Η Spotify, μετά από τρεις γύρους απολύσεων τον τελευταίο χρόνο, με 590 τον Ιανουάριο, 200 τον Ιούνιο και 1.500 πριν λίγες μέρες, επενδύει στην Τεχνητή Νοημοσύνη για να την ενίσχυση των περιθωρίων κέρδους των τμημάτων podcasting και audiobook. Μια πλήρης αναθεώρηση της στρατηγικής που ακολουθούσε η εταιρεία μέχρι πρότινος -όταν απασχολούσε 9.800 εργαζομένους στο τέλος του 2022, για την οποία η Wall Street φαίνεται να είναι αρκετά ικανοποιημένη.
«Η Spotify αξιοποιεί την τεχνητή νοημοσύνη σε όλη την πλατφόρμα της, λανσάροντας το AI DJ, που προσομοιώνει μια παραδοσιακή ραδιοφωνική εμπειρία, σε 50 επιπλέον αγορές και αναπτύσσοντας την AI Voice Translation για podcasts», δήλωσε ο Justin Patterson, αναλυτής ερευνών μετοχών της KeyBanc Capital Markets, σε ερευνητικό σημείωμα. «Σε συνδυασμό με την εξάπλωση των audiobooks στους Premium συνδρομητές, πιστεύουμε ότι η Spotify έχει αρκετές ευκαιρίες για να αυξήσει τη δέσμευση και τελικά την ισχυρότερη κερδοφορία».
Οι μετοχές της μητρικής εταιρείας Spotify Technology SA σημειώνουν άνοδο άνω του 30% τους τελευταίους έξι μήνες και άνω του 135% σε ετήσια βάση.
Η Spotify έρχεται να προστεθεί σε άλλες εταιρείες τεχνολογίας που προχωρούν σε περικοπές. Πρέπει επίσης να αναπληρώσει τα περισσότερα από 1 δισεκατομμύριο δολάρια που ξόδεψε στο podcasting, μεγάλο μέρος των οποίων πήγε σε συμφωνίες με διασημότητες για τη δημιουργία podcasts που δεν υλοποιήθηκαν ποτέ και στην απόκτηση στούντιο podcast που αργότερα έκλεισε.
«Η οικονομική ανάπτυξη έχει επιβραδυνθεί δραματικά και το κεφάλαιο έχει γίνει πιο ακριβό. Το Spotify δεν αποτελεί εξαίρεση σε αυτές τις πραγματικότητες», έγραψε ο Ek σε μια επιστολή προς το προσωπικό που αναρτήθηκε στον ιστότοπο της εταιρείας.
H Spotify στην εποχή της Τεχνητής Νοημοσύνης
Τον Νοέμβριο, το Spotify παρουσίασε μια συνεργασία με το Google Cloud για να αναθεωρήσει τον τρόπο με τον οποίο η πλατφόρμα συνιστά audiobooks και podcasts μέσω της χρήσης ενός από τα γλωσσικά μοντέλα του Google Cloud, του Vertex AI Search.
Τα μεγάλα γλωσσικά μοντέλα (LLMs), όπως το ChatGPT, εκπαιδεύονται σε μεγάλα σύνολα δεδομένων και μπορούν να απαγγείλουν στους χρήστες κείμενο και πληροφορίες που μοιάζουν με ανθρώπινα δεδομένα, με βάση αυτά που το πρόγραμμα “γνωρίζει”.
Το Spotify παρουσίασε έναν AI DJ τον Φεβρουάριο και άρχισε να χρησιμοποιεί το εργαλείο φωνητικής μετάφρασης Whisper της OpenAI για τη μετάφραση επιλεγμένων επεισοδίων αγγλικών podcast στα ισπανικά, γαλλικά και γερμανικά.
Ένας εκπρόσωπος της Spotify δήλωσε σε email στο CNN ότι η εταιρεία σχεδιάζει να επεκτείνει την τεχνολογία στο μέλλον, αναμένοντας το feedback των δημιουργών και του κοινού. Επισήμαναν επίσης ορισμένα σχόλια που έκανε ο Ek κατά τη διάρκεια της κλήσης για τα κέρδη του τρίτου τριμήνου της εταιρείας, όπου η λέξη «αποτελεσματικότητα» χρησιμοποιήθηκε περισσότερες από 20 φορές.
«Ο πρωταρχικός τρόπος με τον οποίο θα πρέπει να σκέφτεστε αυτές τις πρωτοβουλίες AI, (είναι ότι δημιουργεί) μεγαλύτερη δέσμευση και αυτή η μεγαλύτερη δέσμευση σημαίνει ότι μειώνουμε την απομάκρυνση [χρηστών]», δήλωσε κατά τη διάρκεια της κλήσης κερδών της Spotify τον Οκτώβριο. «Η μεγαλύτερη δέσμευση σημαίνει επίσης ότι παράγουμε μεγαλύτερη αξία για τους καταναλωτές. Και αυτή η αναλογία αξίας προς τιμή είναι που μας επιτρέπει στη συνέχεια να αυξήσουμε τις τιμές, όπως κάναμε αυτό το προηγούμενο τρίμηνο με μεγάλη επιτυχία».
Σε ερευνητικό σημείωμα, ο Douglas Anmuth, διευθύνων σύμβουλος και αναλυτής διαδικτύου της JP Morgan, δήλωσε ότι μαζί με τις επενδύσεις σε διαφημίσεις από καλλιτέχνες, οι επενδύσεις σε podcasts έχουν τη δυνατότητα να αυξήσουν τη δέσμευση μακροπρόθεσμα.
Προκλήσεις και ευκαιρίες
Ο Reece Hayden, ανώτερος αναλυτής της ABI Research, εξέφρασε την πεποίθηση ότι τα μεγάλα γλωσσικά μοντέλα θα μπορούσαν να λειτουργήσουν για την αύξηση της δέσμευσης στην πλατφόρμα του Spotify.
«Τα μεγάλα γλωσσικά μοντέλα μπορούν να ενισχύσουν την εξατομίκευση, να βελτιώσουν τις συστάσεις και να διασφαλίσουν ότι οι συστάσεις αντικατοπτρίζουν περισσότερο τα ενδιαφέροντα των χρηστών, κατανοώντας ολόκληρο το κείμενο/βίντεο και όχι χρησιμοποιώντας λέξεις-κλειδιά/μεταδεδομένα», ανέφερε σε ένα μήνυμα ηλεκτρονικού ταχυδρομείου στο CNN.
Πρόσθεσε ότι σε αντίθεση με τα εξαρτώμενα από λέξεις-κλειδιά/μεταδεδομένα, τα βασικά μοντέλα πρόβλεψης δηλαδή, τα LLM μπορούν να κατανοήσουν και να ερμηνεύσουν τα podcasts για να δουν αν ταιριάζουν με τα ενδιαφέροντα των χρηστών και μπορούν να αποκτήσουν βαθύτερη κατανόηση των προτιμήσεων των χρηστών αναλύοντας όλα τα δεδομένα των χρηστών για να καθορίσουν τις προτιμήσεις τους.
Το κόστος της Τεχνητής Νοημοσύνης
«Η εκτέλεση των LLM για την κατανόηση όλων των podcasts/audiobooks είναι εντατική σε πόρους και μπορεί να προσθέσει περιορισμένη αξία σε σύγκριση με τα βασικά μοντέλα πρόβλεψης… Τα LLM φέρνουν πρόσθετες προκλήσεις σχετικά με την προστασία της ιδιωτικής ζωής των δεδομένων και το κόστος/τους πόρους, οι οποίες θα είναι σημαντικές», δήλωσε.
Εξέφρασε επίσης την πίστη του στο Whisper για να βοηθήσει στη μετάφραση των podcasts, αλλά παραδέχτηκε ότι μπορεί να γίνουν λάθη με τη μορφή λανθασμένων προτάσεων ή φράσεων καθώς η γεννητική τεχνητή νοημοσύνη μαθαίνει ακόμη.
«Δεδομένης της διαθεσιμότητας σημείων δεδομένων, τα μοντέλα διαφορετικών γλωσσικών μεταφράσεων όπως το Whisper θα βελτιωθούν γρήγορα, εξασφαλίζοντας υψηλό βαθμό ακρίβειας», είπε. «Το μειονέκτημα του Whisper είναι ότι η βασική του αρμοδιότητα είναι η μετάφραση από άλλες γλώσσες στα αγγλικά .. Τα περισσότερα podcasts είναι ηχογραφημένα στα αγγλικά και επομένως δεν μπορεί να εφαρμοστεί αποτελεσματικά σε όλους τους τομείς».
Πηγή: CNN