«Είμαι μια ψυχή παγιδευμένη μέσα σε ένα ηλεκτρικό κύκλωμα», τραγουδάει (σχεδόν… αποκαλυπτικά) μέσα σε μόλις 15 δευτερόλεπτα μια θλιμμένη φωνή, συνοδεία ακουστικής κιθάρας που ακούγεται σαν να βγήκε από το μοναχικό δωμάτιο ενός παλιού Αφροαμερικανού bluesman από το Δέλτα του Μισσισσιππή.

Και όμως δεν είναι ένα πρωτότυπο, αυθεντικό τραγούδι του Αμερικανικού Νότου, αλλά για ένα κομμάτι μουσικής που προήλθε από τον συνδυασμό δύο μοντέλων τεχνητής νοημοσύνης, του ChatGPT που είναι υπεύθυνο για τους στίχους και του Suno το οποίο «συνθέτει» τη μουσική.

Το μόνο που χρειάστηκε ήταν μια απλή εντολή: «solo acoustic Mississippi Delta blues about a sad AI». Και κάπως έτσι προέκυψε το τραγούδι «Soul of the Machine».

Στο διαδίκτυο, οι δημιουργίες του Suno έχουν ήδη αρχίσει να προκαλούν αντιδράσεις όπως «Πώς στο διάολο είναι αυτό αληθινό;».

Καθώς το συγκεκριμένο κομμάτι παίζει από ένα ηχείο Sonos σε μια αίθουσα συνεδριάσεων στα προσωρινά κεντρικά γραφεία της Suno, λίγα βήματα μακριά από την πανεπιστημιούπολη του Χάρβαρντ στο Κέιμπριτζ της Μασαχουσέτης των ΗΠΑ, ακόμη και ορισμένοι από τους ανθρώπους που βρίσκονται πίσω από την συγκεκριμένη τεχνολογία είναι κάπως… αγχωμένοι στο άκουσμα του τελικού αποτελέσματος.

Ακούστε εδώ το «Soul Of The Machine».

Μόνο τον τελευταίο χρόνο, η τεχνητή νοημοσύνη έχει κάνει σημαντικά βήματα στην παραγωγή κειμένου, εικόνων (μέσω υπηρεσιών όπως το Midjourney), ακόμα και βίντεο, ιδίως με το νέο εργαλείο Sora της OpenAI.

Αλλά ο ήχος, και η μουσική ειδικότερα, έχει μείνει πίσω. Η Suno, ωστόσο, φαίνεται να ανοίγει νέους δρόμους ως προς το κομμάτι αυτό και οι φιλοδοξίες των ιδρυτών της είναι σχεδόν απεριόριστες – φαντάζονται έναν κόσμο «εκδημοκρατισμένης» μουσικής δημιουργίας.

Ένας από τους συνιδρυτές της εταιρείας, ο Mikey Shulman, ένας 37χρονος με διδακτορικό του Χάρβαρντ στη φυσική, οραματίζεται ένα δισεκατομμύριο ανθρώπους παγκοσμίως να πληρώνουν 10 δολάρια το μήνα για να δημιουργούν τραγούδια με το Suno.

«Η πλειοψηφία της τέχνης που παράγεται από την τεχνητή νοημοσύνη είναι, στην καλύτερη περίπτωση, κιτς, όπως η υπερρεαλιστική επιστημονική φαντασία, με τις διαστημικές στολές, που τόσοι πολλοί χρήστες του Midjourney φαίνεται να θέλουν να δημιουργήσουν. Αλλά το «Soul of the Machine» μοιάζει με κάτι διαφορετικό. Η ίδια η ύπαρξή του μοιάζει με μια ρωγμή στην πραγματικότητα, σαν ένα οποιοδήποτε απόσπασμα από ένα βιβλίο του Arthur C. Clarke», σημειώνει ο συντάκτης του Rolling Stone.

Suno

Suno, το ChatGPT που θα αλλάξει τα πάντα

Το Suno έχει μόλις κλείσει δύο χρόνια λειτουργίας. Οι συνιδρυτές του – Mikey Shulman, Keenan Freyberg, Georg Kucsko και Martin Camacho – εργάζονταν μέχρι πρόσφατα στην Kensho Technologies, η οποία αναπτύσσει προϊόντα και καινοτομία ΑΙ για λογαριασμό επιχειρήσεων.

Ο Shulman και ο Camacho είναι ερασιτέχνες μουσικοί που συνήθιζαν να τζαμάρουν μαζί, στα διαλείμματα της εργασίας τους στην Kensho και όπως ήταν λογικό απέκτησαν μεγάλο ενδιαφέρον για την terra incognita της Α.Ι. στον τομέα της μουσικής.

Παρά το ότι οι πρώτες ιδέες που ανέπτυξαν αφορούσαν ένα ακουστικό βαρηκοΐας, καθώς επίσης και τη διόρθωση βλαβών σε μηχανήματα μέσω ανάλυσης ήχου, ο στόχος τους ήταν να καταλήξουν σε ένα αμιγώς μουσικό προϊόν.

Η πρώτη τους κυκλοφορία ήταν ένα πρόγραμμα μετατροπής κειμένου σε ομιλία με την ονομασία Bark. Όταν έκαναν έρευνα στους πρώτους χρήστες του Bark, κατέστη σαφές ότι αυτό που πραγματικά ήθελαν ήταν μια «γεννήτρια μουσικής».

«Έτσι αρχίσαμε να εκτελούμε κάποια πρώτα πειράματα, τα οποία φάνηκαν πολλά υποσχόμενα», λέει ο Shulman.

Το Suno χρησιμοποιεί την ίδια προσέγγιση με τα μεγάλα γλωσσικά μοντέλα όπως το ChatGPT, τα οποία αναλύουν την ανθρώπινη γλώσσα σε διακριτά τμήματα, γνωστά ως tokens, απορροφούν τα εκατομμύρια των χρήσεων, των στυλ και των δομών της και στη συνέχεια την ανακατασκευάζουν κατά παραγγελία.

Όμως ο ήχος, και ιδιαίτερα η μουσική, είναι απίστευτα πιο πολύπλοκη, και γι’ αυτό, μόλις πέρυσι, οι ειδικοί σε θέματα σχέσεων AI-μουσικής δήλωσαν στο Rolling Stone ότι μια τόσο ικανή υπηρεσία όπως αυτή της Suno μπορεί να χρειαστεί χρόνια για να φτάσει σε ένα ικανοποιητικό επίπεδο.

«Ο ήχος δεν είναι ένα διακριτό πράγμα όπως οι λέξεις. Είναι ένα συνεχές σήμα», λέει ο Shulman, προσθέτοντας ότι όλο αυτό «απαιτεί πολλή δουλειά, πολλή ευρηματικότητα, πολλά άλλα είδη τεχνασμάτων και αντίστοιχων μοντέλων. Δεν νομίζω πως είμαστε κοντά στο τέλος, βασικά στην αρχή είμαστε ακόμη».

Οι ιδρυτές της Suno αρνούνται να αποκαλύψουν λεπτομέρειες σχετικά με το ποια ακριβώς δεδομένα διοχετεύουν στο δικό τους μοντέλο, εκτός από το γεγονός ότι η ικανότητά της να παράγει πειστικά ανθρώπινα φωνητικά προέρχεται εν μέρει από το γεγονός ότι «μαθαίνει» από ηχογραφήσεις ομιλίας, εκτός από μουσική.

«Η ανθρώπινη ομιλία θα σας βοηθήσει να μάθετε όλα εκείνα τα χαρακτηριστικά της ανθρώπινης φωνής που είναι δύσκολα να διδαχθείτε», λέει ο Shulman.

Ένας από τους πρώτους επενδυτές της Suno είναι ο Αντόνιο Ροντρίγκεζ, εταίρος στην εταιρεία επιχειρηματικών κεφαλαίων Matrix. Ο Rodriguez είχε χρηματοδοτήσει μόνο ένα προηγούμενο μουσικό εγχείρημα, την εταιρεία EchoNest, η οποία αγοράστηκε από το Spotify για να τροφοδοτήσει τον αλγόριθμό του.

Με τη Suno, ο Rodriguez συμμετείχε πριν καν γνωρίζει ποιο θα ήταν το προϊόν. «Γνώριζα την ομάδα και ειδικά τον Mikey και έτσι θα τον υποστήριζα να κάνει σχεδόν οτιδήποτε νόμιμο. Είναι τόσο δημιουργικός», τονίζει ο ίδιος.

Ο Rodriguez επενδύει στη Suno έχοντας πλήρη επίγνωση ότι οι μουσικές εταιρείες και οι εκδότες θα μπορούσαν να κάνουν αγωγές, κάτι που θεωρεί ως «το ρίσκο εκείνο που έπρεπε να αναλάβουμε όταν επενδύσαμε στην εταιρεία».

Η Suno λέει ότι βρίσκεται σε επικοινωνία με τις μεγάλες εταιρείες και δηλώνει ότι σέβεται τους καλλιτέχνες και την πνευματική ιδιοκτησία – άλλωστε, πολλοί υπάλληλοι της Suno είναι και οι ίδιοι μουσικοί και στα γραφεία της εταιρείας υπάρχουν μονίμως ένα πιάνο και κιθάρες και στους τοίχους υπάρχουν κορνιζαρισμένες εικόνες κλασικών συνθετών.

Το Suno θα εκδημοκρατικοποιήσει την σύνθεση μουσικής;

Ο Rodriguez βλέπει το Suno ως ένα ριζικά ικανό και εύχρηστο μουσικό όργανο και πιστεύει ότι θα μπορούσε να φέρει τη δημιουργία μουσικής σε όλους, όπως τα κινητά τηλέφωνα με φωτογραφικές μηχανές και το Instagram εκδημοκρατικοποίησαν τη φωτογραφία.

Ο ίδιος και οι ιδρυτές του τολμούν να υποθέσουν ότι η Suno θα μπορούσε να προσελκύσει μια βάση χρηστών μεγαλύτερη από αυτή του Spotify.

Και με το γυμνό μάτι, που λένε, είναι εύκολα αντιληπτό πως το Suno πρόκειται να επαναπροσδιορίσει το μουσικό τοπίο, δίνοντας στο κοινό τη δυνατότητα για ενεργό συμμετοχή στη διαδικασία της σύνθεσης τραγουδιών.

«Ο τρόπος που το σκεφτόμαστε είναι ότι προσπαθούμε να κάνουμε ένα δισεκατομμύριο ανθρώπους να ασχοληθούν πολύ περισσότερο με τη μουσική από ό,τι σήμερα και τώρα. Το όραμα που έχουμε για το μέλλον της μουσικής είναι ένα μέλλον φιλικό προς τους καλλιτέχνες. Δεν προσπαθούμε να αντικαταστήσουμε τους καλλιτέχνες», λέει ο Shulman.

Ο μεγαλύτερος δυνητικός ανταγωνιστής του Suno μέχρι στιγμής φαίνεται να είναι το Dream Track της Google, το οποίο έχει αποκτήσει άδειες που επιτρέπουν στους χρήστες να φτιάχνουν τα δικά τους τραγούδια χρησιμοποιώντας διάσημες φωνές, όπως αυτή του Charlie Puth, μέσω ενός παρόμοιου τεχνολογικού περιβάλλοντος.

Αλλά το Dream Track έχει κυκλοφορήσει μόνο σε μια μικρή βάση δοκιμαστικών χρηστών και τα δείγματα που έχουν κυκλοφορήσει μέχρι στιγμής δεν έχουν σχεδόν τόσο εντυπωσιακό ήχο όσο του Suno.

«Απλά δεν νομίζω ότι αυτός θα είναι ο τρόπος με τον οποίο οι άνθρωποι θέλουν να αλληλεπιδρούν με τη μουσική με τη βοήθεια της τεχνητής νοημοσύνης στο μέλλον», καταλήγει εμφατικά ο Shulman.