Οι ερευνητές της Google δημιούργησαν ένα εργαλείο τεχνητής νοημοσύνης που μπορεί να παράγει μουσικά κομμάτια διάρκειας κάποιων λεπτών από προτροπές κειμένου, παρόμοια με τον τρόπο που συστήματα όπως το DALL-E δημιουργούν εικόνες.
Το μοντέλο ονομάζεται MusicLM, και ενώ δεν μπορείτε να πειραματιστείτε μαζί του, η Big Tech εταιρεία έχει ανεβάσει κάποια δείγματα που παρήγαγε χρησιμοποιώντας το.
Υπάρχουν αποσπάσματα 30 δευτερολέπτων που μοιάζουν με πραγματικά τραγούδια και δημιουργήθηκαν από περιγραφές ειδών μουσικής – για παράδειγμα, reggae ή soundtrack – καθώς και κομμάτια πέντε λεπτών που δημιουργήθηκαν από μία ή δύο λέξεις όπως “melodic techno”.
Το MusicLM μπορεί ακόμη και να προσομοιώσει ανθρώπινες φωνές, και ενώ φαίνεται να πετυχαίνει τον τόνο και τον συνολικό ήχο των φωνών σωστά, υπάρχει μια ποιότητα σε αυτές που είναι σίγουρα κατώτερες των προσδοκιών.
Η δημιουργία μιας τέτοιας πλατφόρμας θα προκαλέσει αναπόφευκτα πρόσθετες συζητήσεις σχετικά με το ρόλο της τεχνητής νοημοσύνης σε θέματα πνευματικής ιδιοκτησίας και την παραβίαση πνευματικών δικαιωμάτων, που δημιουργούνται από μια πληθώρα καλλιτεχνών που αφορούν τη δημόσια χρήση της τέχνης τους για τη δημιουργία περιεχομένου τεχνητής νοημοσύνης.
Πηγή: The Verge, Mashable