Στο βίντεο κλιπ για το τελευταίο τους σινγκλ “DTDTGMGN”, τα μέλη του νοτιοκορεατικού συγκροτήματος Eternity χορεύουν σε ένα δωμάτιο με νέον ροζ φωτισμό, διακοσμημένο με σχολικές στολές και αφίσες διασήμων. Οι ιλιγγιώδεις κινήσεις της κάμερας και οι γρήγορες αλλαγές σκηνών είναι χαρακτηριστικές του είδους της K-pop που έχει γίνει παγκόσμιο φαινόμενο τα τελευταία χρόνια.
«Κράτα με σφιχτά, ακούμπα στον ώμο μου», τραγουδά ένα μέλος.
Μόνο που οι φανς τους δε μπορούν ούτε να τις κρατήσουν σφιχτά ούτε να ακουμπήσουν στους ώμους τους, τουλάχιστον όχι κυριολεκτικά – αφού κανένα από τα 11 μέλη των Eternity δεν υπάρχει.
Οι Eternity είναι ένα δημιούργημα της τεχνολογίας AI (τεχνητή νοημοσύνη), διατρυπώντας τα όρια μεταξύ πραγματικής και εικονικής ψυχαγωγίας. Η Pulse9, ο όμιλος που δημιούργησε και διαχειρίζεται το συγκρότημα, πιστεύει ότι οι ποπ σταρ που δημιουργούνται μέσω υπολογιστή έχουν σημαντικό πλεονέκτημα έναντι των ομολόγων τους στην πραγματική ζωή.
Όπως συμβαίνει με τα περισσότερα δημοφιλή συγκροτήματα της K-pop, τα μέλη των Eternity έχουν δική τους αρχηγό, τραγουδίστριες, ράπερς και χορεύτριες. Αλλά ένα μέλος συγκεκριμένα, η Zae-in, φαίνεται να έχει όλο το πακέτο, αφού μπορεί να κάνει όλα τα παραπάνω.
«Η Zae-in έχει (έναν συνδυασμό) χαρακτηριστικών που οι περισσότεροι πραγματικοί καλλιτέχνες θα ήταν δύσκολο να έχουν», δήλωσε η CEO της εταιρείας, Park Ji-eun. «Μπορεί να τραγουδήσει πολύ καλά, να ραπάρει πολύ καλά και μπορεί να είναι δημιουργική ως σχεδιάστρια (μόδας). Και είναι και εξαιρετική ηθοποιός».
Με τη βοήθεια της τεχνολογίας αντικατάστασης προσώπων σε πραγματικό χρόνο και μιας φωνής που δημιουργείται μέσω AI, η Zae-in παίζεται από 10 διαφορετικά άτομα, συμπεριλαμβανομένων ηθοποιών, τραγουδιστών και χορευτών, που δανείζουν τα ταλέντα τους στο avatar της. Σε ένα βίντεο που δημοσιεύτηκε στον λογαριασμό της Zae-in στο Instagram, για παράδειγμα, κάνει longboard δίπλα στον ποταμό Han της Σεούλ. Για το βίντεο, οι δημιουργοί της χρησιμοποίησαν μια κασκαντέρ, της οποίας το πρόσωπο αργότερα αντικαταστάθηκε από αυτό της Zae-in.
Δείτε αυτή τη δημοσίευση στο Instagram.
«Υπάρχει η ποπ σταρ Zae-in, η ηθοποιός Zae-in, η δημοσιογράφος Zae-in», είπε η εικονική σταρ στο CNN σε μια συνέντευξη μέσω Zoom, κατά την οποία την έπαιξε μια ηθοποιός (αν και η Pulse9 λέει ότι το λογισμικό τεχνητής νοημοσύνης της μπορεί να αναδημιουργήσει τη φωνή της Zae -in και να παράγει ομιλία χωρίς ανθρώπινη συμβολή). «Υπάρχουν διάφορες Zae-ins, επομένως το μοναδικό μας πλεονέκτημα είναι ότι μπορούμε να κάνουμε ό,τι ένα άτομο δεν μπορεί».
«Το μόνο πράγμα που δεν μπορούμε να κάνουμε είναι να υπογράψουμε αυτόγραφα», πρόσθεσε χαμογελώντας.
Η αντικατάσταση προσώπων σε πραγματικό χρόνο και οι πρώιμες μορφές τεχνολογίας “deepfake“ υπάρχουν εδώ και σχεδόν μια δεκαετία. Κατά καιρούς, εικονικές influencers όπως η Miquela και η Νοτιοκορεάτισα Rozy έχουν μαζέψει εκατομμύρια followers κι έχουν “κλείσει” σημαντικές δουλειές στον χώρο της μόδας και της μουσικής.
Παρακάτω η Miquela, μια CGI influencer με την ποπ σταρ Rosalia:
View this post on Instagram
View this post on Instagram
Ωστόσο, οι τελευταίες εξελίξεις σε εικόνα και ήχο χάρη στην τεχνητή νοημοσύνη διευκολύνουν εταιρείες όπως η Pulse9 να δημιουργούν πειστικούς εικονικούς χαρακτήρες, ενώ οι εξελίξεις σε προγράμματα παραγωγής τεχνητής νοημοσύνης όπως το ChatGPT εξαλείφουν την ανάγκη για ποπ σταρ όπως η Zae-in να “παίζονται” από πραγματικούς ανθρώπους.
Πώς δημιουργήθηκαν οι Eternity;
Η ομάδα της εταιρείας Pulse9 θέλωντας να δώσει “ζωή” στις Eternity (αιωνιότητα), σχεδίασε προσεκτικά την εμφάνιση των μελών της. Η ομάδα της Park δημιούργησε 101 μοναδικά ψηφιακά πρόσωπα, εμπνευσμένα από υπάρχουσες celebrities της Κορέας, προτού τα χωρίσει σε 4 κατηγορίες – «σέξι», «χαριτωμένο», «έξυπνο» και «αθώο». Μέσω ιντερνετικής δημοσκόπησης κατέληξε σε 11 πρόσωπα και κάπως έτσι “γεννήθηκαν” οι Eternity.
Χρησιμοποιώντας τεχνολογία deepfake και σύλληψη κίνησης, η Pulse9 κυκλοφόρησαν το πρώτο βίντεο κλιπ του συγκροτήματος (για να συνοδεύσει το κομμάτι με τον ειρωνικό τίτλο “I’m Real”) το 2021. Οι αντιδράσεις στο βίντεο ήταν ανάμεικτες. Πολλοί χρήστες των social media ένιωσαν ότι οι εκφράσεις των μελών της μπάντας έμοιαζαν αφύσικες και αποκομμένες από το σώμα τους, ενώ άλλοι ανέφεραν το φαινόμενο του “uncanny valley“, σύμφωνα με το οποίο οι θεατές νιώθουν δυσφορία όταν βλέπουν κάτι που μοιάζει με άνθρωπο αλλά δεν είναι.
Πέντε μήνες αργότερα, όταν η Pulse9 κυκλοφόρησε το επόμενο βίντεο κλιπ των Eternity, για το τραγούδι “No Filter“, ο κόσμος παρατήρησε ότι ήταν σχεδόν αδύνατον να διακρίνεις ότι επρόκειτο για AI. «Είμαι έκπληκτος με το πόσο ρεαλιστικές ακούγονται και τα γραφικά φαίνονται πιο ρεαλιστικά από ό,τι στο ντεμπούτο τους», λέει το σχόλιο με τα περισσότερα like στο YouTube.
Το “DTDTGMGN”, που κυκλοφόρησε τον περασμένο Οκτώβριο, αντιπροσώπευε ένα άλλο τεράστιο άλμα στην ποιότητα. «Μέχρι πέρυσι, το πρόσωπο ήταν το μόνο εικονικό μέρος των τραγουδιστριών, αλλά σήμερα μπορούμε να δημιουργήσουμε ολόκληρο το σώμα με βάση την τεχνολογία AI», είπε η Park, προσθέτοντας ότι το “No Filter” συντέθηκε επίσης χρησιμοποιώντας AI (αν και πραγματικοί άνθρωποι επεξεργάστηκαν το τραγούδι και έγραψαν τους στίχους).
Η SM Entertainment, το πρακτορείο πίσω από μερικούς από τους μεγαλύτερους αστέρες της K-pop, πειραματίστηκε επίσης με την τεχνητή νοημοσύνη. Το 2020, η εταιρεία σύστησε στο κοινό τις Aespa, ένα συγκρότημα που αποτελείται από τέσσερις τραγουδίστριες και τα εικονικά τους avatars. Δηλαδή, υπάρχουν όντως τέσσερις καλλιτέχνιδες που τραγουδούν και χορεύουν στο συγκρότημα, αλλά όταν τις βλέπουμε σε βίντεο κλιπ και φωτογραφίσεις, η εικόνα τους είναι ενισχυμένη μέσω AI. Ο ιδρυτής της SM, Lee Soo-man, δήλωσε ότι το μέλλον της ψυχαγωγίας είναι «διασημότητες και ρομπότ».
Τα εικονικά K-pop είδωλα θα σου μιλούν στη γλώσσα σου
Η εταιρεία Hybe που διαχειρίζεται τους BTS, χρησιμοποίησε τεχνητή νοημοσύνη για να τροποποιήσει την προφορά και τον τόνο ενός τραγουδιστή του συγκροτήματος, πριν κυκλοφορήσει ένα από τα τραγούδια του σε έξι γλώσσες – Κορεάτικα, Αγγλικά, Ισπανικά, Κινέζικα, Ιαπωνικά και Βιετναμέζικα.
Παρακάτω, η Audrey Hepburn δίνοντας συνεντεύξεις σε 6 γλώσσες:
Και η Shakira, μιλώντας με κοινό και δημοσιογράφους σε 7 γλώσσες:
Νωρίτερα φέτος, η Metaverse Entertainment, μια αντιπροσωπεία που δημιουργήθηκε από την εταιρεία βιντεοπαιχνιδιών Netmarble και τη μητρική εταιρεία της SM Entertainment, Kakao Entertainment, μας παρουσίασε τις MAVE, ένα εικονικό girl group. Σε αντίθεση με τις Eternity, οι οποίες έχουν δημιουργηθεί με απλές εναλλαγές προσώπων, τα τέσσερα μέλη των MAVE δημιουργήθηκαν εξαρχής μέσω CGI.
Η Metaverse Entertainment χρησιμοποίησε τεχνολογία AI για να δημιουργήσει τα πρόσωπα, συγχωνεύοντας χαρακτηριστικά και χτενίσματα σε τέσσερις τελικούς χαρακτήρες. Η εταιρεία χρησιμοποίησε τεχνολογία καταγραφής κίνησης για να καταγράψει πραγματικές K-pop χορογραφίες. Στη συνέχεια χρησιμοποίησε ένα πρόγραμμα βαθιάς εκμάθησης για να φτιάξει τα βίντεο κλιπ. Τα φωνητικά του γκρουπ είναι εν μέρει ανθρώπινα και εν μέρει δημιουργημένα μέσω τεχνητής νοημοσύνης, όπως δήλωσε ο τεχνικός διευθυντής της Metaverse Entertainment, Kang Sung-ku.
«Στόχος μας είναι να δημιουργήσουμε εικονικούς ανθρώπους με πλήρη τεχνητή νοημοσύνη (που είναι) πραγματικά πιστευτοί», είπε στο CNN.
Το βίντεο κλιπ για το πρώτο σινγκλ των MAVE, “Pandora“, έχει ήδη συγκεντρώσει 26 εκατομμύρια προβολές στο YouTube από την κυκλοφορία του τον Ιανουάριο.
Κατά τη γνώμη μου, μάλλον δεν πολυ-πέτυχαν τον στόχο τους να φτιάξουν «πραγματικά πιστευτούς» εικονικούς ανθρώπους. Οι Mave μοιάζουν με Sims τόσο εξωτερικά όσο και κινησιολογικά.
Το μέλλον της K-pop
Οι εικονικοί ποπ σταρ μπορεί να απολαμβάνουν ένα πλεονέκτημα έναντι των ανθρώπινων όσον αφορά τη σχέση με τους θαυμαστές τους. Οι εξελίξεις στα προγράμματα γλώσσας της τεχνητής νοημοσύνης θα μπορούσαν να δώσουν τη δυνατότητα στους θαυμαστές να “συνομιλούν” με τα είδωλά τους – ακόμη και δημιουργώντας προσωπικές σχέσεις μαζί τους.
«Θα θυμούνται τι είπατε χθες και θα μπορούν να συνεχίσουν να μιλάνε για πράγματα από (προηγούμενες συζητήσεις)», είπε ο Kang Sung-ku., κάνοντας μια σύγκριση μεταξύ των δημιουργιών τεχνητής νοημοσύνης της εταιρείας του και της εικονικής βοηθού της iPhone, Siri. «Θα σε θυμούνται και θα γνωρίζουν πράγματα για σένα — και θα μιλούν (μαζί σου) με βάση αυτές τις πληροφορίες».
Η Metaverse Entertainment πειραματίζεται ήδη με αυτήν την ιδέα μέσω εφαρμογών που επιτρέπουν στους χρήστες να αλληλεπιδρούν απευθείας με τις MAVE. Τα μέλη του συγκροτήματος επί του παρόντος μιλούν Κορεάτικα, Αγγλικά, Γαλλικά και Ινδονησιακά – ενδεικτικά των σημαντικότερων αγορών και target-group τους. Θεωρητικά στο μέλλον θα μπορούσαν να μιλούν ακόμη περισσότερες γλώσσες.
«Υπάρχουν κάποια πράγματα που δε θα μπορούσαν να πω ούτε στους καλύτερούς μου φίλους, αλλά ίσως θα μπορούσα να τα πω σε μια εξατομικευμένη τεχνητή νοημοσύνη, που μπορεί να με παρηγορήσει και να με νοιαστεί», είπε ο Kang. «Νομίζω ότι θα είναι καλό για όλους».
Η εξέλιξη αυτή θα μπορούσε σίγουρα να είναι καλή για εταιρείες όπως η Metaverse Entertainment. Η βιομηχανία της K-pop στηρίζεται σε ένα επίπονο σύστημα “ασκούμενων”, στο οποίο ελπιδοφόροι έφηβοι, περνούν χρόνια σε ακαδημίες, παρακολουθώντας δαπανηρά μαθήματα χορού και μουσικής πριν το ντεμπούτο τους. (Σύμφωνα με το Wall Street Journal, η SM Entertainment ξόδεψε περίπου 3 εκατομμύρια δολάρια για να φέρει τις Girls Generation στην αγορά το 2007.) Τα πρακτορεία πρέπει να επενδύουν σε μαθήματα, στούντιο, styling, μάρκετινγκ και μερικές φορές ακόμη και σε αισθητικές επεμβάσεις για τα μέλη των συγκροτημάτων — κόστος που δεν απαιτείται για τα εικονικά ταλέντα.
Επιπλέον, οι ποπ σταρ που δημιουργούνται από υπολογιστή δεν θα αρρωστήσουν ποτέ, δεν θα γεράσουν ποτέ, δε θα διαφωνήσουν για συμβόλαια, δε θα παραιτηθούν και δε θα γίνουν πρωτοσέλιδο ξαφνικά για κάποιο σκάνδαλο στο οποίο πρωταγωνίστησαν. Ωστόσο, πιθανότατα οι μεγάλες εταιρείες δε θα αντικαταστήσουν τα πραγματικά συγκροτήματα σύντομα, όπως λέει ο Kang, αναγνωρίζοντας ότι μεγάλη μερίδα των θαυμαστών της K-pop έχουν αντιδράσει άσχημα στους AI καλλιτέχνες.
«Η κριτική αφορούσε την αντικατάσταση των σημερινών ειδώλων με εικονικά – νόμιζαν ότι τα σημερινά είδωλα μπορεί να χάσουν τις δουλειές τους», είπε ο Kang, προσθέτοντας ότι ορισμένοι θαυμαστές θα προτιμούν πάντα τους ανθρώπους καλλιτέχνες.
Η δημιουργός των Eternity, Park Ji-eun, συμφώνησε, συγκρίνοντας την εμφάνιση της τεχνητής νοημοσύνης με την εφεύρεση της φωτογραφίας τον 19ο αιώνα: «Πολλοί ζωγράφοι φοβούνταν τη (νέα) τεχνολογία, αλλά σήμερα, έχουμε ακόμα ζωγράφους. Νομίζω ότι οι BTS δεν θα φοβηθούν ποτέ τα εικονικά είδωλα – είναι απλώς ένα νέο περιεχόμενο».