Ένα βράδυ πριν μερικούς μήνες, η Ρόμπιν κοιμόταν δίπλα στον σύζυγό της, Στιβ, στο σπίτι τους στο Μπρούκλιν, όταν χτύπησε το τηλέφωνό τους.
Το ζευγάρι – αμφότεροι γύρω στα 30 – είχε βγει να πιει σε ένα μπαρ εκείνο το βράδυ και είχε επιστρέψει στο σπίτι λίγες ώρες νωρίτερα και είχε πέσει για ύπνο. Τα δύο μικρά παιδιά τους κοιμόντουσαν στα υπνοδωμάτια στο τέλος του διαδρόμου, χωρίς κανείς εξ’ αυτών να υποψιάζεται τι τους επιφυλάσσει το μέλλον.
Όταν χτύπησε το τηλέφωνό της, άνοιξε τα μάτια της και κοίταξε την ταυτότητα του καλούντος. Ήταν η πεθερά της, η Μόνα, η οποία δεν τηλεφωνούσε ποτέ μετά τα μεσάνυχτα.
«Οπότε το αγνοώ και προσπαθώ να γυρίσω από το άλλο πλευρό και να ξαναπέσω για ύπνο. Αλλά με ξαναπαίρνει τηλέφωνο», λέει η Ρόμπιν.
Σήκωσε εντέλει το τηλέφωνο και, στην άλλη άκρη, άκουσε τη φωνή της Μόνα να κλαίει και να επαναλαμβάνει τις λέξεις «Δεν μπορώ να το κάνω, δεν μπορώ να το κάνω».
«Νόμιζα ότι είχε συμβεί κάποιο φρικτό πράγμα», είπε η Ρόμπιν, η πρώτη σκέψη της οποίας ήταν ότι είχε συμβεί κάποιο ατύχημα, αναφέρει το εκτενές δημοσίευμα του New Yorker.
Τότε η Ρόμπιν άκουσε κάτι που ακουγόταν σαν τη φωνή του συζύγου της Μόνα, του Μπομπ στο τηλέφωνο: «Μόνα, δώσε μου το τηλέφωνο», είπε η φωνή του Μπομπ και μετά: «Πάρε τον Στιβ. Πάρε τον Στιβ».
Η Ρόμπιν κούνησε τον Στιβ που κοιμόταν δίπλα της και τον ξύπνησε λέγοντάς του «Νομίζω ότι είναι η μαμά σου», του είπε.
Όταν άνοιξε τα μάτια του, βρήκε τη Ρόμπιν σε κατάσταση πανικού. Όταν σήκωσε το τηλέφωνο, άκουσε μια ανδρική φωνή στην άλλη άκρη της γραμμής, η οποία του είπε: «Δεν θα καλέσετε την αστυνομία. Δεν θα το πείτε σε κανέναν. Αλλά έχω ένα όπλο στο κεφάλι της μητέρας σου και θα της τινάξω τα μυαλά στον αέρα αν δεν κάνεις ακριβώς ό,τι σου πω».
«Θέλω να ακούσω τη φωνή της», είπε ο Steve στον άνδρα στο τηλέφωνο.
Ο άνδρας αρνήθηκε. «Αν μου το ξαναζητήσεις αυτό, θα τη σκοτώσω», του απάντησε.
«Εντάξει», είπε ο Στιβ. «Τι θέλεις από μας;»
Ο άντρας απαίτησε χρήματα, συγκεκριμένα 500 δολάρια, τα οποία ο Στιβ θα του τα έστελνε μέσω Venmo.
«Ήταν ένα τόσο παράλογα μικρό ποσό για λύτρα», θυμήθηκε ο Steve, ο οποίος δέχτηκε να του τα στείλει.
Αφού ο Steve έστειλε τα πεντακόσια δολάρια, ο άντρας του είπε ότι τα χρήματα είχαν έρθει, αλλά δεν ήταν αρκετά.
Ο Steve ρώτησε αν η μητέρα του θα αφεθεί ελεύθερη και ο άντρας στο τηλέφωνο εκνευρίστηκε.
Στη συνέχεια ο άνδρας ζήτησε επιπλέον 250 δολάρια. Ο Steve έστειλε το πρόσθετο ποσό και, όταν η διαδικασία ολοκληρώθηκε, ο άνδρας έκλεισε το τηλέφωνο.
Μέχρι εκείνη τη στιγμή είχαν περάσει περίπου 25 λεπτά.
Εντωμεταξύ, ο Στιβ κατάφερε τελικά και βρήκε στο τηλέφωνο τον πατέρα του, τον Μπομπ [της μητέρας του ήταν εξαρχής μπλοκαρισμένο και χακαρισμένο από τους δράστες για ευνόητους λόγους], ο οποίος σήκωσε το τηλέφωνο και το έδωσε στη Μόνα.
«Μαμά, είσαι στο σπίτι; Είσαι καλά;», την ρώτησε ο Στιβ.
Η Μόνα ακουγόταν μια χαρά, αλλά δεν ήταν σίγουρη για ποιο πράγμα μιλούσαν. «Ναι, είμαι στο κρεβάτι», του απάντησε. «Γιατί ρωτάς;»
Τότε ήταν που ο Steve και η Robin συνειδητοποίησαν ότι έπεσαν θύματα μιας νέας απάτης.
Μιας απάτης, η οποία χρησιμοποιεί τεχνητή νοημοσύνη για να αντιγράψει τη φωνή ενός αγαπημένου προσώπου.
Μιας απάτης που αγγίζει τα όρια της δυστοπίας και του Black Mirror.
Η ΑΙ υπαγορεύει το μέλλον ακόμη και στις τηλεφωνικές απάτες
Η ΑΙ υπαγορεύει λοιπόν το μέλλον ακόμη και στις τηλεφωνικές απάτες, η τεχνολογική εφευρετικότητα των οποίων ξεπερνάει πλέον και την πιο οργιώδη φαντασία.
«Έχουμε πλέον περάσει επισήμως στην σφαίρα του αλλόκοτου», λέει ο Hany Farid, ο οποίος μελετά τη τεχνητή νοημοσύνη στο Πανεπιστήμιο της Καλιφόρνιας στο Μπέρκλεϊ. «Μπορώ πλέον να κλωνοποιήσω τη φωνή σχεδόν οποιουδήποτε και να τον κάνω να πει σχεδόν τα πάντα. Και αυτό που νομίζετε ότι θα συμβεί είναι ακριβώς αυτό που συμβαίνει σήμερα».
Έχουν περάσει σχεδόν 13 χρόνια από το 2011, όταν η Apple κυκλοφόρησε τη Siri. Τρία χρόνια αργότερα, η Amazon κυκλοφόρησε την (παρόμοια) Alexa. Οι «συνθετικές φωνές» συγκατοικούσαν πλέον μαζί μας.
Παρόλα αυτά, μέχρι και πριν από λίγα χρόνια, η πρόοδος αυτή ως προς τις συνθετικές φωνές έδειχνε να έχει… παγώσει.
«Αν θέλω να δημιουργήσω μια ακόμη καλύτερη και πιο πειστική έκδοση της Siri ή της γυναικείας φωνής του GPS, αυτό που με ενδιαφέρει είναι η φυσικότητα», εξήγησε ο Farid, προσθέτοντας εμφατικά: «Δεν θέλω να ακούγεται πλέον σαν κάτι που είναι μισός άνθρωπος και μισός ρομπότ. Η αναπαραγωγή μιας συγκεκριμένης ανθρώπινης φωνής είναι ακόμη πιο δύσκολη. Δεν είναι μόνο ότι πρέπει να ακούγομαι σαν άνθρωπος. Πρέπει να ακούγομαι συγκεκριμένα όπως ΕΣΥ».
Περισσότερα χρήματα «έπεσαν» έκτοτε προς αυτή την κατεύθυνση και το 2019 όλα αυτά απέδωσαν καρπούς: μια εταιρεία τεχνητής νοημοσύνης με έδρα το Τορόντο, η Dessa, κλωνοποίησε τη φωνή του podcaster Joe Rogan. Η Dessa χρειάστηκε πολλά χρήματα και εκατοντάδες ώρες δουλειάς για να φτιάξει το προϊόν της. Η επιτυχία τους, ωστόσο, ήταν μοναδική και ξεχωριστή.
Και το 2022 μια εταιρεία με έδρα τη Νέα Υόρκη, η ElevenLabs, παρουσίασε μια υπηρεσία που παρήγαγε εντυπωσιακούς κλώνους σχεδόν οποιασδήποτε φωνής γρήγορα. Η τεχνολογία της ElevenLabs είναι πλέον ευρέως διαθέσιμη.
«Μπορείτε απλώς να πλοηγηθείτε σε μια εφαρμογή, να πληρώσετε πέντε δολάρια το μήνα, να την τροφοδοτήσετε με σαράντα πέντε δευτερόλεπτα από τη φωνή κάποιου και στη συνέχεια να κλωνοποιήσετε αυτή τη φωνή», μου είπε ο Farid.
Είναι τόσο απλό πια.
Η εν λόγω εταιρεία αποτιμάται πλέον σε περισσότερα από ένα δισεκατομμύριο δολάρια και η υπόλοιπη Big Tech ακολουθεί στενά πάνω στα βήματα της. Οι σχεδιαστές του προγράμματος κλωνοποίησης Vall-E της Microsoft, το οποίο έκανε το ντεμπούτο του πέρυσι, χρησιμοποίησαν πάνω από 60.000 ώρες αφήγησης αγγλόφωνων ηχητικών βιβλίων από περισσότερους από επτά χιλιάδες ομιλητές. Το Vall-E, το οποίο δεν είναι διαθέσιμο ακόμη στο κοινό, ισχυρίζεται να μπορεί να αναπαράγει τη φωνή και το «ακουστικό περιβάλλον» ενός ομιλητή με ένα δείγμα μόλις τριών δευτερολέπτων.
Αλλά, φυσικά, η τεχνολογία αυτή χρησιμοποιείται και για κακόβουλους σκοπούς, όπως η απάτη στον Στιβ και την Ρόμπιν.
Κάτι που έχει γίνει ακόμη ευκολότερο τώρα που το TikTok, το YouTube και το Instagram αποθηκεύουν ατελείωτα βίντεο με κανονικούς ανθρώπους να μιλούν.
«Είναι απλό: Παίρνεις τριάντα ή εξήντα δευτερόλεπτα από τη φωνή ενός παιδιού και συνδέεσαι στο ElevenLabs και πολύ σύντομα η γιαγιά δέχεται ένα τηλεφώνημα με τη φωνή του εγγονού που λέει: “Γιαγιά, έχω πρόβλημα, έπαθα ατύχημα”», σημειώνει ο Farid, επισημαίνοντας με νόημα ότι «ο κακός στην άλλη άκρη της γραμμής μπορεί να αποτύχει στο ενενήντα εννέα τοις εκατό των περιπτώσεων και πάλι όμως μπορεί να γίνει πολύ, πολύ πλούσιος».
Ο Robin και ο Steve, στο Μπρούκλιν, πήραν πίσω τελικά τα χρήματά τους, αυτά τα 750 δολάρια, από το Venmo.
Σήμερα, είναι σε θέση να αστειεύονται με ορισμένες πτυχές της δοκιμασίας τους, αλλά ταυτόχρονα έχουν λάβει και τα μέτρα τους για το μέλλον.
«Σκεφτήκαμε έναν προφορικό κωδικό πρόσβασης για την ευρύτερη οικογένεια. Αν κάποιος από εμάς έχει πρόβλημα, οι άλλοι θα μπορούν να επιβεβαιώσουν άμεσα ότι είναι πραγματικά εκείνος που τους καλεί για βοήθεια», καταλήγει η Ρόμπιν.