Η συμπεριφορά του ανθρώπινου εγκεφάλου, είναι ένα ζήτημα που απασχολεί την επιστημονική κοινότητα, και όχι μόνο, διαχρονικά. Πόσες φορές έχετε αναρωτηθεί πως θα ήταν αν μπορούσε κάποιος να διαβάσει τη σκέψη σας. Αυτό έμοιαζε να είναι ένα ουτοπικό επίτευγμα, που, όμως, τώρα γίνεται πραγματικότητα με τη βοήθεια του fMRI και της τεχνητής νοημοσύνης.
Η λειτουργική απεικόνιση μαγνητικού συντονισμού (fMRI) καταγράφει αδρά, πολύχρωμα στιγμιότυπα του εγκεφάλου σε δράση. Παρόλο που αυτός ο εξειδικευμένος τύπος απεικόνισης μαγνητικού συντονισμού έχει μεταμορφώσει τη γνωστική νευροεπιστήμη, δεν είναι μια μηχανή που διαβάζει το μυαλό: οι νευροεπιστήμονες δεν μπορούν να κοιτάξουν μια σάρωση του εγκεφάλου και να πουν τι έβλεπε, άκουγε ή σκεφτόταν κάποιος στον σαρωτή.
Σταδιακά οι επιστήμονες ξεπερνούν αυτό το θεμελιώδες εμπόδιο για να μεταφράσουν τις εσωτερικές εμπειρίες σε λέξεις χρησιμοποιώντας την απεικόνιση του εγκεφάλου. Αυτή η τεχνολογία θα μπορούσε να βοηθήσει ανθρώπους που δεν μπορούν να μιλήσουν ή να επικοινωνήσουν με άλλο τρόπο προς τα έξω, όπως εκείνους που έχουν υποστεί εγκεφαλικά επεισόδια ή ζουν με αμυοτροφική πλευρική σκλήρυνση. Οι σημερινές διεπαφές εγκεφάλου-υπολογιστή απαιτούν την εμφύτευση συσκευών στον εγκέφαλο, αλλά οι νευροεπιστήμονες ελπίζουν να χρησιμοποιήσουν μη επεμβατικές τεχνικές όπως η μαγνητική τομογραφία για να αποκρυπτογραφήσουν την εσωτερική ομιλία χωρίς την ανάγκη χειρουργικής επέμβασης.
Ερευνητές του Πανεπιστημίου του Τέξας Όστιν ανέπτυξαν έναν πρωτοποριακό “σημασιολογικό αποκωδικοποιητή” που χρησιμοποιεί τεχνητή νοημοσύνη για να μετατρέπει τις σαρώσεις της δραστηριότητας ομιλίας του ανθρώπινου εγκεφάλου σε παραφρασμένο κείμενο. Οι ερευνητές έκαναν ένα βήμα μπροστά συνδυάζοντας την ικανότητα της fMRI να παρακολουθεί τη νευρική δραστηριότητα με τη δύναμη της πρόβλεψης των γλωσσικών μοντέλων τεχνητής νοημοσύνης. Η υβριδική τεχνολογία οδήγησε σε έναν αποκωδικοποιητή που μπορεί να αναπαράγει τις ιστορίες που άκουγε ή φανταζόταν να λέει ένα άτομο στον σαρωτή. Ο αποκωδικοποιητής μπορούσε ακόμη και να μαντέψει την ιστορία πίσω από μια ταινία μικρού μήκους που παρακολούθησε κάποιος στον σαρωτή, αν και με μικρότερη ακρίβεια. Οι δημιουργοί της προειδοποιούν, ήδη, ότι θα μπορούσε να γίνει κατάχρηση, αν δεν ρυθμιστεί κατάλληλα.
Τα ευρήματα της ομάδας, που δημοσιεύθηκαν για πρώτη φορά τη Δευτέρα στο Nature Neuroscience, περιγράφουν λεπτομερώς ένα νέο σύστημα που ενσωματώνει ένα πρόγραμμα δημιουργίας παρόμοιο με το GPT-4 του OpenAI και το Google Bard μαζί με την υπάρχουσα τεχνολογία που είναι ικανή να ερμηνεύει σαρώσεις λειτουργικής μαγνητικής τομογραφίας (fMRI) – μια συσκευή που παρακολουθεί πώς και πού ρέει το αίμα σε συγκεκριμένες περιοχές του εγκεφάλου. Ενώ προηγούμενες διεπαφές εγκεφάλου-υπολογιστή (BCI) ήταν υποσχόμενες για την επίτευξη παρόμοιων μεταφραστικών ικανοτήτων, η έκδοση του UT Austin φέρεται να είναι η πρώτη μη επεμβατική έκδοση που δεν απαιτεί πραγματικά φυσικά εμφυτεύματα ή καλωδιώσεις.
Στο πλαίσιο της μελέτης, οι ερευνητές ζήτησαν από τρεις ανθρώπους να περάσουν, ξεχωριστά ο καθένας, συνολικά 16 ώρες μέσα σε ένα μηχάνημα fMRI ακούγοντας podcasts ήχου. Η επιστημονική ομάδα, εν τω μεταξύ, εκπαίδευσε ένα μοντέλο τεχνητής νοημοσύνης για τη δημιουργία και ανάλυση σημασιολογικών χαρακτηριστικών αναλύοντας σχόλια στο Reddit και αυτοβιογραφικά κείμενα. Με το πλέξιμο των δεδομένων, η τεχνητή νοημοσύνη έμαθε να ταιριάζει λέξεις και φράσεις που σχετίζονταν με σαρώσεις του εγκεφάλου των υποκειμένων για να δημιουργήσει σημασιολογικές συνδέσεις.
Μετά από αυτό το βήμα, ζητήθηκε και πάλι από τους συμμετέχοντες να ξαπλώσουν σε έναν σαρωτή fMRI και να ακούσουν νέο ήχο που δεν αποτελούσε μέρος των αρχικών δεδομένων. Ο σημασιολογικός αποκωδικοποιητής μετέφρασε στη συνέχεια τον ήχο σε κείμενο μέσω των σαρώσεων της εγκεφαλικής δραστηριότητας και μπορούσε να παράγει παρόμοια αποτελέσματα ακόμη και όταν τα υποκείμενα παρακολουθούσαν σιωπηλά βίντεο κλιπ ή φαντάζονταν τις δικές τους ιστορίες μέσα στο κεφάλι τους. Παρόλο που οι μεταγραφές της τεχνητής νοημοσύνης προσέφεραν γενικά απαντήσεις που δεν βρίσκονταν στη θέση τους ή ήταν ασαφώς διατυπωμένες, το συνολικό αποτέλεσμα εξακολουθούσε να παραφράζει με επιτυχία τους εσωτερικούς μονολόγους των υποκειμένων της δοκιμής. Μερικές φορές, μάλιστα, αντικατόπτριζε με ακρίβεια τις επιλογές λέξεων του ήχου. Όπως εξηγούν οι New York Times, τα αποτελέσματα υποδεικνύουν ότι ο αποκωδικοποιητής τεχνητής νοημοσύνης της ομάδας του UT Austin δεν καταγράφει απλώς τη σειρά των λέξεων, αλλά και το πραγματικό σιωπηρό νόημα.
Υπάρχει, ωστόσο, ένας σημαντικός όρος για τον νέο σημασιολογικό αποκωδικοποιητή – ο εθελοντής που ξαπλώνει στον σαρωτή πρέπει να καταβάλει μια συντονισμένη, συνειδητή προσπάθεια να συνεργαστεί με τους στόχους του προγράμματος τεχνητής νοημοσύνης. Με απλά λόγια, ένας πιο πολυάσχολος εγκέφαλος σημαίνει μια πιο ακατάληπτη απομαγνητοφώνηση.
Παρά τους σημερινούς περιορισμούς, η ερευνητική ομάδα προβλέπει ήδη τη δυνατότητα ταχείας προόδου παράλληλα με την κατάχρηση. “Οι μελλοντικές εξελίξεις θα μπορούσαν να επιτρέψουν στους αποκωδικοποιητές να παρακάμψουν αυτές τις απαιτήσεις [ιδιωτικότητας]“, έγραψε η ομάδα στη μελέτη της. “Επιπλέον, ακόμη και αν οι προβλέψεις του αποκωδικοποιητή είναι ανακριβείς χωρίς τη συνεργασία του υποκειμένου, θα μπορούσαν να παρερμηνευθούν σκόπιμα για κακόβουλους σκοπούς… Για αυτούς και άλλους απρόβλεπτους λόγους, είναι κρίσιμο να αυξηθεί η ευαισθητοποίηση σχετικά με τους κινδύνους της τεχνολογικής αποκωδικοποίησης του εγκεφάλου και να θεσπιστούν πολιτικές που προστατεύουν την ψυχική ιδιωτικότητα κάθε ατόμου“.
Πηγή: Popular Science