Οι άνθρωποι είμαστε πολύ καλοί στο να αντιλαμβανόμαστε τη σκέψη και τις πεποιθήσεις των άλλων. Παρακολουθούμε τα πρόσωπα και τις κινήσεις τους και ακούγοντας τα λόγια τους μπορούμε να συνδυάσουμε τις πληροφορίες και να συμπεράνουμε τι συμβαίνει μέσα στο μυαλό τους. Η μη λεκτική επικοινωνία είναι εξίσου σημαντική. Η δυνατότητα να καταλάβεις ένα βλέμμα, μία κίνηση του χεριού, το κλείσιμο του ματιού, τις εκφράσεις του προσώπου, βοηθά στο να επικοινωνήσουμε και να χτίσουμε σχέσεις.
Για τους ψυχολόγους, αυτή η δυνατότητα να μπορούμε να αποδώσουμε σε ανθρώπους νοητικές καταστάσεις διαφορετικές από τις δικές μας (πεποιθήσεις, σκέψεις, συναισθήματα), και, με βάση την κατανόηση αυτή, να εξηγήσουμε και να προβλέψουμε τόσο τις δικές μας πράξεις όσο και αυτές των άλλων ονομάζεται θεωρία του νου. Όταν αυτή απουσιάζει ή δεν έχει αναπτυχθεί επαρκώς, αποτελεί σημάδι ύπαρξης κάποιας διαταραχής, της σχιζοφρένειας, του αυτισμού, ή κάποιας αναπτυξιακής διαταραχής. Η θεωρία του νου μας βοηθά να επικοινωνούμε και να κατανοούμε ο ένας τον άλλον- μας επιτρέπει να απολαμβάνουμε τη λογοτεχνία και τις ταινίες, να παίζουμε παιχνίδια και να κατανοούμε το κοινωνικό μας περιβάλλον. Με πολλούς τρόπους, η ικανότητα αυτή αποτελεί ουσιαστικό μέρος της ανθρώπινης ύπαρξης.
Τι θα γινόταν αν μια μηχανή μπορούσε να διαβάσει τη σκέψη και το μυαλό;
Ο ψυχολόγος Michal Kosinski του Stanford Graduate School of Business, διατύπωσε ακριβώς αυτό το επιχείρημα: ότι μεγάλα γλωσσικά μοντέλα όπως τα ChatGPT και GPT-4 της OpenAI – βασισμένοι στην τεχνητή νοημοσύνη και αλγόριθμους που εκπαιδεύονται σε τεράστιες ποσότητες κειμένου από το διαδίκτυο – έχουν αναπτύξει θεωρία του νου. Οι μελέτες του έχουν προκαλέσει αναστάτωση και έχουν ξεσηκώσει συζητήσεις στην επιστημονική κοινότητα, προσπαθώντας να δώσουν μία απάντηση (με μια πιο στιβαρή επιστημονική έρευνα) σε ερωτήματα που εύλογα προκύπτουν: – Μπορεί το ChatGPT να σκεφτεί σαν άνθρωπος; Τι δυνατότητες έχουν αυτά τα μοντέλα και πώς θα μπορούσαν να αλλάξουν την κατανόησή μας για το ίδιο μας το μυαλό;
Προηγούμενη έρευνα του Dr. Kosinski έδειξε ότι τα νευρωνικά δίκτυα που εκπαιδεύονται να αναλύουν χαρακτηριστικά του προσώπου, όπως το σχήμα της μύτης, η γωνία του κεφαλιού και η συναισθηματική έκφραση, μπορούν να προβλέψουν τις πολιτικές απόψεις και τον σεξουαλικό προσανατολισμό των ανθρώπων με εκπληκτικό βαθμό ακρίβειας (περίπου 72% στην πρώτη περίπτωση και περίπου 80% στη δεύτερη περίπτωση). Η πρόσφατη εργασία του σχετικά με τα μεγάλα γλωσσικά μοντέλα χρησιμοποιεί τα κλασικά τεστ θεωρίας του νου που μετρούν την ικανότητα των παιδιών να αποδίδουν ψευδείς πεποιθήσεις σε άλλους ανθρώπους.
Ένα διάσημο παράδειγμα είναι η δοκιμασία Sally-Anne, στην οποία ένα κορίτσι, η Anne, μετακινεί μια μπίλια από ένα καλάθι σε ένα κουτί όταν ένα άλλο κορίτσι, η Sally, δεν κοιτάζει. Για να γνωρίζει πού θα ψάξει η Σάλι για το βόλο, ισχυρίστηκαν οι ερευνητές, ο θεατής θα πρέπει να ασκήσει τη θεωρία του νου, συνδυάζοντας τις αντιδράσεις της, τη μη λεκτική επικοινωνία, τα αντιληπτικά δηλαδή στοιχεία και το σχηματισμό πεποιθήσεων: Η Sally δεν είδε την Anne να μετακινεί τη μπίλια στο κουτί, οπότε εξακολουθεί να πιστεύει ότι βρίσκεται εκεί που την άφησε τελευταία φορά, στο καλάθι. Ο Dr. Kosinski παρουσίασε 10 μεγάλα γλωσσικά μοντέλα με 40 μοναδικές παραλλαγές αυτών των δοκιμασιών θεωρίας του νου – περιγραφές καταστάσεων όπως η δοκιμασία Sally-Anne, στην οποία ένα άτομο (Sally) σχηματίζει μια λανθασμένη πεποίθηση. Στη συνέχεια υπέβαλε στα μοντέλα ερωτήσεις σχετικά με αυτές τις καταστάσεις, παροτρύνοντάς τα να δουν αν θα απέδιδαν ψευδείς πεποιθήσεις στους εμπλεκόμενους χαρακτήρες και θα προέβλεπαν με ακρίβεια τη συμπεριφορά τους. Διαπίστωσε ότι το GPT-3.5, που κυκλοφόρησε τον Νοέμβριο του 2022, το έκανε αυτό στο 90% των περιπτώσεων και το GPT-4, που κυκλοφόρησε τον Μάρτιο του 2023, στο 95% των περιπτώσεων.
Το συμπέρασμα; Οι μηχανές έχουν θεωρία του νου.
Βέβαια, μετά τη δημοσίευση αυτών των αποτελεσμάτων, ο Tomer Ullman, ψυχολόγος στο Πανεπιστήμιο του Χάρβαρντ, απέδειξε, ότι μικρές προσαρμογές στις πληροφορίες μπορούν να αλλάξουν εντελώς τις απαντήσεις που παράγονται ακόμη και από τα πιο εξελιγμένα μεγάλα γλωσσικά μοντέλα. Εάν ένα δοχείο περιγραφόταν ως διαφανές, οι μηχανές δεν θα μπορούσαν να συμπεράνουν ότι κάποιος μπορούσε να δει μέσα σε αυτό. Οι μηχανές δυσκολεύονταν να λάβουν υπόψη τους τη μαρτυρία των ανθρώπων σε αυτές τις καταστάσεις και μερικές φορές δεν μπορούσαν να διακρίνουν αν ένα αντικείμενο βρισκόταν μέσα σε ένα δοχείο ή πάνω σε αυτό.
Ο Maarten Sap, επιστήμονας πληροφορικής στο Πανεπιστήμιο Carnegie Mellon, τροφοδότησε περισσότερες από 1.000 δοκιμασίες θεωρίας του νου σε μεγάλα γλωσσικά μοντέλα και διαπίστωσε ότι τα πιο εξελιγμένα, όπως οι ChatGPT και GPT-4, περνούσαν μόνο το 70 % των περιπτώσεων. (Με άλλα λόγια, ήταν κατά 70 % επιτυχείς στο να αποδίδουν ψευδείς πεποιθήσεις στους ανθρώπους που περιγράφονταν στις καταστάσεις των δοκιμών). Η ασυμφωνία μεταξύ των δεδομένων του και του Dr. Kosinski θα μπορούσε να οφείλεται σε διαφορές στις δοκιμές, αλλά ο Dr. Sap δήλωσε ότι ακόμη και η επιτυχία στο 95 % τω περιπτώσεων δεν θα αποτελούσε απόδειξη πραγματικής θεωρίας του νου. Τα μηχανήματα συνήθως αποτυγχάνουν με έναν συγκεκριμένο τρόπο, αδυνατώντας να εμπλακούν σε αφηρημένη λογική και συχνά κάνοντας “ψευδείς συσχετισμούς”, είπε.
Ο Dr Ullman σημείωσε ότι οι ερευνητές της μηχανικής μάθησης έχουν αγωνιστεί τις τελευταίες δύο δεκαετίες για να αποτυπώσουν την ευελιξία της ανθρώπινης γνώσης σε υπολογιστικά μοντέλα. Αυτή η δυσκολία ήταν μια “σκιώδης διαπίστωση”, είπε, που κρυβόταν πίσω από κάθε συναρπαστική καινοτομία. Οι ερευνητές έχουν δείξει ότι τα γλωσσικά μοντέλα δίνουν συχνά λανθασμένες ή άσχετες απαντήσεις όταν προετοιμάζονται με περιττές πληροφορίες πριν τεθεί μια ερώτηση- ορισμένα chatbots αποπροσανατολίστηκαν τόσο πολύ από υποθετικές συζητήσεις για πουλιά που μιλούσαν, ώστε τελικά ισχυρίστηκαν ότι τα πουλιά μπορούν να μιλήσουν. Επειδή η συλλογιστική τους είναι ευαίσθητη σε μικρές αλλαγές στα δεδομένα που δέχονται, οι επιστήμονες έχουν αποκαλέσει τη γνώση αυτών των μηχανών «εύθραυστη» .
Η Dr. Alison Gopnik, ψυχολόγος στο πανεπιστήμιο της California, συνέκρινε τη θεωρία του νου των μεγάλων γλωσσικών μοντέλων με τη δική της γενική κατανόηση της θεωρίας της σχετικότητας. «Έχω διαβάσει αρκετά ώστε να ξέρω ποιες είναι οι λέξεις», είπε. «Αλλά αν μου ζητούσατε να κάνω μια νέα πρόβλεψη ή να πω τι μας λέει η θεωρία του Αϊνστάιν για ένα νέο φαινόμενο, θα έμενα σε αδιέξοδο γιατί δεν έχω πραγματικά τη θεωρία στο μυαλό μου. Αντίθετα, η ανθρώπινη θεωρία του νου συνδέεται με άλλους μηχανισμούς συλλογισμού της κοινής λογικής».
Σε γενικές γραμμές, το έργο του Dr. Kosinski και οι αντιδράσεις σε αυτό εντάσσονται στη συζήτηση σχετικά με το αν οι ικανότητες αυτών των μηχανών μπορούν να συγκριθούν με τις ικανότητες των ανθρώπων – μια συζήτηση που διχάζει τους ερευνητές που ασχολούνται με την επεξεργασία της φυσικής γλώσσας. Είναι αυτές οι μηχανές στοχαστικοί παπαγάλοι, ή εξωγήινες οντότητες, ή δόλιοι απατεώνες; Μια έρευνα του 2022 στον τομέα διαπίστωσε ότι, από τους 480 ερευνητές, το 51% πίστευε ότι τα μεγάλα γλωσσικά μοντέλα θα μπορούσαν τελικά να «κατανοήσουν τη φυσική γλώσσα με κάποια μη τετριμμένη έννοια» και το 49% πίστευε ότι δεν θα μπορούσαν.
Ο Dr. Ullman δεν αποκλείει την πιθανότητα κατανόησης ή την ανάπτυξη θεωρίας του νου από μηχανές, αλλά είναι επιφυλακτικός στο να αποδίδει ανθρώπινες ικανότητες σε μη ανθρώπινα πράγματα. Είναι φυσικό και συχνά κοινωνικά επιβεβλημένο να εξηγούμε την ανθρώπινη συμπεριφορά μιλώντας για πεποιθήσεις, επιθυμίες, προθέσεις και σκέψεις. Αυτή η τάση είναι θεμελιώδης για το ποιοι είμαστε – τόσο θεμελιώδης που μερικές φορές προσπαθούμε να διαβάσουμε το μυαλό πραγμάτων που δεν έχουν μυαλό, τουλάχιστον όχι μυαλό σαν το δικό μας.
• Με πληροφορίες από: The New York Times