Νόμιζες ότι το Pokémon ήταν ένα δύσκολο σημείο αναφοράς για την Τεχνητή Νοημοσύνη; Μια ομάδα ερευνητών υποστηρίζει ότι το Super Mario Bros είναι ακόμη πιο δύσκολο.
Το Hao AI Lab, μια ερευνητική ομάδα από το Πανεπιστήμιο της Καλιφόρνιας στο Σαν Ντιέγκο έβαλε πριν από λίγες ημέρες την Τεχνητή Νοημοσύνη να παίξει ζωντανά παιχνίδια Super Mario Bros. Η Claude 3.7 της Anthropic απέδωσε καλύτερα, ακολουθούμενη από την Claude 3.5. Οι Gemini 1.5 Pro της Google και GPT-4o της OpenAI αντιμετώπισαν δυσκολίες προσαρμογής σε αυτό το ιδιότυπο πείραμα που εφαρμόστηκε.
Δε χρησιμοποιήθηκε η αυθεντική έκδοση του Super Mario Bros που κυκλοφόρησε το 1985. Το παιχνίδι τρέχει σε έναν εξομοιωτή και ενσωματώθηκε με ένα πλαίσιο, το GamingAgent για να επιτρέψει στις Τεχνητές Νοημοσύνες να έχουν τον έλεγχο του Mario. Το GamingAgent, το οποίο ανέπτυξε εσωτερικά το Hao, παρείχε στην Τεχνητή Νοημοσύνη βασικές οδηγίες όπως: «Εάν υπάρχει εμπόδιο ή εχθρός κοντά, μετακινήσου/πήδηξε αριστερά για να αποφύγεις» και στιγμιότυπα του παιχνιδιού. Η Τεχνητή Νοημοσύνη στη συνέχεια δημιούργησε εντολές με τη μορφή κώδικα Python για να ελέγξει τον Mario.
Παρά αυτά, η Hao αναφέρει ότι το παιχνίδι ανάγκασε κάθε μοντέλο να «μάθει» να σχεδιάζει περίπλοκες κινήσεις και να αναπτύσσει στρατηγικές παιχνιδιού κι αυτό θεωρείται κέρδος. Ενδιαφέρον προκαλεί το γεγονός ότι το εργαστήριο διαπίστωσε ότι τα μοντέλα που βασίζονται στη σκέψη, όπως το OpenAI’s o1 που «σκέφτονται» τα προβλήματα βήμα-βήμα για να καταλήξουν σε λύσεις είχαν χειρότερη απόδοση από τα «μη σκεπτόμενα» μοντέλα παρά το γεγονός ότι γενικά είναι πιο δυνατά στις περισσότερες αναφορές. Αυτό εγείρει ερωτηματικά.
Ένας από τους κύριους λόγους που τα μοντέλα σκέψης αντιμετωπίζουν δυσκολίες στο να παίξουν παιχνίδια σε πραγματικό χρόνο είναι ότι χρειάζονται λίγο χρόνο — συνήθως δευτερόλεπτα — για να αποφασίσουν για τις ενέργειες, σύμφωνα με τους ερευνητές. Μέχρι να συμβεί αυτό όμως χάνουν στο παιχνίδι. Στο Super Mario Bros., ο χρόνος είναι το παν. Ένα δευτερόλεπτο μπορεί να σημαίνει τη διαφορά μεταξύ ενός άνετου άλματος και μιας πτώσης στο θάνατο και ξανά από την αρχή.
Τα παιχνίδια χρησιμοποιούνται για τη μέτρηση της Τεχνητής Νοημοσύνης για δεκαετίες, ωστόσο κάποιοι ειδικοί αμφισβητούν τη “σοφία” του να συνδέουμε τις ικανότητες της Τεχνητής Νοημοσύνης σε παιχνίδια με την τεχνολογική πρόοδο. Σε αντίθεση με τον πραγματικό κόσμο, τα παιχνίδια τείνουν να είναι αφηρημένα και σχετικά απλά, ενώ προσφέρουν μια θεωρητικά ατελείωτη ποσότητα δεδομένων για την εκπαίδευση της Τεχνητής Νοημοσύνης. Οι πρόσφατοι εντυπωσιακοί δείκτες μέτρησης μέσω παιχνιδιών δείχνουν αυτό που ο Andrej Karpathy, επιστημονικός ερευνητής και ιδρυτικό μέλος της OpenAI αποκάλεσε «κρίση αξιολόγησης». «Δεν ξέρω πραγματικά ποια [μετρικά δεδομένα της ΤΝ] να παρακολουθήσω αυτή τη στιγμή», έγραψε σε ανάρτησή του στο X.
Τουλάχιστον, μπορούμε να παρακολουθήσουμε την Τεχνητή Νοημοσύνη να παίζει Mario κι ας βγάλουν οι επιστήμονες σε ανώτερη κλίμακα τα συμπεράσματά τους, ενσωματώνοντας στη συνέχεια τις όποιες βελτιώσεις στα μοντέλα επεξεργασίας.
*Mε στοιχεία από το TechCrunch.
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram.