Η OpenAI λανσάρει έναν νέο “γενικού σκοπού” πράκτορα (agent) στο ChatGPT, ο οποίος σύμφωνα με την εταιρεία μπορεί να ολοκληρώσει μια μεγάλη ποικιλία υπολογιστικών εργασιών εκ μέρους των χρηστών. Η OpenAI αναφέρει ότι ο πράκτορας μπορεί να πλοηγηθεί αυτόματα στο ημερολόγιο του χρήστη, να δημιουργήσει επεξεργάσιμες παρουσιάσεις και διαφάνειες, καθώς και να εκτελεί κώδικα. 

Το εργαλείο που ονομάζεται πράκτορας ChatGPT, συνδυάζει αρκετές δυνατότητες από τα προηγούμενα εργαλεία πράκτορες της OpenAI, όπως την ικανότητα του Operator να κλικάρει σε ιστοσελίδες, καθώς και την ικανότητα του Deep Research να συνθέτει πληροφορίες από δεκάδες ιστοσελίδες σε μια συνοπτική αναφορά έρευνας. Η OpenAI αναφέρει ότι οι χρήστες θα μπορούν να αλληλεπιδρούν με τον πράκτορα απλά δίνοντας εντολές στο ChatGPT χρησιμοποιώντας φυσική γλώσσα. 

Ο πράκτορας ChatGPT είναι διαθέσιμος από την Πέμπτη για τους συνδρομητές των προγραμμάτων Pro, Plus και Team της OpenAI. Για να ενεργοποιήσουν το εργαλείο, οι χρήστες μπορούν να επιλέξουν την «λειτουργία πράκτορα» από το αναπτυσσόμενο μενού εργαλείων του ChatGPT. 

Η κυκλοφορία του πράκτορα ChatGPT αντιπροσωπεύει την πιο τολμηρή προσπάθεια της OpenAI μέχρι σήμερα να μετατρέψει το ChatGPT σε ένα εργαλείο που μπορεί να αναλαμβάνει ενέργειες και να αναλαμβάνει καθήκοντα για τους χρήστες αντί να περιορίζεται μόνο στην απάντηση ερωτήσεων. Τα τελευταία χρόνια, εταιρείες της Silicon Valley, όπως η OpenAI, η Google και η Perplexity έχουν παρουσιάσει δεκάδες πράκτορες AI που υπόσχονται να κάνουν ακριβώς αυτό, ωστόσο αυτές οι πρώιμες εκδόσεις πράκτορες AI έχουν αποδειχθεί ότι δυσκολεύονται με πιο σύνθετες εργασίες και φαίνονται λιγότερο ελκυστικοί ως προϊόντα από το τελικό όραμα που παρουσιάζουν οι εκτελεστικοί διευθυντές τεχνολογίας γύρω από τους πράκτορες AI. 

Παρά ταύτα, η OpenAI αναφέρει ότι ο πράκτορας ChatGPT είναι πολύ πιο ικανός από τις προηγούμενες εκδοχές της. 

Ο νέος πράκτορας της εταιρείας μπορεί να έχει πρόσβαση σε συνδέσεις του ChatGPT, επιτρέποντας στους χρήστες να συνδέσουν εφαρμογές όπως το Gmail και το GitHub, έτσι ώστε ο πράκτορας να μπορεί να βρει σχετικές πληροφορίες για τις εντολές του χρήστη. Η OpenAI αναφέρει ότι ο πράκτορας ChatGPT έχει πρόσβαση σε τερματικό και μπορεί να χρησιμοποιεί APIs για να αποκτά πρόσβαση σε ορισμένες εφαρμογές. 

Η OpenAI προτείνει ότι οι χρήστες μπορούν να αξιοποιήσουν τον πράκτορα ChatGPT για να «σχεδιάσουν και να αγοράσουν τα υλικά για να ετοιμάσουν ένα ιαπωνικό πρωινό για τέσσερα άτομα», καθώς και να «αναλύσουν τρεις ανταγωνιστές και να δημιουργήσουν μια παρουσίαση». Τέτοιες ικανότητες απαιτούν από τον πράκτορα ChatGPT να αναλύσει ιστοσελίδες, να σχεδιάσει μια πορεία δράσης και να χρησιμοποιήσει εργαλεία, δηλαδή εργασίες πολύ πιο περίπλοκες από ό,τι η OpenAI έχει προσπαθήσει στο παρελθόν να αντιμετωπίσει με πράκτορες. 

Το μοντέλο που υποστηρίζει τον πράκτορα ChatGPT προσφέρει κορυφαία απόδοση σε αρκετά benchmarks, σύμφωνα με την OpenAI. 

Η εταιρεία αναφέρει ότι το μοντέλο του πράκτορα ChatGPT σημειώνει 41,6% στην “Τελευταία Εξέταση της Ανθρωπότητας” (pass@1), ένα δύσκολο τεστ που αποτελείται από χιλιάδες ερωτήσεις σε περισσότερα από εκατό θέματα. Αυτός ο αριθμός είναι σχεδόν διπλάσιος από ό,τι είχαν επιτύχει τα μοντέλα o3 και o4-mini της OpenAI στο ίδιο τεστ. 

Στο FrontierMath, ένα από τα πιο δύσκολα γνωστά μαθηματικά benchmarks, η OpenAI λέει ότι ο πράκτορας ChatGPT πετυχαίνει 27,4% όταν έχει πρόσβαση σε εργαλεία, όπως ένα τερματικό για εκτέλεση κώδικα. Η προηγούμενη κορυφαία επίδοση είχε σημειωθεί από το μοντέλο o4-mini, το οποίο είχε φτάσει μόλις το 6,3%. 

Η OpenAI σημειώνει ότι ανέπτυξε τον πράκτορα ChatGPT με γνώμονα την ασφάλεια, κυρίως επειδή το προϊόν παρουσιάζει κάποιες νέες δυνατότητες που θα μπορούσαν να το κάνουν πιο επικίνδυνο αν πέσει στα χέρια κακόβουλων ατόμων. Η OpenAI έχει προειδοποιήσει στο παρελθόν ότι τα μοντέλα πράκτορες μπορεί να παρουσιάζουν επικίνδυνες δυνατότητες. 

Στην έκθεση ασφάλειας για τον πράκτορα ChatGPT, η OpenAI λέει ότι έχει χαρακτηριστεί το μοντέλο ως “υψηλής ικανότητας” στους τομείς των βιολογικών και χημικών όπλων που ορίζεται στο “Πλαίσιο Ετοιμότητας” της OpenAI ως ένα μοντέλο με την ικανότητα να “ενισχύει υπάρχουσες διαδρομές προς σοβαρή βλάβη“. Η OpenAI σημειώνει ότι δεν έχει άμεση απόδειξη γι’ αυτό, αλλά αποφάσισε να ακολουθήσει μια προληπτική προσέγγιση και να ενεργοποιήσει νέες προστασίες για να μειώσει αυτούς τους κινδύνους. 

Τα νέα μέτρα σχετικά με τον πράκτορα ChatGPT περιλαμβάνουν έναν παρατηρητή που λειτουργεί σε πραγματικό χρόνο, καθώς οι χρήστες αλληλεπιδρούν με το προϊόν. Η OpenAI λέει ότι εκτελεί συγκεκριμένη ταξινόμηση σε κάθε εντολή που εισάγεται στον πράκτορα ChatGPT, προσδιορίζοντας εάν το αίτημα σχετίζεται με τη βιολογία. Εάν ναι, η OpenAI εκτελεί την απάντηση του πράκτορα ChatGPT μέσω ενός δεύτερου παρατηρητή που καθορίζει εάν το περιεχόμενο θα μπορούσε να χρησιμοποιηθεί για να προκαλέσει βιολογική απειλή. 

Η OpenAI επίσης αναφέρει ότι έχει απενεργοποιήσει τη δυνατότητα μνήμης του ChatGPT για αυτόν τον πράκτορα, προκειμένου να αποτραπεί η κακή χρήση. Σε άλλα μέρη του ChatGPT, η δυνατότητα μνήμης επιτρέπει στο chatbot να αναφέρεται σε πληροφορίες από προηγούμενες συνομιλίες με τον χρήστη, ωστόσο η OpenAI λέει ότι οι κακόβουλοι χρήστες θα μπορούσαν να εκμεταλλευτούν αυτή τη δυνατότητα στον πράκτορα ChatGPT για να εξαγάγουν ευαίσθητα δεδομένα μέσω επιθέσεων με έγχυση εντολών. Η εταιρεία λέει ότι μπορεί να εξετάσει την προσθήκη αυτής της δυνατότητας στο μέλλον. 

Ενώ ο πράκτορας ChatGPT φαίνεται εντυπωσιακός, παραμένει ασαφές πόσο ικανός είναι πραγματικά στον πραγματικό κόσμο. Μέχρι τώρα η τεχνολογία των πρακτόρων έχει αποδειχθεί σχετικά ασταθής, όταν αλληλεπιδρά με τον πραγματικό κόσμο. Παρόλα αυτά, η OpenAI δηλώνει ότι έχει αναπτύξει ένα πιο ικανό μοντέλο που είναι ικανό να εκπληρώσει την υπόσχεση των AI πρακτόρων. 

*Mε στοιχεία από το TechCrunch.

 

 

 Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram.