“Oι μηχανές έρχονται να πάρουν τις δουλειές μας, ιδίως τις καλές δουλειές, τις δουλειές γραφείου, σκέψης, ανάλυσης, κρίσης. Δικηγόροι, τραπεζίτες, σύμβουλοι, αναλυτές. Η πρόβλεψη ακούστηκε επίσημα, δυνατά και με αυτοπεποίθηση από CEOs τεχνολογικών κολοσσών”. Δύο χρόνια μετά, η πραγματικότητα μοιάζει πιο πεισματάρα απ’ όσο περίμεναν οι αισιόδοξοι του disruption. Ένα νέο benchmark, το APEX-Agents έρχεται να προσγειώσει τις προσδοκίες πρακτικά. Το αποτέλεσμα είναι αμείλικτο: οι AI agents δεν είναι ακόμη έτοιμοι για τον χώρο εργασίας.
Το ενδιαφέρον δε βρίσκεται τόσο στο χαμηλό ποσοστό επιτυχίας, λιγότερο από 25% σωστές απαντήσεις στα καλύτερα μοντέλα, όσο στο γιατί αποτυγχάνουν. Τα μοντέλα δεν “σκοντάφτουν” επειδή δε ξέρουν, αλλά επειδή ακόμα δυσκολεύονται να κινηθούν μέσα στο χάος. Η καθημερινή εργασία δεν είναι ένα prompt. Είναι η ικανότητα να συνδέεις ασύνδετα πράγματα, να καταλαβαίνεις τι δεν ειπώθηκε, να διαβάζεις ανάμεσα στις γραμμές. Κάπου εκεί χάνεται το νήμα.
Προκρίνεται μια βαθύτερη αυταπάτη πίσω από την ιδέα ότι οι AI agents είναι έτοιμοι να αντικαταστήσουν τον άνθρωπο: ότι η γνώση είναι το βασικό κεφάλαιο της εργασίας, όμως δεν είναι. Η γνώση είναι απαραίτητη, αλλά δεν αρκεί. Η εργασία υψηλής αξίας απαιτεί κρίση, ευθύνη και κατανόηση πλαισίου. Απαιτεί να ξέρεις πότε να απαντήσεις και πότε να σωπάσεις. Πότε να ακολουθήσεις τη διαδικασία και πότε να την παρακάμψεις. Αυτές οι λεπτές αποφάσεις δεν κωδικοποιούνται εύκολα.
Οι AI agents σήμερα μοιάζουν περισσότερο με ασκούμενους. Έξυπνους, γρήγορους, με εντυπωσιακή μνήμη, αλλά επικίνδυνους αν τους αφήσεις χωρίς επίβλεψη. Μπορούν να βοηθήσουν, να προτείνουν, να επιταχύνουν. Δεν μπορούν όμως να αναλάβουν και αυτό έχει σημασία, γιατί η πραγματική αντικατάσταση δεν έρχεται όταν ένα εργαλείο κάνει το 20% της δουλειάς, αλλά όταν μπορείς να του εμπιστευτείς το 80% χωρίς φόβο.
Το APEX-Agents κάνει κάτι κρίσιμο: δεν μετρά εντυπώσεις, αλλά πράξη κι ευθύνη. Ρωτά: μπορεί αυτό το σύστημα να σταθεί σε ένα πραγματικό περιβάλλον επαγγελματικών υπηρεσιών; Μπορεί να πάρει μια σύνθετη απόφαση, γνωρίζοντας ότι αν κάνει λάθος, το κόστος είναι πραγματικό; Η απάντηση προς το παρόν είναι όχι.
Αυτό δεν σημαίνει ότι η AI απέτυχε, αλλά ότι αποκαλύφθηκε το πραγματικό μέγεθος της συγκεκριμένης δυναμικής σε ενεστώτα χρόνια. Συζητάμε επομένως για μία υποδομή που εξελίσσεται. Κάτι που αλλάζει τον τρόπο που δουλεύουμε. Οι πιο ρεαλιστικές εφαρμογές σήμερα αφορούν την ενίσχυση.
Υπάρχει και κάτι ακόμη που συχνά αγνοείται: ο χώρος εργασίας δεν είναι μόνο παραγωγή αποτελέσματος. Είναι σχέσεις, πολιτική, εμπιστοσύνη. Είναι το πως παρουσιάζεις μια απάντηση, το πως διαχειρίζεσαι την αβεβαιότητα. Οι άνθρωποι δεν πληρώνονται μόνο για να βρίσκουν τη σωστή απάντηση, αλλά για να την υπερασπίζονται.
Η συζήτηση για τους AI agents αποκαλύπτει κάτι βαθύτερο για τον ίδιο τον καπιταλισμό της γνώσης. Θέλαμε να πιστέψουμε ότι η εργασία είναι μια σειρά από tasks που απλώς περιμένουν αυτοματοποίηση. Το benchmark μας θυμίζει ότι η εργασία είναι περισσότερο διαδικασία παρά αποτέλεσμα, περισσότερο πλοήγηση παρά προορισμός.
Οι AI agents θα βελτιωθούν, το ιστορικό της τεχνολογίας το δείχνει. Τα ποσοστά θα ανέβουν, τα benchmarks θα “σπάσουν”, αλλά ακόμη κι όταν συμβεί αυτό, το ερώτημα δεν θα είναι αν μπορούν να κάνουν τη δουλειά, αλλά αν μπορούν να αναλάβουν την ευθύνη της. Το APEX-Agents ρίχνει τη συζήτηση από το hype στο έδαφος και μας θυμίζει ότι η ανθρώπινη εργασία δεν αντικαθίσταται τόσο εύκολα, επειδή ο κόσμος στον οποίο δουλεύουμε είναι βαθιά και πεισματικά ανθρώπινος.
*Με στοιχεία από το TechCrunch
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram





