Η τεχνητή νοημοσύνη μετριέται λάθος. Για χρόνια κυριαρχεί μια απλή σύγκριση, μηχανή εναντίον ανθρώπου. Ποιος γράφει καλύτερα, ποιος λύνει ταχύτερα, ποιος κερδίζει στο σκάκι. Μια εύκολη, απλοϊκή αφήγηση, που όμως είναι μετρήσιμη κι εντυπωσιακή με τον τρόπου που παρουσιάζεται. Οι αριθμοί λάμπουν, τα headlines πολλαπλασιάζονται, η ουσία χάνεται. 

Η πραγματικότητα δείχνει κάτι άλλο. Η τεχνητή νοημοσύνη δε λειτουργεί σε κενό, μπαίνει σε ομάδες, σε οργανισμούς, σε διαδικασίες γεμάτες τριβές, αντιφάσεις και καθυστερήσεις. Εκεί δοκιμάζεται πραγματικά. Τα benchmarks αγνοούν αυτό το πεδίο, μετρούν απομονωμένες επιδόσεις. Σαν εξετάσεις σχολείου, σωστό ή λάθος, γρήγορο ή αργό. Ίσως να είναι κι ο λόγος που τα εργαλεία δεν έχουν απογειωθεί, αλλά χρησιμοποιούνται καθημερινά για μία σειρά από εργασίες που θα έκανε ένας επαγγελματίας, επιπέδου junior. Η απόσταση ανάμεσα στη μέτρηση και στη χρήση μεγαλώνει επικίνδυνα, αλλά ακόμα δεν έχει βρεθεί η φόρμουλα που θα φέρει την επόμενη βιομηχανική επανάσταση. 

Ένα μοντέλο μπορεί να πετυχαίνει 98% ακρίβεια, να εντυπωσιάζει με την ταχύτητά του, να υπόσχεται παραγωγικότητα, ωστόσο την καθημερινότητα ξεκινά η αποδόμηση. Στα νοσοκομεία για παράδειγμα, η εικόνα αλλάζει. Η τεχνητή νοημοσύνη διαβάζει εξετάσεις καλύτερα από έναν ακτινολόγο. Αυτό λένε τα tests. Στην πράξη οι γιατροί αφιερώνουν περισσότερο χρόνο. Πρέπει να ερμηνεύσουν το αποτέλεσμα, να το προσαρμόσουν σε πρωτόκολλα, να το συζητήσουν σε ομάδες. Σε αυτή τη φάση πάντα υπάρχει ο φόβος του λάθους και μιλάμε για ανθρώπινες ζωές σε αυτήν την περίπτωση. 

Η διάγνωση είναι συλλογική διαδικασία. Περιλαμβάνει διαφορετικές ειδικότητες (διαφωνίες, αναθεωρήσεις, χρόνο). Η μηχανή εισβάλλει σε αυτό το οικοσύστημα. Δεν το αντικαθιστά, το επηρεάζει και μερικές φορές άθελά της το βαραίνει. 

Το ίδιο μοτίβο επαναλαμβάνεται παντού. Επιχειρήσεις, μη κερδοσκοπικοί οργανισμοί, πανεπιστήμια. Η τεχνητή νοημοσύνη αποδίδει εξαιρετικά σε αποστειρωμένες συνθήκες, στην πραγματική ζωή αρκετές φορές σκοντάφτει. Έτσι γεννιέται ένα νέο φαινόμενο. Το “νεκροταφείο” της τεχνητής νοημοσύνης. Εργαλεία με υψηλές επιδόσεις εγκαταλείπονται κι η εμπιστοσύνη διαβρώνεται. 

Το κόστος ξεπερνά τα οικονομικά, αγγίζει την κοινωνία και την εμπιστοσύνη του κοινού. Το πρόβλημα βαθαίνει όταν οι ρυθμιστικές αρχές βασίζονται σε αυτά τα metrics. Οι αποφάσεις παίρνονται πάνω σε ελλιπή δεδομένα. Τα ρίσκο μεταφέρεται στους οργανισμούς, η ευθύνη διαχέεταιΗ λύση απαιτεί αλλαγή οπτικής και φιλοσοφίας. 

Η αξιολόγηση πρέπει να εξετάζει πως η τεχνητή νοημοσύνη συνεργάζεται με ανθρώπους. Πως επηρεάζει τη σκέψη, πως αλλάζει τη λήψη αποφάσεων, πως ενισχύει ή αποδυναμώνει τον συντονισμό. Σε ένα νοσοκομείο του Ηνωμένου Βασιλείου εφαρμόστηκε μια τέτοια προσέγγιση. Η ερώτηση άλλαξε. Δεν αφορούσε μόνο την ακρίβεια, αλλά και την ποιότητα συνεργασίας, την ικανότητα της ομάδας να σκέφτεται συλλογικά και την εμφάνιση νέων λαθών. Αυτό είναι το κρίσιμο σημείο. Η τεχνητή νοημοσύνη είναι παράγοντας μέσα σε ένα σύστημα, μία ακόμα μεταβλητή που μας βοηθάει στη λύση της τελικής εξίσωσης. 

Ο χρόνος παίζει επίσης καθοριστικό ρόλο. Οι σημερινές μετρήσεις μοιάζουν με τεστ μιας ημέρας, η πραγματική απόδοση χτίζεται σε μήνες. Τα λάθη της τεχνητής νοημοσύνης δεν είναι το βασικό πρόβλημα, αλλά το κατά πόσο αυτά γίνονται αντιληπτά στον σωστό χρόνο. Η βραχυπρόθεσμη μέτρηση κρύβει τις συνέπειες. Ένα εργαλείο μπορεί να επιταχύνει μια διαδικασία, ταυτόχρονα αυξάνει το γνωστικό φορτίο. Οδηγεί σε πρόωρα συμπεράσματα, δημιουργεί νέα εμπόδια πιο κάτω στην αλυσίδα. 

Η μετάβαση σε πιο σύνθετα benchmarks φέρνει δυσκολίες. Αυξάνει το κόστος, μειώνει τη δυνατότητα σύγκρισης, απαιτεί χρόνο και πόρους. Αυτό είναι όμως το “τίμημα” της αλήθειας, ειδικά όταν μιλάμε για την υγεία. Η σημερινή προσέγγιση υπόσχεται σαφήνεια., συχνά όμως παράγει αυταπάτες. Η επόμενη προσέγγιση φέρνει πολυπλοκότητα, προσεγγίζει την πραγματικότητα. Το διακύβευμα είναι μεγάλο. Η τεχνητή νοημοσύνη επηρεάζει κρίσιμους τομείς (υγεία, εκπαίδευση, οικονομία). Δεν αφορά το τι μπορεί να κάνει μια μηχανή μόνη της, αλλά το τι συμβαίνει όταν μπαίνει μέσα σε ανθρώπινες σχέσεις, ομάδες και δομές. Εκεί κρίνεται το μέλλον της κι αποκαλύπτεται η αξία της. 

*Mε στοιχεία από το Technology Review 

 

 

 Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram