Ένα από τα κορυφαία μοντέλα Τεχνητής Νοημοσύνης της OpenAI μπορεί να ξεπεράσει τους ανθρώπους στη διάγνωση ιατρικών παθήσεων, αλλά αυτό σημαίνει ότι η τεχνητή νοημοσύνη είναι έτοιμη να αντικαταστήσει τους ανθρώπινους γιατρούς; Όχι ακριβώς, αν και μια τέτοια τεχνολογία θα μπορούσε να διαδραματίσει ολοένα και μεγαλύτερο ρόλο στη θεραπεία των ασθενών.
Ο Άνταμ Ρόντμαν από την Ιατρική Σχολή του Χάρβαρντ και οι συνεργάτες του από πανεπιστήμια, νοσοκομεία και εταιρείες σε όλη την επικράτεια των ΗΠΑ υπέβαλαν το μοντέλο τεχνητής νοημοσύνης o1-preview που κυκλοφόρησε η OpenAI τον Σεπτέμβριο σε μιία σειρά δοκιμασιών για να αξιολογήσουν την απόδοσή του σε διάφορα ιατρικά καθήκοντα. Αυτές οι δοκιμές προσαρμόστηκαν από αντίστοιχες που χρησιμοποιούνται για την αξιολόγηση διαφορικής διάγνωσης—τη διαδικασία με την οποία οι γιατροί αποκλείουν πιθανές αιτίες μιας ασθένειας βάσει συμπτωμάτων και εξετάσεων—καθώς και τη λογική στη θεραπεία και τη διάγνωση που οι γιατροί ζυγίζουν τα προβλήματα, λαμβάνουν αποφάσεις για τη θεραπεία και καθορίζουν τα επόμενα βήματα.
Σε όλα τα παραπάνω η Τεχνητή Νοημοσύνη ξεπέρασε κατά πολύ τόσο τα προηγούμενα μοντέλα AI όσο και την ανθρώπινη απόδοση σύμφωνα με τις αξιολογήσεις ειδικών που βαθμολόγησαν τις απαντήσεις. Για παράδειγμα, σε ένα τεστ κλινικής σκέψης το o1 πέτυχε άριστη βαθμολογία σε 78 από τις 80 περιπτώσεις, σε σύγκριση με 47 στις 80 για το GPT-4, ένα παλαιότερο μοντέλο της OpenAI και 28 στις 80 για γιατρούς νοσοκομείων. «Ήταν αφύσικα υψηλό» λέει ο Ρόντμαν.
Η ερευνητική ομάδα φρόντισε να αποκλείσει την πιθανότητα ότι κάποιες από τις ιατρικές περιπτώσεις που αξιολόγησε η AI περιλαμβάνονταν στα δεδομένα εκπαίδευσής της, κάτι που θα μπορούσε να έχει ενισχύσει τεχνητά την απόδοσή της.
Αυτά τα υψηλά σκορ δεν σημαίνουν ότι πρέπει να προτιμήσουμε τη μηχανή τεχνητής νοημοσύνης από τους ανθρώπινους γιατρούς ή να στραφούμε σε ένα chatbot για διαγνώσεις—αυτό θα ήταν «ανεύθυνο». Αντίθετα οι ερευνητές ήθελαν να αναδείξουν ότι τα διαγνωστικά τεστ αναφοράς που χρησιμοποιούνται σήμερα δεν είναι επαρκή. «Ανησυχώ για την ιατρική επειδή δεν παίρνουμε αυτές τις τεχνολογίες στα σοβαρά. Δεν αναπτύσσουμε ουσιαστικά κριτήρια αξιολόγησης κι αγνοούμε σημαντικά μέρη της διαγνωστικής διαδικασίας.
Τα μοντέλα ΑΙ δεν μπορούν να εκφράσουν συναισθήματα ούτε να κατανοήσουν μη λεκτικά σημάδια από τους ασθενείς που θα μπορούσαν να υποδηλώνουν την ανάγκη για περαιτέρω διερεύνηση, όπως μπορεί να κάνει ένας ανθρώπινος γιατρός υποστηρίζει ο Κιθ Γκράιμς, πρώην γενικός ιατρός στη βρετανική εταιρεία ψηφιακής υγείας Curistica. «Αυτή η μελέτη εξετάζει μόνο ένα στενό κομμάτι της δουλειάς ενός γιατρού».
Η Έλεν Σάλσμπερι από το Πανεπιστήμιο της Οξφόρδης, ενεργή γενική ιατρός, τονίζει ότι αυτή θα είναι πάντα μια θεμελιώδης διαφορά μεταξύ ανθρώπων και AI. «Οι ασθενείς δεν παρουσιάζουν απαραίτητα ξεκάθαρα συμπτώματα. Ανάλογα με το πως θα τους κάνεις την ερώτηση μπορεί να προκύψουν διαφορετικές πληροφορίες». Επιπλέον, οι υποκείμενες παθήσεις και το άγχος των ασθενών επηρεάζουν τον τρόπο με τον οποίο περιγράφουν τα συμπτώματά τους. «Τα περισσότερα διαγνωστικά προβλήματα προκύπτουν επειδή υπάρχει ένας μεγάλος όγκος συμπτωμάτων και πρέπει να αποφασίσεις τι είναι πραγματικά σημαντικό».
Αυτό βέβαια δεν σημαίνει ότι η Τεχνητή Νοημοσύνη δεν έχει ρόλο στην ιατρική. «Σίγουρα θα έρθει η στιγμή που θα ξεπεράσουν τους γιατρούς» λέει ο Λουκ Άλεν, γενικός ιατρός στο Πανεπιστήμιο της Οξφόρδης – απλώς δεν είμαστε ακόμα εκεί. «Νομίζω ότι κατευθυνόμαστε προς μια συμπληρωματική εποχή, όπου η τεχνητή νοημοσύνη θα αναλαμβάνει τις βαριές υπολογιστικές εργασίες με τα δεδομένα και εμείς θα επικεντρωνόμαστε στην ανθρώπινη πλευρά της ιατρικής». Η πλήρης αντικατάσταση των γιατρών από AI του φαίνεται ανέφικτη – και τονίζει ότι οι άνθρωποι δεν πρέπει να αντιμετωπίζουν τις απαντήσεις της AI ως ανώτερες από αυτές των ιατρών.
Παρ’ όλα αυτά, πολλοί στον ιατρικό τομέα – συμπεριλαμβανομένων του Ρόντμαν και των συνεργατών του – βλέπουν τη σαφή επιθυμία του κόσμου για γιατρούς-ΑΙ. «Αυτό ισχύει και στα δύο συστήματα υγείας σε Ηνωμένο Βασίλειο και ΗΠΑ: το σύστημα υγείας καταρρέει» λέει ο Ρόντμαν. «Είμαι γιατρός, και ακόμα και για μένα είναι δύσκολο να δω τον προσωπικό μου γιατρό έγκαιρα. Ο κόσμος βλέπει – και δικαιολογημένα – τις αποτυχίες του συστήματος υγείας και ελπίζει πραγματικά ότι αυτή η τεχνολογία θα βοηθήσει να καλυφθούν τα κενά».
*Mε στοιχεία από το New Scientist.
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Inst agram.
Ένα από τα κορυφαία μοντέλα Τεχνητής Νοημοσύνης της OpenAI μπορεί να ξεπεράσει τους ανθρώπους στη διάγνωση ιατρικών παθήσεων, αλλά αυτό σημαίνει ότι η τεχνητή νοημοσύνη είναι έτοιμη να αντικαταστήσει τους ανθρώπινους γιατρούς; Όχι ακριβώς, αν και μια τέτοια τεχνολογία θα μπορούσε να διαδραματίσει ολοένα και μεγαλύτερο ρόλο στη θεραπεία των ασθενών.
Ο Άνταμ Ρόντμαν από την Ιατρική Σχολή του Χάρβαρντ και οι συνεργάτες του από πανεπιστήμια, νοσοκομεία και εταιρείες σε όλη την επικράτεια των ΗΠΑ υπέβαλαν το μοντέλο τεχνητής νοημοσύνης o1-preview που κυκλοφόρησε η OpenAI τον Σεπτέμβριο σε μιία σειρά δοκιμασιών για να αξιολογήσουν την απόδοσή του σε διάφορα ιατρικά καθήκοντα. Αυτές οι δοκιμές προσαρμόστηκαν από αντίστοιχες που χρησιμοποιούνται για την αξιολόγηση διαφορικής διάγνωσης—τη διαδικασία με την οποία οι γιατροί αποκλείουν πιθανές αιτίες μιας ασθένειας βάσει συμπτωμάτων και εξετάσεων—καθώς και τη λογική στη θεραπεία και τη διάγνωση που οι γιατροί ζυγίζουν τα προβλήματα, λαμβάνουν αποφάσεις για τη θεραπεία και καθορίζουν τα επόμενα βήματα.
Σε όλα τα παραπάνω η Τεχνητή Νοημοσύνη ξεπέρασε κατά πολύ τόσο τα προηγούμενα μοντέλα AI όσο και την ανθρώπινη απόδοση σύμφωνα με τις αξιολογήσεις ειδικών που βαθμολόγησαν τις απαντήσεις. Για παράδειγμα, σε ένα τεστ κλινικής σκέψης το o1 πέτυχε άριστη βαθμολογία σε 78 από τις 80 περιπτώσεις, σε σύγκριση με 47 στις 80 για το GPT-4, ένα παλαιότερο μοντέλο της OpenAI και 28 στις 80 για γιατρούς νοσοκομείων. «Ήταν αφύσικα υψηλό» λέει ο Ρόντμαν.
Η ερευνητική ομάδα φρόντισε να αποκλείσει την πιθανότητα ότι κάποιες από τις ιατρικές περιπτώσεις που αξιολόγησε η AI περιλαμβάνονταν στα δεδομένα εκπαίδευσής της, κάτι που θα μπορούσε να έχει ενισχύσει τεχνητά την απόδοσή της.
Αυτά τα υψηλά σκορ δεν σημαίνουν ότι πρέπει να προτιμήσουμε τη μηχανή τεχνητής νοημοσύνης από τους ανθρώπινους γιατρούς ή να στραφούμε σε ένα chatbot για διαγνώσεις—αυτό θα ήταν «ανεύθυνο». Αντίθετα οι ερευνητές ήθελαν να αναδείξουν ότι τα διαγνωστικά τεστ αναφοράς που χρησιμοποιούνται σήμερα δεν είναι επαρκή. «Ανησυχώ για την ιατρική επειδή δεν παίρνουμε αυτές τις τεχνολογίες στα σοβαρά. Δεν αναπτύσσουμε ουσιαστικά κριτήρια αξιολόγησης κι αγνοούμε σημαντικά μέρη της διαγνωστικής διαδικασίας.
Τα μοντέλα ΑΙ δεν μπορούν να εκφράσουν συναισθήματα ούτε να κατανοήσουν μη λεκτικά σημάδια από τους ασθενείς που θα μπορούσαν να υποδηλώνουν την ανάγκη για περαιτέρω διερεύνηση, όπως μπορεί να κάνει ένας ανθρώπινος γιατρός υποστηρίζει ο Κιθ Γκράιμς, πρώην γενικός ιατρός στη βρετανική εταιρεία ψηφιακής υγείας Curistica. «Αυτή η μελέτη εξετάζει μόνο ένα στενό κομμάτι της δουλειάς ενός γιατρού».
Η Έλεν Σάλσμπερι από το Πανεπιστήμιο της Οξφόρδης, ενεργή γενική ιατρός, τονίζει ότι αυτή θα είναι πάντα μια θεμελιώδης διαφορά μεταξύ ανθρώπων και AI. «Οι ασθενείς δεν παρουσιάζουν απαραίτητα ξεκάθαρα συμπτώματα. Ανάλογα με το πως θα τους κάνεις την ερώτηση μπορεί να προκύψουν διαφορετικές πληροφορίες». Επιπλέον, οι υποκείμενες παθήσεις και το άγχος των ασθενών επηρεάζουν τον τρόπο με τον οποίο περιγράφουν τα συμπτώματά τους. «Τα περισσότερα διαγνωστικά προβλήματα προκύπτουν επειδή υπάρχει ένας μεγάλος όγκος συμπτωμάτων και πρέπει να αποφασίσεις τι είναι πραγματικά σημαντικό».
Αυτό βέβαια δεν σημαίνει ότι η Τεχνητή Νοημοσύνη δεν έχει ρόλο στην ιατρική. «Σίγουρα θα έρθει η στιγμή που θα ξεπεράσουν τους γιατρούς» λέει ο Λουκ Άλεν, γενικός ιατρός στο Πανεπιστήμιο της Οξφόρδης – απλώς δεν είμαστε ακόμα εκεί. «Νομίζω ότι κατευθυνόμαστε προς μια συμπληρωματική εποχή, όπου η τεχνητή νοημοσύνη θα αναλαμβάνει τις βαριές υπολογιστικές εργασίες με τα δεδομένα και εμείς θα επικεντρωνόμαστε στην ανθρώπινη πλευρά της ιατρικής». Η πλήρης αντικατάσταση των γιατρών από AI του φαίνεται ανέφικτη – και τονίζει ότι οι άνθρωποι δεν πρέπει να αντιμετωπίζουν τις απαντήσεις της AI ως ανώτερες από αυτές των ιατρών.
Παρ’ όλα αυτά, πολλοί στον ιατρικό τομέα – συμπεριλαμβανομένων του Ρόντμαν και των συνεργατών του – βλέπουν τη σαφή επιθυμία του κόσμου για γιατρούς-ΑΙ. «Αυτό ισχύει και στα δύο συστήματα υγείας σε Ηνωμένο Βασίλειο και ΗΠΑ: το σύστημα υγείας καταρρέει» λέει ο Ρόντμαν. «Είμαι γιατρός, και ακόμα και για μένα είναι δύσκολο να δω τον προσωπικό μου γιατρό έγκαιρα. Ο κόσμος βλέπει – και δικαιολογημένα – τις αποτυχίες του συστήματος υγείας και ελπίζει πραγματικά ότι αυτή η τεχνολογία θα βοηθήσει να καλυφθούν τα κενά».
*Mε στοιχεία από το New Scientist.
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Inst agram.