Η κυβέρνηση των ΗΠΑ έδωσε εντολή στην Anthropic να διακόψει άμεσα την πρόσβαση σε δύο από τα ισχυρότερα μοντέλα τεχνητής νοημοσύνης της, τα Claude Fable 5 και Claude Mythos 5, επικαλούμενη λόγους εθνικής ασφάλειας. Η εταιρεία δήλωσε δημόσια ότι συμμορφώθηκε, διευκρινίζοντας παράλληλα ότι θεωρεί πως η κυβερνητική εκτίμηση είναι λανθασμένη.
Σύμφωνα με την Anthropic, η οδηγία ελήφθη αργά το απόγευμα της Παρασκευής και απαιτεί την απενεργοποίηση και των δύο μοντέλων για όλους τους χρήστες παγκοσμίως. Αυτό ισχύει παρότι η εντολή παρουσιάζεται ως μέτρο ελέγχου εξαγωγών που στοχεύει ονομαστικά αλλοδαπούς υπηκόους. Η πρόσβαση στα υπόλοιπα μοντέλα της Anthropic, όπως σημειώνει η εταιρεία, δεν επηρεάζεται από το μέτρο. Ωστόσο, η απόσυρση των συγκεκριμένων εκδόσεων αγγίζει τον πυρήνα της στρατηγικής της, καθώς αφορούν τα πιο προηγμένα της συστήματα.
Η κυβερνητική κίνηση περιγράφεται ως δράση στο πλαίσιο ελέγχου εξαγωγών, με στόχο να περιοριστεί η πρόσβαση σε προηγμένα μοντέλα που θα μπορούσαν να αξιοποιηθούν για επιθετικές χρήσεις. Παρά ταύτα, όπως υποστηρίζει η Anthropic, η πρακτική εφαρμογή της οδηγίας οδηγεί σε καθολικό “κλείσιμο” των Claude Fable 5 και Claude Mythos 5, ανεξάρτητα από χώρα ή ιδιότητα χρήστη. Αυτό το σημείο είναι κεντρικό στη διαφωνία της εταιρείας. Η Anthropic αφήνει να εννοηθεί ότι, ενώ ο τίτλος της ενέργειας παραπέμπει σε εξαγωγικούς περιορισμούς, η αιτιολόγηση σχετίζεται με τεχνικό ζήτημα ασφάλειας που αποδίδεται στο Fable 5.
Γιατί το Mythos θεωρείται ιδιαίτερα ευαίσθητο
Το Claude Mythos 5 παρουσιάζεται από την Anthropic ως το πιο ικανό της μοντέλο. Η εταιρεία είχε γνωστοποιήσει ότι το κρατούσε αυστηρά περιορισμένο, επικαλούμενη αυτό που περιέγραψε ως εξαιρετική ικανότητα εντοπισμού ευπαθειών ασφαλείας σε λογισμικό. Σύμφωνα με την Anthropic, το Mythos εντόπισε αδυναμίες σε μεγάλα λειτουργικά συστήματα και δημοφιλείς web browsers κατά τις δοκιμές. Αντί για ευρεία διάθεση, η εταιρεία επέλεξε ένα ελεγχόμενο πρόγραμμα πρόσβασης, με την ονομασία Project Glasswing, μέσω του οποίου το μοντέλο διαμοιράστηκε σε περίπου 50 ελεγμένους οργανισμούς για αμυντική εργασία στην κυβερνοασφάλεια.
Στη λίστα των οργανισμών που αναφέρει η Anthropic περιλαμβάνονται εταιρείες όπως Amazon, Apple, Google, Microsoft και CrowdStrike. Η λογική του περιορισμού, όπως παρουσιάζεται, ήταν να αξιοποιηθεί η ικανότητα του μοντέλου για άμυνα, μειώνοντας τον κίνδυνο κακόβουλης χρήσης. Το Claude Fable 5 κυκλοφόρησε πολύ πρόσφατα και, σύμφωνα με την Anthropic, σχεδιάστηκε ως απάντηση στην εμπορική πίεση για δημόσια διαθέσιμη έκδοση υψηλών επιδόσεων. Η εταιρεία το περιγράφει ως παραλλαγή του Mythos με επιπλέον “κιγκλιδώματα” (guardrails), ώστε να μπλοκάρονται απαντήσεις σε τομείς υψηλού κινδύνου, όπως η κυβερνοασφάλεια και η βιολογία.
Παράλληλα, η Anthropic παρέπεμψε σε αποτελέσματα benchmarking της Vals AI, εταιρείας που παρακολουθεί την απόδοση τεχνολογιών AI, σύμφωνα με τα οποία το Fable 5 εμφανίστηκε ως το πιο ικανό δημόσια διαθέσιμο μοντέλο τη συγκεκριμένη περίοδο.
Πηγή εικόνας: Vals AI
Το ζήτημα του “jailbreak” και τι ισχυρίζεται η Anthropic
Σε εκτενές blog post, η Anthropic αναφέρει ότι η δική της κατανόηση είναι πως η βασική ανησυχία της κυβέρνησης συνδέεται με ισχυρισμό περί “jailbreak” του Fable 5. Όπως τονίζει, μέχρι στιγμής έχει λάβει μόνο προφορικές ενδείξεις για ένα πιθανό, στενό και μη καθολικό jailbreak. Η εταιρεία περιγράφει το υποτιθέμενο σενάριο ως κάτι που “ουσιαστικά ισοδυναμεί” με το να ζητηθεί από το μοντέλο να διαβάσει μια συγκεκριμένη βάση κώδικα και να εντοπίσει αδυναμίες λογισμικού. Προσθέτει ότι ανάλογο επίπεδο ικανότητας είναι ήδη διαθέσιμο σε άλλα δημόσια προσβάσιμα μοντέλα, συμπεριλαμβανομένου του GPT-5.5 της OpenAI.
Η Anthropic σημειώνει επίσης ότι παρόμοια χρήση αποτελεί συνηθισμένη πρακτική μεταξύ επαγγελματιών κυβερνοασφάλειας όταν ο στόχος είναι αμυντικός, όπως ο εντοπισμός και η επιδιόρθωση κενών ασφαλείας πριν αυτά αξιοποιηθούν κακόβουλα. Ένα ακόμη βασικό σημείο του επιχειρήματος της Anthropic είναι ότι οι ισχυρότερες δικλίδες ασφαλείας δεν βασίζονται αποκλειστικά στη συμπεριφορά του ίδιου του μοντέλου. Όπως αναφέρει, αξιοποιεί ανεξάρτητα συστήματα ταξινομητών (classifiers) που λειτουργούν ξεχωριστά.
Με αυτή τη λογική, ακόμη και αν κάποιος καταφέρει να παρακάμψει μια αρχική άρνηση του Fable 5, οι υποκείμενες προστασίες απέναντι στα πιο επικίνδυνα αποτελέσματα υποτίθεται ότι παραμένουν ενεργές. Η εταιρεία χρησιμοποιεί αυτό το επιχείρημα για να υποστηρίξει ότι μια μεμονωμένη, περιορισμένη παράκαμψη δεν θα έπρεπε να οδηγεί σε καθολική απόσυρση ενός εμπορικού μοντέλου.
Επιπτώσεις για τον κλάδο και το πλαίσιο ανταγωνισμού
Παρά τις εξηγήσεις της Anthropic, η κυβερνητική ενέργεια προχώρησε. Η εταιρεία υποστηρίζει ότι, αν το πρότυπο αυτό υιοθετηθεί ευρύτερα, θα μπορούσε να λειτουργήσει αποτρεπτικά για νέες κυκλοφορίες από παρόχους “frontier” μοντέλων, καθώς θα αυξάνει τον κίνδυνο άμεσης ανάκλησης με αφορμή περιορισμένες τεχνικές αδυναμίες ή ισχυρισμούς περί παράκαμψης. Η υπόθεση αποκτά πρόσθετο βάρος καθώς η Anthropic έχει καλλιεργήσει δημόσια εικόνα “ασφαλειοκεντρικής” εταιρείας. Παρατηρητές επισημαίνουν ότι η προηγούμενη επιλογή της να κρατήσει το Mythos περιορισμένο, ακριβώς λόγω της ισχύος του, ενδέχεται να ενίσχυσε το ενδιαφέρον των αρχών για πιο αυστηρό έλεγχο.
Στο ευρύτερο τοπίο ανταγωνισμού, έχουν καταγραφεί και επικριτικά σχόλια από την πλευρά της OpenAI. Ο Sam Altman έχει αναφερθεί στο παρελθόν στον χειρισμό του Mythos ως παράδειγμα επικοινωνίας που μπορεί να εκληφθεί ως μάρκετινγκ βασισμένο στον φόβο, υποστηρίζοντας ότι όταν μια εταιρεία επιμένει δημόσια πως ένα σύστημα είναι μοναδικά επικίνδυνο, είναι πιθανό αυτό να ληφθεί σοβαρά υπόψη και από ρυθμιστικές αρχές.
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram





