Κάποιες εποχές η τεχνολογία προχωρά με μικρά, ήσυχα βήματα και εποχές που ορμά προς τα εμπρός με τη μανία ενός αλόγου που δεν κοιτά πίσω του. Σήμερα ζούμε τη δεύτερη εκδοχή, με την τεχνητή νοημοσύνη να έχει μετατραπεί από υπόσχεση σε εμμονή. Μια εμμονή που έχει όνομα: κλιμάκωση. Περισσότερα δεδομένα, περισσότερα GPU, μεγαλύτερα μοντέλα, όλο και πιο ακριβά data centers. Η λογική είναι σχεδόν αυτόματη, σχεδόν δόγμα: όσο πιο μεγάλο, τόσο πιο έξυπνο. Όσο πιο ακριβό, τόσο πιο αποτελεσματικό, αλλά όπως συμβαίνει με κάθε δόγμα, κάποια στιγμή φτάνει σε ένα σημείο καμπής. Αυτή η στιγμή ίσως να πλησιάζει πολύ πιο γρήγορα απ’ όσο νομίζουν οι πρωταγωνιστές της τεχνολογικής κούρσας.
Ας ξεκινήσουμε από την αρχή. Η σημερινή βιομηχανία της τεχνητής νοημοσύνης έχει χτιστεί πάνω στην ιδέα ότι τα μεγάλα μοντέλα αποδίδουν καλύτερα και μέχρι τώρα αυτό ισχύει σε μεγάλο βαθμό: τα λεγόμενα frontier models εταιρειών όπως η OpenAI, η Anthropic ή η Google είναι σαφώς ανώτερα από τα μικρότερα, φθηνότερα μοντέλα που χτίζονται σε ακαδημαϊκά εργαστήρια ή startups με περιορισμένους πόρους.
Αυτή η ανισορροπία δημιούργησε και μια νέα γεωπολιτική οικονομία γύρω από την AI: εκατοντάδες δισεκατομμύρια δολάρια επενδύονται για να στηθούν τεράστια data centers, να παραχθούν custom chips, να αγοραστούν GPU. Η OpenAI για παράδειγμα ανακοίνωσε πρόσφατα συνεργασία με την Broadcom για σχεδιασμό νέων επεξεργαστών, με το μότο “ο κόσμος χρειάζεται περισσότερη υπολογιστική ισχύ”.
Πράγματι η ζήτηση για AI υποδομές έχει γίνει ο νέος πυρετός του χρυσού. Το 60% του κόστους ενός νέου data center αφορά GPUs, υλικό που απαξιώνεται γρήγορα, αλλά προς το παρόν θεωρείται αναγκαίο. Οι συμφωνίες υποδομών ξεπερνούν σε αξία πολλές εθνικές οικονομίες και πίσω απ’ όλα αυτά υπάρχει μια βασική παραδοχή: όσο περισσότερη ισχύς, τόσο καλύτερη τεχνητή νοημοσύνη.
Μόνο που η επιστήμη αρχίζει να ψιθυρίζει κάτι διαφορετικό.
Η ομάδα του MIT με επικεφαλής τον ερευνητή Hans Gundlach και τους Neil Thompson και Jayson Lynch χαρτογράφησε την πορεία των μεγάλων μοντέλων και έφτασε σε ένα ανησυχητικό αλλά απολύτως λογικό συμπέρασμα: όσο μεγαλώνουν τα μοντέλα, τόσο μειώνονται οι αποδόσεις τους. Με άλλα λόγια όσο ανεβαίνουμε την καμπύλη της κλιμάκωσης, τόσο περισσότερο πλησιάζουμε το σημείο που κάθε επιπλέον GPU, κάθε δισεκατομμύριο παραμέτρων, κάθε νέα δαπάνη αποδίδει όλο και λιγότερο.
Αντίθετα, τα μικρότερα μοντέλα εξοπλισμένα με πιο αποδοτικούς αλγορίθμους μπορούν σταδιακά να καλύψουν αυτή την απόσταση. Δεν χρειάζονται φουτουριστικά data centers και επενδύσεις-μαμούθ. Χρειάζονται έξυπνες λύσεις. Όπως λέει ο Thompson: «Αν δαπανάς τεράστια ποσά για να εκπαιδεύσεις αυτά τα μοντέλα, τότε σίγουρα θα πρέπει να επενδύεις και στην ανάπτυξη πιο αποδοτικών αλγορίθμων. Αυτό μπορεί να κάνει τεράστια διαφορά».
Η παρατήρηση αυτή δεν είναι θεωρητική. Ήδη το φθηνό και εντυπωσιακά αποδοτικό μοντέλο της DeepSeek τον Ιανουάριο έδειξε ότι η “λογική του μεγάλου μεγέθους” δεν είναι ο μόνος δρόμος προς την πρόοδο. Η σιωπηλή, αργή αλλά σταθερή βελτίωση της αποδοτικότητας μπορεί να υποσκάψει το μονοπώλιο των μεγάλων παικτών.
Την ίδια στιγμή η βιομηχανία της τεχνητής νοημοσύνης κινείται με τη φόρα ενός υπερηχητικού τρένου. OpenAI, Google, Meta και Amazon επενδύουν σε γιγαντιαία κέντρα δεδομένων και συμφωνίες αξίας εκατοντάδων δισεκατομμυρίων. Ολόκληρες τοπικές οικονομίες στις ΗΠΑ στηρίζονται σήμερα σε αυτή τη νέα “AI gold rush”.
Όμως σε αντίθεση με τον χρυσό, οι GPU απαξιώνονται ταχύτατα. Οι επενδύσεις αυτές δεν βασίζονται σε ένα σταθερό τεχνολογικό θεμέλιο αλλά σε μια παραδοχή πίστης: ότι η τεχνητή νοημοσύνη θα συνεχίσει να γίνεται καλύτερη όσο της ρίχνουμε πόρους. Αν αυτή η παραδοχή σπάσει, το οικοδόμημα μπορεί να τρίζει πιο γρήγορα απ’ όσο νομίζουμε.
Ήδη οικονομικοί και τεχνολογικοί αναλυτές προειδοποιούν ότι η φούσκα μπορεί να μη βρίσκεται στα μοντέλα, αλλά στις υποδομές. Ο Jamie Dimon της JP Morgan το είπε ξεκάθαρα: «Το επίπεδο αβεβαιότητας θα έπρεπε να είναι πολύ υψηλότερο στα μυαλά των περισσότερων».
Η πιο ενδιαφέρουσα διάσταση της μελέτης του MIT είναι ότι δεν καταδικάζει την τεχνητή νοημοσύνη σε επιβράδυνση. Αντίθετα δείχνει έναν εναλλακτικό δρόμο ανάπτυξης. Έναν δρόμο όπου η πρόοδος δεν θα μετριέται σε teraflops και αριθμούς παραμέτρων αλλά σε αποδοτικότητα, σε ευφυΐα αλγορίθμων, σε έξυπνη χρήση των πόρων. Αντί να στηρίζεται αποκλειστικά σε τεράστια μοντέλα η επόμενη γενιά τεχνητής νοημοσύνης μπορεί να στηριχθεί σε έξυπνα, μικρότερα συστήματα που τρέχουν σε προσιτότερο hardware, δίνοντας σε μικρότερους παίκτες τη δυνατότητα να μπουν στο παιχνίδι. Αυτή η “αποδημοκρατικοποίηση της ευφυΐας” μπορεί να αλλάξει τους γεωπολιτικούς και οικονομικούς συσχετισμούς που σήμερα θεωρούμε δεδομένους.
Η τεχνητή νοημοσύνη όπως την ξέρουμε σήμερα έχει τις ρίζες της σε ερευνητικές προσπάθειες που έγιναν στα περιθώρια σε πανεπιστήμια, σε ερευνητικά κέντρα, σε μικρές ομάδες που πειραματίστηκαν με ιδέες έξω από το κυρίαρχο ρεύμα. Αν η βιομηχανία ποντάρει τα πάντα σε μία μόνο κατεύθυνση deep learning, μεγάλα μοντέλα, GPU τότε κινδυνεύει να χάσει τις επόμενες μεγάλες ανακαλύψεις που θα προκύψουν αλλού: σε νέες μορφές υπολογισμού, σε διαφορετικά μαθηματικά πλαίσια, ακόμα και σε τεχνολογίες όπως η κβαντική πληροφορική.
Με άλλα λόγια, όσο μεγαλώνεις το μοντέλο, μικραίνεις τον ορίζοντα του μέλλοντος.
Η σημερινή στιγμή για την τεχνητή νοημοσύνη θυμίζει λίγο τις μεγάλες φούσκες της ιστορίας: τη φούσκα των σιδηροδρόμων τον 19ο αιώνα, το dot-com boom των αρχών του 2000. Δεν ήταν η τεχνολογία που έσκασε ήταν η υπερβολή, η εμμονή, η μονοδιάστατη πίστη ότι το μέγεθος αρκεί. Το MIT δεν προβλέπει καταστροφή. Προειδοποιεί. Προτείνει μια πιο σύνθετη, πιο ισορροπημένη στρατηγική. Μια στρατηγική που βάζει δίπλα στην υπολογιστική ισχύ την αλγοριθμική φινέτσα που αντιμετωπίζει την τεχνητή νοημοσύνη όχι ως εργοστάσιο γιγάντων, αλλά ως πεδίο ευφυούς σχεδίασης.
Αν η βιομηχανία το αγνοήσει, η ίδια η κλιμάκωση μπορεί να γίνει το αδιέξοδο που έσκαψε με τα ίδια της τα χέρια. Αν όμως το καταλάβει εγκαίρως, τότε το μέλλον μπορεί να είναι λιγότερο εντυπωσιακό σε μέγεθος, αλλά πολύ πιο έξυπνο και ίσως τελικά πολύ πιο ανθρώπινο.
*Mε στοιχεία από το Wired
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram.