Υπάρχει μια λέξη που επανέρχεται ξανά και ξανά όταν μιλάμε για την τεχνητή νοημοσύνη: δεδομένα. Χωρίς αυτά τα μεγαλύτερα γλωσσικά μοντέλα του κόσμου δεν είναι παρά άδεια δοχεία. Όσο πιο πολλά δεδομένα έχουν τόσο πιο “έξυπνα” φαίνονται. Μέχρι τώρα, οι εταιρείες AI έμαθαν να τρώνε σαν ακρίδες το διαδίκτυο: άρθρα, βιβλία, εικόνες, βίντεο, συνομιλίες, ό,τι μπορούσε να κατέβει από τον ιστό. Όμως αυτή η δεξαμενή σιγά-σιγά στερεύει. Το διαδίκτυο δεν προσφέρει πλέον τις καθαρές, “φρέσκες” πληροφορίες που χρειάζονται για να πάνε το επόμενο βήμα. Γι’ αυτό οι κολοσσοί του κλάδου στρέφονται αλλού: στον πραγματικό κόσμο.
Τους τελευταίους μήνες βλέπουμε έναν αγώνα δρόμου. Η OpenAI, η Google και η Perplexity δεν ψάχνουν απλώς να φτιάξουν καλύτερα μοντέλα, αλλά να βρουν νέες πηγές δεδομένων. Δεδομένων που δεν μπορείς να “ξύνεις” από μια ιστοσελίδα, αλλά που παράγονται καθημερινά από συναλλαγές, συνομιλίες, αναζητήσεις, συνήθειες κι αυτό σημαίνει συνεργασίες, συμφωνίες και συχνά δωρεάν δώρα στους χρήστες που στην πραγματικότητα δεν είναι και τόσο δωρεάν.
Η OpenAI συνεργάστηκε με κολοσσούς του ηλεκτρονικού εμπορίου όπως η Shopee και η Shopify. Η Google και η Perplexity μοίρασαν πρόσβαση σε προηγμένα εργαλεία τους σε επιλεγμένους χρήστες στην Ινδία εκεί όπου το κοινό είναι νεανικό, τεχνολογικά “ψημένο” και με απίστευτη διείσδυση κινητών. Στόχος; Να αποκτήσουν πρόσβαση σε δομημένα δεδομένα καταναλωτών: πως ψάχνουν ένα προϊόν, πως αλληλεπιδρούν με μια υπηρεσία, ποια μονοπάτια ακολουθούν μέχρι να πατήσουν “αγορά”. Δεδομένα που είναι χρυσός για να εκπαιδεύσεις συστήματα εξατομίκευσης, fintech εφαρμογές ή υπηρεσίες υγείας.
Όπως το έθεσε ένας ερευνητής: «Αυτές οι συνεργασίες θα τους δώσουν διαφορετικά σύνολα δεδομένων, πιο πλούσια, πιο πολύτιμα, που θα κάνουν τα μοντέλα πιο ακριβή και πιο δημιουργικά». Στην ουσία, οι εταιρείες AI προσπαθούν να μιμηθούν τον τρόπο με τον οποίο ο εγκέφαλος μαθαίνει όχι από θεωρία, αλλά από εμπειρία.
Η Κίνα έχει ήδη δείξει πώς η πρόσβαση σε ειδικά δεδομένα μπορεί να γίνει ανταγωνιστικό πλεονέκτημα. Οι εταιρείες της στον τομέα της ανακάλυψης φαρμάκων χρησιμοποίησαν το εθνικό σύστημα υγείας που καλύπτει πάνω από 600 εκατομμύρια ανθρώπους σαν μια απίστευτη δεξαμενή εκπαίδευσης. Το αποτέλεσμα; Συμφωνίες δισεκατομμυρίων με κολοσσούς όπως η AstraZeneca και η Pfizer. Αυτό είναι που οι Αμερικανοί και οι Ευρωπαίοι αρχίζουν να συνειδητοποιούν: χωρίς πραγματικά, τοπικά, “βρώμικα” δεδομένα οι μηχανές τους θα μείνουν έξυπνες μόνο στα χαρτιά.
Στην Ινδία η στρατηγική φαίνεται να αποδίδει. Τον Ιούλιο όταν η Perplexity ανακοίνωσε συνεργασία με την Bharti Airtel οι λήψεις της εφαρμογής της εκτοξεύτηκαν από 790.000 σε πάνω από 6,6 εκατομμύρια. Ο κόσμος έσπευσε να δοκιμάσει το “δωρεάν εργαλείο”. Ένας νεαρός data scientist είπε ξεκάθαρα: «Δεν με νοιάζει που μαζεύουν τα δεδομένα μου. Δεν είναι ευαίσθητα. Τη χρησιμοποιώ για emails, debugging, έρευνα αγοράς». Δεν γνώριζε καν ότι μπορεί να απενεργοποιήσει τη συλλογή δεδομένων. Εδώ είναι το μυστικό: το “δωρεάν” στην τεχνητή νοημοσύνη σχεδόν πάντα σημαίνει ότι πληρώνεις με τα δεδομένα σου.
Την ίδια ώρα που οι χρήστες χαίρονται με τα εργαλεία, οι ειδικοί ανησυχούν. Γιατί; Γιατί υπάρχει το ζήτημα της κυριαρχίας των δεδομένων. Χώρες όπως η Νιγηρία, η Ινδία, η Νότια Αφρική, το Βιετνάμ έχουν αρχίσει να απαιτούν από τις εταιρείες να αποθηκεύουν τα δεδομένα των πολιτών τους τοπικά. Δε θέλουν να γίνουν απλά “τροφοδότες” για τα παγκόσμια συστήματα χωρίς αντάλλαγμα. Θέλουν ισοτιμία, προστασία, έλεγχο. «Χρειάζονται ισχυρά πλαίσια εποπτείας για να αποφύγουμε τις προκαταλήψεις και τις καταχρήσεις» τονίζει χαρακτηριστικά ένας ειδικός.
Η μάχη είναι τέτοια που φτάνει στα όρια του παραλόγου. Στις 12 Αυγούστου η Perplexity προκάλεσε σοκ όταν ανακοίνωσε ότι προσφέρει 34,5 δισεκατομμύρια δολάρια για να αγοράσει τον browser Chrome της Google. Το ποσό σχεδόν διπλάσιο από τη δική της αποτίμηση. Ίσως να ήταν μπλόφα, ίσως στρατηγικό επικοινωνιακό πυροτέχνημα, αλλά το μήνυμα ήταν σαφές: το πραγματικό “γήπεδο” όπου θα κριθεί η μάχη της τεχνητής νοημοσύνης δεν είναι μόνο οι αλγόριθμοι. Είναι η πρόσβαση στα δεδομένα.
Γιατί τα δεδομένα δεν είναι ουδέτερα. Είναι οι ζωές μας. Είναι τα clicks, οι συνήθειες, οι αγορές, οι αναζητήσεις μας. Όσο πιο πολύ μπαίνουν οι εταιρείες σε αυτό το πεδίο, τόσο περισσότερο θα χρειάζεται να μιλήσουμε για διαφάνεια, για όρια, για δικαιώματα, γιατί αλλιώς η υπόσχεση της τεχνητής νοημοσύνης κινδυνεύει να γίνει μια νέα μορφή αποικιοκρατίας: οι πλούσιοι του Βορρά να αντλούν την πρώτη ύλη, δηλαδή τα δεδομένα από τον Νότο χωρίς ποτέ να επιστρέφουν την αξία που αποσπούν.
Εδώ είναι που φαίνεται η αλήθεια: το μέλλον της AI δεν θα κριθεί μόνο στα ερευνητικά εργαστήρια ή στους διαγωνισμούς για το ποιο μοντέλο έχει περισσότερες παραμέτρους. Θα κριθεί στο ποιος θα έχει το δικαίωμα να μαζεύει, να αποθηκεύει, να επεξεργάζεται και να πουλάει τα δεδομένα του πραγματικού κόσμου και αυτό το μέλλον είναι ανοιχτό, αμφίβολο και γεμάτο εντάσεις.
Το μεγάλο στοίχημα δεν είναι ποια εταιρεία θα φτιάξει τον πιο “έξυπνο” αλγόριθμο, αλλά ποια κοινωνία θα βάλει τα όρια για το τι σημαίνει να ζεις σε έναν κόσμο όπου κάθε σου κίνηση μπορεί να γίνει υλικό εκπαίδευσης, γιατί τα δεδομένα δεν είναι απλώς καύσιμο για τις μηχανές. Είναι το αποτύπωμα της ανθρώπινης εμπειρίας και αυτό αν δεν το προστατέψεις, δεν θα μείνει τίποτα για σένα, όλα θα πάνε αναίμακτα σε εκείνους που ξέρουν να τα εκμεταλλεύονται.
*Mε στοιχεία από Rest of World.
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram.