Η τεχνητή νοημοσύνη υπόσχεται να αλλάξει τον κόσμο, αλλά η διαδρομή δεν είναι εύκολη. Όλο και περισσότερες ιστοσελίδες, από τράπεζες και πανεπιστήμια μέχρι δικηγορικά γραφεία και εκδοτικούς οργανισμούς επιλέγουν να υψώσουν “ψηφιακούς φράχτες” για να προστατεύσουν το περιεχόμενό τους από τα αδηφάγα bots που εκπαιδεύουν τα μεγάλα γλωσσικά μοντέλα. Η εικόνα που προκύπτει είναι μια σύγκρουση ανάμεσα στην απεριόριστη δίψα των εταιρειών AI για δεδομένα και στο δικαίωμα των δημιουργών να διαφυλάξουν την πνευματική τους ιδιοκτησία.
Η ImmuniWeb, παγκόσμια εταιρεία ασφάλειας εφαρμογών ανέλυσε 1.807 μεγάλες ιστοσελίδες και κατέληξε σε ένα ηχηρό συμπέρασμα: τα AI bots δεν είναι πλέον καλοδεχούμενα. Οι ιδιοκτήτες εφαρμόζουν τεχνικές άμυνας είτε μέσω αρχείων robots.txt είτε με πιο προηγμένους μηχανισμούς από την πλευρά των διακομιστών, ώστε να εμποδίζουν την ανεξέλεγκτη πρόσβαση. Το αποτέλεσμα είναι πως οι πράκτορες που βασίζονται σε αυτά τα δεδομένα δυσκολεύονται όλο και περισσότερο να παρέχουν ακριβείς πληροφορίες στους χρήστες τους.
Τα στοιχεία είναι ενδεικτικά. Στη λίστα της Encyclopedia Britannica με εφημερίδες και περιοδικά του κόσμου, το 83% των ιστοσελίδων μπλοκάρει πλέον την πρόσβαση των bots. Στον ακαδημαϊκό χώρο πάνω από το 70% των κορυφαίων επιστημονικών περιοδικών και βάσεων δεδομένων έχουν υψώσει φράχτες. Το ίδιο συμβαίνει και με κορυφαία δικηγορικά γραφεία: το 64% των μεγαλύτερων στις ΗΠΑ και την Αγγλία αποκλείει επιθετικά τα bots, ενώ το αντίστοιχο ποσοστό για τις μεγαλύτερες τράπεζες του Forbes ανέρχεται στο 43%. Ακόμη και στον χώρο της εκπαίδευσης, 93 από τα 255 πανεπιστήμια που εξετάστηκαν (περίπου το 36% ) έχουν επιλέξει την ίδια τακτική.
Δεν είναι μόνο τα αρχεία robots.txt. Εταιρείες χρησιμοποιούν Web Application Firewalls (WAFs), μηχανισμούς ελέγχου κυκλοφορίας, ακόμη και τη βοήθεια κολοσσών όπως η Cloudflare προστατεύοντας ήδη το 20% των ιστοσελίδων παγκοσμίως έχει αρχίσει να αποκλείει τα AI crawlers εξ ορισμού. Το μήνυμα είναι σαφές: αν η νομοθεσία, όπως ο νέος Κανονισμός AI της Ε.Ε. δεν επαρκεί για να προστατεύσει τους δημιουργούς, τότε οι ίδιοι θα λάβουν τα μέτρα τους, erecting, όπως το έθεσε ο CEO της ImmuniWeb, Dr. Ilia Kolochenko «τεχνικούς φράχτες και οχυρώματα» που καθιστούν την εξόρυξη δεδομένων απαγορευτικά δαπανηρή ή τεχνικά αδύνατη.
Μέσα σε αυτή τη νέα πραγματικότητα οι εταιρείες τεχνητής νοημοσύνης βρίσκονται αντιμέτωπες με την ηθική διάσταση των επιλογών τους. Η εκμετάλλευση τεράστιου όγκου περιεχομένου χωρίς άδεια αποκαλύφθηκε ως μια συστηματική πρακτική που δεν μπορεί πλέον να μείνει στο σκοτάδι. «Οι πρόσφατες αποκαλύψεις για την εκτεταμένη και σκόπιμη χρήση πειρατικού περιεχομένου για την εκπαίδευση LLMs είναι μόνο η κορυφή του παγόβουνου», προειδοποιεί ο Kolochenko.
Απέναντι σε αυτή την κατάσταση πολλές ιστοσελίδες δεν περιορίζονται μόνο σε τεχνικά μέτρα, αλλά ανανεώνουν και τους Όρους Χρήσης τους απαγορεύοντας ρητά το data scraping και τη χρήση του περιεχομένου για εκπαίδευση AI. Η στρατηγική αυτή βασίζεται περισσότερο στο νομικό πλαίσιο της παραβίασης σύμβασης, παρά στη συχνά αμφιλεγόμενη προστασία που παρέχει η νομοθεσία περί πνευματικών δικαιωμάτων.
Την ώρα που η Δύση κλείνει τα παράθυρα το data scraping μετακινείται σε πιο απομακρυσμένες δικαιοδοσίες. Από τον Ιανουάριο του 2025 η ImmuniWeb κατέγραψε έντονη αύξηση της αυτοματοποιημένης διαδικτυακής κίνησης από το Ιράν και την Κίνα. Εκεί εταιρείες με υπεράκτιες οντότητες και θολές εταιρικές δομές αναλαμβάνουν να συνεχίσουν τη δουλειά, ώστε να αποφευχθούν διώξεις στις ΗΠΑ ή την Ευρώπη. Πρόκειται για ένα “παιχνίδι γάτας με το ποντίκι”, όπου οι δημιουργοί στήνουν εμπόδια και οι εταιρείες τεχνητής νοημοσύνης αναζητούν νέες τρύπες να εκμεταλλευτούν.
Το ερώτημα που πλανάται είναι αν αυτό το επιχειρηματικό μοντέλο έχει μέλλον. Η ImmuniWeb θεωρεί πως όχι. Η λογική της μαζικής ιδιοποίησης περιεχομένου χωρίς άδεια δεν είναι βιώσιμη. Αργά ή γρήγορα θα οδηγήσει ορισμένους πάροχους εκτός αγοράς. Από την άλλη η εναλλακτική, δηλαδή η πληρωμή ενός δίκαιου τιμήματος για το περιεχόμενο ίσως καταστήσει τις λύσεις AI απαγορευτικά ακριβές για πολλούς χρήστες. Ένα δίλημμα που φέρνει την αγορά αντιμέτωπη με τα όριά της.
Παράλληλα οι ιστοσελίδες δείχνουν να κάνουν διακρίσεις ανάμεσα στα bots. Στην κορυφή της λίστας των πιο συχνά αποκλεισμένων βρίσκεται το Copilot της Microsoft με 34,7%, ακολουθεί το Claude της Anthropic με 27%, το GPTBot της OpenAI με 20,8%, το AmazonBot με 17,7% και το Meta AI με 12,4%. Η διαφοροποίηση δείχνει ότι οι εταιρείες δεν βλέπουν όλα τα AI μοντέλα με τον ίδιο τρόπο, επιλέγοντας σε ποιον θα κλείσουν την πόρτα και σε ποιον θα αφήσουν χαραμάδα.
Μέσα σε όλα αυτά η κοινωνία βρίσκεται μπροστά σε μια κρίσιμη καμπή. Από τη μία, η τεχνητή νοημοσύνη υπόσχεται πρόοδο, καινοτομία και νέες δυνατότητες. Από την άλλη, η ανεξέλεγκτη της ανάπτυξη απειλεί τα δικαιώματα των δημιουργών, τη διαφάνεια και την ίδια την ποιότητα της γνώσης. Το μπλόκο που υψώνεται σήμερα δεν είναι απλώς τεχνικό ή νομικό, θα λέγαμε πως είναι βαθιά πολιτισμικό.
Το μεγάλο ερώτημα είναι αν μπορούμε να βρούμε μία ισορροπία. Μια συμφωνία που θα επιτρέπει στην AI να εξελίσσεται χωρίς να κατασπαράζει τον πνευματικό κόπο εκατομμυρίων ανθρώπων. Μέχρι τότε οι φράχτες θα γίνονται ψηλότεροι και τα μονοπάτια πιο στενά, θυμίζοντας ότι κάθε τεχνολογική επανάσταση κρύβει μέσα της και μια μάχη για το ποιος τελικά θα κρατήσει το κλειδί.
➪ Ακολουθήστε το OLAFAQ στο Facebook, Bluesky και Instagram.