Τα έργα τέχνης που δημιουργήθηκαν μέσω της ΑΙ (τεχνητής νοημοσύνης) και τα deepfakes έχουν κατακλύσει τον κόσμο. Από ευφάνταστες πλωτές κατασκευές και σουρεαλιστικά έπιπλα μέχρι την αναδημιουργία προγονικών πορτρέτων, οι αλγόριθμοι τύπου κείμενο σε είκονα (text-to-image) – π.χ. Midjourney, DALL·E 2 και Stable Diffusion – έχουν γίνει ένα νέο αγαπημένο εργαλείο για τους καλλιτέχνες. Ο συνδυασμός της ακριβής εισαγωγής προτροπών και του δημιουργικού οράματος του εκάστοτε καλλιτέχνη, οδήγησε σε εντυπωσιακά γραφικά και έργα τέχνης, τα οποία έχουν πλημμυρίσει το ίντερνετ.

Η μηχανή αναζήτησης stock εικόνων, Everypixel δημοσίευσε μια λεπτομερή αναφορά που ποσοτικοποιεί αυτό το σύγχρονο φαινόμενο: Με μια πρόχειρη εκτίμηση, σε μόλις 12 μήνες, οι αλγόριθμοι text-to-image παρήγαγαν πάνω από 150 δισεκατομμύρια εικόνες!

«Από την κυκλοφορία του DALL·E 2, κατά μέσο όρο 34 εκατομμύρια εικόνες δημιουργούνται καθημερινά», γράφει το Everypixel. Σύμφωνα με την έκθεση, ως ανθρωπότητα χρειαστήκαμε περίπου 150 χρόνια για να συγκεντρώσουμε το 10% (15 δισεκατομμύρια) αυτού του ποσού, αποδεικνύοντας την απίστευτη —και εξίσου ανησυχητική— δύναμη της μηχανικής μάθησης και του ΑΙ.

AI artwork: @outkastdesign / freepik

Το Everypixel υπολογίζει την επίπτωση των λογισμικών text-to-image 

Η αναφορά της Everypixel συνδυάζει στατιστικά στοιχεία και γεγονότα που σχετίζονται με τέσσερα διαφορετικά λογισμικά κειμένου σε εικόνα (text-to-image): το Midjourney, το DALL·E 2, το Stable Diffusion και το Adobe Firefly. Αρχικά, το OpenAI παρουσίασε το DALL·E 2 τον Απρίλιο του 2022 πρώτα ως invitation-only πλατφόρμα (πλατφόρμα με είσοδο μόνο με πρόσκληση). Η πρόσβαση στην πλατφόρμα πήρε παράταση για  αρκετούς μήνες, μέχρι που τον Σεπτέμβριο του 2022, έγινε ανοιχτή σε όλους τους χρήστες χωρίς περιορισμούς.

Μέχρι τότε, δύο εκατομμύρια εικόνες παράγονταν καθημερινά κατά μέσο όρο. Ενώ το ακριβές χρονικό πλαίσιο και η μέθοδος για τον υπολογισμό αυτού του αριθμού παραμένουν ασαφή, «υποθέτουμε ότι αυτός είναι ένας μέσος όρος, πράγμα που σημαίνει ότι έχουν δημιουργηθεί περίπου 916 εκατομμύρια εικόνες σε μια ενιαία πλατφόρμα σε 15 μήνες», μοιράζεται το Everypixel.

Ακολουθεί το Midjourney. Ξεκίνησε τον Ιούλιο του 2022, η χρήση του Midjourney στην αποκλειστική του πλατφόρμα, Discord, περιλαμβάνει περίπου 20 έως 40 εργασίες δημιουργίας εικόνας ανά δευτερόλεπτο. Διαθέτει 15 εκατομμύρια εγγεγραμμένους χρήστες και 1,5 έως 2,5 εκατομμύρια ενεργά μέλη ανά πάσα στιγμή. Χρησιμοποιώντας κατά μέσο όρο 30 εργασίες εικόνας ανά δευτερόλεπτο, ο ημερήσιος αριθμός θα μπορούσε να φτάσει τα 2,5 εκατομμύρια. Από την κυκλοφορία του, έχουν δημιουργηθεί περίπου 964 εκατομμύρια εικόνες με το Midjourney.

AI artwork: @user27955914 / freepik

Εν τω μεταξύ, τον Αύγουστο του 2022, η Stability AI αποκάλυψε το μοντέλο κειμένου σε εικόνα που είναι γνωστό ως Stable Diffusion. Οι επίσημοι ιστότοποι δοκιμών για αυτό το πρόγραμμα περιλαμβάνουν το χώρο Dreamstudio και Stability AI στο Hugging Face, με πάνω από 10 εκατομμύρια χρήστες σε όλα τα κανάλια. «Αν υπολογίσουμε τους αριθμούς και τις τάσεις του Midjourney που έχουμε στη διάθεσή μας, αποδεικνύεται ότι μέσω των επίσημων καναλιών Stable Diffusion, οι χρήστες δημιουργούν 2 εκατομμύρια εικόνες σε καθημερινή βάση και στον πρώτο χρόνο κυκλοφορίας, ο αριθμός αυτός έχει φτάσει τις 690 εκατομμύρια εικόνες», αναφέρει η έκθεση.

Η πρόκληση, ωστόσο, έγκειται στην open-source φύση του κώδικα που χρησιμοποιεί το Stable Diffusion (κώδικας ανοικτής πηγής). Αυτό σημαίνει ότι η δημιουργία περιεχομένου εκτείνεται πέρα ​​από τις επίσημες πλατφόρμες. Πολυάριθμες πλατφόρμες, εφαρμογές και υπηρεσίες που έχουν δημιουργηθεί πάνω στην τεχνολογία του Stable Diffusion περιπλέκουν περαιτέρω την ακριβή εκτίμηση καθώς απευθύνονται σε ένα μεγάλο και μη μετρήσιμο κοινό, παράγοντας περιεχόμενο που είναι δύσκολο να μετρηθεί λόγω της συνεχούς και γρήγορης ανάπτυξης.

AI artist: Jon Laitinen

Το Everypixel εξέτασε αποθετήρια (repositories) όπως το GitHub, το HuggingFace και το Civitai για να κατανοήσει καλύτερα αυτήν την πρόκληση. Αυτές οι πλατφόρμες φιλοξενούν χιλιάδες μοντέλα που βασίζονται στο Stable Diffusion.

Μια αρχική εκτίμηση προέκυψε κατά την εφαρμογή των προτύπων του Midjourney σε μοντέλα Stable Diffusion στις πλατφόρμες αυτές. Αργότερα, τα δεδομένα από την ομάδα της Civitai βελτίωσαν τις εκτιμήσεις, αποκαλύπτοντας πάνω από 11 δισεκατομμύρια εικόνες που δημιουργήθηκαν σε αυτά τα αποθετήρια. Αν στα παραπάνω συνυπολογίσουμε και άλλα δημοφιλή μοντέλα (όπως το Runway) και τα επίσημα κανάλια του Stability AI, ο αριθμός εικόνων που έχουν δημιουργηθεί μέσω Stable Diffusion αυξάνεται στα 12,590 δισεκατομμύρια, αποτελώντας το 80% όλων των εικόνων που έχουν δημιουργηθεί από τεχνητή νοημοσύνη, χρησιμοποιώντας τεχνικές μετατροπής κειμένου σε εικόνα.

AI, εικόνα
AI artwork: @user24124133 / freepik

Πέραν του Midjourney, του DALL-E και του Stable Diffusion, υπάρχει και το Adobe Firefly, μια λειτουργία κειμένου σε εικόνα του Photoshop, που παρήγαγε πάνω από 100 εκατομμύρια εικόνες έξι εβδομάδες μετά την κυκλοφορία του (Μάρτιος 2023) και 1 δισεκατομμύριο εικόνες μετά από μόλις τρεις μήνες. Η συγχώνευσή του με το Adobe Photoshop τον Μάιο του 2023 προώθησε περαιτέρω τη δημιουργία εικόνων, χάρη στη δημοτικότητα του Photoshop, ένα αγαπημένο λογισμικό για δεκάδες χιλιάδες δημιουργούς ανά τον κόσμο.

«Συνολικά, περισσότερες από 15 δισεκατομμύρια AI εικόνες, έχουν δημιουργηθεί χρησιμοποιώντας το Stable Diffusion, το Adobe Firefly, το Midjourney και το DALLE-2». Αν αυτός ο αριθμός δε σας φαίνεται από μόνος του εντυπωσιακός, σκεφτείτε ότι μιλάμε για έναν όγκο μεγαλύτερο από ολόκληρη τη βιβλιοθήκη φωτογραφιών, εικονογραφήσεων, γραφικών και vectors του Shutterstock και το 1/3 του αριθμού των εικόνων που έχουν ανέβει ποτέ στο Instagram, όπως αναφέρει η έρευνα του Everypixel.

AI artwork: @juszczaklukasz / freepik

Η σκοτεινή πλευρά της τεχνητής νοημοσύνης και των deepfakes 

Ας απομακρυνθούμε όμως από την πιο “ηλιόλουστη” πλευρά των εικόνων που δημιουργούνται από την τεχνητή νοημοσύνη κι ας μιλήσουμε για κάτι πιο σκοτεινό. Πιθανότατα έχετε δει τις viral φωτογραφίες του Πάπα με τα oversized μπουφάν ή τη σύλληψη του Donald Trump. Μπορεί να έχετε δει ακόμη και εικόνες της Γαλάζιας Πανώλης στη Ρωσία τη δεκαετία του ’70 και να αναρωτηθήκατε αν μπλοκάρατε κάτι σημαντικό από τη μνήμη σας ή αν δεν προσέχατε και πολύ στο μάθημα Ιστορίας στο σχολείο. Αν δεν το έχετε καταλάβει ακόμα: Οι εικόνες αυτές είναι ψεύτικες – για την ακρίβεια, δημιουργήθηκαν από ΑΙ.

εικόνα AI

Και θα μου πείτε ότι αυτή δεν είναι η πρώτη φορά στην ιστορία που μια “ψεύτικη” εικόνα καταφέρνει να ξεγελάσει εκατομμύρια κόσμο. Μέχρι και σήμερα βλέπουμε τόσες και τόσες “φωτοσοπαρισμένες” φωτογραφίες στα περιοδικά και τα social media, αδυνατώντας να καταλάβουμε τι είναι αληθινό και τι όχι.

Πριν κάποια χρόνια, έγινε viral μια φωτογραφία που έδειχνε την Marilyn Monroe και τον John F. Kennedy να αγκαλιάζονται μετά το περίφημο πάρτι γενεθλίων του Προέδρου, στο οποίο η σταρ του τραγούδησε «Happy birthday, mister president». Μόνο που το τρυφερό εκείνο ενσταντανέ δεν ήταν αληθινό: ήταν μια φωτογραφία που τράβηξε η Alison Jackson, στην οποία ποζάρουν δύο μοντέλα, υποδυόμενοι το γνωστό παράνομο ζευγάρι.

Κι αν το φαινόμενο των “ψεύτικων” εικόνων δεν είναι καινούργιο, τότε γιατί μας αφορά τόσο η σκοτεινή πλευρά της τεχνητής νοημοσύνης και των deepfakes; Διότι, ποτέ ξανά τέτοιες ψεύτικες εικόνες δεν έχουν εξαπλωθεί με τέτοια ταχύτητα και μαζικότητα. Ποτέ ξανά τέτοιες εικόνες δεν έκαναν τόσο πολύ κόσμο να αμφισβητήσει το αν είναι αληθινές ή όχι.

Μέσα σε λίγους μόνο μήνες, η τεχνητή νοημοσύνη έχει προχωρήσει από τις φωτορεαλιστικές εικόνες του DALL·E 2 και του Midjourney σε ακόμα περισσότερα και πιο εξελιγμένα εργαλεία, που δημιουργούν ρεαλιστικά βίντεο και ολόκληρες ταινίες.

Όλες οι ενδείξεις μαρτυρούν ότι η τεχνητή νοημοσύνη ήρθε για να μείνει – η φόρα της δε δείχνει να σταματά σύντομα. Και ενώ είναι ομολογουμένως διασκεδαστικό να πειραματίζεσαι μαζί της, είναι, αλήθεια ότι αποτελεί σημαντική απειλή – ειδικά στο πλαίσιο της παραπληροφόρησης και των fake news.