Τώρα, στον τελευταίο μήνα του 2023, μπορούμε να πούμε με βεβαιότητα ότι αυτή η χρονιά άνηκε 100% στην τεχνητή νοημοσύνη -κάτι που δεν πρόκειται να αλλάξει στο άμεσο μέλλον. Αυτό οφείλεται κυρίως στο γεγονός ότι αυτοί η βιομηχανία της τεχνολογίας βρίσκεται σε κατάσταση “πολέμου”, αφού κάθε εταιρεία, είτε μεγάλη είτε μικρή, προσπαθεί να δημιουργήσει ένα καινούργιο εργαλείο που θα επισκιάσει οτιδήποτε άλλο κυκλοφορεί στην αγορά.
Σε αυτό το πλαίσιο, η Meta ανακοίνωσε αρκετές νέες εξελίξεις που αφορούν τις δικές της προσπάθειες για την ΤΝ, συμπεριλαμβανομένης μιας νέας δυνατότητας δημιουργικής ΤΝ (generative AI video) που ονομάζεται Emu Video, καθώς και ένα εργαλείο επεξεργασία εικόνας που ονομάζεται Emu Edits.
Ας ρίξουμε μια ματιά σε αυτές τις νέες AI τεχνολογίες και ας διερευνήσουμε πώς θα μπορούσαν να επιφέρουν περαιτέρω αλλαγές σε αυτόν τον χώρο.
Emu video
Tο νέο μοντέλο Emu της Meta, αυτό το εργαλείο δημιουργίας βίντεο από προτροπή κειμένου, βασίζεται σε μοντέλα διάχυσης (diffusion models) και θα έχει παρόμοια λειτουργία με άλλα προγράμματα τεχνητής νοημοσύνης, όπως τα Runway, Midjourney ή Pika Labs. Η Meta αναφέρει ότι το Emu Video κάνει χρήση μιας «ενοποιημένης αρχιτεκτονικής για εργασίες παραγωγής βίντεο που μπορούν να ανταποκριθούν σε μια ποικιλία εισόδων: μόνο κείμενο, μόνο εικόνα και τόσο κείμενο όσο και εικόνα».
Το Emu Video κάνει χρήση κάποιων state-of-the-art προσεγγίσεων για την απλοποίηση της χρήσης του και για τη δημιουργία βίντεο διάρκειας τεσσάρων δευτερολέπτων σε 16 καρέ ανά δευτερόλεπτο (512×512). Φυσικά, το Emu Video, απ’ όσα γνωρίζουμε μέχρι στιγμής, θα δημιουργεί κάτι καθαρά στοιχειώδες σε σύγκριση με αυτό που θα μπορούσε να δημιουργήσει ένας animator. Θα περιορίζεται επίσης σε βίντεο τύπου animation προς το παρόν. Αλλά, όπως πάντα, το θέμα δεν είναι πραγματικά τι μπορεί να κάνει αυτή η τεχνητή νοημοσύνη σήμερα, αλλά τι θα μπορεί να κάνει αύριο.
Emu Edit
Η άλλη σημαντική είδηση για την τεχνητή νοημοσύνη που ανακοίνωσε η Meta είναι η λειτουργία Emu Edit, η οποία πρόκειται να παρέχει ακριβή επεξεργασία εικόνων μέσω εργασιών αναγνώρισης και δημιουργίας. Σχεδιασμένο για να είναι πιθανότατα και άμεσα διαθέσιμο στο Instagram και το Facebook, αυτό το εργαλείο επεξεργασίας εικόνων AI θα λύσει πολλά από τα προβλήματα που έχουν διαπιστώσει οι χρήστες με την παραγωγική AI, όπου τα αποτελέσματα δεν μοιάζουν πάντα με αυτό που τέθηκε στις προτροπές.
Το Emu Edits κάνει χρήση μιας νέας προσέγγισης στις προτροπές, εξορθολογίζοντας διάφορες εργασίες επεξεργασίας εικόνας μαζί, ώστε να προσφέρει βελτιωμένες δυνατότητες και ακρίβεια στην επεξεργασία εικόνας. Το Emu Edits είναι ικανό για επεξεργασία ελεύθερης μορφής μέσω προτροπών και μπορεί να εκτελέσει ορισμένες χρήσιμες εργασίες όπως η αφαίρεση και η προσθήκη φόντου, οι αλλαγές χρώματος και γεωμετρίας και άλλες εντολές ανίχνευσης.
Και αυτός φαίνεται να είναι ο μεγαλύτερος ισχυρισμός της Meta για την τεχνητή νοημοσύνη της, συγκεκριμένα ότι το Emu Edits θα είναι σε θέση να ακολουθεί με μεγαλύτερη ακρίβεια τις οδηγίες, καλύτερα από οποιαδήποτε άλλο εργαλείο ή εφαρμογή τεχνητής νοημοσύνης δημιουργίας εικόνων.
Ο μακρύς δρόμος μπροστά μας
Σύμφωνα με τη Meta, αυτά τα νέα εργαλεία τεχνητής νοημοσύνης είναι μόνο η αρχή, και η εταιρεία τεχνολογίας σχεδιάζει να συνεχίσει να τα βελτιώνει, καθώς και να εισάγει ενδεχομένως νέα εργαλεία και χαρακτηριστικά τεχνητής νοημοσύνης στο μέλλον. Οι χρήσεις αυτή τη στιγμή φαίνονται αρκετά απλές, πιθανότατα περιοριζόμενες μόνο στη δημιουργία κινούμενων sticker και έξυπνων GIF για να τα στέλνετε σε φίλους.
Αλλά καθώς αυτές οι τεχνολογίες AI συνεχίζουν να αναπτύσσονται, πιθανότατα θα γίνουν καλύτερες, εξυπνότερες και πιο ανταγωνιστικές σε σύγκριση με τις ανθρώπινες δυνατότητες. Βέβαια, αυτές οι υποθέσεις δεν σχετίζονται τόσο με το άμεσο μέλλον και το παρόν, αλλά με την ταχύτητα που συμβαίνουν ήδη οι καινοτομίες και με τους μεγαλύτερους παίκτες του τεχνολογικού παιχνιδιού να διπλασιάζουν τις επενδύσεις τους στην τεχνητή νοημοσύνη, φαίνεται ότι αυτή η στιγμή πλησιάζει μέρα με τη μέρα.
Πηγή: No Film School