Οι τεχνολογικές εξελίξεις συνήθως προκαλούν ενθουσιασμό και όλοι ανυπομονούν να πάρουν μία δόση από το «μέλλον», αλλά, ίσως, αυτό που έχει συμβεί με την τεχνητή νοημοσύνη το τελευταίο διάστημα, και πιο συγκεκριμένα με AI εργαλεία που παράγουν εικόνες μέσω προτροπών όπως το Midjourney, είναι μοναδικό.
Αυτά όχι μόνο πυροδότησαν την δημιουργικότητα, αλλά μοιάζουν να έχουν φτιαχτεί αποκλειστικά για τον εκάστοτε χρήστη. Είναι σαν κάποιος να τρύπωσε στο μυαλό μας -εν προκειμένω, το Midjourney, το DALL-E, το Stable Diffusion κ.α.- και να έφερε στην οθόνη του υπολογιστή κάθε χαραγμένη διαδρομή των σκέψεων μας και απάτητα μονοπάτια της ατομικής συνείδησης.
Τώρα, με τις τελευταίες επίσημες ανακοινώσεις για επερχόμενη κυκλοφορία του Midjourney v6, ίσως νωρίτερα από τον Ιούλιο του 2023 σύμφωνα με το Manifold Markets, ολόκληρη η κοινότητα που ασχολείται με την τεχνητή νοημοσύνη αλλά και αυτοί που παρακολουθούν με κάποια απόσταση (και ενδιαφέρον ταυτόχρονα) τις εξελίξεις, ανυπομονούν για τις νέες -και ελπίζουμε συναρπαστικές- δυνατότητες του πιο διάσημου AI εργαλείου δημιουργίας εικόνων.
Παρόλο που το Midjourney v5 κυκλοφόρησε πρόσφατα, οι developers του Σαν Φρανσίσκο -εκεί έχει την έδρα της η Midjourney Inc.- εργάζονται πυρετωδώς για τη νέα έκδοση. Ο στόχος τους είναι τα νέα χαρακτηριστικά του Midjourney να αναβαθμίσουν την εμπειρία των χρηστών της πλατφόρμας και μέσα από αυτό να δοθεί εκ νέου ώθηση στην δυναμική της τεχνητής νοημοσύνης.
Οι επιβεβαιωμένες βελτιώσεις του Midjourney v6
Υψηλότερη ανάλυση εικόνας
Με τη νέα έκδοση θα υπάρχει ακόμα καλύτερη ποιότητα και μεγαλύτερη λεπτομέρεια στην εικόνα . Το Midjourney v5 παράγει αυτή την στιγμή μια βασική ανάλυση 1024×1024 και δεν διαθέτει μεμονωμένο upscaler [σ.σ. διαδικασία μεγέθυνσής της εικόνας χωρίς καμία απώλεια στην ποιότητά της]. Το Tokenized υποθέτει ότι στη επικείμενη έκδοση του Midjourney η ανάλυση θα είναι μέχρι 2048×2048 και θα υπάρχει upscaler.
Οι αληθοφανείς «υφές» της εικόνας που θα έχουμε σύντομα στα χέρια μας είναι ακόμα ένα μεγάλο άλμα της τεχνητής νοημοσύνης σε αυτό το επίπεδο και δεν θα ενισχύσει μόνο τις παραγόμενες εικόνες αλλά θα επιτρέψει στους χρήστες να επεκτείνουν τα όρια του πειραματισμού.
Βελτιωμένo natural language processing (NLP)
Ο τρόπος με τον οποίο το Midjourney αναγνωρίζει και «διαβάζει» την φυσική γλώσσα των προτροπών πρόκειται να αναβαθμιστεί, επιτρέποντας έτσι στην πλατφόρμα να κατανοεί καλύτερα τα κείμενα των χρηστών, άρα, να παράγει πιο ακριβείς και λεπτομερείς εικόνες. Η ομάδα των developers του Midjourney θέλει να μπορεί η πλατφόρμα να κατανοήσει όσο πιο απλά γίνεται την προτροπή ενός χρήστη, η περιγραφή του οποίου δεν θα σκοντάφτει σε αδέξιες προτάσεις αλλά θα θυμίζει τον τρόπο με τον οποίο περιγράφουμε σε κάποιο φυσικό πρόσωπο κάτι που είδαμε ή φανταζόμαστε.
Ο τρόπος με τον οποίο συνομιλούμε και αλληλοεπιδρούμε με το AI θα περάσει σε ένα επόμενο επίπεδο και αυτό αναμφισβήτητα θα μας φέρει πιο κοντά σε ακριβείς εικόνες, καθώς θα ζωντανέψουν ιδέες που δεν φανταζόμασταν ποτέ ότι ήταν εφικτό.
Οι φήμες για τη νέα έκδοση
Βελτιωμένα χέρια
Μία από τις γνωστές προκλήσεις των γεννήτριων AI εικόνας είναι η δυσκολία στην ακριβή παραγωγή χεριών. Ενώ η v5 του Midjourney έχει επιδείξει σημαντική βελτίωση σε σχέση με τις προηγούμενες εκδόσεις του, εξακολουθεί να αντιμετωπίζει δυσκολίες στην αληθοφανή αποτύπωση των χεριών -συνήθως αυτά είναι και ο τρόπος να ξεχωρίσει κάποιος μία εικόνα ΤΝ με μία πραγματική.
Οι φήμες που έχουν κυκλοφορήσει αναφέρουν ότι το Midjourney v6 θα καταφέρει να αντιμετωπίσει αυτό το ζήτημα, με πιο ρεαλιστικά χέρια. Αν αυτό αληθεύει, η v6 θα διευρύνει το εύρος των δυνατότητων στην δημιουργία εικόνας.
Το 3D
Η τρισδιάστατη μοντελοποίηση της νέας έκδοσης είναι μία κατεύθυνση που πρέπει να παρθεί κάποια στιγμή, αλλά είναι κάπως δύσκολο να συμβεί σε αυτό το χρονικό σημείο. Αν εφαρμοστεί το 3D, ένας νέος δημιουργικός κόσμος θα εμφανιστεί μπροστά μας και, ταυτόχρονα, θα μπορούσε να φέρει επιπτώσεις σε διάφορους επαγγελματικούς κλάδους, όπως στην αρχιτεκτονική, τον σχεδιασμό προϊόντων, την ανάπτυξη videogame και την εικονική πραγματικότητα.
Ωστόσο, αυτοί οι φόβοι μέχρι στιγμής λειτουργούν περισσότερο ως «καμπανάκι κινδύνου» παρά ως πραγματικότητα. Άλλωστε, όπως είχαμε γράψει και σε ένα σχετικό κείμενο:
«Δεν θα αντικατασταθούμε από την τεχνητή νοημοσύνη, αλλά θα αντικατασταθούμε από ανθρώπους που χρησιμοποιούν την τεχνητή νοημοσύνη».
Η επόμενη μέρα για το Midjourney
Η δημοφιλής γεννήτρια AI εικόνας μέσω προτροπής κειμένου συνεχίζει να εξελίσσεται σε ένα συναρπαστικό και σημαντικό επαγγελματικό εργαλείο, αλλά λειτουργεί και ως ψηφιακός καμβάς παραγωγής έργων τέχνης στον οποίο αποτυπώνονται βαθύτερες ανθρώπινες σκέψεις απ’ αυτές που μπορούμε μόνοι μας να φέρουν στην επιφάνεια.
Εικάζω πως το μέλλον θα είναι λαμπρό για το Midjourney και τις αντίστοιχες πλατφόρμες. Είτε πρόκειται για εικόνες υψηλότερης ανάλυσης είτε για πιο «έξυπνη» φυσική γλώσσα ή οποιοδήποτε από τα χαρακτηριστικά που αναφέρθηκαν παραπάνω, δεν υπάρχει αμφιβολία πως το Midjourney v6 θα ανοίξει ακόμα περισσότερο το φάσμα του εφικτού και η δημιουργικότητα θα είναι ένα περιπετειώδες ταξίδι.