Μήπως στα μοντέλα Τεχνητής Νοημοσύνης το μεγαλύτερο δεν είναι απαραίτητα και καλύτερο;
Όταν πρόκειται για γώσσικά μοντέλα Τεχνητής Νοημοσύνης, τα μεγαλύτερα είναι συνήθως πιο αποτελεσματικά. Είναι όμως και ικανά να πλησιάσουν την ανθρώπινη σκέψη ή να μας δώσουν απαντήσεις για τον τρόπο λειτουργίας τους;
Μεγάλα γλωσσικά μοντέλα Τεχνητής Νοημοσύνης όπως το ChatGPT και το Bard, που συνομιλούν, δημιουργούν από νομικά κείμενα μέχρι μουσική, τροφοδοτούνται με ολοένα και περισσότερα δεδομένα, και μέσω της μηχανικής μάθησης διαρκώς βελτιώνονται . Καθημερινά, αρθρογράφοι και bloggers αφιερώνουν πολλές λέξεις και χρόνο για να εξηγήσουν πώς οι πιο πρόσφατες εξελίξεις – μια εφαρμογή που συνοψίζει άρθρα, podcast που δημιουργούνται από Τεχνητή Νοημοσύνη (AI), ένα βελτιωμένο μοντέλο που μπορεί να απαντήσει σε οποιαδήποτε ερώτηση σχετικά με το επαγγελματικό μπάσκετ – θα αλλάξουν τον κόσμο.
Αλλά η ολοένα μεγαλύτερη και πιο ικανή AI απαιτεί επεξεργαστική ισχύ που λίγες εταιρείες κατέχουν και υπάρχει αυξανόμενη ανησυχία ότι μια μικρή ομάδα, συμπεριλαμβανομένων των Google, Meta, OpenAI και Microsoft, θα ασκήσει σχεδόν απόλυτο έλεγχο στην τεχνολογία.
Επίσης, τα μεγαλύτερα γλωσσικά μοντέλα είναι πιο δύσκολο να κατανοηθούν. Συχνά περιγράφονται ως «μαύρα κουτιά», ακόμη και από τους ανθρώπους που τα σχεδιάζουν, και κορυφαίες προσωπικότητες του χώρου έχουν εκφράσει δυσφορία που οι στόχοι της AI μπορεί τελικά να μην ευθυγραμμίζονται με τους δικούς μας. Εάν το μεγαλύτερο και πιο πολύπλοκο είναι καλύτερο, είναι επίσης πιο αδιαφανές και πιο αποκλειστικό. Η εξέλιξη της τεχνολογίας και η πολυπλοκότητα των συστημάτων της τεχνητής νοημοσύνης έχουν χτίσει ένα δίκτυο με κρυφές πτυχές και άγνωστους κόσμους ακόμα και για τους δημιουργούς του.
Τον Ιανουάριο, μια ομάδα νέων ακαδημαϊκών που εργάζονται στην επεξεργασία φυσικής γλώσσας — ο κλάδος της AI επικεντρώθηκε στη γλωσσική κατανόηση — δημιούργησε μια πρόκληση για να προσπαθήσει να αναστρέψει αυτό το παράδειγμα. Ζήτησε από ομάδες να δημιουργήσουν λειτουργικά μοντέλα γλώσσας χρησιμοποιώντας σύνολα δεδομένων που είναι μικρότερα από το ένα δέκατο χιλιοστό του μεγέθους αυτών που χρησιμοποιούνται από τα πιο προηγμένα μοντέλα μεγάλων γλωσσών.
Ένα επιτυχημένο μίνι μοντέλο Τεχνητής Νοημοσύνης θα ήταν σχεδόν εξίσου ικανό με τα μοντέλα προηγμένης τεχνολογίας, αλλά πολύ μικρότερο, πιο προσιτό και πιο συμβατό με τον άνθρωπο.
Το έργο ονομάζεται Πρόκληση BabyLM. Στόχος ήταν να υπάρχει μία μεγαλύτερη κατανόηση του τρόπου με τον οποίο τα συστήματα αυτά καταλήγουν σε μία παραγωγή κειμένου και γνωστικών δυνατοτήτων, αλλά και η χρήση τους να είναι πιο εύκολη και προσιτή στους περισσότερους ανθρώπους.
Τα μεγάλα γλωσσικά μοντέλα είναι νευρωνικά δίκτυα σχεδιασμένα να προβλέψουν την επόμενη λέξη σε μια δεδομένη πρόταση ή φράση. Εκπαιδεύονται για αυτό το έργο χρησιμοποιώντας ένα σύνολο λέξεων που συλλέγονται από κείμενα, ιστότοπους, μυθιστορήματα και εφημερίδες. Ένα τυπικό μοντέλο κάνει εικασίες βάσει παραδειγμάτων φράσεων και στη συνέχεια προσαρμόζεται ανάλογα με το πόσο κοντά είναι στη σωστή απάντηση.
Artwork: Olafaq Staff
Επαναλαμβάνοντας αυτή τη διαδικασία ξανά και ξανά, ένα μοντέλο σχηματίζει χάρτες του τρόπου με τον οποίο οι λέξεις σχετίζονται μεταξύ τους. Γενικά, σε όσο περισσότερες λέξεις εκπαιδεύεται ένα μοντέλο, τόσο καλύτερο θα γίνεται. Κάθε φράση παρέχει στο μοντέλο ένα γενικό πλαίσιο, και όταν αυτό εμπλουτίζεται, μεταφράζεται σε μια πιο λεπτομερή ιδέα του τι σημαίνει κάθε λέξη. Το GPT-3 του OpenAI, που κυκλοφόρησε το 2020, εκπαιδεύτηκε σε 200 δισεκατομμύρια λέξεις. Το Chinchilla του DeepMind, που κυκλοφόρησε το 2022, εκπαιδεύτηκε σε ένα τρισ.
Στον Ethan Wilcox, γλωσσολόγο στο ETH Zurich, το γεγονός ότι κάτι μη ανθρώπινο μπορεί να δημιουργήσει γλώσσα αποτελεί μια συναρπαστική ευκαιρία: Θα μπορούσαμε να χρησιμοποιήσουμε άραγε τα ΑΙ γλωσσικά μοντέλα για τη μελέτη του τρόπου με τον οποίο οι άνθρωποι μαθαίνουν τη γλώσσα;
Για παράδειγμα, ο νατιβισμός, μια ισχυρή θεωρία που ανάγεται στο πρώιμο έργο του Noam Chomsky, ισχυρίζεται ότι οι άνθρωποι μαθαίνουν τη γλώσσα γρήγορα και αποτελεσματικά επειδή έχουν μια έμφυτη κατανόηση του πώς λειτουργεί η γλώσσα. Αλλά και τα γλωσσικά μοντέλα μαθαίνουν τη γλώσσα γρήγορα, και φαινομενικά χωρίς έμφυτη κατανόηση του τρόπου λειτουργίας της γλώσσας – οπότε ίσως ο νατιβισμός να μην ευσταθεί απόλυτα.
Η πρώτη ενασχόληση με AI, τη δεκαετία του 1950, οφειλόταν στην επιθυμία να μοντελοποιηθούν οι ανθρώπινες γνωστικές ικανότητες στους υπολογιστές. η βασική μονάδα επεξεργασίας πληροφοριών στο A.I. είναι ο «νευρώνας» και τα πρώιμα γλωσσικά μοντέλα στις δεκαετίες του 1980 και του 1990 εμπνεύστηκαν άμεσα από τον ανθρώπινο εγκέφαλο.
Αλλά καθώς οι επεξεργαστές έγιναν πιο ισχυροί και οι εταιρείες άρχισαν να εργάζονται προς εμπορεύσιμα προϊόντα, οι επιστήμονες υπολογιστών συνειδητοποίησαν ότι ήταν συχνά πιο εύκολο να εκπαιδεύσουν γλωσσικά μοντέλα σε τεράστιες ποσότητες δεδομένων παρά να τα εξαναγκάσουν σε ψυχολογικά ενημερωμένες δομές. Ως αποτέλεσμα, μας δίνουν κείμενο που μοιάζει τον τρόπο που επικοινωνούν οι άνθρωποι, αλλά δεν υπάρχει καμία σχέση με τον τρόπο λειτουργίας του εγκεφάλου τους.
Για τους επιστήμονες που ενδιαφέρονται να κατανοήσουν πώς λειτουργεί το ανθρώπινο μυαλό, αυτά τα μεγάλα μοντέλα προσφέρουν περιορισμένη γνώση. Και επειδή απαιτούν τεράστια επεξεργαστική ισχύ, λίγοι ερευνητές μπορούν να έχουν πρόσβαση σε αυτά και μόνο ένας μικρός αριθμός βιομηχανικών εργαστηρίων με τεράστιους πόρους μπορεί να αντέξει οικονομικά να εκπαιδεύσει μοντέλα με δισεκατομμύρια παραμέτρους σε τρισεκατομμύρια λέξεις.
Artwork: Olafaq Staff
Η πρόκληση είναι ότι τα γλωσσικά μοντέλα μαθαίνουν πολύ διαφορετικά από τους ανθρώπους. Οι άνθρωποι έχουν σώματα, κοινωνικές ζωές και πλούσιες αισθήσεις. Μπορούμε να μυρίσουμε σάπια φύλλα, να νιώσουμε ένα απαλό άγγιγμα, να πέσουμε πάνω σε εμπόδια και να γευτούμε μέντα. Από νωρίς, είμαστε εκτεθειμένοι σε απλές προφορικές λέξεις και συντακτικό που συχνά δεν αναπαρίστανται γραπτώς.
Έτσι, ένας υπολογιστής που παράγει γλώσσα αφού έχει εκπαιδευτεί σε εκατοντάδες γραπτές λέξεις μπορεί να μας πει τόσα πολλά για τη δική μας γλωσσική διαδικασία. Και ένα γλωσσικό μοντέλο που έχει εκτεθεί μόνο σε λέξεις που συναντά ο άνθρωπος σε μικρή ηλικία, αυτό που προτείνει η ιδέα του BabyLM Challenge, θα μπορούσε να απαντήσει πιο αποτελεσματικά σε ορισμένα ερωτήματα που έχουμε σχετικά με τις δικές μας ικανότητες, αλλά και με το μονοπάτι που το ίδιο ακολούθησε για να παράγει αυτό το αποτέλεσμα.
Οι δυνατότητες ενός τέτοιου ερευνητικού προγράμματος δεν έχουν αγνοηθεί από μεγαλύτερα εργαστήρια της βιομηχανίας. Ο Sam Altman, ο διευθύνων σύμβουλος του OpenAI, δήλωσε πρόσφατα ότι η αύξηση του μεγέθους των γλωσσικών μοντέλων δεν θα οδηγούσε στο είδος βελτιώσεων που παρατηρήθηκαν τα τελευταία χρόνια. Και εταιρείες όπως η Google και η Meta έχουν επίσης επενδύσει στην έρευνα σε πιο αποτελεσματικά γλωσσικά μοντέλα, που ενημερώνονται από τις ανθρώπινες γνωστικές δομές.
Πολλοί από τους πρωτοπόρους που άρχισαν να αναπτύσσουν τεχνητά νευρωνικά δίκτυα δεν ήταν σίγουροι για το πώς λειτουργούν και ποιες είναι οι δυνατότητές τους. Στην πραγματικότητα όμως, ακόμα και σήμερα υπάρχουν πολλά θέματα που δε γνωρίζουμε και δεν μπορούμε να εξηγήσουμε με βεβαιότητα. Ίσως μία τέτοια εξέλιξη να δώσει λύσεις τόσο για τον τρόπο λειτουργίας τους όσο και για την ίδια την ανθρώπινη γλωσσική και γνωστική διαδικασία.
Πριν από ακριβώς 25 χρόνια ιδρύθηκε η Google που άλλαξε το τεχνολογικό πρόσωπο του 21ου αιώνα, καταφέρνοντας μέχρι και να… ρηματοποιήσει το ίδιο της το όνομα.
Πριν από ακριβώς 25 χρόνια ιδρύθηκε η Google που άλλαξε το τεχνολογικό πρόσωπο του 21ου αιώνα, καταφέρνοντας μέχρι και να… ρηματοποιήσει το ίδιο της το όνομα.
Τεχνητή νοημοσύνη, προγραμματισμός, μηχανική μάθηση και κώδικες συνθέτουν τις τεχνολογικές εξελίξεις και πιθανόν θέτουν τις βάσεις για να αποκτήσουν οι μηχανές συνείδηση.
Τεχνητή νοημοσύνη, προγραμματισμός, μηχανική μάθηση και κώδικες συνθέτουν τις τεχνολογικές εξελίξεις και πιθανόν θέτουν τις βάσεις για να αποκτήσουν οι μηχανές συνείδηση.
«Το αποτέλεσμα επαναπροσδιορίζει το τοπίο των δημιουργικών συνεργασιών, αναδεικνύοντας πώς η συνέργεια μεταξύ των ανθρώπινων ιδεών και της τεχνολογίας AI μπορεί να φέρει επανάσταση» - Copy Magazine.
«Το αποτέλεσμα επαναπροσδιορίζει το τοπίο των δημιουργικών συνεργασιών, αναδεικνύοντας πώς η συνέργεια μεταξύ των ανθρώπινων ιδεών και της τεχνολογίας AI μπορεί να φέρει επανάσταση» - Copy Magazine.
Προσβασιμότητα, φορητότητα, απλότητα: Η τεχνητή νοημοσύνη όπως η πυρίτιδα και το καλάσνικοφ, θα φέρει επανάσταση στον τρόπο που εξελίσσονται και διεξάγονται οι πόλεμοι.
Προσβασιμότητα, φορητότητα, απλότητα: Η τεχνητή νοημοσύνη όπως η πυρίτιδα και το καλάσνικοφ, θα φέρει επανάσταση στον τρόπο που εξελίσσονται και διεξάγονται οι πόλεμοι.
Εμείς και οι συνεργάτες μας αποθηκεύουμε ή/και έχουμε πρόσβαση σε πληροφορίες σε μια συσκευή, όπως cookies και επεξεργαζόμαστε προσωπικά δεδομένα, όπως μοναδικά αναγνωριστικά και τυπικές πληροφορίες που αποστέλλονται από μια συσκευή για εξατομικευμένες διαφημίσεις και περιεχόμενο, μέτρηση διαφημίσεων και περιεχομένου, καθώς και απόψεις του κοινού για την ανάπτυξη και βελτίωση προϊόντων.
Με την άδειά σας, εμείς και οι συνεργάτες μας ενδέχεται να χρησιμοποιήσουμε ακριβή δεδομένα γεωγραφικής τοποθεσίας και ταυτοποίησης μέσω σάρωσης συσκευών. Μπορείτε να κάνετε κλικ για να συναινέσετε στην επεξεργασία από εμάς και τους συνεργάτες μας όπως περιγράφεται παραπάνω. Εναλλακτικά, μπορείτε να αποκτήσετε πρόσβαση σε πιο λεπτομερείς πληροφορίες και να αλλάξετε τις προτιμήσεις σας πριν συναινέσετε ή να αρνηθείτε να συναινέσετε.
Λάβετε υπόψη ότι κάποια επεξεργασία των προσωπικών σας δεδομένων ενδέχεται να μην απαιτεί τη συγκατάθεσή σας, αλλά έχετε το δικαίωμα να αρνηθείτε αυτήν την επεξεργασία. Οι προτιμήσεις σας θα ισχύουν μόνο για αυτόν τον ιστότοπο. Μπορείτε πάντα να αλλάξετε τις προτιμήσεις σας επιστρέφοντας σε αυτόν τον ιστότοπο ή επισκεπτόμενοι την πολιτική απορρήτου μας.
Εμείς και οι συνεργάτες μας αποθηκεύουμε ή έχουμε πρόσβαση σε πληροφορίες σε συσκευές, όπως cookies και επεξεργαζόμαστε προσωπικά δεδομένα, όπως μοναδικά αναγνωριστικά και τυπικές πληροφορίες που αποστέλλονται από μια συσκευή για τους σκοπούς που περιγράφονται παρακάτω. Μπορείτε να κάνετε κλικ για να συναινέσετε στην επεξεργασία από εμάς και τους συνεργάτες μας για τους εν λόγω σκοπούς. Εναλλακτικά, μπορείτε να κάνετε κλικ για να αρνηθείτε να συναινέστε ή να αποκτήσετε πρόσβαση σε πιο λεπτομερείς πληροφορίες και να αλλάξετε τις προτιμήσεις σας πριν συναινέσετε. Οι προτιμήσεις σας θα ισχύουν μόνο για αυτόν τον ιστότοπο. Λάβετε υπόψη ότι κάποια επεξεργασία των προσωπικών σας δεδομένων ενδέχεται να μην απαιτεί τη συγκατάθεσή σας, αλλά έχετε το δικαίωμα να αρνηθείτε αυτήν την επεξεργασία. Μπορείτε πάντα να αλλάξετε τις προτιμήσεις σας επιστρέφοντας σε αυτόν τον ιστότοπο ή επισκεπτόμενοι την πολιτική απορρήτου μας.
Necessary cookies are absolutely essential for the website to function properly. These cookies ensure basic functionalities and security features of the website, anonymously.
Cookie
Duration
Description
cookielawinfo-checkbox-advertisement
1 year
Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional
11 months
The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance
11 months
This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent
1 year
Records the default button state of the corresponding category & the status of CCPA. It works only in coordination with the primary cookie.
viewed_cookie_policy
11 months
The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.
Functional cookies help to perform certain functionalities like sharing the content of the website on social media platforms, collect feedbacks, and other third-party features.
Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.
Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics the number of visitors, bounce rate, traffic source, etc.
Cookie
Duration
Description
_ga
2 years
The _ga cookie, installed by Google Analytics, calculates visitor, session and campaign data and also keeps track of site usage for the site's analytics report. The cookie stores information anonymously and assigns a randomly generated number to recognize unique visitors.
_gat_gtag_UA_222713851_1
1 minute
Set by Google to distinguish users.
_gid
1 day
Installed by Google Analytics, _gid cookie stores information on how visitors use a website, while also creating an analytics report of the website's performance. Some of the data that are collected include the number of visitors, their source, and the pages they visit anonymously.
CONSENT
2 years
YouTube sets this cookie via embedded youtube-videos and registers anonymous statistical data.
Advertisement cookies are used to provide visitors with relevant ads and marketing campaigns. These cookies track visitors across websites and collect information to provide customized ads.
Cookie
Duration
Description
advanced_ads_browser_width
1 month
This cookie is set by Advanced ads plugin.This cookie is used to measure and store the user browser width for adverts.
VISITOR_INFO1_LIVE
5 months 27 days
A cookie set by YouTube to measure bandwidth that determines whether the user gets the new or old player interface.
YSC
session
YSC cookie is set by Youtube and is used to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices
never
YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.
yt-remote-device-id
never
YouTube sets this cookie to store the video preferences of the user using embedded YouTube video.