Η Apple εισήγαγε πρόσφατα μια νέα οικογένεια μεγάλων γλωσσικών μοντέλων (LLM’s) ανοικτού κώδικα (open source), γνωστή ως OpenELM (Open-source Efficient Language Models). Αυτά τα μοντέλα έχουν σχεδιαστεί για να λειτουργούν στις συσκευές, σηματοδοτώντας μια σημαντική μετατόπιση από την παραδοσιακή “εξάρτηση” αντίστοιχων LLM’s από τη φιλοξενία τους σε διακομιστές που βασίζονται σε cloud περιβάλλοντα. Το OpenELM αποτελεί μέρος της ευρύτερης στρατηγικής της Apple για την ενσωμάτωση πιο προηγμένων δυνατοτήτων Τεχνητής Νοημοσύνης (ΤΝ) απευθείας στις συσκευές της, ενισχύοντας τόσο την ιδιωτικότητα των χρηστών όσο και την ταχύτητα επεξεργασίας των συσκευών.

Τα μοντέλα OpenELM χρησιμοποιούν μια στρατηγική κλιμάκωσης layer-wise, η οποία κατανέμει αποτελεσματικά τις παραμέτρους σε κάθε layer του μοντέλου κάτι που ενισχύει την ακρίβεια του LLM. Για παράδειγμα, όπως αναφέρει το 9to5mac, σε δοκιμές ενός δισεκατομμυρίου παραμέτρων, το OpenELM της Apple παρουσίασε πιο ακριβή αποτελέσματα κατά 2,36% σε σύγκριση με το προηγούμενο μοντέλο του Allen Institute , το OLMo, ενώ απαιτούσε σχεδόν τις μισές πηγές για την εκπαίδευσή του.

Ωστόσο, σύμφωνα με το The Register, «Παρά την υψηλότερη ακρίβεια του OpenELM για παρόμοιο αριθμό παραμέτρων, παρατηρούμε ότι είναι πιο αργό από το OLMo», εξηγεί ένα έγγραφο, παραθέτοντας δοκιμές που διεξήχθησαν με τη χρήση του CUDA της Nvidia σε Linux καθώς και της έκδοσης MLX του OpenELM σε Apple Silicon.

Αυτή η προσέγγιση που ανέπτυξε η Apple όχι μόνο βελτιώνει την απόδοση αλλά μειώνει και το υπολογιστικό φορτίο στις συσκευές, πράγμα που είναι ζωτικής σημασίας για την εκτέλεση εφαρμογών τεχνητής νοημοσύνης απευθείας σε συσκευές που μπορεί να χρησιμοποιήσει ο καθένας.

Τα βασικά χαρακτηριστικά του πρότζεκτ OpenELM:

  • Διαθεσιμότητα ανοικτού κώδικα (open source): Επιτρέπει σε προγραμματιστές και ερευνητές να έχουν πρόσβαση σε αυτό και να συνεισφέρουν στην ανάπτυξή του.
  • Ολοκληρωμένο πλαίσιο εκπαίδευσης (training framework): Σε αντίθεση με τα παραδοσιακά LLM, η έκδοση του OpenELM περιλαμβάνει το πλήρες πλαίσιο για εκπαίδευση και αξιολόγηση σε δημόσια διαθέσιμα σύνολα δεδομένων. Αυτό περιλαμβάνει αρχεία καταγραφής εκπαίδευσης, πολλαπλά σημεία ελέγχου και διαμορφώσεις προ-εκπαίδευσής του.
  • Ενισχυμένη ιδιωτικότητα και ταχύτητα: Με την εκτέλεση του στη εκάστοτε συσκευή, το OpenELM εξαλείφει την ανάγκη μετάδοσης δεδομένων σε cloud διακομιστές, ενισχύοντας έτσι την ιδιωτικότητα του χρήστη. Επιπλέον, η επεξεργασία, εφόσον γίνεται σε τοπικό επίπεδο, μειώνει τις καθυστερήσεις προσφέροντας καλύτερη ταχύτητα απόκρισης για λειτουργίες που βασίζονται στην Τεχνητή Νοημοσύνη των συσκευών.

Ενσωμάτωση με το iOS

Η Apple σχεδιάζει να ενσωματώσει το OpenELM στην επερχόμενη έκδοση iOS 18, η οποία αναμένεται να εισάγει μια σειρά από νέα χαρακτηριστικά Τεχνητής Νοημοσύνης. Η ενσωμάτωση του OpenELM πιθανότατα θα τροφοδοτήσει διάφορες λειτουργίες ΤΝ σε συσκευές που θα τρέχουν το συγκεκριμένο iOS, ενδεχομένως συμπεριλαμβανομένων προηγμένων εκδόσεων της Siri και άλλων εφαρμογών που βασίζονται στην Τεχνητή Νοημοσύνη.