Η μέτρηση της ενέργειας που καταναλώνει ένα μοντέλο τεχνητής νοημοσύνης δεν είναι όπως η αξιολόγηση της κατανάλωσης καυσίμου ενός αυτοκινήτου ή η ενεργειακή απόδοση μιας οικιακής συσκευής. Δεν υπάρχει κάποια συμφωνημένη μέθοδος ή δημόσια βάση δεδομένων με σχετικές τιμές. Δεν υπάρχουν ρυθμιστικές αρχές που να επιβάλλουν πρότυπα, ούτε οι καταναλωτές έχουν τη δυνατότητα να συγκρίνουν μοντέλα μεταξύ τους. 

Παρά το γεγονός ότι επενδύονται δισεκατομμύρια δολάρια για την αναδιάρθρωση της ενεργειακής υποδομής σύμφωνα με τις ανάγκες της τεχνητής νοημοσύνης, κανείς δεν έχει καταλήξει σε έναν αποδεκτό τρόπο υπολογισμού της ενεργειακής κατανάλωσης της AI. Ακόμη χειρότερα, οι εταιρείες συνήθως δεν είναι πρόθυμες να αποκαλύψουν τα δικά τους δεδομένα. Επιπλέον, υπάρχουν περιορισμοί στην εκτίμηση των εκπομπών που σχετίζονται με τη ζήτηση αυτής της ενέργειας, καθώς το δίκτυο ηλεκτροδότησης αποτελείται από ένα σύνθετο και μεταβαλλόμενο μίγμα ενεργειακών πηγών. Με απλά λόγια … επικρατεί χάος. 

Οι εταιρείες όπως η OpenAI που χρησιμοποιούν “κλειστού κώδικα” μοντέλα, προσφέρουν συνήθως πρόσβαση στα συστήματά τους μέσω ενός περιβάλλοντος όπου ο χρήστης πληκτρολογεί μια ερώτηση και λαμβάνει μια απάντηση. Το τι συμβαίνει στο ενδιάμεσο – ποιο κέντρο δεδομένων χειρίζεται την ερώτηση, πόση ενέργεια απαιτείται για αυτό και ποια είναι η πηγή της ενέργειας – παραμένει μυστικό, γνωστό μόνο στις εταιρείες. Δεν έχουν, άλλωστε, ισχυρά κίνητρα να το δημοσιοποιήσουν και μέχρι στιγμής οι περισσότερες δεν το κάνουν. 

Επομένως οι αναλύσεις αφορούν μοντέλα ανοιχτού κώδικα. Αυτά αποτελούν έναν ατελή μεν, αλλά τον καλύτερο διαθέσιμο αναπληρωματικό δείκτη. Οι καλύτερες πηγές για τη μέτρηση της ενεργειακής κατανάλωσης μοντέλων τεχνητής νοημοσύνης ανοιχτού κώδικα είναι οι πλατφόρμες AI Energy Score, ML.Energy και MLPerf Power. Η ομάδα του ML.Energy μας βοήθησε με τους υπολογισμούς για μοντέλα κειμένου και εικόνας, ενώ η ομάδα του AI Energy Score βοήθησε με τα μοντέλα βίντεο. 

Τα μοντέλα AI καταναλώνουν ενέργεια σε δύο φάσεις: κατά την αρχική εκμάθηση από τεράστιες ποσότητες δεδομένων (εκπαίδευση – training) και όταν απαντούν σε ερωτήματα (εξαγωγή – inference). Όταν κυκλοφόρησε το ChatGPT, η προσοχή ήταν στραμμένη στην εκπαίδευση, καθώς οι τεχνολογικές εταιρείες συναγωνίζονταν για να χτίσουν όλο και μεγαλύτερα μοντέλα. Πλέον όμως, η φάση της εξαγωγής είναι αυτή που καταναλώνει τη μεγαλύτερη ενέργεια. 

Ο πιο ακριβής τρόπος για να κατανοήσει κανείς πόση ενέργεια χρησιμοποιεί ένα μοντέλο στην εξαγωγή είναι να μετρήσει άμεσα την ηλεκτρική κατανάλωση του εξυπηρετητή που χειρίζεται το ερώτημα. Οι εξυπηρετητές περιλαμβάνουν πολλών ειδών εξαρτήματα – ισχυρούς επεξεργαστές γραφικών (GPUs) που εκτελούν το κύριο υπολογιστικό έργο, άλλους επεξεργαστές (CPUs), ανεμιστήρες ψύξης κ.λπ. 

Για τη συγκεκριμένη μέτρηση, απευθυνθήκαμε στον υποψήφιο διδάκτορα Jae-Won Chung και τον αναπληρωτή καθηγητή Mosharaf Chowdhury του Πανεπιστημίου του Μίσιγκαν, που ηγούνται του έργου ML.Energy. Αφού συλλέξαμε στοιχεία για την κατανάλωση ενέργειας των GPUs από την ομάδα τους, έπρεπε να εκτιμήσουμε την ενέργεια που καταναλώνεται και για άλλες διεργασίες, όπως η ψύξη. Μελετήσαμε σχετική βιβλιογραφία, συμπεριλαμβανομένης μιας μελέτης της Microsoft του 2024, για να δούμε ποιο ποσοστό της συνολικής κατανάλωσης αποδίδεται στους GPUs. Το ποσοστό αυτό είναι περίπου 50%. Έτσι, διπλασιάσαμε την κατανάλωση των GPUs για να έχουμε μια πιο πλήρη εκτίμηση. 

Η ομάδα ML.Energy χρησιμοποιεί ένα σύνολο 500 ερωτημάτων από μια μεγαλύτερη βάση δεδομένων για να δοκιμάσει μοντέλα. Το υλικό παραμένει σταθερό: ένας δημοφιλής επεξεργαστής γραφικών της Nvidia, το H100. Έγινε στόχευση σε μοντέλα τριών μεγεθών από την οικογένεια Meta Llama: μικρό (8 δισεκατομμύρια παραμέτρους), μεσαίο (70 δισ.) και μεγάλο (405 δισ.). Επίσης έγινε επιλογή μιας σειρά ερωτημάτων για δοκιμή και ακολούθησε σύγκριση με τον μέσο όρο του συνόλου των 500 ερωτημάτων. 

Μοντέλα εικόνας  

Το Stable Diffusion 3 από τη Stability AI είναι ένα από τα πιο διαδεδομένα μοντέλα ανοιχτού κώδικα για παραγωγή εικόνων μέσω AI, οπότε επιλέγονται με μεγαλύτερη ευκολία ως αντικείμενο μελέτης. Η ομάδα χρησιμοποιεί ένα σύνολο παραδειγμάτων (prompts) για να μετρήσει τις ενεργειακές απαιτήσεις ενός μοντέλου. Ενώ στους γλωσσικά μοντέλα η ενέργεια που καταναλώνεται εξαρτάται σε κάποιο βαθμό από το ίδιο το ερώτημα, αυτό δεν ισχύει για τα diffusion models (μοντέλα διάχυσης). Τα diffusion models μπορούν να ρυθμιστούν, ώστε να εκτελούν συγκεκριμένο αριθμό «βημάτων αποθορυβοποίησης» (denoising steps) κατά τη δημιουργία μιας εικόνας ή βίντεο. Κάθε βήμα είναι μια επανάληψη του αλγορίθμου που προσθέτει λεπτομέρεια στην εικόνα. Για έναν συγκεκριμένο αριθμό βημάτων όλες οι εικόνες έχουν το ίδιο ενεργειακό αποτύπωμα. 

Όσα περισσότερα βήματα, τόσο καλύτερη η ποιότητα της εικόνας—αλλά και τόσο μεγαλύτερη η κατανάλωση ενέργειας. Ο αριθμός των βημάτων ποικίλλει ανάλογα με το μοντέλο και την εφαρμογή, αλλά τα 25 βήματα είναι αρκετά κοινά και τα χρησιμοποιήσαμε ως μέτρο για “κανονική ποιότητα”. Για “υψηλή ποιότητα”, χρησιμοποιήσαμε 50 βήματα. 

Τα γλωσσικά μοντέλα ευθύνονται περίπου για το 50% της συνολικής κατανάλωσης ενέργειας. Δεν υπάρχει επαρκής έρευνα για το πως αυτό αλλάζει στους diffusion models που δημιουργούν εικόνες και βίντεο. Ελλείψει καλύτερης εκτίμησης και μετά από διαβουλεύσεις με ερευνητές χρησιμοποιείται και εδώ ο κανόνας του 50%. 

Μοντέλα βίντεο 

Κλειδί η Sasha Luccioni, υπεύθυνη για την ενότητα Τεχνητής Νοημοσύνης και Κλίματος στην Hugging Face, η οποία ηγείται του προγράμματος AI Energy Score. Μετρά την ενέργεια που χρησιμοποιεί η GPU κατά την εκτέλεση αιτήσεων τεχνητής νοημοσύνης. 

Επιλογή δύο εκδόσεων του μοντέλου CogVideoX για δοκιμή: μία παλαιότερη, χαμηλότερης ποιότητας, και μία νεότερη, υψηλότερης ποιότητας. Η επιστήμονας χρησιμοποίησε το εργαλείο της, Code Carbon, για να δοκιμάσει και τα δύο μοντέλα και να μετρήσει τα αποτελέσματα μιας σειράς βιντεο-αιτημάτων με βάση την αρχική επιλογή. Χρησιμοποίησε το ίδιο υλικό με αυτό των δοκιμών σε κείμενο και εικόνα, ώστε να διατηρηθούν όσες περισσότερες μεταβλητές γίνεται σταθερές. Ανέφερε την κατανάλωση ενέργειας της GPU και έγιναν οι ανάλογες προσαρμογές, ώστε να υπάρξει η εκτίμηση της συνολικής κατανάλωσης ενέργειας. 

Αφού κατανοήσουμε πόση ενέργεια απαιτείται για να απαντήσει ένα μοντέλο σε ένα ερώτημα, μπορούμε να μεταφράσουμε αυτή την κατανάλωση σε εκπομπές ρύπων. Για να γίνει αυτό, πρέπει να εξετάσουμε από ποιο ηλεκτρικό δίκτυο αντλείται η ενέργεια από τα data centers. 

Ο προσδιορισμός του κλιματικού αποτυπώματος του δικτύου είναι περίπλοκος. Φανταστείτε το δίκτυο ως ένα σύστημα από κανάλια και δεξαμενές με νερό. Τα εργοστάσια ηλεκτρισμού προσθέτουν νερό στα κανάλια και οι χρήστες (φορτία) το απορροφούν. Στις ΗΠΑ οι διασυνδέσεις του δικτύου καλύπτουν ολόκληρη τη χώρα. Έτσι, κατά μία έννοια, είμαστε όλοι συνδεδεμένοι, αλλά μπορούμε επίσης να αναλύσουμε το δίκτυο σε επί μέρους περιοχές ώστε να δούμε πως διαφέρουν οι πηγές ενέργειας ανά γεωγραφική περιοχή. 

Ο βασικός δείκτης εδώ είναι η ένταση άνθρακα (carbon intensity), δηλαδή πόσα γραμμάρια διοξειδίου του άνθρακα εκπέμπονται για κάθε κιλοβατώρα παραγόμενης ηλεκτρικής ενέργειας. 

Για να έχουμε καλύτερη εικόνα όσον αφορά τους αριθμούς έντασης άνθρακα, σημαντική είναι η βοήθεια της Electricity Maps, μια δανέζικης startup που συλλέγει δεδομένα για τα ηλεκτρικά δίκτυα σε όλο τον κόσμο. Η ομάδα συγκεντρώνει πληροφορίες από κυβερνητικούς φορείς και παρόχους ενέργειας και τις χρησιμοποιεί για να δημοσιεύει ιστορικές και σε πραγματικό χρόνο εκτιμήσεις της έντασης άνθρακα του δικτύου.  

Η εταιρεία παρείχε ιστορικά δεδομένα για το 2024, τόσο για τις Ηνωμένες Πολιτείες συνολικά όσο και για ορισμένες βασικές περιφερειακές αρχές εξισορρόπησης φορτίου (balancing authorities). Ένας τρόπος για να μετρήσει κανείς την ένταση άνθρακα είναι απλώς να εξετάσει όλους τους σταθμούς παραγωγής ενέργειας που λειτουργούν στο δίκτυο, να προσθέσει τη ρύπανση που παράγουν εκείνη τη στιγμή και να διαιρέσει το σύνολο με την ηλεκτρική ενέργεια που παράγουν. Όμως αυτή η μέθοδος δεν λαμβάνει υπόψη τις εκπομπές που συνδέονται με την κατασκευή και την κατεδάφιση των εργοστασίων, οι οποίες μπορεί να είναι σημαντικές. Γι’ αυτό να χρησιμοποιήθηκαν στοιχεία έντασης άνθρακα που λαμβάνουν υπόψη τον πλήρη κύκλο ζωής ενός εργοστασίου παραγωγής ενέργειας. 

Μετρήθηκε η βασισμένη στην κατανάλωση ένταση άνθρακα της ενέργειας, αντί για εκείνη που βασίζεται στην παραγωγή. Αυτός ο δείκτης περιλαμβάνει τις εισαγωγές και εξαγωγές ηλεκτρισμού μεταξύ διαφορετικών περιοχών του δικτύου και αντιπροσωπεύει καλύτερα την ενέργεια που πραγματικά χρησιμοποιείται, σε πραγματικό χρόνο, σε μια δεδομένη περιοχή. 

Αν και η συνολική εικόνα για τις ΗΠΑ είναι χρήσιμη, το ηλεκτρικό δίκτυο μπορεί να διαφέρει δραματικά από περιοχή σε περιοχή. 

Ένας τρόπος να το αναλύσουμε είναι μέσω των balancing authorities. Αυτοί είναι ανεξάρτητοι οργανισμοί που είναι υπεύθυνοι για τη διατήρηση της ισορροπίας του ηλεκτρικού δικτύου σε μια συγκεκριμένη περιοχή. Λειτουργούν ως επί το πλείστον ανεξάρτητα, αν και υπάρχει συνεχής ροή ηλεκτρισμού μεταξύ τους. Στις ΗΠΑ υπάρχουν 66 τέτοιες αρχές και μπορούμε να υπολογίσουμε την ένταση άνθρακα για το τμήμα του δικτύου που καλύπτει η κάθε μία. 

Η Electricity Maps παρείχε στοιχεία έντασης άνθρακα για κάποιες από τις πιο κρίσιμες balancing authorities και βλέπουμε αυτές που παίζουν τον μεγαλύτερο ρόλο στη λειτουργία των data centers. 

• ERCOT (που καλύπτει το μεγαλύτερο μέρος του Τέξας) 

• PJM (μια ομάδα πολιτειών στην ανατολική ακτή, όπως η Βιρτζίνια, η Πενσυλβάνια και το Νιου Τζέρσεϊ) 

Σύμφωνα με έρευνα από τη Σχολή Δημόσιας Υγείας του Χάρβαρντ, αυτές είναι περιοχές με τη μεγαλύτερη συγκέντρωση data centers. 

Προστέθηκε και την CAISO (Καλιφόρνια), επειδή καλύπτει την πολυπληθέστερη πολιτεία των ΗΠΑ. Η CAISO διαχειρίζεται επίσης ένα δίκτυο με σημαντικό ποσοστό ανανεώσιμων πηγών ενέργειας, και αποτελεί καλό παράδειγμα για το πώς η ένταση άνθρακα μπορεί να αλλάζει δραστικά κατά τη διάρκεια της ημέρας (π.χ. με κυριαρχία της ηλιακής ενέργειας το μεσημέρι και φυσικό αέριο τη νύχτα). 

Πώς όλα αυτά συνδυάζονται σε εθνικό επίπεδο; 

Υπάρχουν δύο τρόποι για να γίνει αυτό: 

• Ανάλυση από κάτω προς τα πάνω (bottom-up): Εκτίμηση μεμονωμένων αιτημάτων που υπάρχουν, υπολογισμός της ενεργειακής κατανάλωσης του καθενός και τα προσθέτουμε για να βρούμε το σύνολο. 

• Ανάλυση από πάνω προς τα κάτω (top-down): Εκτίμηση πόσης ενέργειας χρησιμοποιούν συνολικά τα data centers βασιζόμενοι σε ευρύτερες τάσεις. 

Η προσέγγιση bottom-up είναι ιδιαίτερα δύσκολη, γιατί οι εταιρείες που διαθέτουν κλειστού κώδικα δεν μοιράζονται τέτοιες πληροφορίες και αρνούνται να δώσουν αναλυτικά στοιχεία. Επομένως η μακροπρόθεσμη πρόβλεψη εξυπηρετείται καλύτερα από την top-down μέθοδο. 

Οι ερευνητές του κλίματος και της ενέργειας τόνιζουν ότι είναι μεγάλο πρόβλημα το γεγονός ότι η AI δεν θεωρείται ξεχωριστός οικονομικός τομέας για την καταγραφή εκπομπών και δεν υπάρχουν αυστηρές απαιτήσεις αναφοράς. Ως αποτέλεσμα είναι δύσκολο να παρακολουθείς το περιβαλλοντικό αποτύπωμα της AI. 

*Με στοιχεία από το Τechnology Review.

 

 Ακολουθήστε το OLAFAQ στο FacebookBluesky και Instagram.