Ένα νέο benchmark έρχεται να προσγειώσει το αφήγημα ότι οι AI agents είναι έτοιμοι να μπουν στα γραφεία απότομα: οι μηχανές ξέρουν πολλά, αλλά ακόμη δεν ξέρουν να δουλεύουν.
Ένα νέο benchmark έρχεται να προσγειώσει το αφήγημα ότι οι AI agents είναι έτοιμοι να μπουν στα γραφεία απότομα: οι μηχανές ξέρουν πολλά, αλλά ακόμη δεν ξέρουν να δουλεύουν.





