Deși s-a anunțat că AI va înlocui multe locuri de muncă intelectuale, în practică schimbările au fost lente, în special în sarcinile complexe din domenii precum consultanța, dreptul și investment banking.
Un benchmark nou, APEX-Agents, a testat modelele AI în sarcini reale și a constatat că acestea reușesc să ofere răspunsuri corecte în mai puțin de 25% dintre cazuri, întâmpinând obstacole majore în gestionarea informațiilor multidisciplinare.
Cercetătorii consideră că progresul rapid în AI va continua, dar în prezent modelele acționează mai mult ca stagiari, fiind nevoie de timp și dezvoltare suplimentară pentru a atinge un nivel profesional solid.