Istraživači su testirali najnaprednije AI modele i došli do poražavajućih rezultata.
Iako nas tehnološki giganti uveravaju da je budućnost u AI agentima koji će raditi umesto nas, novo istraživanje pokazuje da su ovi sistemi zapravo „operisani“ od osnovne logike i matematike.
U svetu tehnologije trenutno ne postoji veći „hajp“ od AI agenata. To nisu obični četbotovi sa kojima se dopisujete; to su sistemi koji bi trebalo da samostalno koriste vaš računar, plaćaju račune ili planiraju putovanja. Međutim, najnovija studija otkrila je njihovu „Ahilovu petu“, a to je osnovna matematika.
Istraživači su testirali najnaprednije modele i došli do poražavajućih rezultata. Problem leži u tzv. akumulaciji grešaka. Pošto AI agenti funkcionišu tako što jedan veliki zadatak razbijaju na niz manjih koraka, svaka sitna greška u proračunu na početku dovodi do potpunog kolapsa cele operacije.
Kada bi agent dobio zadatak koji zahteva više od nekoliko logičkih koraka, šansa za uspeh bi drastično opadala. U prevodu, ako mu poverite da vam sračuna troškove i rezerviše hotel, lako se može desiti da ostanete i bez novca i bez smeštaja.
Još jedan problem koji je studija istakla jeste to što ovi sistemi često „zaborave“ šta je bio prvobitni cilj. Dok pokušavaju da reše jedan pod-zadatak, agenti se neretko zaglave u besmislenim ponavljanjima (loop) ili počnu da generišu potpuno nebitne podatke, gubeći nit onoga što je korisnik zapravo tražio.
„Performanse su često bile katastrofalne čim bi se u jednačinu uvela malo kompleksnija logika,“ navodi se u izveštaju koji prenosi Futurism.
Ovo istraživanje je svojevrsni „hladan tuš“ za kompanije kao što su Microsoft, Google i OpenAI. Dok se oni utrkuju ko će pre izbaciti pametnijeg asistenta, realnost je da ovi sistemi i dalje ne razumeju svet oko sebe na način na koji to radi ljudski mozak.
Za sada, savet je jasan: nemojte dozvoliti veštačkoj inteligenciji da vam vodi poslovne knjige ili rešava domaći iz matematike bez detaljne provere.
IZVOR: B92 I FOTO: PEXELS























































































