Un chatbot avansat creat de OpenAI a reușit să treacă testul Turing, una dintre cele mai cunoscute metode de evaluare a comportamentului asemănător celui uman în inteligența artificială. Conform unui studiu realizat de cercetători de la Universitatea din California, San Diego, modelul GPT-4.5 a fost perceput ca fiind uman în 73% dintre interacțiuni.
Studiul, aflat în faza de preprint, deci nevalidat încă prin evaluare academică oficială, a implicat 284 de participanți care au participat la opt sesiuni de testare. În fiecare rundă, un „interogator” comunica prin text cu două entități – una umană și una AI – fără să știe care e care. După cinci minute de dialog, trebuia să decidă cine e persoana reală. GPT-4.5 a fost cel mai convingător, fiind identificat drept om în aproape trei sferturi din cazuri, în timp ce LLaMa-3.1-405B a avut o rată de succes de 56%. Modelele mai vechi, precum ELIZA sau GPT-4o, au avut performanțe mult mai slabe, păcălind participanții doar în 23% și 21% dintre cazuri.
Testul Turing, conceput în anii ’50 de Alan Turing, are ca scop verificarea capacității unei mașini de a imita cu succes un om într-un dialog natural. Totuși, mulți specialiști atrag atenția că acest test e mai degrabă o măsură a abilitații de a imita, nu o dovadă clară de inteligență autentică. Chiar și autorii studiului subliniază că reușita GPT-4.5 nu înseamnă că modelul este conștient sau echivalent cu o minte umană. Ei consideră că testul măsoară în primul rând capacitatea unui sistem de a trece neobservat ca substitut uman într-o interacțiune limitată în timp.
De asemenea, cercetarea notează că fiecare model AI a fost programat să adopte o anumită „personalitate”, însă nu oferă suficiente detalii despre modul în care acest element a influențat percepția interlocutorilor.
În concluzie, deși GPT-4.5 nu este „inteligent” în sens uman, performanțele sale sugerează cât de avansată a devenit capacitatea AI-ului de a susține conversații convingătoare.