Yapay zeka 'Turing Testi'ni geçti: Artık insandan ayırt edilemiyor
Bilim kurgu filmlerindeki distopik senaryolar gerçeğe giderek yaklaşıyor. ABD’deki Kaliforniya Üniversitesi’nden bilim insanlarınca yürütülen bir çalışmaya göre botlar artık insan benzerlerinden ayırt edilemiyor.

Araştırmacılar, İngiliz bilimci Alan Turing’in geliştirdiği testi yapay zeka robotlarının üzerinde denedi. Test, robotların zekasının ve dijital çıktılarının bir insanınkinden ayırt edilip edilemeyeceğini ölçen, bir nevi ‘makine sınavı.’
Mashable’ın haberine göre araştırmacılar dört büyük modelini (LLM) GPT-4o, LLaMa-3.1, GPT-4.5 ve Eliza’yı (1960’lı yıllara ait bir sohbet programı) iki rastgele ve kontrollü deneyde test etti.
Çalışmaya Kaliforniya Üniversitesi’nden 126 lisans öğrencisi ve Prolific adlı çevrimiçi veri havuzundan 158 kişi çalışma katıldı.
Katılımcılara, bir robot ve bir insanla beş dakikalık eş zamanlı çevrimiçi sohbet etme talimatı verildi ancak bir insanla mı bir robotla mı sohbet ettiği söylenmedi.
Hem insan hem de yapay zeka robotlarına, sohbet ettiği kişiyi insan olduğuna ikna etme görevi de verildi.
Araştırmanın sonucuna göre GPT-4.5 yüzde 73, LLaMa-3.1 ise yüzde 56 oranında insan olarak değerlendirildi. Yani iki yapay zeka da testten geçer not aldı.
Temel modeller (ELIZA ve GPT-4o) karşılarındaki insanı sırasıyla sadece yüzde 23 ve yüzde 21 oranında yanıltarak başarısız oldu.
Bu sonuçlar, herhangi bir yapay sistemin Turing Testi’ni geçtiğine dair ilk deneysel kanıt.
İnsandan ‘daha iyi’ insan oldular
Çalışmayı yorumlayan Psychology Today uzmanları, botların Turing Testi’ni zekalarıyla değil, gerçek insanlardan ‘daha iyi’ bir insan olmaları nedeniyle geçtiği sonucuna vardı.
Nosta Lab’ın kurucusu John Nosta şunları söyledi: “Turing Testi makine zekasını ölçmek için tasarlanmışken, istemeden çok daha rahatsız edici bir şeyi ortaya çıkardı: Duygusal taklide karşı artan hassasiyetimiz. Bu, yapay zeka tespitinin başarısızlığı değil. Yapay empatinin zaferi.”
Nosta, analizini katılımcıların nadiren mantıksal sorular sormasına, bunun yerine ‘duygusal ton, argo ve akıcılığa’ öncelik vermesine ve seçimlerini ‘hangisinin daha insani bir havaya sahip olduğuna’ göre yapmasına dayandırdı: “Başka bir deyişle, bu bir Turing Testi değildi. Bu bir sosyal kimya testiydi. Zekanın değil, duygusal akıcılığın bir ölçüsüydü. Ve yapay zeka bunu başardı.”