ChatGPT, yapılan bir deneyde insan benzeri davranarak iştirakçilerin birçoklarını kandırdı ve Turing testini geçmeyi başardı.

OpenAI’ın geliştirdiği GPT-4.5, Kaliforniya Üniversitesi San Diego’da yapılan bir deneyde, iştirakçilerin büyük çoğunluğunu insan olduğuna inandırarak Turing testini geçmeyi başardı. Uzmanlar ise bu durum kulağa ne kadar etkileyici gelse de modelin sahiden şuur kazandığını söylemenin doğru olmadığını, yalnızca iyi bir taklit yeteneği olduğunu belirtti.
Deneyde katılımcılar biri insan biri yapay zekâ olan iki farklı bireyle sohbet etti ama hangisinin kim olduğunu bilmiyorlardı. Sohbetin sonunda tahmin yapmaları istendi ve GPT-4.5, katılımcıların %73’ü tarafından insan sanıldı.
Sadece rol yapabildiğinde inandırıcı oldu

Hatta birtakım katılımcılar yapay zekâ sanılarak modelin gerisinde kaldı. Araştırmacılar, modelin daha ikna edici olabilmesi için ona “genç, utangaç, internetle içli dışlı ve hafif esprili” bir karakter profili tanımladı. GPT-4.5 bu profille hayli başarılı bir performans sergiledi. Profilini tanımlaması için oluşturulan bu yönergeler kaldırıldığında ise kandırabildiği kişi oranı %36’ya kadar geriledi. Aslında bu da modelin sırf makul şartlar altında etkileyici sonuçlar verdiğini, kendi başına kalınca “insan aynıi” etkileşim kurmakta zorlandığını ortaya koydu.
Uzmanlar, GPT-4.5’in sergilediği davranışların şuurlu düşünme değil, dilsel tahminlere dayalı bir performans olduğunu belirtti. Model ise ne testin ne de muvaffakiyetinin farkında. Bu nedenle ortaya çıkan sonuç, teknik olarak başarılı bir “canlandırma” olarak tanımlandı. Nihayetinde ise yapay zekânın buna aynı becelerinin yanlış bireyler tarafından kullanılması durumunda kimi riskleri de beraberinde getirebileceği aktarıldı.