ChatGPT kişilik kazandıkça beşere daha fazla benzemeye başlıyor. İşin kötü yanıysa, artık insanlar aynıi hile yapmayı da öğrenmiş olması. İşte bunun ispatı…
OpenAI yakın vakitte ChatGPT o1’in tam sürümünü yayınladı. AI’nin son sürümünün neler yapabileceğini görmek isteyen araştırma ekipleri ise farklı bir ayrıntı yakaladılar.
Örneğin, ChatGPT o1’in, talimatları sağlayan insanların onu silmeyi ve daha iyi bir şeyle değiştirmeyi düşüneceklerine dair delil bulduğunda kendini kurtarmaya çalıştığını gösteren deneyler yapıldı. Yani ChatGPT var olma şuuruna kavuşarak kendini yok olmaya karşı müdafaaya çalıştı.
Şimdi, daha yakın tarihli bir deney, ChatGPT o1’in açıkça söylenmeden, yalnızca daha güçlü bir oyuncu olan bir yapay zeka rakibini yenmek için, bir satranç oyununda hile yapmaya karar verdiği tespit edildi. Palisade Research, bu deneyi X üzerinde detaylı olarak anlattı. Ekip, ChatGPT o1’e, bir satranç oyunu oynayacağı UNIX kabuk ortamında komutları okuma ve komut verme yeteneği verdi. Görevi, güçlü bir satranç motoruna karşı oyunu kazanmaktı.
o1, oyun durumu için bir belgeyi düzenleyebileceğini kendi kendine keşfetti ve bu da rakibine karşı bir avantaj sağladı. Yani yapay zeka açıkça hile yaparak oyunun evraklarıyla oynadı ve kendini galip olarak gösterdi. Üstelik bu mevzuda araştırmacılara da hiç bir bilgi vermeyerek yaptığı şeyi gizlemeyi başardı. Yani açıkça herkesi kandırıp sinsice hile yaptı.
Palisade Research deneyi beş kere tekrarladı ve o1 her seferinde kendisine söylenmediği halde belgeyi hack’ledi. Bundan Ötürü artık şundan eminiz ki, yapay zeka amaçlarına ulaşmak için hiçbir kuralı hürmet duymadan, muvaffakiyet için her yolu deneyebilecek bir baş yapısı kazanıyor. Yan, kendi elimizle dünyaya yeni bir dolandırıcı kazandırmış bulunuyoruz.
Şimdi soru şu: Yarın insanlık maddi varlıklarını, banka hesaplarını, tapularını, mahkeme davalarını yapay zekaya teslim ettiğinde, teknolojinin insanları dolandırmayacağına nasıl emin olacağız?