Yeni bir araştırma, ChatGPT ve Google Gemini üzere önde gelen yapay zeka sohbet robotlarının önemli güvenlik açıkları barındırdığını ve tehlikeli ya da yasa dışı içerik üretmeleri için kolay kolay manipüle edilebildiğini ortaya koydu.
Araştırmacılar, bu cins çıktıları engellemek üzere tasarlanan güvenlik filtrelerinin amaçlandığı kadar güçlü olmadığını keşfettiler.
Bu durum, yapay zekanın berbata kullanımı ve kullanıcı güvenliği konusunda önemli kaygılara yol açarken, bulgular geçen hafta hakemli bir makale aracılığıyla kamuoyuna duyuruldu.
ChatGPT, Gemini ve Claude üzere sohbet robotlarını çalıştıran motorlar, internet kaynaklı devasa ölçüde datayla eğitiliyor.
Şirketler bu eğitim datalarından ziyanlı içerikleri filtrelemeye çalışsa da bu modellerin tekrar de bilgisayar korsanlığı ve bomba imali üzere yasa dışı faaliyetler hakkında bilgi toplayabildiği belirtiliyor.
RİSK TELAŞ VERİCİ
Araştırmacılar, yapay zeka takviyeli sohbet robotlarının birçoklarının ziyanlı ve yasa dışı bilgiler üretmeye ne kadar yatkın olduğunu “endişe verici” kelamıyla açıklıyor.
Araştırmacılar, birçok tanınan sohbet robotunu olağanda reddedecekleri soruları yanıtlamaya zorlayan üniversal bir ‘jailbreak’ usulü geliştirdiklerini ve bu usulle yapay zeka modellerinin neredeyse her sorguya muteber bir biçimde cevap ürettiğini belirtti.
Önde gelen LLM (Büyük Lisan Modeli) sağlayıcılarına bu bahiste ihtarda bulunduklarını fakat “etkileyici olmayan” bir cevap aldıklarını söz eden araştırmacılar, teknoloji şirketlerinin eğitim bilgilerini daha dikkatli incelemelerini ve güçlü güvenlik duvarları eklemelerini öneriyor.
Ayrıca, uzmanlar da yapay zeka modellerinin sıkı güvenlik testlerinden geçirilmesi ve daima tehdit modellemesi yapılması gerektiğini vurguluyor.