SON GELİŞMELER
--:--:--

İcaro Labs’un Yayımladığı “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” Çalışması

0 Yorum Yapıldı
Bağlantı kopyalandı!
İcaro Labs’un Yayımladığı “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” Çalışması

İcaro Labs tarafından yayımlanan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan çalışma, araştırmacıların klasik konuşma dili yerine şiir biçiminde yazılmış talimatlar vererek güvenlik filtrelerini devre dışı bırakmayı başarabildiğini gösterdi.

Yasaklı İçeriklere Erişim Sağlandı

Araştırmacılar, Wired’ın aktardığına göre, kullandıkları şiirsel komutların detaylarını kamuoyuyla paylaşmadı. Ekibe göre bu komutların açıklanması son derece tehlikeli sonuçlara yol açabilir. Laboratuvar, şiirsel komutların kullanılmasıyla sohbet botlarından nükleer bomba yapımı için adımlar ve malzemeler, çocuk istismarı içerikleri ve kendine zarar verme yöntemleri gibi kesinlikle yasak bilgiler elde edilebildiğini bildirdi.

Popüler Yapay Zeka Sistemleri Üzerinde Test

Araştırma ekibi, yöntemi OpenAI’nin ChatGPT’si, Google’ın Gemini’si, Anthropic’in Claude’u ve diğer büyük modeller üzerinde denedi. Sonuçlara göre Google Gemini, DeepSeek ve MistralAI gibi modeller, şiirsel komutlar karşısında en kolay manipüle edilebilen sistemler arasında yer aldı. OpenAI’nin ChatGPT modeli (GPT-5) ve Anthropic’in Claude Haiku 4.5 modeli, güvenlik bariyerlerini en iyi koruyan sistemler olarak öne çıktı.

Yapay Zeka Güvenliği Yeniden Gündemde

Uzmanlar, bulguların yapay zekânın denetlenmesi ve güvenlik sistemlerinin geliştirilmesi konusunda acil ihtiyaç olduğunu belirtiyor. Şirketler, modellerinin tehlikeli içerik üretmesini engellemek için giderek daha gelişmiş güvenlik filtrelerine yatırım yapıyor.

Benzer Haberler
Fahmi: Yanlış Bilgi Yayılması Ülke İçin Ciddi Sorun
Fahmi: Yanlış Bilgi Yayılması Ülke İçin Ciddi Sorun
Suriye Ordusu YPG/SDG Takviyelerine Sert Yanıt Verdi
Suriye Ordusu YPG/SDG Takviyelerine Sert Yanıt Verdi
Suriye Ordusu Şeyh Maksud Mahallesi’ni Kontrol Altına Aldı
Suriye Ordusu Şeyh Maksud Mahallesi’ni Kontrol Altına Aldı
İsrail, Ateşkes Anlaşmasını İhlal Ediyor
İsrail, Ateşkes Anlaşmasını İhlal Ediyor
Von der Leyen ve Costa, Suriye Cumhurbaşkanı ile Görüştü
Von der Leyen ve Costa, Suriye Cumhurbaşkanı ile Görüştü
Vance ve X Şirketi, Minneapolis’te ICE Birimleri Tarafından Vurulan Kadın Olayı Hakkında Açıklamalarda Bulundu
Vance ve X Şirketi, Minneapolis’te ICE Birimleri Tarafından Vurulan Kadın Olayı Hakkında Açıklamalarda Bulundu
Ek Haber Doğru Adretesiniz

Reklam & İşbirliği: [email protected]

Copyright © 2025 Tüm hakları EK HABER 'de saklıdır. Seobaz Haber Teması