Anthropic tarafından geliştirilen Claude Mythos, siber güvenlik dünyasında bir dönüm noktasına imza atarak, simüle edilmiş bir kurumsal ağ saldırısını otonom bir şekilde baştan sona tamamlayan ilk yapay zekâ modeli oldu. Birleşik Krallık Yapay Zekâ Güvenliği Enstitüsü (AISI) tarafından paylaşılan verilere göre bu model, uzmanlık gerektiren karmaşık siber güvenlik görevlerinin %73’ünü başarıyla yerine getirdi.
AISI’den Çarpıcı Test Sonuçları
Birleşik Krallık Bilim, Yenilik ve Teknoloji Bakanlığı’na bağlı olan AISI, Anthropic’in 7 Nisan’daki duyurusunun ardından Claude Mythos üzerinde kapsamlı testler yürüttü. Şirket, modelin barındırdığı yüksek riskli yetenekler nedeniyle onu genel kullanıma açmak yerine, erişimi yalnızca belirli güvenlik araştırma firmalarıyla sınırlandırdı.
Bayrağı Yakala (CTF) değerlendirmelerinde %73 gibi rekor bir başarı oranına ulaşan model, özellikle insan uzmanların bile yaklaşık 20 saatini alan “The Last Ones” adlı 32 adımlı saldırı simülasyonunda rüştünü ispatladı. Claude Mythos, bu zorlu süreci 10 denemenin 3’ünde tamamlarken, adım ortalamasında da önceki lider model olan Claude Opus 4.6’yı geride bıraktı.
Sıfır-Gün Açıkları ve Küresel Yankılar
Anthropic’in “red team” (saldırı) ekibi tarafından yapılan incelemeler, Mythos’un tüm yaygın işletim sistemleri ve tarayıcılarda henüz keşfedilmemiş (sıfır-gün) güvenlik açıklarını bulup kullanabildiğini gösterdi. Şirket yetkilileri, modelin tespit ettiği açıkların neredeyse tamamının hâlâ savunmasız durumda olduğunu belirterek, bu detayları kamuoyuyla paylaşmanın sorumsuzca olacağını ifade etti.
Modelin bu kapasitesi, ekonomi ve finans dünyasında da alarm zillerinin çalmasına neden oldu. Reuters’ın haberine göre, ABD Hazine Bakanı Scott Bessent ve Fed Başkanı Jerome Powell, büyük bankaların CEO’larıyla bir araya gelerek yapay zekâ kaynaklı siber risklere karşı alınacak önlemleri görüştü.
Güvenlik Odaklı Yanıt: Project Glasswing
Anthropic, saldırı kapasitesiyle korkutan bu modeli dizginlemek ve savunma amacıyla kullanmak için Project Glasswing girişimini hayata geçirdi. Bu proje ile Claude Mythos’un, kritik yazılımları korumak ve yapay zekâ destekli saldırılara karşı kalkan oluşturmak için kullanılması planlanıyor.
Uzmanlar, yapay zekânın siber saldırılarda yeni bir çağ başlattığı konusunda hemfikir. Bu süreçte kurumlara; sistemlerini düzenli olarak yamalamaları, erişim kontrollerini sıkılaştırmaları ve ağ hareketlerini kapsamlı bir şekilde izlemeleri tavsiye ediliyor.


