Anthropic’in Claude Mythos Preview ve OpenAI’ın GPT-5.5 modelleri, otonom siber güvenlik görevlerinde mevcut yetenek tahminlerini aşan performanslar sergiledi. Birleşik Krallık Yapay Zeka Güvenlik Enstitüsü (AISI) ve Palo Alto Networks’ün Çarşamba günü yayımladığı ayrı raporlar, her iki modelin yapay zekanın siber alandaki ilerleyiş hızına ilişkin tüm öngörüleri geride bıraktığını ortaya koydu.
Sınır Modelleri Tüm Tahminleri Aştı
AISI, 2024 sonlarından bu yana yapay zekanın siber görevlerdeki otonom yetkinliğini izlemektedir. Enstitü, 2026 Şubat’ında sınır modellerinin yüzde 80 güvenilirlik eşiğindeki siber görev kapasitesinin yaklaşık 4,7 ayda ikiye katlandığını tahmin etmişti. Bu rakam, Kasım 2025’teki sekiz aylık öngörüden zaten belirgin biçimde düşüktü. Ancak Mythos Preview ve GPT-5.5’in sonuçları, her iki trend çizgisini de geçersiz kıldı.
AISI’nin siber tatbikat ortamlarında gerçekleştirdiği testler, en çarpıcı sonuçları ortaya koydu. “The Last Ones” adlı 32 adımlı kurumsal ağ saldırısı simülasyonu, bir insan uzmanın yaklaşık 20 saat harcayacağı karmaşıklıkta tasarlanmıştı. Mythos Preview’in güncellenmiş kontrol noktası bu senaryoyu 10 denemenin 6’sında başarıyla tamamladı. Aynı model, “Cooling Tower” senaryosunu ise 10 denemenin 3’ünde çözdü. GPT-5.5, “The Last Ones” görevini 10 denemenin 3’ünde geçti. Bu sonuçlar, herhangi bir yapay zeka modelinin ilk kez AISI’nin her iki görev aralığını da tamamlaması anlamına gelmektedir.
Uzman Düzeyinde Performans Karşılaştırması
AISI, 95 adet dar kapsamlı siber görevden oluşan bir değerlendirme paketi kullanmaktadır. Bu görevler dört zorluk seviyesinde sınıflandırılmış olup, güvenlik açığı araştırmasından istismar tekniklerine kadar geniş bir yelpazede gerçekçi hedeflere yönelik testler içermektedir.
Uzman düzeyindeki görevlerde GPT-5.5, yüzde 71,4 ortalama başarı oranıyla en güçlü sonucu üretti. Mythos Preview yüzde 68,6 ile hemen arkasından geldi. Karşılaştırma olarak, GPT-5.4 yüzde 52,4 ve Opus 4.7 yüzde 48,6 seviyesinde kaldı. Nisan 2025’ten önce hiçbir modelin uzman düzeyindeki görevleri tamamlayamadığı düşünüldüğünde, bir yılda yaşanan ilerlemenin boyutu daha net anlaşılmaktadır.
Özellikle dikkat çeken bir test sonucu, GPT-5.5’in karmaşık bir tersine mühendislik görevini 10 dakika 22 saniyede ve yalnızca 1,73 dolar API maliyetiyle tamamlamasıydı. Aynı görevin bir insan uzman tarafından yaklaşık 12 saatte çözülebileceği tahmin edilmektedir. Bu maliyet rakamı, siber güvenlik ekonomisinin temellerini sarsan bir veridir.
Palo Alto Networks’ten “Vulnpocalypse” Uyarısı
Palo Alto Networks, kendi bağımsız testleriyle benzer bulgulara ulaştığını açıkladı. Şirket, geçen ay boyunca 130’dan fazla ürününü yapay zeka destekli güvenlik taramasından geçirdi ve normal aylık ortalamanın yedi katını aşan 75 gerçek güvenlik açığı tespit etti. Tüm açıklar yamalandı.
Şirketin teknoloji direktörü Lee Klarich, kurumların rakiplerinin benzer yetenekler kazanmasından önce üç ila beş aylık dar bir zaman penceresiyle karşı karşıya olduğunu ifade etti. Bu uyarı, yapay zeka destekli siber saldırı kapasitesinin savunma tarafından daha hızlı gelişebileceğine yönelik endişeleri yansıtmaktadır.
İkiye Katlanma Süresi Kısalıyor
Son 18 ayda yapay zekanın siber yetkinliklerindeki ilerleme hızı keskin biçimde yükselmiştir. AISI, ikiye katlanma süresini Kasım 2025’te sekiz ay olarak hesaplamış, 2026 Şubat’ında 4,7 aya düşürmüş ve Mythos Preview ile GPT-5.5 sonuçlarının ardından bu süreyi yeniden kısaltmıştır. Güncel hesaplama artık yaklaşık dört aya yakın durmaktadır.
Yazılım mühendisliği görevlerinde yapay zekayı izleyen bağımsız araştırma kuruluşu METR, neredeyse aynı rakama ulaşarak bu eğilimi doğrulamıştır. METR, Claude Mythos’un yeteneklerini mevcut ölçüm araçlarıyla değerlendirmenin zorlaştığını belirterek, modelin kapasitesinin ölçüm altyapısının ötesine geçtiğine işaret etmiştir.
AISI, bulgulara yönelik bazı kısıtlamaları da belirtmiştir. Örneklem büyüklüğünün hâlâ küçük olduğu ve en zor görevler için sınırlı insan karşılaştırma verisi bulunduğu vurgulanmıştır. Buna rağmen enstitü, analizden tek bir modelin çıkarılmasının bile ikiye katlanma tahminini bir aydan az etkileyeceğini açıklamıştır. Bu sonuçların izole bir yetenek sıçramasını mı yoksa yeni ve daha hızlı bir trendin başlangıcını mı temsil ettiği henüz netlik kazanmamıştır.
Sınırlı Erişim ve Stratejik Dağıtım
Anthropic, Mythos’un erken sürümünü Nisan 2026’daki ilk dağıtımında sınırlı bir grupla paylaştı. Palo Alto Networks, CrowdStrike, Amazon, Apple ve JPMorgan bu grubun öne gelen isimleri arasındaydı. Anthropic, Mythos’u şimdiye kadar geliştirdiği en güçlü yapay zeka modeli olarak tanımlarken, modelin dağıtımını açıkça kısıtlayan ilk ürünü olma özelliğini de vurguladı.
OpenAI, buna karşılık GPT-5.5-Cyber modelini ve Daybreak adlı siber güvenlik girişimini duyurdu. OpenAI da daha önce GPT-5.4-Cyber modelini 15 Nisan’da yalnızca davetiye usulüyle erişime açmıştı. Her iki şirketin de gelişmiş siber modelleri ayrı bir dağıtım sınıfında ele alması ve erişimi sınırlandırması, bu teknolojilerin taşıdığı riskin ciddiyetini ortaya koymaktadır.
Siber Güvenlik Ekonomisi İçin Sonuçlar
Bu gelişmeler, siber güvenlik sektörünün ekonomik denklemini temelden değiştirme potansiyeli taşımaktadır. Bir uzmanın 12 saatlik çalışmasının 1,73 dolara sıkıştırılması, yalnızca bir görevi hızlandırmak değil; o görevi kimin yapabileceğini değiştirmek anlamına gelmektedir. Savunma tarafında devasa verimlilik artışı sağlarken, saldırı tarafında da aynı yeteneklerin erişilebilir hale gelmesi çift yönlü bir risk oluşturmaktadır.
AISI, yapay zekanın otonom siber kapasitesinin aylar içerisinde ikiye katlandığını ve bu hızın yıllar değil aylar mertebesinde olduğunu açıkça ifade etmiştir. Bu ilerleme hızı, kurumların güvenlik stratejilerini ve yama döngülerini yeniden değerlendirmelerini zorunlu kılmaktadır.
Not: Bu makale bilgilendirme amaçlıdır ve yatırım tavsiyesi niteliği taşımamaktadır.

