Yapay zeka dünyasında “en iyi” sıralaması sürekli değişse de değişmeyen tek şey gelişimin kendisi oluyor. Zira Anthropic, Claude Opus 4.5 adlı yeni üst seviye modelini tanıtarak özellikle yazılım geliştirme, ajan sistemleri ve bilgisayar kullanımına odaklanan kapsamlı bir güncelleme sundu. Şirket, modelin bu alanlarda şimdiye kadarki en güçlü performansı sergilediğini ve önceki sürümlerin ötesine geçen bir teknik kapasiteye ulaştığını belirtiyor.
“En iyi” yarışı hız kesmeden sürüyor
Yeni model, özellikle yazılım odaklı değerlendirmelerde öne çıkıyor. SWE-Bench Verified testinde yüzde 80,9 ile şimdiye kadar ulaşılmış en yüksek skora imza atan Opus 4.5, böylece hem Gemini 3.0 hem de GPT‑5.1‑Codex‑Max modellerinin üzerine çıkmış durumda. Şirket ayrıca modelin yalnızca sentetik testlerde değil, gerçek dünyaya yönelik işler olan derin araştırma, slayt düzenleme ve elektronik tablo işleme gibi alanlarda da belirgin bir iyileşme gösterdiğini vurguluyor.
Model, Terminal-bench, araç kullanımı testleri tau2-bench ve MCP Atlas, genel problem çözme alanındaki ARC-AGI 2 ve GPQA Diamond testlerinde de üstün performans sergiliyor. Anthropic ayrıca modelin bilgisayar kullanımı ve elektronik tablo yeteneklerini vurguladı ve bu özellikleri göstermek için paralel ürünler geliştirdi. Bilindiği üzere Claude for Chrome ve Claude for Excel ürünleri, daha önce pilot olarak sunulmuştu. Opus 4.5 ile birlikte bu ürünler daha geniş kullanıcı kitlesine açılacak. Chrome uzantısı tüm Max kullanıcılarına sunulacak, Excel odaklı model ise Max, Team ve Enterprise kullanıcılarının erişimine açık olacak. Opus 4.5, uzun bağlamlı işlemler için hafıza yönetiminde de önemli geliştirmeler içeriyor. Modelin hafıza yönetiminde yapılan bu değişiklikler, uzun sohbetlerde veya karmaşık görevlerde verimliliği artırıyor.
Şirket, Opus 4.5’in yalnızca yeteneklerini değil, güvenlik çerçevesini de genişlettiğini belirtiyor. Yeni sürümün kullanım politikalarına aykırı kötü niyetli komutları ayırt etme konusunda önceki sürümlerden çok daha dirençli olduğu ifade ediliyor. Opus 4.5, yakın zamanda piyasaya çıkan diğer ileri seviye modellerle ciddi rekabet yaşayacak. Bunlar arasında OpenAI’ın GPT-5.1 (12 Kasım’da çıkmış) ve Google’ın Gemini 3 (18 Kasım’da çıkmış) modelleri öne çıkıyor.
https://www.youtube.com/embed/2MJDdzSXL74
Kaynak : https://www.donanimhaber.com/gemini-3-un-kralligi-kisa-surdu-claude-opus-4-5-tanitildi–198962



