Çinli teknoloji devinden çapıcı yapay zeka tespiti: Bağlamı anlamıyorlar

featured
service
Paylaş

Bu Yazıyı Paylaş

veya linki kopyala

Yapay zeka alanında son yıllarda kaydedilen hızlı ilerlemeye rağmen, güncel üst seviye modellerin karmaşık ve düzensiz gerçek dünya koşullarında halen kırılgan olduğu ortaya kondu. Çinli teknoloji devi Tencent tarafından yayımlanan yeni bir teknik makale, yapay zeka sistemlerinin bağlamdan öğrenme konusunda ciddi sınırlamalar taşıdığını ve bu durumun pratik kullanımı doğrudan etkilediğini vurguluyor.

İnsanlar anında öğreniyor, modeller hatırlamaya çalışıyor

Araştırmacılar, gelecekte yapay zeka modellerinin kontrollü ortamların dışına çıkabilmesi için “bağlam öğrenmenin” model tasarımının merkezine yerleştirilmesi gerektiğini savunuyor. Araştırmacılara göre mevcut sistemler, gerekli bilgilere erişebilmelerine rağmen bağlamı doğru şekilde yorumlayamadıkları için görevleri tutarlı biçimde yerine getiremiyor.

Çalışmada, insanlarla yapay zekalar arasındaki temel fark günlük örneklerle açıklanıyor. Bir yazılımcının daha önce görmediği bir araç için dokümantasyonu hızla tarayıp hata ayıklamaya başlaması, bir oyuncunun yeni bir oyunu kural kitabını okuyarak oynaya oynaya öğrenmesi ya da bir bilim insanının yüzlerce deney kaydını inceleyerek yeni bir ilişki keşfetmesi bu farkın somut örnekleri olarak gösteriliyor.

Tencent’e göre insanlar bu süreçlerde geçmişte ezberlenmiş sabit bilgiye değil, o anda karşılarına çıkan bağlama dayanarak öğreniyor. Buna karşın mevcut büyük dil modelleri, ağırlıklı olarak ön eğitim sırasında parametrelerine gömülmüş bilgiyi geri çağırıyor. Çıkarım aşamasında ise yeni bilgiyi aktif biçimde öğrenmek yerine, statik iç belleğine yaslanıyor.

Araştırmada bu durum, “yapısal bir uyumsuzluk” olarak tanımlanıyor. Modeller, bildikleri şeyler üzerinden akıl yürütmek için optimize edilmiş durumda. Oysa kullanıcılar, sürekli değişen ve dağınık bağlamlara bağlı problemleri çözebilen sistemlere ihtiyaç duyuyor.

Bağlam öğrenmeyi ölçmek için yeni standart geliştirildi

Bu sorunu ölçmek amacıyla Tencent araştırma ekibi, CL-bench adı verilen yeni bir değerlendirme kriteri geliştirdi. Toplam 19 önde gelen yapay zeka modeli, 500 karmaşık bağlam, 1.899 görev ve 31.607 doğrulama kriteri üzerinden test edildi. Bu görevler, modellerin “iş başında” öğrenme yeteneğini, yani verilen bağlamdan anlam çıkararak yeni durumlara uyum sağlama becerisini ölçmeyi hedefliyor.

CL-bench, klasik bilgi sorularına dayanan kıyaslamalardan farklı olarak her görevin kendi bağlamını modele sunuyor. Bu yaklaşım temelde insanların öğrenme biçimine daha yakın. Ek olarak bunu sürekli öğrenme modelleriyle de karıştırmamak gerek. Birisinde model, kendi ağırlıklarını sürekli güncellerken bağlan öğrenmede temel parametreler değişmeden kalıyor.

Ortalama başarı yüzde 17

Test sonuçları ise yapay zekaların gerçek dünya karmaşıklığında nasıl da kaybolduğunu net biçimde ortaya koyuyor. Zira ilk 10 sıradaki modellerin CL-bench üzerindeki ortalama başarısı yalnızca yüzde 17,2 olarak ölçüldü. Çalışmada, güncel modellerin henüz güvenilir bağlam öğreniciler olmaktan uzak olduğu vurgulanıyor.

Öte yandan en yüksek puanı yüzde 23,7 ile OpenAI’ın GPT-5.1 modeli alırken, onu yüzde 21,1 ile Anthropic’in Claude Opus 4.5 modeli izledi. Çin merkezli modeller arasında en iyi performans, Moonshot AI’ın Kimi K2 modeliyle beşinci sırada ve yüzde 17,6 seviyesinde gerçekleşti. Tencent’in kendi modeli Hunyuan 2.0, yüzde 17,2 skorla altıncı sırada yer aldı.

Ancak yukarıda saydıklarımız “iyi” istatistikler. En başarılı olan GPT-5.1 modeli bile hiçbir bağlam verilmediğinde görevlerin yüzde 1’inden daha azını çözebildi.

Araştırma, bağlam öğrenmenin gelişmesi halinde insan-yapay zeka ilişkisinin de değişeceğini öngörüyor. Buna göre insanlar, modele veri sağlayan aktörler olmaktan çıkıp, en doğru ve zengin bağlamı tasarlayan “bağlam sağlayıcılara” dönüşebilir.

Ancak burada kritik bir sorun var. Tencent’e göre bağlam öğrenme geçici bir süreç. Model, bağlam penceresi kapandığında öğrendiklerini unutuyor. Asıl büyük soru ise şu: Bağlamdan edinilen bilgi nasıl kalıcı hale getirilebilir? Bu yalnızca olguları değil, becerileri, deneyimi ve kalıpları da kapsayan daha derin bir öğrenme anlamına geliyor.

Bu arada CL-Bench’e GitHub veya Hugging Face ulaşabilirsiniz.

Kaynak : https://www.donanimhaber.com/cinli-teknoloji-devinden-yapay-zeka-tespiti-baglami-anlamiyorlar–201793

0
mutlu
Mutlu
0
_zg_n
Üzgün
0
sinirli
Sinirli
0
_a_rm_
Şaşırmış
0
vir_sl_
Virüslü
Çinli teknoloji devinden çapıcı yapay zeka tespiti: Bağlamı anlamıyorlar

Tamamen Ücretsiz Olarak Bültenimize Abone Olabilirsin

Yeni haberlerden haberdar olmak için fırsatı kaçırma ve ücretsiz e-posta aboneliğini hemen başlat.

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Giriş Yap

Kamu Haberleri ayrıcalıklarından yararlanmak için hemen giriş yapın veya hesap oluşturun, üstelik tamamen ücretsiz!

Bizi Takip Edin