Google, açık ağırlıklı Gemma 3 modeli üzerine inşa edilen yeni çeviri modeli ailesi TranslateGemma’yı duyurdu. TranslateGemma, aralarında Türkçe, İngilizce, İspanyolca, Fransızca, Çince ve Hintçe gibi yaygın dillerin de bulunduğu 55 farklı dili destekliyor. Bu geniş dil yelpazesi modeli hem geliştiriciler hem de çok dilli uygulamalar için dikkat çekici hale getiriyor.
Google’ın duyurusunun zamanlaması ise dikkat çekici. Zira bir gün önce OpenAI, sessiz sedasız ChatGPT Translate özelliğini kullanıma almıştı. ChatGPT Translate, kelime kelime çeviriden ziyade bağlam ve ton doğruluğuna odaklanan bir yaklaşım sunuyor. Ancak yaptığım denemelerde ciddi eksiklikleri olduğunu tespit ettim. Zira bir çeviri aracından çok çeviri görünüme sokulmuş sohbet robotu gibi davranıyor. Aşağıdaki haberde bahsettiğim ciddi sorunu görebilirsiniz.
3 farklı sürüme sahip
Öte yandan TranslateGemma ise daha çok model mimarisi ve performans verimliliği üzerinden konumlanıyor. TranslateGemma, 4B, 12B ve 27B parametre olmak üzere üç farklı sürümle sunuluyor. Google’ın paylaştığı teknik verilere göre 12B parametreli model, WMT24++ benchmark testlerinde, temel alınan Gemma 3 27B modelinden daha yüksek performans sergiliyor.
Google, 4B modelin mobil cihazlarda çıkarım (inference) için optimize edildiğini, 12B modelin ise tüketici sınıfı dizüstü bilgisayarlar için uygun olduğunu belirtiyor. En büyük model olan 27B sürümü ise daha yüksek donanım gereksinimlerine sahip ve bulut ortamında tek bir NVIDIA H100 gibi güçlü bir GPU ile çalıştırılması öneriliyor. TranslateGemma’nın yetenekleri yalnızca metinle sınırlı değil. Vistra görüntü çeviri benchmark testlerinde yapılan değerlendirmeler, modelin görüntüler içindeki metinleri çevirme konusunda da başarılı olduğunu ortaya koyuyor. Google, bunun için ince ayarlar yapmadığını söylüyor.
Eğitimde Gemini detayı
Bununla birlikte şirket, TranslateGemma’daki bu yüksek “zeka yoğunluğunun” arkasında iki aşamalı özel bir eğitim süreci bulunduğunu açıkladı. İlk aşamada, Denetimli İnce Ayar (Supervised Fine-Tuning) yöntemi kullanıldı. Bu süreçte Gemma 3 modelleri, hem insan çevirmenler tarafından hazırlanmış metinlerle hem de Gemini modelleri tarafından üretilmiş yüksek kaliteli sentetik verilerle eğitildi. İkinci aşamada ise Pekiştirmeli Öğrenme (Reinforcement Learning) devreye alındı. Bu aşamada MetricX-QE ve AutoMQM gibi gelişmiş ölçüm sistemlerini içeren birden fazla ödül modeli, çevirilerin daha doğal, akıcı ve bağlama uygun hale gelmesi için kullanıldı.
Nasıl kullanılır?
TranslateGemma modelleri, denemek veya kendi projelerinde kullanmak isteyenler için Kaggle ve Hugging Face platformları üzerinden indirilebilir durumda. Ayrıca Gemma Cookbook aracılığıyla keşfedilebiliyor ve Vertex AI üzerinden dağıtıma alınabiliyor.
Kaynak : https://www.donanimhaber.com/google-yeni-ceviri-ailesi-translategemma-yi-tanitti–200940



