Çinli araştırmacılar, yapay zeka destekli video üretiminde hız ve maliyet dengesini kökten değiştirmesi beklenen TurboDiffusion adlı yeni bir teknik geliştirdi. Kısa süre önce yayımlanan akademik çalışmaya göre TurboDiffusion, görüntü kalitesinden ödün vermeden video üretim sürecini ölçekli kullanımda 200 kata kadar hızlandırabiliyor.
Araştırma, Pekin’deki Tsinghua Üniversitesi, yapay zekâ modeli geliştiricisi Shengshu Technology ve Kaliforniya Üniversitesi Berkeley bünyesindeki uzmanların ortak çalışmasıyla hazırlandı. Çalışmada, TurboDiffusion’ın performansı tüketici sınıfı bir sistem üzerinde test edildi. Nvidia’nın RTX 5090’ın kullanıldığı bu testlerde, standart çözünürlükte beş saniyelik bir video klibin üretim süresi 3 dakikadan 1,9 saniyeye düşürüldü. Bu sonuç, yaklaşık 100 katlık bir hız artışına karşılık geliyor.
Video üretiminde 200 kata varan hızlanma
Aynı donanım üzerinde gerçekleştirilen bir başka deneyde ise yüksek çözünürlüklü, beş saniyelik bir videonun üretim süresi neredeyse 80 dakikadan 24 saniyeye indirildi. Bu da TurboDiffusion’ın bazı senaryolarda 200 kata yaklaşan bir hız kazancı sağlayabildiğini ortaya koyuyor. OpenAI’ın metinden videoya dönüştürme modeli Sora, kısa klipler oluşturmak için birkaç dakikaya ihtiyaç duyuyor. Diğer benzer platformlarda da video üretimi üç-beş dakika sürebiliyor.
Araştırmacılar, elde edilen bu çarpıcı hızlanmayı model eğitimi alanındaki yeniliklere bağlıyor. TurboDiffusion’da kullanılan ‘seyrek doğrusal dikkat mekanizması’ (sparse linear attention) yaklaşımı, yapay zeka modelinin tüm veriyi aynı anda işlemek yerine yalnızca en kritik bölümlere odaklanmasını sağlıyor. Bu yöntem, hem işlem süresini hem de hesaplama maliyetlerini ciddi ölçüde azaltıyor.
Gerçek zamanlı video üretimine geçiş
Sektör analisti Kyon Xu, video üretimindeki bu hızlanmanın büyük bir paradigma değişimine işaret ettiğini belirterek, yapay zeka video modellerinin artık üretim sürecinde bir darboğaz olmaktan çıkacağını vurguluyor. Yapay zekanın farklı sektörlerde adil ve kapsayıcı biçimde yaygınlaşmasını hedefleyen AI Native Foundation da TurboDiffusion’a dikkat çekti. Vakıf, X platformunda yaptığı paylaşımda bu tekniğin “anında üretim” noktasına geçişi simgelediğini ve gerçek zamanlı yapay zeka video uygulamalarının önünü açtığını ifade etti. Açıklamaya göre TurboDiffusion, şirketlerin daha düşük maliyetle, daha hızlı iterasyonlarla ticari ölçekte video üretmesini mümkün kılacak. Daha da güzel olan ise TurboDiffusion’ın tamamen açık kaynak olarak GitHub üzerinden paylaşılması.
Kaynak : https://www.donanimhaber.com/cinlilerden-yapay-zekada-cigir-acan-video-uretim-teknigi–200257



