Dünya OpenAI’ın Sora’sının piyasaya sürülmesini beklerken Çin’de TikTok’un rakip şirketi Kuaishou, son derece güçlü bir yapay zekâ modeliyle hamle yaparak ”Kling” i tanıttı. Rakibi Sora‘dan çok daha iyi olduğu söylenen ”Kling” gerçekliğe yakınlık konusunda gördüklerimizi sorgulatacak kadar mükemmel çalşıyor.
Kling, basit komutlara karşılık 1080p kalitesinde, 30 fps’de 2 dakikalık videolar üretebiliyor ve en çarpıcı özelliği, gerçek dünyanın fiziksel özelliklerini doğru bir şekilde simüle edebilmesi. Sora’da da 1920x1080p’den 1080x1920p’ye kadar çeşitli boyutlarda ve çözünürlüklerde görüntüler üretebilirsiniz; ancak videolarınız 60 saniyeyi malesef geçemiyor. Üstelik Sora, neden-sonuç ilişkisini anlamakta zorlanarak videoların gerçekçiliğini bozan bazı aksaklıklara da neden olabiliyor.
Kling, metinsel istemleri zengin ve canlı sahnelere dönüştürürken ”Difüzyon Transformatörü” mimarisinden yararlanıyor. Derin öğrenme modelleri sınıfında yer alan bir tür yapay sinir ağı olan tescilli bir 3B VAE (Variational Auto Encoder) ve değişken çözünürlük eğitimi aracılığıyla çeşitli en-boy oranları desteği sunuyor. Ayrıca Kling, tek bir tam vücut fotoğrafından tam ifade ve uzuv hareketine olanak tanıyan gelişmiş bir 3B yüz ve vücut yeniden yapılandırma teknolojisine sahip.
Sora ve Kling piyasayı uzun bir süre domine edecek gibi ancak kullanıcıların hangisini benimseyeceği şimdiden merak konusu.