Meta’nın en son yapay zekâ çıktısı, gerçek zamanlı metin ve konuşma çevirisi için büyük bir ilerleme ortaya koydu. Hatta geçtiğimiz hafta şirket, metni konuşmaya ve metni konuşmaya çeviren çok modlu bir model olan SeamlessM4T’yi piyasaya sürdü. Meta, SeamlessM4T’nin “ilk hepsi bir arada, çok dilli, çok modlu yapay zekâ çeviri ve transkripsiyon modeli” olduğunu, yani dilleri aynı anda benzersiz bir şekilde çevirip yazıya dökebildiğini iddia ediyor. SeamlessM4T, 100 dile kadar konuşmadan metne, konuşmadan konuşmaya, metinden konuşmaya ve metinden metne girişleri çevirebiliyor. Konuşmadan konuşmaya ve metinden konuşmaya çeviri çıktıları için çeviriler 35 dili destekleyecek şekilde tasarlandı.
Llama 2 ve AudioCraft da dahil olmak üzere Meta tarafından yakın zamanda piyasaya sürülen diğer AI modelleri gibi SeamlessM4T de araştırma lisansına sahip araştırmacılar ve geliştiricilerin kullanımına açık. Modelin yanı sıra Meta, 270.000 saatlik konuşma ve metin hizalamalarına sahip olan SeamlessAlign adlı eğitim veri setini de yayınlıyor. OpenAI ve Google’ın aksine Meta, modellerini açık kaynaklı ve kamuya açık hale getirmeye özen gösteren bir marka. Meta’nın açık kaynaklı modeller başlatma yaklaşımı, geliştiricilerin ürünleri oluşturmasına ve geliştirmesine olanak tanırken, aynı zamanda üretken yapay zekâ sistemlerinin şeffaflığını isteyen yapay zekâ etik uzmanları arasında puan kazanma gibi ikili bir etkiye sahip.
Meta’nın açık kaynak yaklaşımı fedakâr görünüyor değil mi? Ancak bu, yapay zekâ geliştiren diğer büyük teknoloji şirketlerine karşı acımasızca rekabet eden bir pazarda stratejik bir güç hamlesi. Ayrıca tüm yapay zekâ modellerinin uğraşması gereken veri toplama sorunu da var. Blog gönderisine göre, SeamlessM4T’nin veri seti (SeamlessAlign) kamuya açık verilerden oluşuyor ve telif hakkıyla korunan eserlerin ve kişisel verilerin izinsiz kullanılmasıyla ilgili etik ve yasal sorunlar var.
Meta’nın duyurusu, SeamlessM4T için özel planların ayrıntılarını vermedi. Yalnızca “bu temel modelin yeni iletişim yeteneklerini nasıl mümkün kılabileceğini keşfetmek” istediğini ima etti. Başka bir deyişle, bir gün WhatsApp veya Instagram’da SeamlessM4T’nin tüketiciye yönelik bir versiyonunu görebiliriz.