
Fransız yapay zeka girişimi Mistral, sesli komutlarla çalışan ilk açık kaynak ses modeli Voxtral’i tanıttı. Hem bulut hem de uç cihazlarda kullanılabilen model, konuşmaları yazıya dökmekle kalmıyor; özet çıkarma, soru-cevap ve API tetikleme gibi gelişmiş görevleri de yerine getirebiliyor.
İki farklı sürümle sunulan Voxtral, 24 milyar parametreli Voxtral Small ile yüksek doğruluk sağlarken; 3 milyar parametreli Voxtral Mini, kaynakları sınırlı sistemlere uygun şekilde tasarlandı. Her iki model de İngilizce başta olmak üzere Fransızca, Almanca, İtalyanca, İspanyolca, Portekizce, Hollandaca ve Hintçe gibi dillerde etkili çalışıyor.
Mistral, Voxtral’i hem açık kaynak olarak Hugging Face’te paylaştı hem de API üzerinden erişime açtı. Ayrıca, transkripsiyona özel daha hafif bir sürüm olan Voxtral Mini Transcribe, düşük maliyetli alternatif arayan geliştiricilere sunuluyor.
Şirket, bu ses modelini dil modeli Mistral Small 3.1 ile birleştirerek sesli girdileri sadece metne değil, anlamlı iş akışlarına dönüştürmeyi hedefliyor. Voxtral, Mistral’in sohbet botu Le Chat üzerinde de denenebiliyor.
Mistral, 6 Ağustos’ta Inworld ile düzenleyeceği etkinlikte Voxtral’in yeteneklerini canlı demolarla sergileyecek.