
Stability AI, akıllı telefonlarda çalışacak kadar hafif ve hızlı olduğunu iddia ettiği yeni ses üretim modeli Stable Audio Open Small’u tanıttı. Arm iş birliğiyle geliştirilen bu model, mobil cihazlarda yalnızca 8 saniyeden kısa sürede 11 saniyelik stereo ses üretebiliyor. Özellikle kısa ses efektleri ve örnekleri üretmek için optimize edilen Stable Audio Open Small, piyasadaki rakiplerinden farklı olarak çevrim dışı çalışabiliyor.
Suno ve Udio gibi benzer yapay zeka tabanlı ses üretim araçları yalnızca bulut ortamında hizmet sunarken, Stable Audio Open Small mobil cihazlar üzerinde bağımsız olarak çalışabiliyor. Ayrıca modelin eğitiminde yalnızca telifsiz müzik arşivleri kullanılmış; Free Music Archive ve Freesound gibi kaynaklardan alınan verilerle geliştirildiği için telif hakkı ihlali riski taşımıyor.
Toplam 341 milyon parametreye sahip olan bu yapay zeka modeli, Arm CPU’ları için özel olarak optimize edildi. Bununla birlikte, yalnızca İngilizce komutları anlayabiliyor, gerçekçi vokal ve yüksek kaliteli müzik üretimi konusunda sınırlı bir performans sergiliyor. Eğitim verisinin çoğunlukla Batı müziğine dayanması da, modelin farklı müzik türlerinde tutarsız sonuçlar vermesine yol açabiliyor.
Arm’ın KleidiAI teknolojisi ile desteklenen model, Mobile World Congress etkinliğinde gerçek zamanlı ses üretim yetenekleriyle tanıtılmıştı. Şimdi ise Stability AI ve Arm, Stable Audio Open Small’u geliştiricilere açık hale getirerek daha geniş bir kullanıcı kitlesine sunmayı hedefliyor.