Apple, kullanıcıların bir fotoğrafta neyi değiştirmek istediklerini metinsel komut vererek düzenlemelerine olanak tanıyan yeni bir model geliştirdi. Apple’ın Santa Barbara’daki California Üniversitesi ile birlikte çalıştığı MGIE modeli, metin komutları aracılığıyla görselleri kırpabiliyor, yeniden boyutlandırabiliyor, çevirebiliyor ve filtreler ekleyebiliyor.
MGIE, bir fotoğraftaki belirli nesneleri farklı bir şekle sokmak veya daha parlak hale getirmek gibi basit ve karmaşık görüntü düzenleme görevlerine uygulayabiliyor. MGIE, çok modlu dil modellerinin iki farklı kullanımını harmanlıyor. İlk olarak kullanıcı istemlerini yorumlar, ardından düzenlemenin nasıl görüneceğini imgeliyor.
MGIE’nin çok yönlü tasarımı her türlü görüntü düzenleme kullanım senaryosunu destekliyor. Kırpma, döndürme ve filtreleme gibi yaygın Photoshop ayarlamalarını gerçekleştirebilir. Model aynı zamanda daha gelişmiş nesne manipülasyonları, arka plan değiştirme ve fotoğraf birleştirme işlemlerini de gerçekleştiriyor. MGIE, parlaklık ve kontrast gibi özellikleri ayarlayarak görüntüleri global olarak optimize eder. Aynı şekilde belirli bölgeler ve nesneler üzerinde yerelleştirilmiş düzenlemeler de gerçekleştirir. Sistem şekil, boyut, renk, doku ve stil gibi görsel nitelikleri değiştirebilir.
Apple, MGIE’yi GitHub üzerinden indirilebilir hale getirdi. Aynı zamanda Hugging Face Spaces’ta araçla ilgili bir web demosu da yayınladı.