Microsoft telah meluncurkan MAI-Image-1, jaringan saraf miliknya sendiri untuk menghasilkan gambar dari deskripsi teks. Dikembangkan sepenuhnya di dalam perusahaan, model ini berhasil masuk ke sepuluh besar di papan peringkat publik LMArena dalam waktu kurang dari 24 jam. Platform ini memungkinkan pengguna untuk membandingkan kemampuan berbagai algoritma AI secara langsung.
Tidak seperti banyak solusi yang ada, MAI-Image-1 dirancang dengan masukan dari desainer dan seniman profesional. Para pengembangnya mengatakan bahwa tujuan utama adalah untuk mengatasi jebakan umum AI, seperti kecenderungan untuk bergantung pada pola berulang dan menghasilkan visual yang terlihat generik.
Menurut Microsoft, kekuatan utama model ini adalah kecepatan pemrosesan yang tinggi dan kemampuannya untuk secara akurat menggambarkan elemen kompleks seperti permainan cahaya, refleksi, dan detail lanskap yang rumit. Ini memungkinkan visualisasi ide yang lebih cepat dan memberikan pengguna berbagai pilihan berkualitas tinggi untuk lebih disempurnakan dalam perangkat lunak pengeditan grafis.
MAI-Image-1 bergabung dengan portofolio alat AI milik perusahaan yang terus berkembang, yang juga mencakup generator suara MAI-Voice-1 dan chatbot MAI-1-preview. Model gambar baru ini diharapkan segera diluncurkan ke publik yang lebih luas melalui layanan Copilot dan Bing Image Creator. Untuk saat ini, siapa pun dapat mencobanya di platform LMArena.
Pasar AI generatif terus memanas dengan persaingan yang ketat. Baru-baru ini, xAI milik Elon Musk membuka akses ke layanan Grok Imagine, yang dipasarkan sebagai model dengan lebih sedikit batasan dan bahkan menyertakan "Mode Pedas" khusus.