Stability AI Memperkenalkan Model AI Ringan untuk Generasi Suara Offline

Stability AI Memperkenalkan Model AI Ringan untuk Generasi Suara Offline

Arkadiy Andrienko

Stability AI, yang dikenal karena inovasinya dalam AI generatif, telah mengumumkan model generasi audio baru: Stable Audio Open Small. Apa yang membedakan alat ini adalah kemampuannya untuk berjalan di smartphone tanpa akses internet, berkat optimasi untuk prosesor Arm.

Dikembangkan bekerja sama dengan pembuat chip Arm, model ini dirancang untuk menghasilkan klip suara pendek — sampel, efek suara, atau sketsa instrumental hingga 11 detik. Menurut para pengembang, memproduksi audio semacam itu memerlukan waktu kurang dari delapan detik, bahkan di perangkat seluler. Kinerja ini dimungkinkan dengan mengecilkan jaringan saraf menjadi 341 juta parameter dan menyesuaikannya untuk chip yang hemat energi.

Berbeda dengan layanan berbasis cloud seperti Suno atau Udio, Stable Audio Open Small bekerja sepenuhnya secara lokal. Ini menghilangkan latensi dan ketergantungan pada konektivitas internet. Model ini dilatih hanya pada dataset sumber terbuka dari Free Music Archive dan Freesound, mengurangi risiko hak cipta — sebuah kontras yang mencolok dengan beberapa pesaing yang mengandalkan materi pelatihan yang lebih dipertanyakan.

Namun, alat ini memiliki keterbatasan: hanya mendukung permintaan dalam bahasa Inggris, tidak menghasilkan vokal atau komposisi yang kompleks. Ketentuan penggunaan bervariasi — gratis untuk startup dan peneliti, tetapi perusahaan dengan pendapatan tahunan lebih dari $1 juta perlu membeli lisensi komersial. Meskipun bukan pengganti studio profesional, Stable Audio Open Small menawarkan solusi praktis untuk pembuatan audio cepat, di mana saja, langsung dari ponsel Anda.

    Tentang Penulis
    Komentar0