Berita Perangkat Keras dan Teknologi Stability AI Memperkenalkan Model AI Ringan untuk Generasi Suara Offline

Stability AI Memperkenalkan Model AI Ringan untuk Generasi Suara Offline

15 Mei 2025, 11:39

Stability AI, yang dikenal karena inovasinya dalam AI generatif, telah mengumumkan model generasi audio baru: Stable Audio Open Small. Apa yang membedakan alat ini adalah kemampuannya untuk berjalan di smartphone tanpa akses internet, berkat optimasi untuk prosesor Arm.

Dikembangkan bekerja sama dengan pembuat chip Arm, model ini dirancang untuk menghasilkan klip suara pendek — sampel, efek suara, atau sketsa instrumental hingga 11 detik. Menurut para pengembang, memproduksi audio semacam itu memerlukan waktu kurang dari delapan detik, bahkan di perangkat seluler. Kinerja ini dimungkinkan dengan mengecilkan jaringan saraf menjadi 341 juta parameter dan menyesuaikannya untuk chip yang hemat energi.

Berbeda dengan layanan berbasis cloud seperti Suno atau Udio, Stable Audio Open Small bekerja sepenuhnya secara lokal. Ini menghilangkan latensi dan ketergantungan pada konektivitas internet. Model ini dilatih hanya pada dataset sumber terbuka dari Free Music Archive dan Freesound, mengurangi risiko hak cipta — sebuah kontras yang mencolok dengan beberapa pesaing yang mengandalkan materi pelatihan yang lebih dipertanyakan.

Namun, alat ini memiliki keterbatasan: hanya mendukung permintaan dalam bahasa Inggris, tidak menghasilkan vokal atau komposisi yang kompleks. Ketentuan penggunaan bervariasi — gratis untuk startup dan peneliti, tetapi perusahaan dengan pendapatan tahunan lebih dari $1 juta perlu membeli lisensi komersial. Meskipun bukan pengganti studio profesional, Stable Audio Open Small menawarkan solusi praktis untuk pembuatan audio cepat, di mana saja, langsung dari ponsel Anda.

Postingan telah diterjemahkan Tampilkan yang asli (EN)

Berita Perangkat Keras dan Teknologi Pengumuman

Tentang Penulis

Arkadiy Andrienko

Penulis artikel dan berita

Sebagai jurnalis teknologi di VGTimes, saya dengan senang hati membahas GPU terbaru dan mendalami seluk-beluk RPG klasik. Sejak tahun 2018, saya menulis tentang game dan perangkat keras, pengalaman saya di bidang rekayasa suara memungkinkan saya memahami dengan baik nuansa teknologi audio, dan saya selalu mencari sesuatu yang baru di bidang perangkat keras game. Ketika saya tidak menulis tentang teknologi, kemungkinan besar saya sedang menjelajahi puing-puing pasca-apokaliptik di Fallout, mengelola koloni di RimWorld, atau memimpin pasukan di Hearts of Iron IV. Bagi saya, game lebih dari sekadar hobi — ini adalah hasrat yang memberi energi pada potensi kreatif saya dan menjaga hubungan dengan dunia teknologi yang terus berkembang.

...Perluas

Komentar0