Technologue.id, Jakarta - Pada Rabu, Meta mengumumkan AudioCraft sumber terbuka, yakni seperangkat alat AI generatif untuk membuat musik dan audio dari perintah teks.
Dengan alat tersebut, pembuat konten dapat memasukkan deskripsi teks sederhana untuk menghasilkan lanskap audio yang kompleks, menyusun melodi, atau bahkan mensimulasikan seluruh orkestra virtual.
Baca Juga:
Prediksi Penjualan iPhone 15 Bakal Melempem
AudioCraft terdiri dari tiga komponen inti, antara lain AudioGen, alat untuk menghasilkan berbagai efek audio dan soundscapes. Selain itu, ada MusicGen, yang dapat membuat komposisi musik dan melodi dari deskripsi dan EnCodec, codec kompresi audio berbasis jaringan saraf.
Secara khusus, Meta mengatakan bahwa EnCodec baru-baru ini telah diperbaiki dan memungkinkan "generasi musik berkualitas lebih tinggi dengan lebih sedikit artefak".
Selain itu, AudioGen dapat membuat efek suara audio seperti gonggongan anjing, klakson mobil, atau langkah kaki di lantai kayu. Lalu, MusicGen dapat membuat lagu dari berbagai genre dari awal, berdasarkan deskripsi seperti "Lagu dansa pop dengan melodi yang menarik, perkusi tropis, dan ritme yang ceria.
Meta telah menyediakan beberapa sampel audio di situs webnya untuk dievaluasi. Sampel ini meskipun cukup terdengar canggih, namun kualitasnya tidak cukup tinggi untuk menggantikan efek audio atau musik komersial yang diproduksi secara profesional.
Meta mencatat bahwa sementara model AI generatif berpusat di sekitar teks dan gambar diam telah menerima banyak perhatian (dan relatif mudah bagi orang untuk bereksperimen secara online), pengembangan alat audio generatif telah tertinggal.
Baca Juga:
YouTube Tambahkan Beberapa Tools Baru untuk Shorts
Perusahaan berharap rilis AudioCraft di bawah Lisensi MIT akan berkontribusi pada komunitas yang lebih luas dengan menyediakan alat yang dapat diakses untuk eksperimen audio dan musik.