Stability AI, la società specializzata nell’AI generativa open, nota – tra le altre cose – per i modelli Stable Diffusion e Stable Diffusion XL, ha annunciato il lancio di Stable Audio, il primo prodotto di intelligenza artificiale per la generazione di musica e suoni dell’azienda.
Stable Audio – afferma Stability AI – è un prodotto unico nel suo genere che utilizza le più recenti tecniche di intelligenza artificiale generativa per fornire musica ed effetti sonori in modo più veloce e di qualità superiore attraverso un’interfaccia web facile da usare.
Stability AI offre una versione gratuita di base di Stable Audio, che può essere utilizzata per generare e scaricare brani fino a 20 secondi, e un abbonamento “Pro”, che fornisce brani di 90 secondi scaricabili per progetti commerciali.
“Come unica azienda indipendente, open e multimodale di AI generativa, siamo entusiasti di utilizzare la nostra esperienza per sviluppare un prodotto a supporto dei creatori di musica“, ha dichiarato Emad Mostaque, CEO di Stability AI. “La nostra speranza è che Stable Audio metta in grado gli appassionati di musica e i professionisti creativi di generare nuovi contenuti con l’aiuto dell’AI, e non vediamo l’ora di vedere le infinite innovazioni che ispirerà“.
La società sviluppatrice della soluzione spiega che Stable Audio è ideale per i musicisti che desiderano creare campioni da utilizzare nella loro musica, ma le opportunità per i creatori di contenuti sono illimitate.
Le tracce audio vengono generate in risposta a prompt di testo descrittivo forniti dall’utente, insieme alla lunghezza desiderata dell’audio. Ad esempio: “Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM” può essere inserito con la richiesta di un brano di 95 secondi, che verrà generato.
Il modello sottostante – sottolinea Stability AI – è stato addestrato utilizzando la musica e i metadati di AudioSparx, una delle principali librerie musicali, in una partnership tra le aziende che genererà valore economico e creativo per tutte le parti.
Stable Audio, secondo la società sviluppatrice, è il primo prodotto di generazione musicale che consente di creare musica di alta qualità a 44,1 kHz per uso commerciale tramite latent diffusion. L’architettura latent diffusion, spiega Stability AI, utilizza l’audio condizionato dai metadati del testo, così come dalla durata e dal tempo di inizio del file audio, consentendo di controllare il contenuto e la lunghezza dell’audio generato.
È possibile saperne di più sulla ricerca alla base di questo modello, leggendo l’approfondimento sul sito di Stability AI.