All’inizio dell’anno OpenAI aveva svelato Sora, il modello in grado di creare video realistici a partire da un testo, e aveva condiviso i primi progressi dell’azienda nella ricerca sulla simulazione del mondo. Sora serve come base per un’intelligenza artificiale che comprenda e simuli la realtà, un passo importante verso lo sviluppo di modelli in grado di interagire con il mondo fisico.
Ora Sora esce dalla fase di anteprima di ricerca e OpenAI annuncia che il modello di generazione video è in fase di roll-out su sora.com. Tuttavia, il modello video ancora non è disponibile in Europa, o almeno: nella maggior parte dei Paesi europei, tra cui l’Italia, non è ancora accessibile.
Il team ha sviluppato una nuova versione di Sora – Sora Turbo – che è molto più veloce del modello presentato in anteprima a febbraio. OpenAI rilascia oggi il modello come prodotto autonomo su Sora.com per gli utenti di ChatGPT Plus e Pro.
Oltre al modello in sé, OpenAI sta rilasciando un’ampia gamma di funzionalità che il team ha condiviso per la prima volta nel report tecnico.
Gli utenti possono generare video con risoluzione fino a 1080p, della durata massima di 20 secondi e in formato widescreen, verticale o quadrato. È possibile inserire i propri asset per estendere, remixare e fondere, o generare contenuti completamente nuovi a partire dal prompt di testo.
Il team ha sviluppato nuove interfacce per rendere più semplice sottoporre a Sora prompt con testo, immagini e video. Inoltre, lo strumento storyboard consente agli utenti di specificare con precisione gli input per ogni fotogramma. I feed Featured e Recent vengono poi costantemente aggiornati con le creazioni della community.
Sora – spiega OpenAI – è incluso nell’account Plus senza costi aggiuntivi. È possibile generare ogni mese fino a 50 video a 480p o meno video a 720p.
Per chi vuole di più da Sora, il piano Pro prevede un utilizzo 10 volte superiore, risoluzioni più elevate e durate più lunghe. OpenAI ha sottolineato che l’azienda sta inoltre lavorando a prezzi personalizzati per diversi tipi di utenti, che conta di rendere disponibili all’inizio del prossimo anno.
OpenAI sottolinea che l’attuale versione di Sora ha molti limiti, spesso genera una fisica non realistica e fatica a gestire azioni complesse di lunga durata. Sebbene Sora Turbo sia molto più veloce dell’anteprima di febbraio, il team sta ancora lavorando per rendere la tecnologia accessibile a tutti.
L’azienda afferma che sta introducendo ora la sua tecnologia di generazione di video per dare alla società il tempo di esplorarne le possibilità e di co-sviluppare norme e salvaguardie che ne garantiscano un uso responsabile man mano che il settore progredisce.
Tutti i video generati da Sora sono dotati di metadati C2PA, che identificano un video come proveniente da Sora per garantire la trasparenza e possono essere utilizzati per verificarne l’origine. Pur essendo imperfetti, il team ha aggiunto delle salvaguardie come i watermark visibili per impostazione predefinita e ha creato uno strumento di ricerca interno che utilizza gli attributi tecnici dele generazioni per aiutare a verificare se il contenuto proviene da Sora.
Oggi il team blocca forme di abuso particolarmente dannose e, al momento del lancio, i caricamenti di persone saranno limitati, ma OpenAI intende estendere la funzione a un numero maggiore di utenti man mano che il team perfeziona le sue mitigazioni dei deepfake. Per saperne di più sull’approccio alla sicurezza e al monitoraggio di OpenAI, è possibile consultare la system card e i dettagli sulle iniziative di red teaming.
Ulteriori informazioni su Sora sono disponibili sul sito di OpenAI.