Riformista Cartaceo
Video realistici creati con l’intelligenza artificiale: OpenAI lancia Sora

Si chiama Sora, ed è il nuovo modello di intelligenza artificiale text-to-video di casa OpenAI, capace di generare video realistici da semplici prompt testuali. Affiancandosi alla generazione di immagini di DALL-E, Sora apre nuove frontiere per creatori di contenuti, designer e professionisti del settore, offrendo uno strumento potente per trasformare le idee in narrazioni visive coinvolgenti. Il nuovo modello si distingue per la sua abilità nel creare scene complesse e personaggi espressivi, interpretando con precisione le richieste degli utenti e simulando interazioni realistiche nel mondo fisico. Attualmente in fase di test, Sora è valutato da esperti di sicurezza e artisti visivi per affinare ulteriormente le sue capacità e indirizzare le sfide tecniche. Nonostante l’impressionante capacità di generazione video, Sora incontra alcune difficoltà, come la corretta rappresentazione della fisica di scene complesse e la gestione di dettagli spaziali e temporali.
OpenAI si impegna a superare questi ostacoli, lavorando per migliorare la precisione e la versatilità del modello. Interessante la scelta di aprire la demo a team di sicurezza, con cui OpenAI prevede l’implementazione di rigorose misure salvaguardia per prevenire la disinformazione e l’uso improprio dei video generati. Strumenti di rilevamento avanzati e l’integrazione di metadati C2PA garantiranno trasparenza e autenticità, affrontando i rischi associati alla produzione di contenuti sintetici.
Sora, basato su un’architettura transformer, beneficia di una scalabilità e flessibilità notevoli: l’approccio alla generazione video è quello della diffusione, che vede l’AI trasformare il “rumore statico” in immagini coerenti e rappresenta un salto qualitativo nel campo dell’intelligenza artificiale visiva.
La tecnologia di recaptioning, ereditata da DALL-E 3, consente al modello di seguire le istruzioni degli utenti con una elevata precisione, generando contenuti che rispecchiano fedelmente le loro visioni. Sora non solo facilita la creazione di video partendo da zero ma può anche animare immagini fisse o estendere video esistenti, offrendo una gamma di applicazioni che vanno dalla pubblicità al cinema, fino all’educazione e oltre.
Questo modello rappresenta secondo i suoi creatori un passo avanti verso il raggiungimento dell’Intelligenza Artificiale Generale (AGI), lo scopo finale – perlomeno dichiarato – di OpenAI. Con Sora, OpenAI non solo estende i confini della creatività digitale ma invita anche a una riflessione sul futuro dell’IA, evidenziando il potenziale di questa tecnologia nel migliorare la nostra capacità di raccontare storie visive e interagire con il mondo in modi sempre più sofisticati.
© Riproduzione riservata