Durante il Google I/O 2025, la conferenza annuale più attesa dagli appassionati di tecnologia, Google ha presentato Veo 3, il suo nuovo modello di intelligenza artificiale generativa specializzato nella creazione di video. La vera rivoluzione? Per la prima volta, i video generati includono anche una componente audio perfettamente sincronizzata, capace di aggiungere effetti sonori, ambienti acustici e persino dialoghi credibili, coerenti con le immagini prodotte.
Oltre le immagini, arriva la voce dell’intelligenza artificiale
Veo 3 rappresenta un passo avanti decisivo rispetto alla precedente versione Veo 2. Non solo genera video realistici, ma li accompagna con suoni integrati in modo naturale nella scena. Secondo Google, questa innovazione permette agli utenti di descrivere scene complete, compresi i dialoghi e il tono della voce, ottenendo clip dinamici, credibili e coinvolgenti. Il servizio è incluso nel piano AI Ultra, disponibile al costo di 249,99 dollari al mese attraverso l’app Gemini.
Una qualità che sorprende e preoccupa
I primi esempi pubblicati su piattaforme come TikTok e YouTube sono impressionanti. I video sembrano veri, al punto da alimentare un nuovo dibattito sul confine sempre più sottile tra realtà e finzione digitale. Il CEO di Google DeepMind, Demis Hassabis, ha commentato: “È come uscire finalmente dal cinema muto dell’intelligenza artificiale”. Un’affermazione che dà il senso dell’impatto potenziale: oggi è possibile creare trailer credibili, e domani, chissà, forse interi cortometraggi.
L’integrazione audio come svolta tecnologica
La grande novità di Veo 3 sta nella sua capacità di analizzare i pixel del video per generare audio coerente, sfruttando una tecnologia sviluppata da DeepMind nota come video-to-audio AI. Questo sistema, già in fase sperimentale nel 2024, si basa su un modello addestrato su migliaia di video, suoni ed elementi testuali. Anche se Google non ha rivelato l’origine dei dati usati, è probabile che YouTube, di sua proprietà, abbia fornito un’importante base di addestramento.
Una corsa a più voci nel mercato dell’intelligenza artificiale
Il settore dei video AI è in forte espansione, con concorrenti come Runway, Pika, Luma, Kling e colossi come OpenAI e Alibaba che lanciano prodotti con frequenza crescente. Tuttavia, l’integrazione audio potrebbe essere ciò che davvero distingue Veo 3. Come sottolinea Edgadget, se le promesse saranno mantenute, il modello di Google potrebbe conquistare un vantaggio competitivo significativo.
Flow, lo strumento AI pensato per chi crea cinema
Accanto a Veo 3, Google ha annunciato anche Flow, un ambiente creativo basato sull’intelligenza artificiale che consente di costruire scene cinematografiche combinando testo, immagini, audio e movimento. Grazie all’integrazione con i modelli Veo, Imagen e Gemini, Flow consente di: generare scenari partendo da descrizioni, creare elementi visivi originali, modificare l’inquadratura e mantenere coerenza stilistica tra le scene. Un vero laboratorio digitale per filmmaker, attualmente disponibile solo negli Stati Uniti per gli abbonati AI Pro e AI Ultra.
Una nuova fase della narrazione audiovisiva
Il binomio Veo 3 e Flow apre prospettive fino a ieri impensabili per creativi, registi, pubblicitari e content creator. Non si tratta più solo di immagini spettacolari, ma di narrazioni complete, dotate di audio, movimento e coerenza. Se un tempo si parlava di democratizzazione del cinema grazie agli smartphone, oggi l’intelligenza artificiale sembra voler abbattere anche gli ultimi confini tra ideazione e realizzazione audiovisiva.
28 Maggio 2025
© team icoe, editoriale blozine
blozine editoriale no-profit della
Centro studi su innovazione, comunicazione ed etica.
Copywriters
Francesca S., Matteo R., Laura A., Antonella B., Giorgio F., Anna C., Miriam M., Stefano G., Adele P. e Francesca N.
Chi siamo
iscriviti sulla nostra pagina Facebook e non perderai nessuna notizia!
© blozine, l'editoriale dalla B alla Z. Tutti i diritti sono riservati.