Veo 3, Google jaunais video ģenerējošais modelis, kas visā internetā veido viļņus, tagad ir pieejams visiem, kas ir publiski priekšskatījumā, uzņēmums paziņots Ceturtdiena.
Šis rīks sākotnēji bija pieejams tikai Dvīņu Ultra abonentiem un caur Flow, Google AI darbināmā filmu veidošanas platformu, kas tika atklāta arī jaunākajā I/O. Sākot ar ceturtdienu tam var piekļūt kā publisks priekšskatījums visiem Google Cloud klientiem un partneriem Vertex AI Media StudioApvidū
Arī: labākie 2025. gada AI attēlu ģeneratori: Dvīņi, Chatgpt, Midjourney un citi
Pagājušajā mēnesī tika atklāts Google ikgadējā izstrādātāju konferencē I/O, Veo 3 var ģenerēt video ar sinhronizētu audio-ilgstošu tehnisku izaicinājumu šajā jomā. Iedomājieties, ka jūs pamudināsit sistēmu ģenerēt, piemēram, aizņemtas metro automašīnas videoklipu. Veo 3 var radīt videoklipu, komplektā ar AI ģenerētu apkārtējās vides fona troksni, lai pievienotu reālisma izjūtu. Jūs pat varat pamudināt to radīt cilvēku balsu audio, norāda Google.
Modelis specializējas arī reālistiski reālās pasaules fizikas imitēšanā, piemēram, ūdens šķidruma dinamikā un ēnu kustībai, padarot to par potenciāli vērtīgu instrumentu filmu veidotājiem un attīstot Google plašāku misiju-izmantot izmantojamu AI radošajām industrijām.
Lietotāji var izveidot videoklipus Veo 3, izmantojot dabiskās valodas teksta uzvednes, precizējot viņu norādījumus, lai modificētu smalkas radošas detaļas-“no debesu ēnojuma līdz precīzai veidā, kā saule sit pa ūdeni pēcpusdienas gaismā”, uzņēmums rakstīja a emuāra ieraksts ceturtdien.
Izmantojiet gadījumus un trūkumus
Google savā emuāra ierakstā atzīmēja, ka virkne uzņēmumu aktīvi eksperimentē ar VEO 3, lai ģenerētu uz klientiem vērstu saturu, ieskaitot sociālo mediju reklāmas un produktu demonstrācijas, kā arī iekšējos materiālus, piemēram, apmācības videoklipus. Viens izpilddirektors to raksturoja kā “vienīgo lielāko lēcienu uz priekšu praktiski noderīgā AI reklāmai, jo Gen AI pirmo reizi ielauzās galvenajā leņķī 2023. gadā.”
Arī: atvērtā koda prasmes var ietaupīt jūsu karjeru, kad AI nāk klauvēt
Google un citi vadošie AI izstrādātāji ir ieguldījuši lielus ieguldījumus rīkos, kas izstrādāti, lai ģenerētu video no dabiskās valodas uzvednēm, derējot, ka tas būs galvenais praktiskais lietošanas gadījums ģeneratīvajai AI. Piemēram, AI Avatar Company Synthesia piedāvā tehnoloģiju kā veidu, kā padarīt uzņēmuma saturu ātrāku un ar mazāk resursiem, tostarp ļaujot lietotājiem, piemēram, izpilddirektoriem, atkārtojiet to līdzību izveidot uzņēmuma video adreses.
Iegūstiet rīta labākos stāstus katru dienu ar mūsu iesūtni Tech šodien biļetens.
Radošo profesionāļu reakcija ir sajaukta. Daži redz pozitīvu potenciālu, kas paredzēta Ai-atbalstītās filmu veidošanas nākotnei; atzītais režisors Darrens Aronofskis, kurš, viens, ir izveidojis radošu partnerība ar Google DeepMind. Līdzīgs darījums ir sitis starp Lionsgate un AI starta skrejceļu.
Tomēr citi ir kritiski novērtējuši AI ģenerētā video aizvien pieaugošo iejaukšanos visā radošajā industrijā. Izšķirt Video reklāma Rotaļlietām R ‘ASV, kas radītas, izmantojot Openai’s Sora, pagājušajā gadā, piemēram, saņēma plašu tiešsaistes izsmieklu. Izklaides darbinieku arodbiedrības ir organizēšana, lai aizsargātu viņu darbu Tā kā tehnoloģija strauji attīstās.
Tas nav pārtraucis tehnoloģiju uzņēmumus veidot un izlaist jaunus video ģenerējošus rīkus tirgotājiem. Šā mēneša sākumā Amazon ADS paziņoja par vispārējo atklāšanu visā ASV ar savu video ģenerēšanas rīku; META ir vēl augstāks, un, kā ziņots, mērķis ir automatizēt katru reklāmas ražošanas procesa soli.
Būtisks tehniskais izaicinājums
VEO 3 ir viens no pirmajiem modeļiem no galvenā tehnoloģiju izstrādātāja, kas var sinhronizēt AI ģenerētu video un audio. Meta Filmu genkas atbrīvots oktobrī, ir vēl viens. Dažiem citiem rīkiem, piemēram, skrejceļa Gen-3 Alpha, ir funkcijas, kas ļauj AI ģenerētam audio video pēcražošanas procesā, bet abu vienlaicīgajai paaudzei ir nepieciešami tādi liela spēka kā Google aprēķināšana un resursi.
Arī: es tērzēju ar pieciem AI robotiem – tie veica labākās sarunas
AI modeļu veidošana, kas spēj ģenerēt sinhronizētu video un audio, ir bijusi sarežģīta tehniska problēma un aktīva pētījumu joma visā AI nozarē. Gan AI ģenerēts video, gan AI ģenerēts audio ir atšķirīgas tehniskas problēmas, un to sakausēšana rada pilnīgi jaunu sarežģītības dimensiju. Šeit ir Veo 3 demonstrācija.
https://www.youtube.com/watch?v=94Kmlfyiao8
Pirmkārt, video ir vēl rāmju sērija, turpretī audio ir nepārtraukts vilnis. Tāpēc abu sinhronizēšana prasa modeļus, kas var darboties visās šajās divās kārtībās, veidojot ievērojami atšķirīgos laika grafikus, kuros tie darbojas.
Arī: Google Flow ir jauns AI video ģenerators, kas paredzēts filmu veidotājiem – kā to izmēģināt šodien
AI modelim, kas saplūst ar skaņu, arī jāspēj dinamiski ņemt vērā tādus mainīgos lielumus kā materiāls, attālums un ātrums. Automašīna, kas brauc ar ātrumu 100 jūdzes stundā, izklausās daudz savādāk nekā viena, kas brauc ar 10 jūdzēm stundā; Zirgs, kas staigā pa bruģakmeņiem, izklausās savādāk nekā tas, kas staigā pa zāli.