Kā gaidīts pēc vairāku dienu noplūdēm un baumām tiešsaistē, Google to ir izdarījis atklāja Veo 3.1tā jaunākais AI video paaudzes modelis, kas nodrošina radošu un tehnisku jauninājumu komplektu, lai uzlabotu stāstījuma vadību, audio integrāciju un reālismu mākslīgā intelekta ģenerētajā video.
Lai gan atjauninājumi paplašina hobiju un satura veidotāju iespējas, izmantojot Google tiešsaistes AI izveides lietotni, Plūsmalaidiens arī norāda uz pieaugošu iespēju uzņēmumiem, izstrādātājiem un radošajām komandām, kas meklē mērogojamus, pielāgojamus video rīkus.
Kvalitāte ir augstāka, fizika labāka, cenas ir tādas pašas kā iepriekš, un vadības un rediģēšanas funkcijas ir izturīgākas un daudzveidīgākas.
Mans sākotnējie testi parādīja, ka tas ir jaudīgs un veiktspējīgs modelis, kas uzreiz iepriecina katru paaudzi. Tomēr izskats ir kinematogrāfiskāks, slīpēts un nedaudz vairāk "mākslīgs" nekā pēc noklusējuma nekā konkurenti, piemēram, OpenAI jaunā Sora 2, kas tika izlaista pagājušā mēneša beigās un kas var būt vai var nebūt tas, ko vēlas konkrēts lietotājs (Sora izceļas ar rokas un "vaļsirdīgs" stila video).
Paplašināta vadība pār stāstījumu un audio
Veo 3.1 balstās uz tā priekšgājēju Veo 3 (tika izlaists 2025. gada maijā) ar uzlabotu atbalstu dialogam, apkārtējai skaņai un citiem audio efektiem.
Vietējā audio ģenerēšana tagad ir pieejama vairākās Movement galvenajās funkcijās, tostarp “Frames to Video”, “Substances to Video” un “Lengthen," kas sniedz lietotājiem iespēju attiecīgi: pārvērst nekustīgus attēlus video; izmantot priekšmetus, rakstzīmes un objektus no vairākiem attēliem vienā videoklipā; un ģenerējiet garākus klipus nekā sākotnējās 8 sekundes, līdz vairāk nekā 30 sekundēm vai pat 1+ plus, turpinot no iepriekšējā klipa pēdējā kadra.
Iepriekš pēc šo funkciju izmantošanas audio bija jāpievieno manuāli.
Šis papildinājums sniedz lietotājiem lielāku kontroli pār toni, emocijām un stāstījumu — iespējas, kurām iepriekš bija nepieciešams pēcapstrādes darbs.
Uzņēmuma kontekstā šāds kontroles līmenis var samazināt vajadzību pēc atsevišķiem audio cauruļvadiem, piedāvājot integrētu veidu, kā izveidot mācību saturu, mārketinga videoklipus vai digitālās pieredzes ar sinhronizētu skaņu un vizuāliem materiāliem.
Google atzīmēja emuāra ieraksts ka atjauninājumi atspoguļo lietotāju atsauksmes, kas prasa dziļāku māksliniecisko kontroli un uzlabotu audio atbalstu. Gallegos uzsver, cik svarīgi ir padarīt rediģēšanu un precizējumus iespējamus tieši programmā Movement, nepārstrādājot ainas no nulles.
Bagātīgākas ievades un rediģēšanas iespējas
Ar Veo 3.1 Google ievieš atbalstu vairākiem ievades veidiem un precīzāku ģenerēto izvadu kontroli. Modelis kā ievadi pieņem teksta uzvednes, attēlus un videoklipus, kā arī atbalsta:
-
Atsauces attēli (līdz trim) lai vadītu gala rezultātu izskatu un stilu
-
Pirmā un pēdējā kadra interpolācija lai ģenerētu vienmērīgas ainas starp fiksētiem galapunktiem
-
Ainas paplašinājums kas turpina videoklipa darbību vai kustību pēc tā pašreizējā ilguma
Šo rīku mērķis ir sniegt uzņēmuma lietotājiem iespēju precizēt sava satura izskatu un sajūtu, kas ir noderīgi zīmola konsekvencei vai radošu biksīšu ievērošanai.
Tiek ieviestas arī papildu iespējas, piemēram, “Ievietot” (pievienot objektus ainām) un “Noņemt” (dzēst elementus vai rakstzīmes), lai gan ne visas ir uzreiz pieejamas, izmantojot Gemini API.
Izvietošana dažādās platformās
Veo 3.1 ir pieejams, izmantojot vairākus Google esošos AI pakalpojumus:
-
PlūsmaGoogle saskarne filmu veidošanai ar mākslīgā intelekta palīdzību
-
Gemini APIkas ir paredzēta izstrādātājiem, kuri lietojumprogrammās iekļauj video iespējas
-
Virsotne AIkur uzņēmuma integrācija drīzumā atbalstīs Veo “Scene Extension” un citas galvenās funkcijas
Pieejamība, izmantojot šīs platformas, ļauj uzņēmuma klientiem izvēlēties pareizo vidi — uz GUI balstītu vai programmatisku —, pamatojoties uz viņu komandām un darbplūsmām.
Cenas un piekļuve
Pašlaik ir pieejams Veo 3.1 modelis priekšskatījums un pieejams tikai vietnē apmaksāts līmenis no Gemini API. Izmaksu struktūra ir tāda pati kā Veo 3, iepriekšējās paaudzes AI video modeļiem no Google.
-
Standarta modelis: 0,40 USD par videoklipa sekundi
-
Ātrs modelis: 0,15 USD sekundē
Nav bezmaksas līmeņa, un no lietotājiem tiek iekasēta maksa tikai tad, ja videoklips ir veiksmīgi ģenerēts. Šis modelis atbilst iepriekšējām Veo versijām un nodrošina paredzamu cenu noteikšanu uzņēmumu komandām, kas apzinās budžetu.
Tehniskās specifikācijas un izvades vadība
Veo 3.1 izvada video at 720p vai 1080p izšķirtspējaar a 24 kadri sekundē.
Ilguma opcijas ietver 4, 6 vai 8 sekundes no teksta uzvednes vai augšupielādētiem attēliem, ar iespēju pagarināt videoklipus līdz 148 sekundes (vairāk nekā 2 ar pusi minūtes!) izmantojot funkciju “Pagarināt”.
Jaunā funkcionalitāte ietver arī stingrāku objektu un vides kontroli. Piemēram, uzņēmumi var augšupielādēt produkta attēlu vai vizuālo atsauci, un Veo 3.1 ģenerēs ainas, kas saglabā tā izskatu un stilistiskās norādes visā videoklipā. Tas varētu racionalizēt radošās ražošanas cauruļvadus mazumtirdzniecības, reklāmas un virtuālā satura ražošanas komandām.
Sākotnējās reakcijas
Plašāka veidotāju un izstrādātāju kopiena uz Veo 3.1 izlaišanu ir reaģējusi ar optimismu un rūdītu kritiku, jo īpaši salīdzinot to ar konkurējošiem modeļiem, piemēram, OpenAI Sora 2.
Mets Šūmers, AI dibinātājs Otherside AI/Hyperwrite un agrīnais ieviesējs savu sākotnējo reakciju raksturoja kā “vilšanos”, norādot, ka Veo 3.1 ir “ievērojami sliktāks par Sora 2” un arī “diezgan dārgāks”.
Tomēr viņš atzina, ka Google rīki, piemēram, atbalsts atsaucēm un ainas paplašinājums, ir spilgta vieta izlaidumā.
Treviss Deivids3D digitālais mākslinieks un AI satura veidotājs piebalsoja šim noskaņojumam. Lai gan viņš atzīmēja audio kvalitātes uzlabojumus, jo īpaši skaņas efektus un dialogu, viņš pauda bažas par ierobežojumiem, kas joprojām pastāv sistēmā.
Tie ietver pielāgota balss atbalsta trūkumu, nespēju tieši atlasīt ģenerētās balsis un nepārtrauktu ierobežojumu 8 sekunžu paaudzēm, neskatoties uz dažiem publiskiem apgalvojumiem par ilgāku izvadi.
Deivids arī norādīja, ka rakstzīmju konsekvencei mainot kameras leņķus joprojām ir nepieciešama rūpīga pamudināšana, savukārt citi modeļi, piemēram, Sora 2, to apstrādā automātiski. Viņš apšaubīja 1080p izšķirtspējas trūkumu lietotājiem tādos maksas līmeņos kā Movement Professional un pauda skepsi par funkciju paritāti.
No pozitīvākās puses, @kimmonismus, AI informatīvā izdevuma rakstnieks norādīja, ka “Veo 3.1 ir pārsteidzošs”, lai gan joprojām secināja, ka OpenAI jaunākais modelis kopumā joprojām ir vēlams.
Kopumā šie agrīnie iespaidi liecina, ka, lai gan Veo 3.1 nodrošina nozīmīgus rīku uzlabojumus un jaunas radošās vadības funkcijas, cerības ir mainījušās, jo konkurenti paaugstina gan kvalitātes, gan lietojamības latiņu.
Adopcija un mērogs
Kopš Movement palaišanas pirms pieciem mēnešiem Google saka, ka 275 miljoni video ir ģenerēti dažādos Veo modeļos.
Pieņemšanas temps liecina par ievērojamu interesi ne tikai no privātpersonām, guess arī no izstrādātājiem un uzņēmumiem, kas eksperimentē ar automatizētu satura izveidi.
Tomass Iljičs, Google Labs produktu pārvaldības direktors, uzsver, ka Veo 3.1 izlaidums tuvina iespējas tam, kā cilvēku filmu veidotāji plāno un uzņem. Tie ietver sižetu kompozīciju, kadru nepārtrauktību un saskaņotu audio — visas jomas, kuras uzņēmumi arvien vairāk vēlas automatizēt vai racionalizēt.
Drošība un atbildīga AI izmantošana
Videoklipi, kas ģenerēti ar Veo 3.1, tiek marķēti, izmantojot Google ūdenszīmi SynthID tehnoloģija, kurā ir iestrādāts nemanāms identifikators, kas signalizē, ka saturs ir AI ģenerēts.
Google savās API izmanto drošības filtrus un regulēšanu, lai palīdzētu samazināt privātuma un autortiesību riskus. Ģenerētais saturs tiek īslaicīgi saglabāts un dzēsts pēc divām dienām, ja vien netiek lejupielādēts.
Izstrādātājiem un uzņēmumiem šīs funkcijas sniedz pārliecību par izcelsmi un atbilstību — tas ir būtiski regulētajās vai zīmoljutīgās nozarēs.
Kur Veo 3.1 atrodas starp pārpildītu AI video modeļu telpu
Veo 3.1 nav tikai iepriekšējo modeļu iterācija — tas atspoguļo vairākveidu ievades, stāstu vadības un uzņēmuma līmeņa rīku dziļāku integrāciju. Lai gan radošie profesionāļi var redzēt tūlītējus ieguvumus, rediģējot darbplūsmas un precizitāti, uzņēmumi, kas pēta apmācības, reklāmas vai virtuālās pieredzes automatizāciju, var atrast vēl lielāku vērtību modeļa kompozīcijas un API atbalsta jomā.
Agrīnās lietotāju atsauksmes liecina, ka, lai gan Veo 3.1 piedāvā vērtīgus rīkus, cerības attiecībā uz reālismu, balss vadību un paaudzes garumu strauji attīstās. Tā kā Google paplašina piekļuvi, izmantojot Vertex AI, un turpina pilnveidot Veo, tā konkurētspējīgā pozīcija uzņēmumu video ģenerēšanā būs atkarīga no tā, cik ātri tiks novērsti šie lietotāju problēmu punkti.