Google ģeneratīvā AI filmu veidošanas programmas plūsma ir sasniegusi pagrieziena punktu. Tehnoloģiju gigants apstiprināja tikai CNET, ka plūsmas veidotāji programmā ir saražojuši vairāk nekā 100 miljonus AI video. Daļēji pateicoties savam uzlabotajam AI video modelim Veo 3, Move ļauj lietotājiem ģenerēt video klipus un rediģēt tos kopā, lai izveidotu ainas.
Ir pagājušas 90 dienas, kopš Google mūs pārsteidza ar plūsmu ikgadējā I/O izstrādātāju konferencē. Pēc Elias Roman teiktā, vecākais Move Google Labs produktu pārvaldības direktors, lielāko daļu laika kopš tā laika ir pavadīts “grūstīšanās tikai tāpēc, lai neatpaliktu no pieprasījuma”.
Plūsma ir atkāpe no Google iepriekšējā ģeneratīvā AI darba. Gadiem ilgi uzņēmuma AI centieni ir vērsti uz Gemini, tā visaptverošo tērzēšanu. Tas ir pārpludinājis savus produktus ar AI, piemēram, ar meklēšanas AI pārskatiem un Gmail AI ģenerētiem kopsavilkumiem. Tā pētniecības asistenta rīks Notebooklm ar savu AI audio ģeneratoru, kas var pārveidot dokumentus par personīgām aplādes, pastāvīgi izvērš jaunas funkcijas.
Nozares vadītājs ir iztērējis miljardiem dolāru, cenšoties uzvarēt sacīkstēs, lai izstrādātu vismodernākos AI vidējiem Google meklētājiem, izstrādātājiem un, jā, pat māksliniekiem un veidotājiem. 100 miljoni AI videoklipu ir nozīmīgs pavērsiens uzņēmumam, un tas palīdz mums parādīt, kā varētu izskatīties AI iespējota radīšanas nākotne.
Iekļūšana AI plūsmā
Lai konkurētu ar Midjourney un stabilu difūziju, Google izveidoja AI attēlu modeļu ražu, kas sākotnēji tika nosaukts par ImageFX un tagad pazīstams kā Imagen (izrunā “Think about”). Tās iepriekšējie ģeneratīvo mediju modeļi bija labāk piemēroti amatieriem vai entuziastu veidotājiem, nevis profesionāļiem, un viņi nedominēja AI radošajā telpā. Tas viss mainījās ar Veo 3.
Google nometa Veo 3, tā jaunāko AI video modeli, maija I/O konferencē. VEO 3 izlēca konkurenci ar nedaudz acīmredzamu, guess pirmo nozares attīstību: AI video ar sinhronizētu, AI ģenerētu audio. Modelis tiešsaistē piesaistīja tonnu uzmanību, un Google tikai septiņas nedēļas vēlāk ziņoja par vairāk nekā 40 miljoniem AI video.
“Tas, ko Veo 3 atļāva, bija daudz plašāks cilvēku kopums, lai izveidotu ļoti pārliecinošus videoklipus, iesaistot visas sajūtas ārpus kastes. Jums nevajadzēja sašūt instrumentu komplektu,” sacīja Romāns. “Lai varētu izdarīt foley [ambient sounds]Skaņas efekti, skaņu celiņš, dialoglodziņš, tas viss, un neliek lietotājam domāt par katru no šīm kārtām noteiktā veidā, es domāju, ir arī liela atbloķēšana. “
Veo 3 ir viens no vairākiem AI modeļiem, kuru varat izmantot filmas veidotāja rīkā. Plūsma tika veidota profesionāliem veidotājiem un filmu veidotājiem, kas ir solis ārpus vienkāršas attēlu un video ģenerēšanas, kas pieejams ar Gemini. Google ar nodomu attālinājās no sākotnējās ImageFX nomenklatūras un izveidoja savu saskarni, sacīja Romāns un vēlējās, lai Move apvienotu vismodernākos Imagen un Veo modeļus ar Dvīņiem, kas tika izmantoti VEO apmācībā un “pamatā runā vietējā VEO”.
Plūsma ir viens no veidiem, kā apvienot visus šos AI modeļus un gabalus, apvienojot Google dažādos ģeneratīvos AI modeļus bezšuvju video izveidošanai un rediģēšanai.
Kas padara plūsmu atšķirīgu no VEO un Imagen
Plūsma tika veidota, lai koncentrētos uz konsekvenci, tas ir, spēju saglabāt vizuālo identitāti no viena klipa uz otru. Ja jums ir 90 sekunžu videoklips, kurā redzams, ka jūsu raksturs kafejnīcā dzer kafiju, jūs nevēlaties, lai viņu matu garums vai acu krāsa mainās ik pēc 8 sekundēm starp ainām. Šī konsekvence ir svarīga profesionāliem projektiem, un to ir arī grūti sasniegt. Romāns to sauca par “Ahileja AI video papēdi”.
Move ir vairāki rīki, kas palīdzēs saglabāt šo konsekvenci, un, pārbaudot, tie tomēr sniedz jums jaunu kontroli pār jūsu darbu, kas iepriekš trūka no Google AI rīkiem. Labākais veids, kā es varu aprakstīt plūsmu, ir vienkāršu video ģeneratora interfeisu augstākā mēroga versija ar iespēju eksportēt vairākus klipus uz pirmizrādes professional līdzīgā laika skalas vienkāršotu versiju.
AI rīki bieži tiek modernizēti ar cerību, ka tie kļūs noderīgāki profesionāliem veidotājiem, lai gan mērķauditorija netiek automātiski piesaistīta to izmantošanai. Ģeneratīvā AI ir strīdīgs jautājums radošajās industrijās, it īpaši, ja runa ir par teksta, attēla un video izveidošanu vairumtirdzniecībā. AI entuziasti varētu slavēt AI modeļu radošumu un ātrumu, guess veidotāji turpina paust likumīgas bažas par AI apmācību un izvietošanu. Tāpēc izdevēji un mākslinieki ir iesnieguši tiesas prāvas pret AI uzņēmumiem, kas apgalvo autortiesību pārkāpumu. Tāpēc darbinieki, kas bagāti ar datiem bagāti, saskaras ar darba drošības problēmām, jo vadītāji vēlas samazināt izmaksas.
Vēl viena AI problēma ir tēlainības veids, ko tas var radīt. Pagājušajā gadā lietotāji atrada Dvīņus varētu radīt attēlus cilvēku cilvēku nacistu karavīru formas tērpos. Google atvainojās par to, ko uzņēmums sauca par “neprecizitātēm dažos vēsturiskos attēlu ģenerēšanas attēlos” un minētais Tas strādāja, lai nekavējoties uzlabotu šos attēlus.
(Google vadlīnijas aizliegt ļaunprātīga un nelikumīga AI satura izveidošana. Romāns sacīja, ka drošības politikas izpildes uzlabošana ir palīdzējusi tehnoloģiskiem atjauninājumiem un reālās dzīves lietošanai un ziņojumiem.)
Turpmāk Romāns sacīja, ka plūsma strādā pie Veo 3 spēju paplašināšanas, konsekvences uzlabošanas un jaunu funkciju pievienošanas, piemēram, individuālām balsīm rakstzīmju darbam. Projekta ziemeļu zvaigzne padara radīšanu pieejamāku cilvēkiem.
“Mēs varam samazināt barjeras, kas neļauj daudz plašākiem cilvēkiem stāstīt stāstus, izmantojot video, un mēs varam paaugstināt griestus attiecībā uz to, kādiem stāstiem var stāstīt caur video,” sacīja Romāns. “Daži no viņiem būs smieklīgi un muļķīgi, piemēram, savvaļas ielu intervijas vai Yeti Asmr emuāru autori, un daži no viņiem būs patiešām spēcīgi.”
Kā izmantot Google plūsmu AI video
Plūsma, kas ir daļa no Google Labs un kas ir pieejama, izmantojot tās AI testa virtuvi, ir pieejama samaksai Google AI Abonenti savā 20 USD mēnesī Professional plānā un USD 250 mēnesī Extremely plānā (pašlaik atlaide par USD 125 uz trim mēnešiem). Google Labs Paziņojums par privātumu saka, ka “cilvēku recenzenti lasa, anotē un apstrādā” jūsu laboratoriju mijiedarbību un rīku izvadi, lai uzlabotu tās AI modeļus. (Jūsu laboratoriju dati pēc noklusējuma tiek glabāti līdz 18 mēnešiem, un uzņēmums iesaka jums ne augšupielādēt un neiesniegt konfidenciālu informāciju. Google vispārējais privātuma centrs ir vairāk informācijas.)
Es kādu laiku pavadīju, pārbaudot plūsmu, ģenerējot klipus un sasmalcinot tos kopā, izmantojot tās ainas celtnieku. Plūsmas lietotājiem ir pieejami tikai vairāki rīki.
Sastāvdaļas uz video: Ir daži veidi, kā jūs varat pieprasīt ģenerēt video klipus, ieskaitot pašsaprotamo tekstu-video un attēlu/rāmjus-video. Sastāvdaļas-Video ir jauns, kuru ir vērts izpētīt. Izmantojot šo metodi, jūs augšupielādējat konkrētus attēlus un pievienojat teksta uzvedni, un plūsma daļas sadalīs kopā. Piemēram, jūs varat augšupielādēt vīrieša attēlu, konkrētas apvalka produkta fotoattēlu un ainavisku fonu, un pēc tam plūsma var tos apvienot un animēt video.
Klipu paplašināšana un pāreju izlīdzināšana: Pagarināšana var palīdzēt pagarināt klipus. Laika skalā Scenebuilder velciet viena klipa rāmja galu uz vēlamo garumu. Ja jūs gatavojaties ģenerēt jaunu videoklipu un vēlaties vienmērīgu pāreju, iesaku doties uz pirmā klipa beigām un nospiest plus pogu marķiera augšpusē, lai saglabātu galīgo rāmi savā bibliotēkā. Pēc tam šo attēlu varat izmantot uzvednē rāmjos, lai saglabātu šo konsistenci no klipa līdz klipam.
Doodling un rediģēšana: Ja rediģējat rāmi vai attēlu atsevišķā dokumentā, varat augšupielādēt iezīmēto attēlu, lai plūst un uzdotu modelim ieviest izmaiņas. To var izdarīt arī ar attēliem, uz kuriem esat uzzīmējis, un tas var atdzīvināt šos logotipus. Šī ir jaunattīstības funkcija – jauns prototips tam ir tagad darbos -, taču noteikti ir jautri izstiepties tādas plūsmas iespējas kā tas.
Pamudinājums ar Dvīņiem: Nevar būt veids, kā Dvīņi automātiski izveidot un/vai uzlabot jūsu uzvednes tieši plūsmā (kaut kas, es ceru, mainās turpmākajā atjauninājumā), taču jūs varat izmantot tērzēšanas robotu, lai palīdzētu jums izveidot perfektu uzvedni. Ja jūs cenšaties atdzīvināt vairāk uz detaļām orientētām idejām, mēģiniet ļaut Dvīņiem jums palīdzēt.
Lai uzzinātu vairāk, apskatiet labākos AI attēlu ģeneratorus un ceļvedi, kā rakstīt labāko AI attēlu uzvednes.