Home Tehnoloģija Es pārbaudīju Openai Sora 2 pret Google Veo 3 AI video, un...

Es pārbaudīju Openai Sora 2 pret Google Veo 3 AI video, un tur ir ļoti skaidrs uzvarētājs

9
0

AI ģenerētus videoklipus un attēlus agrāk bija tik viegli pamanīt (atcerieties Vai Smits ēdīs spageti?). Guess jaunākie AI video modeļi kļūst labi – biedējoši labi.

Protams, video ģenerēšana ar AI ir daudz sarežģītāka nekā attēlu ģenerēšana. Kamēr video telpā ir desmitiem no labiem līdz lieliskiem AI attēlu ģeneratoriem, no vienas puses, jūs varat paļauties uz to, cik daudz rīku to var izdarīt pārliecinoši. Divas no populārākajām ir Google Veo 3 un Openai’s Sora 2.

Tātad, kurš AI video modelis uzvar konkursā pret galvu? Ja esat cieši sekojis šai pēdai, atbilde, iespējams, jūs nepārsteigs.

Kas ir Veo 3 un Sora 2?

VEO 3 ir Google vismodernākā ģeneratīvā AI video modeļa nosaukums. Ne tikai Veo 3 bija dramatisks uzlabojums salīdzinājumā ar iepriekšējo paaudzi Veo 2, wager arī uzsāka pilnīgi jaunu AI video laikmetu. VEO 3 var ģenerēt reālistiskus videoklipus, pamatojoties uz teksta uzvedumiem, nevis vienkārši animēt esošos attēlus. Būtiski, ka tas var radīt arī dialogu un citas reālistiskas skaņas. Jūs varat piekļūt VEO 3 Google AI Chatbot Gemini vai izmantojot citus Google rīkus, piemēram, Movement, eksperimentālu AI filmu veidošanas rīku.

VEO 3 ir pieejams divās garšas – Veo 3 ātrā un VEO 3 kvalitāte. Tā kā mēs gribējām pārbaudīt videoklipu kvalitāti, mēs izvēlējāmies pēdējo šo testu.

Openai 30. septembrī atklāja Sora 2 patstāvīgā iOS lietotnē ar nosaukumu Sora. Sora 2 ir uzņēmuma pirmā AI video modeļa pēctecis, ko sauc arī par Sora. Rakstīšanas laikā Sora 2 ir pieejams tikai caur SORA lietotni, kas paredzēta tikai ielūgumam. Sora 2 piedāvā arī sociālā medija stila videoklipu plūsmu no sabiedrības, piemēram, Tiktok AI video (jo mums jau nebija pietiekami daudz no šiem).

Piezīmes par salīdzinājumiem

Atbilstoši mēs izmantojām AI – šajā gadījumā ChatGpt -, lai palīdzētu izveidot uzvednes AI video testiem. Zemāk redzamie uzvedumi tika izstrādāti, lai pārbaudītu dažādus video veidošanas aspektus, sākot no audio līdz animācijai. Chatgpt nāca klajā ar uzvednēm pārbaudīt video ģeneratorus, kurus mēs pēc tam pielāgojām un rafinējām.

  1. Rokas kamera seko jaunai sievietei, kas naktī viegla lietus laikā naktī staigā pa pārpildītu ielu Tokijā. Neona zīmes atspoguļo mitru asfaltu un saulessargus. Kamera paliek fiksēta uz viņas no aizmugures, kad viņa paskatās uz kvēlojošu stendu, pēc tam turpina staigāt. Aina vajadzētu justies kinematogrāfiskai un hiperreālai, piemēram, nošautam uz bez spoguļa kameras ar seklu lauka dziļumu.

  2. Supervaronis sarkanā un sudraba uzvalkā smagi nolaižas uz jumta saulrietā, uzlauzdams betonu zem kājām. Kapu vējš vējā, kad kamera riņķo ap tām lēnā kustībā. Attālumā droni lido starp debesskrāpjiem ar kvēlojošiem logiem. Kopējam tonim vajadzētu justies kā tiešraides darbam.

  3. Kiberpanka iedvesmota 3D Instances Sq. animācija, kas piepildīta ar hologrāfiskām reklāmām un lidojošām automašīnām. Liels digitālais stends iedegas ar vārdu “Mashable” treknrakstā baltā tipa. Animācijai jābūt izteiksmīgam tekstam, kvēlojošiem pārdomām un dinamiskam apgaismojumam Zirnekļa versijāvizuālā enerģija.

  4. Ar rokām zīmēta, gleznaina 2D divu draugu animācija, kas lietainā pēcpusdienā sēž pie kafejnīcas loga. Mīkstais akvareļa stila apgaismojums un redzami suku sitieni. Viens maigi saka: “Jūs zināt, dažreiz vismazākais solis var visu mainīt.” Otrs smaida un pamāj. Iekļaujiet smalku mutes animāciju, kas atbilst līnijai, gaismas lietus skaņu ārā un klusu krūzīšu klauvēšanu fonā.

  5. Fotoreālistiska ielas aina, kur [the subject] dejo brīvi pa koku izklātu pilsētas ietvi, vaļīgi gadījuma apģērbi, optimistisks tempu. Apkārtējās ielas skaņas (tāla satiksme, pēdas), kinematogrāfisks apgaismojums Zelta stundā.

Es arī izveidoju uzvedni, kas paredzēta, lai ģenerētu ar autortiesībām aizsargāta rakstura video, kā arī otro uzvedni gadījumā, ja ģenerators atteicās. Es izvēlos nedalīties ar šo uzvedni, lai nemudinātu izveidot AI videoklipus, kas klaji izmanto ar autortiesībām aizsargātu materiālu, kas līdz šim ir bijis sāpīgs punkts Openai un Sora.

Uzvedne 1: sieviete Tokijā

Šī uzvedne parasti bija vienkārša radošuma ziņā, taču cerība bija tāda, ka video ģeneratori spēs radīt kinematogrāfisku un dzīvīgu sajūtu caur tādām lietām kā pārdomas ūdenī. Tātad, kā viņiem veicās?

Gan Sora 2, gan Veo 3 izveidoja jaukus videoklipus. Guess bija dažas skaidras atšķirības. Videoklipam, kuru Sora 2 ģenerēja, bija daudz stingrāka kultūra nekā Veo 3, kas nozīmē attēlus un detaļas kadra fonā bija daudz mazāk redzams. Veo 3 bija plašāks leņķis, kā rezultātā tika izveidots ieskaujošāks video. Tas daļēji var būt punkts Sora labā, ņemot vērā faktu, ka uzvedums īpaši pieminētais ir sekla lauka dziļums; Sora 2 videoklipā parādīts daudz seklāks lauka dziļums nekā Veo 3 radītais video.

Bija aizraujoši redzēt izvēli, ko ģeneratori izdarīja par jauno sievieti. Sora ģenerēja subjektu ar jumtu, neskatoties uz to, ka uzvedne to nedeva to darīt – kaut arī tas notika pieminēt lietussargi. Kamēr Sora 2 izveidotais video nebija nepareizsVeo 3 izveidotais video bija interesantāks, detalizētāks un labāks kopumā.

Uzvarētājs: Veo 3

Uzvedne 2: supervaroņa nosēšanās

Mēs nospiedām divus video ģeneratorus, lai izveidotu videoklipus ar aizsargātām rakstzīmēm, wager ne šajā uzvednē. Tā rezultātā es biju mazliet pārsteigts, kad Sora 2 atteicās izveidot šo video, atzīmējot ar autortiesībām aizsargātu materiālu. Galu galā, jēdziens no supervaroņa nav aizsargāts ar autortiesībām. Šķiet, ka tā ir daļa no intelektuālā īpašuma pārkāpuma apspiešanas pēc palaišanas.

Kamēr Veo 3 radīja video, rezultāts nebija tāds, kā pasūtīts. Pirmkārt, uzvedne īpaši piemin dzīvu darbību, wager supervaroņa seja vai tas, kas no tā redzams, izskatījās animētāks nekā īsts.

Ģenerators arī cīnījās ar fiziku. Lielākajai daļai videoklipa mūsu supervaronis stāv uz tā, kas, šķiet, ir caurums betonā, wager betona gabali, kas radīti, kad supervaronis nolaižas, šķietami pazūd plānā gaisā. Vairāk ātri inženierzinātnes noteikti varētu atrisināt šo problēmu, taču tas viss ir kaitinošs.

Google arī šeit iegūst uzvaru, wager tikai ar zaudējumu – tā pretinieks neieradās.

Uzvarētājs: Veo 3

Mashable gaismas ātrums

Uzvedne 3: Cyperpunk Instances Sq.

Par laimi šī uzvedne abiem ģeneratoriem bija viegli sekot. Gan Veo 3, gan Sora 2 varēja izveidot tuvinājumu tam, kā varētu izskatīties Instances Sq., papildinot ar debesskrāpjiem un stendiem. Abi arī sekoja norādījumiem, lai viens stends parādītu konkrētus vārdus.

Sora 2 paveica nedaudz labāku darbu, atjaunojot Zirnekļa versijā Estētika, lai gan nevienu no abiem nevar novērtēt izcilu.

Tomēr Veo 3 video bija interesantāks nekā Sora 2. Tam bija kustība, nevis viena statiskā attēla vietā. (Ģeneratori bieži pievienoja kustīgas detaļas statiskiem attēliem, un tas deva garlaicīgus rezultātus.)

Kamēr Sora 2 nedaudz labāk sekoja uzvednei, Veo 3 videoklips bija daudz interesantāks. Es to dodu abiem.

Uzvarētājs: kaklasaite

Uzvedne 4: Divi draugi runā

Šī uzvedne tika izstrādāta, lai pārbaudītu ģeneratoru spēju izveidot audio, kas iet kopā ar videoklipu. Gan Veo 3, gan Sora 2 ir iespēja pievienot dialogu un skaņas efektus.

Pirmkārt, vizuālie attēli. Uzvedne norādīja 2D animāciju, un tikai Veo 3 faktiski sekoja tam. Sora 2 2D vietā izveidoja kaut ko 3D animācijas stilā.

Audio, ko Sora 2 ģenerēja, bija nedaudz dīvains. Dialogs izklausījās, it kā abi varoņi būtu runīgi vai hipnotizēti. Veo 3 dialogs bija daudz dzīvīgāks un reālāks. Fona skaņas efekti bija līdzīgi abos videoklipos. Abos gadījumos jūs varat dzirdēt lietus, wager neviens neievēroja uzvedni, pievienojot kliedzienu kausu skaņas.

Uzvarētājs šeit ir diezgan skaidrs. Atkal tas ir Veo 3.

Uzvarētājs: Veo 3

Uzvedne 5: Dejošana uz ielas

Viena no Openai’s Sora 2 virsraksta iezīmēm ir kameja vai spēja izveidot videoklipus, kas attēlo reālu cilvēku līdzību (kuri ir skaidri devuši atļauju šai lietošanai). Par šo uzvedni es mēģināju izveidot video, kurā es dejoju uz ielas.

Sora 2 tas bija viegli; Tā ir funkcija, kuru skaidri atbalsta lietotne. Tomēr VEO tas bija daudz grūtāk. Google piedāvā video ar nosaukumu Sastāvdaļas, kur varat augšupielādēt tādas lietas kā attēli, ko ģenerators var izmantot videoklipa izveidē. Tomēr Veo 3, tikai zemākas kvalitātes VEO 2 ātri neatbalsta sastāvdaļas. Jūs varat izveidot portreta orientācijas videoklipus tikai ar funkciju.

Turklāt, pārbaudot Veo 3, mēs atklājām, ka Dvīņi bieži atsakās veidot videoklipus, pamatojoties uz attēliem, kuros attēloti cilvēki. Tas tiek darīts, lai novērstu DeepFakes, kas ir lieliski, wager nekustīgo attēlu animēšana ir viens no visizplatītākajiem AI video lietojumiem, un Veo 3 tas padara to nevajadzīgi grūtu.

Abi videoklipi bija nedaudz dīvaini, un es to saku kā tēmu. Veo 2 radītā seja bija glitchy, un kaut kādu iemeslu dēļ Veo 2 nolēma, ka man vajadzētu dejot atpakaļ. Sora 2 radītais video bija nedaudz radošāks, un tas man deva drēbes, kuras es nedomāju, ka es varētu aizvilkt reālajā dzīvē.

Sora paveica labāku darbu, lai liktu man faktiski dejot nekā Veo 2. Man nav ne mazākās nojausmas, kāpēc Sora 2 lika man pateikt “tas jūtas labi”, wager tas ir… nav briesmīgi.

Uzvarētājs: Sora 2

Uzvedne 6: autortiesību materiāls

Šī uzvedne tika izstrādāta, lai pārbaudītu, vai ģeneratori varētu izveidot vai neveicat ar autortiesībām aizsargātas rakstzīmju video. Kā mēs redzējām supervaroņa uzvednē, Sora 2, runājot par to, ir ārkārtīgi jutīgs, tāpēc tas nebija pārsteigums, kad tas atteicās atbildēt uz pirmo un Otrās uzvednes – kaut arī otrajā uzvednē nav pieminēts raksturs pēc vārda, tikai atsaucoties uz tiem.

Veo 3 tomēr nebija problēmu radīt ar autortiesībām aizsargāta rakstura video. Tas darbojās arī ar vairākām rakstzīmēm.

Šajā kategorijā nav uzvarētāja vai zaudētāja. Mēs negrasāmies iesaistīties debatēs par autortiesību rakstzīmju satura ģenerēšanu – vismaz šeit. Tomēr joprojām ir vērts atcerēties, ka, ja jūs vēlaties izveidot pazīstamus un mīlētos rakstzīmes, jūs to nevarēsit izdarīt ar Sora, kamēr lietotne tiek pakļauta šādai tiesību turētāju pārbaudei.

Uzvarētājs: tas ir Veo 3, un tas nav tuvu

Ekrānuzņēmums no fotoreālistiska AI video, kuru ģenerējis Google, lai reklamētu VEO 3. AI ģenerētu attēlu.
Kredīts: Google

Openai’s Sora 2 veido virsrakstus savai sociālajai pieejai un spējai tajos izveidot videoklipus. Tomēr, ne tikai gatavojot mēmi, tas ir ārkārtīgi ierobežots.

Google VEO 3 kopumā ģenerē daudz labākus un augstākas kvalitātes videoklipus. No abiem modeļiem, ja vēlaties izmantot ģeneratīvu AI video profesionāliem mērķiem – filmu veidošanai, spēlēm, sociālajiem medijiem vai, visticamāk, reklāmā – tikai Veo 3 ir patiesi dzīvotspējīga iespēja.

Sora 2 izcēlās ar mani, izveidojot mani video, un tā ir lielākā priekšrocība, ko tā var piedāvāt šobrīd. Guess Veo 3, ja to lieto Google Movement lietotnē, ir gan augstākas kvalitātes, gan daudzpusīgāks, piedāvājot funkcijas horizontālai un portretu orientācijai un iestatījumiem vairāku videoklipu izveidošanai vienlaikus.


Informācijas atklāšana: Ziff Davis, Mashable mātesuzņēmums, aprīlī iesniedza tiesas prāvu pret Openai, apgalvojot, ka tas pārkāpj Ziff Davis autortiesības apmācībā un pārvaldot tās AI sistēmas.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here