Midjourney, viens no populārākajiem AI attēlu paaudzes jaunuzņēmumiem, trešdien paziņoja izlaist no tā ļoti gaidītā AI video ģenerēšanas modeļa V1.
V1 ir attēla-video modelis, kurā lietotāji var augšupielādēt attēlu-vai uzņemt attēlu, ko ģenerē viens no citiem Midjourney modeļiem-un V1 izveidos četru piecu sekunžu videoklipu komplektu, pamatojoties uz to. Līdzīgi kā Midjourney attēlu modeļi, V1 ir pieejams tikai caur Discord, un tas ir pieejams tikai tīmeklī palaišanas laikā.
V1 atklāšana Midjourney konkurē ar AI video ģenerēšanas modeļiem no citiem uzņēmumiem, piemēram, Openai’s Sora, Runway’s Gen 4, Adobe’s Firefly un Google’s Veo 3. Lai gan daudzi uzņēmumi ir koncentrējušies uz vadāmu AI video modeļu izstrādi, ko izmanto komerciālos iestatījumos, MidJourney vienmēr ir izcēlusies ar saviem atšķirīgajiem AI attēla modeļiem, kas ir radoši veidi.
Uzņēmums saka, ka tai ir lielāki mērķi saviem AI video modeļiem, nevis B-Roll ģenerēšana Holivudas filmām vai reklāmas nozares reklāmām. A blogot Submit, Midjourney izpilddirektors Deivids Holzs saka, ka tā AI video modelis ir nākamais uzņēmuma solis uz savu galamērķi, izveidojot AI modeļus “spējīgu reāllaika atvērtās pasaules simulācijas”.
Pēc AI video modeļiem Midjourney saka, ka plāno izstrādāt AI modeļus 3D apmetumu ražošanai, kā arī reāllaika AI modeļiem.
Midjourney V1 modeļa atklāšana notiek tikai nedēļu pēc tam, kad startup iesūdzēja tiesā divi no Holivudas bēdīgi slavenākajām filmu studijām: Disney un Common. Uzvalks apgalvo, ka Midjourney AI attēlu modeļu radītie attēli attēlo studijas autortiesības aizsargātos rakstzīmes, piemēram, Homēru Simpsonu un Dartu Vaderu.
Holivudas studijas ir cīnījušās, lai stātos pretī pieaugošajai AI attēla un video ģenerējošo modeļu popularitātei, piemēram, Midjourney attīstās. Arvien lielākas ir bailes, ka šie AI rīki varētu aizstāt vai devalvēt radošo darbu darbu attiecīgajās jomās, un vairāki plašsaziņas līdzekļu uzņēmumi apgalvoja, ka šie produkti ir apmācīti viņu ar autortiesībām aizsargātiem darbiem.
Kamēr Midjourney ir mēģinājis sevi atšķirt kā atšķirīgi no citiem AI attēlu un video startiem – vairāk koncentrējoties uz radošumu nekā tūlītējām komerciālām lietojumprogrammām, startēšana nevar izvairīties no šīm apsūdzībām.
Lai sāktu, Midjourney saka, ka tas iekasēs 8x vairāk par video ģenerēšanu, nevis par tipisku attēlu ģenerēšanu, kas nozīmē, ka abonentiem, veidojot videoklipus, būs ievērojami ātrāki no ikmēneša piešķirtajām paaudzēm nekā attēli.
Palaišanas laikā lētākais veids, kā izmēģināt V1, ir, abonējot Midjourney 10 USD par mēnesi pamata plānu. Midjourney’s 60-Mon-Month Professional plāna un 120 USD mēneša Mega plāna abonentiem būs neierobežotas video paaudzes uzņēmuma lēnākajā “Relaks” režīmā. Nākamā mēneša laikā Midjourney saka, ka tā pārvērtēs cenu noteikšanu video modeļiem.
V1 nāk ar dažiem pielāgotiem iestatījumiem, kas lietotājiem ļauj kontrolēt video modeļa izvadi.
Lietotāji var atlasīt automātisko animācijas iestatījumu, lai attēla pārvietošanās nejauši pārvietotu, vai arī viņi var izvēlēties manuālu iestatījumu, kas lietotājiem ļauj tekstā aprakstīt īpašu animāciju, kuru viņi vēlas pievienot savam videoklipam. Lietotāji var arī pārslēgt kameras un subjekta kustības daudzumu, iestatījumos izvēloties “zemu kustību” vai “augstu kustību”.
Kaut arī videoklipi, kas ģenerēti ar V1, ir tikai piecas sekundes gari, lietotāji var izvēlēties tos pagarināt par četrām sekundēm līdz četrām reizēm, kas nozīmē, ka V1 video varētu iegūt pat 21 sekundes.
Līdzīgi kā Midjourney AI attēlu modeļi, V1 videoklipu agrīnās demonstrācijas izskatās nedaudz citādi, nevis hiperreālistiskas. Sākotnējā reakcija uz V1 ir bijusi pozitīva, lai gan joprojām nav skaidrs, cik labi tā atbilst citiem vadošajiem AI video modeļiem, kas tirgū ir bijuši vairākus mēnešus vai pat gadus.