Home Tehnoloģija Kas ir Sora? Viss, kas jums jāzina par OpenAI video ģeneratoru

Kas ir Sora? Viss, kas jums jāzina par OpenAI video ģeneratoru

21
0

Ja pēdējo nedēļu laikā esat bijis sociālo mediju tuvumā, jūs būtu redzējis vilni AI radīts videoklipi, kas klīst tur, un savāc miljoniem skatījumu. Daudzi no tiem tiek ražoti Sorā, ChatGPT māsas AI rīks.

Sora ir ģeneratīvs video modelis izstrādāts OpenAI, kas pārveido teksta aprakstus, attēlus vai video ievades īsos videoklipos. Šis rīks ļauj rakstīt kaut ko līdzīgu “plastmasas maisiņš, kas peld pa gaisu, vēja nests” un saņemt atbilstošu videoklipu.

Pamudinājums, ko izmantoju, veidojot šo videoklipu programmā Sora, bija: “Plastmasas maisiņš, kas peld pa gaisu, ko nes vējš. Tas iet garām kokiem, vienā mirklī gandrīz atsitoties pret zemi, guess vējš to atkal nes gaisā. Dabisks apgaismojums, mierīga ainava.”

Barbara Pazura/Sora

OpenAI pirmo reizi atklāja Sora 2024. gada sākumā un padarīja to pieejamu ChatGPT Plus un Professional abonentu pagājušā gada decembrī. Modelis ir balstīts uz OpenAI agrākajām teksta pārveides sistēmām, piemēram, Dals-Eguess izmanto jaunas arhitektūras, kas paredzētas dabiskākai kustībai un vizuālai konsekvencei.

(Informācijas atklāšana: Ziff Davis, CNET mātes uzņēmums, aprīlī iesniedza prasību pret OpenAI, apgalvojot, ka tas ir pārkāpis Ziff Davis autortiesības apmācībā un AI sistēmu darbībā.)

Nejauciet OpenAI Sora video paaudzes darbvirsmas rīku ar jauno sociālo tīklu iOS un Android lietotne ar tādu pašu nosaukumu vai ar nesaistītu Sora lasīšanas lietotne. Sociālā lietotne darbojas Sora 2savukārt darbvirsmas versijā atkarībā no reģiona var izmantot oriģinālo modeli vai Sora 2.

Kā darbojas Sora

Sora ir difūzijas modelis. Tas sāk video veidošanu ar statisku trokšņu ekrānu un pakāpeniski to noņem, līdz formas, faktūras un kustība veido saskaņotu ainu, kas atbilst teksta uzvednei. Sora 2 modelis, kas tika izlaists 30. septembrī, atbalsta arī sinhronizētu dialogu un skaņas efektus, savukārt iepriekšējās versijas ražoja tikai klusus klipus.

Sora sadala attēlus un kadrus mazos datu gabalos, ko sauc par ielāpiem, kas palīdz izprast kustību, faktūru un detaļas dažādos formātos un garumos. Šie ielāpi darbojas līdzīgi kā valodu modeļu marķieri, kas sadala tekstu mazākās vienībās, piemēram, vārdos vai pieturzīmēs, ļaujot AI rīkam apstrādāt un ģenerēt izvadi.

Varat augšupielādēt tekstu, nekustīgus attēlus un īsus videoklipus kā sākumpunktus, kā arī iestatīt garumu no 5 līdz 20 sekundēm ar izšķirtspēju no 480p līdz 1080p pašreizējā publiskajā versijā.

Sora AI video ģeneratora ekrānuzņēmums

Sora modelē, kā tādi elementi kā ziedi uzvedas un mijiedarbojas reālajā pasaulē.

Sora / CNET ekrānuzņēmums

Papildus izpratnei par uzvednē aprakstīto Sora arī modelē, kā šie elementi uzvedas un mijiedarbojas reālajā pasaulē. Vecākiem modeļiem bija problēmas simulēt šīs darbības. Piemēram, videoklipā, kurā kāds ēd cepumu, var izlaist koduma atzīmi. Sora tagad precīzāk simulē šīs cēloņu un seku detaļas. Pat tā, OpenAI atzīst ka Sora 2 “joprojām pieļauj noteiktas kļūdas”, neskatoties uz to, ka tā “labāk ievēro fizikas likumus salīdzinājumā ar iepriekšējām sistēmām”.

Lai iegūtu detalizētus norādījumus par to, kā izmantot Sora, lai izveidotu AI video, izlasiet mūsu ceļvedi nākamais.

Ko jūs varat darīt ar Sora

Cenšoties izveidot ciešākas attiecības ar profesionāliem satura veidotājiem, Sora ir ieviesusi funkcijas, kas iepriekš bija rezervētas uzlabotiem video rīkiem. Jaunā sižeta veidošanas opcija, kas ir pieejama Plus un Professional lietotājiem darbvirsmā, ļauj veidotājiem pirms videoklipu ģenerēšanas iezīmēt ainas, līdzīgi kā filmu veidotāji plāno kadrus.

Ekrānuzņēmums ar Sora premium sižeta funkciju

Sora tagad ir aprīkots ar storyboarding, lai jūs varētu ieskicēt un plānot ainas pirms videoklipu ģenerēšanas.

Sora / CNET ekrānuzņēmums

Līdz šim lielākā daļa Sora klipu ir bijuši īsi un ikdienišķi. Tomēr atjauninājumi, piemēram, storyboarding, ilgāks izpildlaiks un augstāka izšķirtspēja, liecina, ka OpenAI mērķis ir padarīt platformu piemērotu slīpētākam un profesionālākam darbam.

Daži mākslinieki, piemēram Arvida Bestrēmair veiksmīgi izmantojuši AI attēlus radoši, radoši paplašinot iespējas. Kad mākslīgā intelekta rīks izkropļo ķermeni, piemēram, pievienojot papildu ekstremitāti vai pārveidojot to dīvainā veidā, Byström uzskata to par mākslas daļu, nevis kļūdu. Viņa atstāj vietu modeles interpretācijai, atrodot skaistumu šajos negadījumos un nepazīstamajās formās, kas rodas no “AI pārpratuma par ķermeni”.

Wager lielākajai daļai cilvēku tas ir saistīts ar ērtībām, nevis mākslinieciskumu. Ģeneratīvais mākslīgais intelekts kļūst par īsceļu ātrai, tendencēm balstīta satura izlaišanai, kas piedāvā maz vai nav nekādas vērtības, guess ir paredzēts tikai izklaides nolūkiem, t.s. AI slīpums.

“Labākajā gadījumā cilvēki to vienkārši ignorē,” saka Nataniels ĀtrsUSC Marshall’s Neely Ētiskās vadības un lēmumu pieņemšanas centra direktors. “Otrais labākais scenārijs, tas galu galā ir liels traucēklis… sliktākajā gadījumā tas patiešām iedragās mūsu uzticības sajūtu un mūsu spēju saprast, kas ir īsts.”

Baistrēms piebalso šīm bažām par izaicinājumiem atšķirt īsto no viltus.

“Varbūt viena laba lieta ir tā, ka mēs beidzot sāksim apšaubīt to, ko mēs redzam,” saka Byström. “Vizuālais attēls vienmēr ir bijis spēcīgs, taču, kad to ir tik viegli viltot, cilvēki var atgriezties pie uzticamākiem avotiem.”

Sora pieejamība, piekļuve un izmaksas

OpenAI ir sadalījis Sora pieejamību divos komponentos: darbvirsmas tīmekļa rīks, kas paredzēts profesionālai lietošanai, un mobilā lietotne, kas galvenokārt paredzēta sociālo video veidošanai un kopīgošanai.

Ja vēlaties izveidot augstas kvalitātes, garas formas saturu, vislabākā izvēle ir tīmekļa saskarne, jo tā piedāvā uzlabotas funkcijas, piemēram, sižetu un ilgāku video ilgumu.

CNET AI atlanta emblēmas māksla; noklikšķiniet, lai redzētu vairāk

Bezmaksas Sora lietotnes operētājsistēmās iOS un Android sākās tikai ar ielūgumiem. Kopš oktobra beigām cilvēki ASV, Kanādā, Japānā un Dienvidkorejā ir spējuši piesakieties bez koda. Uzņēmums plāno paplašināt piekļuvi papildu valstīm.

Mobilā lietotne lielā mērā koncentrējas uz īsas formas videoklipu izveidi, remiksēšanu un kopīgošanu, kas atgādina TikTok, padarot to par pirmo sociālo pieredzi.

Sora lietošanas izmaksas ir integrētas esošajos ChatGPT abonēšanas plānos. Ja jums ir bezmaksas ChatGPT konts, jūs saņemat ierobežotu dienas naudu aptuveni 30 Sora paaudzēm.

Core Sora funkcionalitāte ir pieejama ChatGPT Plus abonentiem par USD 20 mēnesī, piešķirot dāsnu dienas naudu video paaudzēm. Profesionāļiem, kuriem nepieciešama labāka izvade, Professional abonements maksā 200 USD mēnesī un nodrošina izcilas funkcijas, tostarp augstākas izšķirtspējas videoklipus, ilgāko ilgumu un iespēju lejupielādēt darbus bez ūdenszīmes.

Tā kā platformas pieprasījums strauji pieauga, OpenAI ieviesa a atalgojuma modelis ikvienam, kurš sasniedz savu ikdienas bezmaksas limitu. Tādējādi varat iegādāties nelielus papildu video paaudžu komplektus par aptuveni 4 ASV dolāriem par 10 paciņu.

Strīdi un citi jautājumi

Izmantojot Sora, OpenAI pārgāja no attēlu ģenerēšanas uz video, vēl vairāk paplašinot traucējumus, ko attēlu modeļi ir radījuši grafikas un ilustrāciju nozarē. Videoklipu izveidi, kam kādreiz bija nepieciešamas lielas komandas vai specializēta programmatūra, tagad var veikt, izmantojot uzvedni tālrunī. Tas varētu mainīt filmu, izklaides un mediju ražošanas ekonomiku, kā arī cilvēku uzticības līmeni tam, ko viņi redz.

Kad manipulēts video izplata dezinformāciju vai uzdodas par sabiedrībā zināmām personāmtā ir mūsu problēma nevajadzētu ignorēt. OpenAI Līdzība Nepareizas izmantošanas filtrs ir izstrādāts, lai neļautu jums izveidot videoklipus, kuros attēloti reāli cilvēki bez piekrišanas. Ja kāds mēģina Sorai norādīt slavenības vārdu vai atpazīstamu personu, sistēma vai nu bloķē pieprasījumu, vai atgriež kļūdas ziņojumu.

Sora 2 arī ieviesa Cameo funkciju, kas ļauj augšupielādēt savu līdzību, lai izveidotu sev AI versiju un kontrolētu, kā tā tiek izmantota. Jūs jebkurā laikā varat izlemt, kurš videoklipos var iekļaut jūsu epizodi, noņemt piekļuvi vai dzēst klipus, kuros jūs attēlojat. Drīz pēc palaišanas, slavenību video platforma Cameo iesniedza tiesā prasību pret OpenAIapgalvojot, ka šī funkcija varētu radīt neskaidrības par zīmolu un maldināt sabiedrību, liekot šķist, ka tā ir saistīta ar uzņēmumu vai to apstiprina uzņēmums.

Sākotnēji Sora 2 izmantoja an atteikšanās politika ar autortiesībām aizsargātām rakstzīmēmkas nozīmē, ka tiesību īpašniekiem bija jāpieprasa izslēgšana, ja viņi nevēlējās, lai tiktu izmantots viņu materiāls. tomēr atbildot uz pretreakcijuOpenAI paziņoja, ka tā ir piešķirot tiesību īpašniekiem “precīzāku kontroli”, tuvojoties izvēles modelim, kurā satura veidotājiem ir jāpiešķir atļauja, nevis vienkārši pēc fakta jāizslēdz saturs.

Viljams Šulcspartneris plkst Tirgotājs un Gouldskoncentrējoties uz interneta tiesībām un jaunām tehnoloģijām, stāsta CNET, ka, lai gan Sora aizsardzības pasākumi tiek uzlaboti, tie joprojām ir nepilnīgi. Dažkārt varat apiet līdzības filtrus, un sistēma laiku pa laikam atzīmē nekaitīgu saturu. Viņš saka, ka galu galā tas ir “pārredzamība un atbildīga lietošana”.

“Uzņēmumiem, kas paļaujas uz AI sistēmām, lai radītu reklāmas un saturu, var nebūt iespējas iegūt autortiesību reģistrāciju, kas ir nepieciešama autortiesību īstenošanai,” viņš saka, piebilstot, ka potenciāls risinājums varētu būt “cilvēku radīta satura pievienošana izvadei”.

Papildus juridiskajām problēmām ir arī ētiskas problēmas.

“Es vēlētos redzēt, ka OpenAI izlaiž produktus, kuru mērķis ir kalpot, piemēram, atrisināt problēmas vai palīdzēt mums sasniegt šos izvirzītos mērķus, lai padarītu sevi labākus. Man ir grūti saprast, ko Sora 2 dara, izņemot tikai naudas pelnīšanu,” CNET stāsta Fasts.

Ja video ģenerēšana kļūs plaši izplatīta, radīšanas, izplatīšanas un autentiskuma ekonomika krasi mainīsies.Tas norāda uz ģeneratīvā AI pagriezienu no muļķīgiem attēliem sākumā uz kinofilmām tuvākajā nākotnē. Dažiem satura veidotājiem tas nozīmē jaunu potenciālu. Visiem pārējiem tas nozīmē jaunu piesardzību.

Quick saka, ka jauni rīki vienmēr ir aizraujoši un atraisa jaunu potenciālu, taču brīdina, ka “vispārējais uzdevums ir novirzīt paradigmu tehnoloģiju ekosistēmā no mentalitātes, kas gūst peļņu, pirmkārt, ar mērķi vēlāk, uz AI mentalitāti, kuras mērķis ir pirmais.”


Nepalaidiet garām nevienu no mūsu objektīva tehniskā satura un laboratorijas pārskatiem. Pievienojiet CNET kā vēlamo Google avotu.




avots