AI attēlu un video modeļi nav cilvēki, taču tiem ir atšķirīgas “personības”, norāda veidotāji, kuri tos izmanto. Jaunā parādība ir reakcija uz strauji augošo ģeneratīvo AI nozari, uzsverot, kā radītāji pārvalda galvu reibinošu izvēli.
Ģeneratīvā AI pēdējos gados ir piedzīvojusi milzīgu izaugsmes pieaugumu, taču tas notika tikai 2025. AI attēls, video un citi ģeneratīvie mediju modeļi ieņēma galveno vietu. Līdzīgi kā tērzēšanas roboti ir no jauna definējuši teksta ģenerēšanu, šie radošie AI modeļi pārveido satura veidošanu un radošo darbu uz labu vai sliktu.
Google un OpenAI jau sen ir bijuši līderi AI sacīkstēs. Pirms šī gada viņi bija pazīstami ar savu Dvīņi un ChatGPT tērzēšanas roboti. Tagad Veo 3, nano banāns un Sora 2 ir izvirzījuši tehnoloģiju titānus pārliecinoši vadošo lomu radošu AI modeļu vidū. Jaunas AI inovācijas no Adobe un AI radošajiem jaunajiem uzņēmumiem, piemēram SkrejceļšPika un Luma, arī šogad ir stiprinājuši laukumu.
Lai mākslīgā intelekta uzņēmumi saglabātu konkurētspēju pārpildītajā tirgū, ģeneratīvie mediji no nišas piedāvājuma ir kļuvuši par obligātu nepieciešamību. Uzņēmumi koncentrējas uz savu AI modeļu jaunināšanu, lai saglabātu priekšrocības un piesaistītu jaunus lietotājus. Uzlabojumi parasti ietver detalizēta satura izveidi ar augstāku izšķirtspēju un videoklipiem ietver skaņu un pagarina klipu ilgumu. Halucinācijas vai kļūdas pazūd ar katru modeļa atjauninājumu, tāpēc tas kļūst arvien grūtāks lai pamanītu AI radītu saturu.
Kopumā AI satura izveidei nekad nav bijis tik daudz iespēju. Kad veidotājiem ir jāizvēlas izmantojamais modelis, vairs nav nozīmes tam, kurš modelis nodrošinās izmantojamus rezultātus. Tagad notiek debates par to, kurš būs vispiemērotākais konkrētam projektam vai uzdevumam. Rezultātā katram AI modelim tagad ir sava personība.
Nepalaidiet garām nevienu no mūsu objektīva tehniskā satura un laboratorijas pārskatiem. Pievienojiet CNET kā vēlamo Google avotu.
AI rīku humanizēšana ar personībām
Radītāji lieto terminu “personības” sarunvalodā — AI modeļi nav cilvēki, un tāpēc tiem nav personību. Šis termins patiešām attiecas uz modeļa spēju veikt konkrētus uzdevumus un tā reputāciju kā izcilību noteiktās jomās. Tas attiecas arī uz katra modeļa individuālo stilu sākotnējā līmenī.
“Radītāji humanizē šos rīkus. Viņi tos sauc par “radošo” vai “detalizēto”, jo viņi veido reālas attiecības ar savu AI. Tā vairs nav tikai programmatūra,” sacīja Tifānija Kjaze (@TechTiff), dibinātājs AI plūsmas klubskas māca cilvēkiem izmantot AI rīkus. “Šīs personības palīdz radītājiem veidot uzticēšanos ar saviem rīkiem, strādāt ar radošiem blokiem un atrast darbplūsmas komfortu.”
Radītājiem, kuri ikdienā izmanto AI rīkus, pareizā modeļa izvēle ir kļuvusi par radošā procesa neatņemamu sastāvdaļu, līdzīgi kā pareizā kameras objektīva vai otas izvēle.
“Katrs modelis pasauli interpretē atšķirīgi; daži ir kinematogrāfiski, citi sirreālāki vai sapņaināki,” sacīja Deivs Klārksdirektors un galvenais radošais darbinieks plkst Apsolīt AIAI ražošanas studija. “Man galvenais ir zināt, kā uztvert savu radošo redzējumu un pārvērst to vizuālās valodas uzvednēs, kas ļauj man sasniegt vēlamo mākslinieciskumu.”
Katra modeļa personības atklāšanai ir mācīšanās līkne. Dažreiz to pat nenosaka uzņēmums, kas to veido; tas atšķiras dažādos attēlos un videoklipos, kā arī dažādās viena modeļa paaudzēs. Daļēji tas ir saistīts ar to, kā tiek veidoti modeļi.
“Daļa no tā, ko mēs mācāmies, kad mēs apmācām savus modeļus, ir apmācības procesa beigās, jūs varat parādīt modelim noteiktu stilu, un modelis zināmā mērā pielāgosies šim stilam vai pielāgosies šim stilam un būtībā iegūs personību,” sacīja Aleksandru Kostins, Adobe ģeneratīvā AI viceprezidents. “Tāpēc mēs redzam ļoti izteiktus modeļus, kas to dara. Citi cenšas būt neitrālāki.”
Apmācības dati, kas tiek izmantoti modeļa izveidei un uzlabošanai, arī spēlē lomu katra modeļa bāzes stila izstrādē. Piemēram, Adobe Firefly modeļi tika apmācīti, izmantojot licencētus Adobe Inventory attēlus, tāpēc Firefly ģenerētais saturs bieži vien izskatās kā krājums. (Kostins teica, ka uzņēmums strādā, lai to labotu, lai radītu reālistiskākus rezultātus.)
Kāda ir katra AI attēla un video modeļa personība?
Esmu pavadījis daudz laika ar šiem AI modeļiem, un veidotājiem, ar kuriem es runāju, bija līdzīgas idejas un pieredze man pašam attiecībā uz katra modeļa personību. Šeit ir dažas no populārākajām modeļu personībām.
- Google Veo 3 (video): kinematogrāfiska, dabiska kustība, augsta kvalitāte
- Flux (video): izceļas ar reālismu, īpaši attiecībā uz cilvēka iezīmēm
- Skrejceļš (video): pilna radošā studija, lieliski piemērota tiem, kam nepieciešama praktiska kontrole
- Sora (video): noder idejām un izpētei, mēmi priekš Sora sociālo mediju lietotne
- Pusceļš (attēls un video): Radošākie modeļi, vislabāk piemēroti mākslinieciskam vai stilizētam darbam
- Google nano banāns (attēls): vislabāk piemērota rakstzīmju konsekvencei, piemērota e-komercijai un darbam sociālajos medijos
- Adobe Firefly attēla modelis 5 (attēls): komerciāli droši rezultāti profesionālam darbam
Jūs pamanīsit arī atšķirīgas personības starp tērzēšanas robotiem. ChatGPT ir pazīstams ar savu sirsnīgo, pievilcīgo toni (dažreiz kaitinoši tā), savukārt Claude ir populārs izpētes rīks, un Gemini ir ērta izvēle Google lietotājiem. Tomēr AI attēlu un video modeļu atšķirīgās personības — stili, estētika, iedzimtas preferences utt. — ir daudz skaidrākas.
Lai gan jūs varat izveidot gandrīz jebkuru ainu ar AI attēlu un video ģeneratoriem, tie nav “visas mašīnas”, kādas var būt tērzēšanas roboti. Radītājiem, kuri izmanto AI radošos rīkus profesionālam darbam, bieži vien ir jāatstāj īpašs saturs. Izpratne par katra modeļa personību ir ļoti svarīga.
Vairāku modeļu izmantošanas priekšrocības
Ideja par lēcienu starp AI modeļiem un programmām sākotnēji var nešķist pievilcīga, taču AI saraksta paplašināšana sniedz priekšrocības.
Klārks un viņa komanda izmantoja dažādus AI modeļus jaunam īsfilma viņš režisēja ar nosaukumu Mans draugs Zefs. Šī hibrīda filmu veidošanas metode, kā to sauc Klārks, iesaistīja komandu, izmantojot AI rīkus, piemēram, Adobe Firefly, Google Veo 3.1 un Luma’s Ray3, kā arī Adobe tradicionālo programmatūru, tostarp Photoshop un Premiere Professional.
“Sajaucot vairākus modeļus, jūs iegūstat radošu diapazonu un precizitāti, gandrīz kā ar speciālistu komandu,” sacīja Klārks. “Mēs varam vizualizēt stāsta pasauli daudz agrāk, atkārtot ātrāk un izdarīt stingrākas radošas izvēles, pirms mēs sāksim filmēšanas laukumā.”
Daži satura veidotāji ir uzticīgi konkrētiem mākslīgā intelekta rīkiem un platformām, un, iespējams, vilcinās darboties. Šī ideja par AI lojalitāti ir nedaudz nepareiza, sacīja Kyazze. Radītāji, kas gūst vislabākos rezultātus, ir “agnostiķi ar rīkiem un koncentrējas uz mērķi”.
“Vairāku modeļu darbplūsmu patiesais ieguvums ir tas, ka jūs nepiespiežat vienu rīku darīt visu. Jūs izmantojat katra modeļa faktiskās stiprās puses. Tas nav tikai efektīvāk. Tas sniedz jums labākus rezultātus, jo katrai konkrētai sava projekta daļai izmantojat pareizo rīku,” sacīja Kyazze.
Attīstās personības
AI modeļu jēdziens ar personībām ir salīdzinoši jauns, pateicoties nesenajam radītājiem pieejamo modeļu skaita pieaugumam. Taču tās nav statiskas etiķetes; modeļa reputācija un personība laika gaitā var mainīties. Tiklīdz tiek ieviesti jauni atjauninājumi, modeļi, kas kādreiz bija zināmi kā briesmīgi, veicot konkrētu uzdevumu, var tikt uzlaboti.
Šī tendence ir vēl viena zīme, ka AI spēlē arvien lielāku lomu radošajā darbā. Tas neattiecas uz visiem satura veidotājiem, jo daudzi ir pret AI un nevēlas to izmantot. Wager tiem, kas interesējas, nekad nav bijis vairāk izvēles.
Atšķirīgu personību izveide mākslīgā intelekta attēlu un video modeļiem ir viens no veidiem vai risinājums, kā palīdzēt viņiem izvēlēties pareizo rīku, lai sasniegtu labākus rezultātus, netērējot pārāk daudz laika un naudas AI rīkiem, kas nav vislabāk piemēroti.
Lai gan ģeneratīvo mediju modeļi ir daudz uzlabojušies, tie joprojām nav ideāli. Pielāgošanās katra modeļa stiprajām un vājajām pusēm ir gudrs darbplūsmas dizains, sacīja Kyazze. Ir svarīgi arī atcerēties, ka AI modeļi ir tikai rīki, sacīja Klārks.
“Mākslinieka cilvēciskā izpausme – mūsu personība un radošais skatījums – ir tas, kas patiesi virza rezultātus,” sacīja Klārks. “Tas nav par tradicionālā procesa aizstāšanu; tas ir par iespējamā paplašināšanu un iztēles tuvināšanu ekrānam vairāk nekā jebkad agrāk.”
(Informācijas atklāšana: Ziff Davis, CNET mātes uzņēmums, aprīlī iesniedza prasību pret OpenAI, apgalvojot, ka tas ir pārkāpis Ziff Davis autortiesības apmācībā un AI sistēmu darbībā.)












