Home Tehnoloģija Ekspertu atbalstīti veidi, kā novērst AI attēla halucinācijas, izmantojot ChatGPT, Midjourney un...

Ekspertu atbalstīti veidi, kā novērst AI attēla halucinācijas, izmantojot ChatGPT, Midjourney un citus

24
0

Kā CNET AI attēlu un video ģeneratoru recenzentam viena no darba lielākajām priekšrocībām ir jautri sliktajiem, mežonīgi dīvainajiem un reizēm rāpojošajiem attēliem, ko šie ģeneratora rīki izspiež.

Nepārprotiet mani, AI radošā programmatūra īsā laikā ir gājusi garu ceļu. Esmu izveidojis skaistas zinātniskās fantastikas ainas filmā Midjourney, reālistiskus produktu attēlus, izmantojot stabilu difūziju, un AI uzlabojis sevi ar ChatGPT. Taču neviens AI pakalpojums nav ideāls, un testēšanas laikā esmu novērojis dažas ievērojamas tendences.

Ir lietas, kuras, neskatoties uz pastāvīgiem atjauninājumiem, AI attēlu ģeneratori vienkārši nevar tikt galā ar pirmo mēģinājumu.

Dažas AI attēlu programmas sniedz jums rīkus šo kļūdu rediģēšanai, kas ir lieliski. Es ļoti iesaku tos izmantot, kad vien iespējams. Programmām, kas nepiedāvā šos rīkus, vai, visticamāk, ja šie rīki neatrisina problēmu, tālāk ir jārīkojas.

Pamatojoties uz savu pieredzi, esmu apkopojis savus pārbaudītos padomus, kā pielāgot uzvednes un iestatījumus, lai optimizētu attēlus. Lai uzzinātu vairāk, skatiet labākos AI attēlu ģeneratorus un mūsu ceļvedi efektīvai AI attēlu uzvedņu rakstīšanai.

10 fotoattēli, kas parāda, ar ko AI attēlu ģeneratori visvairāk cīnās

Skatīt visas fotogrāfijas

Cilvēku sejas un izteiksmes

audekls-spāres

Katelyn Chedraoui, izmantojot Canva Magic Media AI / CNET

Precīzas sejas izteiksmes pastāvīgi izaicina AI ģeneratorus. Savdabīgas acis, zobi un uzacis ir vieni no spēcīgākajiem rādītājiem, kas liecina, ka attēls ir AI ģenerēts. Šajā gadījumā rezultāts man bija ārkārtīgi jocīgs, ja arī pilnīgi nelietojams. Meitenēm ir Helovīnam līdzīgi vampīru zobi, un čalim aizmugurē ir vairāk nekā slikta matu diena.

Mākslīgā intelekta ģenerēts attēls ar cilvēku, kurš izskatās saniknots aiz pārpildītās tīrīšanas līdzekļu kastes

Stīvens Šenklends, izmantojot Dall-E 3/CNET

Pat ar multfilmu vai nereālistiskiem varoņiem ģeneratoriem ir grūti regulēt emocijas un izpausmes. Šis attēls, ko izveidoja mūsu labākā izvēle Dall-E 3, pārāk pastiprināja uzvedni, un gala rezultāts bija pārāk dramatisks. Es esmu sevi identificējis kārtīgs ķēms, taču nevaru iedomāties, ka kāds būtu tik sarūgtināts par to, kas izskatās pēc simtiem dolāru vērtiem tīrīšanas līdzekļiem. Pat labākās programmas var neizdoties un radīt dīvainus rezultātus.

Kā to labot: Es iesaku lūgt pakalpojumu samazināt to cilvēku skaitu, kurus tas mēģina renderēt, tādējādi samazinot kļūdu iespējamību, un izmantot pēcpaaudzes rediģēšanas rīkus, lai atlasītu konkrētas attēla daļas, kuras ir jāģenerē vai jālabo. Izvēloties maigāku īpašības vārdu (“dusmīgs”, nevis “dusmīgs”), varētu palīdzēt pakalpojumam virzīt pareizo ceļu.

Ikoniskas rakstzīmes, preču zīmes un atpazīstami logotipi

canva-tiktok

Katelyn Chedraoui, izmantojot Canva Magic Media AI / CNET

Daudzu iemeslu dēļ AI attēlu ģeneratori reti var izveidot precīzus logotipus, zināmas preču zīmes vai citādi atpazīstamas rakstzīmes. Parasti tas notiek tāpēc, ka pastāv nopietnas juridiskas bažas par uzņēmumu, kas atļauj sava zīmola materiālus vai intelektuālo īpašumu izmantot AI pakalpojumiem. Tas varētu būt arī tāpēc, ka logotips vai zīmols, kuru vēlaties iekļaut, nav ģeneratora apmācības datos, tāpēc ģenerators nesapratīs jūsu pieprasījumu.

Divi neseni izņēmumi ir jaunās attēlu ģenerēšanas funkcijas tālruņos Google Pixel 9 un Pixel 9 XL, pateicoties Gemini AI, ko mūsu mobilo sakaru eksperti izmantoja, lai izveidotu attēlus ar precīza izskata Mikija peles un Pikaču atveidojumu. Otrs izņēmums ir daži maksājoši X (agrāk Twitter) lietotāji, kuri ziņo, ka var izmantot sociālo mediju vietnes Grok tērzēšanas robotu, lai reālistiskā izskata Miki un cilvēku politiskās figūras. Šie attēli joprojām nav ideāli atveidoti, taču tie ir diezgan tuvu.

Kā to salabot: Jūs nevarat, wager pluss ir tas, ka jums ir daudz lielāka iespēja izvairīties no tiesas prāvām par autortiesību pārkāpumiem. Ja saskaraties ar šo problēmu, iesaku vēlreiz pārskatīt dizaina koncepciju, lai noskaidrotu, vai varat saprast to pašu, neizmantojot konkrētu uzņēmuma nosaukumu vai logotipu. Vai jums tiešām ir nepieciešams TikTok logotips, vai arī jums ir nepieciešams, piemēram, tālrunis ar vertikālu video atskaņošanu.

Pārklājoši, sarežģīti elementi

leonardo kāpnes

Katelyn Chedraoui, izmantojot Leonardo AI / CNET

Ja attēlā ir pārāk daudz pārklājošu vai sarežģītu elementu, dažkārt ģenerators tiks izjaukts. Labākās AI attēlu programmas nesaskaras ar šo problēmu ļoti bieži, taču pat labākās programmas kādā brīdī neizdodas. Ar šo Leonardo attēlu manu sapņu bibliotēku sagrauj ripojošās kāpnes, kas pazūd pusceļā.

virtuves lete pilna ar garšvielām ar atvērtu pavārgrāmatu

Katelyn Chedraoui, izmantojot Canva Magic Media AI / CNET

Līdzīgi šis fotoreālistiskais virtuves attēls izskatās nevainojams, skatoties virspusēji, taču otrs skatiens vai ātra pietuvināšana parāda nejēdzīgas rakstzīmes, kas uzdrukātas uz pavārgrāmatas, un šķiet, ka pašai grāmatai ir divi muguriņi un trīs sadaļas. Šādi attēli parāda, cik apgrūtinoši var radīt AI attēlus — pat ja domājat, ka esat ieguvis uzvarētāju, nelieli trūkumi padara tos nelietojamus.

Kā to salabot: mēģiniet vienkāršot uzvedni vai izmantot pēcpaaudzes rediģēšanas rīkus, lai noteiktu problēmu un to novērstu. Dažreiz var palīdzēt arī estētikas maiņa; šīs problēmas parasti parādās, kad mēģināt izveidot fotoreālistiskus vai krājuma attēlus. Ja jūsu pakalpojums piedāvā noteiktu apgabalu rediģēšanas rīku, mēģiniet to izmantot, lai atlasītu apšaubāmo apgabalu un lūgtu ģeneratoru noņemt tajā esošo.

Pārmērīga rediģēšana un halucinācijas

futbola komanda svin uzvaru, neveiksmīgs lāse apakšējā labajā stūrī

Katelyn Chedraoui, izmantojot Midjourney AI / CNET

Lieliska AI attēlu ģeneratora pazīme ir tā spēja radīt attēlu ar nelielām kļūdām vai halucinācijām, vienlaikus nodrošinot pareizos rīkus šo problēmu novēršanai, kad tās neizbēgami parādās, taču ne katrs pakalpojums to dara. Šajā piemērā no Midjourney es izgāju vairākas rediģēšanas kārtas šim attēlam, kurā futbola komanda svin uzvaru, un man nav ne jausmas, kas notika, lai sasniegtu šo gala rezultātu, vai arī man nav ne jausmas, kas notiek ar lāsīti, kas, iespējams, ir spēlētājs attēla labajā pusē. Atklāti sakot, es domāju, ka arī Midjourney to nezināja.

Kā to salabot: Rediģējot AI attēlus, dažreiz mazāk ir vairāk. Nebaidieties izņemt pašreizējo attēlu sēriju un sākt no jauna. Bieži vien varat profilaktiski novērst lielas problēmas, uzlabojot uzvedni, lai vēlāk būtu jāuztraucas tikai par nelielu problēmu novēršanu.

AI ģeneratoriem joprojām ir vajadzīgs cilvēka darbs

leonardo-last-super-tmnt

Katelyn Chedraoui, izmantojot Leonardo AI / CNET

Man nav šaubu, ka uzņēmumi, kas ir aiz šiem AI ģeneratoriem, strādā, lai novērstu šīs problēmas un uzlabotu savus modeļus. Pagaidām nepilnīgi attēli mums vēlreiz parāda, ka, lai gan šī tehnoloģija tiek uzlabota, tā nav nevainojama. Es ceru, ka tāpēc, ka daudzi no šiem pakalpojumiem saskaras ar līdzīgām problēmām, tie visi meklēs risinājumus šīm problēmām.

Noslēgumā es jums atgādināšu, ka, kopīgojot attēlu, vislabāk ir atzīmēt vai atzīt, ka attēls ir ģenerēts AI. AI attēliem kļūstot labākiem un reālistiskākiem, svarīgāk nekā jebkad agrāk ir atšķirt AI radīto mākslu no cita veida medijiem.

Lai uzzinātu vairāk, skatiet mūsu padomus par labāko AI attēla uzvedni un mūsu labāko AI attēlu ģeneratoru izvēli.



avots