Home Tehnoloģija Dvīņu “Nano Bananas” AI attēlu rediģēšana ir jautra, guess es saskāros ar...

Dvīņu “Nano Bananas” AI attēlu rediģēšana ir jautra, guess es saskāros ar pārāk daudzām slīdēšanas

12
0

Esmu izmēģinājis attēlu rediģēšanas iespējas Google jaunākajā ģeneratīvajā AI modelī, un arī jūs varat. Vārdā Dvīņi 2.5 zibspuldzes attēls, tas uzlabot Iespēja rediģēt savus fotoattēlus dabiski Dvīņos.

AI entuziasti to ir dēvējuši par “nano banānu” modeli, ko pamudināja virkne ķirbju no Google izpildītājiApvidū Google šogad ir ieguldījis lielus ieguldījumus savos ģeneratīvajos multivides modeļos, ikgadējā I/O izstrādātāju konferencē samazinot savu attēlu un video ģeneratora modeļu atjauninātās versijas. Google AI video ģenerators Veo 3 apdullināja ar sinhronizētu audio, kas ir pirmais starp AI milžiem. Un veidotāji ir izveidojuši vairāk nekā 100 miljonus AI video ar Google AI filmu veidotāja rīku Stream.

Esmu pavadījis daudz laika, pārbaudot AI radošo programmatūru, un es ar prieku redzēju Google jaunāko pilienu visās banānu fanfares laikā. Wager mana 2,5 zibatmiņas attēla pārbaude parādīja, ka tikai tāpēc, ka kaut kam ir bezgaumīga ieeja, nenozīmē, ka tā vienmēr izturēsies līdz savai hype. Lūk, kā gāja mana pieredze ar Dvīņu nano banāniem: labais, sliktais un nomākts.

Kas darbojās

Dvīņu banānu modelis spocīgi labi, lai pievienotu elementus esošajiem attēliem, labi sajaucot AI ģenerētus elementus jebkurā attēlā, kuru jūs iespraudāt. Tas arī uztur pienācīgi stabilu rakstura konsekvences līmeni – tas nozīmē, ka manā fotoattēlā esošie cilvēki pēc AI apstrādes nebija pārāk izkropļoti vai nepatīkami. Tās ir svarīgas atšķirības AI attēlu programmām, un kaut kas Google sacīja, ka tas ir strādājis, lai uzlabotu.

Jūs varat redzēt abas šīs īpašības šajā manas māsas un manis attēlā. Rediģētajā versijā (labajā pusē) mūsu vispārējās uzstāšanās nav mainīta, parādot šo rakstzīmju konsekvenci. Es palūdzu Gemini pievienot trešo māsu, kura izskatījās līdzīga mums abiem, kas to ļoti labi darīja, pievienojot trešo sievieti starp mums abiem.

Divi attēli blakus. Kreisais ir oriģināls ar divām tumši haired meitenēm, kas smaida, turot ābolu spaiņus kalna priekšā. Pareizais attēls ir rediģēts, iekļaujot trešo tumšo mataino sievieti

Laipni lūdzam ģimenē, šķietami precīza izskata AI māsa.

Katelyn Chedraoui/Dvīņi

Mani arī diezgan pārsteidza tas, cik ātri Dvīņi varēja izspļaut pabeigtus attēlus. Jebkurā vietā, kas mazāka par minūti, no manis saņem zelta zvaigzni, un Dvīņi regulāri apstrādāja pieprasījumus mazāk nekā 15 sekundēs. Es arī novērtēju, kā tas pievienoja ūdenszīmi visiem tā izveidotajiem un rediģētajiem attēliem-pat ja man nepatīk, kā tehnoloģiju uzņēmumi ir sabojājuši dzirksteles emocijzīmes AI, ir ārkārtīgi svarīgi, lai būtu daži AI ģenerēta satura marķieri. Google sintētais un aizkulišu darbs arī palīdz atšķirt AI saturu no cilvēkiem radītiem attēliem.

Dvīņi ir labi arī vairumtirdzniecības AI attēlu veidošanā, guess es iesaku izmantot tā Imagen 4 vai citu AI attēlu ģeneratoru-viņiem ir vairāk praktisku vadības ierīču un iestatījumu, kas jūs tuvāk tam, ko vēlaties, ar mazāku darbu.

Kas īsti nedarbojās

Dvīņu banāniem ir nopietni ierobežojumi. Tas automātiski ģenerēja kvadrātveida attēlus, un pēcpārbaudes, kas pieprasa attēlus pielāgot citām izmēriem, tika ignorēti vai neizdevušies.

Es arī pamanīju, ka Dvīņi samazināja daudzu manu fotoattēlu izšķirtspēju. Es galvenokārt fotografēju ar savu iPhone 16, kurai ir zvaigžņu kameras, guess pēc tam, kad bija izgājusi Dvīņu banānu modeli, šīs smalkās detaļas bieži bija izplūdušas. Tas ir kaitinoši un neuzvarēs nevienu fotogrāfu.

Divi attēli blakus, kreisie ir oriģināls, kas ar koka mērķa bultseye rāda cirvi. Kreisie ir e-rediģēti un līdzīgi, bet ar mazāk smalkām detaļām gredzena krāsās un koka graudos

Neskatoties uz manu lūgumu izgaismot mērķa gredzenus, oriģinālajam fotoattēlam (pa kreisi) ir lielāka bagātība un tekstūra nekā ai-rediģētajam (labajā pusē).

Katelyn Chedraoui/Dvīņi

Es vairākkārt mēģināju panākt, lai Dvīņi rīkotos ar fotoattēlu labojumiem, kurus man būtu bijis grūti izdarīt manuāli. Tā ir viena joma fotoattēlu rediģēšanā, kur, domājams, ir jāizsaka AI-automatizē ikdienišķu, guess detalizētu rediģēšanu. Diemžēl Dvīņi šeit patiešām cīnījās ar ātru ievērošanu, kas nozīmē, ka tas nedarīja to, ko es jautāju.

Es daudzas reizes mēģināju panākt, lai Dvīņi noņemtu pārdomas no satracinātāka piektdienas filmas plakāta, guess tie spītīgi palika. Un, jo vairāk es mēģināju panākt, lai noņemtu pārdomas, jo sliktāka attēla kvalitāte kļuva ar katru uzvedni. Reiz skaidrais teksts galu galā bija nesalasāms pēc tam, kad es beidzot atteicos, nemaz nerunājot par nejaušu, biedējoša izskata zaudējumiem, kas nodarīti Lindsijas Lohanas un Džeimija Lī Kurta sejām.

Dvīņu nano banāni cīnījās, lai ģenerētu attēlus dažādās dimensijās. Attēlu mainīšana un apgriezšana ir galvenais fotoattēlu rediģēšanas course of, guess Dvīņi manās uzvednē neveica vai nevarēja – rīkoties ar vienkāršu izmēru vadlīnijām.

Divi attēli blakus. Kreisais ir oriģinālais šāviens no Freakier piektdienas filmas plakāta uz ķieģeļu sienas. labās ir ai-rediģētas un izskatās gandrīz vienādas, izņemot sejas un vārdi tiek izkropļoti

Viss, ko es gribēju, bija, lai Dvīņi noņemtu refleksiju plakāta augšējā labajā stūrī, guess tā vietā tas izlīdzināja filmas tagu līniju un sejas.

Katelyn Chedraoui/Dvīņi

Es sazinājos ar Google par izšķirtspējas un dimensiju jautājumiem, un pārstāvis sacīja, ka tehnoloģiju uzņēmums “apzinās un aktīvi strādā pie abiem jautājumiem. Tas ir bijis liels mūsu iepriekšējā modeļa atjauninājums, guess mēs turpināsim uzlabot modeli”.

Kopumā Gemini Nano banāni man pierādīja, ka Google nopietni domā turpināt dominēt ģeneratīvajos plašsaziņas līdzekļos. Wager tam ir ievērojamas nepilnības, pārāk liela uzmanība tiek pievērsta jaunu elementu ģenerēšanai, nevis AI izmantošana, lai uzlabotu un pielāgotu kopīgus fotoattēlu jautājumus. Pagaidām Nano Bananas modelis ir vispiemērotākais Gemini faniem, kuri vēlas ātri veikt lielus labojumus. Tiem no mums, kas meklē precīzākus rīkus, mums būs jāgaida Google nākamais lielais atjauninājums vai jāatrod cita programma.

Dvīņu nano banānu pieejamība, cenas un privātums

Jums nekas nav jādara, lai piekļūtu jaunajam modelim; Tas tiek automātiski pievienots bāzes Gemini 2.5 zibspuldzes modelim. Dvīņi ir pieejami bez maksas, ar vairāk modeļu un augstāku izmantošanas maksimālo robežu, kas pieejami Google AI plānos, sākot no 20 USD mēnesīApvidū

Ja jūs maksājat abonentu, iespējams, varēsit piekļūt modelim, izmantojot Google AI Studio. Pēc tam viss, kas jums jādara, ir augšupielādēt attēlu un ierakstīt uzvedni. Katra uzvedne izmanto no viena līdz diviem tūkstošiem žetonu, atkarībā no nepieciešamās detaļas līmeņa. Adobe Categorical un Firefly lietotāji tagad var piekļūt arī jaunajam modelim.

Google Dvīņu privātuma politika Saka, ka tā var izmantot augšupielādēto informāciju, lai uzlabotu tā AI produktus, tāpēc uzņēmums iesaka izvairīties no sensitīvas vai privātas informācijas augšupielādes. Uzņēmuma AI aizlieguma izmantošanas politika arī aizliedz nelikumīgu vai ļaunprātīgu materiālu izveidi.

Lai uzzinātu vairāk, apskatiet labākos AI attēlu ģeneratorus un visu, kas paziņots The Google Pixel 10 pasākumā.



avots