Google jaunina savu Dvīņu tērzēšanu ar jaunu AI attēla modeli, kas lietotājiem nodrošina precīzāku fotoattēlu rediģēšanas kontroli, soli, kas paredzēts, lai panāktu Openai populāros attēlu rīkus un piesaistītu lietotājus no Chatgpt.
Atjauninājums, ko sauc par Gemini 2.5 Flash Picture, tiek parādīts, sākot no otrdienas visiem lietotājiem Dvīņos, kā arī izstrādātājiem, izmantojot Dvini API, Google AI Studio un Vertex AI platformas.
Dvīņu jaunais AI attēlu modelis ir paredzēts, lai precīzāk rediģētu attēlus – balstoties uz lietotāju dabiskās valodas pieprasījumiem -, saglabājot seju, dzīvnieku un citu detaļu konsekvenci, ar kaut ko tādu, ar ko cīnās visvairāk konkurējošie rīki. Piemēram, palūdziet Chatgpt vai Xai’s Grok fotoattēlā mainīt kāda cilvēka krekla krāsu, un rezultāts var ietvert izkropļotu seju vai mainītu fonu.
Google jaunais rīks jau ir pievērsis uzmanību. Pēdējās nedēļās sociālo mediju lietotāji uzbudināts Vairāk par iespaidīgu AI attēlu redaktoru Crowdsourced novērtēšanas platformā Lmarena. Modelis lietotājiem parādījās anonīmi ar pseidonīmu “Nano-Banana”.
Google saka, ka tas ir aiz modeļa (ja tas nebija acīmredzams jau No visiem ar banāniem saistītajiem padomiem), kas patiešām ir vietējā attēla spēja tā vadošajā Gemini 2.5 Flash AI modelī. Google saka, ka attēla modelis ir vismodernākais Lmarena un citiem etaloniem.

“Mēs patiešām virzām vizuālo kvalitāti uz priekšu, kā arī modeļa spēju ievērot instrukcijas,” intervijā TechCrunch sacīja Nicole Brichtova, kas ir produkta vadība vizuālās ģenerēšanas modeļos Google Deepmind.
“Šis atjauninājums veic daudz labāku darbu, padarot labojumus nemanāmāk, un modeļi ir izmantojami visam, ko vēlaties tos izmantot,” sacīja Brichtova.
AI attēlu modeļi ir kļuvuši par kritisku kaujas vietu Large Tech. Kad Openai martā uzsāka GPT-4O vietējo attēlu ģeneratoru, tas caur jumtu izmantoja Chatgpt lietošanu, pateicoties AI ģenerētās studijas Ghibli mēmu neprātam, kas, pēc Openai izpilddirektora Sema Altmana teiktā, atstāja uzņēmuma GPUS “kūstošs.
Lai neatpaliktu no Openai un Google, Meta pagājušajā nedēļā paziņoja, ka tas licencēs AI attēlu modeļus no starta Midjourney. Tikmēr A16Z atbalstītās vācu vienradzis melno mežu laboratorijas turpina dominēt etalonos ar saviem plūsmas AI attēlu modeļiem.
Varbūt Dvīņu iespaidīgais AI attēlu redaktors var palīdzēt Google aizvērt savu lietotāja plaisu ar Openai. Chatgpt tagad reģistrē vairāk nekā 700 miljonus nedēļas lietotāju. Google ieņēmumu zvanā jūlijā tehnoloģiju giganta izpilddirektors Sundars Pichai atklāja, ka Dvīņiem ir 450 miljoni ikmēneša Lietotāji – kas nozīmē, ka iknedēļas lietotāji ir vēl zemāki.
Brichtova saka, ka Google īpaši izstrādāja attēla modeli ar patērētāju lietošanas gadījumiem, piemēram, palīdzot lietotājiem vizualizēt savus mājas un dārza projektus. Modelim ir arī labākas “pasaules zināšanas”, un tā var apvienot vairākas atsauces vienā uzvednē; Piemēram, vienā saliedētā apzīmējumā apvienojot dīvāna, viesistabas fotoattēlu un krāsu paleti.

Kamēr Dvīņu jaunais AI attēlu ģenerators lietotājiem atvieglo veidošanu un rediģēšanu, uzņēmumam ir aizsardzības pasākumi, kas ierobežo to, ko lietotāji var radīt. Google pagātnē ir cīnījies ar AI attēlu ģeneratora aizsardzības pasākumiem. Vienā brīdī uzņēmums atvainojās par to, ka Dvīņi vēsturiski ģenerēja neprecīzus cilvēku attēlus un pavisam atgāja AI attēlu ģeneratoru.
Tagad Google uzskata, ka tas ir panākts labākā līdzsvarā.
“Mēs vēlamies lietot lietotājiem radošu kontroli, lai viņi no modeļiem varētu iegūt to, ko viņi vēlas,” sacīja Brichtova. “Wager tas nav tā, kā kaut kas notiek.”
Google pakalpojumu noteikumu ģeneratīvā AI sadaļa aizliedz lietotājiem ģenerēt “nekonsensus intīmus attēlus”. Šķiet, ka tie paši aizsardzības pasākumi neeksistē grokam, kas lietotājiem ļāva izveidot AI ģenerētus skaidri attēli atgādina slavenības, piemēram, Teilore Svifta.
Lai risinātu DeepFake attēlu pieaugumu, kas lietotājiem var apgrūtināt to, kas ir īsts tiešsaistē, Brichtova saka, ka Google pieliek vizuālas ūdenszīmes AI ģenerētiem attēliem, kā arī identifikatoriem tās metadatos. Tomēr kāds, ritinot garām tēlu sociālajos medijos, var nemeklēt šādus identifikatorus.