Home Tehnoloģija Noslēpumains projekts “Nano-Banana” ir atklāts kā Google jaunākais attēlu redaktors

Noslēpumains projekts “Nano-Banana” ir atklāts kā Google jaunākais attēlu redaktors

8
0

Google vienkārši uzlaboja savu AI attēla modeli, un tas faktiski izskatās diezgan nozīmīgs solis uz augšu. Uzņēmums šodien izvērsa Gemini 2.5 Flash Picture, kas ir galvenais atsvaidzinājums, kas sola gudrāku un elastīgāku attēlu ģenerēšanu.

Jauninātais modelis ļauj lietotājiem izdot dabiskās valodas uzvednes ne tikai ģenerēt attēlus, guess arī apvienot esošos fotoattēlus un veikt precīzākus labojumus, neradot dīvainus kropļojumus. Tas arī piesaista Dvīņu “pasaules zināšanas”, lai labāk saprastu, ko tas rada.

Šis jauninājums notiek, kad Google mēģina novērst plaisu ar nozares vadītāju Openai. Agrāk attēlu ģenerēšana ir bijis galvenais AI virzītājspēks. Chatgpt lietojums strauji pieauga martā, kad uzņēmums uzsāka savu GPT-4O vietējo attēlu ģeneratoru. Vīrusu studijas Ghibli memes, kas ģenerēta modelī, izraisīja uzņēmuma GPU modeļi kūstpēc Openai izpilddirektora Sema Altmana teiktā. Chatgpt šobrīd ir beidzies 700 miljoni nedēļas lietotāju. Salīdzinājumam – Google izpilddirektors Sundars Pichai uzņēmuma jūlija ieņēmumu izsaukumā atklāja, ka Dvīņi bija 450 miljoni ikmēneša lietotājujoprojām atrodas aiz Chatgpt.

https://www.youtube.com/watch?v=bi-wi2q_xog

Ar savu jaunāko atjauninājumu Google saka, ka tas ir atrisinājis vienu no AI lielākajām galvassāpēm. Līdz šim rakstzīmes vai objekti konsekventi vairākos labojumos ir bijis galvenais izaicinājums AI attēlu ģeneratoriem.

VaiTagad jūs varat ievietot to pašu rakstzīmi dažādās vidēs, parādīt vienu produktu no vairākiem leņķiem jaunos iestatījumos vai radīt konsekventus zīmola aktīvus, vienlaikus saglabājot subjektu ”,” Uzņēmums rakstīja a emuāra ierakstsApvidū

Google saka, ka lietotāji tagad var veikt ļoti specifiskus pielāgojumus tikai uzvednei. Piemēram, lietotāji var izjaukt attēla fonu, noņemt traipu no t-krekla, mainīt subjekta pozu vai pat pievienot krāsu melnbaltu fotoattēlam.

Pat pirms oficiālās atklāšanas jaunais modelis pagrieza galvu uz Crowdsourced novērtēšanas platformu Lmarena, kur tas parādījās anonīmi ar nosaukumu “Nano-Banana”. Viens X lietotājs Dalījās, kā viņi fotoattēlā izmantoja Nano-Banana, lai mainītu Altmana kreklu. Rezultāts bija pārsteidzoši labs. Mūsdienās Google pakāpās uz priekšu un pieprasīja īpašumtiesības uz modeli, atklājot, ka Nano-Banana faktiski bija Gemini 2.5 zibspuldzes attēls.

Papildus tam, ka tas ir pieejams Dvīņu lietotnē, jaunais modelis tagad ir pieejams izstrādātājiem caur Gemini API, Google AI studiju un Vertex AI. Google jau ir izveidojis vairākas veidņu lietotnes, kurās tiek izmantots jaunais modelis vietnē Google AI Studio, uzņēmuma kodēšanas AI palīgs, un sacīja, ka lietotāji var papildināt kodu.

Uzņēmums arī sacīja, ka daži izstrādātāji jau ir eksperimentējuši ar lietotni, lai redzētu, kā tas būtu noderīgi reālās pasaules scenārijos, piemēram, nekustamā īpašuma saraksta kartīšu, darbinieku vienveidīgu nozīmīšu un produktu maketu izveidošana.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here