Home Tehnoloģija Google Gemini 2.5 zibspuldzes attēls ‘Nano Banana’ modelis parasti ir pieejams

Google Gemini 2.5 zibspuldzes attēls ‘Nano Banana’ modelis parasti ir pieejams

8
0

Havier Zayas Images/second, izmantojot Getty Photographs

Sekojiet zdnet: Pievienojiet mūs kā vēlamo avotu Google.


ZDNET galvenie pārņemšana

  • Google modernākais attēlu modelis ir pieejams visiem.
  • Pirmoreiz tas kļuva slavens ar koda nosaukumu “Nano-Banana”.
  • Tagad modelim ir 10 dažādas malu attiecības.

Gemini 2.5 Flash Picture, Google vismodernākais attēlu ģenerējošais AI modelis, kas citādi pazīstams kā “Nano Banana”, kas oficiāli ieviests augustā, oficiāli ir ārpus tā pārbaudes posma un gatavs pilntiesīgai, reālās pasaules lietošanai, uzņēmumam paziņots Ceturtdiena.

Arī: Openai’s Sora 2 palaiž ar ārprātīgi reālistisku video un iPhone lietotni

Papildus tam, ka tas ir vispārpieņemts, Gemini 2.5 Flash Picture tagad ir 10 malu attiecības četros stilos (ainava, laukums, portrets un “elastīgs”), ļaujot “bez piepūles satura veidošanas dažādos formātos, sākot no kinematogrāfiskām ainavām līdz vertikāliem sociālo mediju ziņām”, Google rakstīja paziņojumā.

Uzņēmums arī publicēja arī Izstrādātāju dokumenti un “pavārgrāmata“Lai palīdzētu lietotājiem sākt darbu ar Gemini 2,5 zibatmiņu, kas maksā 0,039 USD par attēlu.

Kāpēc tas izceļas

Tagad pieejams caur Gemini API Google AI studijā un uzņēmuma lietošanai, izmantojot Vertex AI, modelis ir pazīstams ar spēju saglabāt subjekta konsekvenci dažādos attēlu kopumos.

Arī: mans jaunais mīļākais Photoshop AI rīks ļauj man apvienot attēlus vienā klikšķā – un es nevaru apstāties

Piemēram, zīmoli var radīt viena un tā paša produkta attēlus vairākās vidēs, dodot viņiem vairāk iespēju izvēlēties. Tāpat lietotāji var ģenerēt sevis vai izdomātu rakstzīmju attēlus, kas valkā dažādus tērpus, teiksim, neuztraucoties par modeli, kas pievieno negodīgus pirkstus, vai krītošu upuri pārējiem halucinējošiem quirks, par kuriem attēlu ģenerējoši AI rīki ir kļuvuši bēdīgi slaveni.

Gemini 2.5 Flash Picture arī specializējas arī nelielu rediģēšanas attēlos, pamatojoties uz dabiskās valodas instrukcijām (“noņemiet šo marināras traipu no mana krekla, lūdzu”) un sakausēt vairākus attēlus kopā, starp citām tehniskām spējām.

Vai vēlaties vairāk stāstu par AI? Reģistrējieties AI līderu sarakstāmūsu iknedēļas biļetens.

Pirms tā oficiāla debija -Un pirms Google pat bija publiski pieprasījis to kredītu-modelis tika izmantots koda nosaukuma “Nano-Banana” un ātri kļuva par superzvaigznes priekšskatījuma modeli par Lmarena. Tajā pašā dienā, kad tas tika publiski ieviests augusta beigās, Adobe paziņots ka tam varētu piekļūt caur tā Firefly un Categorical instrumentiem.

Ūdens zīmogs un DeepFakes

Daudzi izstrādātāji lielā mērā iegulda attēlu ģenerējošos AI rīkos, cenšoties tos pārdot veidotājiem un uzņēmumiem kā rentablām alternatīvām ilgstošām un dārgām personām. Tikai šonedēļ Openai izlaida Sora 2, kas ir jaunākais modelis aiz sava Sora AI video ģeneratora, kurš parādīja milzīgus fotoreālisma uzlabojumus.

Arī: meta reklāmdevējiem dod jaunus AI personalizācijas rīkus – vienlaikus izmantojot tērzēšanu, lai mērķētu saturu

Tā rezultātā tehnoloģija ir strauji attīstījusies, radot tādu instrumentu uzliesmojumu, kas dažu sekunžu laikā var radīt fotoreālistiskus attēlus, kā arī DeepFakes straumi. Bez visaptveroša federālā regulējuma tehnoloģiju uzņēmumiem bija jāuzņemas atbildība par caurspīdīguma pasākumu veidošanu savos attēlu ģenerējošos rīkos, lai pārliecinātos, ka viņu lietotāji zina, kad viņi redz kaut ko, ko rada mašīna-vai nē.

Visi attēli, kas izveidoti vai rediģēti, izmantojot Gemini 2.5 zibatmiņu, ietver neredzamu sintētisko ID ūdenszīmi, saskaņā ar Google, kas nozīmē, ka tos var identificēt kā AI ģenerētu ar citu modeli, kas īpaši apmācīts šim mērķim, wager, iespējams, ne cilvēka acs.



avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here