Home Tehnoloģija Dvīņu nano banāns uzlabo attēlu rediģēšanu un kontroli uzņēmumu mērogā – guess...

Dvīņu nano banāns uzlabo attēlu rediģēšanu un kontroli uzņēmumu mērogā – guess tas nav ideāls

13
0

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt


Google Izlaists Gemini 2.5 Flash Picture, jauns modelis, kuru daudzi beta lietotāji zināja kā Nanobanana, kas uzņēmumiem dod lielāku izvēli radošiem projektiem. Tas ļauj viņiem ātri un ar lielāku kontroli mainīt attēlu izskatu, nekā tas, ko piedāvāja iepriekšējie modeļi.

Modelis tiks integrēts Dvīņu lietotnē.

Modelis, kas veidots uz Gemini 2.5 zibspuldzes, pievieno vairāk iespēju vietējā attēla rediģēšanai Dvīņu lietotnē. Gemini 2.5 Flash attēls uztur rakstzīmju līdzību starp dažādiem attēliem, un, rediģējot attēlus, ir lielāka konsekvence. Ja lietotājs augšupielādē sava mājdzīvnieka fotoattēlu un pēc tam lūdz modeli mainīt fonu vai pievienot cepuri savam sunim, Gemini 2.5 zibspuldzes attēls to darīs, nemainot attēla tēmu.

“Mēs zinām, ka, rediģējot sevi vai cilvēkus, kurus jūs labi pazīstat, smalkām nepilnībām ir nozīme, attēlojums, kas ir“ tuvu, guess ne gluži tāds pats ”, nejūtas pareizi,” Google sacīja emuāra ierakstā, ko raksta Dvīņu lietotnes Multimodal Era Lead David Sharon un Google Deepmind Gemini Picture Product Product Nicole Brihtova. “Tāpēc mūsu jaunākais atjauninājums ir paredzēts, lai jūsu draugu, ģimenes un pat jūsu mājdzīvnieku fotoattēli izskatās konsekventi kā viņi paši.”


AI mērogošana sasniedz savas robežas

Strāvas robežas, pieaugošās marķiera izmaksas un secinājumu kavēšanās ir uzņēmuma AI pārveidošana. Pievienojieties mūsu ekskluzīvajam salonam, lai atklātu, kā ir labākās komandas:

  • Enerģijas pārvēršana par stratēģisku priekšrocību
  • Arhitektējot efektīvus secinājumus par reālu caurlaidspējas pieaugumu
  • Konkurences IA atbloķēšana ar ilgtspējīgām AI sistēmām

Nostipriniet savu vietu, lai paliktu priekšā:


Viens no sūdzībām uzņēmumiem un dažiem individuāliem lietotājiem bija tas, ka, pamudinot labojumus uz AI ģenerētiem attēliem, nelieli pielāgojumi pārāk daudz maina fotoattēlu. Piemēram, kāds var uzdot modelim pārvietot cilvēka pozīciju attēlā, un, lai gan modelis dara to, kas tam teikts, personas seja tiek nedaudz mainīta.

Visos Gemini ģenerētajos attēlos būs Google sintētais ūdenszīme. Modelis ir pieejams visiem apmaksātajiem un bezmaksas lietotņu lietotājiem.

Spekulācijas, ka Google plāno izlaist jaunu attēlu modeli, nikns bija nikns sociālo mediju platformās. LM arēnā lietotāji redzēja noslēpumainu jaunu modeli ar nosaukumu Nanobanana, kas sekoja “sarežģītām, daudzpakāpju instrukcijām ar iespaidīgu precizitāti”, kā Andressen Horowitz partneris Justīne Mūra to ievietoja amatā.

Drīz cilvēki pamanīja, ka nanobanānas modelis, šķiet, nāk no Google, pirms vairāki agrīnie testētāji to apstiprināja. Lai arī tajā laikā Google neapstiprināja, ko plānoja darīt ar modeli LM arēnā.

Līdz šai nedēļai spekulācijas par to, kad modelis iznāks, turpinās, kas savā ziņā ir pravietisks.

Liela daļa uztraukuma rodas kā cīņa starp modeļu pakalpojumu sniedzējiem, lai piedāvātu spējīgākus un reālistiskākus attēlus un labojumus, parādot, cik spēcīgi ir kļuvuši multimodāli modeļi.

Tomēr Google joprojām ir jācīnās no konkurentiem, piemēram, Qwen un tā nesen izlaistais Qwen-Picture Edit un Openaikas ChatGpt pievienoja vietējo AI attēlu rediģēšanu un arī padarīja modeli pieejamu kā API.

Protams, NedeveļšalkainsIlgi uzskatīja par vienu no attēlu rediģēšanas telpas līderiem, pievienoja savu vadošo modeli Firefly Photoshop un tās citas foto rediģēšanas platformas.

Vietējā attēla rediģēšana

Dvīņi martā pievienoja vietējo AI attēlu rediģēšanu Gemini, ko tas piedāvāja bezmaksas tērzēšanas platformas lietotājiem.

Attēlu rediģēšanas funkciju ieviešana tieši tērzēšanas platformā ļautu uzņēmumiem labot attēlus vai grafikus, nepārvietojot Home windows.

Lietotāji var augšupielādēt fotoattēlu Dvīņos, pēc tam modelim pastāstīt, kādas izmaiņas viņi vēlas. Kad tie ir apmierināti, jaunos attēlus var atkārtoti ielādēt Gemini un padarīt videoklipu.

Izņemot kostīma vai atrašanās vietas maiņas pievienošanu, Gemini 2.5 zibspuldzes attēls var sajaukt dažādus fotoattēlus, piedāvā vairāku pagriezienu rediģēšanu un sajaukt viena attēla stilus citam.


avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here