Home Tehnoloģija Google jaunais Gemini 2.5 datora lietošanas modelis var noklikšķināt, ierakstīt un ritināt

Tehnoloģija

Google jaunais Gemini 2.5 datora lietošanas modelis var noklikšķināt, ierakstīt un ritināt

9 oktobris 2025

Havier Zayas Images/second, izmantojot Getty Pictures

Sekojiet zdnet: Pievienojiet mūs kā vēlamo avotu Google.

ZDNET galvenie pārņemšana

Google jaunais AI modelis var tieši mijiedarboties ar vietnes UIS.
Tas pievienojas līdzīgiem instrumentiem no Openai un Antropic.
Uzņēmums arī atzina tās vājās puses, ieskaitot halucinācijas.

Google DeepMind ir debitēja jauns AI modelis Publiskajā priekšskatījumā, kas paredzēts, lai pārvietotos tīmekļa pārlūkprogrammā, tāpat kā cilvēks.

Uzņēmuma jaunais datora lietošanas modelis, kas izveidots virs DEVINE 2.5 Professional, var izpildīt tādus uzdevumus kā noklikšķināšana, rakstīšana un ritināšana tieši tīmekļa lapā.

Arī: 5 iemesli, kāpēc es izmantoju vietējo AI uz sava darbvirsmas – Chatgpt, Dvini vai Claude vietā

Lietotājiem tas vienkārši ir jāparedz dabiskā valodā – piemēram, “atvērt Wikipedia, jāmeklē“ Atlantis ”un apkopo mīta vēsturi rietumu domās”. Modelis autonomi iegūs pieprasītās vietnes URL un ekrānuzņēmumus, lai analizētu lietotāja interfeisu, kas tai jārīkojas iekšā, un soli pa solim izpildīs pieprasīto uzdevumu, vienlaikus ieskicējot tā argumentāciju un darbības tekstlodziņā, kas ir viegli redzama lietotājiem. Tas var arī atbildēt, lūdzot apstiprinājumu, ja tas ir uzdots veikt jutīgu uzdevumu, piemēram, pirkuma veikšanu.

Gemini 2.5 datora lietošanas priekšskatījums seko līdzīgu tīmekļa pārliešanas modeļu izlaišanai no Openai un Anthropic. Google iepriekš debitēja eksperimentāls hroma paplašinājums ar nosaukumu Mission Mariner, kas var rīkoties arī lietotāju vārdā tīmekļa lapās.

Kā tas darbojas

Gemini 2.5 Datoru lietošana darbojas no iteratīvas cilpas funkcijas, kas ļauj tai reģistrēt visas tās nesenās darbības noteiktā lietotāja interfeisā un attiecīgi noteikt tās nākamo darbību. Tātad, jo vairāk uzdevumu tas veic noteiktā vietā, jo vairāk konteksta būs, un jo nemanāmāk tas darbosies.

Google ievietoja demonstrācijas videoklipus (paātrināja 3x), parādot modeli autonomi, veicot atjauninājumu klientu attiecību pārvaldības vietnē un pārkārtojot piezīmes Google Jamboard platformā, kas tika pārtraukta pagājušā gada beigās.

Arī: Chatgpt’s Codex tikko ieguva milzīgu jauninājumu, kas padara to jaudīgāku nekā jebkad agrāk – kas jauns

Saskaņā ar a emuāra ieraksts Otrdien publicēts Google, jaunais modelis pārspēja līdzīgus rīkus no Antropic un Openai gan precizitātes, gan latentuma ziņā, kā arī “vairākos tīmekļa un mobilo vadības etalonos”, ieskaitot tiešsaistes-mind2web, novērtēšanas ietvaru tīmekļa pārliešanas aģentu veiktspējas pārbaudes pārbaudei.

Kā to izmēģināt

Jaunais modelis ir paredzēts galvenokārt tīmekļa pārlūkiem, wager arī par “spēcīgu solījumu” mobilajā telefonā, sacīja Google. Tas tagad ir pieejams caur Gemini API Google AI un caur Vertex AI. Izšķirt demonstrācijas versija ir pieejams arī caur Browserbase.

Drošības apsvērumi

Jaunajam modelim ir arī drošības vadības ierīču kopums, kuru Google saka, ka izstrādātāji var izmantot, lai neļautu tam veikt nevēlamas darbības, piemēram, apiet Captchas, apdraudēt datu drošību vai iegūt kontroli pār medicīniskajām ierīcēm. Piemēram, izstrādātāji var uzdot modelim pieprasīt lietotāja apstiprinājumu, pirms tas veic noteiktas noteiktas darbības.

Vai vēlaties vairāk stāstu par AI? Reģistrējieties mūsu AI līderu sarakstā biļetens.

Uzņēmums arī jaunā modeļa sistēmas kartē atzīmēja, ka tas “var uzrādīt dažus no vispārējiem pamatu modeļu ierobežojumiem, jo tas balstās uz Dvīņu 2.5 Professional, piemēram, halucinācijām un cēloņsakarības izpratnes ierobežojumiem, sarežģītu loģisko atskaitījumu un hipotētisko pamatojumu”.

Šie ierobežojumi attiecas uz vairumu modeļu. Šīs nedēļas sākumā Antropic publicēja jaunus pētījumus, kas parāda, ka daudziem Frontier AI modeļiem bija tendence ziņot, ko viņi interpretēja kā neētisku vai nelikumīgu informāciju testa scenārijos, pat ja it kā inkriminējošā informācija patiesībā bija nekaitīga.

avots

Google jaunais Gemini 2.5 datora lietošanas modelis var noklikšķināt, ierakstīt un ritināt

ZDNET galvenie pārņemšana

Kā tas darbojas

Kā to izmēģināt

Drošības apsvērumi

LEAVE A REPLY Cancel reply

jaunākais ieraksts

Labākie tehnoloģiju piedāvājumi, kuru cena ir mazāka par 100 USD, joprojām...

Drīz beidzas vasaras laiks. Lūk, kad iestatīt pulksteņus atpakaļ

Varenais nein treileris: kritiskās lomas jaunā šovs teases burvju cīņas un...

Nākamās robežas navigācija vietnē TechCrunch Disrupt 2025: kur investori redz iespēju...

Sietlas starta FDA apstiprinātā, vīrusu neitralizējošā maska zemē Amazon

Apple izlaiž jaunu beta programmaparatūru AirPods Professional 2, AirPods Professional 3...

Zvanīšana visiem vistas žokejiem: “Minecraft 2” ir Go

10. pikselis pret Pixel 10 Professional pret Pixel 10 Professional XL:...

OnePlus 13 joprojām ir par zemāko cenu, vēl Amazon

‘Idiokrātija’ ir tendence uz Netflix ASV, un tā ir izraisīta saruna...