Sekojiet zdnet: Pievienojiet mūs kā vēlamo avotu Google.
ZDNET galvenie pārņemšana
- Google jaunais AI modelis var tieši mijiedarboties ar vietnes UIS.
- Tas pievienojas līdzīgiem instrumentiem no Openai un Antropic.
- Uzņēmums arī atzina tās vājās puses, ieskaitot halucinācijas.
Google DeepMind ir debitēja jauns AI modelis Publiskajā priekšskatījumā, kas paredzēts, lai pārvietotos tīmekļa pārlūkprogrammā, tāpat kā cilvēks.
Uzņēmuma jaunais datora lietošanas modelis, kas izveidots virs DEVINE 2.5 Professional, var izpildīt tādus uzdevumus kā noklikšķināšana, rakstīšana un ritināšana tieši tīmekļa lapā.
Arī: 5 iemesli, kāpēc es izmantoju vietējo AI uz sava darbvirsmas – Chatgpt, Dvini vai Claude vietā
Lietotājiem tas vienkārši ir jāparedz dabiskā valodā – piemēram, “atvērt Wikipedia, jāmeklē“ Atlantis ”un apkopo mīta vēsturi rietumu domās”. Modelis autonomi iegūs pieprasītās vietnes URL un ekrānuzņēmumus, lai analizētu lietotāja interfeisu, kas tai jārīkojas iekšā, un soli pa solim izpildīs pieprasīto uzdevumu, vienlaikus ieskicējot tā argumentāciju un darbības tekstlodziņā, kas ir viegli redzama lietotājiem. Tas var arī atbildēt, lūdzot apstiprinājumu, ja tas ir uzdots veikt jutīgu uzdevumu, piemēram, pirkuma veikšanu.
Gemini 2.5 datora lietošanas priekšskatījums seko līdzīgu tīmekļa pārliešanas modeļu izlaišanai no Openai un Anthropic. Google iepriekš debitēja eksperimentāls hroma paplašinājums ar nosaukumu Mission Mariner, kas var rīkoties arī lietotāju vārdā tīmekļa lapās.
Kā tas darbojas
Gemini 2.5 Datoru lietošana darbojas no iteratīvas cilpas funkcijas, kas ļauj tai reģistrēt visas tās nesenās darbības noteiktā lietotāja interfeisā un attiecīgi noteikt tās nākamo darbību. Tātad, jo vairāk uzdevumu tas veic noteiktā vietā, jo vairāk konteksta būs, un jo nemanāmāk tas darbosies.
Google ievietoja demonstrācijas videoklipus (paātrināja 3x), parādot modeli autonomi, veicot atjauninājumu klientu attiecību pārvaldības vietnē un pārkārtojot piezīmes Google Jamboard platformā, kas tika pārtraukta pagājušā gada beigās.
Arī: Chatgpt’s Codex tikko ieguva milzīgu jauninājumu, kas padara to jaudīgāku nekā jebkad agrāk – kas jauns
Saskaņā ar a emuāra ieraksts Otrdien publicēts Google, jaunais modelis pārspēja līdzīgus rīkus no Antropic un Openai gan precizitātes, gan latentuma ziņā, kā arī “vairākos tīmekļa un mobilo vadības etalonos”, ieskaitot tiešsaistes-mind2web, novērtēšanas ietvaru tīmekļa pārliešanas aģentu veiktspējas pārbaudes pārbaudei.
Kā to izmēģināt
Jaunais modelis ir paredzēts galvenokārt tīmekļa pārlūkiem, wager arī par “spēcīgu solījumu” mobilajā telefonā, sacīja Google. Tas tagad ir pieejams caur Gemini API Google AI un caur Vertex AI. Izšķirt demonstrācijas versija ir pieejams arī caur Browserbase.
Drošības apsvērumi
Jaunajam modelim ir arī drošības vadības ierīču kopums, kuru Google saka, ka izstrādātāji var izmantot, lai neļautu tam veikt nevēlamas darbības, piemēram, apiet Captchas, apdraudēt datu drošību vai iegūt kontroli pār medicīniskajām ierīcēm. Piemēram, izstrādātāji var uzdot modelim pieprasīt lietotāja apstiprinājumu, pirms tas veic noteiktas noteiktas darbības.
Vai vēlaties vairāk stāstu par AI? Reģistrējieties mūsu AI līderu sarakstā biļetens.
Uzņēmums arī jaunā modeļa sistēmas kartē atzīmēja, ka tas “var uzrādīt dažus no vispārējiem pamatu modeļu ierobežojumiem, jo tas balstās uz Dvīņu 2.5 Professional, piemēram, halucinācijām un cēloņsakarības izpratnes ierobežojumiem, sarežģītu loģisko atskaitījumu un hipotētisko pamatojumu”.
Šie ierobežojumi attiecas uz vairumu modeļu. Šīs nedēļas sākumā Antropic publicēja jaunus pētījumus, kas parāda, ka daudziem Frontier AI modeļiem bija tendence ziņot, ko viņi interpretēja kā neētisku vai nelikumīgu informāciju testa scenārijos, pat ja it kā inkriminējošā informācija patiesībā bija nekaitīga.