Home Tehnoloģija Google izvelk DeMini Deep Think AI – spriešanas modeli, kas paralēli pārbauda...

Tehnoloģija

Google izvelk DeMini Deep Think AI – spriešanas modeli, kas paralēli pārbauda vairākas idejas

2 augusts 2025

Google Deepmind izvērš Gemini 2.5 Deep Think, kas, pēc uzņēmuma teiktā, ir vismodernākais AI spriešanas modelis, kas spēj atbildēt uz jautājumiem, izpētot un apsverot vairākas idejas vienlaicīgi, un pēc tam izmantojot šos izejas, lai izvēlētos labāko atbildi.

Abonenti Google USD 250 par mēneša Ultra abonementu iegūs piekļuvi Gemini 2.5 Deep Thoup Dvini lietotnē, sākot no piektdienas.

Pirmoreiz atklāts maijā Google I/O 2025, Gemini 2.5 Deep Think ir Google pirmais publiski pieejams vairāku aģentu modelis. Šīs sistēmas radīja vairākus aģentus, lai paralēli risinātu jautājumu – procesu, kurā tiek izmantoti ievērojami vairāk skaitļošanas resursu nekā viens aģents, bet tai ir tendence radīt labākas atbildes.

Google izmantoja Dvīņu 2,5 Deep Dover variāciju, lai iegūtu zelta medaļu šī gada starptautiskajā matemātikas olimpiādē (SJO).

Līdztekus Gemini 2.5 Deep Think, uzņēmums saka, ka tas atbrīvo modeli, ko tas izmantoja SJO, izvēlētai matemātiķu un akadēmiķu grupai. Google saka, ka šis AI modelis “prasa stundas līdz saprātam”, nevis sekundes vai minūtes, piemēram, lielākajai daļai uz patērētājiem vērsto AI modeļu. Uzņēmums cer, ka SJO modelis uzlabos pētniecības centienus, un tā mērķis ir saņemt atsauksmes par to, kā uzlabot daudzu aģentu sistēmu akadēmiskās lietošanas gadījumiem.

Google norāda, ka Dvīņu 2.5 dziļais domāšanas modelis ir būtisks uzlabojums salīdzinājumā ar to, ko tas paziņoja I/O. Uzņēmums arī apgalvo, ka ir izstrādājis “jaunas pastiprināšanas mācīšanās metodes”, lai mudinātu Gemini 2.5 Dziļi domāt, lai labāk izmantotu savus spriešanas ceļus.

“Dziļā domāšana var palīdzēt cilvēkiem risināt problēmas, kurām nepieciešama radošums, stratēģiska plānošana un uzlabojumu veikšana soli pa solim,” sacīja Google emuāra ierakstā, kas dalīts ar TechCrunch.

TechCrunch pasākums

Sanfrancisko
|
2025. gada 27.-29. Oktobris

Uzņēmums saka, ka Dvīņi 2.5 Dziļi domā, ka cilvēces pēdējā eksāmena (HLE) ir sasniegts vismodernākais sniegums-izaicinoša pārbaude, kas mēra AI spēju atbildēt uz tūkstošiem sabiedrības jautājumu, kas saistīti ar matemātiku, humanitārajām zinātnēm un zinātni. Google apgalvo, ka tā modelis ieguva 34,8%no HLE (bez rīkiem), salīdzinot ar XAI GROK 4, kas ieguva 25,4%, un Openai O3, kura rezultāts bija 20,3%.

Google arī saka, ka Gemini 2.5 Deep Think Operformo AI modeļus no Openai, XAI un Anthropic vietnē LivecodeBench6, kas ir izaicinošs konkurētspējīgu kodēšanas uzdevumu pārbaude. Google modelis ieguva 87,6%, savukārt Grok 4 ieguva 79%, bet Openai O3 ieguva 72%.

Etalona punkti. Attēla kredīti: Google

Dvīņi 2.5 Deep Thouple automātiski darbojas ar tādiem rīkiem kā koda izpilde un Google meklēšana, un uzņēmums saka, ka tas spēj radīt “daudz ilgākas atbildes” nekā tradicionālos AI modeļus.

Google testēšanā modelis sagatavoja detalizētākus un estētiski patīkamus tīmekļa izstrādes uzdevumus, salīdzinot ar citiem AI modeļiem. Uzņēmums apgalvo, ka modelis varētu palīdzēt pētniekiem un “potenciāli paātrināt ceļu uz atklāšanu”.

Mākslas ainas, kuras veidojis Google AI (kredīts: Google)

Liekas, ka vairākas vadošās AI laboratorijas saplūst ap vairāku aģentu pieeju.

Elona Muska XAI nesen izlaida savu vairāku aģentu sistēmu, Grok 4 Heavy, kas, pēc viņa teiktā, spēja sasniegt nozares vadošo sniegumu vairākos etalonos. Openai pētnieks Noam Brown teica par a podcast Tas, ka neatbrīvotais AI modelis, ko uzņēmums izmantoja, lai sasniegtu zelta medaļu šī gada starptautiskajā matemātikas olimpiādē (SJO), bija arī vairāku aģentu sistēma. Tikmēr, Antropic pētījumu aģentskas ģenerē rūpīgas izpētes biksītes, darbina arī vairāku aģentu sistēma.

Neskatoties uz spēcīgo veiktspēju, šķiet, ka daudzu aģentu sistēmas ir pat dārgākas, lai kalpotu nekā tradicionālie AI modeļi. Tas nozīmē, ka tehnoloģiju uzņēmumi var saglabāt šīs sistēmas, kas tiek novirzītas aiz visdārgākajiem abonēšanas plāniem, kurus XAI un tagad Google ir izvēlējušies darīt.

Nākamajās nedēļās Google saka, ka tā plāno dalīties ar Dvīņu 2.5 dziļo domāšanu ar atlasītu testētāju grupu, izmantojot Gemini API. Uzņēmums saka, ka vēlas labāk izprast, kā izstrādātāji un uzņēmumi var izmantot savu daudzu aģentu sistēmu.

avots

Google izvelk DeMini Deep Think AI – spriešanas modeli, kas paralēli pārbauda vairākas idejas

jaunākais ieraksts

Brendons Pfaadts uzvar 11. vietā, kad D-backs noņem Padres

20 gadus vecā priestera meita, kas atbrīvota no ledus aizturēšanas pēc...

Jennifer jūtas “milzīgā vaina”, lai novietotu mammu vecu cilvēku aprūpē

YouTube videoklipu “Coach” potenciālie migranti, kā izmantot mazpazīstamu vīzu shēmu, lai...

Mēs īstenojam “neokoloniālo” politiku, lai saglabātu hegemoniju: Krievija

Cubs ‘Michael Soroka ir saista plecu sāpīguma dēļ

Kalifornijas ugunsgrēki joprojām izplatās, Grand Canyon Wildfire joprojām nav ietverts pēc...

Masīva 22 collu žurka, kas atrodama Lielbritānijas mājās, iedzīvotāji aicina rīkoties,...

Home Dem paziņo, ka viņa ir “lepna Gvatemalāna” pirms amerikāņa progresīvajā...

100 Gazas bērni cer, ka tiks evakuēti uz Lielbritāniju, lai saņemtu...