Google Deepmind izvērš Gemini 2.5 Deep Think, kas, pēc uzņēmuma teiktā, ir vismodernākais AI spriešanas modelis, kas spēj atbildēt uz jautājumiem, izpētot un apsverot vairākas idejas vienlaicīgi, un pēc tam izmantojot šos izejas, lai izvēlētos labāko atbildi.
Abonenti Google USD 250 par mēneša Ultra abonementu iegūs piekļuvi Gemini 2.5 Deep Thoup Dvini lietotnē, sākot no piektdienas.
Pirmoreiz atklāts maijā Google I/O 2025, Gemini 2.5 Deep Think ir Google pirmais publiski pieejams vairāku aģentu modelis. Šīs sistēmas radīja vairākus aģentus, lai paralēli risinātu jautājumu – procesu, kurā tiek izmantoti ievērojami vairāk skaitļošanas resursu nekā viens aģents, bet tai ir tendence radīt labākas atbildes.
Google izmantoja Dvīņu 2,5 Deep Dover variāciju, lai iegūtu zelta medaļu šī gada starptautiskajā matemātikas olimpiādē (SJO).
Līdztekus Gemini 2.5 Deep Think, uzņēmums saka, ka tas atbrīvo modeli, ko tas izmantoja SJO, izvēlētai matemātiķu un akadēmiķu grupai. Google saka, ka šis AI modelis “prasa stundas līdz saprātam”, nevis sekundes vai minūtes, piemēram, lielākajai daļai uz patērētājiem vērsto AI modeļu. Uzņēmums cer, ka SJO modelis uzlabos pētniecības centienus, un tā mērķis ir saņemt atsauksmes par to, kā uzlabot daudzu aģentu sistēmu akadēmiskās lietošanas gadījumiem.
Google norāda, ka Dvīņu 2.5 dziļais domāšanas modelis ir būtisks uzlabojums salīdzinājumā ar to, ko tas paziņoja I/O. Uzņēmums arī apgalvo, ka ir izstrādājis “jaunas pastiprināšanas mācīšanās metodes”, lai mudinātu Gemini 2.5 Dziļi domāt, lai labāk izmantotu savus spriešanas ceļus.
“Dziļā domāšana var palīdzēt cilvēkiem risināt problēmas, kurām nepieciešama radošums, stratēģiska plānošana un uzlabojumu veikšana soli pa solim,” sacīja Google emuāra ierakstā, kas dalīts ar TechCrunch.
TechCrunch pasākums
Sanfrancisko
|
2025. gada 27.-29. Oktobris
Uzņēmums saka, ka Dvīņi 2.5 Dziļi domā, ka cilvēces pēdējā eksāmena (HLE) ir sasniegts vismodernākais sniegums-izaicinoša pārbaude, kas mēra AI spēju atbildēt uz tūkstošiem sabiedrības jautājumu, kas saistīti ar matemātiku, humanitārajām zinātnēm un zinātni. Google apgalvo, ka tā modelis ieguva 34,8%no HLE (bez rīkiem), salīdzinot ar XAI GROK 4, kas ieguva 25,4%, un Openai O3, kura rezultāts bija 20,3%.
Google arī saka, ka Gemini 2.5 Deep Think Operformo AI modeļus no Openai, XAI un Anthropic vietnē LivecodeBench6, kas ir izaicinošs konkurētspējīgu kodēšanas uzdevumu pārbaude. Google modelis ieguva 87,6%, savukārt Grok 4 ieguva 79%, bet Openai O3 ieguva 72%.
Dvīņi 2.5 Deep Thouple automātiski darbojas ar tādiem rīkiem kā koda izpilde un Google meklēšana, un uzņēmums saka, ka tas spēj radīt “daudz ilgākas atbildes” nekā tradicionālos AI modeļus.
Google testēšanā modelis sagatavoja detalizētākus un estētiski patīkamus tīmekļa izstrādes uzdevumus, salīdzinot ar citiem AI modeļiem. Uzņēmums apgalvo, ka modelis varētu palīdzēt pētniekiem un “potenciāli paātrināt ceļu uz atklāšanu”.

Liekas, ka vairākas vadošās AI laboratorijas saplūst ap vairāku aģentu pieeju.
Elona Muska XAI nesen izlaida savu vairāku aģentu sistēmu, Grok 4 Heavy, kas, pēc viņa teiktā, spēja sasniegt nozares vadošo sniegumu vairākos etalonos. Openai pētnieks Noam Brown teica par a podcast Tas, ka neatbrīvotais AI modelis, ko uzņēmums izmantoja, lai sasniegtu zelta medaļu šī gada starptautiskajā matemātikas olimpiādē (SJO), bija arī vairāku aģentu sistēma. Tikmēr, Antropic pētījumu aģentskas ģenerē rūpīgas izpētes biksītes, darbina arī vairāku aģentu sistēma.
Neskatoties uz spēcīgo veiktspēju, šķiet, ka daudzu aģentu sistēmas ir pat dārgākas, lai kalpotu nekā tradicionālie AI modeļi. Tas nozīmē, ka tehnoloģiju uzņēmumi var saglabāt šīs sistēmas, kas tiek novirzītas aiz visdārgākajiem abonēšanas plāniem, kurus XAI un tagad Google ir izvēlējušies darīt.
Nākamajās nedēļās Google saka, ka tā plāno dalīties ar Dvīņu 2.5 dziļo domāšanu ar atlasītu testētāju grupu, izmantojot Gemini API. Uzņēmums saka, ka vēlas labāk izprast, kā izstrādātāji un uzņēmumi var izmantot savu daudzu aģentu sistēmu.