Home Tehnoloģija Google izlaiž olimpiādes medaļas ieguvēju Gemini 2.5 ‘Deep Thoup’ AI publiski-bet tur...

Tehnoloģija

Google izlaiž olimpiādes medaļas ieguvēju Gemini 2.5 ‘Deep Thoup’ AI publiski-bet tur ir nozveja …

2 augusts 2025

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt

Google ir oficiāli uzsācis Gemini 2.5 Deep Think, Jauna tā AI modeļa variācija, kas izstrādāta dziļākai spriešanai un sarežģītai problēmu risināšanai, kas pagājušajā mēnesī veidoja virsrakstus par zelta medaļas iegūšanu starptautiskajā matemātiskajā olimpiādē (SJO)-pirmo reizi AI modelis sasniedza varoņdarbu.

Tomēr Diemžēl tas ir ne Identisks zelta medaļas ieguvšanas modelis. Faktiski tā ir mazāk jaudīga “bronzas” versija saskaņā ar Google emuāra ziņu un Logan Kilpatrick, Google AI studijas produktu vadību.

Kā Kilpatriks ievietots sociālajā tīklā x: “Šī ir mūsu SJO zelta modeļa variācija, kas ir ātrāka un optimizēta ikdienas lietošanai. Mēs arī piešķiram SJO zelta pilnu modeli matemātiķu kopumam, lai pārbaudītu pilnu iespēju vērtību.”

Tagad pieejams caur Dvīņu mobilo lietotnišis bronzas modelis ir pieejams Google visdārgākais individuālais AI plāns, AI Ultrakas mēnesī maksā 249,99 USD ar 3 mēnešu sākuma akciju ar samazinātu likmi USD 124,99 mēnesī jauniem abonentiem.

AI trieciena sērija atgriežas Sanfrancisko – 5. augusts

Nākamais AI posms ir šeit – vai esat gatavs? Pievienojieties līderiem no Block, GSK un SAP, lai apskatītu, kā autonomi aģenti pārveido uzņēmumu darbplūsmas-no reālā laika lēmumu pieņemšanas līdz automatizācijai galīgai līdz galam.

Nostipriniet savu vietu tūlīt – telpa ir ierobežota:

Google arī savā izlaišanas emuāra ierakstā sacīja, ka tas dziļi domā ar un bez rīku lietošanas integrācijas “uzticamiem testētājiem”, izmantojot Dvīņu lietojumprogrammu programmēšanas interfeisu (API) “Tuvākajās nedēļās”.

Kāpēc ‘dziļā domāšana’ ir tik spēcīga

Dvīņi 2.5 Deep Thoup balstās uz lielo valodu modeļu (LLMS) Dvīņu saimi, pievienojot jaunas iespējas, kuru mērķis ir argumentācija, izmantojot sarežģītas problēmas.

Tas Izmanto “paralēlās domāšanas” paņēmienus, lai vienlaikus izpētītu vairākas idejas, un tajā ietilpst pastiprināšanas mācīšanās, lai laika gaitā stiprinātu tās soli pa solim problēmu risināšanas spēju.

Modelis ir Paredzēts lietošanas gadījumiem, kas gūst labumu no paplašinātām pārdomām, piemēram, matemātisko minējumu pārbaude, zinātniskie pētījumi, algoritma dizains, un radoši atkārtošanas uzdevumi, piemēram, kods un dizaina uzlabošana.

Agrīnie testētāji, ieskaitot tādus matemātiķus kā Mišels Van Garels, ir to izmantojuši, lai zonētu neatrisinātas problēmas un ģenerētu iespējamus pierādījumus.

AI Power lietotājs un eksperts Etans Molliks, Pensilvānijas universitātes Wharton Biznesa skolas profesors, Ievietots arī x ka tas varēja uzaicināt uzvedni, ko viņš bieži izmanto, lai pārbaudītu jauno modeļu iespējas – “Izveidojiet kaut ko tādu, ko es varu ielīmēt p5J, kas mani pārsteidz ar savu gudrību, radot kaut ko tādu, kas tālā nākotnē izsauc zvaigznītes vadības paneli” – un Pārvērtis to par 3D grafiku, kas ir pirmā reize, kad jebkurš modelis to ir izdarījisApvidū

Bija agrīna pieeja Dvīņiem ar dziļu domāšanu. Ļoti labs modelis, lieli ieguvumi salīdzinājumā ar standarta Gemini 2.5 Pro daudzām problēmām.

Šeit ir pirmais mēģinājums uz Starship Control Panel uzvedni, kuru izmēģinu ar katru modeli. Pirmo reizi esmu redzējis modeli, reaģējot uz 3D saskarni. pic.twitter.com/blff2icop3
– Etans Molliks (@emollick) 2025. gada 1. augusts

Veiktspējas etaloni un lietošanas gadījumi

Google izceļ vairākas galvenās lietojumprogrammu jomas dziļai domām:

Matemātika un zinātne: Modelis var simulēt spriešanu ar sarežģītiem pierādījumiem, izpētīt minējumus un interpretēt blīvu zinātnisko literatūru
Kodēšanas un algoritma dizains: Tas labi veic uzdevumus, kas saistīti ar veiktspējas kompromisiem, laika sarežģītību un daudzpakāpju loģiku
Radošā attīstība: Dizaina scenārijos, piemēram, Voxel Art vai lietotāja interfeisā, Deep Think demonstrē spēcīgāku iteratīvo uzlabojumu un detaļu uzlabošanu

Arī modelis vada veiktspēju etalonu novērtējumos, piemēram, LiveCodeBench V6 (par kodēšanas spēju) un cilvēces pēdējais eksāmens (Matemātikas, zinātnes un argumentācijas aptveršana).

Tas Outcored Gemini 2.5 Pro un konkurējošie modeļi, piemēram, Openai GPT-4 un XAI’s GROK 4 ar divciparu starpību dažās kategorijās (argumentācija un zināšanas, kodu ģenerēšana un SJO 2025 matemātika).

Dvīņi 2.5 dziļa domāšana pret Gemini 2.5 Pro

Lai gan gan Deep Think, gan Gemini 2.5 Pro ir daļa no Gemini 2.5 modeļa saimes, Google pozicionē dziļi, domājot par spējīgāks un analītiski prasmīgs variantsit īpaši, ja runa ir par sarežģītu spriešanu un daudzpakāpju problēmu risināšanu.

Šis uzlabojums izriet no izmantošanas paralēlā domāšana un pastiprināšanas mācīšanās paņēmienikas ļauj modelim simulēt dziļāku kognitīvo apspriešanu.

Oficiālajā komunikācijā Google apraksta dziļo domāšanu kā labāku apstrādājot niansētas uzvednes, izpētīt vairākas hipotēzes un ražot rafinētas izejasApvidū To atbalsta sānu salīdzinājumi Voxel Art Generation, kur Deep domā, ka vairāk tekstūras, strukturālās precizitātes un kompozīcijas daudzveidības pievieno vairāk nekā 2,5 pro.

Uzlabojumi nav tikai vizuāli vai anekdotiski. Google ziņo, ka dziļi domā pārspēj Gemini 2.5 Pro par vairākiem tehniskiem etaloniem Saistīts ar spriešanu, kodu ģenerēšanu un starpdomēnu zināšanām. Tomēr šie ieguvumi ir saistīti ar reakcijas un tūlītējas pieņemšanas kompromisiem.

Lūk, sadalījums:

Spēja / atribūts	Dvīņi 2.5 Pro	Dvīņi 2.5 dziļa domāšana
Secināšanas ātrums	Ātrāks, zems latentums	Lēnāks, pagarināts “domāšanas laiks”
Sarežģītība	Mērens	Augsts – izmanto paralēlu domāšanu
Ātrs dziļums un radošums	Labs	Sīkāka un niansēta
Etalona izrāde	Stiprs	Vismodernākais
Satura drošības un toņu objektivitāte	Uzlabots vecākiem modeļiem	Vēl vairāk uzlabots
Atteikšanās likme (labdabīgas uzvednes)	Apakšējais	Augstāks
Izejas garums	Standarta	Atbalsta garākas atbildes
Voksela mākslas / dizaina uzticība	Pamata ainas struktūra	Uzlabota detaļa un bagātība

Google atzīmē to Deep Think ir augstāks atteikšanās līmenis ir aktīvas izmeklēšanas joma. Tas var ierobežot tā elastību, rīkojoties ar neskaidriem vai neformāliem jautājumiem, salīdzinot ar 2,5 Pro. Turpretī 2,5 Pro joprojām ir labāk piemērots lietotājiem, kuri prioritāti piešķir ātrums un atsaucībaīpaši vieglākiem, vispārējas nozīmes uzdevumiem.

Šī diferenciācija ļauj lietotājiem izvēlēties, pamatojoties uz viņu prioritātēm: 2.5 Pro ātrumam un plūstamībaivai Dziļi domājiet par stingrību un pārdomāmApvidū

Nevis zelta medaļas ieguvēju modelis, tikai bronza

Jūlijā Google Deepmind veidoja virsrakstus, kad PROJEKTĀS DEVINE DEEP THOVE modelis ieguva oficiālu zelta medaļas statusu 2025. gada SJO-pasaulē prestižākajā matemātikas konkursā vidusskolēniem.

Sistēma Atrisināja piecas no sešām izaicinošām problēmām un kļuva par pirmo AI, kas saņēma zelta līmeņa punktu skaitu no SJO.

Google Deepmind izpilddirektors Demis Hassabis paziņoja par sasniegumu X, norādot, ka modelis ir atrisinājis problēmas dabiskajā valodā-bez tulkošanas formālā programmēšanas sintakse.

SJO dēlis apstiprināja, ka modelis ieguva 35 no iespējamiem 42 punktiem, kas ir krietni virs zelta sliekšņa. Dvīņi 2.5 Deep Think risinājumi bija Aprakstīja konkursa prezidents Gregors Dolinārs kā skaidrs, precīzs un daudzos gadījumos, Vieglāk sekot nekā cilvēku konkurentiem.

Tomēr Gemini 2.5 dziļi domājoši, kas izlaisti lietotājiem, nav tas pats konkurences modelis, drīzāk – zemāka veiktspēja, bet acīmredzami ātrāka versija.

Kā piekļūt dziļai domāšanai tagad

Dvīņi 2.5 dziļa domāšana ir Pašlaik pieejama tikai Google Gemini mobilajā lietotnē iOS un Android lietotājiem Google AI Ultra plānādaļa no Google One abonēšanas sastāva ar cenu noteikšanu šādi.

Reklāmas piedāvājums: USD 124,99 mēnesī uz 3 mēnešiem, tad tas sāk…
Standarta likme: USD 249,99 mēnesī
Iekļautas funkcijas: 30 TB krātuves, piekļuve Dvīņu lietotnei ar Deep Think un Veo 3, kā arī tādi rīki kā plūsma, slotiņš un 12 500 ikmēneša AI kredītpunkti

Abonenti var aktivizēt dziļu domāšanu Dvīņu lietotnē, izvēloties 2.5 Pro modeli un pārslēdzot opciju “Deep Think”.

Tas atbalsta fiksētu skaitu uzvednes dienā un ir integrēts ar tādām iespējām kā koda izpildīšana un Google meklēšana. Modelis arī ģenerē garākas un detalizētākas izejas, salīdzinot ar standarta versijām.

Zemāka līmeņa Google AI Pro plāns, kura cena ir USD 19,99 mēnesī (ar bezmaksas izmēģinājumu), neietver piekļuvi Deep Thought, kā arī bezmaksas Gemini AI pakalpojums.

Kāpēc tas ir svarīgi uzņēmuma tehniskajiem lēmumu pieņēmējiem

Dvīņi 2.5 Dziļā domāšana atspoguļo galvenā pētījuma pavērsiena praktisku pielietojumu.

Tas Ļauj uzņēmumiem un organizācijām izmantot matemātikas olimpiādes medaļu ieguvušo modeli un likt tam pievienoties viņu personālam, kaut arī tikai ar atsevišķu lietotāja kontu tagad.

Pētniekiem, kuri saņem pilnu imo klases modeli, tas piedāvā ieskatu sadarbības AI nākotnē matemātikā. Ultra abonentiem Deep Think nodrošina spēcīgu soli pretī spējīgākai un kontekstā informētai AI palīdzībai, kas tagad darbojas viņu plaukstā.

Ikdienas ieskats par biznesa lietošanas gadījumiem ar VB katru dienu

Ja vēlaties pārsteigt savu priekšnieku, VB Daily jūs esat aptvēris. Mēs sniedzam jums iekšēju liekšķeri par to, ko uzņēmumi dara ar ģeneratīvu AI, sākot no normatīvajām maiņām uz praktisko izvietošanu, lai jūs varētu dalīties ar ieskatu par maksimālo IA.

Izlasiet mūsu konfidencialitātes politiku

Paldies par abonēšanu. Pārbaudiet vairāk VB biļetenu šeit.

Radās kļūda.

avots

Google izlaiž olimpiādes medaļas ieguvēju Gemini 2.5 ‘Deep Thoup’ AI publiski-bet tur ir nozveja …

Kāpēc ‘dziļā domāšana’ ir tik spēcīga

Veiktspējas etaloni un lietošanas gadījumi

Dvīņi 2.5 dziļa domāšana pret Gemini 2.5 Pro

Nevis zelta medaļas ieguvēju modelis, tikai bronza

Kā piekļūt dziļai domāšanai tagad

Kāpēc tas ir svarīgi uzņēmuma tehniskajiem lēmumu pieņēmējiem

LEAVE A REPLY Cancel reply

jaunākais ieraksts

Pakistānas zemestrīce: 5.4. Miljparāts trīce grūdieno vairākas teritorijas; Nav ziņots par...

Komandieru treneris Terry McLaurin tirdzniecības pieprasījumā: bizness kā parasti

Radioaktīvā lapsenes ligzda, ko darbinieki atklāja bijušajā kodolbumbas vietnē

Zilais Jays izskatās, lai atgrieztos uz ceļa un Royals

Kā Florida mierīgi pārspēja Kaliforniju saules izaugsmē

“Es esmu bezjēdzīgs, Ferrari ir jāmaina draiveris!” – Hamiltons izmisuma uzliesmojumā

Protestētāji iebilst viens pret otru Londonas viesnīcu mājokļu patvēruma meklētājus

Iepazīstieties ar sērfotāju pakaļdzīšanās pasaules rekordu Kalifornijas slavenajā Massive Wave vietnē

Taizemes mītiņš Bangkokā, lai denonsētu premjerministru Paetongtarn

MLB labākās likmes sestdienai, 2. augustam: MLB spīdveja klasiskās izvēles un...