Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt
Google ir oficiāli uzsācis Gemini 2.5 Deep Think, Jauna tā AI modeļa variācija, kas izstrādāta dziļākai spriešanai un sarežģītai problēmu risināšanai, kas pagājušajā mēnesī veidoja virsrakstus par zelta medaļas iegūšanu starptautiskajā matemātiskajā olimpiādē (SJO)-pirmo reizi AI modelis sasniedza varoņdarbu.
Tomēr Diemžēl tas ir ne Identisks zelta medaļas ieguvšanas modelis. Faktiski tā ir mazāk jaudīga “bronzas” versija saskaņā ar Google emuāra ziņu un Logan Kilpatrick, Google AI studijas produktu vadību.
Kā Kilpatriks ievietots sociālajā tīklā x: “Šī ir mūsu SJO zelta modeļa variācija, kas ir ātrāka un optimizēta ikdienas lietošanai. Mēs arī piešķiram SJO zelta pilnu modeli matemātiķu kopumam, lai pārbaudītu pilnu iespēju vērtību.”
Tagad pieejams caur Dvīņu mobilo lietotnišis bronzas modelis ir pieejams Google visdārgākais individuālais AI plāns, AI Ultrakas mēnesī maksā 249,99 USD ar 3 mēnešu sākuma akciju ar samazinātu likmi USD 124,99 mēnesī jauniem abonentiem.
AI trieciena sērija atgriežas Sanfrancisko – 5. augusts
Nākamais AI posms ir šeit – vai esat gatavs? Pievienojieties līderiem no Block, GSK un SAP, lai apskatītu, kā autonomi aģenti pārveido uzņēmumu darbplūsmas-no reālā laika lēmumu pieņemšanas līdz automatizācijai galīgai līdz galam.
Nostipriniet savu vietu tūlīt – telpa ir ierobežota:
Google arī savā izlaišanas emuāra ierakstā sacīja, ka tas dziļi domā ar un bez rīku lietošanas integrācijas “uzticamiem testētājiem”, izmantojot Dvīņu lietojumprogrammu programmēšanas interfeisu (API) “Tuvākajās nedēļās”.
Kāpēc ‘dziļā domāšana’ ir tik spēcīga
Dvīņi 2.5 Deep Thoup balstās uz lielo valodu modeļu (LLMS) Dvīņu saimi, pievienojot jaunas iespējas, kuru mērķis ir argumentācija, izmantojot sarežģītas problēmas.
Tas Izmanto “paralēlās domāšanas” paņēmienus, lai vienlaikus izpētītu vairākas idejas, un tajā ietilpst pastiprināšanas mācīšanās, lai laika gaitā stiprinātu tās soli pa solim problēmu risināšanas spēju.
Modelis ir Paredzēts lietošanas gadījumiem, kas gūst labumu no paplašinātām pārdomām, piemēram, matemātisko minējumu pārbaude, zinātniskie pētījumi, algoritma dizains, un radoši atkārtošanas uzdevumi, piemēram, kods un dizaina uzlabošana.
Agrīnie testētāji, ieskaitot tādus matemātiķus kā Mišels Van Garels, ir to izmantojuši, lai zonētu neatrisinātas problēmas un ģenerētu iespējamus pierādījumus.
AI Power lietotājs un eksperts Etans Molliks, Pensilvānijas universitātes Wharton Biznesa skolas profesors, Ievietots arī x ka tas varēja uzaicināt uzvedni, ko viņš bieži izmanto, lai pārbaudītu jauno modeļu iespējas – “Izveidojiet kaut ko tādu, ko es varu ielīmēt p5J, kas mani pārsteidz ar savu gudrību, radot kaut ko tādu, kas tālā nākotnē izsauc zvaigznītes vadības paneli” – un Pārvērtis to par 3D grafiku, kas ir pirmā reize, kad jebkurš modelis to ir izdarījisApvidū
Veiktspējas etaloni un lietošanas gadījumi
Google izceļ vairākas galvenās lietojumprogrammu jomas dziļai domām:
- Matemātika un zinātne: Modelis var simulēt spriešanu ar sarežģītiem pierādījumiem, izpētīt minējumus un interpretēt blīvu zinātnisko literatūru
- Kodēšanas un algoritma dizains: Tas labi veic uzdevumus, kas saistīti ar veiktspējas kompromisiem, laika sarežģītību un daudzpakāpju loģiku
- Radošā attīstība: Dizaina scenārijos, piemēram, Voxel Art vai lietotāja interfeisā, Deep Think demonstrē spēcīgāku iteratīvo uzlabojumu un detaļu uzlabošanu
Arī modelis vada veiktspēju etalonu novērtējumos, piemēram, LiveCodeBench V6 (par kodēšanas spēju) un cilvēces pēdējais eksāmens (Matemātikas, zinātnes un argumentācijas aptveršana).
Tas Outcored Gemini 2.5 Pro un konkurējošie modeļi, piemēram, Openai GPT-4 un XAI’s GROK 4 ar divciparu starpību dažās kategorijās (argumentācija un zināšanas, kodu ģenerēšana un SJO 2025 matemātika).
Dvīņi 2.5 dziļa domāšana pret Gemini 2.5 Pro
Lai gan gan Deep Think, gan Gemini 2.5 Pro ir daļa no Gemini 2.5 modeļa saimes, Google pozicionē dziļi, domājot par spējīgāks un analītiski prasmīgs variantsit īpaši, ja runa ir par sarežģītu spriešanu un daudzpakāpju problēmu risināšanu.
Šis uzlabojums izriet no izmantošanas paralēlā domāšana un pastiprināšanas mācīšanās paņēmienikas ļauj modelim simulēt dziļāku kognitīvo apspriešanu.
Oficiālajā komunikācijā Google apraksta dziļo domāšanu kā labāku apstrādājot niansētas uzvednes, izpētīt vairākas hipotēzes un ražot rafinētas izejasApvidū To atbalsta sānu salīdzinājumi Voxel Art Generation, kur Deep domā, ka vairāk tekstūras, strukturālās precizitātes un kompozīcijas daudzveidības pievieno vairāk nekā 2,5 pro.
Uzlabojumi nav tikai vizuāli vai anekdotiski. Google ziņo, ka dziļi domā pārspēj Gemini 2.5 Pro par vairākiem tehniskiem etaloniem Saistīts ar spriešanu, kodu ģenerēšanu un starpdomēnu zināšanām. Tomēr šie ieguvumi ir saistīti ar reakcijas un tūlītējas pieņemšanas kompromisiem.
Lūk, sadalījums:
Spēja / atribūts | Dvīņi 2.5 Pro | Dvīņi 2.5 dziļa domāšana |
---|---|---|
Secināšanas ātrums | Ātrāks, zems latentums | Lēnāks, pagarināts “domāšanas laiks” |
Sarežģītība | Mērens | Augsts – izmanto paralēlu domāšanu |
Ātrs dziļums un radošums | Labs | Sīkāka un niansēta |
Etalona izrāde | Stiprs | Vismodernākais |
Satura drošības un toņu objektivitāte | Uzlabots vecākiem modeļiem | Vēl vairāk uzlabots |
Atteikšanās likme (labdabīgas uzvednes) | Apakšējais | Augstāks |
Izejas garums | Standarta | Atbalsta garākas atbildes |
Voksela mākslas / dizaina uzticība | Pamata ainas struktūra | Uzlabota detaļa un bagātība |
Google atzīmē to Deep Think ir augstāks atteikšanās līmenis ir aktīvas izmeklēšanas joma. Tas var ierobežot tā elastību, rīkojoties ar neskaidriem vai neformāliem jautājumiem, salīdzinot ar 2,5 Pro. Turpretī 2,5 Pro joprojām ir labāk piemērots lietotājiem, kuri prioritāti piešķir ātrums un atsaucībaīpaši vieglākiem, vispārējas nozīmes uzdevumiem.
Šī diferenciācija ļauj lietotājiem izvēlēties, pamatojoties uz viņu prioritātēm: 2.5 Pro ātrumam un plūstamībaivai Dziļi domājiet par stingrību un pārdomāmApvidū
Nevis zelta medaļas ieguvēju modelis, tikai bronza
Jūlijā Google Deepmind veidoja virsrakstus, kad PROJEKTĀS DEVINE DEEP THOVE modelis ieguva oficiālu zelta medaļas statusu 2025. gada SJO-pasaulē prestižākajā matemātikas konkursā vidusskolēniem.
Sistēma Atrisināja piecas no sešām izaicinošām problēmām un kļuva par pirmo AI, kas saņēma zelta līmeņa punktu skaitu no SJO.
Google Deepmind izpilddirektors Demis Hassabis paziņoja par sasniegumu X, norādot, ka modelis ir atrisinājis problēmas dabiskajā valodā-bez tulkošanas formālā programmēšanas sintakse.
SJO dēlis apstiprināja, ka modelis ieguva 35 no iespējamiem 42 punktiem, kas ir krietni virs zelta sliekšņa. Dvīņi 2.5 Deep Think risinājumi bija Aprakstīja konkursa prezidents Gregors Dolinārs kā skaidrs, precīzs un daudzos gadījumos, Vieglāk sekot nekā cilvēku konkurentiem.
Tomēr Gemini 2.5 dziļi domājoši, kas izlaisti lietotājiem, nav tas pats konkurences modelis, drīzāk – zemāka veiktspēja, bet acīmredzami ātrāka versija.
Kā piekļūt dziļai domāšanai tagad
Dvīņi 2.5 dziļa domāšana ir Pašlaik pieejama tikai Google Gemini mobilajā lietotnē iOS un Android lietotājiem Google AI Ultra plānādaļa no Google One abonēšanas sastāva ar cenu noteikšanu šādi.
- Reklāmas piedāvājums: USD 124,99 mēnesī uz 3 mēnešiem, tad tas sāk…
- Standarta likme: USD 249,99 mēnesī
- Iekļautas funkcijas: 30 TB krātuves, piekļuve Dvīņu lietotnei ar Deep Think un Veo 3, kā arī tādi rīki kā plūsma, slotiņš un 12 500 ikmēneša AI kredītpunkti
Abonenti var aktivizēt dziļu domāšanu Dvīņu lietotnē, izvēloties 2.5 Pro modeli un pārslēdzot opciju “Deep Think”.
Tas atbalsta fiksētu skaitu uzvednes dienā un ir integrēts ar tādām iespējām kā koda izpildīšana un Google meklēšana. Modelis arī ģenerē garākas un detalizētākas izejas, salīdzinot ar standarta versijām.
Zemāka līmeņa Google AI Pro plāns, kura cena ir USD 19,99 mēnesī (ar bezmaksas izmēģinājumu), neietver piekļuvi Deep Thought, kā arī bezmaksas Gemini AI pakalpojums.
Kāpēc tas ir svarīgi uzņēmuma tehniskajiem lēmumu pieņēmējiem
Dvīņi 2.5 Dziļā domāšana atspoguļo galvenā pētījuma pavērsiena praktisku pielietojumu.
Tas Ļauj uzņēmumiem un organizācijām izmantot matemātikas olimpiādes medaļu ieguvušo modeli un likt tam pievienoties viņu personālam, kaut arī tikai ar atsevišķu lietotāja kontu tagad.
Pētniekiem, kuri saņem pilnu imo klases modeli, tas piedāvā ieskatu sadarbības AI nākotnē matemātikā. Ultra abonentiem Deep Think nodrošina spēcīgu soli pretī spējīgākai un kontekstā informētai AI palīdzībai, kas tagad darbojas viņu plaukstā.