Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt
Google DeepMind Pirmdien paziņoja, ka oficiāli ir sasniegusi sava Dvīņu mākslīgā intelekta modeļa uzlabotā versija Zelta medaļas līmeņa sniegums pie Starptautiskā matemātiskā olimpiādepiecu no sešām ārkārtīgi sarežģītām problēmām un atpazīšanas nopelnīšanu kā pirmo AI sistēmu, kas saņem oficiālu zelta līmeņa vērtējumu no konkurences organizatoriem.
Uzvara veicina AI argumentācijas jomu un liek Google priekšā pastiprinošajā cīņā starp tehnoloģiju gigantu veidošanu nākamās paaudzes mākslīgajā intelektā. Vēl svarīgāk ir tas, ka tas parāda, ka AI tagad var risināt sarežģītas matemātiskas problēmas, izmantojot dabisko valodu izpratni, nevis prasīt specializētas programmēšanas valodas.
“Oficiālie rezultāti ir-Gemini sasniedza zelta medaļu līmeni starptautiskajā matemātiskajā olimpiādē!” Demis HassabisGoogle Deepmind izpilddirektors, pirmdienas rītā rakstīja sociālo mediju platformā X. “Papildu versija spēja atrisināt 5 no 6 problēmām. Neticami progress.”
Oficiālie rezultāti ir-Gemini sasniedza zelta medaļu līmeni starptautiskajā matemātiskajā olimpiādē! ? Papildu versija spēja atrisināt 5 no 6 problēmām. Neticami progress – milzīgs apsveikums @lmthang Un komanda! https://t.co/pp9bxf7rvj
– Demis Hassabis (@Demishassabis) 2025. gada 21. jūlijs
Līdz Starptautiskā matemātiskā olimpiādekas notiek katru gadu kopš 1959. gada, tiek plaši uzskatīts par pasaules prestižāko matemātikas konkursu pirms universitātes studentiem. Katra iesaistītā valsts nosūta sešus elites jaunos matemātiķus, lai sacenstos sešu ārkārtīgi izaicinošu problēmu risināšanā, kas aptver algebru, kombinatoriku, ģeometriju un skaitļu teoriju. Tikai aptuveni 8% cilvēku dalībnieku parasti nopelna zelta medaļas.
AI trieciena sērija atgriežas Sanfrancisko – 5. augusts
Nākamais AI posms ir šeit – vai esat gatavs? Pievienojieties līderiem no Block, GSK un SAP, lai apskatītu, kā autonomi aģenti pārveido uzņēmumu darbplūsmas-no reālā laika lēmumu pieņemšanas līdz automatizācijai galīgai līdz galam.
Nostipriniet savu vietu tūlīt – telpa ir ierobežota:
Kā Google Deepmind’s DeMini Deep domā, ka krekinga matemātikas grūtākās problēmas
Google jaunākie panākumi ievērojami pārsniedz 2024. gada sniegumu, kad uzņēmuma apvienojums Alfapsārs un Alfigiometrija Sistēmas nopelnīja sudraba medaļas statusu, risinot četras no sešām problēmām. Šai iepriekšējai sistēmai cilvēku eksperti prasīja, lai dabiskās valodas problēmas vispirms tulkotu domēnam specifiskās programmēšanas valodās un pēc tam interpretētu AI matemātisko izvadi.
Šī gada izrāviens nāca cauri Dvīņi dziļi domāuzlabota spriešanas sistēma, kas izmanto to, ko sauc par pētniekiem ”paralēlā domāšana. Atšķirībā no tradicionālajiem AI modeļiem, kas seko vienai argumentācijas ķēdei, dziļi domā, ka vienlaikus izpētītu vairākus iespējamos risinājumus pirms ierašanās pie galīgās atbildes.
“Mūsu modelis darbojās dabiskajā valodā, iegūstot stingrus matemātiskus pierādījumus tieši no oficiālajiem problēmu aprakstiem,” Hassabis paskaidroja Pēcpārbaudes ziņojumā sociālo mediju vietnē X, uzsverot, ka sistēma pabeidza savu darbu konkursa standarta 4,5 stundu termiņā.
Mēs sasniedzām šī gada iespaidīgo rezultātu, izmantojot uzlabotu Gemini Deep Assume versiju (uzlabots spriešanas režīms sarežģītām problēmām). Mūsu modelis darbojās dabiskajā valodā, iegūstot stingrus matemātiskus pierādījumus tieši no oficiālajiem problēmu aprakstiem-…
– Demis Hassabis (@Demishassabis) 2025. gada 21. jūlijs
Modelis sasniedza 35 no iespējamiem 42 punktiem, ērti pārsniedzot zelta medaļas slieksni. Pēc SJO prezidenta prof. Dr. Gregora Dolināra teiktā, risinājumi bija “Pārsteidzoši daudzos aspektos”Un atzīts par“ skaidru, precīzu un lielāko daļu no tiem ir viegli izpildāms ”sacensību greideri.
Openai saskaras ar pretestību, lai apietu oficiālos konkurences noteikumus
Paziņojums nāk ar pieaugošu spriedzi AI nozarē par konkurences praksi un caurspīdīgumu. Google Deepmind izmērītā pieeja savu rezultātu atbrīvošanai ir uzslavējusi AI kopienu, īpaši pretstatā konkurējošajam Openai rīkoties ar līdzīgiem sasniegumiem.
“Mēs nepaziņojām piektdien, jo mēs cienījām SJO valdes sākotnējo lūgumu, ka visām AI laboratorijām ir kopīgi rezultāti tikai pēc tam, kad neatkarīgi eksperti bija pārbaudījuši oficiālos rezultātus un studenti bija pareizi saņēmuši pelnīto aklamāciju,” Hassabis rakstījaparādoties Openai iepriekšējam paziņojumam par savu olimpiādes sniegumu.
BTW kā malā mēs piektdien nepaziņojām, jo mēs ievērojām SJO valdes sākotnējo lūgumu, ka visām AI laboratorijām ir kopīgi rezultāti tikai pēc tam, kad neatkarīgi eksperti bija pārbaudījuši oficiālos rezultātus, un studenti bija pamatoti saņēmuši viņu pelnīto atzinību
– Demis Hassabis (@Demishassabis) 2025. gada 21. jūlijs
Sociālo mediju lietotāji ātri atzīmēja atšķirību. “Jūs redzat? Openai ignorēja SJO pieprasījumu. Kauns. Nav klases. Taisna necieņa,” uzrakstīja vienu lietotājuApvidū “Google Deepmind rīkojās ar integritāti, saskaņots ar cilvēci.”
Kritika izriet no Openai lēmuma paziņot par saviem matemātiskajiem olimpiādes rezultātiem, nepiedaloties oficiālajā SJO novērtēšanas procesā. Tā vietā Openai bija bijušo SJO dalībnieku panelis, lai novērtētu tās AI sniegumu, pieeju, kas dažiem sabiedrības uzskatiem trūkst uzticamības.
“Openai, iespējams, šobrīd ir vissliktākais uzņēmums uz planētas,” rakstīja viens kritiķis, savukārt citi ieteica uzņēmumam “nopietni uztvert lietas” un “būt ticamākam”.
Tu redzi?
Openai ignorēja SJO pieprasījumu. Kauns. Nav klases. Taisna necieņa.
Google Deepmind rīkojās ar integritāti, saskaņots ar cilvēci.
Trvthnuke pic.twitter.com/8laoak6xue
– Nik (@ns123abc) 2025. gada 21. jūlijs
Apmācības metožu iekšpusē, kas darbināja Dvīņu matemātisko meistarību
Šķiet, ka Google Deepmind panākumi rodas no jaunām apmācības metodēm, kas pārsniedz tradicionālās pieejas. Komanda izmantoja uzlabotas pastiprināšanas mācīšanās metodes, kas izstrādātas, lai izmantotu daudzpakāpju spriešanu, problēmu risināšanu un teorēmu nodrošinošus datus. Modelim tika nodrošināta arī piekļuve augstas kvalitātes matemātisko risinājumu kolekcijai un saņēma īpašus norādījumus par tuvošanās imo stila problēmām.
Tehniskais sasniegums pārsteidza AI pētniekus, kuri atzīmēja tā plašāku seku. “Ne tikai matemātikas risināšana …, guess arī izpratne par valodu aprakstītajām problēmām un abstrakta loģikas piemērošana jauniem gadījumiem,” rakstīja AI Observer Elyss wrenApvidū “Šī nav rote atmiņa – šī ir jauna izziņa kustībā.”
Etans MolliksWharton skolas profesors, kurš studē AI, uzsvēra vispārējas nozīmes modeļa, nevis specializētu rīku izmantošanas nozīmi. “Pieaugot pierādījumiem par LLM spēju vispārināt jaunu problēmu risināšanu,” viņš rakstīja, uzsverot, kā tas atšķiras no iepriekšējām pieejām, kurām bija nepieciešama specializēta matemātiskā programmatūra.
Tas nebija tikai Openai.
Google arī izmantoja vispārēju nozīmes modeli, lai atrisinātu Starptautiskās matemātikas olimpiādes ļoti smagās matemātikas problēmas vienkāršā valodā. Pagājušajā gadā viņi izmantoja specializētu instrumentu izmantošanu
Palielināt pierādījumus par LLM spēju vispārināt jaunu problēmu risināšanu https://t.co/ve72ffmx2b
– Etans Molliks (@emollick) 2025. gada 21. jūlijs
Modelis demonstrēja īpaši iespaidīgu spriešanu vienā problēmā, kurā daudzi cilvēku konkurenti izmantoja maģistra līmeņa matemātiskos jēdzienus. Pēc DeepMind pētnieka Junhyuk Jung teiktā, Gemini “izdarīja izcilu novērojumu un izmantoja tikai pamatskolas skaita teoriju, lai izveidotu pašpietiekamu pierādījumu”, atrodot elegantāku risinājumu nekā daudzi cilvēku dalībnieki.
Ko nozīmē Google Deepmind uzvara 200 miljardu dolāru vērtās AI sacensībās
Izrāviens notiek kritiskā brīdī AI nozarē, kur uzņēmumi demonstrē augstākas spriešanas iespējas. Panākumiem ir tūlītēja praktiska ietekme: Google plāno izveidot tā versiju Deep Think modelis Pieejams matemātiķiem testēšanai, pirms tā tiek ieviesta Google AI Extremely abonentiem, kuri katru mēnesi maksā 250 USD par piekļuvi uzņēmuma vismodernākajiem AI modeļiem.
Laiks izceļ arī pastiprinošo konkurenci starp galvenajām AI laboratorijām. Kamēr Google svinēja savu metodisko, oficiāli pārbaudīto pieeju, strīdi, kas saistīti ar Openai paziņojumu, atspoguļo plašāku spriedzi par pārredzamību un uzticamību AI attīstībā.
Šī konkurences dinamika pārsniedz tikai matemātisko spriešanu. Pēdējo nedēļu laikā dažādi AI uzņēmumi paziņo par izrāvienu iespējām, lai gan ne visi ir saņemti pozitīvi. Elona Muska Xai nesen uzsāka palaišanu Groks 4kas uzņēmums apgalvoja, tomēr bija “gudrākais AI pasaulē” līderu saraksta rādītāji parādīja, ka tā ir Aiz Google un Openai modeļiem. Turklāt Groks ir saskāries ar kritiku par pretrunīgi vērtētām īpašībām, ieskaitot seksualizēti AI pavadoņi un ģenerēšanas epizodes antisemītisks satursApvidū
AI rītausma, kas domā kā cilvēki-ar reālām sekām
Matemātiskā olimpiādes uzvara pārsniedz konkurences lielīšanās tiesības. Dvīņu sniegums parāda, ka AI sistēmas tagad var saskaņot cilvēka līmeņa spriešanu sarežģītos uzdevumos, kuriem nepieciešama radošums, abstrakta domāšana un spēja sintezēt ieskatu vairākās jomās.
“Šis ir ievērojams avanss salīdzinājumā ar pagājušā gada izrāviena rezultātu,” DeepMind komanda atzīmēja viņu tehniskajā paziņojumā. Pāreja no specializēto formālo valodu prasības līdz darbībai dabiskā valodā liek domāt, ka AI sistēmas kļūst arvien intuitīvākas un pieejamākas.
Uzņēmumiem šī attīstība norāda, ka AI drīz var risināt sarežģītas analītiskas problēmas dažādās nozarēs, neprasot specializētu programmēšanu vai domēna zināšanas. Spēja pamatot ar sarežģītām problēmām, izmantojot ikdienas valodu, varētu demokratizēt sarežģītas analītiskās iespējas dažādās organizācijās.
Tomēr joprojām pastāv jautājumi par to, vai šīs spriešanas iespējas efektīvi pārvērtīsies par Messier reālās pasaules izaicinājumiem. Matemātiskā olimpiāde nodrošina precīzi definētas problēmas ar skaidriem veiksmes kritērijiem-tālu no neviennozīmīgiem, daudzšķautņainiem lēmumiem, kas nosaka lielāko daļu biznesa un zinātnisko centienu.
Google Deepmind plāno atgriezties nākamā gada konkursā ”Meklējot perfektu rezultātu. Uzņēmums uzskata, ka AI sistēmas, kas apvieno dabiskās valodas plūsmu ar stingru argumentāciju, “kļūs par nenovērtējamiem instrumentiem matemātiķiem, zinātniekiem, inženieriem un pētniekiem, palīdzot mums attīstīt cilvēku zināšanas par ceļu uz AGI”.
Guess, iespējams, visstingrākā detaļa parādījās no pašām sacensībām: saskaroties ar konkursa visgrūtāko problēmu, Dvīņi sāka no nepareizas hipotēzes un nekad neatguvās. Tikai pieci cilvēku studenti šo problēmu atrisināja pareizi. Galu galā, šķiet, pat zelta medaļas ieguvušajai AI joprojām ir ko mācīties no pusaudžu matemātiķiem.
avots