Sekojiet zdnet: Pievienojiet mūs kā vēlamo avotu Google.
ZDNET galvenie pārņemšana
- Dvīņu modelis ieguva zeltu izaicinošā kodēšanas konkursā.
- Modelis pareizi atbildēja uz 10 no 12 problēmām.
- Uzvaram varētu būt liela ietekme uz AGI, saka Google.
Pēdējos gados lielie valodu modeļi (LLM) ir kļuvuši par daudzu programmatūras izstrādātāju instrumentu komplektu neatņemamu sastāvdaļu, palīdzot viņiem ātrāk un efektīvāk veidot, pilnveidot un izvietot lietotnes. Tagad Google saka, ka viens no vismodernākajiem modeļiem ir sasniedzis lielu kodēšanas izrāvienu, kas varētu palīdzēt izraisīt jaunus zinātniskus atklājumus – tostarp, iespējams, mākslīgā vispārējā intelekta vai AGI sasniegšanu.
Arī: vai AI domās kā cilvēki? Mēs pat neesam tuvu – un mēs uzdodam nepareizu jautājumu
Gemini 2.5 Deep Think, modernākā Google flagmana AI modeļa versija, kas izmanto uzlabotas spriešanas iespējas, lai sadalītu problēmas vairākos komponentos, ir sasniegusi zelta medaļu sniegumu 2025. gada Starptautiskajā koleģiālo programmēšanas konkursa (ICPC) pasaules finālā, uzņēmums trešdien paziņoja.
Google rakstīja a emuāra ieraksts ka DeMini 2.5 Deep domāšanas “uzlabotā versija” darbojas kā sava veida automatizēta un integrēta komanda.
“Lai risinātu problēmu, vairāki Dvīņu aģenti katrs piedāvā savus risinājumus, izmantojot termināļus, lai izpildītu kodu un testus, un pēc tam atkārtot risinājumus, pamatojoties uz visiem mēģinājumiem,” rakstīja uzņēmums.
Dvīņu pārsteidzošā uzvara
ICPC tiek plaši atzīts par pasaules prestižāko un grūtāko universitātes līmeņa kodēšanas konkursu. Komandas, kurās piedalījās gandrīz 3000 universitāšu 103 valstīs, sacentās šī gada finālā, kas notika 4. septembrī Baku, Azerbaidžānā. Katrai komandai piecu stundu laikā jāatrisina sarežģītu problēmu kopums. Kļūdai nav vietas: tikai perfektas atbildes saņem punktus.
Arī: es 24 dienu kodēšanu veicu 12 stundu laikā ar 20 USD AI rīku – bet tur ir viena liela kļūme
Dvīņi pareizi atrisināja 10 no 12 problēmām šī gada ICPC finālā, sasniedzot zelta medaļas līmeņa sniegumu un otro augstāko punktu skaitu kopumā, salīdzinot ar cilvēku konkursa dalībnieku grupu.
Dvīņu 2.5 Deep Thoup kopā ar Openai eksperimentālo spriešanas modeli sasniedza arī zelta medaļas līmeņa sniegumu šī gada starptautiskajā matemātiskajā olimpiādē, jūlijā paziņoja uzņēmumi.
“Kopā šie sasniegumi konkurences programmēšanā un matemātiskajā argumentācijā parāda Dvīņu dziļo lēcienu abstraktā problēmu risināšanā-iezīmējot nozīmīgu soli mūsu ceļā uz mākslīgo vispārējo intelektu (AGI),” Google rakstīja savā emuāra ierakstā.
Modeļa izrāviens
Tas, ko Google apraksta emuāra ierakstā kā “nepieredzēts brīdis”, Dvīņi ātri un pareizi atrisināja vienu no 12 konkurences problēmām, kas kavēja visus cilvēku konkurentus. No otras puses, bija divas problēmas, kuras tai neizdevās atrisināt, kuras citas komandas veiksmīgi izdarīja.
Arī: Openai ir jauns aģentu kodēšanas partneris jums tagad: GPT-5-CODEX
Trešā izaicinājuma problēma C problēma lūdza konkurentus izstrādāt risinājumu šķidruma izplatīšanai, izmantojot virkni savstarpēji savienotu kanālu, lai rezervuāri, kas savienoti ar katru kanālu, tiktu aizpildīti pēc iespējas ātrāk. Katru kanālu var aizvērt, atvērt vai daļēji atvērt, kas nozīmē, ka ir bezgalīgs skaits iespējamo konfigurāciju.
Meklējot optimālo konfigurāciju, Dvīņi izmantoja pārsteidzošu pieeju: tā sākās, piešķirot katram rezervuāram skaitlisko vērtību, lai noteiktu prioritāti, kas tai jāpiešķir attiecībā pret citiem. Pēc tam modelis izvietoja algoritmu un spēles teorētisku koncepciju, kas pazīstama kā Minimax teorēma, lai atrastu risinājumu.
Viss process aizņēma mazāk nekā pusstundu. Neviens cilvēku konkurents to nespēja atrisināt.
Arī: es izveidoju biznesa plānu ar catgpt, un tas pārvērtās par piesardzības stāstu
Lai arī šāda veida problēmu risināšanas spējas ir mazāk monumentālas, tas atgādina slaveno gājienu 37 Alphago 2016. gada spēles laikā pret Go World Champion Lee Sedol, kurā šis AI modelis (izstrādājis Google Deepmind) pieņēma stratēģiju, kas šajā brīdī pārsteidza cilvēku ekspertus, bet izrādījās izšķiroša pret tās uzvaru. Kopš tā laika “Move 37” ir kļuvis par saīsinājumu brīžos, kad AI rīkojas radoši vai negaidīti, kas izaicina mūsu parastās inteliģentās problēmu risināšanas normas.
Ko nozīmē Dvīņu uzvara
Dvīņu augstākā līmeņa veiktspēja 2025. gada ICPC ietekmē daudz ārpus programmatūras izstrādes, vēsta Google.
“ICPC nepieciešamās prasmes-izpratne par sarežģītu problēmu, daudzpakāpju loģiskā plāna izstrāde un nevainojami īstenošana-ir tādas pašas prasmes, kas vajadzīgas daudzās zinātniskās un inženierzinātņu jomās, piemēram, jaunu narkotiku izstrāde vai mikročipi,” uzņēmums rakstīja savā emuāra ierakstā, sakot, ka šī attīstība parāda AI, kas varētu palīdzēt sarežģītām problēmām, kas saistītas ar labvēlīgu labumu).
Arī: Google jaunais atvērtais protokols nodrošina AI aģentu darījumus – un 60 uzņēmumi to jau atbalsta
Priekšstats, ka AI galu galā varētu palīdzēt zinātniskos atklājumos, daudziem datorzinātniekiem jau sen ir sapnis. Šā mēneša sākumā Openai uzsāka iekšēju iniciatīvu, kas bija paredzēta šim pašam mērķim. Šā mēneša sākumā Hārvardas Medicīnas skola izstrādāja AI modeli, kas varētu palīdzēt mērķēt uz deģeneratīvu slimību un vēža ārstēšanu.
Saskaņā ar Google teikto, labākais ceļš šajā sakarā, iespējams, būs kaut kāds cilvēku-AI sadarbības veids, ar kura palīdzību tādi uzlaboti aģentu modeļi kā Gemini 2.5 Deep Thoup piedāvā jaunus risinājumus īpaši sarežģītām tehniskām problēmām.