Google DeepMind koplietots Ceturtdien SIMA 2, tā vispārējās mākslīgā intelekta aģenta nākamās paaudzes izpētes priekšskatījums, kas integrē Gemini, Google lielā valodas modeļa, valodu un spriešanas spējas, lai ne tikai sekotu norādījumiem, wager arī saprastu vidi un mijiedarbotos ar to.
Tāpat kā daudzi DeepMind projekti, tostarp AlphaFold, pirmā SIMA versija tika apmācīta simtiem stundu videospēļu datu, lai iemācītos spēlēt vairākas 3D spēles kā cilvēks, pat dažas spēles, kurās tā nebija apmācīta. SIMA 1, kas tika prezentēts 2024. gada martā, varēja izpildīt pamata norādījumus plašā virtuālo vidi klāstā, taču sarežģītu uzdevumu izpildes panākumu līmenis bija tikai 31%, salīdzinot ar 71% cilvēkiem.
“SIMA 2 ir pakāpeniskas izmaiņas un iespēju uzlabojumi salīdzinājumā ar SIMA 1,” preses brīfingā sacīja Džo Marino, DeepMind vecākais pētnieks. “Tas ir vispārīgāks aģents. Tas var veikt sarežģītus uzdevumus iepriekš neredzētās vidēs. Un tas ir sevi pilnveidojošs aģents. Tātad tas faktiski var sevi pilnveidot, pamatojoties uz savu pieredzi, kas ir solis pretim vispārīgākiem robotiem un AGI sistēmām kopumā.”
SIMA 2 darbina Gemini 2.5 flash-lite modelis, un AGI attiecas uz mākslīgo vispārējo intelektu, ko DeepMind definē kā sistēmu, kas spēj veikt plašu intelektuālu uzdevumu klāstu ar spēju apgūt jaunas prasmes un vispārināt zināšanas dažādās jomās.
DeepMind pētnieki saka, ka darbs ar tā sauktajiem “iemiesotajiem aģentiem” ir ļoti svarīgs vispārinātam intelektam. Marino paskaidroja, ka iemiesotais aģents mijiedarbojas ar fizisko vai virtuālo pasauli, izmantojot ķermeni — novērojot ievadi un veicot darbības līdzīgi kā robots vai cilvēks, savukārt aģents, kas nav iemiesots, var mijiedarboties ar jūsu kalendāru, veikt piezīmes vai izpildīt kodu.
Džeina Vanga, DeepMind vecākā personāla pētniece ar pieredzi neirozinātnēs, teica TechCrunch, ka SIMA 2 sniedzas daudz tālāk par spēlēšanu.
“Mēs lūdzam to patiešām saprast, kas notiek, saprast, ko lietotājs tam lūdz darīt, un pēc tam spēt atbildēt veselā saprāta veidā, kas patiesībā ir diezgan grūti,” sacīja Vans.
Techcrunch pasākums
Sanfrancisko
|
2026. gada 13.–15. oktobris
Integrējot Gemini, SIMA 2 dubultoja sava priekšgājēja veiktspēju, apvienojot Gemini progresīvās valodas un spriešanas spējas ar apmācībā iegūtajām prasmēm.

Marino demonstrēja SIMA 2 filmā “No Man’s Sky”, kur aģents aprakstīja tās apkārtni — akmeņainu planētas virsmu — un noteica tās turpmākos soļus, atpazīstot briesmu bāku un mijiedarbojoties ar to. SIMA 2 izmanto arī Gemini, lai iekšēji spriestu. Citā spēlē, lūdzot aiziet līdz mājai, kas ir nogatavojušos tomāta krāsā, aģents izrādīja savu domu – nogatavojušies tomāti ir sarkani, tāpēc jādodas uz sarkano māju – tad atrada un piegāja pie tās.
Tas, ka SIMA 2 darbojas ar Dvīņu spēku, nozīmē arī to, ka SIMA 2 izpilda norādījumus, kuru pamatā ir emocijzīmes: “Jūs to pamācat 🪓🌲, un tas nocirtīs koku,” sacīja Marino.
Marino arī demonstrēja, kā SIMA 2 var orientēties jaunizveidotās fotoreālistiskās pasaulēs, ko radījis Genie, DeepMind pasaules modelis, pareizi identificējot un mijiedarbojoties ar tādiem objektiem kā soliņi, koki un tauriņi.

Dvīņi arī ļauj sevi pilnveidot bez daudz cilvēku datiem, piebilda Marino. Ja SIMA 1 tika pilnībā apmācīts cilvēka spēlēšanai, SIMA 2 to izmanto kā bāzes līniju, lai nodrošinātu spēcīgu sākotnējo modeli. Kad komanda ievieto aģentu jaunā vidē, tā lūdz citam Gemini modelim izveidot jaunus uzdevumus un atsevišķu atlīdzības modeli, lai novērtētu aģenta mēģinājumus. Izmantojot šo paša radīto pieredzi kā apmācību datus, aģents mācās no savām kļūdām un pakāpeniski darbojas labāk, būtībā mācot sev jaunas uzvedības metodes, izmantojot izmēģinājumus un kļūdas, kā to darītu cilvēks, vadoties pēc AI balstītas atsauksmes, nevis cilvēkus.
DeepMind uzskata, ka SIMA 2 ir solis ceļā uz vispārējas nozīmes robotu atbloķēšanu.
“Ja mēs domājam par to, kas sistēmai ir jādara, lai veiktu uzdevumus reālajā pasaulē, piemēram, robotam, es domāju, ka tajā ir divas sastāvdaļas,” preses brīfingā sacīja Frederiks Bese, DeepMind vecākais personāla pētniecības inženieris. “Pirmkārt, ir augsta līmeņa izpratne par reālo pasauli un to, kas jādara, kā arī daži argumenti.”
Ja lūdzat robotam humanoīdu jūsu mājā pārbaudīt, cik pupiņu kārbu jums ir skapī, sistēmai ir jāsaprot visi dažādie jēdzieni — kas ir pupiņas, kas ir skapis — un jādodas uz šo vietu. Besse saka, ka SIMA 2 vairāk skar šo augsta līmeņa uzvedību, nevis zemāka līmeņa darbības, kuras viņš dēvē par tādu lietu kā fizisko locītavu un riteņu kontroli.
Komanda atteicās dalīties ar konkrētu laika grafiku SIMA 2 ieviešanai fiziskajās robotikas sistēmās. Besse pastāstīja TechCrunch, ka DeepMind ir nesen atklāta robotikas pamatu modeļi, kas var arī domāt par fizisko pasauli un izveidot daudzpakāpju plānus misijas pabeigšanai, tika apmācīti atšķirīgi un atsevišķi no SIMA.
Lai gan nav arī laika grafika vairāk kā SIMA 2 priekšskatījuma izlaišanai, Vans teica TechCrunch, ka mērķis ir parādīt pasaulei, pie kā DeepMind ir strādājis, un noskaidrot, kāda veida sadarbība un potenciālie lietojumi ir iespējami.













