Medal, videospēļu klipu augšupielādes un kopīgošanas platforma, ir izveidojusi jaunu progresīvu AI pētniecības laboratoriju, kas izmanto savus spēļu videoklipus, lai apmācītu un veidotu pamata modeļus un AI aģentus, kas var saprast, kā objekti un entītijas pārvietojas telpā un laikā. Šo koncepciju sauc par telpisko un laika spriešanu.
Jaunuzņēmums, ko sauc par Normal Instinct, paredz, ka Medal datu kopa, kas sastāv no 2 miljardiem videoklipu gadā no 10 miljoniem aktīvo lietotāju ikmēneša desmitiem tūkstošu spēļu, pārspēj tādas alternatīvas kā Twitch vai YouTube aģentu apmācībai.
“Spēlējot videospēles, jūs būtībā nododat savu uztveri, parasti izmantojot kameras pirmās personas skatu, uz dažādām vidēm,” TechCrunch teica Pims de Vite, Medal and Normal Instinct izpilddirektors. Viņš atzīmēja, ka spēlētāji, kuri augšupielādē klipus, mēdz publicēt ļoti negatīvus vai pozitīvus piemērus, kas kalpo kā patiešām noderīgi apmācības gadījumi. “Jūs saņemat šo atlases novirzi uz tieši tāda veida datiem, kurus vēlaties izmantot apmācības darbā.”
Tiek ziņots, ka šis datu grāvis piesaistīja OpenAI uzmanību, kas pagājušā gada beigās mēģināja iegūt medaļu par 500 miljoniem USD. Informācija. (Ne OpenAI, ne Normal Instinct nekomentētu ziņojumu.)
Tas arī ir novedis pie tā, ka Normal Instinct ir piesaistījis milzīgus $ 133,7 miljonus sākuma finansējuma, ko vadīja Khosla Ventures un Normal Catalyst, piedaloties Raine.
Jaunuzņēmums plāno izmantot līdzekļus, lai palielinātu savu pētnieku un inženieru komandu, kas koncentrējas uz vispārēja aģenta apmācību, kas var mijiedarboties ar apkārtējo pasauli, mērķējot uz sākotnējiem lietojumiem spēlēs un meklēšanas un glābšanas dronos.
De Vite saka, ka dibinātāju komanda jau ir guvusi panākumus: Vispārējās intuīcijas modelis var saprast vidi, kurā tas nebija apmācīts, un pareizi paredzēt darbības tajās. To var izdarīt tikai, izmantojot vizuālo ievadi; aģenti redz tikai to, ko redzētu spēlētājs, un viņi pārvietojas telpā, sekojot kontrollera ievadēm. Uzņēmums saka, ka šī pieeja var dabiski pāriet uz fiziskām sistēmām, piemēram, robotizētām rokām, droniem un autonomiem transportlīdzekļiem, ar kuriem cilvēki bieži manipulē, izmantojot videospēļu kontrolierus.
Techcrunch pasākums
Sanfrancisko
|
2025. gada 27.–29. oktobris
Nākamais Vispārējās intuīcijas pavērsiens ir divējāds: jaunu simulētu pasauļu ģenerēšana citu aģentu apmācībai un autonoma navigācija pilnīgi nepazīstamā fiziskā vidē.
Šī tehniskā pieeja veido to, kā uzņēmums plāno komercializēt savu tehnoloģiju, un izceļ to no konkurentiem, kas veido pasaules modeļus.
Lai gan Normal Instinct arī veido pasaules modeļus, uz kuriem apmācīt savus aģentus, šādi modeļi nav produkts. Atšķirībā no citiem pasaules modeļu veidotājiem, piemēram, DeepMind un World Labs, kas pārdod savus pasaules modeļus Genie un Marmors Aģentu apmācībai un satura veidošanai Normal Instinct koncentrējas uz citiem lietošanas gadījumiem, lai izvairītos no autortiesību problēmām.
“Mūsu mērķis nav ražot modeļus, kas konkurē ar spēļu izstrādātājiem,” sacīja de Vite.
Tā vietā starta spēļu lietojumprogrammas ir vērstas uz robotu un ne-spēlētāju rakstzīmju izveidi, kas var pārspēt tradicionālos “determinētos robotus” vai iepriekš ieprogrammētas rakstzīmes, kas katru reizi rada vienu un to pašu rezultātu.
“[The bots] var tikt mērogots līdz jebkuram sarežģītības līmenim,” Morics Bērs-Lents, Normal Instinct dibinātājs un Lightspeed Ventures partneris, teica TechCrunch. “Nav piespiedu kārtā radīt dievišķu robotu, kas pārspēj visus, taču, ja jūs varat pakāpeniski mērogot un papildināt jebkuras spēlētāja situācijas likviditāti, lai viņu laimestu līmenis vienmēr būtu aptuveni 50%, un tas vienmēr maksimāli palielinās līdz 50%.
De Vitam ir arī pieredze humānās palīdzības jomā, kas norāda uz starta uzsvaru uz meklēšanas un glābšanas bezpilota lidaparātu darbināšanu, kuriem dažreiz ir jāpārvietojas nepazīstamā vidē un jāiegūst informācija bez GPS.
Galu galā de Vite un Bejē-Lencs uzskata, ka vispārējās intuīcijas pamatfunkcija – telpiskā un laika spriešana – ir izšķiroša daļa cīņā pret mākslīgo vispārējo intelektu (AGI). Lai gan lielākās AI laboratorijas koncentrējas uz arvien jaudīgāku lielu valodu modeļu izveidi, vispārējā intuīcija uzskata, ka patiesai AGI ir nepieciešams kaut kas, kas LLM principā pietrūkst.
“Kā cilvēki mēs veidojam tekstu, lai aprakstītu, kas notiek mūsu pasaulē, taču, to darot, jūs zaudējat daudz informācijas,” sacīja de Vite. “Jūs zaudējat vispārējo intuīciju attiecībā uz telpisko un laika spriešanu.”