Google Deepmind otrdien izlaida jaunu valodas modeli ar nosaukumu Gemini Robotics On-System, kas var vadīt uzdevumus uz robotiem, nepieprasot interneta savienojumu.
Balstoties uz uzņēmuma iepriekšējo Gemini robotikas modeli, kas tika izlaists martā, Gemini Robotics On-System var kontrolēt robota kustības. Izstrādātāji var kontrolēt un precīzi pielāgot modeli, lai tas atbilstu dažādām vajadzībām, izmantojot dabiskās valodas uzvednes.
Etalīnos Google apgalvo, ka modelis darbojas tādā līmenī, kas atrodas tuvu mākonim balstītam Dvīņu robotikas modelim. Uzņēmums saka, ka tas pārspēj citus in-estice modeļus vispārīgi etalonos, lai gan tas šos modeļus nenosauca.
Demonstrācijā uzņēmums parādīja robotus, kas vada šo vietējo modeli, darot tādas lietas kā somas un saliekamas drēbes. Google saka, ka, kamēr modelis tika apmācīts Aloha robotitas vēlāk to pielāgoja, lai strādātu Bi-ARM Franka FR3 robots un Apollo humanoīdu robots, ko veica ApptronikApvidū
Google apgalvo, ka divkāršā Franka FR3 bija veiksmīga, risinot scenārijus un objektus, ko tā iepriekš nebija “redzējusi”, piemēram, darot montāža uz rūpnieciskās jostasApvidū
Google DeepMind arī atbrīvo Dvīņu robotika SDKApvidū Uzņēmums sacīja, ka izstrādātāji var parādīt robotus no 50 līdz 100 uzdevumu demonstrācijām, lai apmācītu tos jaunos uzdevumos, izmantojot šos modeļus Mujoco Physics simulatorā.
Arī citi AI modeļa izstrādātāji robotikā iemērc pirkstus. NVIDIA veido platformu humanoīdu pamatu modeļu izveidošanai; Sejas apskaušana ir ne tikai atvērto modeļu un datu kopu izstrāde robotikai, wager arī strādā pie robotiem; un Mirae Asset atbalstītais korejiešu starta RLWRLD strādā pie robotu pamata modeļu izveidošanas.