Trešdien Microsoft pētnieki izlaida jaunu simulācijas vidi, kas izstrādāta, lai pārbaudītu AI aģentus, kā arī jaunus pētījumus, kas liecina, ka pašreizējie aģentu modeļi var būt neaizsargāti pret manipulācijām. Pētījums, kas veikts sadarbībā ar Arizonas štata universitāti, rada jaunus jautājumus par to, cik labi AI aģenti darbosies, strādājot bez uzraudzības, un cik ātri AI uzņēmumi var izpildīt solījumus par aģentu nākotni.
Simulācijas vide, saukta par “Maģiskais tirgus” Microsoft, ir izveidota kā sintētiska platforma AI aģenta darbības eksperimentēšanai. Tipisks eksperiments var ietvert klientu aģentu, kurš mēģina pasūtīt vakariņas saskaņā ar lietotāja norādījumiem, savukārt aģenti, kas pārstāv dažādus restorānus, sacenšas, lai uzvarētu pasūtījumā.
Komandas sākotnējie eksperimenti ietvēra 100 atsevišķus klientu puses aģentus, kas sadarbojās ar 300 biznesa puses aģentiem. Tā kā tirgus avota kods ir atvērtā koda avots, citām grupām vajadzētu būt vienkāršai lietošanai, lai veiktu jaunus eksperimentus vai reproducētu atklājumus.
Ece Kamar, Microsoft Analysis AI Frontiers Lab rīkotājdirektors, saka, ka šāda veida pētījumi būs ļoti svarīgi, lai izprastu AI aģentu iespējas. “Patiesībā ir jautājums par to, kā pasaule mainīsies, ja šie aģenti sadarbosies, runās savā starpā un risinās sarunas,” sacīja Kamārs. “Mēs vēlamies dziļi izprast šīs lietas.”
Sākotnējais pētījums aplūkoja vadošo modeļu kombināciju, tostarp GPT-4o, GPT-5 un Gemini-2.5-Flash, un atklāja dažas pārsteidzošas nepilnības. Jo īpaši pētnieki atklāja vairākas metodes, kuras uzņēmumi varētu izmantot, lai manipulētu ar klientu aģentiem, lai viņi iegādātos savus produktus. Pētnieki pamanīja īpašu efektivitātes samazināšanos, jo klienta aģentam tika dotas lielākas izvēles iespējas, pārspējot aģenta uzmanību.
“Mēs vēlamies, lai šie aģenti mums palīdzētu apstrādāt daudzas iespējas,” saka Kamārs. “Un mēs redzam, ka pašreizējie modeļi patiešām kļūst pārāk nomākti, jo viņiem ir pārāk daudz iespēju.”
Aģenti arī nokļuva nepatikšanās, kad viņiem tika lūgts sadarboties kopīga mērķa sasniegšanai, acīmredzot nezinot, kuram aģentam būtu jāuzņemas kāda loma sadarbībā. Veiktspēja uzlabojās, kad modeļiem tika sniegti precīzāki norādījumi par to, kā sadarboties, taču pētnieki joprojām uzskatīja, ka modeļiem piemītošās iespējas ir jāuzlabo.
Techcrunch pasākums
Sanfrancisko
|
2026. gada 13.–15. oktobris
“Mēs varam instruēt modeļus — tāpat kā mēs varam viņiem pastāstīt, soli pa solim,” sacīja Kamārs. “Guess, ja mēs pēc būtības pārbaudām viņu sadarbības iespējas, es sagaidu, ka šiem modeļiem šīs iespējas būs pēc noklusējuma.”













