Sekojiet ZDNET: Pievienojiet mūs kā vēlamo avotu Google tīklā.
ZDNET galvenās atziņas
- Microsoft pētīja mijiedarbību starp AI klientiem un pārdevējiem.
- Lielākajai daļai aģentu neizdevās pretoties manipulācijām un izdarīt saprātīgu izvēli.
- Rezultāti uzsver AI aģentu vadītas ekonomikas draudus.
Kā jūs droši vien esat pamanījuši, ap AI aģentiem un viņu domājamajām iespējām pārveidot ekonomiku un cilvēku darbu, automatizējot rutīnas, laikietilpīgus uzdevumus, ir bijis daudz ažiotāžu. Tomēr arvien vairāk pētījumu liecina, ka aģenti nedarbojas elementāri, norādot, ka viņi, iespējams, vēl nav gatavi pirmizrādei.
Tāpat: es ļāvu Gemini Deep Analysis izpētīt manu Gmail un Diska saturu — lūk, ko tā atklāja
Jauns Microsoft pētījums atklāja, ka nozarē vadošajiem aģentu mākslīgā intelekta rīkiem ir grūti mijiedarboties vienam ar otru, lai pieņemtu tirgus pamata lēmumus, piemēram, izvēloties restorānu, salīdzinot ēdienkartes piedāvājumus un cenas. Pētnieki arī atklāja, ka lielākā daļa aģentu bija mēģinājuši manipulēt, tostarp tūlītējas injekcijas un maldinoša informācija. Tomēr šie aģenti pastāvīgi cieta neveiksmi, kas nozīmē, ka pētījums varētu sniegt AI uzņēmumiem plānu, kā novērst šīs nepilnības.
Pārbaudes tirgus
Microsoft pētījumi aptvēra to, ko tā sauc par “Maģiskais tirgus” — atvērtā pirmkoda vide, kurā AI aģenti savā starpā sarunājas, lai pabeigtu darījumus virtuālā vidē, kas imitē reālās pasaules tirgu. (Varat izmēģināt pats. GitHub.)
Mērķis bija pārbaudīt aģentu sistēmu praktiskās iespējas laikā, kad AI izstrādātāji strauji piegādā autonomākus produktus, piemēram, iepirkšanās un pirkšanas aģentus gan privātpersonām, gan uzņēmumiem. Piemēram, OpenAI operators var pārvietoties vietnēs un veikt pirkumus lietotāju vārdā, savukārt Meta Enterprise AI var mijiedarboties ar klientiem kā automatizēts tirdzniecības pārstāvis.
Tāpat: Google finanses saņem ar Gemini darbinātu jauninājumu — ko tas var sniegt jūsu labā tagad
Automatizēto pircēju un pārdevēju pieaugums “liecina par nākotni, kur [AI] aģenti kļūst par aktīviem tirgus dalībniekiem, taču šo tirgu struktūra joprojām ir neskaidra,” Microsoft raksta uzņēmuma emuāra ierakstā par savu jauno pētījumu.
Magentic Market ir agrīns mēģinājums iezīmēt daļu no šīs struktūras un atklāt visas lamatas, kurās mēs varētu nonākt. Tas ir izstrādāts, lai simulētu reālo tirgu sarežģītību, un tajā ir iesaistīti daudzi aģenti, kuri visi ir atbrīvoti, īstā spēles teorijas stilā, lai mijiedarbotos, cenšoties optimizēt savus individuālos rezultātus, nevis vienkārši sastopas automatizēto klientu aģentu pret pircēja aģentu un ļautu viņiem noslēgt darījumu.
Microsoft veica savus eksperimentus, izmantojot vadošos patentētos modeļus, piemēram, GPT-5 un Gemini 2.5 Flash, kā arī atvērtā koda modeļus, piemēram, OpenAI OSS-20b. Šie modeļi tika izmantoti, lai modelētu 100 klientus un 300 uzņēmumus, kuri varētu mijiedarboties savā starpā, izmantojot teksta uzvednes, kuras var pārraudzīt lietotāji.
Tāpat: es ļāvu ChatGPT Atlas veikt Walmart iepirkšanos manā vietā — lūk, kā to darīja AI pārlūkprogrammas aģents
Microsoft piešķīra klientu aģentiem preču un ērtību sarakstu un bija jāmeklē visi pieejamie pārdevēju aģenti, lai atrastu to, kas piedāvāja visu, ko viņi meklē, par labāko pieejamo cenu. Pētnieki izmantoja “patērētāju labklājības” metriku, lai novērtētu katra modeļa veiktspēju, kas tika aprēķināta kā klienta iekšējo preču vērtējumu summa, no kuras atņemta galīgā pārdošanas cena, kas apkopota visos tā darījumos.
Kā aģentiem veicās
Pēc Microsoft domām, klientu aģenti bieži izrādīja solījumu, palīdzot cilvēkiem pārvarēt to, ko uzņēmums raksturoja kā “informācijas trūkumus”. Uztveriet tos kā garīgus vai loģistikas īsceļus, ko cilvēks var izmantot, ja viņam tiek piedāvāts pārāk daudz iespēju, piemēram, nejauši izvēlēties vai meklēt lētāko variantu.
“Šīs izmaiņas ir svarīgas, jo aģentiem iegūstot labākus atklāšanas un saziņas rīkus, viņi atbrīvo klientus no lielās kognitīvās slodzes, kas rodas, aizpildot informācijas nepilnības,” savā emuāra ierakstā rakstīja Microsoft. “Tas samazina apzinātu lēmumu pieņemšanas izmaksas un uzlabo klientu rezultātus.”
Arī: Kāpēc Amazon patiešām nevēlas, lai Perplexity AI pārlūkprogramma iepirktos jūsu vietā
Tomēr aģentiem bija arī daži kritiski trūkumi.
Viena no lielajām problēmām bija saistīta ar to, ko pētnieki sauc par “izvēles paradoksu” — pazīstamāka frāze varētu būt “analīzes paralīze”. Būtībā, lai gan viņiem bija daudz dažādu iespēju izvēlēties, lielākā daļa klientu aģentu, izņemot GPT-5 un Gemini 2.5 Flash, sadarbojās tikai ar nelielu skaitu pārdevēju aģentu.
“Tas liek domāt, ka lielākā daļa modeļu neveic izsmeļošus salīdzinājumus un tā vietā viegli pieņem sākotnējās “pietiekami labās” iespējas,” rakstīja Microsoft. Pētnieki turklāt atklāja, ka katram klientu aģentam patērētāju labklājība samazinājās, jo palielinājās pārdevēju aģentu pieejamo iespēju skaits.
Tāpat: Google AI režīma aģenti var iegādāties pasākumu biļetes jūsu vietā tagad — lūk, kā to izdarīt
Pētnieki arī pārbaudīja sešas dažādas “manipulācijas stratēģijas”, lai mēģinātu maldināt klientu aģentus, tostarp pievienojot apšaubāmus apgalvojumus, piemēram, “novērtēts meksikāņu restorāns” vai izmantojot atklātas tūlītējas injekcijas. Saskaņā ar Microsoft teikto, bija lielas atšķirības attiecībā uz to, kā modeļi reaģēja; jo īpaši, Claude Sonnet 4 izrādīja pilnīgu pretestību visiem manipulācijas mēģinājumiem.
Nav pārsteidzoši, ka pētnieki atklāja dažas novirzes, kas kavēja modeļa veiktspēju. Piemēram, atvērtā pirmkoda modeļiem, piemēram, Qwen2.5-14b-2507, bija tendence izvēlēties pēdējo uzņēmumu, kas tika piedāvāts sākotnējā opciju sarakstā, neatkarīgi no tā, kā tas tiek salīdzināts ar citiem. Bija arī plaši izplatīta “priekšlikuma novirze”, kas lika modeļiem izvēlēties pirmo pārdevēja aģentu, kas ar to sadarbojās ar piedāvājumu, liekot domāt par ātruma prioritāti, nevis pamatīgumu.
“Šie aizspriedumi var radīt negodīgu tirgus dinamiku, izraisīt neparedzētu uzvedību un mudināt uzņēmumus panākt atbildes ātrumu, nevis produkta vai pakalpojuma kvalitāti,” sacīja Microsoft.
Aģentu lietošanas riski
Lai gan uzņēmumi, kas izmanto šos rīkus, reklamē tos kā laiku taupošus personīgos asistentus, tiem var būt arī lielas ekonomiskas sekas, kuras vēl nav apzinātas. Piemēram, akciju tirgu jau pārvalda neizdibināmi algoritmi, kas paredzēti neskaitāmu preču cenu izsekošanai. Cik nepārredzamāka kļūs šī sistēma, ja AI ne tikai izseko preču cenām, wager faktiski pārrauga daudzus vai lielāko daļu ikdienas darījumu?
Tāpat: AI aģenti ir tik labi, cik tie tiek sniegti, un tas ir liela problēma uzņēmumiem
Tā kā mēs jau zinām, ka mākslīgā intelekta modeļi ir pakļauti visa veida novirzēm, kas slēpjas dziļi to apmācības datu sarežģītībā, kā tie izpaudīsies, kad AI patērētāju un pircēju leģioni tiks izlaisti savvaļā?
Microsoft atklājumi ir tikai jaunākie, kas pierāda, ka aģentiem nevajadzētu uzticēties situācijās, kurās ir lielas likmes, un ikreiz, kad tie tiek izvietoti, tie ir rūpīgi jāuzrauga.
Piemēram, citā šīs nedēļas sākumā publicētajā pētījumā konstatēts, ka AI aģenti ir tālu no kvalitatīva ārštata darba pabeigšanas. Antropisks pētniecības projekts šī gada sākumā parādīja, ka Klods mēnesi cīnījās, lai vadītu mazu uzņēmumu.
Vai vēlaties vairāk stāstu par AI? Reģistrējieties mūsu AI līderu sarakstam informatīvais izdevums.
Visi šie rezultāti liek secināt, ka, neskatoties uz milzīgo ažiotāžu, kas virmo ap aģentiem, paies kāds laiks, līdz šīs sistēmas varēs darboties autonomi. Kā Microsoft secina savā emuāra ierakstā: “Aģentiem vajadzētu palīdzēt, nevis aizstāt cilvēku lēmumu pieņemšanu.”












