Home Tehnoloģija Kā procesuālā atmiņa var samazināt AI aģentu izmaksas un sarežģītību

Kā procesuālā atmiņa var samazināt AI aģentu izmaksas un sarežģītību

11
0

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt


Jauna tehnika no Džejjanas universitāte un Alibaba grupa Piešķir lielas valodas modeļa (LLM) aģentiem dinamisku atmiņu, padarot tos efektīvākus un efektīvākus sarežģītos uzdevumos. Paņēmiens, ko sauc Mempanodrošina aģentiem “procesuālo atmiņu”, kas tiek nepārtraukti atjaunināta, iegūstot pieredzi, līdzīgi kā tas, kā cilvēki mācās no prakses.

MEMP izveido mūža mācību ietvaru, kurā aģentiem nav jāsāk no nulles katram jaunam uzdevumam. Tā vietā tie kļūst arvien labāki un efektīvāki, jo viņi saskaras ar jaunām situācijām reālās vides vidē, kas ir galvenā prasība uzticamai uzņēmuma automatizācijai.

Procesālās atmiņas gadījums AI aģentos

LLM aģentiem ir solījums par sarežģītu, daudzpakāpju biznesa procesu automatizēšanu. Tomēr praksē šie garo horizontu uzdevumi var būt trausli. Pētnieki norāda, ka neparedzami notikumi, piemēram, tīkla glitches, lietotāja interfeisa izmaiņas vai mainīgas datu shēmas, var novilkt visu procesu. Pašreizējiem aģentiem tas bieži nozīmē sākt katru reizi, kas var būt laikietilpīgs un dārgs.

Tikmēr daudziem sarežģītiem uzdevumiem, neskatoties uz virsmas atšķirībām, ir dziļas strukturālās kopības. Tā vietā, lai katru reizi pārmeklētu šos modeļus, aģentam jāspēj iegūt un atkārtoti izmantot savu pieredzi no iepriekšējiem panākumiem un neveiksmēm, norāda pētnieki. Tam nepieciešama īpaša “procesuālā atmiņa”, kas cilvēkiem ir ilgtermiņa atmiņa, kas atbild par tādām prasmēm kā velosipēda rakstīšana vai braukšana, kas ar praksi kļūst automātiska.


AI mērogošana sasniedz savas robežas

Strāvas robežas, pieaugošās marķiera izmaksas un secinājumu kavēšanās ir uzņēmuma AI pārveidošana. Pievienojieties mūsu ekskluzīvajam salonam, lai atklātu, kā ir labākās komandas:

  • Enerģijas pārvēršana par stratēģisku priekšrocību
  • Arhitektējot efektīvus secinājumus par reālu caurlaidspējas pieaugumu
  • Konkurences IA atbloķēšana ar ilgtspējīgām AI sistēmām

Nostipriniet savu vietu, lai paliktu priekšā:


Sākot no nulles (augšā), izmantojot procesuālo atmiņu (apakšā) (avots: arxiv)

Pašreizējām aģentu sistēmām bieži trūkst šīs spējas. Viņu procesuālās zināšanas parasti izstrādā ar rokām izstrādātājiem, glabā stingrās uzvednes veidnēs vai iegulti modeļa parametros, kurus ir dārgi un lēni atjaunināt. Pat esošie atmiņas veidotie ietvari nodrošina tikai rupjas abstrakcijas un nav pienācīgi pievēršami, kā prasmes jābūvē, indeksē, labo un galu galā atzarotas par aģenta dzīves ciklu.

Līdz ar to pētnieki atzīmē viņu papīrs“Nav principiāla veida, kā kvantitatīvi noteikt, cik efektīvi aģents attīsta savu procesuālo repertuāru vai garantēt, ka jaunā pieredze uzlabojas, nevis iznīcina veiktspēju.”

Kā darbojas MEMP

MEMP ir uzdevumu-agnostiska sistēma, kas procesuālo atmiņu uzskata par optimizējamo galveno komponentu. Tas sastāv no trim galvenajiem posmiem, kas darbojas nepārtrauktā cilpā: atmiņas veidošana, iegūšana un atjaunināšana.

Atmiņas ir veidotas no aģenta pagātnes pieredzes jeb “trajektorijām”. Pētnieki izpētīja šo atmiņu glabāšanu divos formātos: verbatim, soli pa solim; vai destilējot šīs darbības augstāka līmeņa, skriptam līdzīgās abstrakcijās. Izgūšanai aģents meklē atmiņu par visatbilstošāko pagātnes pieredzi, kad viņam tiek dots jauns uzdevums. Komanda eksperimentēja ar dažādām metodēm, šādu vektora meklēšanu, lai jaunā uzdevuma apraksts atbilstu iepriekšējiem vaicājumiem vai atslēgvārdu iegūšanai, lai atrastu vispiemērotāko.

Kritiskākais komponents ir atjaunināšanas mehānisms. MEMP ievieš vairākas stratēģijas, lai nodrošinātu aģenta atmiņas attīstību. Tā kā aģents pabeidz vairāk uzdevumu, tā atmiņu var atjaunināt, vienkārši pievienojot jauno pieredzi, filtrējot tikai veiksmīgus rezultātus vai, visefektīvāk, atspoguļojot neveiksmes, lai labotu un pārskatītu sākotnējo atmiņu.

MEMP ietvars (avots: arxiv)

Šī uzmanība tiek pievērsta dinamiskai, mainīgai atmiņai novieto MEMP pieaugošajā pētījumu jomā, kuras mērķis ir padarīt AI aģentus uzticamāku ilgtermiņa uzdevumiem. Darbs ir paralēli citiem centieniem, piemēram, MEM0, kas konsolidē galveno informāciju no ilgām sarunām strukturētos faktos un zināšanu grafikos, lai nodrošinātu konsekvenci. Līdzīgi A-MEM ļauj aģentiem autonomi izveidot un sasaistīt “atmiņas piezīmes” no viņu mijiedarbības, laika gaitā veidojot sarežģītu zināšanu struktūru.

Tomēr līdzautors Runnans Fangs izceļ kritisku atšķirību starp MEMP un citiem ietvariem.

“MEM0 un A-MEM ir lieliski darbi … guess tie koncentrējas uz ievērojamu satura atcerēšanos iekšā Viena trajektorija vai saruna, ”Fangs komentēja VentureBeat. Būtībā viņi palīdz aģentam atcerēties“ kas ”notika.“ Memp, pretēji, mērķē uz starpnotorijas procesuālo atmiņu ”. Tas koncentrējas uz “kā” zināšanām, kuras var vispārināt līdzīgos uzdevumos, neļaujot aģentam katru reizi atkārtoti pārbaudīt no nulles.

“Destilējot pagātnes veiksmīgas darbplūsmas atkārtoti lietojamos procesuālajos priekšmetos, MEMP paaugstina panākumu līmeni un saīsina soļus,” piebilda Fangs. “Ļoti svarīgi, ka mēs ieviešam arī atjaunināšanas mehānismu, lai šī procesuālā atmiņa turpinātu uzlaboties – galu galā prakse ir lieliski piemērota arī aģentiem.”

“Aukstuma sākuma” problēmas pārvarēšana

Kaut arī mācīšanās jēdziens no pagātnes trajektorijām ir spēcīgs, tas rada praktisku jautājumu: kā aģents veido savu sākotnējo atmiņu, ja nav perfektu piemēru, no kuriem mācīties? Pētnieki pievēršas šai “aukstuma sākuma” problēmai ar pragmatisku pieeju.

Fangs paskaidroja, ka DEV vispirms var definēt stabilu novērtēšanas metriku, nevis iepriekš pieprasīt perfektu “zelta” trajektoriju. Šī metrika, kas var būt balstīta uz noteikumiem vai pat cita LLM, vērtē aģenta snieguma kvalitāti. “Kad šī metrika ir ieviesta, mēs ļaujam modernākajiem modeļiem izpētīt aģenta darbplūsmā un saglabājam trajektorijas, kas sasniedz visaugstākos rādītājus,” sacīja Fangs. Šis course of ātri palielina sākotnējo noderīgo atmiņu kopumu, ļaujot jaunam aģentam sasniegt ātrumu bez plašas manuālās programmēšanas.

Memp darbībā

Lai pārbaudītu ietvaru, komanda ieviesa MEMP papildus spēcīgajiem LLM, piemēram, GPT-4O, Claude 3.5 Sonnet un Qwen2.5, novērtējot tos sarežģītos uzdevumos, piemēram, mājsaimniecības darbos Alfworld etalonam un informācijas meklēšanai Travelplanner. Rezultāti parādīja, ka procesuālās atmiņas veidošana un iegūšana ļāva aģentam efektīvi destilēt un atkārtoti izmantot savu iepriekšējo pieredzi.

Pārbaudes laikā aģenti, kas aprīkoti ar MEMP, ne tikai sasniedza augstāku panākumu līmeni, guess arī kļuva daudz efektīvāki. Viņi novērsa neauglīgu izpēti un izmēģinājumu un kļūdas, izraisot būtisku gan darbību skaitu, gan marķiera patēriņu, kas nepieciešams uzdevuma veikšanai.

Procesālās atmiņas (labajā pusē) izmantošana palīdz aģentiem veikt uzdevumus mazākos posmos un izmantot mazāk žetonu (avots: arxiv)

Viens no nozīmīgākajiem uzņēmuma lietojumprogrammu atklājumiem ir tas, ka procesuālā atmiņa ir nododama. Vienā eksperimentā jaudīgā GPT-4O ģenerētā procesuālā atmiņa tika piešķirta daudz mazākam modelim, Qwen2.5-14b. Mazāks modelis ievērojami palielināja veiktspēju, uzlabojot tā panākumu līmeni un samazinot darbības, kas vajadzīgas uzdevumu veikšanai.

Pēc Fangas teiktā, tas darbojas, jo mazākie modeļi bieži rīkojas ar vienkāršām, vienpakāpēm, guess, kad runa ir par tālsatiksmes plānošanu un argumentāciju, ir labi vienas pakāpes darbības. Procedūras atmiņa no lielāka modeļa efektīvi aizpilda šo spēju plaisu. Tas liek domāt, ka zināšanas var iegūt, izmantojot mūsdienīgu modeli, pēc tam to izvietojot mazākos, rentablākos modeļos, nezaudējot šīs pieredzes priekšrocības.

Ceļā uz patiesi autonomiem aģentiem

Iepērkot aģentus ar atmiņas atjaunināšanas mehānismiem, MEMP ietvars ļauj viņiem pastāvīgi veidot un pilnveidot savas procesuālās zināšanas, darbojoties dzīvā vidē. Pētnieki atklāja, ka tas aģentam piešķīra “nepārtrauktu, gandrīz lineāru uzdevuma apguvi”.

Tomēr ceļš uz pilnīgu autonomiju prasa pārvarēt vēl vienu šķērsli: daudziem reālās pasaules uzdevumiem, piemēram, pētījuma ziņojuma sagatavošanai, trūkst vienkārša veiksmes signāla. Lai nepārtraukti uzlabotu, aģentam jāzina, vai tas paveica labu darbu. Fangs saka, ka nākotne ir LLM izmantošana kā tiesneši.

“Šodien mēs bieži apvienojam jaudīgus modeļus ar ar rokām darinātiem noteikumiem, lai aprēķinātu pabeigšanas rādītājus,” viņš atzīmē. “Tas darbojas, guess ar rokām uzrakstīti noteikumi ir trausli un grūti vispārināmi.”

LLM-AS-tiesnešu varētu sniegt niansētas, uzraudzības atgriezeniskās saites, kas vajadzīgas aģentam, lai pašpārliecinātos par sarežģītiem, subjektīviem uzdevumiem. Tas padarītu visu mācību cilpu pielāgojamāku un izturīgāku, atzīmējot kritisku soli, lai veidotu izturīgu, pielāgojamu un patiesi autonomu AI darbiniekus, kas nepieciešami sarežģītai uzņēmuma automatizācijai.


avots