Home Tehnoloģija ACE novērš konteksta sabrukumu, izmantojot “attīstošās rokasgrāmatas” pašpilnveidojošiem AI aģentiem

ACE novērš konteksta sabrukumu, izmantojot “attīstošās rokasgrāmatas” pašpilnveidojošiem AI aģentiem

22
0

Jauns ietvars no Stenfordas universitāte un SambaNova risina būtisku izaicinājumu, veidojot stabilus AI aģentus: konteksta inženieriju. Zvanīja Aģentiskā konteksta inženierija (ACE), ietvars automātiski aizpilda un modificē lielo valodas modeļu (LLM) lietojumprogrammu konteksta logu, uzskatot to par “attīstošu rokasgrāmatu”, kas veido un pilnveido stratēģijas, aģentam iegūstot pieredzi savā vidē.

ACE ir izstrādāta, lai pārvarētu citu konteksta inženierijas sistēmu galvenos ierobežojumus, neļaujot modeļa kontekstam pasliktināties, uzkrājot vairāk informācijas. Eksperimenti liecina, ka ACE darbojas gan sistēmas uzvedņu optimizēšanai, gan aģenta atmiņas pārvaldīšanai, pārspējot citas metodes, vienlaikus ir arī ievērojami efektīvāka.

Kontekstu inženierijas izaicinājums

Uzlabotās AI lietojumprogrammas, kas izmanto LLM, lielā mērā paļaujas uz "konteksta adaptācija," vai konteksta inženieriju, lai vadītu viņu uzvedību. Tā vietā, lai veiktu dārgu modeļa pārkvalificēšanas vai precizēšanas procesu, izstrādātāji izmanto LLM. konteksta mācīšanās spējas lai vadītu tā uzvedību, pārveidojot ievades uzvednes ar īpašiem norādījumiem, argumentācijas darbībām vai domēna specifiskām zināšanām. Šo papildu informāciju parasti iegūst, aģentam mijiedarbojoties ar savu vidi un apkopojot jaunus datus un pieredzi. Kontekstu inženierijas galvenais mērķis ir sakārtot šo jauno informāciju tā, lai uzlabotu modeļa veiktspēju un izvairītos no tā sajaukšanas. Šī pieeja kļūst par centrālo paradigmu spējīgu, mērogojamu un pašpilnveidojošu AI sistēmu veidošanā.

Kontekstu inženierijai ir vairākas priekšrocības uzņēmuma lietojumprogrammām. Konteksti ir interpretējami gan lietotājiem, gan izstrādātājiem, tos var papildināt ar jaunām zināšanām izpildlaikā, un tos var kopīgot dažādos modeļos. Kontekstu inženierija gūst labumu arī no nepārtrauktiem aparatūras un programmatūras uzlabojumiem, piemēram, augošie konteksta logi LLM un efektīvas secinājumu metodes, piemēram, uzvednes un konteksta kešatmiņa.

Ir dažādas automatizētas konteksta inženierijas metodes, taču lielākā daļa no tām saskaras ar diviem galvenajiem ierobežojumiem. Pirmā ir “īsuma novirze”, kur tūlītējas optimizācijas metodes parasti dod priekšroku kodolīgiem, vispārīgiem norādījumiem, nevis visaptverošiem, detalizētiem norādījumiem. Tas var mazināt veiktspēju sarežģītās jomās.

Otrs, smagāks jautājums ir "konteksta sabrukums." Ja LLM tiek uzdots atkārtoti pārrakstīt visu savu uzkrāto kontekstu, tas var ciest no sava veida digitālās amnēzijas.

“Tas, ko mēs saucam par konteksta sabrukumu, notiek, kad AI mēģina pārrakstīt vai saspiest visu, ko tas ir iemācījies, vienā jaunā uzvednes vai atmiņas versijā,” raksta pētnieki rakstveida komentāros VentureBeat. “Laika gaitā šis pārrakstīšanas course of izdzēš svarīgas detaļas, piemēram, dokumenta pārrakstīšanu tik daudz reižu, ka galvenās piezīmes pazūd. Klientiem paredzētajās sistēmās tas var nozīmēt, ka atbalsta aģents pēkšņi zaudē izpratni par pagātnes mijiedarbību… izraisot neregulāru vai nekonsekventu uzvedību.”

Pētnieki apgalvo, ka “kontekstiem vajadzētu darboties nevis kā kodolīgiem kopsavilkumiem, wager gan kā visaptverošām, attīstošām rokasgrāmatām – detalizētām, iekļaujošām un bagātām ar domēna ieskatiem.” Šī pieeja balstās uz mūsdienu LLM spēku, kas var efektīvi atdalīt atbilstību no gariem un detalizētiem kontekstiem.

Kā darbojas aģentu konteksta inženierija (ACE).

ACE ir ietvars visaptverošai konteksta pielāgošanai, kas paredzēts gan bezsaistes uzdevumiem, piemēram, sistēmas uzvednes optimizācijaun tiešsaistes scenāriji, piemēram, aģentu reāllaika atmiņas atjauninājumi. Tā vietā, lai saspiestu informāciju, ACE kontekstu uztver kā dinamisku rokasgrāmatu, kas laika gaitā apkopo un organizē stratēģijas.

Ietvars sadala darbu trīs specializētās lomās: ģenerators, reflektors un kurators. Šis modulārais dizains ir iedvesmots no tā, “kā cilvēki mācās — eksperimentējot, atspoguļojot un konsolidējoties — vienlaikus izvairoties no sašaurinājuma, kas rada pārslogotu vienu modeli ar visiem pienākumiem”, teikts rakstā.

Darbplūsma sākas ar ģeneratoru, kas sagatavo ievades uzvedņu argumentācijas ceļus, izceļot gan efektīvas stratēģijas, gan izplatītākās kļūdas. Pēc tam Reflector analizē šos ceļus, lai iegūtu galvenās mācības. Visbeidzot, kurators sintezē šīs nodarbības kompaktos atjauninājumos un apvieno tās esošajā rokasgrāmatā.

Lai novērstu konteksta sabrukumu un īsuma novirzi, ACE ietver divus galvenos dizaina principus. Pirmkārt, tas izmanto pakāpeniskus atjauninājumus. Konteksts tiek attēlots kā strukturētu, detalizētu aizzīmju kolekcija, nevis viens teksta bloks. Tas ļauj ACE veikt detalizētas izmaiņas un izgūt visatbilstošāko informāciju, nepārrakstot visu kontekstu.

Otrkārt, ACE izmanto “augšanas un uzlabošanas” mehānismu. Kad tiek apkopota jauna pieredze, rokasgrāmatai tiek pievienotas jaunas aizzīmes un atjauninātas esošās. Dublēšanas noņemšanas darbība regulāri noņem liekos ierakstus, nodrošinot, ka konteksts laika gaitā joprojām ir visaptverošs, taču atbilstošs un kompakts.

ACE darbībā

Pētnieki novērtēja ACE divu veidu uzdevumos, kas gūst labumu no mainīgā konteksta: aģentu etaloniem, kuriem nepieciešama vairāku pagriezienu spriešana un rīku izmantošana, un jomai specifiski finanšu analīzes kritēriji, kas prasa īpašas zināšanas. Nozarēm ar augstu ienesīgumu, piemēram, finansēm, ieguvumi sniedzas tālāk par tīru veiktspēju. Kā teica pētnieki, sistēma ir “daudz pārredzamāka: atbilstības amatpersona var burtiski izlasīt AI apgūto, jo tas ir saglabāts cilvēkiem lasāmā tekstā, nevis paslēpts miljardos parametru.”

Rezultāti parādīja, ka AKE konsekventi pārspēja spēcīgas bāzes līnijas, piemēram, GEPA un klasiskā konteksta mācīšanās, sasniedzot vidējo veiktspējas pieaugumu 10,6% apmērā aģenta uzdevumos un 8,6% domēna specifiskajos etalonos gan bezsaistes, gan tiešsaistes iestatījumos.

Būtiski, ka ACE var izveidot efektīvus kontekstus, analizējot atgriezenisko saiti no savām darbībām un vides, nevis pieprasot manuāli marķētus datus. Pētnieki atzīmē, ka šī spēja ir a "galvenā sastāvdaļa sevis pilnveidošanai LLM un aģentiem." Par publiku AppWorld etalons, kas paredzēts aģentu sistēmu novērtēšanai, aģents, kas izmanto ACE ar mazāku atvērtā koda modeli (DeepSeek-V3.1) atbilda augstākā ranga sniegumam, Ar GPT-4.1 darbināms aģents vidēji un pārspēja to grūtākajā testu komplektā.

Uzņēmumiem ir ievērojams ieguvums. “Tas nozīmē, ka uzņēmumiem nav jābūt atkarīgiem no masveida patentētiem modeļiem, lai saglabātu konkurētspēju,” sacīja pētnieku grupa. “Viņi var izvietot vietējos modeļus, aizsargāt sensitīvus datus un joprojām iegūt augstākā līmeņa rezultātus, nepārtraukti uzlabojot kontekstu, nevis pārkvalificējot svarus.”

Papildus precizitātei ACE izrādījās ļoti efektīva. Tas pielāgojas jauniem uzdevumiem ar vidēji par 86,9% mazāku latentumu nekā esošajām metodēm, un tam ir nepieciešams mazāk darbību un marķieru. Pētnieki norāda, ka šī efektivitāte parāda, ka “mērogojamu pašpilnveidošanos var sasniegt gan ar lielāku precizitāti, gan ar mazākām pieskaitāmām izmaksām.”

Uzņēmumiem, kas norūpējušies par izsecināšanas izmaksām, pētnieki norāda, ka ilgāki ACE radītie konteksti nerada proporcionāli augstākas izmaksas. Mūsdienu apkalpošanas infrastruktūras arvien vairāk tiek optimizētas ilgstošam konteksta darba slodzēm, izmantojot tādas metodes kā KV kešatmiņas atkārtota izmantošana, saspiešana un izkraušana, kas amortizē plašā konteksta apstrādes izmaksas.

Galu galā ACE norāda uz nākotni, kurā AI sistēmas ir dinamiskas un nepārtraukti pilnveidojas. "Mūsdienās tikai AI inženieri var atjaunināt modeļus, wager konteksta inženierija paver durvis domēna ekspertiem — juristiem, analītiķiem, ārstiem —, lai tiešā veidā veidotu to, ko AI zina, rediģējot kontekstuālo rokasgrāmatu." pētnieki teica. Tas arī padara pārvaldību praktiskāku. "Selektīvā atcelšana kļūst daudz vieglāk izsekojama: ja informācija ir novecojusi vai juridiski sensitīva, to var vienkārši noņemt vai aizstāt kontekstā, nepārkvalificējot modeli.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here