Home Tehnoloģija Ķīniešu pētnieki atklāj piezīmes, pirmo “atmiņas operētājsistēmu”, kas sniedz AI cilvēkam līdzīgu...

Ķīniešu pētnieki atklāj piezīmes, pirmo “atmiņas operētājsistēmu”, kas sniedz AI cilvēkam līdzīgu atsaukšanu

28
0

Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt


Pētnieku komanda no vadošajām institūcijām, ieskaitot Šanhajas Jiao Tongas universitāte un Džejjanas universitāte ir izstrādājuši to, ko viņi sauc par “Atmiņas operētājsistēmu” mākslīgajam intelektam, pievēršoties fundamentālam ierobežojumam, kas kavē AI sistēmas iegūt cilvēku līdzīgu pastāvīgu atmiņu un mācīšanos.

Sistēma, ko sauc par Piezīmesuzskata atmiņu par galveno skaitļošanas resursu, kuru laika gaitā var ieplānot, koplietot un attīstīties – līdzīgi kā tas, kā tradicionālās operētājsistēmas pārvalda CPU un glabāšanas resursus. Pētījums, Publicēts 4. jūlijā par arxivdemonstrē ievērojamus darbības uzlabojumus salīdzinājumā ar esošajām pieejām, ieskaitot 159% palielinājumu laika spriešanas uzdevumos, salīdzinot ar Openai atmiņas sistēmām.

“Lielo valodu modeļi (LLMS) ir kļuvuši par būtisku mākslīgā vispārējā intelekta (AGI) infrastruktūru, tomēr viņu precīzi definētu atmiņas pārvaldības sistēmu trūkums kavē ilgstoša spriešanas, pastāvīgas personalizācijas un zināšanu konsekvences attīstību,” pētnieki raksta viņu papīrsApvidū

AI sistēmas cīnās ar pastāvīgu atmiņu visās sarunās

Pašreizējās AI sistēmas saskaras ar to, ko pētnieki sauc par “atmiņas tvertne“Problēma-būtisks arhitektūras ierobežojums, kas neļauj viņiem saglabāt saskaņotas, ilgtermiņa attiecības ar lietotājiem. Katra saruna vai sesija būtībā sākas no nulles, modeļiem nespējot saglabāt preferences, uzkrātas zināšanas vai uzvedības modeļus starp mijiedarbību. Tas rada neapmierinošu lietotāja pieredzi, kur AI palīgs var aizmirst lietotāja uztura ierobežojumus, kas minēti vienā sarunā, kad tiek lūgts restorāns nākamajā vietā.

Kamēr daži risinājumi patīk Paaudze ar augstu augu (lupata) Mēģinājums to risināt, sarunu laikā ievelkot ārēju informāciju, pētnieki apgalvo, ka tie joprojām ir “bezvalstnieku risinājumi bez dzīves cikla kontroles”. Problēma ir dziļāka nekā vienkārša informācijas iegūšana – tā ir sistēmu radīšana, kas patiesi var mācīties un attīstīties no pieredzes, līdzīgi kā cilvēka atmiņa.

“Esošie modeļi galvenokārt paļaujas uz statiskiem parametriem un īslaicīgiem kontekstuālajiem stāvokļiem, ierobežojot to spēju izsekot lietotāju vēlmēm vai atjaunināt zināšanas ilgākos periodos,” skaidro komanda. Šis ierobežojums ir īpaši acīmredzams uzņēmuma iestatījumos, kur paredzams, ka AI sistēmas uzturēs kontekstu sarežģītās, daudzpakāpju darbplūsmās, kas varētu ilgt dienas vai nedēļas.

Jauna sistēma nodrošina dramatiskus uzlabojumus AI argumentācijas uzdevumos

Piezīmes iepazīstina ar principiāli atšķirīgu pieeju caur to, ko pētnieki sauc par “Memcubas”-Standartizētas atmiņas vienības, kas var iekapsulēt dažāda veida informācijas veidus un tos sastāv, migrē un attīstās laika gaitā. Tie ir no skaidrām teksta zināšanām un beidzot ar parametru līmeņa pielāgošanu un aktivizācijas stāvokļiem modelī, izveidojot vienotu atmiņas pārvaldības ietvaru, kas iepriekš neeksistēja.

Pārbaude uz Lokomo etalonskas novērtē atmiņu intensīvus spriešanas uzdevumus, piezīmes konsekventi pārspēja izveidotās bāzes līnijas visās kategorijās. Sistēma sasniedza 38,98% vispārēju uzlabojumu, salīdzinot ar Openai atmiņas ieviešanu, ar īpaši spēcīgiem ieguvumiem sarežģītos argumentācijas scenārijos, kuriem nepieciešama savienojoša informācija vairākos sarunu pagriezienos.

“Memos (Memos-0630) konsekventi ierindojas pirmajā vietā visās kategorijās, pārspējot spēcīgas bāzes līnijas, piemēram, MEM0, Langmem, Zep un Openai-Reminiscence, ar īpaši lielām robežām tādos izaicinājumos kā vairāku hop un laika pamatojums,” teikts pētījumā. Sistēma arī veica ievērojamus efektivitātes uzlabojumus, samazinot laiku līdz 94% no pirmās kārtas latentuma noteiktās konfigurācijās, izmantojot novatorisko KV-kešatmiņas atmiņas injekcijas mehānismu.

Šie veiktspējas ieguvumi liecina, ka atmiņas sašaurinājums ir bijis nozīmīgāks ierobežojums, nekā iepriekš saprasts. Uzskatot atmiņu par pirmās klases skaitļošanas resursu, Piezīmes Šķiet, ka tiek atbloķēta spriešanas iespējas, kuras iepriekš ierobežoja arhitektūras ierobežojumi.

Tehnoloģija varētu pārveidot, kā uzņēmumi izvieto mākslīgo intelektu

Ietekme uz uzņēmuma AI izvietošanu varētu būt pārveidojoša, jo īpaši tāpēc, ka uzņēmumi arvien vairāk paļaujas uz AI sistēmām sarežģītām, pastāvīgām attiecībām ar klientiem un darbiniekiem. Piezīmes ļauj pētnieki raksturot kā “Starpplatformu atmiņas migrācija“Ļaujot AI atmiņām būt pārnēsājamām dažādās platformās un ierīcēs, sadalot to, ko viņi sauc par”Atmiņas salas”Pašlaik slazda lietotāja konteksts noteiktās lietojumprogrammās.

Apsveriet pašreizējo neapmierinātību, ko daudzi lietotāji piedzīvo, kad vienā AI platformā izpētītās atziņas nevar pārnest uz citu. Mārketinga komanda var izstrādāt detalizētas klientu personas, sarunājot ar ChatGpt, lai sāktu no nulles, pārejot uz citu AI rīku kampaņas plānošanai. Memos to apskata, izveidojot standartizētu atmiņas formātu, kas var pārvietoties starp sistēmām.

Pētījumā arī ir aprakstīts potenciāls “apmaksāti atmiņas moduļi“Kur domēna eksperti varētu iesaiņot savas zināšanas iegādājamo atmiņu vienībās. Pētnieki paredz scenārijus, kur“ medicīnas college students klīniskajā rotācijā varētu vēlēties izpētīt, kā pārvaldīt retu autoimūnu stāvokli. Pieredzējis ārsts var iekapsulēt diagnostisko heiristiku, nopratināšanas ceļus un tipiskus gadījumu modeļus strukturētā atmiņā ”, ko var uzstādīt un izmantot citas AI sistēmas.

Šis tirgus modelis varētu būtiski mainīt, kā specializētās zināšanas tiek sadalītas un pelnītas AI sistēmās, radot jaunas ekonomiskas iespējas ekspertiem, vienlaikus demokratizējot piekļuvi augstas kvalitātes domēna zināšanām. Uzņēmumiem tas varētu nozīmēt ātru AI sistēmu izvietošanu ar dziļu kompetenci noteiktās jomās bez tradicionālajām izmaksām un termiņiem, kas saistīti ar pielāgotu apmācību.

Trīs slāņu dizains atspoguļo tradicionālās datoru operētājsistēmas

Līdz piezīmju tehniskā arhitektūra atspoguļo gadu desmitiem ilgu mācīšanos no tradicionālās operētājsistēmas dizaina, kas pielāgots AI atmiņas pārvaldības unikālajiem izaicinājumiem. Sistēma izmanto trīs slāņu arhitektūru: interfeisa slāni API zvaniem, operācijas slāni atmiņu plānošanai un dzīves cikla pārvaldībai, kā arī infrastruktūras slāni glabāšanai un pārvaldībai.

Sistēmas Memscheduler Komponents dinamiski pārvalda dažādus atmiņas veidus – sākot no pagaidu aktivizācijas stāvokļiem līdz pastāvīgām parametru modifikācijām -, izvēloties optimālas glabāšanas un izguves stratēģijas, pamatojoties uz lietošanas modeļiem un uzdevuma prasībām. Tas nozīmē nozīmīgu atkāpšanos no pašreizējām pieejām, kas parasti atmiņu uzskata par pilnīgi statisku (iegultu modeļa parametros) vai pilnīgi īslaicīgai (ierobežota ar sarunu kontekstu).

“Fokuss mainās no tā, cik daudz zināšanu modelis vienreiz uzzina, vai tas var pārveidot pieredzi strukturētā atmiņā un atkārtoti to atgūt un rekonstruēt,” atzīmē pētnieki, aprakstot viņu redzējumu par to, ko viņi sauc par ”Mem-apmācībaParadigmas. Šī arhitektūras filozofija norāda uz būtisku pārdomu, kā būtu jāprojektē AI sistēmas, virzoties promenade no pašreizējās masīvas pirmstalizēšanas paradigmas uz dinamiskāku, uz pieredzi balstītāku mācīšanos.

Paralēles ar operētājsistēmas attīstību ir pārsteidzošas. Tāpat kā agrīnajiem datoriem programmētājiem bija nepieciešams manuāli pārvaldīt atmiņas sadali, pašreizējām AI sistēmām ir nepieciešams, lai izstrādātāji rūpīgi orķestrētu, kā informācija plūst starp dažādiem komponentiem. Piezīmes Abstrakts šo sarežģītību, potenciāli dodot iespēju jaunai AI lietojumprogrammu paaudzei, kuras var veidot papildus sarežģītai atmiņas pārvaldībai, nepieprasot dziļu tehnisko kompetenci.

Pētnieki izlaiž kodu kā atvērtu avotu, lai paātrinātu adopciju

Komanda ir atbrīvojusi Piezīmes Kā atvērtā koda projekts ar Pilns kods, kas pieejams vietnē github un integrācijas atbalsts lielākajām AI platformām, ieskaitot HuggingFace, Openai un Ollama. Šī atvērtā koda stratēģija, šķiet, ir paredzēta, lai paātrinātu adopciju un veicinātu sabiedrības attīstību, nevis īstenotu patentētu pieeju, kas varētu ierobežot plašu ieviešanu.

“Mēs ceram, ka piezīmes palīdzēs virzīt AI sistēmas no statiskiem ģeneratoriem līdz nepārtraukti attīstītiem, uz atmiņu balstītiem aģentiem,” Github krātuvē komentēja projekta vadošais Zhiyu Li. Sistēma šobrīd atbalsta Linux platformas, plānojot Home windows un MacOS atbalstu, kas liek domāt, ka komanda prioritizē uzņēmumu un izstrādātāju pieņemšanu, salīdzinot ar tūlītēju patērētāju piekļuvi.

Atvērtā koda izlaišanas stratēģija atspoguļo plašāku tendenci AI pētījumos, kad pamata infrastruktūras uzlabojumi tiek atklāti dalīti, lai sniegtu labumu visai ekosistēmai. Šī pieeja vēsturiski ir paātrinājusi jauninājumus tādās jomās kā dziļas mācību ietvars, un tai varētu būt līdzīga ietekme uz atmiņas pārvaldību AI sistēmās.

Tehnoloģiju milži sacenšas, lai atrisinātu AI atmiņas ierobežojumus

Pētījums tiek parādīts, jo galvenie AI uzņēmumi cīnās ar pašreizējo atmiņas pieeju ierobežojumiem, uzsverot, cik būtisks šis izaicinājums ir kļuvis nozarei. Openai nesen ieviesa Atmiņas funkcijas Chatgptkamēr AntropisksVerdzība Googleun citi pakalpojumu sniedzēji ir eksperimentējuši ar dažādiem pastāvīga konteksta veidiem. Tomēr šo ieviešanai parasti ir ierobežota darbības joma, un tā bieži trūkst sistemātiskas pieejas Piezīmes nodrošina.

Šī pētījuma laiks liecina, ka atmiņas pārvaldība ir kļuvusi par kritisku konkurences kaujas laukumu AI attīstībā. Uzņēmumi, kas var efektīvi atrisināt atmiņas problēmu, var iegūt ievērojamas priekšrocības lietotāju saglabāšanā un apmierinātībā, jo viņu AI sistēmas laika gaitā spēs veidot dziļākas, noderīgākas attiecības.

Nozares novērotāji jau sen ir prognozējuši, ka nākamais lielais izrāviens AI ne vienmēr nāks no lielākiem modeļiem vai vairāk apmācības datiem, wager gan no arhitektūras jauninājumiem, kas labāk imitē cilvēka izziņas spējas. Atmiņas pārvaldība atspoguļo tieši šāda veida fundamentālu attīstību – tādu, kas varētu atbloķēt jaunas lietojumprogrammas un lietošanas gadījumus, kas nav iespējami ar pašreizējām bezvalstnieku sistēmām.

Attīstība ir daļa no plašākas AI pētījumu maiņas uz valstiskākām, pastāvīgākām sistēmām, kas laika gaitā var uzkrāt un attīstīt zināšanas – iespējas, kas tiek uzskatītas par būtiskām mākslīgajai vispārējai intelektam. Uzņēmējdarbības tehnoloģiju vadītājiem, kas novērtē AI ieviešanu, Piezīmes varētu būt nozīmīgs progress AI sistēmu veidošanā, kas laika gaitā uztur kontekstu un uzlabojas, nevis katru mijiedarbību uzskatot par izolētu.

Pētniecības grupa norāda, ka viņi plāno izpētīt pārrobežu atmiņu dalīšanu, pašpārliecinošus atmiņu blokus un plašākas “atmiņas tirgus” ekosistēmas attīstību turpmākajā darbā. Wager, iespējams, visnozīmīgākā piezīmju ietekme nebūs īpaša tehniskā ieviešana, wager drīzāk pierādījums tam, ka atmiņas uzskatīšana par pirmās klases skaitļošanas resursiem var atbloķēt dramatiskus uzlabojumus AI iespējās. Nozarē, kas lielā mērā ir vērsta uz modeļa lieluma un apmācības datu mērogošanu, piezīmes liecina, ka nākamais izrāviens varētu nākt no labākas arhitektūras, nevis lielākiem datoriem.


avots