Home Tehnoloģija Lai mērogotu aģentu AI, jēdziens noplēsa savu tehnoloģiju kaudzi un sāka svaigu

Lai mērogotu aģentu AI, jēdziens noplēsa savu tehnoloģiju kaudzi un sāka svaigu

9
0

Daudzas organizācijas vilcinājās pārveidot savu tehnoloģiju kaudzi un sākt no nulles. Ne JēdziensApvidū Par savu produktivitātes programmatūras 3.0 versiju (atbrīvota septembrī) uzņēmums nevilcinājās atjaunot no sākuma; Viņi atzina, ka faktiski ir nepieciešams atbalstīt aģentu AI uzņēmuma mērogā. Kamēr tradicionālās ar AI darbināmas darbplūsmas ir saistītas ar skaidrām, soli pa solim instrukcijām, kuru pamatā ir daži kadru mācīšanās, AI aģenti, kurus darbina uzlaboti spriešanas modeļi, ir pārdomāti par instrumenta definīciju, var identificēt un izprast, kādi rīki viņiem ir viņu rīcībā un plāno nākamās darbības. “Tā vietā, lai mēģinātu modernizēt to, ko mēs būvējām, mēs gribējām spēlēt ar spriešanas modeļu stiprajām pusēm,” VentureBeat stāstīja Sāra Saha, jēdziena AI modelēšanas vadītāja. “Mēs esam atjaunojuši jaunu arhitektūru, jo darbplūsmas atšķiras no aģentiem.”

Pārkārtošana, lai modeļi varētu darboties autonomi

Jēdzienu ir pieņēmuši 94% no Forbes AI 50 uzņēmumiem, un to klientu Openai, Cursor, Figma, Rampas un Vercelas starpā ir 100 miljoni lietotāju un to skaits. Strauji mainīgā AI ainavā uzņēmums identificēja nepieciešamību pāriet ārpus vienkāršākām, uz uzdevumiem balstītām darbplūsmām uz uz mērķi orientētām spriešanas sistēmām, kas aģentiem ļauj autonomi izvēlēties, orķestrēt un izpildīt rīkus dažādās vidēs.

Ļoti ātri spriešanas modeļi ir kļuvuši “daudz labāki”, lai iemācītos izmantot rīkus un ievērot pārdomu ķēdes (COT) instrukcijas, atzīmēja Sachs. Tas ļauj viņiem būt “daudz neatkarīgākiem” un pieņemt vairākus lēmumus vienā aģenta darbplūsmā. “Mēs pārbūvējam savu AI sistēmu, lai tā spēlētu," Viņa teica. Raugoties no inženierzinātņu viedokļa, tas nozīmēja stingru uzvedības plūsmu aizstāšanu ar vienotu orķestrēšanas modeli, skaidroja Sachs. Šo galveno modeli atbalsta modulārie apakš-aģenti, kas meklē priekšstatu un tīmekli, vaicājumu un pievieno datu bāzēm un rediģē saturu. Katrs aģents kontekstuāli izmanto rīkus; Piemēram, viņi var izlemt, vai meklēt sevi vai citu platformu, piemēram, Slack. Modelis veiks secīgus meklējumus, līdz tiks atrasta attiecīgā informācija. Pēc tam tas, piemēram, var pārveidot piezīmes priekšlikumos, izveidot papildu ziņojumus, izsekot uzdevumiem un pamanīt un veikt atjauninājumus zināšanu bāzēs. Saskaņā ar 2.0. Sadaļā Komanda koncentrējās uz to, lai AI veiktu īpašus uzdevumus, kas viņiem prasīja “izsmeļoši pārdomāt”, kā pamudināt modeli, atzīmēja Sachs. Tomēr ar 3.0 versiju lietotāji var piešķirt uzdevumus aģentiem, un aģenti faktiski var rīkoties un vienlaikus veikt vairākus uzdevumus. “Mēs atkārtoti izveidojām to, ka tas pats izvēlas instrumentus, nevis nedaudzus šāvienus, kas skaidri pamudina iziet cauri visiem šiem dažādajiem scenārijiem,” skaidroja Sachs. Mērķis ir nodrošināt, ka viss ir saskarnē ar AI un ka “jebko, ko jūs varat darīt, jūsu jēdziena aģents var darīt”.

Bifurkating, lai izolētu halucinācijas

Jēdziena filozofija “labāka, ātrāka, lētāka” virza nepārtrauktu iterācijas ciklu, kas līdzsvaro latentumu un precizitāti, izmantojot precīzi noregulētus vektora iegulumus un elastīgas meklēšanas optimizāciju. Sachs komanda izmanto stingru novērtēšanas sistēmu, kas apvieno deterministiskus testus, tautas optimizāciju, cilvēku anotētus datus un LLMS as-a-A-tiesnesi, ar modeļa vērtēšanu identificējot neatbilstības un neprecizitātes. “Bifurējot novērtējumu, mēs varam noteikt, no kurienes rodas problēmas, un tas mums palīdz izolēt nevajadzīgas halucinācijas,” skaidroja Sachs. Turklāt pašas arhitektūras padarīšana vienkāršāka nozīmē, ka ir vieglāk veikt izmaiņas, jo modeļi un paņēmieni attīstās. “Mēs pēc iespējas optimizējam latentumu un paralēlu domāšanu,” tas noved pie “daudz labākas precizitātes,” atzīmēja Sachs. Modeļi ir balstīti uz datiem no tīmekļa un ar jēdzienu saistītā darbvieta. Galu galā Sachs ziņoja, ka ieguldījums tās arhitektūras atjaunošanā jau ir nodrošinājis priekšstatu atdevi attiecībā uz spējām un ātrāku izmaiņu līmeni. Viņa piebilda: “Mēs esam pilnībā atvērti, lai to atkal atjaunotu, kad notiek nākamais izrāviens, ja mums tas būs jādara.”

Izpratne par kontekstuālo latentumu

Veidojot un precizējot modeļus, ir svarīgi saprast, ka latentums ir subjektīvs: AI ir jāsniedz visatbilstošākā informācija, ne vienmēr visvairāk, uz ātruma rēķina. “Jūs būtu pārsteigts par dažādiem veidiem, kā klienti vēlas gaidīt lietas un negaidīt lietas,” sacīja Sachs. Tas rada interesantu eksperimentu: cik lēni jūs varat iet, pirms cilvēki atsakās no modeļa? Piemēram, ar tīru navigācijas meklēšanu lietotāji var nebūt kā pacienti; Viņi vēlas, lai atbildes būtu tuvu. “Ja jūs jautājat:“ Kas ir divi plus divi ”, jūs nevēlaties gaidīt, kamēr jūsu aģents meklēs visur Slack un Jira,” norādīja Sachs. Guess, jo ilgāks laiks, kad tas tiek dots, jo izsmeļošāks var būt argumentācijas aģents. Piemēram, jēdziens var veikt 20 minūšu autonomu darbu simtiem vietņu, failu un citu materiālu. Šajos gadījumos lietotāji labprātāk gaida, paskaidroja Sachs; Tie ļauj modelim izpildīt fonā, kamēr viņi apmeklē citus uzdevumus. “Tas ir jautājums par produktu,” sacīja Sahs. “Kā mēs iestatām lietotāju cerības no lietotāja saskarnes? Kā mēs varam noskaidrot lietotāju cerības uz latentumu?”

Jēdziens ir tā lielākais lietotājs

Jēdziens saprot, cik svarīgi ir izmantot savu produktu – patiesībā tā darbinieki ir vieni no lielākajiem enerģijas lietotājiem. Sachs paskaidroja, ka komandām ir aktīvas smilšu kastes, kas ģenerē apmācības un novērtēšanas datus, kā arī “patiešām aktīva” īkšķa-up-thumbs-lejā lietotāju atgriezeniskās saites cilpa. Lietotāji nekautrējas pateikt to, kas, viņuprāt, būtu jāuzlabo vai funkcijas, kuras viņi vēlētos redzēt. Sachs uzsvēra, ka tad, kad lietotājs nomāc mijiedarbību, viņi skaidri dod atļauju cilvēka anotatoram analizēt šo mijiedarbību tādā veidā, kas tos pēc iespējas vairāk atļauj. “Mēs visu dienu, katru dienu izmantojam savu rīku kā uzņēmumu, un tāpēc mēs saņemam patiešām ātru atgriezenisko saiti,” sacīja Sachs. “Mēs patiešām esam suni par savu produktu.” Tas nozīmē, ka tas ir viņu pašu produkts, kuru viņi veido, atzīmēja Sachs, tāpēc viņi saprot, ka, iespējams, ir aizsargbrilles, kad runa ir par kvalitāti un funkcionalitāti. Lai to līdzsvarotu, jēdziens ir uzticējies "Ļoti aiapvēsti" Dizaina partneri, kuriem tiek piešķirta agrīna piekļuve jaunām iespējām un sniedz svarīgas atsauksmes. Sachs uzsvēra, ka tas ir tikpat svarīgi kā iekšēja prototipēšana. “Mēs visi esam par eksperimentēšanu atklātā, es domāju, ka jūs saņemat daudz bagātīgākas atsauksmes,” sacīja Sahs. “Tā kā dienas beigās, ja mēs tikai skatāmies, kā jēdziens izmanto jēdzienu, mēs īsti nesniedzam vislabāko pieredzi klientiem.” Tikpat svarīgi, ka nepārtraukta iekšējā pārbaude ļauj komandām novērtēt progresu un pārliecināties, ka modeļi neregresē (kad laika gaitā precizitāte un veiktspēja noārdās). "Viss, ko jūs darāt, paliek uzticīgi," Sachs paskaidroja. "Jūs zināt, ka jūsu latentums ir robežās."

Daudzi uzņēmumi pieļauj kļūdu, pārāk intensīvi koncentrējoties uz ar atpakaļejošu datumu orientējošu Evansu; Tas viņiem apgrūtina saprast, kā vai kur viņi uzlabojas, Sachs norādīja. Jēdziens uzskata evals par a "lakmusa pārbaude" attīstības un tālredzīga progresēšana, kā arī novērojamības un regresijas pierādīšanas evals. “Es domāju, ka liela kļūda, ko daudzi uzņēmumi pieļauj, ir abu sakropļošana,” sacīja Sahs. “Mēs tos izmantojam abiem mērķiem; mēs par tiem domājam patiešām atšķirīgi.”

Izņemšana no priekšstata ceļojuma

Uzņēmumiem jēdziens var kalpot par plānu, kā atbildīgi un dinamiski darboties aģentu AI savienotā, atļauja uzņēmuma darbvietā. Saha izņemšana citiem tehnoloģiju vadītājiem:

  • Nebaidieties atjaunot, kad mainās pamata iespējas; Jēdziens pilnībā pārveidoja savu arhitektūru, lai saskaņotu ar argumentācijas modeļiem.

  • Latentumu uzskata par kontekstuālu: optimizējiet katru lietošanas gadījumu, nevis universāli.

  • Ievietojiet visus uzticamos, izstrādātos uzņēmuma datus, lai nodrošinātu precizitāti un uzticēšanos. Viņa ieteica: “Esiet gatava pieņemt smagus lēmumus. Esiet gatavi sēdēt robežas augšdaļā, tā sakot, par to, ko jūs izstrādājat, lai izveidotu vislabāko produktu, kādu vien iespējams klientiem.”

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here