Pievienojieties pasākumam, kuru uzņēmuma vadītāji uzticas gandrīz divas desmitgades. VB Transform apvieno cilvēkus, kas veido reālu uzņēmumu AI stratēģiju. Uzziniet vairāk
Redaktora piezīme: Kumo Ai bija viens no finālistiem VB transformācija Mūsu ikgadējā inovāciju vitrīna un RFM pasniedza no galvenās vietas plkst VB transformācija trešdien.
Ģeneratīvais AI uzplaukums ir devis mums spēcīgus valodu modeļus, kas var rakstīt, apkopot un saprātīgi pārsniedzot lielu teksta daudzumu un cita veida datu veidus. Bet, kad runa ir par augstas vērtības paredzamiem uzdevumiem, piemēram, prognozēt klientu krāpšanu vai krāpšanas noteikšanu no strukturētiem, relāciju datiem, uzņēmumi joprojām ir iestrēguši tradicionālās mašīnu apguves pasaulē.
Stenfordas profesors un Kumo ai Līdzdibinātājs Jure Leskovec apgalvo, ka tas ir kritiskais trūkstošais gabals. Viņa uzņēmuma rīks-relāciju fonda modelis (RFM) ir jauna veida iepriekš apmācīta AI, kas strukturētās datu bāzēs ienes lielo valodu modeļu (LLMS) “nulles šāviena” iespējas.
“Tas ir par prognozes izdarīšanu par kaut ko, ko nezināt, kaut ko tādu, kas vēl nav noticis,” Leskovec sacīja VentureBeat. “Un tā ir principiāli jauna spēja, kas, manuprāt, ir trūkst no pašreizējā kompetences par to, ko mēs domājam par gen ai.”
Kāpēc prognozējošā ML ir “30 gadus veca tehnoloģija”
Kaut arī LLM un izguves un augumentētās paaudzes (RAG) sistēmas var atbildēt uz jautājumiem par esošajām zināšanām, tās ir principiāli retrospektīvas. Viņi izgūst un saprata informāciju, kas jau ir tur. Paredzamajiem biznesa uzdevumiem uzņēmumi joprojām paļaujas uz klasisko mašīnu apguvi.
Piemēram, lai izveidotu modeli, kas prognozē klientu čau, biznesam ir jāalgo datu zinātnieku komanda, kuri ievērojami ilgu laiku pavada, veicot “funkciju inženieriju”, procesu, kas manuāli radīs prognozējošus signālus no datiem. Tas ietver sarežģītu datu viļņošanos, lai pievienotos informācijai no dažādām tabulām, piemēram, klienta pirkuma vēstures un vietnes klikšķiem, lai izveidotu vienu masīvu apmācības tabulu.
“Ja vēlaties veikt mašīnu apguvi (ml), atvainojiet, jūs esat iestrēdzis pagātnē,” sacīja Leskovec. Dārgi un laikietilpīgi sašaurinājumi neļauj lielākajai daļai organizāciju būt patiesi veikliem ar saviem datiem.
Kā Kumo vispārina transformatorus datu bāzēm
Kumo pieeja “Relāciju dziļā mācīšanās” apņem šo manuālo procesu ar divām galvenajām atziņām. Pirmkārt, tas automātiski apzīmē jebkuru relāciju datu bāzi kā vienu, savstarpēji savienotu grafiku. Piemēram, ja datu bāzei ir tabula “lietotāji”, lai ierakstītu klientu informāciju un “pasūtījumu” tabulu, lai ierakstītu klientu pirkumus, katra lietotāju tabulas rindā kļūst par lietotāja mezglu, katra pasūtījumu tabulas rindā kļūst par pasūtījuma mezglu utt. Pēc tam šie mezgli tiek automātiski savienoti, izmantojot datu bāzes esošās attiecības, piemēram, ārvalstu atslēgas, izveidojot bagātīgu visas datu kopas karti bez manuālām pūlēm.
Otrkārt, Kumo vispārināja transformatora arhitektūramotors aiz LLM, lai mācītos tieši no šī grafika attēlojuma. Transformatori izceļas ar žetonu secību izpratni, izmantojot “uzmanības mehānismu”, lai nosvērtu dažādu žetonu nozīmi attiecībā pret otru.
Kumo RFM Piemēro šo pašu uzmanības mehānismu grafikam, ļaujot tai vienlaikus apgūt sarežģītus modeļus un attiecības pa vairākām tabulām. Leskovec salīdzina šo lēcienu ar datora redzes attīstību. 2000. gadu sākumā ML inženieriem bija manuāli jāizstrādā tādas funkcijas kā malas un formas, lai noteiktu objektu. Bet jaunākas arhitektūras, piemēram, konvolūcijas neironu tīkli (CNN), var uzņemt neapstrādātus pikseļus un automātiski apgūt attiecīgās funkcijas.
Līdzīgi RFM uzņem neapstrādātas datu bāzes tabulas un ļauj tīklam pašam atklāt visnozīmīgākos signālus bez nepieciešamības pēc manuālām pūlēm.
Rezultāts ir iepriekš apmācīts pamata modelis, kas uzreiz var veikt paredzamus uzdevumus jaunā datu bāzē, kas ir pazīstams kā “nulles šāviens”. Demonstrācijas laikā Leskovec parādīja, kā lietotājs varētu ierakstīt vienkāršu vaicājumu, lai prognozētu, vai konkrēts klients nākamajās 30 dienās veiktu pasūtījumu. Dažu sekunžu laikā sistēma atdeva varbūtības rādītāju un skaidrojumu par datu punktiem, kas noveda pie tā noslēguma, piemēram, lietotāja nesenā darbība vai to trūkums. Modelis netika apmācīts paredzētajā datu bāzē un reālā laikā pielāgots, izmantojot konteksta apguvi.

“Mums ir iepriekš apmācīts modelis, uz kuru jūs vienkārši norādāt uz saviem datiem, un tas jums sniegs precīzu prognozi 200 milisekundes vēlāk,” sacīja Leskovec. Viņš piebilda, ka tas var būt “tik precīzs, kā, teiksim, nedēļu laikā no datu zinātnieka darba”.
Interfeiss ir paredzēts, lai būtu pazīstams ar datu analītiķiem, ne tikai mašīnu apguves speciālistiem, demokratizējot piekļuvi prognozējošajai analītikai.
Agensijas nākotnes darbība
Šai tehnoloģijai ir būtiska ietekme uz AI aģentu attīstību. Lai aģents veiktu jēgpilnus uzdevumus uzņēmuma ietvaros, tam ir jādara vairāk nekā tikai apstrādāt valodu; Tam jāpieņem saprātīgi lēmumi, pamatojoties uz uzņēmuma privātajiem datiem. RFM var kalpot par šo aģentu paredzamo motoru. Piemēram, klientu apkalpošanas aģents varētu vaicāt RFM, lai noteiktu klienta iespējamību, vai to iespējamo nākotnes vērtība, pēc tam izmantojiet LLM, lai pielāgotu savu sarunu un attiecīgi piedāvā.
“Ja mēs ticam aģentiskai nākotnei, aģentiem būs jāpieņem lēmumi, kas sakņojas privātajos datos. Un tas ir veids, kā aģents var pieņemt lēmumus,” skaidroja Leskovec.
Kumo darbs norāda uz nākotni, kurā Enterprise AI ir sadalīts divos papildinošos domēnos: LLM, lai apstrādātu retrospektīvas zināšanas nestrukturētā tekstā, un RFM, lai prognozētu strukturētus datus. Izslēdzot funkciju inženierijas sašaurinājumu, RFM sola spēcīgāku uzņēmumu rokās nodot spēcīgus ML rīkus, krasi samazinot laiku un izmaksas, lai nokļūtu no datiem līdz lēmumam.
Uzņēmums ir izlaidis RFM publisku demonstrāciju un plāno palaist versiju, kas lietotājiem ļauj tuvāko nedēļu laikā savienot savus datus. Organizācijām, kurām nepieciešama maksimāla precizitāte, Kumo piedāvās arī precīzu noregulēšanas pakalpojumu, lai vēl vairāk palielinātu veiktspēju privātajās datu kopās.