Šobrīd uzņēmumi saprot, ka izguves paplašinātā paaudze (RAG) ļauj lietojumprogrammām un aģentiem atrast vislabāko un pamatotāko informāciju vaicājumiem. Tomēr tipiski RAG iestatījumi varētu būt inženiertehnisks izaicinājums un uzrāda arī nevēlamas iezīmes.
Lai palīdzētu to atrisināt, Google izlaida failu meklēšanas rīku Gemini API, pilnībā pārvaldītu RAG sistēmu, kas abstrakti prom izguves cauruļvads.” Failu meklēšana noņem lielu daļu rīku un lietojumprogrammu apkopošanas, kas saistīti ar RAG cauruļvadu iestatīšanu, tāpēc inženieriem nav jāsavieno tādas lietas kā krātuves risinājumi un veidotāju iegulšana.
Šis rīks tieši konkurē ar uzņēmuma RAG produktiem no OpenAI, AWS un Microsoftkuru mērķis ir arī vienkāršot RAG arhitektūru. Tomēr Google apgalvo, ka tā piedāvājums prasa mazāk orķestrēšanas un ir vairāk savrups.
“Failu meklēšana nodrošina vienkāršu, integrētu un mērogojamu veidu, kā izmantot Gemini ar jūsu datiem, sniedzot atbildes, kas ir precīzākas, atbilstošākas un pārbaudāmākas,” teica Google. emuāra ieraksts.
Uzņēmumi var bez maksas piekļūt dažām failu meklēšanas funkcijām, piemēram, glabāšanai un iegulšanas ģenerēšanai, vaicājuma laikā. Lietotāji sāks maksāt par iegulšanu, kad šie faili tiks indeksēti ar fiksētu likmi 0,15 USD par 1 miljonu marķieru.
Google Gemini Embedding modelis, kas galu galā kļuva par augšējais iegulšanas modelis Masīvā teksta iegulšanas etalonā nodrošina failu meklēšanu.
Failu meklēšana un integrētā pieredze
Google teica, ka failu meklēšana darbojas, “risinot RAG sarežģītību jūsu vietā”.
Failu meklēšana pārvalda failu glabāšanu, sadalīšanas stratēģijas un iegulšanu. Izstrādātāji var izsaukt failu meklēšanu esošajā GeneContent API, kas, pēc Google teiktā, atvieglo rīka pārņemšanu.
Failu meklēšana izmanto vektoru meklēšanu, lai “izprastu lietotāja vaicājuma nozīmi un kontekstu”. Ideālā gadījumā tas atradīs nepieciešamo informāciju, lai atbildētu uz vaicājumu no dokumentiem, pat ja uzvednē ir ietverti neprecīzi vārdi.
Funkcijai ir iebūvēti citāti, kas norāda uz konkrētām dokumenta daļām, ko tā izmantoja atbilžu ģenerēšanai, kā arī atbalsta dažādus failu formātus. Tie ietver PDF, Docx, txt, JSON un daudzus izplatītus programmēšanas valodu failu tipus," Google saka.
Nepārtraukta RAG eksperimentēšana
Uzņēmumi, iespējams, jau ir sākuši veidot RAG cauruļvadu, jo tie liek pamatu saviem AI aģentiem, lai viņi varētu faktiski izmantot pareizos datus un pieņemt apzinātus lēmumus.
Tā kā RAG ir galvenā daļa no tā, kā uzņēmumi saglabā precizitāti un gūst ieskatu par savu uzņēmējdarbību, organizācijām ir ātri jāsaņem šī cauruļvada redzamība. RAG var būt sarežģītas inženierijas problēmas, jo vairāku rīku koordinēšana kopā var kļūt sarežģīta.
“Tradicionālo” RAG konveijera izveide nozīmē, ka organizācijām ir jāsagatavo un jāprecizē failu ievadīšanas un parsēšanas programma, tostarp sadalīšana, iegulšanas ģenerēšana un atjauninājumi. Pēc tam viņiem jāslēdz līgums ar vektoru datubāzi, piemēram Priežu čiekursnosaka tā izguves loģiku un iekļauj to visu modeļa konteksta logā. Turklāt viņi, ja vēlas, var pievienot avota citātus.
Failu meklēšanas mērķis ir to visu racionalizēt, lai gan konkurentu platformas piedāvā līdzīgas funkcijas. OpenAI Asistentu API ļauj izstrādātājiem izmantot failu meklēšanas funkciju, virzot aģentu uz atbilstošiem dokumentiem, lai saņemtu atbildes. Atklāts AWS pamatklints datu automatizācijas pārvaldīts pakalpojums decembrī.
Lai gan failu meklēšana ir līdzīga šīm citām platformām, Google piedāvājumā ir apkopoti visi, nevis tikai daži RAG konveijera izveides elementi.
Phaser Studio, AI vadītas spēļu ģenerēšanas platformas Beam radītājs, Google emuārā teica, ka izmantoja failu meklēšanu, lai izsijātu savu 3000 failu bibliotēku.
“Failu meklēšana ļauj mums uzreiz atklāt pareizo materiālu, neatkarīgi no tā, vai tas ir koda fragments aizzīmju rakstiem, žanra veidnes vai arhitektūras norādes no mūsu Phaser “smadzeņu” korpusa,” sacīja Phaser CTO Ričards Deivijs. “Rezultāts ir tāds, ka idejas, kuru prototipa izveidei kādreiz bija vajadzīgas vairākas dienas, tagad kļūst pieejamas dažu minūšu laikā.”
Kopš paziņojuma vairāki lietotāji ir izrādījuši interesi par šīs funkcijas izmantošanu.












