Kad es pirmo reizi rakstīju “Vektoru datu bāzes: spīdīgu objektu sindroms un pazuduša vienradža gadījums” 2024. gada martā nozari pārņēma ažiotāža. Vektoru datu bāzes tika novietotas kā nākamā lielā lieta — obligāts AI laikmeta infrastruktūras slānis. Aizplūda miljardiem riska dolāru, izstrādātāji steidzās integrēt iegulšanu savos cauruļvados, un analītiķi bez prāta izsekoja finansējuma kārtas Priežu čiekurs, Aust, Chroma, Milvus un ducis citu.
Solījums bija apreibinošs: visbeidzot, veids, kā meklēt pēc nozīmes, nevis pēc trausliem atslēgvārdiem. Vienkārši izmetiet savas zināšanas par uzņēmumu vektoru veikalā, pievienojiet LLM un skatieties, kā notiek burvība.
Izņemot to, ka maģija nekad nav pilnībā īstenojusies.
Pēc diviem gadiem, realitātes pārbaude ir pienācis: 95% organizāciju, kuras ir ieguldījušas AI iniciatīvās, nesaņem izmērāmu atdevi. Un daudzi no brīdinājumiem, ko es toreiz izteicu — par vektoru ierobežojumiem, pārpildīto pārdevēju ainavu un risku, ka vektoru datubāzes tiek uzskatītas par sudraba lodēm — ir izrādījušies gandrīz tieši tā, kā bija paredzēts.
Prognoze 1: pazudis vienradzis
Toreiz es apšaubīju, vai Pinecone — šīs kategorijas plakātu bērns — iegūs vienradža statusu, vai arī tas kļūs par datubāzes pasaules “pazudušo vienradzi”. Šodien uz šo jautājumu ir atbildēts visspilgtākajā iespējamajā veidā: priežu čiekurs ir tiek ziņots, ka pēta pārdošanusīvas konkurences un klientu skaita samazināšanās dēļ.
Jā, Pinecone pacēla lielas kārtas un parakstīja telts logotipus. Wager praksē diferenciācija bija vāja. Atvērtā pirmkoda atskaņotāji, piemēram, Milvus, Qdrant un Chroma, ir zemāki par izmaksām. Esošie operatori, piemēram, Postgres (ar pgVector) un Elasticsearch vienkārši pievienoja vektoru atbalstu kā līdzekli. Un klienti arvien biežāk jautāja: “Kāpēc ieviest pilnīgi jaunu datu bāzi, ja mana esošā kaudze jau pietiekami labi darbojas ar vektoriem?”
Rezultāts: pinecone, kura vērtība kādreiz bija gandrīz miljards dolāru, tagad meklē māju. Tiešām pazudis vienradzis. 2025. gada septembrī, Pinecone iecelts Ash Ashutosh kā izpilddirektors, dibinātājam Edo Libertijam pārejot uz galvenā zinātnieka amatu. Laiks ir teiciens: vadības maiņa notiek laikā, kad pieaug spiediens un jautājumi par tās ilgtermiņa neatkarību.
2. prognoze: vektori vien to neizgriezīs
Es arī apgalvoju, ka vektoru datu bāzes pašas par sevi nav gala risinājums. Ja jūsu lietošanas gadījumam ir nepieciešama precizitāte — piemēram, rokasgrāmatā meklējot “Kļūda 221”, tīra vektoru meklēšana ar prieku parādītu “Kļūda 222” kā “pietiekami tuvu”. Jauki demonstrācijā, katastrofāli ražošanā.
Šī spriedze starp līdzību un atbilstību ir izrādījusies liktenīga mītam par vektoru datubāzēm kā universāliem dzinējiem.
“Uzņēmumi atklāja cieto veidu, kā semantiskā ≠ ir pareiza.”
Izstrādātāji, kuri ar prieku nomainīja vektoru leksisko meklēšanu, ātri no jauna ieviesa… leksisko meklēšanu saistībā ar vektoriem. Komandas, kuras gaidīja, ka vektori “vienkārši darbosies”, beidzās ar metadatu filtrēšanu, pārrangotāji un ar roku noregulēti noteikumi. Līdz 2025. gadam vienprātība ir skaidra: vektori ir spēcīgi, taču tikai kā daļa no hibrīda steka.
3. prognoze: pārpildīts lauks kļūst par preci
Vektoru datubāzes palaišanas eksplozija nekad nebija ilgtspējīga. Weaviate, Milvus (izmantojot Zilliz), Chroma, Vespa, Qdrant — katrs apgalvoja, ka ir smalks atšķirības, taču lielākajai daļai pircēju viņi visi darīja to pašu: uzglabāja vektorus un atguva tuvākos kaimiņus.
Šodien ļoti maz no šiem spēlētājiem izlaužas. Tirgus ir sadrumstalots, pārvērsts par precēm un daudzējādā ziņā to ir aprijuši vēsturiskie operatori. Vektoru meklēšana tagad ir izvēles rūtiņas funkcija mākoņdatu platformās, nevis atsevišķs grāvis.
Tāpat kā toreiz rakstīju: viena vektora DB atšķiršana no cita radīs arvien lielāku izaicinājumu. Šis izaicinājums ir tikai kļuvis grūtāks. Vald, Marko, LanceDB, PostgresSQL, MySQL karstuma vilnis, Orākuls 23c, Azure SQL, Kasandra, Redis, Neo4j, Vienotais veikals, ElasticSearch, OpenSearch, Apahce Solr… saraksts turpinās.
Jaunā realitāte: hibrīds un GraphRAG
Wager tas nav tikai stāsts par lejupslīdi — tas ir stāsts par evolūciju. No vektoru ažiotāžas pelniem rodas jaunas paradigmas, kas apvieno labāko no vairākām pieejām.
Hibrīda meklēšana: atslēgvārds + vektors tagad ir noklusējuma iestatījums nopietnām lietojumprogrammām. Uzņēmumi uzzināja, ka nepieciešama gan precizitāte, gan izplūdums, precizitāte un semantika. Tādi rīki kā Apache Solr, Elasticsearch, pgVector un paša Pinecone “kaskādes izguves” to aptver.
GraphRAG: 2024./2025. gada beigu populārākais vārds ir GraphRAG — ar grafiku uzlabota izguves paplašinātā paaudze. Apvienojot vektorus ar zināšanu grafikiem, GraphRAG kodē attiecības starp entītijām, kuras tikai iegulšana izlīdzina. Izmaksa ir dramatiska.
Kritēriji un pierādījumi
-
Amazon AI emuārs citē etalonus no Lettriakur hibrīda GraphRAG palielināja atbilžu pareizību no ~50% līdz 80% plus testa datu kopās finanšu, veselības aprūpes, nozares un tiesību jomā.
-
The GraphRAG-Bench etalons (izlaists 2025. gada maijā) nodrošina stingru GraphRAG un vanilla RAG novērtējumu saistībā ar argumentācijas uzdevumiem, vairāku apgriezienu vaicājumiem un domēna izaicinājumiem.
-
An OpenReview RAG un GraphRAG novērtējums atklāja, ka katrai pieejai ir stiprās puses atkarībā no uzdevuma, taču hibrīda kombinācijas bieži darbojas vislabāk.
-
FalkorDB emuārs ziņo ka tad, kad svarīga ir shēmas precizitāte (strukturētie domēni), GraphRAG noteiktos etalonos var pārspēt vektoru izguvi par koeficientu ~3,4x.
GraphRAG pieaugums pasvītro lielāko punktu: izguve nav saistīta ar kādu atsevišķu spīdīgu objektu. Tas ir par celtniecību izguves sistēmas — slāņveida, hibrīdi, kontekstu apzinoši konveijeri, kas sniedz LLM pareizo informāciju, ar pareizo precizitāti un īstajā laikā.
Ko tas nozīmē virzība uz priekšu
Spriedums ir spēkā: vektoru datu bāzes nekad nav bijis brīnums. Tie bija nozīmīgs solis meklēšanas un izguves attīstībā. Taču tās nav un nekad nav bijušas beigu spēles.
Šajā vietā ieguvēji nebūs tie, kas pārdod vektorus kā atsevišķu datu bāzi. Viņi būs tie, kas ieguls vektoru meklēšanu plašākās ekosistēmās, integrējot grafikus, metadatus, noteikumus un konteksta inženieriju vienotās platformās.
Citiem vārdiem sakot: vienradzis nav vektoru datubāze. Vienradzis ir izguves kaudze.
Skatoties uz priekšu: kas tālāk
-
Vienotās datu platformas apvienos vektoru + grafiku: Sagaidiet, ka lielākie DB un mākoņdatošanas pakalpojumu sniedzēji piedāvās integrētas izguves stekas (vektors + grafiks + pilns teksts) kā iebūvētas iespējas.
-
“Izguves inženierija” parādīsies kā atsevišķa disciplīna: Gluži kā MLOps attīstījās, tiks ieviesta arī skaņošanas, hibrīda ranžēšanas un diagrammu veidošanas prakse.
-
Meta modeļi, kas mācās labāk vaicāt: Nākotnes LLM var mācīties lai organizētu, kuru izguves metodi izmantot katram vaicājumam, dinamiski pielāgojot svērumu.
-
Temporālais un multimodālais GraphRAG: Jau tagad pētnieki paplašina GraphRAG, lai būtu informēti par laiku (T-GRAG) un multimodāli vienoti (piemēram, savienojot attēlus, tekstu, video).
-
Atvērtie etaloni un abstrakcijas slāņi: Tādi rīki kā BenchmarkQED (RAG salīdzinošajai novērtēšanai) un GraphRAG-Bench virzīs sabiedrību uz godīgākām, salīdzināmi izmērītām sistēmām.
No spīdīgiem objektiem līdz būtiskai infrastruktūrai
Vektoru datubāzes stāsta loka ir gājusi pa klasisku ceļu: visaptverošs hype cikls, kam seko pašpārbaude, korekcija un nobriešana. 2025. gadā vektoru meklēšana vairs nav spīdošais objekts, pēc kura visi tiecas akli — tagad tas ir būtisks parts sarežģītākā, daudzpusīgā izguves arhitektūrā.
Sākotnējie brīdinājumi bija pareizi. Uz vektoriem balstītas cerības bieži vien sabrūk uz precizitātes, relāciju sarežģītības un uzņēmuma ierobežojumu bariem. Tomēr tehnoloģija nekad netika izniekota: tā piespieda nozari pārdomāt izguvi, sajaucot semantiskās, leksiskās un relāciju stratēģijas.
Ja es rakstītu turpinājumu 2027. gadā, man ir aizdomas, ka tas veidotu vektoru datubāzes nevis kā vienradžus, wager gan kā mantotu infrastruktūru — pamatu, taču to aizēno viedāki orķestrēšanas slāņi, adaptīvi izguves kontrolieri un AI sistēmas, kas dinamiski izvēlas. kuras izguves rīks atbilst vaicājumam.
Pašlaik īstā cīņa nav vektors pret atslēgvārdu — tā ir novirzīšana, sajaukšana un disciplīna, veidojot izguves cauruļvadus, kas uzticami pamato AI faktos un domēna zināšanā. Tas ir vienradzis, pēc kura mums tagad vajadzētu dzīties pakaļ.
Amits Verma ir inženierzinātņu un AI laboratoriju vadītājs Neirons7.
Lasiet vairāk no mūsu viesraksti. Vai arī apsveriet iespēju iesniegt savu ziņu! Skatiet mūsu vadlīnijas šeit.











