Home Tehnoloģija Kā Deductive AI ietaupīja DoorDash 1000 inženiertehniskās stundas, automatizējot programmatūras atkļūdošanu

Kā Deductive AI ietaupīja DoorDash 1000 inženiertehniskās stundas, automatizējot programmatūras atkļūdošanu

23
0

Tā kā programmatūras sistēmas kļūst sarežģītākas un mākslīgā intelekta rīki ģenerē kodu ātrāk nekā jebkad agrāk, būtiska problēma pasliktinās: Inženieri slīkst atkļūdošanas darbospavadot līdz pat pusi sava laika programmatūras kļūmju cēloņu meklēšanai, nevis jaunu produktu veidošanai. Izaicinājums ir kļuvis tik akūts, ka tiek radīta jauna instrumentu kategorija — AI aģenti, kas var noteikt ražošanas kļūmes minūtēs, nevis stundās.

Deduktīvā AIjaunuzņēmums, kas otrdien izaug no slepenā režīma, uzskata, ka ir atradis risinājumu, pielietojot pastiprinošo mācīšanos — to pašu tehnoloģiju, kas nodrošina spēļu AI sistēmas, — netīrajā, augstas likmes ražošanas programmatūras incidentu pasaulē. Uzņēmums paziņoja, ka ir piesaistījis $ 7,5 miljonus sākuma finansējuma, ko vadīja CRVar piedalīšanos no plkst Databricks Ventures, Thomvest Venturesun PrimeSetlai komercializētu to, ko tā sauc "AI SRE aģenti" kas var diagnosticēt un palīdzēt novērst programmatūras kļūmes mašīnas ātrumā.

Skaņa sasaucas ar pieaugošo neapmierinātību inženiertehniskajās organizācijās: Mūsdienu novērojumu rīki var parādīt, ka kaut kas ir bojāts, taču tie reti izskaidro, kāpēc. Ja ražošanas sistēma neizdodas pulksten 3:00, inženieri joprojām saskaras ar stundām ilgu manuālu detektīvu darbu, savstarpēju atsauci uz žurnāliem, metriku, izvietošanas vēsturi un kodu izmaiņām desmitiem savstarpēji saistītu pakalpojumu, lai noteiktu galveno cēloni.

"Mūsdienu infrastruktūras sarežģītība un savstarpējā atkarība nozīmē, ka pārtraukuma vai incidenta pamatcēloņa izmeklēšana var justies kā adatas meklēšana siena kaudzē, izņemot to, ka siena kaudze ir futbola laukuma lielumā, tā ir izgatavota no miljoniem citu adatu, tā pastāvīgi mainās un deg — un katra sekunde, ko neatrodat, ir vienāda ar zaudētiem ieņēmumiem." teica Samērs Agarvals, Deductive līdzdibinātājs un galvenais tehnoloģiju speciālists, ekskluzīvā intervijā ar VentureBeat.

Deduktīvā sistēma veido to, ko uzņēmums sauc par a "zināšanu grafiks" kas kartē attiecības starp kodu bāzēm, telemetrijas datiem, inženiertehniskajām diskusijām un iekšējo dokumentāciju. Kad notiek incidents, vairāki AI aģenti strādā kopā, lai izveidotu hipotēzes, pārbaudītu tās ar reāliem sistēmas pierādījumiem un atrastu galveno cēloni — atdarinot pieredzējušu vietņu uzticamības inženieru izmeklēšanas darbplūsmu, wager pabeidzot procesu minūtēs, nevis stundās.

Šī tehnoloģija jau ir parādījusi izmērāmu ietekmi dažās no pasaules prasīgākajām ražošanas vidēm. DoorDash reklāmas platformakas vada reāllaika izsoles, kas jāpabeidz mazāk nekā 100 milisekundēs, ir integrējis Deductive savā incidentu reaģēšanas darbplūsmā. Uzņēmums ir izvirzījis ambiciozu 2026. gada mērķi ražošanas incidentus atrisināt 10 minūšu laikā.

"Mūsu reklāmu platforma darbojas tādā tempā, ka manuāla, lēna izmeklēšana vairs nav dzīvotspējīga. Katra dīkstāves minūte tieši ietekmē uzņēmuma ieņēmumus," sacīja Shahrooz Ansari, DoorDash inženierzinātņu vecākais direktors, intervijā ar VentureBeat. "Deductive ir kļuvis par būtisku mūsu komandas paplašinājumu, ātri sintezējot signālus desmitiem pakalpojumu un sniedzot svarīgus ieskatus — dažu minūšu laikā."

DoorDash lēš, ka Deductive pēdējo dažu mēnešu laikā ir izraisījis aptuveni 100 ražošanas negadījumus, kas nozīmē vairāk nekā 1000 stundu ikgadējas inženierijas produktivitātes un ietekmes uz ieņēmumiem "miljonos dolāru," saskaņā ar Ansari. Vietas izlūkošanas uzņēmumā FoursquareDeductive par 90% samazināja laiku, lai diagnosticētu Apache Spark darba kļūmes, pārvēršot procesu, kas iepriekš ilga stundas vai dienas, un tas tiek pabeigts mazāk nekā 10 minūtēs, vienlaikus radot vairāk nekā USD 275 000 ietaupījumu gadā.

Kāpēc AI ģenerēts kods rada atkļūdošanas krīzi

Deductive palaišanas laiks atspoguļo pieaugošo spriedzi programmatūras izstrādē: AI kodēšanas palīgi ļauj inženieriem ģenerēt kodu ātrāk nekā jebkad agrāk, taču iegūto programmatūru bieži ir grūtāk saprast un uzturēt.

"Vibe kodēšana," AI pētnieka popularizēts termins Andrejs Karpatisattiecas uz dabiskās valodas uzvedņu izmantošanu, lai ģenerētu kodu, izmantojot AI palīgus. Lai gan šie rīki paātrina attīstību, tie var ieviest to, ko Agarwal raksturo kā "atlaišana, arhitektūras robežu pārrāvumi, pieņēmumi vai ignorēti dizaina modeļi" kas uzkrājas laika gaitā.

"Lielākā daļa mākslīgā intelekta ģenerētā koda joprojām rada atlaišanu, lauž arhitektūras robežas, izdara pieņēmumus vai ignorē iedibinātos dizaina modeļus," Agarvals pastāstīja Venturebeat. "Daudzos veidos mums tagad ir vajadzīgs AI, lai palīdzētu iztīrīt nekārtību, ko pats AI rada."

Apgalvojums, ka inženieri aptuveni pusi sava laika pavada atkļūdošanai, nav pārmērīga. Datortehnikas asociācija ziņo, ka izstrādātāji tērē 35% līdz 50% sava laika programmatūras apstiprināšanai un atkļūdošanai. Pavisam nesen Harness programmatūras piegādes stāvoklis 2025. gadā ziņojumā konstatēts, ka 67% izstrādātāju pavada vairāk laika, lai atkļūdotu mākslīgā intelekta radīto kodu.

"Mēs esam redzējuši, ka pasaules līmeņa inženieri pusi sava laika pavada atkļūdošanai, nevis būvēšanai," teica Rakesh Kothari, Deductive līdzdibinātājs un izpilddirektors. "Un, tā kā vibrācijas kodēšana ģenerē jaunu kodu tādā ātrumā, kādu mēs nekad neesam redzējuši, šī problēma tikai pasliktināsies."

Kā Deductive AI aģenti faktiski izmeklē ražošanas kļūmes

Deductive tehniskā pieeja būtiski atšķiras no AI funkcijām, kas tiek pievienotas esošajām novērošanas platformām, piemēram Datu suns vai Jauna relikvija. Lielākā daļa no šīm sistēmām izmanto lielus valodu modeļus, lai apkopotu datus vai identificētu korelācijas, taču tām trūkst tā, ko sauc Agarwal "kodu apzinoša spriešana"— spēja saprast ne tikai to, ka kaut kas sabojājās, wager arī to, kāpēc kods darbojas tā, kā tas darbojas.

"Lielākā daļa uzņēmumu izmanto vairākus novērojamības rīkus dažādās komandās un pakalpojumos, tāpēc nevienam pārdevējam nav vienota vienota priekšstata par to, kā viņu sistēmas darbojas, neizdodas un atkopjas, kā arī viņi nevar to savienot pārī ar izpratni par kodu, kas nosaka sistēmas darbību." Agarvals paskaidroja. "Šīs ir galvenās programmatūras incidentu risināšanas sastāvdaļas, un tieši to aizpilda deduktīvs."

Sistēma izveido savienojumu ar esošo infrastruktūru, izmantojot tikai lasīšanas API piekļuvi novērojamības platformām, kodu krātuvēm, incidentu pārvaldības rīkiem un tērzēšanas sistēmām. Pēc tam tas nepārtraukti veido un atjaunina savu zināšanu grafiku, kartējot pakalpojumu atkarības un izsekojot izvietošanas vēsturi.

Kad tiek aktivizēts brīdinājums, Deductive uzsāk izmeklēšanu, ko uzņēmums raksturo kā vairāku aģentu izmeklēšanu. Dažādi aģenti specializējas dažādos problēmas aspektos: viens var analizēt jaunākās koda izmaiņas, otrs pārbauda izsekošanas datus, wager trešais korelē incidenta laiku ar nesenajām izvietošanām. Aģenti dalās ar konstatējumiem un iteratīvi precizē savas hipotēzes.

Būtiskā atšķirība no uz noteikumiem balstītas automatizācijas ir Deductive pastiprinošās mācīšanās izmantošana. Sistēma mācās no katra incidenta, kuras izmeklēšanas darbības noveda pie pareizas diagnozes un kuri bija strupceļi. Kad inženieri sniedz atgriezenisko saiti, sistēma iekļauj šo signālu savā mācību modelī.

"Katru reizi, kad tā novēro izmeklēšanu, tā uzzina, kuras darbības, datu avoti un lēmumi noveda pie pareizā rezultāta," Agarvals teica. "Tā iemācās pārdomāt problēmas, nevis tikai norādīt uz tām."

Vietnē DoorDash nesenais latentuma pieaugums API sākotnēji šķita izolēta pakalpojuma problēma. Deductive izmeklēšana atklāja, ka galvenais iemesls patiesībā bija taimauta kļūdas no pakārtotās mašīnmācīšanās platformas, kas tiek izvietota. Sistēma savienoja šos punktus, analizējot žurnālu apjomus, pēdas un izvietošanas metadatus vairākos pakalpojumos.

"Ja nebūtu Deductive, mūsu komandai būtu manuāli jākoriģē latentuma pieaugums visos žurnālos, izsekošanas un izvietošanas vēsturēs," Ansari teica. "Deductive spēja izskaidrot ne tikai to, kas mainījās, wager arī to, kā un kāpēc tas ietekmēja ražošanas uzvedību."

Uzņēmums pagaidām informē cilvēkus

Lai gan Deductive tehnoloģija teorētiski varētu virzīt labojumus tieši uz ražošanas sistēmām, uzņēmums ir apzināti izvēlējies paturēt cilvēkus vismaz pagaidām.

"Lai gan mūsu sistēma spēj veikt dziļāku automatizāciju un varētu ieviest labojumus ražošanā, pašlaik mēs iesakām veikt precīzus labojumus un mazināšanas pasākumus, ko inženieri var pārskatīt, apstiprināt un lietot," Agarvals teica. "Mēs uzskatām, ka uzticamības, pārredzamības un darbības drošības nodrošināšanai ir svarīgi uzturēt cilvēku informētību."

Tomēr viņš to atzina "laika gaitā mēs domājam, ka tiks panākta dziļāka automatizācija un attīstīsies tas, kā cilvēki darbojas šajā cilpā."

Databrick un ThoughtSpot veterāni liek spriest par novērojamību

Dibinātāju komanda apvieno dziļas zināšanas, veidojot dažas no Silikona ielejas veiksmīgākajām datu infrastruktūras platformām. Agarvals ieguva doktora grādu. UC Berkeley, kur viņš radīja BlinkDBietekmīga sistēma aptuvenai vaicājumu apstrādei. Viņš bija viens no pirmajiem inženieriem plkst Datu ķieģeļikur viņš palīdzēja celt Apache Spark. Kothari bija agrīnais inženieris plkst Domas vietakur viņš vadīja komandas, kas koncentrējās uz izplatītu vaicājumu apstrādi un liela mēroga sistēmas optimizāciju.

Investoru sindikāts atspoguļo gan tehnisko uzticamību, gan tirgus iespējas. Ārpus CRV Makss Gazorskārtā tika iekļauta dalība no Jons StoicaDatabricks un Anyscale dibinātājs; Adžeta SingaNutanix un ThoughtSpot dibinātājs; un Bens SigelmansLightstep dibinātājs.

Tā vietā, lai konkurētu ar tādām platformām kā Datu suns vai PagerDutyDeduktīva pozicionē sevi kā papildu slāni, kas atrodas virs esošajiem rīkiem. Cenu noteikšanas modelis atspoguļo šo: tā vietā, lai iekasētu maksu, pamatojoties uz datu apjomu, deduktīvās maksas, pamatojoties uz izmeklēto incidentu skaitu, kā arī bāzes platformas maksa.

Uzņēmums piedāvā gan mākoņa mitinātas, gan pašmitinātas izvietošanas iespējas un uzsver, ka tas neuzglabā klientu datus savos serveros un neizmanto tos modeļu apmācīšanai citiem klientiem — tas ir būtisks pārliecība, ņemot vērā gan koda, gan ražošanas sistēmas darbības patentēto raksturu.

Ar svaigu kapitālu un agrīnu klientu piesaisti tādos uzņēmumos kā DoorDash, Foursquareun Kumo AIDeductive plāno paplašināt savu komandu un padziļināt sistēmas spriešanas spējas no reaģējošas incidentu analīzes līdz proaktīvai novēršanai. Īstermiņa redzējums: palīdzēt komandām paredzēt problēmas, pirms tās rodas.

DoorDash’s Ansari piedāvā pragmatisku atbalstu tam, kur tehnoloģija atrodas šodien: "Izmeklējumi, kas iepriekš bija manuāli un laikietilpīgi, tagad ir automatizēti, ļaujot inženieriem novirzīt savu enerģiju uz profilaksi, ietekmi uz uzņēmējdarbību un jauninājumiem."

Nozarē, kurā katra sekunde dīkstāves nozīmē zaudētus ieņēmumus, pāreja no ugunsdzēsības uz celtniecību arvien vairāk izskatās mazāk kā greznība, wager drīzāk pēc galda likmēm.

avots