Piedāvā Elastic
Žurnāli ir iestatīti kā primārais devices, lai atrastu “kāpēc” tīkla incidentu diagnostikā
Mūsdienu IT vidēs ir datu problēma: to ir pārāk daudz. Organizācijām, kurām jāpārvalda uzņēmuma vide, ir arvien lielākas grūtības atklāt un diagnosticēt problēmas reāllaikā, optimizēt veiktspēju, uzlabot uzticamību un nodrošināt drošību un atbilstību — tas viss notiek ierobežota budžeta ietvaros.
Mūsdienu novērojamības ainavā ir daudz rīku, kas piedāvā risinājumu. Lielākā daļa no tiem ir saistīti ar DevOps komandām vai vietņu uzticamības inženieriem (SRE), kas analizē žurnālus, metriku un pēdas, lai atklātu modeļus un noskaidrotu, kas notiek tīklā, un diagnosticētu problēmas vai incidenta cēloni. Problēma ir tāda, ka course of rada informācijas pārslodzi: Kubernetes klasteris vien var izdalīt 30 līdz 50 gigabaitus žurnālu dienā, un aizdomīgi uzvedības modeļi var izlīst garām cilvēku acīm.
"Tagad AI pasaulē ir tik anakroniski domāt par to, ka cilvēki vien novēro infrastruktūru," saka Kens Eksners, Elastic galvenais produktu virsnieks. "Es ienīstu to jums lauzt, guess mašīnas ir labākas par cilvēkiem paraugu saskaņošanā.
Nozares mēroga uzmanība simptomu vizualizēšanai liek inženieriem manuāli meklēt atbildes. Izšķirošais "kāpēc" ir aprakts baļķos, taču, tā kā tajos ir milzīgs daudzums nestrukturētu datu, nozare mēdz tos izmantot kā pēdējo līdzekli. Tas ir licis komandām veikt dārgus kompromisus: vai nu pavadīt neskaitāmas stundas, veidojot sarežģītus datu cauruļvadus, atmest vērtīgus žurnāla datus un riskēt ar kritiskām redzamības nepilnībām, vai reģistrēties un aizmirst.
Elastic, Search AI Firm, nesen izlaida jaunu novērojamības funkciju ar nosaukumu Streams, kuras mērķis ir kļūt par primāro signālu izmeklēšanā, izmantojot trokšņainos žurnālus un pārvēršot tos modeļos, kontekstā un nozīmē.
Streams izmanto AI, lai automātiski sadalītu un parsētu neapstrādātus žurnālus, lai iegūtu attiecīgos laukus, un ievērojami samazinātu SRE piepūli, lai padarītu žurnālus izmantojamus. Straumes arī automātiski atklāj nozīmīgus notikumus, piemēram, kritiskas kļūdas un anomālijas no konteksta bagātinātiem žurnāliem, sniedzot SRE agrīnus brīdinājumus un skaidru izpratni par viņu darba slodzi, ļaujot tiem ātrāk izmeklēt un atrisināt problēmas. Galīgais mērķis ir parādīt sanācijas darbības.
"No neapstrādātiem, apjomīgiem, nekārtīgiem datiem, Streams automātiski izveido struktūru, ievietojot to lietojamā formā, automātiski brīdina par problēmām un palīdz tās novērst," saka Eksners. "Tāda ir Streams burvība."
Bojāta darbplūsma
Straumes apvērš novērojamības procesu, kas, pēc dažu domām, ir bojāts. Parasti SRE iestata metriku, žurnālus un izsekošanas. Pēc tam viņi iestata brīdinājumus un pakalpojuma līmeņa mērķus (SLO) — bieži vien ir stingri kodēti noteikumi, lai parādītu, kur pakalpojums vai course of ir pārsniedzis slieksni vai ir atklāts konkrēts modelis.
Kad tiek aktivizēts brīdinājums, tas norāda uz metriku, kas parāda anomāliju. No turienes SRE apskata metrikas informācijas paneli, kurā viņi var vizualizēt problēmu un salīdzināt brīdinājumu ar citiem rādītājiem vai CPU ar atmiņu un I/O, un sākt meklēt modeļus.
Pēc tam viņiem, iespējams, vajadzēs aplūkot pēdas un izpētīt lietojumprogrammas augšupējās un lejupējās atkarības, lai noskaidrotu problēmas galveno cēloni. Kad viņi noskaidro problēmas cēloni, viņi pāriet uz šīs datu bāzes vai pakalpojuma žurnāliem, lai mēģinātu atkļūdot problēmu.
Daži uzņēmumi vienkārši cenšas pievienot vairāk rīku, ja pašreizējie izrādās neefektīvi. Tas nozīmē, ka SRE pāriet no viena rīka uz rīku, lai turpinātu uzraudzību un problēmu novēršanu savā infrastruktūrā un lietojumprogrammās.
"Jūs izmantojat dažādus rīkus. Jūs paļaujaties uz cilvēku, lai šīs lietas interpretētu, vizuāli aplūkotu attiecības starp sistēmām pakalpojumu kartē, vizuāli apskatītu diagrammas metrikas informācijas panelī, lai noskaidrotu, kas un kur ir problēma. " saka Eksners. "Guess AI automatizē šo darbplūsmu."
Izmantojot AI darbināmas straumes, žurnāli tiek izmantoti ne tikai reaktīvi, lai atrisinātu problēmas, guess arī lai proaktīvi apstrādātu iespējamās problēmas un izveidotu ar informāciju bagātus brīdinājumus, kas palīdz komandām pāriet uz problēmu risināšanu, piedāvājot risinājumu problēmas novēršanai vai pat pilnībā novēršot problēmu, pirms automātiski paziņo komandai, ka tā ir novērsta.
"Es uzskatu, ka žurnāli, visbagātīgākā informācijas kopa, sākotnējais signāla veids, sāks vadīt lielāko daļu automatizācijas, ko mūsdienās parasti veic pakalpojumu uzticamības inženieris, un to dara ļoti manuāli." viņš piebilst. "Cilvēkam nevajadzētu būt šajā procesā, kur viņš to dara, iedziļinoties sevī, mēģinot noskaidrot, kas notiek, kur un kāda ir problēma, un pēc tam, kad viņi atrod galveno cēloni, viņi mēģina izdomāt, kā to atkļūdot."
Novērojamības nākotne
Lielie valodu modeļi (LLM) varētu būt galvenais spēlētājs novērojamības nākotnē. LLM izceļas ar modeļu atpazīšanu milzīgā daudzumā atkārtotu datu, kas ļoti līdzinās žurnālu un telemetrijas datiem sarežģītās, dinamiskās sistēmās. Un mūsdienu LLM var apmācīt konkrētiem IT procesiem. Izmantojot automatizācijas rīkus, LLM ir nepieciešamā informācija un rīki, lai atrisinātu datu bāzes kļūdas vai Java kaudzes problēmas un daudz ko citu. Būtiski būs tos iekļaut platformās, kas nodrošina kontekstu un atbilstību.
Eksners saka, ka automatizētā labošana joprojām prasīs zināmu laiku, taču LLM ģenerētās automatizētās izpildgrāmatas un rokasgrāmatas kļūs par standarta praksi nākamo pāris gadu laikā. Citiem vārdiem sakot, atlīdzināšanas pasākumus vadīs LLM. LLM piedāvās labojumus, un cilvēks tos pārbaudīs un ieviesīs, nevis pieaicinās ekspertu.
Prasmju trūkuma risināšana
Iesaistīšanās AI, lai nodrošinātu novērojamību, palīdzētu novērst lielu IT infrastruktūras pārvaldībai nepieciešamo talantu trūkumu. Darbā pieņemšana notiek lēni, jo organizācijām ir vajadzīgas komandas ar lielu pieredzi un izpratni par iespējamām problēmām un to, kā tās ātri atrisināt. Šī pieredze var nākt no LLM, kas ir kontekstuāli pamatota, saka Eksners.
"Mēs varam palīdzēt tikt galā ar prasmju trūkumu, papildinot cilvēkus ar LLM, kas viņus visus uzreiz padara par ekspertiem," viņš paskaidro. "Es domāju, ka tas mums ievērojami atvieglos iesācēju praktizētāju pieņemšanu un padarīs viņus par pieredzējušiem praktiķiem gan drošības, gan novērojamības jomā, un tas ļaus iesācējam praktizējam rīkoties kā ekspertam.
Tagad ir pieejamas elastīgās novērojamības straumes. Sāciet ar lasīšana vairāk par straumēm.
Sponsorētie raksti ir saturs, ko ražo uzņēmums, kas vai nu maksā par ziņu, vai kuram ir biznesa attiecības ar VentureBeat, un tie vienmēr ir skaidri atzīmēti. Lai iegūtu vairāk informācijas, sazinieties gross sales@venturebeat.com.













