Sekojiet ZDNET: Pievienojiet mūs kā vēlamo avotu Google tīklā.
ZDNET galvenās atziņas
- Liels AWS pārtraukums izjauca globālās vietnes, lietotnes un pakalpojumus.
- Problēma radās DNS kļūmes dēļ AWS reģionā US-East-1.
- Jaunākajā atjauninājumā Amazon teica, ka AWS pārtraukums ir atrisināts.
Amazon Web Services (AWS)kas ir lielas interneta daļas mugurkauls, aptumšojās agrā pirmdienas rītā. 20. oktobrī aptuveni plkst. 12:11 ET, tas piedzīvoja lielu pārtraukumuizslēdzot daudzas vietnes, lietotnes un tiešsaistes platformas visā pasaulē.
Traucējumi radās uzņēmuma kritiskajā ASV-East-1 reģionā Ziemeļvirdžīnijā, kas ir AWS lielākais un svarīgākais datu centrs. Pagāja līdz pulksten 18:53 ET, līdz beidzot tika novērstas galvenās problēmas. Pat tad saglabājās dažas pakārtotās problēmas.
Plaši izplatīti palēninājumi un noildzes
AWS pirmo reizi atzina šo problēmu pēc tam, kad tā atklāja palielinātu kļūdu līmeni un latentumu daudzos galvenajos pakalpojumos, tostarp EC2, Lambda un DynamoDB — Amazon mākoņdatu datu bāzes tehnoloģijā. Inženieri vēlāk atklāja domēna nosaukumu sistēmas (DNS) izšķirtspējas problēmu, kas ietekmē DynamoDB API galapunktu, kas kaskādējās pāri atkarīgajām sistēmām.
Arī: Eiropas plāns atteikties no ASV tehnoloģiju gigantiem ir balstīts uz atvērtā pirmkoda, un tas kļūst arvien populārāks
Jā, tieši tā. Vecais tehniķa joks — “Kad ir tīkla problēma, tā vienmēr ir DNS” — atkal izrādījās patiesība.
Kamēr inženieri ātri novērsa DNS problēmu, citi AWS pakalpojumi sāka nedarboties, atstājot platformu joprojām bojātu. Nākamā galvenā problēma radās, kad AWS tīkla slodzes līdzsvarotāja veselības pārbaudes sāka sabojāties, izraisot citu pakalpojumu darbības traucējumus. Pārtraukumam izplatoties, AWS pakalpojumu veselības informācijas panelis apstiprināja, ka tika ietekmēti 28 dažādi AWS pakalpojumi, izraisot plašu mākoņa darbību palēnināšanos un taimautu.
Ietekme izplatījās kritiskās nozarēs, izslēdzot piekļuvi galvenajām patērētāju platformām, piemēram, Snapchat, Ring, Alexa, Roblox un Hulu, kā arī finanšu un AI pakalpojumiem, piemēram, Coinbase, Robinhood un Perplexity. Pat Amazon.com un Prime Video piedzīvoja daļējus pārtraukumus.
Apvienotajā Karalistē un ES tika ziņots, ka lielākās bankas, tostarp Lloyds Banking Group, un dažas valdības vietnes, tika pārtrauktas, jo traucējumi izplatījās ārpus Ziemeļamerikas.
Tāpat: Labākie mākoņu krātuves pakalpojumi: ekspertu pārbaudīts
Saskaņā ar DownForeveryoneOrJustForMeTūkstošiem lietotāju sāka ziņot par problēmām tūlīt pēc pulksten 3:00 ET, un līdz pusdienlaikam Amazon vien tika reģistrēti vairāk nekā 14 000 ziņojumu par pārtraukumiem. Viedās mājas sistēmas, kas balstās uz AWS, piemēram, Ring durvju zvani un Alexa iespējotas ierīces, pārstāja darboties vai zaudēja savienojumu, uzsverot daudzu mājsaimniecību un uzņēmumu dziļo atkarību no Amazon mākoņa.
Dati no DowndetektorsZiff Davis piederošs uzņēmums, arī parādīja milzīgo AWS pārtraukuma apjomu. Pirmajās divās stundās no ASV tika saņemts vairāk nekā 1 miljons ziņojumu, kam sekoja 400 000 ziņojumu no Apvienotās Karalistes. Līdz rītam kopējais ziņojumu skaits pasaulē bija pārsniedzis 8,1 miljonu, no kuriem 1,9 miljoni no ASV un 1 miljons no Apvienotās Karalistes.
Tāpat: Kurp nāk mākonis no šejienes: 8 tendences, kas jāievēro, un cik tas viss varētu maksāt
Lieki piebilst, ka sociālie mediji bija piepildīti ar lietotāju sūdzībām un spekulācijām, jo pārtraukumi visā pasaulē kļuva par mazumtirdzniecības, straumēšanas, spēļu un finanšu operācijām. Izrādījās, ka mēs neesam laimīgi bez mūsu interneta. Kurš zināja?
Mīksts, wager lēni atveseļojas
AWS inženieri sākotnēji teica, ka viņi “strādā pie vairākiem paralēliem ceļiem, lai paātrinātu atveseļošanos”, koncentrējoties uz izmeklēšanu uz tīkla vārtejas kļūdām ASV austrumu krasta reģionā.
Amazon vēlāk ziņots ka pārtraukums tika novērsts līdz plkst. 6:35 ET, lai gan pakalpojumi, piemēram, Ring un Chime, joprojām lēni atgriezās. Tomēr pirmdien līdz pulksten 1:03 AWS vēl nebija pilnībā atveseļojies.
“Mēs turpinām piemērot mazināšanas pasākumus tīkla slodzes balansētāja veselībai un savienojamības atjaunošanai lielākajai daļai AWS pakalpojumu,” sacīja uzņēmums. “Lambda ir radušās funkciju izsaukšanas kļūdas, jo tīkla slodzes līdzsvarotāja veselības pārbaudes ietekmēja iekšējo apakšsistēmu. Mēs veicam pasākumus, lai atjaunotu šo iekšējo Lambda sistēmu. EC2 palaišanas gadījumu kļūmēm mēs pašlaik validējam labojumu un izvietosim pirmajā AZ, tiklīdz būsim pārliecināti, ka varam to darīt droši.”
Downdetector paziņoja, ka ir reģistrējis vairāk nekā 6,5 miljonus ziņojumu vairāk nekā 1000 atkarīgos pakalpojumos līdz pulksten 12:30 BST. Tās dati liecināja, ka vairāk nekā 2000 uzņēmumu piedzīvoja darbības traucējumus, no kuriem aptuveni 280 joprojām bija ietekmēti vēlā rītā.
Tāpat: Lēns internets mājās? 3 lietas, kuras es vienmēr vispirms pārbaudu, lai iegūtu lielāku Wi-Fi ātrumu
Lūks Keho, nozares analītiķis uzņēmumā Ooklateica, ka simtiem pakalpojumu sinhronizētais modelis norāda uz “galveno mākoņa incidentu, nevis atsevišķus lietotņu darbības pārtraukumus”. Viņš teica, ka pasākums uzsvēra noturības nozīmi un ieteica organizācijām sadalīt darba slodzi vairākos reģionos, lai samazinātu turpmāko pārtraukumu ietekmi.
Daniels Ramirezs, Ookla produktu direktora Downdetector, piebilda, ka tik liela mēroga pārtraukumi bija reti, taču tie varētu notikt biežāk, jo uzņēmumi arvien vairāk centralizē kritiskos datus un darbības viens mākoņa pakalpojumu sniedzējs.
“Šāda veida pārtraukumi, kad pamata interneta pakalpojums samazina lielu skaitu tiešsaistes pakalpojumu, gadā notiek tikai dažas reizes,” sacīja Ramirezs. “Tie, iespējams, kļūst nedaudz biežāki, jo uzņēmumi tiek mudināti pilnībā paļauties uz mākoņpakalpojumiem, un to datu arhitektūra ir izstrādāta, lai maksimāli izmantotu konkrētu mākoņu platformu.”
Marijus Briedis, NordVPN CTO, komentēja: “Šādi pārtraukumi izceļ nopietnu problēmu saistībā ar to, ka daži no pasaules lielākajiem uzņēmumiem bieži paļaujas uz vienu un to pašu digitālo infrastruktūru, kas nozīmē, ka tad, kad krīt viens domino kauls, viņi visi to dara.”
Un šoreiz tā noteikti izrādījās.
Lietotājiem, kuriem joprojām ir problēmas, atrisinot DynamoDB pakalpojuma galapunktus ASV austrumos-1, Amazon ieteica iztīrīt DNS kešatmiņas. “Pamatā esošā DNS problēma ir pilnībā novērsta, un lielākā daļa AWS pakalpojuma darbību tagad notiek normāli,” sacīja Amazon. “Kamēr mēs strādājam pie pilnīgas izšķirtspējas, daži pieprasījumi var tikt apturēti.”
Tāpat: Slikts Wi-Fi mājās? Izmēģiniet manus 10 paņēmienus, kā to novērst šajā nedēļas nogalē
Paredzams, ka Amazon dalīsies a detalizēta pēcnāves paskaidrojot, kas tuvākajās dienās nogāja greizi.
Saņemiet rīta populārākos stāstus savā iesūtnē katru dienu, izmantojot mūsu Tech At present biļetens.