Plašais pārtraukums, kas skāra Amazon Net Providers pirmdienas sākumā un likvidēja vairākas nozīmīgas vietnes un pakalpojumus, bija saistīts ar iekšēju problēmu mākoņa giganta infrastruktūrā.
Jaunā atjaunināt Pirmdien plkst. 8:43 pēc Klusā okeāna piekrastes laika Amazon paziņoja, ka pārtraukuma galvenais iemesls bija “iekšējā apakšsistēma, kas ir atbildīga par mūsu tīkla slodzes balansētāju darbības pārraudzību”.
Pārtraukums ietekmēja visu, sākot no vietnēm, tostarp Fb, Coinbase un pašu Amazon, līdz reģistrācijas kioskiem LaGuardia lidostā.
Amazon paziņoja, ka redz AWS pakalpojumu savienojamību un API atkopšanu.
Dr Eibars TuncdogansLondonas King’s Faculty asociētais profesors teica, ka tas kalpo kā brīdinājuma zīme potenciāli traucējošākai situācijai.
“Ja ļaunprātīgi dalībnieki apzināti mērķētu uz līdzīgu ievainojamību, kaitējums būtu daudz lielāks,” sacīja Tunkodgans.
Problēmas sākās neilgi pēc pusnakts Klusā okeāna reģionā Amazones Ziemeļvirdžīnijas (US-EAST-1) reģionā, kas ir AWS vecākais un lielākais mākoņu reģions, populārs tiešsaistes pakalpojumu nervu centrs. Lieli pārtraukumi, kas radās šajā pašā reģionā, izraisīja arī plašus traucējumus 2017., 2021. un 2023. gads.
In sākotnējais atjauninājumsAWS teica, ka pārtraukums bija saistīts ar DNS atrisināšanas problēmu ar DynamoDB, kas nozīmē, ka interneta tālruņu grāmatā neizdevās atrast pareizo adresi datu bāzes pakalpojumam, ko izmanto tūkstošiem lietotņu datu glabāšanai un atrašanai.
Jaunākais pārtraukums liecina, ka daudzas vietnes nav pienācīgi ieviesušas atlaišanu, kas nepieciešama, lai AWS pārtraukumu gadījumā ātri atgrieztos pie citiem reģioniem vai mākoņa pakalpojumu sniedzējiem.
Tuncodgan teica, ka dziļākā problēma ir “tehnoloģiju monokultūra” globālā infrastruktūrā ar nelielu platformu vai pakalpojumu sniedzēju daudzveidību.
“Tas ir kā lauksaimniecības monokultūra — kad viss ir atkarīgs no viena celma, viena slimība var iznīcināt veselus stādījumus, jo tiem visiem ir viena un tā pati ģenētika,” viņš teica.
Viņš teica, ka, lai gan klienti paši var izveidot atlaišanu, pakalpojumu sniedzēji var arī izstrādāt dažādas konkurējošas infrastruktūras savās ekosistēmās.
“Šis incidents, visticamāk, tiks ātri atrisināts,” viņš teica. “Tomēr, ja vien mēs nepārdomājam arhitektūru (tas ir, mēs decentralizējam un dažādojam), mums vajadzētu sagaidīt vairāk šāda mēroga pārtraukumu neatkarīgi no tā, vai tas ir saistīts ar kļūmēm vai mērķtiecīgiem uzbrukumiem.”
Lasīt vairāk: