Home Tehnoloģija Kā notika AWS pārtraukums: Amazon masveida kļūmē vaino retu programmatūras kļūdu un...

Kā notika AWS pārtraukums: Amazon masveida kļūmē vaino retu programmatūras kļūdu un “kļūdainu automatizāciju”

9
0

(GeekWire fotoattēls / Tods Bišops)

Detalizēts skaidrojums Šīs nedēļas Amazon Net Companies darbības pārtraukums, kas tika izlaists ceturtdienas rītā, apstiprina, ka tā nebija aparatūras kļūme vai ārējs uzbrukums, guess gan sarežģīta, kaskādes kļūme, ko izraisīja reta programmatūras kļūda vienā no uzņēmuma svarīgākajām sistēmām.

Uzņēmums paziņoja, ka “kļūdaina automatizācija” tās iekšējās sistēmās — divas neatkarīgas programmas, kas sāka sacensties viena ar otru, lai atjauninātu ierakstus — izdzēsa galvenos tīkla ierakstus tā DynamoDB datu bāzes pakalpojumam, izraisot domino efektu, kas īslaicīgi sabojāja daudzus citus AWS rīkus.

AWS paziņoja, ka ir izslēgusi kļūdaino automatizāciju visā pasaulē un novērsīs kļūdu, pirms tā tiks atgriezta tiešsaistē. Uzņēmums arī plāno pievienot jaunas drošības pārbaudes un uzlabot sistēmu atkopšanas ātrumu, ja kaut kas līdzīgs atkārtojas.

Amazon atvainojās un atzina plašos traucējumus, ko izraisīja pārtraukums.

“Lai gan mums ir spēcīga pieredze mūsu pakalpojumu sniegšanā ar visaugstāko pieejamības līmeni, mēs zinām, cik svarīgi ir mūsu pakalpojumi mūsu klientiem, viņu lietojumprogrammām un galalietotājiem, kā arī viņu uzņēmumiem,” sacīja uzņēmums, solot mācīties no incidenta.

Pārtraukums sākās pirmdienas sākumā un ietekmēja vietnes un tiešsaistes pakalpojumus visā pasaulē, vēlreiz ilustrējot interneta dziļo paļaušanos uz Amazon mākoņu un parādot, kā viena AWS kļūme var ātri izplatīties visā tīmeklī.

Saistīts: AWS darbības pārtraukums ir brīdinājums par digitālās atkarības un AI infrastruktūras riskiem

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here