سوال 2.5 میلیارد دلاری: قبل از اینکه اینترنت یک برنامه پشتیبان واقعی ایجاد کند، چند قطع AWS دیگر وجود خواهد داشت؟

احتمالا دیروز تحت تاثیر مشکلات اینترنت قرار گرفته اید. قطعی AWS بیش از 2500 شرکت و خدمات را در سراسر جهان تحت تاثیر قرار داد. تخمین زده می شود که این قطعی تقریباً 2.5 میلیارد دلار برای همه افراد درگیر هزینه داشته باشد.
و این همه به دلیل یک منطقه سرور در ویرجینیای شمالی اتفاق افتاد. تنها یک نقطه شکست هزاران شرکت و خدمات عمومی ضروری را در سراسر جهان از بین برده است.
وقتی AWS عطسه می کند، نیمی از اینترنت آنفولانزا می گیرد.
مونیکا ایتون، بنیانگذار و مدیر عامل Chargebacks911 و Fi911
و این علیرغم بهترین شیوه های AWS است که بیان می کند شرکت ها از مناطق سرور نزدیک به بزرگترین مجموعه کاربران نهایی سرویس شما استفاده می کنند. پس چگونه این اتفاق افتاد؟ بنابراین آیا نشان داد که اینترنت در واقع چقدر شکننده است؟ هشدار اسپویلر: بله. بذار توضیح بدم
قطعی AWS چگونه اتفاق افتاد؟
اما به طور خلاصه، بحران از شلوغ ترین مرکز داده خدمات وب آمازون در ویرجینیای شمالی (US-East-1) آغاز شد. جایی که شکست در اتصال شبکه اصلی باعث ایجاد مشکل در سیستم نام دامنه (DNS) شد. DNS را به عنوان دایرکتوری تلفن مرکزی اینترنت در نظر بگیرید و DynamoDB (یک سرویس پایگاه داده حیاتی) مهمترین ورودی آن بود.
دفترچه تلفن استعاری به طور خودکار شروع به حذف آدرس مخزن اصلی کرد. همه سیستمهای داخلی برای سرویسهای کلیدی ناگهان سعی کردند پایگاه داده DynamoDB را فراخوانی کنند، اما DNS نتوانست آدرس دیجیتالی درستی را ارائه دهد. بدون هیچ دستورالعملی در مورد مکان ارسال داده ها، همه این برنامه ها متوقف شدند، زمان آن تمام شد و شروع به از کار افتادن کردند.
این شکست اولیه سپس باعث شکست عظیم و آبشاری کل ابر شد. یک شبکه برق را تصور کنید: وقتی یک پست اصلی آفلاین می شود، افزایش ناگهانی ترافیک زیرساخت های باقی مانده را تحت فشار قرار می دهد. US-EAST-1 پست بزرگی است که جریان برق بین تمام ایستگاه های دیگر را کنترل می کند و همچنین “دفتر تلفن” را حفظ می کند.
این امر باعث شد سرویس هایی مانند EC2 (رایانه های مجازی) و Lambda (کد بدون سرور) از کار بیفتند و حجم زیادی از درخواست ها را جمع آوری کنند. حتی پس از اینکه آمازون ورودی «دفترچه تلفن» را اصلاح کرد، شبکه همچنان پر بار بود و برای رفع ازدحام و بازیابی کامل ثبات، به ساعتها کار دستی و «سرعت کاهش سرعت» (به طور موقت کاهش سرعت ترافیک جدید) نیاز داشت.
چه کسی تحت تاثیر قرار گرفت؟
بله، همه ما از مشکلات بزرگ شاکی بودیم. اسنپ چت و ردیت از کار افتادند. فورتنایت، پلی استیشن شبکه، سرویس های پخش مختلف و بسیاری از سایت های مبتنی بر محتوا نیز از کار افتادند. سریالهای Duolingo و Wordle در معرض خطر بودند، اما با توجه به موقعیت مکانی، قربانیان شگفتانگیزتری نیز وجود داشت.
اگر خانه هوشمند و فناوری امنیت شخصی دارید، احتمالاً نمی توانید کار زیادی در خانه خود انجام دهید. اتوماسیونها و روالها فوراً به دلیل زنگهای در/دوربینهای Ring و دستگاههای آمازون الکسا که به ابر با استفاده از AWS متکی بودند، خراب شدند. این برای کسانی که از Life360 برای آرامش خانواده استفاده می کنند نیز کاهش یافته است.
آموزش همچنین آسیب دید زیرا پلت فرم آموزشی اصلی Canvas از کار افتاد و دانش آموزان قادر به دسترسی به سخنرانی ها یا انجام تکالیف نبودند. فن آوری مالی نیز سقوط کرده است، به طوری که بسیاری از بانک های بزرگ در بریتانیا و همچنین Venmo و Coinbase در ایالات متحده با قطعی مواجه شده اند.
اما بیشترین نگرانی مربوط به تاسیسات حیاتی، حمل و نقل و سیستم های شرکتی بود. HMRC، سازمان مالیاتی بریتانیا، سقوط کرد، وبسایتهای United Airlines و Delta آفلاین شدند، به این معنی که مردم نمیتوانستند پرواز رزرو کنند، و Zoom، Slack و Xero نیز غیرفعال شدند. همه به خاطر یک مرکز در ویرجینیای غربی!؟
خطوط آفساید برای اولین بار در این فصل ترسیم شد تا گل دوم تیاگو برای برنتفورد منتفی شود. ❌تکنولوژی آفساید نیمه اتوماتیک امروز به دلیل قطعی AWS در دسترس نیست20 اکتبر 2025
همچنین، به طرز خندهداری، مشکلات قطعی AWS در سراسر جهان ورزش احساس میشد، به طوری که فناوری آفساید نیمه خودکار مورد استفاده در فوتبال لیگ برتر غیرفعال شد و VAR به فرآیندی درگیرتر در مسابقه وستهم تبدیل شد.
حالا چه اتفاقی باید بیفتد؟
در اینجا سؤال 2.5 میلیارد دلاری برای خدمات وب آمازون وجود دارد: چرا بسیاری از زیرساخت های حیاتی جهان به چنین نقطه شکستی وابسته است؟ بله، میدانم که این گزینه «پیشفرض» است، اما همه اینها بر اساس زمینه تاریخی است. و بافت تاریخی نباید یک منطقه را به سیستم عصبی مرکزی ترافیک روزانه وب سایت تبدیل کند.
دنیای دیجیتال برای خدمات مهمی مانند اینها به تعداد انگشت شماری از شرکت های بزرگ فناوری متکی است. بنابراین آیا زمان آن رسیده است که تنظیم کننده ها و شرکت ها تغییر را اجباری کنند؟
اقدامات عمده
در اینجا نیز پیشینه هایی برای اقدام دولت وجود دارد و این پرسش ها باید بارها و بارها مطرح شود. اگر هر یک از شخصیت های سیاسی با این مقاله برخورد کردند، لطفاً این سؤالات را مطرح کرده و آنها را به آمازون ارسال کنید! و اگر ممکن است دو راه حل پیشنهاد کنم:
- اجرای چند منطقه ای: معماری سیستم سرویسهای کلیدی برای استقرار در یک مکان بسیار حیاتی است. برای غلبه بر این مشکل در آینده باید یک شکست زنده در یک منطقه جداگانه مانند اروپا یا آسیا وجود داشته باشد.
- دولت ها باید سختگیرانه تر عمل کنند: قوانین مربوط به خدمات حیاتی مانند بانکداری، آموزش، حمل و نقل و خدمات دولتی باید یک طرح پشتیبان در فناوری اطلاعات خود داشته باشند. این به معنای نیازهای بیشتر، مانند استراتژی های چند ابری است.
چه کاری می توانید انجام دهید؟
باشه و تو؟ زیرا اگر تاریخ تکرار شود، ممکن است دفعه بعد که AWS سرفه کند و بیشتر اینترنت آنفولانزا بگیرد، همه ما به حالت قبل برگردیم.
اولین کاری که می توانید انجام دهید این است که خانه هوشمند خود را ضد وقفه کنید. زنگهای در و دستگاههای الکسا کاملاً به فضای ابری وابسته هستند. شما باید به دنبال دستگاههایی باشید که روی سیستمهای پروتکل بومی مانند Matter اجرا میشوند، که کنترل محلی را به یک نیاز کلیدی تبدیل میکند.
اما بازی طولانی برای شما (و من و دیگران) این است که از فناوریهایی که هر روز استفاده میکنید، افزونگی بیشتری بخواهید. و نحوه گوش دادن شرکت ها این است که آنها را در جایی که آسیب می بیند ضربه می زنند: در کیف پولشان.
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



