AWS از کار نیفتاد، اما مایکروسافت آن را به نظر میرساند که قطعی بوده است. این چیزی است که دیروز اتفاق افتاد

به نظر می رسد که خدمات وب آمازون (AWS) دیروز (29 اکتبر) با مشکلات بیشتری مواجه شده است زیرا گزارشات قطعی در وب سایت نظارتی DownDetector شروع شده است. پس از قطعی دسته جمعی هفته گذشته که باعث هرج و مرج شد، این وضعیت بد به نظر می رسید. اما این بار خود AWS با آنچه گزارش شده بود مخالفت کرد.
با توجه به صفحه وضعیت خدمات AWS، همه سرویسها «بهطور عادی کار میکنند» و این شرکت به Tom’s Guide گفت: «داشبورد سلامت AWS تنها منبعی در اینترنت است که دادههای دقیقی را در مورد در دسترس بودن خدمات ما ارائه میدهد.
برای پیچیده تر کردن مسائل، ما شروع به دریافت گزارش های تایید نشده از کاربرانی کردیم که در مورد مشکلات مربوط به خطاهای «ظرفیت تکمیل نشده» و از دست دادن Fire TV، که ظاهراً ناشی از مشکلات سرویس آمازون بود، ایمیل می زدند.
در واقع چه اتفاقی افتاد؟
این به دو چیز منتهی می شود: وابستگی متقابل و تأثیر گسترده قطعی واقعی دیروز مایکروسافت. به طور خاص Azure Front Door (AFD). یک “تغییر پیکربندی تصادفی” باعث از کار افتادن شبکه و سرویس مسیریابی مایکروسافت شد (خطاهای وضوح DNS).
آن را مانند یک تابلوی تلفن بزرگ و پیچیده در نظر بگیرید که فوراً تعداد زیادی برنامه و وب سایت را در سراسر کره زمین به هم متصل می کند. AFD اپراتور اصلی است و به طور تصادفی سوئیچ مرکزی را اشتباه چرخانده است.
با وقوع این اتفاق، گزارشهای قطعی کاربر به AWS نیز افزایش یافت. صندوق ورودی ایمیل من با نوشتن خوانندگان منفجر شد و X/Twitter به این گروه پیوست. با این حال، بسیاری از شرکتها و برنامههای کاربردی بزرگ از استراتژی چند ابری استفاده میکنند که برای سرویسهای مختلف به AWS و Azure متکی هستند.
هنگامی که Azure سوئیچ مرکزی اشتباه را برگرداند، سرویسهایی را که از AWS نیز در اجزای خود استفاده میکردند، مختل کرد، اما خود AWS مشکلی نداشت. AWS در صفحه وضعیت خدمات خود توضیح می دهد: “ما می دانیم که یک مشکل عملیاتی در یک ارائه دهنده زیرساخت دیگر ممکن است بر برنامه ها و شبکه های برخی از مشتریان تأثیر بگذارد.”
سپس اثر دومینوی نفوذ گسترده آمد. از آنجایی که بیشتر اینترنت به چندین ارائهدهنده ابر بزرگ مانند Azure، Google Cloud و AWS متصل است، یک نقص بزرگ در یکی از آنها میتواند بر دیگران تأثیر بگذارد و منجر به گزارشهای قطعی برای سرویسهای مرتبط شود که واقعاً تحت تأثیر قرار نگرفتهاند.
نحوه گزارش قطعی
این مهم است که ما این را روشن کنیم. ما در خدمت شما هستیم خوانندگان ما و هیچ کس دیگری. بنابراین ما توسط ترکیبی از سه چیز هدایت میشویم: گزارشهای قطعی کاربر در پلتفرمهایی مانند Down Detector، ایمیلهایی که تجربیات خود کاربران را مستند میکنند و صفحات وضعیت خدمات شرکت.
با این حال، ممکن است یک تغییر در روند گزارش دهی زنده خود در رابطه با قطعی سرویس ابری بالقوه ایجاد کنیم. ابتدا باید قبل از اعلام پاسخ در عناوین و اخبار خود سؤال کنیم، زیرا همانطور که دیروز دیدید، وابستگی های متقابل می تواند باعث سردرگمی در مورد اینکه چه چیزی کاهش می یابد و چه چیزی کاهش نمی یابد.
اما وقتی چیزی مشخص در صفحه وضعیت سرویس ابری، نظر شرکت یا شواهد تایید شده از خوانندگان خود میبینیم، از خود میپرسیم که “مشکلی وجود دارد؟” به جای اینکه بگوییم، موضع خود را تغییر خواهیم داد. “مشکلی پیش آمد.”
ما معتقدیم این عادلانه ترین راه برای نزدیک شدن به کاهش های آینده است. با این حال، اگر پیشنهاد، سوال یا ابهامی دارید، لطفاً در قسمت نظرات با من تماس بگیرید.
دنبال کردن راهنمای تام برای Google News و ما را به عنوان منبع ترجیحی اضافه کنید برای مشاهده آخرین اخبار، تحلیل ها و بررسی های ما در فیدهای خود. فراموش نکنید که روی دکمه Follow کلیک کنید!
اطلاعات بیشتر از راهنمای تام
بازگشت به لپ تاپ



