Fastly „wyłączyło” znaczną część Internetu.
Zawiniła konfiguracja chmury
Minęło już kilkadziesiąt godzin po tym gdy poważna awaria dotknęła wiele znanych witryn, w tym Amazon, Reddit, Financial Times, Guardian czy New York Times. Nie działała też witryna rządu Wielkiej Brytanii (gov.uk).
Wiemy teraz, że za problemami stał dostawca usług przetwarzania w chmurze – Fastly. Firma poinformowała, że wystąpiły problemy z globalną siecią dostarczania treści (CDN), którą już naprawiła.
Zidentyfikowaliśmy konfigurację usługi, która wywołała globalne zakłócenia w naszych POPs (punkty obecności. points of presence) i wyłączyliśmy tę konfigurację.
POPy umożliwiają wysyłanie treści z globalnie rozproszonych serwerów, które znajdują się blisko użytkownika końcowego.
Chmura brzegowa
Kłopoty rozpoczęły się około godziny 12:00 czasu polskiego i trwały przez godzinę. Inne dotknięte strony internetowe to CNN, serwisy streamingowe Twitch i Hulu, PayPal, Shopify, bbc.com, HBO Max czy Vimeo. Awaria spowodowała również awarię części niektórych innych usług, w tym emotikonów Twittera. Po tej godzinie przestoju zaczęto mozolnie przywracać strony internetowe do działania. Problemy dotyczyły konkretnych lokalizacji w Europie i Stanach Zjednoczonych.
Fastly działa jako tzw. „chmura brzegowa” (edge cloud), która ma nie tylko przyspieszyć ładowanie stron internetowych ale także chronić je przed atakami typu DDOS i pomagać w chwilach chwilowego nasilenia ruchu.
Podobne problemy dotknęły w przeszłości Amazon Web Services i Cloudflare, dwie inne wielkie firmy zajmujące się przetwarzaniem w chmurze.
Zamiast chmury – edycja w Google Docs
Niektórym witrynom udało się znaleźć obejście tego problemu, a strona The Verge przeniosła się nawet do Google Docs, aby tam opublikować swoje wiadomości. Zapomnieli jednak wyłączyć możliwość edycji swoich wpisów co doprowadziło do serii zabawnych zmian i tweetów.
Hashtag #InternetOutage
szybko zyskał popularność w mediach społecznościowych, w miarę jak odkrywano coraz więcej niedziałających stron internetowych. Zakłócenia doprowadziły niektórych do kwestionowania zasadności posiadania tak dużej infrastruktury internetowej w rękach kilku firm.
Jake Moore, specjalista ds. cyberbezpieczeństwa w firmie ESET, powiedział: To wydarzenie podkreśla znaczenie ogromnych firm hostingowych oraz tego, za co odpowiadają. Adam Smith, ekspert ds. testowania oprogramowania z BCS (Chartered Institute for IT), powiedział, że awarie CDN podkreślają stale rosnący ekosystem złożonych i połączonych komponentów, które są zaangażowane w dostarczanie usług internetowych. Z tego powodu awarie coraz częściej dotykają wielu witryn i usług jednocześnie.
Niektórzy prawnicy uważają, że są podstawy do wystąpienia z roszczeniami o odszkodowanie. Prof. Rebecca Parry z Nottingham Law School podkreśla, że odpowiedzialność za utratę dostępu do usług będzie prawdopodobnie objęta umową dotyczącą poziomu usług z klientami płatnych usług w chmurze (SLA) ale z drugiej strony takie umowy zazwyczaj nie pokryją wszystkich poniesionych strat.