Masowa awaria usług Amazon Web Services (AWS) spowodowała dziś rano zakłócenia w działaniu dziesiątek popularnych stron internetowych, aplikacji i gier na całym świecie. Problemy dotknęły między innymi Amazon, Snapchat, Fortnite, Roblox oraz brytyjski bank Lloyds.
Źródło problemu w centrum danych w Virginii
Amazon Web Services potwierdził "problem operacyjny" w swoim centrum danych w Północnej Virginii, znanym jako region "us-east-1". To jeden z najważniejszych węzłów infrastruktury chmurowej AWS, który obsługuje znaczną część ruchu internetowego na świecie.
Możemy potwierdzić zwiększone wskaźniki błędów i opóźnienia dla wielu usług AWS w regionie US-EAST-1. Problem może również wpływać na tworzenie zgłoszeń przez Centrum Wsparcia AWS lub API wsparcia. Jesteśmy aktywnie zaangażowani i pracujemy nad złagodzeniem problemu oraz zrozumieniem głównej przyczyny.
Które serwisy zostały dotknięte awarią
Lista firm i platform dotkniętych dzisiejszą awarią jest imponująca. Wśród zgłaszających problemy znalazły się:
- Platformy społecznościowe: Snapchat
- Gry online: Fortnite, Roblox
- Finanse: Coinbase, Robinhood
- Sztuczna inteligencja: Perplexity
- Edukacja: Duolingo
- E-commerce: Depop
- Urządzenia smart: Ring (dzwonki i kamery)
Reakcje przedstawicieli firm
Aravind Srinivas, CEO startup'u AI Perplexity, potwierdził na platformie X: "Perplexity nie działa w tej chwili. Główną przyczyną jest problem z AWS. Pracujemy nad jego rozwiązaniem."
Podobnie inne firmy, w tym giełda kryptowalut Coinbase i aplikacja handlowa Robinhood, oficjalnie przypisały swoje awarie problemom z infrastrukturą Amazon.
Analiza techniczna problemu
Według Rafe'a Pillinga, dyrektora ds. analizy zagrożeń w firmie bezpieczeństwa Sophos, problem wydaje się mieć charakter techniczny, a nie związany z cyberatakiem.
Gdy coś takiego się dzieje, obawy o incydent cybernetyczny są zrozumiałe. AWS ma daleko sięgający i skomplikowany zasięg, więc każdy problem może spowodować poważne zakłócenia. W tym przypadku wygląda na to, że jest to problem IT po stronie bazy danych.
Identyfikacja przyczyny
Inżynierowie AWS zidentyfikowali potencjalną główną przyczynę problemów. Według najnowszych informacji, awaria może być związana z:
- Problemami z rozwiązywaniem DNS dla punktów końcowych API DynamoDB
- Błędami w bazie danych DynamoDB w regionie US-EAST-1
- Wpływem na inne usługi AWS w tym regionie
- Zakłóceniami w usługach globalnych, takich jak aktualizacje IAM
Postępy w naprawie
Amazon Web Services regularnie publikuje aktualizacje dotyczące postępów w rozwiązywaniu problemu. Najnowsze komunikaty wskazują na "znaczące oznaki poprawy":
Widzimy znaczące oznaki poprawy. Większość żądań powinna teraz kończyć się sukcesem. Nadal pracujemy nad zaległością kolejkowanych żądań. Będziemy nadal dostarczać dodatkowe informacje.
Globalny zasięg awarii
Dane z platformy monitorowania Cisco Thousand Eyes pokazują globalny zasięg dzisiejszych problemów. Zgłoszenia napływały z:
- Stanów Zjednoczonych
- Wielkiej Brytanii
- Australii
- Nowej Zelandii
- Innych regionów świata
Wpływ na brytyjskie instytucje
W Wielkiej Brytanii awaria dotknęła również stronę internetową HM Revenue & Customs (HMRC) - urzędu skarbowego. Użytkownicy próbujący zalogować się do systemu podatkowego otrzymywali komunikat: "Przepraszamy, wystąpił problem z usługą".
Znaczenie AWS dla globalnego internetu
Dzisiejsza awaria po raz kolejny pokazuje, jak krytyczną rolę odgrywa infrastruktura Amazon Web Services w funkcjonowaniu współczesnego internetu. AWS obsługuje znaczną część ruchu sieciowego na świecie, a problemy w jednym centrum danych mogą sparaliżować tysiące niezależnych serwisów.
Eksperci podkreślają, że choć awarie tego typu są stosunkowo rzadkie, ich wpływ jest ogromny ze względu na centralizację usług chmurowych w rękach kilku dużych dostawców.
Aktualizacja: Amazon Web Services kontynuuje prace nad pełnym przywróceniem usług. Firma zaleca użytkownikom ponowne próby połączenia z usługami, które wcześniej nie odpowiadały.