Użytkownicy poczty e-mail Microsoftu mogą mieć wrażenie déjà vu, gdyż po raz kolejny doszło do awarii internetowej wersji programu Outlook, uniemożliwiając dostęp do skrzynek pocztowych usługi Exchange Online. Problem, który rozpoczął się wieczorem 19 marca, miał zasięg globalny i dotknął zarówno użytkowników indywidualnych, jak i klientów korporacyjnych.
Według Microsoftu przyczyną usterki była „niedawna zmiana wprowadzona w części infrastruktury Outlook on the web, która mogła mieć wpływ na działanie usługi”. Firma natychmiast rozpoczęła działania naprawcze, co oznaczało wycofanie problematycznych modyfikacji. Po ich cofnięciu dostęp do usługi został przywrócony. Choć problem rozwiązano, incydent rodzi pytania o jakość testowania zmian wprowadzanych przez Microsoft w środowisku produkcyjnym.
Awaria miała globalny zasięg
Według danych serwisu DownDetector, użytkownicy zaczęli zgłaszać problemy około godziny 17:30 UTC 19 marca. Firma szybko potwierdziła awarię za pośrednictwem mediów społecznościowych, publikując komunikat: „Badamy zgłoszenia dotyczące problemu wpływającego na możliwość dostępu użytkowników do Outlooka w sieci”. Zaledwie pół godziny później Microsoft przyznał, że wprowadził zmianę, która mogła być odpowiedzialna za awarię. Zmiana ta została cofnięta, a usługi zaczęły stopniowo wracać do normy.
Nie pierwszy raz – Microsoft i ciągłe problemy z Outlookiem
Dla użytkowników i administratorów IT nie jest to odosobniony przypadek. Tego rodzaju incydenty stają się niepokojąco częste. Na początku marca doszło do długiej przerwy w działaniu Outlooka, którą Microsoft również przypisał „problematycznej zmianie kodu”. Co więcej, osiem dni po omawianej awarii użytkownicy systemu iOS nadal borykali się z problemami z dostępem do Outlooka na swoich urządzeniach. Wielu z nich nie mogło odświeżyć skrzynki pocztowej.
Administratorzy IT na pierwszej linii frontu
Gdy dochodzi do takich awarii, najbardziej poszkodowani są administratorzy IT w przedsiębiorstwach. Użytkownicy indywidualni mogą czuć frustrację z powodu braku dostępu do poczty e-mail, ale to administratorzy IT muszą odpowiadać na lawinę zgłoszeń i próbować ratować sytuację. Firmy, które postawiły na rozwiązania Microsoftu w chmurze, mają w takich sytuacjach związane ręce – ich jedyną opcją jest kontakt z pomocą techniczną i czekanie na rozwiązanie problemu przez dostawcę usług.
Złożoność chmury – czy Microsoft wyciągnie wnioski?
Incydent po raz kolejny uwypukla wyzwania związane z zarządzaniem ogromnymi systemami chmurowymi. Wystarczy jeden błąd inżyniera, by wywołać poważne zakłócenia w funkcjonowaniu usług używanych przez dziesiątki tysięcy klientów. Jedynym sposobem na minimalizowanie takich problemów jest rygorystyczne testowanie zmian i pełna analiza ich potencjalnych konsekwencji przed wdrożeniem. Pytanie brzmi, czy Microsoft wyciągnie z tego wnioski, czy użytkownicy i administratorzy IT będą musieli nadal zmagać się z kolejnymi niespodziewanymi awariami.

Pokaż / Dodaj komentarze do: Kolejna globalna awaria Outlooka. Microsoft testuje na produkcji?