Globalna awaria Cloudflare

Co się stało i dlaczego to ważne 

W dniu 18 listopada 2025 roku doszło do poważnej, globalnej awarii usług Cloudflare – jednego z kluczowych graczy w infrastrukturze internetu. Problemy dotknęły nie tylko małe strony, ale też gigantyczne platformy, takie jak ChatGPT (OpenAI), X (dawniej Twitter), Uber, Canva, Spotyfi, Perplexity, Gemini, PayPal, League of Legends, Zoom i wiele innych.

Ruszamy z zapisami na kurs Zabbix – Monitoring Sieci i Serwerów!
Chcesz zdobyć praktyczną umiejętność w IT i nauczyć się profesjonalnego monitoringu infrastruktury z wykorzystaniem Zabbixa?
 Ten kurs przeprowadzi Cię od podstaw aż po zaawansowane wdrożenia.
 
Promocja trwa do 16 grudnia do godz. 23:59

Zapisz się już dziś!

Sprawdź szczegóły: https://asdevops.pl/kurs-zabbix

 

Przyczyna awarii

Błąd konfiguracyjny w systemie Bot Management. Cloudflare tłumaczy, że problem miał związek z plikiem konfiguracyjnym, który jest automatycznie generowany dla ich systemu zarządzania botami („Bot Management”). Ten plik uległ znacznemu rozrostowi powyżej oczekiwanej liczby wpisów, co przeciążyło oprogramowanie.W efekcie silnik opartego na Cloudflare proxy (routujący ruch) nie był w stanie poprawnie obsłużyć tak dużego pliku — nastąpił „panic crash” („system panikował”), co skutkowało błędami 5xx. Zmiana uprawnień w bazie danych.Awarię wywołała zmiana uprawnień w jednej z baz danych Cloudflare. Ta zmiana spowodowała, że baza wygenerowała duplikaty wpisów w tzw. „feature file” (pliku cech), co zwiększyło jego rozmiar. Gdy duplikowany plik został rozpowszechniony na serwerach Cloudflare, przekroczył granicę obsługiwaną przez oprogramowanie. W szczególności wspomniano, że system zakładał limit ~200 cech (features), a nowy plik znacząco go przekroczył, co doprowadziło do błędu w module Bot Management.

Przebieg i skutki awarii

  • Awaria rozpoczęła się około 11:20 UTC.
  • Wiele usług zgłaszało błędy typu 500 Internal Server Error, co sprawiało, że strony nie ładowały się lub były bardzo niestabilne.
  • Ucierpiały różne warstwy infrastruktury Cloudflare: CDN, DNS, proxy, systemy bezpieczeństwa jak WAF (Firewall Webowy) czy Bot Management.
  • Naprawa została wdrożona w ciągu kilku godzin. Cloudflare potwierdził, że “fix został zaimplementowany” i monitoruje system, aby upewnić się, że usługi wracają do pełnej sprawności.
  • Czas całkowitej awarii wyniósł kilka godzin, a według niektórych raportów problemy trwały do momentu pełnej stabilizacji, czyli około 17:14 UTC.

Konsekwencje

  1. Zależność od wielkich dostawców infrastruktury
     
    Awaria Cloudflare pokazuje, jak bardzo wiele serwisów jest zależnych od jednej firmy. Gdy ona zawodzi, dotyka to całego internetu – nie tylko pojedynczych stron.
  2. Ryzyko systemowe
     
    Nawet rutynowe zmiany konfiguracyjne mogą prowadzić do poważnych awarii. Cloudflare twierdzi, że błąd w ich systemie Bot Management – usłudze mającej chronić strony – doprowadził do globalnych problemów.
  3. Transparentność i zaufanie
     
    Cloudflare przyznał się do błędu i obiecał opublikować dokładniejszą analizę po wstępnej fazie naprawy.
  4. W swoim oświadczeniu CTO firmy stwierdził:

„W skrócie, popełniliśmy błąd. Zawiedliśmy naszych klientów i szerzej – internet.”

Taka transparentność jest kluczowa, jeśli firmy chcą odbudować zaufanie po takich incydentach.

Potrzeba redundancji
 
Dla firm korzystających z usług chmurowych i dostawców takich jak Cloudflare, to moment, żeby przemyśleć strategie redundancji i disaster recovery. Korzystanie z wielu dostawców lub włączanie zapasowych ścieżek może zmniejszyć ryzyko w przyszłości.

Wnioski

Awaria Cloudflare z 18 listopada 2025 r. to ważne przypomnienie, że infrastruktura internetu — choć potężna — wciąż jest wrażliwa. Nawet globalni gracze mogą mieć poważne problemy, a efekty odczuwają całe firmy i miliony użytkowników. Pokazuje to, jak bardzo duże i kluczowe systemy (jak Cloudflare) muszą konfigurować limity i ostrożnie zarządzać zmianami w bazach danych — nawet pozornie „rutynowa” zmiana może mieć poważne konsekwencje.

Ruszamy z zapisami na kurs Zabbix – Monitoring Sieci i Serwerów!
Chcesz zdobyć praktyczną umiejętność w IT i nauczyć się profesjonalnego monitoringu infrastruktury z wykorzystaniem Zabbixa?
 Ten kurs przeprowadzi Cię od podstaw aż po zaawansowane wdrożenia.
 
Promocja trwa do 16 grudnia do godz. 23:59

Zapisz się już dziś!

Sprawdź szczegóły: https://asdevops.pl/kurs-zabbix

 

Ruszamy z zapisami na kurs Zabbix – Monitoring Sieci i Serwerów!

X