A Cloudflare enfrentou problemas técnicos nesta sexta-feira, 19 de dezembro, marcando o terceiro incidente relevante em um curto espaço de tempo. Esses problemas levantam preocupações sobre a dependência global de poucos fornecedores de serviços de internet.
O site Downdetector, que monitora falhas em tempo real, começou a receber um aumento significativo nas reclamações sobre a Cloudflare logo após as 6h. Os usuários relataram principalmente dificuldades de conexão com servidores e problemas de DNS.
Até a manhã de hoje, a Cloudflare emitiu duas notas informativas. A primeira, publicada às 8h19, informou que a empresa estava ciente de problemas intermitentes na rede e que os clientes poderiam enfrentar erros. A segunda nota, divulgada às 8h31, confirmou que a investigação sobre o problema continuava.
Este incidente ocorre após uma instabilidade anterior no início de dezembro, quando plataformas populares como LinkedIn, Substack e Fortnite ficaram fora do ar. Apesar da rápida resposta da empresa para resolver o problema, esse evento teve repercussões, como bloqueios de tráfego legítimo e um impacto negativo nas ações da Cloudflare. A empresa atribuiu essa falha a uma manutenção programada em data centers nos Estados Unidos, especificamente em Chicago e Detroit.
A Cloudflare, fundada em 2009, atua como uma camada invisível na internet. A companhia fornece serviços de segurança e desempenho para websites, funcionando como uma ponte entre os usuários e os sites que eles desejam acessar.
Ela utiliza uma rede de entrega de conteúdo (CDN) para espalhar cópias de dados entre servidores globalmente. Esse sistema ajuda a reduzir o tempo de resposta e proteger contra ataques. A Cloudflare gerencia, em média, 78 milhões de requisições HTTP por segundo. Isso explica como falhas podem rapidamente afetar muitos serviços. Um episódio marcante em novembro levou à indisponibilidade de plataformas como X/Twitter e ChatGPT. O CEO da Cloudflare, Matthew Prince, classificou essa falha como o pior colapso desde 2019.
Na ocasião, a causa foi identificada como um erro no sistema responsável por proteger os sites de ataques DDoS, que tentam sobrecarregar servidores com acessos simultâneos, causando sua paralisação. Quando ocorrem erros nesse sistema compartilhado, as consequências podem ser abrangentes, levando a um colapso em larga escala.
Após a grave falha de novembro, a Cloudflare anunciou medidas para aumentar sua segurança. As ações incluem validações mais rigorosas de arquivos internos, ampliação de opções para desligar rapidamente funções, contenção de sobrecargas causadas por relatórios de erro e uma revisão completa de pontos críticos em seu sistema.
