Cloudflare identifica falha em banco de dados como motivo de grande interrupção recente

Atualização no banco de dados provoca a maior interrupção da Cloudflare em seis anos, impactando CDN, segurança e autenticação global por quase seis horas.

22/11/2025 14:10

2 min de leitura

Cloudflare: Rack de servidores e cabos de rede em data center, i...

Interrupção Global da Cloudflare: Causa e Consequências

A Cloudflare confirmou que uma falha interna em seu banco de dados foi a responsável pela interrupção significativa que afetou a internet global nesta terça-feira. Um ajuste rotineiro nas permissões gerou um erro em cascata, resultando na queda da rede da empresa por quase seis horas, o maior incidente desde 2019. Isso deixou indisponíveis serviços de CDN, segurança, autenticação e parte do painel administrativo utilizados por inúmeras empresas ao redor do mundo.

Detalhes da Falha que Causou a Interrupção

A empresa, que é uma das principais fornecedoras de infraestrutura de segurança e distribuição de conteúdo na internet, esclareceu que o problema não foi causado por ataques cibernéticos. O CEO Matthew Prince explicou que a origem do incidente foi uma alteração nas permissões de um sistema de banco de dados, que resultou na duplicação de entradas em um arquivo de recursos. Essa duplicação fez com que o arquivo se tornasse excessivamente grande, rompendo limites predefinidos e causando falhas no roteamento e processamento de tráfego.

Como a Interrupção Começou

A interrupção teve início às 11h28 UTC, quando a atualização nas permissões foi propagada. Essa mudança alterou o comportamento de uma consulta interna, que passou a retornar metadados duplicados, fazendo com que o arquivo de recursos aumentasse de 60 para mais de 200 entradas. Esse crescimento excedeu o limite de segurança do sistema, resultando em falhas e erros HTTP 5xx observados por clientes globalmente.

Impacto da Queda nos Serviços da Cloudflare

Com a propagação do arquivo corrompido, o sistema de proxy principal, que gerencia milhões de solicitações por segundo, começou a falhar. A instabilidade afetou diversos serviços essenciais da Cloudflare, incluindo:

  • Rede de CDN global
  • Mecanismos de segurança e mitigação de bots
  • Turnstile (substituto do CAPTCHA)
  • Workers KV (banco de dados para aplicações serverless)
  • Painel administrativo
  • Segurança de e-mail
  • Serviços de autenticação Zero Trust

Empresas que dependem da Cloudflare enfrentaram lentidão e indisponibilidade, além de picos de erro 5xx.

Restauração e Estabilização do Sistema

Após análise, os engenheiros conseguiram identificar a causa raiz às 14h30 UTC e restauraram uma versão funcional do arquivo de configuração. O tráfego começou a normalizar gradualmente, e todos os serviços foram considerados operacionais novamente às 17h06 UTC. Matthew Prince classificou o incidente como “inaceitável”, ressaltando a importância da empresa para a infraestrutura da internet.

Sequência de Interrupções no Setor

Esse incidente ocorre em um contexto de interrupções críticas no setor. Em junho, falhas na arquitetura Zero Trust da Cloudflare afetaram a conectividade WARP e o processo de autenticação em várias regiões. Além disso, em outubro, a Amazon enfrentou uma falha de DNS que comprometeu a conectividade de milhões de sites, destacando que até as maiores plataformas de nuvem estão suscetíveis a falhas internas.

Fonte por: Its Show

Autor(a):

Portal de notícias e informações atualizadas do Brasil e do mundo. Acompanhe as principais notícias em tempo real