Cloudflare ha confirmado que la interrupción de corta duración que dejó sin conexión a cientos de sitios web el martes 21 de junio fue causada por un cambio de configuración de red planificado dentro de 19 de sus centros de datos y no fue el resultado de una actividad maliciosa.
Como informó anteriormente Computer Weekly, una amplia gama de sitios web y servicios en línea orientados al consumidor y enfocados en la empresa se desconectaron temporalmente durante el incidente de tiempo de inactividad, que la empresa de seguridad de aplicaciones web tardó poco más de una hora en resolver.
En una publicación de blog, publicada el mismo día en que ocurrió la interrupción, Cloudflare dijo que la interrupción fue el resultado de un cambio de configuración de red, implementado en 19 de sus centros de datos, como parte de un trabajo más amplio diseñado para aumentar la capacidad de recuperación de sus servicios en sus “ubicaciones más concurridas”.
Estas instalaciones incluyen varios centros de datos en América del Norte y del Sur, Europa y Asia-Pacífico, lo que brinda cierto contexto sobre por qué una de las características definitorias de la interrupción fue la gran cantidad de propiedades web de alto perfil y servicios en línea afectados por ella.
“Durante los últimos 18 meses, Cloudflare ha estado trabajando para convertir todas nuestras ubicaciones más concurridas a una arquitectura más flexible y resistente”, dijo la publicación del blog. “En este tiempo, hemos convertido 19 de nuestros centros de datos a esta arquitectura.
“Una parte crítica de esta nueva arquitectura… es una capa adicional de enrutamiento que crea una malla de conexiones. Esta malla nos permite deshabilitar y habilitar fácilmente partes de la red de Internet en un centro de datos para mantenimiento o para solucionar un problema”.
Y aunque la nueva configuración ha reforzado la solidez de la configuración de red de su centro de datos, lo cual es importante porque estos 19 centros de datos transportan una cantidad significativa del tráfico de Cloudflare, también es una de las razones por las que la interrupción tuvo efectos de tan largo alcance, agregó el blog.
“Esta nueva arquitectura nos ha brindado mejoras significativas en la confiabilidad, además de permitirnos realizar el mantenimiento en estas ubicaciones sin interrumpir el tráfico de clientes”, dijo.
“Dado que estas ubicaciones también transportan una proporción significativa del tráfico de Cloudflare, cualquier problema aquí puede tener un impacto muy amplio y, desafortunadamente, eso es lo que sucedió hoy”.
A raíz del incidente, la compañía identificó varias áreas que pueden mejorar para evitar que vuelva a suceder, y “seguirá trabajando para descubrir cualquier otra brecha que pueda causar una recurrencia”, agregó la publicación del blog.
“Lamentamos profundamente la interrupción de nuestros clientes y de todos los usuarios que no pudieron acceder a las propiedades de Internet durante la interrupción. Ya hemos comenzado a trabajar en [making] cambios y continuaremos con nuestra diligencia para garantizar que esto no vuelva a suceder”, concluyó.