Internet, la nube, la redundancia y los planes B. Caída de Fastly.

Hace poco el incendio en un CPD de OVH causó la caída de muchas páginas en Europa, y la posible pérdida de datos para los clientes. Pero buen, al fin y al cabo estamos hablando de clientes que deberían también tener sus copias de seguridad.

Recientemente le explicaba a un cliente, que depende mucho de Sharepoint, que la nube tiene mecanismos redundantes para intentar asegurar las continuidad del servicio. Y dos días más tarde “se cayó” Sharepoint durante unas horas cruciales para ellos.

Hoy, alrededor de las 12:00, se han caído webs tan importante como la CNN, The New York Times, HBO Max, Shopify, Twitter, Twitch, Vimeo.

En un principio se pensó en caída física ( de AWS principalmente) pero luego se ha confirmado que es un problema en el servicio de Fastly, un CDN que usan muchas empresas para acelerar las páginas y protegerlas de ataques de DDoS. Fastly ha confirmado el hecho.

¿Qué debería aprender Internet (clientes y proveedores) de todo esto?

En informática los fallos deberían usarse para aprender y mejorar. Igual que el incendio de OVH lo deberían haber usado los clientes para revisar sus políticas de copia de seguridad, esto se debería usar como aviso.

Tanto clientes como proveedores deberían darse cuenta de la importancia de medidas reduntantes y planes de disaster recovery. Y exigirlo a los proveedores. Todo es susceptible de fallar. Pero si dependes tanto de la nube, y hoy lo hacemos, debería haber un Plan B para cada componente vital.

  • si cae la línea deberíamos tener una de respaldo.
  • si cae el servidor deberíamos tener una copia redundante, preparada para estar arriba en minutos.
  • si mi alojamiento no funciona, tener otro de AWS o de Google Cloud para poder restaurar la página en minutos.
  • si cae el CDN, como hoy, deberíamos estar preparados para desactivarlo. Y el CDN debería tener unos de respaldo.

¿Por qué estas empresas no parecen haber pensado nada de esto o tenerlo en cuenta?

Y si, todo eso lleva dinero. Pero ¿ cuánto dinero están perdiendo estas empresas por tener 1,2-5 horas caías las webs?

No podemos estar teniendo estas caídas globales en sistemas críticos para nuestros negocios.

Revisad vuestros sistemas, ved dónde pueden fallar, y aseguraros que tenéis preparada una respuesta para activarla en menos de 2 horas.

Deja un comentario

Resumen de nuestra Política de Privacidad

  • Responsable: SmythSys IT Consulting SLNE.
  • Finalidad: Gestionar y moderar los comentarios.
  • Legitimación: Necesitas dar tu consentimiento para publicar un comentario.
  • Destinatarios: Tus datos se alojan en los servidores de OVH.
  • Derechos: Tienes derecho a acceder, rectificar, limitar y suprimir los datos en la dirección del responsable (en nuestra política de privacidad).

Time limit is exhausted. Please reload CAPTCHA.