Las aplicaciones del grupo que lidera Mark Zuckerberg han sufrido una nueva caída en sus servicios, dificultando su uso, tal y como refleja el portal de caídas Downdetector, que muestra como los fallos son generalizados a nivel global. La situación es tan crítica que el propio director de Instagram, Adam Masseri, ha descrito la jornada de hoy como "un día de nieve".
Según se reporta en el propio portal de Downdetectar (la página de ‘Status’ de Facebook no está operativa por el fallo), la caída afecta a todo el mundo: en el caso de Instagram, especialmente a la app, la web y la conexión con el servidor; mientras que en WhatsApp afecta a la app, a la conexión con el servidor y al envío de mensajes; por su parte, Facebook tiene la web caída y se reportan problemas en la conexión con el servidor y el acceso a la app; mientras que en Messenger no se pueden enviar mensajes, conectarse a la web ni a la aplicación.
La última brecha signfiicativa de Facebook fue en 2019 cuando un error técnico provocó la caída de todos sus sitios durante 24 horas.
El 57% de las publicaciones en Facebook que la gente ve son de sus familiares y amigos
Leer más
"Estamos trabajando para que las cosas vuelvan a la normalidad lo antes posible, y nos disculpamos por las molestias"
La caída de los cuatros sistemas al mismo tiempo no es una simple casualidad y es que, las cuatro aplicaciones forman parte del mismo Grupo que comparte servidores y, en muchos casos, servicios.
El uso de las cuatro aplicaciones ha empezado a fallar en torno a las 17:25 (hora española). "Somos conscientes de que algunas personas están teniendo problemas para acceder a nuestras aplicaciones y productos", ha reconocido un portavoz de Facebook en declaraciones a Zonamovilidad.es. "Estamos trabajando para que las cosas vuelvan a la normalidad lo antes posible, y nos disculpamos por las molestias", ha asegurado.
Con este mismo mensaje se ha referido Andy Stone, director de comunicación de Facebook, señalando que son conscientes del fallo y están trabajando en arreglarlo.
Qué ha provocado el fallo
Pese a que Facebook inicialmente no había informado de los motivos que han provacado la caída generalizada de los cuatro servicios, son varios los expertos que apuntan a que el error puede deberse a un fallo en los sistemas de dominio (DNS), que traduce los nombres de dominio que se emplean para acceder a las páginas (como facebook.com o zonamovilidad.es).
"Facebook retiró (por causas aún desconocidas) sus rutas del sistema de anuncios BGP, sacándose así a sí mismos de Internet"
Otros expertos, como el director de Tecnología de la empresa Transparent Edge Services, Diego Suárez, explican que el fallo es el enrutamiento BGP, “el sistema postal de internet, un protocolo mediante el cual los routers de los proveedores de Internet saben cómo enviar los paquetes de red”. Suárez explica que “sobre las 17:50 hora española, Facebook retiró (por causas aún desconocidas) sus rutas del sistema de anuncios BGP, sacándose así a sí mismos de Internet. Esto provocó que los propios servidores DNS de Facebook, que traducen los nombres de dominio a direcciones IP, fuesen inaccesibles a todo el resto de la red, con la consiguiente caída de todos sus servicios”.
Grave situación
La situación es especialmente grave para Facebook. Según ha avanzado The New York Times, los empleados de la compañía no han podido acceder a sus oficinas en Estados Unidos esta mañana para evaluar el alcance de la brecha porque sus credenciales no estaban operativas. En un memorando interno, la compañía asegura que se ha notificado de una interrupción del sistema que “afectaba a todos los sistemas y herramientas internas de Facebook”, incluyendo sistemas de seguridad, calendario interno y herramientas de programación.
Los expertos apuntan a que un equipo de la compañía ha eliminado por error las rutas de internet de las empresa (BGP)
A lo largo de la tarde, los rumores sobre una posible brecha de seguridad en la compañía se han ido moviendo e incluso algunas cuentas que se habían vinculado en el pasado al grupo de hackers Anonymous han asegurado que habían entrado en los sistemas de la marca.
Pero la realidad es diferente, los expertos apuntan a que un equipo de la compañía ha eliminado por error las rutas de internet de las empresa (BGP) durante un proceso de mantenimiento.
Facebook ha enviado un equipo de expertos a uno de sus centros de datos en California para tratar de hacer un restablecimiento manual de sus servidores, pero el proceso se está alargando más de lo previsto por la gravedad de la situación.
El impacto de los sistemas afecta también a Workplace, la aplicación de comunicación interna de Facebook que ha sido eliminada y ha obligado a los empleados a comunicarse a través de otras plataformas como LinkedIn y Zoom, así como a las salas de chat de Discord.
Explicación técnica del fallo de Facebook
La explicación para “dummies” la ofrece Cloudflare, señalando que “Facebook y sus páginas se han desconectado de internet” y como consecuencia de eso el DNS ha dejado de resolver el nombre de dominio.
Los DNS tienen mecanismo de enrutamiento, de manera que cuando alguien trata de acceder a facebook.com en el navegador, el DNS, responsable de traducir los nombres de dominio a direcciones IP reales a las que conectarse, comprueba primero si está en la caché y lo utiliza, si no obtiene la respuesta de los servidores de nombres de dominio, en este caso alojados por la propia marca. Sin embargo, si los servidores de nombres (nameservers) son inalcanzables o no responden por algún motivo, se devuelve un SERVFAIL y el navegador emite un error al usuario
De este modo, como Facebook ha dejado de mostrar sus rutas de prefijo DNS a través de BGP, los resolvedores de DNS de Cloudflare y los de todas las demás compañías no tienen forma alguna de conectarse a sus nameservers. Y esto supone una nueva cascada de intentos por parte de navegadores y aplicaciones que no aceptan el error como una respuesta factible y reintentan el acceso, al igual que los propios usuarios finales que recargan la página con el deseo de acceder.
El gran tamaño de Facebook y las demás aplicaciones del grupo afectadas son tan grandes y cuentan con un tamaño tan elevado que los DNS resolvers están manejando 30 veces más consultas de lo habitual, lo que causa problemas de latencia y tiempo de espera mayores en otras plataformas.
Entorno a las 23:28 (hora española), Facebook ha recuperado los BGP, proceso incial para poder restablecer correctamente los sistemas. Tras ello, los DNS se han empezado a activar y las aplicaciones han comenzado a recuperar el servicio. Alrededor de las 23:44 (hora española) las aplicaciones ya estaban operativas, aunque la posibilidad de su uso puede variar entre usuarios.
ACTUALIZACIÓN: Facebook confirma que la caída fue por un fallo técnico
A través de un artículo, el vicepresidente de sistemas e infraestructuras de Facebook, Santosh Janardhan, ha confirmado que “los cambios de configuración en los routers troncales que coordinan el tráfico de red entre nuestros centros de datos han provocado problemas que han interrumpido esta comunicación”.
“Esta interrupción del tráfico de red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que provocó la interrupción de nuestros servicios”, detalla Janardhan
Asegura además que no hay pruebas de que los datos de los usuarios se hayan visto comprometidos y que la causa principal ha sido “un cambio de configuración defectuoso”.
Asimismo, el directivo ha querido pedir disculpas a “todos los afectados” ya que “entendemos el impacto que tienen estas interrupciones en la vida de las personas y nuestra responsabilidad de mantenerlas informadas sobre las interrupciones de nuestros servicios”.
Efectos colaterales
El impacto de la caída de las redes del grupo de Zuckerberg se ha dejado notar en otros servicios. Aplicaciones como Telegram o TikTok están sufriendo la llegada masiva y el aumento de uso de los usuarios que no pueden emplear las otras aplicaciones. También AWS ha registrado ciertos problemas en su plataforma.
Los españoles se apoyan en llamadas y SMS tras la caída de Facebook, Instagram y WhatsApp
Leer más