Cyber day + NO Facebook day La tormenta perfecta
Este lunes 4 de octubre mientras se desarrollaba con total normalidad el Cyber Day en Chile, al llegar el mediodía, dejaron de funcionar Facebook, Instagram y WhatsApp.
Cada año, el Cyber day en Chile ha sido un día donde el uso de internet se multiplica poniendo una cuota importante de stress en todos los sistemas. La industria se adaptó y han quedado atrás esas épocas donde los comercios online chilenos dejaban de funcionar por falta de capacidad ante la demanda de usuarios buscando ofertas, pero la presión sobre los sistemas que hacen funcionar el internet se ve incrementada cada vez que hay un Cyber day.
La caída de ayer de estas tres redes sociales no fue una caída más, fue una caída global, planetaria, que afecto a miles de millones de personas por varias horas. El primer efecto colateral inesperado de esta situación fue la sobrecarga de Telegram, la competencia directa de WhatsApp.
Las causas aún no están completamente claras, Ivan Žilić, Director de Tecnología de Pit Chile nos dijo lo siguiente: “Existen diferentes versiones, pero lo que sabemos con certeza en este momento es que los prefijos (grupos de direcciones IP) de Facebook dejaron de verse en las tablas de rutas cuando se produjo la caída.”
Esta es la representación gráfica de la “desaparición” de las rutas de Facebook:
Visualization of Facebook withdrawing its ASN, made with https://t.co/REvbPepOHK and Yakety Sax. pic.twitter.com/aGVXOPtliu— Steve Weis (@sweis) October 4, 2021
Para que internet funcione como lo conocemos, existen unos servidores llamados DNS. Los DNS son los encargados de “traducir” los nombres de dominio como facebook.com en un dato numérico llamado dirección IP que es comprensible para los computadores, teléfonos u otros aparatos por los cuales accedemos a las apps o páginas web. Todo sitio web requiere al menos un DNS (normalmente tienen varios por redundancia).
Los DNS de Facebook también desaparecieron de Internet ayer. Sin entrar en los detalles técnicos del sistema DNS, es importante saber que cada vez que alguien escribe un nombre de dominio como “facebook.com” o “instagram.com”, un servidor DNS tiene que convertir ese nombre en una dirección IP. Si el servidor DNS responsable de ese nombre de dominio no “existe”, se produce un error. Ni a los humanos ni a las maquinas les gustan los errores y muchas veces vuelven a intentar, a veces de manera compulsiva, hasta obtener un resultado válido.
Ahora imaginemos miles de millones de usuarios y sistemas tratando de obtener una respuesta del DNS para Facebook.com cuando los DNS de Facebook.com no estaban disponibles en internet. El resultado fue error tras error, reintento tras reintento y una carga aumentada sobre el sistema mundial de DNS.
En algunos casos esto significo que los tiempos de respuesta de los DNS aumentaran hasta arriba de los 250ms cuando lo normal es alrededor de 10ms. Para muchos usuarios en el mundo esto se tradujo en un internet lento y largos tiempos de espera para que las páginas web o App se desplegaran.
Roberto Alvarado de GTD, uno de los proveedores más grandes de Internet en Chile, comentó que vieron el impacto en sus sistemas, pero pudieron absorberlo sin que existiera degradación para los usuarios. En sus palabras: “afectación a la infraestructura?, el consumo de recursos de nuestros DNS subió al menos un 10% en cada servidor. ¿Si tuvimos daño hacia los usuarios finales?, no!!!”
Antonio Ricapito de Movistar indico que la situación en su red fue similar, (El uso de DNS) “Subió un 50% respecto del peak y en móvil subió como el 70%”, nuevamente sin afectación a los usuarios.
Por su parte, Hugo Salgado de NIC Chile dijo que: “Vimos que (los root server) F y el L tuvieron alza de tráfico de alrededor 25% más o menos. De DNS resolvers alguien decía que hubo casos (de alzas de tráfico) hasta de 500%! Pero que no fue problema, salvo algunas lentitudes.” Y agregó información muy importante: “El problema es que todos los DNS de facebook daban timeout, y en eso el DNS es poco robusto. ¡Ahí no funciona el caché normal, por lo que depende de cada implementación cuánto espera y cuánto reintenta!”
Enzo Picero, de Grupo ZGH, también comento el impacto de la siguiente forma: “El uso de nuestros servidores DNS recursivos aumento un 30%, suficiente para que se viera en nuestros sistemas de monitoreo, pero muy lejos de afectar la experiencia de los usuarios. Estos eventos son poco usuales, pero la próxima vez podría ser incluso más grande, por eso ya estamos trabajando en un upgrade preventivo de nuestra infraestructura DNS”.
Por el lado de Pit Chile, se vio un aumento considerable en el tráfico de los DNS raíz que alojan, pero no se registró ningún incidente.
Cuando una de las redes más grandes del mundo, con miles de millones de usuarios falla, es un dia triste para todos. En Chile, con la presión y el consumo elevado de internet por el Cyber day y la falla de Facebook pudo ser la tormenta perfecta con una gravísima alteración en las comunicaciones para todos, pero este 4 de octubre será recordado como la tormenta perfecta que NO fue y eso se debe a la robustez de la red y el trabajo incansable de todos los ingenieros de red.
Comments are currently closed.