|
|
|
31 de Agosto de 2006 | Tiempo de lectura: 5 minutos Red.es: Informe sobre la incidencia en el registro de Dominios ocurrida el 29 de agosto/noticias.info/ (MADRID, 31/AGOSTO/06).Lamentamos profundamente lo ocurrido y trabajamos para mejorar nuestro servicio día a día. Incidencias Dominios ".es" ¿Qué ocurrió exactamente? Entre las 15:15 y las 17:12 horas del martes 29 de agosto de 2006, los nombres de dominio “.es”, estuvieron inaccesibles para los usuarios de Internet por un error del software que gestiona el proceso. La incidencia se produjo mientras se realizaban en el Registro de dominios, dependiente de Red.es, las actualizaciones necesarias para trasladar a Internet los cambios y novedades en los nombres de dominio “.es” registradas. Por esta causa, los usuarios afectados pudieron tener dificultades para acceder en ese tiempo a los servicios de Internet a través de los nombres de dominio ".es". ¿Qué usuarios se vieron afectados? Según las valores reales obtenidos directamente de los servidores DNS del ESNIC (el departamento encargado de la gestión del Registro de nombres de dominio) referentes a la franja horaria de 15:15 a 17:12 horas, se vieron afectadas el 15,22% de las peticiones de acceso recibidas en el Registro de dominios ‘.es’ en ese día. ¿Funcionó el correo electrónico durante la interrupción del servicio? El correo electrónico se vio afectado en igual medida que otros servicios de Internet (mensajería instantánea, acceso a páginas webs, etc). Muchos usuarios no notaron en absoluto el incidente, dado que sus servidores de correo mantienen una copia local del fichero de direcciones DNS y por tanto enviaron correos con normalidad. Otros servidores sin dicha copia local no podrían realizar la entrega de correos. En este caso, los servidores de correo por norma general almacenan el correo y lo reintentan más tarde de forma automática, o bien notifican a sus usuarios la imposibilidad del envío. Qué medidas de prevención de riesgos existían en el ESNIC? El ESNIC es un servicio con supervisión permanente los siete días de la semana durante 24 horas (7x24) y cuenta con un protocolo de Gestión de Incidentes que contempla todos los aspectos de mantenimiento proactivo, preventivo y reactivo del servicio. El sistema opera sobre una metodología de actualización de software que contempla la realización de pruebas sobre tres entornos de comprobación distintos, cada uno de ellos cada vez más cercano a la fase de producción real del servicio. ¿Existe un plan de resolución de problemas ante contingencias como esta? Sí, el procedimiento de Gestión de Incidentes establece, primero, la identificación del origen del problema –en este caso concreto la confirmación de si existía un problema de hardware y/o de software y/o de comunicaciones. Una vez correctamente identificado el problema, este se resuelve de la manera más rápida y segura posible, de acuerdo a los procedimientos preestablecidos En esta incidencia, las primeras investigaciones apuntaban a un posible fallo hardware de un equipo de comunicaciones. Tras corroborar el perfecto estado de toda la infraestructura hardware de comunicaciones del servicio y descartar este como causa del problema, se detectó la generación de un archivo dañado o corrupto en el último refresco automático del fichero de configuración de DNS. Se procedió entonces a su inmediata sustitución con la generación de uno nuevo, a partir del fichero de backup existente, al que hubo que añadir los cambios registrados desde su fecha de generación hasta el momento del incidente, para asegurar la no pérdida de ningún cambio de nombre de dominio generado o modificado en ese intervalo. Todo este proceso de análisis, detección, y corrección del problema llevó menos de dos horas. ¿No existía un sistema de backup o replicación del Registro que pudiera haber impedido el incidente? Sí, siempre existe un backup del fichero de configuración de DNS, precisamente éste que en el proceso de actualización se debe cambiar por el nuevo fichero con los cambios sufridos en las últimas ocho horas. Además, se guarda copia de los tres inmediatamente anteriores, por seguridad. Fue precisamente gracias a disponer de este fichero de backup que se pudo regenerar el fichero corrupto sin ninguna pérdida de datos y en un espacio de tiempo tan corto. ¿Se comunicó la incidencia y sus causas? Desde el inicio de la crisis tanto los usuarios, a través del Centro de Atención a Usuarios del Registro de nombres de dominio, como los medios de comunicación, a través de la Dirección de Comunicación, fueron informados puntualmente vía telefónica y por correo electrónico de todos los detalles técnicos y operativos en relación al incidente que se fueron conociendo. Paralelamente, se desarrolló una campaña informativa a través de las webs de Red.es y del ESNIC apoyada en recursos gráficos y de texto orientada a todos los públicos. Las primeras llamadas se recibieron en el CAU nada más producirse la incidencia. Las preguntas realizadas por los usuarios se trasladaron a los técnicos encargados de la resolución de la misma a fin de poder facilitar una explicación completa y exhaustiva. Al mismo tiempo, la Dirección de Comunicación era informada de la evolución del proceso de resolución y preparaba una repuesta para los medios de comunicación que empezaron a requeriir información a partir de las 17 horas, aproximadamente. Cuando, se conocieron las primeras causas, Red.es difundió una nota a través de correo electrónico a los medios. Posteriormente, una vez conocidos los detalles de la incidencia y, sobre todo, sus causas, se difundió a través de correo electrónico y de las páginas web del ESNIC y de Red.es una infografía e información en forma de texto con los detalles conocidos. Los gráficos y el texto han sido reproducidos para los lectores por varios medios de comunicación en sus versiones digitales y en papel . ¿Por qué se tomó la decisión de realizar la intervención técnica a las 15 horas? No se realizó ningún tipo de intervención extraordinaria a las 15:00, sino que se activó de forma automática por el sistema el proceso que diariamente se ejecuta a esas horas y que dio como resultado un fichero de configuración de DNS corrupto. El procedimiento de Gestión de Incidentes permite que el personal de la Entidad detecte una anomalía a las 15:15h, poniendo en marcha el protocolo de Gestión de Incidentes. ¿Fue posible acceder a otras direcciones fuera del ‘.es’ durante el incidente? Sí, no hubo ningún problema. Para más información: es-nic@nic.es Difundido el: 31 de Agosto de 2006 Publicado el: 1 de Septiembre de 2006 15:09 Actualizado el: 19 de Agosto de 2011 17:43 Ubicación: Madrid, Provincia de Madrid, Comunidad de Madrid (España) Fuente: Red.es Página web: Marca: Red.es Vía: vía noticias.info A través de: A través de (antiguo nombre): Noticias.info Tipo: Noticia Palabras clave: ¡Integra esta noticia en tu web!
Cambia los colores, tamaños, estilos, secciones,... | carga tu personalización [?]
Integrar noticia [?] Si no deseas personalizar el widget puedes copiar y pegar el siguiente fragmento de código en tu página web, entre las balizas <body> y </body> y aparecerá al instante. vista previa | mi cuenta [?]Para generar un código de citación debes seleccionar previamente la parte del texto que quieres citar y, a continuación, hacer clic en el botón "Generar ..." correspondiente RSS [?] flujos de noticias gratis Enlace [?] a esta noticia Últimas noticias de Red.es |
|