Desde siempre tuve problemas con los sistemas de monitoreo de redes o los NPM (Network Performance Monitor, por sus siglas en inglés). Pero, son un mal necesario para saber qué está disponible en la red y qué no lo está. Muchos de ellos hoy tienen notificaciones y alarmas anidadas, correlación de eventos e integran también monitoreo de servidores y aplicaciones.
La industria hace unos años se enfocó en las aplicaciones. Métricas y análitica de la utilización que hacen los usuarios de estas Apps, algunos de estos sistemas de Application Performance Management (APM) con mucha profundidad. Por ejemplo dando pistas como en qué parte del path entre usuario e infraestructura se tienen los retardos, cuellos de botella o indisponibilidad.
Es cuestión de perspectiva…
Las herramientas de monitoreo de red testean la red desde el Datacenter hasta los dispositivos de acceso de usuarios (switches/access-points) con mecanismos de semáforo: rojo para no disponible, amarillo para posiblemente no disponible y verde para “sin novedad”. Del mismo modo miden la disponibilidad de los servidores críticos, normalmente usando ICMP esperando la respuesta de los SOs. Estando al lado de manera figurativa del servidor que monitorea.
¿No debería ser al revés?
Monitoreamos el Datacenter, desde el Datacenter. Monitoreamos el Cloud desde el Cloud.
Si pudiéramos pararnos desde la perspectiva del usuario interno/externo y analizamos el viaje de los paquetes desde su dispositivo al servidor o servicio cloud. Si miramos el esfuerzo de ese tráfico tramo por tramo podemos detectar retardo, ancho de banda insuficiente, jitter, pérdida de paquetes, cambio de ruta, etc. En principio, estamos monitoreando la red y todos su componentes, pero desde el punto de vista del usuario ¿alguien dijo customer experience?, entregándome también información útil tanto para resolución de problemas como para la toma de decisiones respecto a la infraestructura, proveedores, configuraciones, etc.
Por último, si podemos hacer esto lo más cercano a los usuarios multiplicado por N, que puede correr como microservicios en dispositivos de red ¿edge?, tanto para servicios internos de la red como servicios publicados en internet. Y a diferencia de un NPM no se queda solo en un ping sino que escala en el modelo OSI hasta la capa de aplicación, pudiendo hacer una transacción HTTP. Dándome resultados capa por capa.
Todo esto lo hace ThousandEyes, comprada recientemente por Cisco. La primera de una serie de soluciones que estoy analizando para el blog en la categoría #InfraReviews.
!Abrazo!
Comments