Herramientas de Monitoreo
Objetivos: Las herramientas de monitoreo cumplen objetivos generales como: ✔ Alertar sobre problemas inminentes o actuales. ✔ Tener una visión centralizada de los equipos, servicios, software, hardware, versiones. ✔ Tener datos históricos de uso de recursos. ✔ Mostrar gráficos, reportes, resúmenes que ayudan a sintetizar la información.
● Prevenir posible problemas futuros relacionados con falta de recursos por aumento de carga o uso. ● Resolver problemas inminentes con avisos y alertas pertinentes antes que el problema sea alertado por los usuarios finales. ● Estimar presupuestos para adquisiciones de software/hardware brindando datos históricos para sustentar la inversión. ● Realizar mejoras y optimizaciones en el uso de los recursos. ● Prevenir fallas de seguridad. ● Reforzar los puntos débiles de la infraestructura, ya sea hardware, software o servicios. La naturaleza del monitoreo es preventiva y sus objetivos permiten a los administradores de sistemas realizar tareas como:
Qué se puede debe monitorear? Recursos Desempeño Procesos
top ● Provee una vista dinámica y en tiempo real de un sistema corriendo, ej., actividad de los procesos ● Por default, despliega las tareas mas intensivas en cuanto a uso de CPU y se actualiza cada 5 segundos – t Enciende/apaga la información de resumen – m Enciende/apaga la información de memoria – A Ordena la lista por mayores consumidores – f Accede a la pantalla de configuración interactiva. Util para monitorear tareas específicas – o Permite seleccionar interactivamente el ordenamiento dentro de top – r Emite el comando renice – k Emite el comando kill – z Enciende/apaga color/mono
vmstat ● El comando vmstat reporta información sobre procesos, memoria, paginación, bloques IO, traps y actividad del CPU $ vmstat - 3 Desplegar el uso de memoria de slabinfo Obtener información sobre páginas de memoria activas / inactivas $ vmstat - m $ vmstat - a
who ● Despliega información sobre los usuarios actualmente conectados y sus procesos $ who $ w $ w usuario
uptime ● El comando uptime puede ser usado para ver cuanto tiempo lleva el servidor corriendo.El tiempo actual, cuanto lleva corriendo el sistema, cuantos usuarios están actualmente conectados y las cargas promedio del sistema para los últimos 1, 5, y 15 minutos $ uptime
who ● Despliega información sobre los usuarios actualmente conectados y sus procesos $ who $ w $ w usuario
uptime ● El comando uptime puede ser usado para ver cuanto tiempo lleva el servidor corriendo.El tiempo actual, cuanto lleva corriendo el sistema, cuantos usuarios están actualmente conectados y las cargas promedio del sistema para los últimos 1, 5, y 15 minutos $ uptime
ps ● Reporta un snapshot de los procesos actuales del sistema $ ps $ ps -A $ ps -Al $ ps aux $ pstree $ ps -U someuser -u someuser u $ ps -C lighttpd -o pid= $ ps -p o comm= $ ps -auxf | sort -nr -k 4 | head - 10
free ● Despliega la cantidad total de memoria física y swap, tanto libre como utilizada en el sistema, así como los buffers utilizados por el kernel $ free
iostat ● Reporta estadísitcas del CPU y estadísitcas de Entrada/Salida para dispositivos, particiones y NFS. $ iostat
sar ● Se utiliza para recolectar, reportar, y guardar información sobre actividad del sistema. $ sar 4 5
mpstat ● Despliega las actividades por cada procesador disponible, siendo el procesador 0 el primero. Para desplegar el promedio de utilización de CPU por procesador $ mpstat -P ALL
pmap ● Reporta el mapa de memoria de un proceso. Este comando se utiliza para encontrar las causas de cuellos de botella en la memoria. Para desplegar la información de memoria de proceso para el pid # 47394: $ pmap -d $ pmap -d PID
Networking
ss ● Es utilizado para vaciar estadísticas de sockets. Permite mostrar información similar a netstat, pero puede mostrar mas información de estado y de TCP que otras herramientas. SS puede mostrar información sobre – Todos los sockets TCP. – Todos los sockets UDP – Todas las conexiones establecidas de ssh / ftp / http / https – Todos los procesos locales conectados a X server – Todos los sockets tcp en estado FIN-WAIT-1 y mas
$ ss -s $ ss -l $ ss -t -a $ ss -x src /tmp/.X11- unix/* Listar los actuales sockets TCP establecidos, cerrados, huerfanos y esperando Mostrar todos los puertos de red abiertos Mostrar todos los sockets TCP Listar todos los procesos locales conectados al X server
iptraf ● Es un monitor de LAN interactivo y colorido. Está basado en ncurses y genera varias estadísticas de red incluyendo información de TCP, conteos de UDP, información de ICMP y OSPF, información de cargas Ethernet, node stats, errores de checksum de IP y otras – Estadísticas de tráfico de red por conexión TCP – Estadísitcas de tráfico IP por interfase de red – Estadísticas de tráfico de red por protocolo – Estadísticas de tráfico de red por puerto TCP/UDP y por tamaño de paquete – Estadísticas de tráfico de red por por dirección Layer2
tcpdump ● Es un comando simple que vacía el tráfico en una red. Sin embargo se requiere un buen conocimiento del protocol TCP/IP para utilizar esta herramienta. # tcpdump -i eth1 'udp port 53' Mostrar el tráfico de DNS Listar todos los paquetes IPv4 HTTP hacia y desde el puerto 80 # tcpdump 'tcp port 80 and (((ip[2:2] - ((ip[0]&0xf) >2)) != 0)' Desplegar todas las sesiones HTTP a # tcpdump -ni eth0 'dst and tcp and port http'
file system /proc ● /proc provee información detallada acerca de varios dispositivos de hardware y otra información del kernel Linux. # cat /proc/cpuinfo # cat /proc/meminfo # cat /proc/zoneinfo # cat /proc/mounts Algunos ejemplos comunes de /proc
KDE System Guard - Ksysguard KSysguard es una aplicación habilitada para red para monitoreo de sistemas y tareas para el ambiente de escritorio KDE. ● Puede correr sobre una sesión SSH ● Arquitectura cliente/servidor que permite monitorear host locales y remotos ● El front-end gráfico usa sensores para obtener la información que despliega ● Un sensor puede regresar un solo valor o información mas compleja como tablas ● Para cada tipo de información ofrece uno o mas displays
Gnome system monitor Permite desplegar información básica del sistema y monitorear procesos del sistema, uso de recursos y file systems
Nagios Es una herramienta que permite sensar el estado de aplicaciones mediante escaneo de puertos, ejecución de comandos o la ejecución de cualquier prueba que pueda determinar si un servicio está corriendo correctamente (peticiones http o consultas sql por ejemplo). El sensado puede ser de 3 tipos: Activo, el servidor inicia la prueba, por ejemplo el servidor solicita una página http. Remoto, el servidor inicia la prueba, pero esta se ejecuta un agente remoto. Por ejemplo ejecutar un comando remoto para saber cuantos procesos se están ejecutando en otro servidor. Pasivo: el servidor nagios recibe el estado de otro servidor, en este caso no inicia la prueba y no tiene control de la frecuencia de ejecución.