Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

  • Las métricas son importantes para el servidor, NMIS utiliza la accesibilidad, la disponibilidad y el estado para representar la red. 
  • La accesibilidad es la capacidad de ping del dispositivo,

  • La disponibilidad es (en el contexto del equipo de red) las interfaces que deberían estar activas, Up o Down, por ejemplo, las interfaces que este e el estado "no se apaganshutdown" (ifAdminStatus = up) deberían  deberían estar activas, por lo que un dispositivo con 10 interfaces de ifAdminStatus=up y ifOperStatus=up para 9 interfaces, el dispositivo estaría disponible en un 90%.


  • La salud es una métrica, formada por muchas cosas según el dispositivo, el enrutador, CPU y la memoria. Algo interesante aquí es que parte del estado se compone de un uso inverso de la interfaz, por lo que una interfaz que  Una interfaz que no tiene uso tendrá un componente de alto estado, una interfaz que se utilice mucho reducirá esa métrica. Entonces Entonces, la salud es un reflejo de la carga en el dispositivo y será muy dinámica.


  • La métrica general de un dispositivo es una métrica adjunta formada por valores ponderados de las otras métricas que se recopilan. La fórmula para esto es configurable, por  por lo que puede tener un peso de Alcance más alto de lo que es actualmente, o más bajo, de según su elección.


Para obtener más referencias,  consulte Métricas, accesibilidad, disponibilidad y estado de NMIS

...

  1. Prueba de ping,  la herramienta de ping se utiliza para probar si un host en particular es alcanzable a través de una red IP. Un ping mide el tiempo que tardan los paquetes en enviarse desde el host local a una computadora de destino y viceversa. 

    Code Block
    ping x.x.x.x #add the ip address you need to reach


  2. Traceroute , es una herramienta de diagnóstico de red que se utiliza para rastrear en tiempo real la ruta tomada por un paquete en una red IP desde el origen hasta el destino, informando las direcciones IP de todos los enrutadores entre los que hizo ping.

    Code Block
    traceroute x.x.x.x  #add the ip address you need to reach


  3. MTR, Mtr (my traceroute) es una herramienta de diagnóstico de red de línea de comandos que proporciona la funcionalidad de ping y traceroute.

    NOTA: instalar esta herramienta porque no viene por defecto. Instalar la herramienta en el caso de no tenerla.

    Code Block
    sudo apt install mtr
    sudo mtr -r 8.8.8.8
    
        [sample results below]
    
        HOST: endor                       Loss%   Snt   Last   Avg  Best  Wrst StDev
         1. 69.28.84.2                    0.0%    10    0.4   0.4   0.3   0.6   0.1
         2. 38.104.37.141                 0.0%    10    1.2   1.4   1.0   3.2   0.7
         3. te0-3-1-1.rcr21.dfw02.atlas.  0.0%    10    0.8   0.9   0.8   1.0   0.1
         4. be2285.ccr21.dfw01.atlas.cog  0.0%    10    1.1   1.1   0.9   1.4   0.1
         5. be2432.ccr21.mci01.atlas.cog  0.0%    10   10.8  11.1  10.8  11.5   0.2
         6. be2156.ccr41.ord01.atlas.cog  0.0%    10   22.9  23.1  22.9  23.3   0.1
         7. be2765.ccr41.ord03.atlas.cog  0.0%    10   22.8  22.9  22.8  23.1   0.1
         8. 38.88.204.78                  0.0%    10   22.9  23.0  22.8  23.9   0.4
         9. 209.85.143.186                0.0%    10   22.7  23.7  22.7  31.7   2.8
        10. 72.14.238.89                  0.0%    10   23.0  23.9  22.9  32.0   2.9
        11. 216.239.47.103                0.0%    10   50.4  61.9  50.4  92.0  11.9
        12. 216.239.46.191                0.0%    10   32.7  32.7  32.7  32.8   0.1
        13. ???                          100.0    10    0.0   0.0   0.0   0.0   0.0
        14. google-public-dns-a.google.c  0.0%    10   32.7  32.7  32.7  32.8   0.0


  4. snmpwalk,  es una aplicación de Protocolo simple de administración de red (SNMP) presente en la CLI del Sistema de administración de seguridad (SMS) que utiliza solicitudes SNMP GETNEXT para consultar información en un dispositivo de red. Se puede proporcionar un identificador de objeto (OID) en la línea de comando.


    Code Block
    The following example CLI command will return the IPS temperature information:
    
    Command:snmpwalk -v 2c -c tinapc <IP address> 1.3.6.1.4.1.10734.3.5.2.5.5
    
    Command Explanation:
    
    In this case the CLI command breaks down as following;
    
    snmpwalk                             = SNMP application
    -v 2c                                     = specifies what SNMP version to use (1, 2c, 3)
    -c tinapc                               = specifies the community string. Note: The IPS has the SNMP read-only community string of "tinapc"
    <IP address>                       = specifies the IP address of the IPS device
    1.3.6.1.4.1.10734.3.5.2.5.5 = OID parameter for the IPS temperature information
    
    Results:
    
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.1.0 = INTEGER: 27
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.2.0 = INTEGER: 50
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.3.0 = INTEGER: 55
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.4.0 = INTEGER: 0
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.5.0 = INTEGER: 85
    
    Results Explanation:
    
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.1.0 = INTEGER: 27 = The chassis temperature (27° Celsius / 80.6° Fahrenheit)
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.2.0 = INTEGER: 50 = The major threshold value for chassis temperature (50° Celsius / 122° Fahrenheit)
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.3.0 = INTEGER: 55 = The critical threshold value of chassis temperature (55° Celsius / 131° Fahrenheit)
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.4.0 = INTEGER: 0   = The minimum value of the chassis temperature range ( 0° Celsius / 32° Fahrenheit)
    SNMPv2-SMI::enterprises.10734.3.5.2.5.5.5.0 = INTEGER: 85 = The maximum value of the chassis temperature range (85° Celsius / 185° Fahrenheit)


    Es importante ver que se pueda hacer ping a un dispositivo, que no tenga latencia o pérdida de paquetes y que se recopilen los datos SNMP.

...

Esta sección es crucial para identificar o resolver problemas de dispositivos, debe revisar algunas consideraciones según la cantidad de nodos que se administranadministrará, la cantidad de usuarios que acceden accederán a la GUI, ¿con qué frecuencia deben actualizarse sus datos?   Si se requieren actualizaciones cada 5 minutos, entonces necesitará deberá tener el hardware adecuado para poder cumplir con estos requisitos, también los recursos requisitos del sistema operativo deben estar bien definidos, una buena regla general es reservar 1 GB de RAM para el sistema operativo de forma predeterminada , Unidades de alta velocidad para los datos (SAN SSD es ideal) con con almacenamiento separado para la base de datos mongo y los archivos temporales. Normalmente en un ambiente se recomienda el uso de En cualquier lugar entre 4-8 núcleos para tener un buen rendimiento y entre con un procesador (es) de alto rendimiento, 16-64 GB de RAM deberían funcionar bien para más de 1k nodos.

Usando el comando top / htop

...

  • hora actual (12:50:01)
  • tiempo de actividad de la máquina (hasta 62 días, 22:56)
  • sesiones de usuarios conectados (5 usuarios)
  • carga promedio en el sistema (promedio de carga: 4.76, 8.03, 4.34) los 3 valores se refieren al último minuto, cinco minutos y 15 minutos ####### Esto no es bueno para el gerente si tenemos valores altos

2. Segunda fila: tarea

...

  • Procesos totales en ejecución (412 en total)
  • Procesos en ejecución (1 en ejecución)
  • Procesos de dormir (411 durmiendo)
  • Procesos detenidos (0 detenidos)
  • Procesos que esperan ser detenidos desde el proceso principal (15 zombis) ####### Esto no es bueno para el gerenteestado del server.
    Proceso Zombie: Un proceso que ha completado la ejecución, pero todavía tiene una entrada en la tabla de procesos. Esta entrada aún necesita permitir que el proceso padre lea su estado de salida secundario.

...

Code Block
Cpu(s):  6.8%us,  3.8%sy,  0.2%ni, 74.4%id, 28.2%wa,  0.1%hi,  0.5%si,  0.0%st

...

  • Procesos de usuario de CPU en porcentaje (6,8%

...

  • us)
  • Procesos del sistema de CPU en porcentaje (3.8% sy)
  • Mejora de prioridad
  •  
  • agradable
  •   de
  • de CPU en porcentaje (0.2% ni)
  •  
  • Porcentaje de la CPU no utilizada (74,4% id)
  • Procesos en espera de operaciones de E / S de la CPU en porcentaje (28
  • .
  • ,2% wa) ####### Esto no es bueno para el rendimiento del servidor.
  • Sirviendo interrupciones de hardware de la CPU en porcentaje (0.1% hi - Hardware IRQ
  • Porcentaje de interrupciones de software de servicio de la CPU (0.0% si - Interrupciones de software

La cantidad de CPU "stolen" de esta máquina virtual por el hipervisor para otras tareas (como ejecutar otra máquina virtual) será 0 en el escritorio y el servidor sin la máquina virtual. (0.0% st - Steal Time)

4. Memoria

Estas filas le proporcionarán la información sobre el uso de RAM. Muestra la memoria total en uso, libre, búferes almacenados en caché.

...

Para decirle al servidor, cómo administrar los dispositivos configurados, necesitamos validar que todos los elementos de configuración estén bien configurados, puede ver el rendimiento del servidor mientras recopila información yendo a la sección, sistema> Diagnóstico del host> Gráfico de tiempo de ejecución NMIS

Si el tiempo total de ejecución / recopilación es demasiado alto, debemos ajustar los parámetros de recopilación según la versión del administrador que esté utilizando.

...

La configuración cron se puede encontrar en /etc/crond.d/nmis

Para una recopilación o actualización, el subproceso principal está configurado de forma predeterminada para bifurcar los procesos de trabajo para realizar las operaciones solicitadas utilizando subprocesos y mejorando el rendimiento. Una de cada operación se ejecutará cada minuto (de forma predeterminada) y procesará tantos nodos como el ciclo de recopilación de sondeo esté configurado para procesar. 

...