Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Tomemos, por ejemplo, dos métricas, el tiempo de respuesta y el número de ruta (el número de rutas en la tabla de enrutamiento), puede ver en los gráficos a continuación que el tiempo de respuesta es más caótico con algún patrón pero realmente poca estabilidad en la métrica, mientras que la ruta La ultima métrica numérica es sólidaconstante, inquebrantablesin cambios caóticos.


Comparando métricas consigo mismas

Esta albóndiga de enrutador Este router "meatball" es un enrutador de oficina pequeña, con poca variación en el enrutamiento, sin embargo, un enrutador de distribución WAN sería generalmente estable, pero tendría un poco más de variabilidad. ¿Cómo podría obtener una alarma de cualquiera de estos sin configurar algunos umbrales estáticos complejos?

...

La configuración de la línea de base delta permite definir el nivel del evento en función del porcentaje de cambio, para los valores predeterminados, esto daría como resultado un Mayor, puede ver la configuración en el ejemplo a continuación, esta tabla es cómo visualizar la configuración.

Cambio %

Nivel de evento resultante

10Advertencia
20Menor
30Importante
40Crítico
50Fatal

Si el cambio es inferior al 10% el nivel será normal, entre el 10% y el 20% Menor, por lo que hasta más del 50% se considerará fatal. 

...

Copie el archivo en el servidor y haga lo siguiente, la actualización será el mismo proceso.

tar xvf Baseline-X.Y.tgz
cd Baseline/
sudo ./install_baseline.sh

Trabajar con la herramienta Dynamic Baseline and Thresholding

...

La configuración de la herramienta de línea base se realiza en el archivo /usr/local/omk/conf/Baseline.nmis, la configuración predeterminada debe instalarse cuando se instala la herramienta.

Opción de configuración

Descripción

Ejemplo

baseQué tipo de línea de base estamos usando, "dinámica" o "delta", el valor predeterminado es dinámico, si no está definido, se usará dinámico.delta
activo¿Está activa o no la línea base de esta métrica? Los valores son verdaderos o falsos.cierto
métricoQué punto o variable de datos NMIS equivale a un RRD DSRouteNumber
escribeQué sección o métrica del modelo NMISRouteNumber
use_indexPara usar con ciertos tipos donde el tipo no es cómo se almacena el índice, por ejemplo, el índice para pkts_hc es interfaz, entonces cuando type = pkts_hc entonces use_index = interfaz. Una opción poco utilizada.interfaz (cuando corresponda)
sección¿Cuál es el nombre de la sección en la información del nodo? Simplemente ejecútelo, de lo contrario, la sección debe existir.
nodeModelEsta es una expresión regular que define qué modelos NMIS deben coincidirCiscoRouter
eventoEl nombre del evento que se utilizará se establecerá de forma predeterminada en la métrica de tipo de línea de base proactiva si no se proporciona ninguna.Cambio proactivo del número de ruta
indexado¿Esta variable está indexada o no?falso
umbral_excedeSe ignora si no está definido; de lo contrario, el valor TAMBIÉN debe exceder este umbral para generar un evento.indef
umbral_periodo¿Cuántos minutos se debe promediar el valor de referencia, por ejemplo, -5 minutos es la última encuesta, -15 minutos sería el promedio de los últimos 15 minutos, -1 hora serían los últimos 60 minutos.-5 minutos
multiplicadorCuántas desviaciones estándar variar la línea de base.1
semanasLa cantidad de semanas para mirar hacia atrás0
horasLa cantidad de horas que se incluirán en las métricas de referencia.8
nivelesLa sección de niveles es utilizada por el método de línea base delta para definir cuándo una cantidad de cambio desencadenará un evento y en qué nivel será ese evento.

Ejemplo de configuración de línea base dinámica el mismo día

Así es como se vería el archivo de configuración, este ejemplo es una línea de base del mismo día:

'RouteNumber' => {
  'active' => 'true',
  'metric' => 'RouteNumber',
  'type' => 'RouteNumber',
  'nodeModel' => 'CiscoRouter',
  'event' => 'Proactive Route Number Change',
  'indexed' => 'false',
  'threshold_exceeds' => undef,
  'threshold_period' => "-5 minutes",
  'multiplier' => 1,
  'weeks' => 0,
  'hours' => 8,
},

Ejemplo de configuración de línea base dinámica de varios días

Otra opción de configuración que utiliza los prefijos BGP que se intercambian con los pares BGP es del modelado systemHealth y esta es una línea de base de varios días:

'cbgpAcceptedPrefix' => {
  'active' => 'true',
  'metric' => 'cbgpAcceptedPrefix',
  'type' => 'bgpPrefix',
  'section' => 'bgpPrefix',
  'nodeModel' => 'CircuitMonitor|CiscoRouter',
  'event' => 'Proactive BGP Peer Prefix Change',
  'indexed' => 'true',
  'multiplier' => 1,
  'weeks' => 4,
  'hours' => 1,
},

Ejemplo de configuración de línea base delta

Actualmente, las líneas base delta no admiten varios días, pero el valor de las horas puede ser muy grande si es necesario.

'hrSystemProcesses' => {
  'baseline' => 'delta',
  'active' => 'true',
  'metric' => 'hrSystemProcesses',
  'type' => 'Host_Health',
  'nodeModel' => 'net-snmp',
  'indexed' => 'false',
  'hours' => 4,
  'threshold_period' => "-15 minutes",
  'levels' => {
    'Warning' => 10,
    'Minor' => 20,
    'Major' => 30,
    'Critical' => 40,
    'Fatal' => 50
  }
},

Ejemplo de configuración de Delta base para paquetes de salida descartados

Actualmente, las líneas base delta no admiten varios días, pero el valor de las horas puede ser muy grande si es necesario.

'ifOutDiscards' => {
  'baseline' => 'delta',
  'active' => 'true',
  'metric' => 'ifOutDiscards',
  'type' => 'pkts_hc',
  'use_index' => 'interface',
  'nodeModel' => 'CiscoRouter',
  'event' => 'Proactive Output Discards (Delta)',
  'indexed' => 'true',
  'hours' => 1,
  'threshold_period' => "-15 minutes",
  'levels' => {
    'Warning' => 1,
    'Minor' => 2,
    'Major' => 3,
    'Critical' => 4,
    'Fatal' => 7
  }
},

Ejecución de la herramienta de línea de base

Una vez instalada, la herramienta se ejecutará desde cron automáticamente, puede ejecutarla de forma interactiva con el siguiente comando:

/usr/local/omk/bin/baseline.pl act=run

Hay algunas opciones de depuración para ver un poco más de detalle, debug = true, debug = 2 o debug = 3 son los niveles actuales de verbosidad.

...

Ejecutando para un par de nodos usando expresiones regulares.

/usr/local/omk/bin/baseline.exe act=run node_regex="router1|server2"

Corriendo para un par de grupos usando expresiones regulares.

/usr/local/omk/bin/baseline.exe act=run group_regex="HQ|Data Center|West Coast"

Procesamiento automático usando Cron

La herramienta de línea de base debería haber creado una configuración cron.d /etc/cron.d/baseline, que contendrá lo siguiente.

#
# this cron schedule runs the baseline system every 5 minutes.
#
#
# if you DON'T want any NMIS cron mails to go to root,
# uncomment and adjust the next line
#MAILTO=prefered@domain.com
#
# m h dom month dow user command
#
# run the baseline every 5 minutes starting at 4 minutes offset from the hour.
4-59/5 * * * * root /usr/local/omk/bin/baseline.exe act=run > /usr/local/omk/log/baseline.log 2>&1

Uso de Group Regex y Cron para procesamiento paralelo.

La opción de expresiones regulares grupales se puede utilizar para proporcionar procesamiento paralelo si la herramienta de línea de base tarda más de 5 minutos en ejecutarse. Un ejemplo simple sería utilizar la herramienta de referencia para todos los dispositivos centrales y de distribución en una ejecución de procesamiento y una segunda para todos los dispositivos de acceso.

# run the baseline every 5 minutes starting at 3 and 4 minutes offset from the hour.
3-58/5 * * * * root /usr/local/omk/bin/baseline.exe act=run group_regex="Core|Dist" > /usr/local/omk/log/baseline1.log 2>&1
4-59/5 * * * * root /usr/local/omk/bin/baseline.exe act=run group_regex="Access" > /usr/local/omk/log/baseline2.log 2>&1