[technique] Supervision TL-SG3424

Mehdi Abaakouk sileht at sileht.net
Lun 31 Mar 11:07:48 CEST 2014


Bonjour,

J'ai récemment ajouté la supervision des nouveaux switch tp-link 
(SG3424) dans checkmk et au bout de quelque jours nous avions des 
timeout sur les checks snmp de ces switchs.

Le problème était que le temps d'un check snmp sur ces switchs prenait 
de 1 à plus de 2 minutes, le timeout de checkmk étant réglé à 2 minutes, 
ça marchait pas bien.
Après quelque investigation, j'ai découvert que par défaut checkmk 
utilisé snmpv1 pour effectuer ces checks.
Ce qui est parfait pour nos onduleurs et les nanostation qui ne 
supportent que cette version.

Mais ces switchs supportent le snmp v2c et v3, j'ai donc activé dans 
checkmk snmp v2c pour utiliser snmpbulkwalk au lieu de snmpwalk.

Quelque chiffres pour la récupération du status, vitesse de port, 
packets in/out/err pour 24 ports.

snmpwalk + v1: > 2 mins
snmpwalk + v2c: > 2 mins
snmpbulkwalk + v2c: > 14 secs

snmpbulkwalk permet de récupérer toutes les métriques demandées en une 
seule transaction snmp contre une transaction par métrique pour 
snmpwalk, vu le nombre de metriques de ces switchs...

Exemple de conf pour activer le bulkwalk snmp pour tous nos switchs:

bulkwalk_hosts += [
   ( [ "switch" ], ALL_HOSTS ),
]

all_hosts = [
   ...
   's5|infra|switch|snmp|noipv6',
   's6|infra|switch|snmp|noipv6',
   's7|infra|switch|snmp|noipv6',
   ...
]

(ce qui signifie en langage checkmk, bulkwalk snmp pour tous les 
machines qui ont le tag switch, les 3 switchs ayant les tags infra, 
switch, snmp, noipv6)

La configuration complète de notre checkmk est ici: 
http://git.tetaneutral.net/nagios.git/tree/main.mk

A+
-- 
Mehdi Abaakouk
mail: sileht at sileht.net
irc: sileht




Plus d'informations sur la liste de diffusion technique