[technique] Supervision TL-SG3424
Mehdi Abaakouk
sileht at sileht.net
Lun 31 Mar 11:07:48 CEST 2014
Bonjour,
J'ai récemment ajouté la supervision des nouveaux switch tp-link
(SG3424) dans checkmk et au bout de quelque jours nous avions des
timeout sur les checks snmp de ces switchs.
Le problème était que le temps d'un check snmp sur ces switchs prenait
de 1 à plus de 2 minutes, le timeout de checkmk étant réglé à 2 minutes,
ça marchait pas bien.
Après quelque investigation, j'ai découvert que par défaut checkmk
utilisé snmpv1 pour effectuer ces checks.
Ce qui est parfait pour nos onduleurs et les nanostation qui ne
supportent que cette version.
Mais ces switchs supportent le snmp v2c et v3, j'ai donc activé dans
checkmk snmp v2c pour utiliser snmpbulkwalk au lieu de snmpwalk.
Quelque chiffres pour la récupération du status, vitesse de port,
packets in/out/err pour 24 ports.
snmpwalk + v1: > 2 mins
snmpwalk + v2c: > 2 mins
snmpbulkwalk + v2c: > 14 secs
snmpbulkwalk permet de récupérer toutes les métriques demandées en une
seule transaction snmp contre une transaction par métrique pour
snmpwalk, vu le nombre de metriques de ces switchs...
Exemple de conf pour activer le bulkwalk snmp pour tous nos switchs:
bulkwalk_hosts += [
( [ "switch" ], ALL_HOSTS ),
]
all_hosts = [
...
's5|infra|switch|snmp|noipv6',
's6|infra|switch|snmp|noipv6',
's7|infra|switch|snmp|noipv6',
...
]
(ce qui signifie en langage checkmk, bulkwalk snmp pour tous les
machines qui ont le tag switch, les 3 switchs ayant les tags infra,
switch, snmp, noipv6)
La configuration complète de notre checkmk est ici:
http://git.tetaneutral.net/nagios.git/tree/main.mk
A+
--
Mehdi Abaakouk
mail: sileht at sileht.net
irc: sileht
Plus d'informations sur la liste de diffusion technique