[technique] Incident et intervention prévu sur le cluster VM

Aymeric mulx at aplu.fr
Mar 26 Jan 20:04:35 CET 2021


Bonsoir,

Un incident est en cours sur le cluster de VM : nous avons perdu une
machine g5.

Le cluster ceph est donc dégradé. 

health: HEALTH_WARN
        Degraded data redundancy: 1558916/24757710 objects degraded
(6.297%), 428 pgs degraded, 428 pgs undersized
        319 slow ops, oldest one blocked for 159 sec, osd.26 has slow ops

Il n'y a que très peu de VM impacté directement par la panne sur g5,
puisqu’il n’y a que ces VMs qui sont concernées par la perte de
l’hyperviseur.

- grainsdart.tetaneutral.net.xml
- vm-test.tetaneutral.net.xml => vm utilisé pour une formation
- g6fog.tetaneutral.net.xml
- chiliproject.tetaneutral.net.xml
- cfarm.tetaneutral.net.xml

Une personne de l’association passe demain, mercredi, à TLS00 pour
regarder le soucis sur g5, nous aviserons en fonction pour relancer les
VMs ailleurs.

Aussi, une autre intervention est prévu jeudi après midi pour remplacer
les disques dur HS du cluster ceph sur d'autres machines.



-- 
Aymeric

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20210126/625f0238/attachment.htm>


Plus d'informations sur la liste de diffusion technique