[technique] Incident sur h1, reboot de 17 VM

Laurent GUERBY laurent at guerby.net
Dim 21 Oct 20:49:34 CEST 2012


Bonsoir,

A 19h22 ce dimanche 20121021 h1 a cessé
de répondre au ping.

A 20h une fois a Myrys j'ai découvert une MCE error sur la console :

http://guerby.org/images/20121021_001.jpg

J'ai eteint et rallumé électriquement h1, ganeti a ensuite relancé
automatiquement toutes les 17 VM impactées.

A surveiller.

http://en.wikipedia.org/wiki/Machine_Check_Exception

Sincèrement,

Laurent





Plus d'informations sur la liste de diffusion technique