[technique] Incident et intervention prévu sur le cluster VM

manu chez Z emmanuel.courcelle at zaclys.net
Jeu 28 Jan 19:46:11 CET 2021


Le 28/01/2021 à 18:49, Aymeric via technique a écrit :
>
> Oui il y'avait 4 vms sur g5 qu'on a relancé ailleurs.
>
> Le passage à libvirt n'empêche pas ça effectivement, pour le coup on 
> avait espoir de revoir g5 en vie sans avoir besoin de recupérer les 
> infos des vm des sauvegardes.
>
> Bref g5 est mort, vive g20 ;)
>
> Pour la suite :
>
> L'intervention de Matthieu a permis de remplacer quelques disques HS, 
> pas tous malheureusement.
>
> Nous allons remettre le cluster ceph en état de fonctionner, il est 
> actuellement en erreur suite a la perte de trop de disques (et donc 
> les VM peuvent avoir des erreurs ou lenteur d’accès disques).
>
> Aymeric.
>
> On 28/01/2021 17:42, Baptiste Jonglez wrote:
>> Hello,
>>
>> On 26-01-21, Aymeric via technique wrote:
>>
>>> Un incident est en cours sur le cluster de VM : nous avons perdu une
>>> machine g5.
>>>
>>> Une personne de l’association passe demain, mercredi, à TLS00 pour
>>> regarder le soucis sur g5, nous aviserons en fonction pour relancer les
>>> VMs ailleurs.
>> Merci pour l'intervention.
>>
>> La VM cfarm n'est pas joignable, j'imagine qu'il y a eu un souci lors de
>> l'intervention ?
>>
>> Est-ce que c'est possible de relancer la VM sur un autre hyperviseur ?
>> A priori le passage à libvirt n'empêche pas ça vu que le stockage est toujours du Ceph ?
>>
>> Merci,
>> Baptiste
> -- 
> Aymeric
>
> _______________________________________________
> technique mailing list
> technique at lists.tetaneutral.net
> http://lists.tetaneutral.net/listinfo/technique

Bonjour Tetaneutral.

Un très grand merci pour l'intervention d'hier de la part du PIC: notre 
cloud était très très lent mardi soir et mercredi, depuis ce matin il 
est revenu à la normale. Ci-dessous un petit graphique de nos outils de 
supervision, quand c'est jaune le processeur se tourne les pouces 
(idle), quand c'est bleu foncé pareil, sauf qu'il est en attente d'I/O 
(iowait)... et les utilisateurs aussi.

Emmanuel

CPU usage




-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20210128/8f927c16/attachment.htm>


Plus d'informations sur la liste de diffusion technique