[technique] Intervention sur le cluster de VM lundi 10/05 PM - risques de coupure

Emmanuel Thierry emmanuel.thierry at sekil.fr
Mer 12 Mai 11:53:23 CEST 2021


Bravo !!!

Emmanuel

> Le 12 mai 2021 à 11:52, Aymeric <mulx at aplu.fr> a écrit :
> 
> Bonjour,
> 
> La machine g3 est revenu ce matin dans le cluster ainsi que les disques associées.
> 
> Certains disques de g3 sont finalement resté dans g20 (ce qui génère le déplacement de quelques données). 
> Le cluster ceph est donc à nouveau ok (il termine de déplacer quelques données mais dans l'ensemble tout va bien). 
> Et avec le retour de g3 on a nouveau la capacité en terme de machine de supporter la perte ou l'interruption sur une autre machine du cluster (en ram ou sur le point de vue stockage). 
> Aymeric.
> On 11/05/2021 20:18, Emmanuel Thierry wrote:
>> Salut,
>> 
>> Merci pour ce topo et bravo pour le travail.
>> 
>> Est-ce que la perte d’une nouvelle machine ou de disques entrainerait le shutdown de la totalité du cluster ?
>> Est-ce que vous sauriez estimer le risque d’une telle défaillance ?
>> 
>> Je me permets de demander pour prendre mes dispositions, en particulier migrer temporairement mes services ou données les plus critiques (cad serveur mail) en cas de risque.
>> 
>> Merci !
>> Emmanuel
>> 
>>> Le 11 mai 2021 à 18:44, Aymeric via technique <technique at lists.tetaneutral.net <mailto:technique at lists.tetaneutral.net>> a écrit :
>>> 
>>> Bonjour,
>>> 
>>> L'intervention prévu lundi après midi était sur 2 machines : 
>>> Changement du ventilateur de l'hyperviseur g20 pour y mettre le bon modèle. L'opération c’est déroulé normalement. 
>>> Déplacement de la carte mère de g3 dans les nouveaux boitier 3U rackable (facilite la gestion des disques dans le cluster ceph, boitier hot-swap). 
>>> Ce déplacement ne c’est pas passé comme prévu.
>>> 
>>> Lundi soir g3 était toujours éteint, les bénévoles présent n'ont pas réussi a assembler l'alimentation. 
>>> Ce mardi matin on a re-pris l'intervention, une solution à base de scotch double face a été choisi (il manque des pièces dans ce que nous avions).. malheureusement il nous a été impossible de rallumer ensuite la machine g3, la carte mère refuse de s'allumer. 
>>> 
>>> Le cluster ceph est donc toujours en état dégradé. 
>>> On a utilisé des emplacements libres de g20 pour ajouter des disques de g3 dans le cluster mais les disques ne sont pas vraiment revenu en ligne, on attends l'avis des experts du sujet ceph pour essayer de les faire rentrer sans générer trop de recovery. 
>>> Pendant ce temps le boitier de g3 est chez un bénévole qui va essayer de regarder si il arrive a faire re-vivre la machine. 
>>> 
>>> Aucune VM n’a normalement été coupé ni impacté par nos manipulations. 
>>> Par contre, en l’état nous n’avons plus assez de machine en redondance pour palier à la perte d'une nouvelle machine. Si il est impossible de rallumer g3 on changera probablement la carte mère pour avoir un g20 bis. 
>>> A suivre…
>>> Aymeric, équipage hosting. 
>>> 
>>> On 07/05/2021 22:53, Christophe Schockaert via technique wrote:
>>>> Bonjour, 
>>>> 
>>>> 
>>>> L'équipe Tetaneutral a planifié une intervention sur le cluster de VMs lundi 10/05 dans l'après-midi. 
>>>> 
>>>> Nous ferons de notre mieux pour les éviter, mais nous ne sommes pas à l'abri d'un risque de coupures. 
>>>> 
>>>> 
>>>> Merci pour votre compréhension, 
>>>> 
>>>> 
>>>> Tetaneutral – Équipage hosting 
>>>> _______________________________________________ 
>>>> technique mailing list 
>>>> technique at lists.tetaneutral.net <mailto:technique at lists.tetaneutral.net> 
>>>> http://lists.tetaneutral.net/listinfo/technique <http://lists.tetaneutral.net/listinfo/technique> 
>>> -- 
>>> Aymeric
>>> _______________________________________________
>>> technique mailing list
>>> technique at lists.tetaneutral.net <mailto:technique at lists.tetaneutral.net>
>>> http://lists.tetaneutral.net/listinfo/technique <http://lists.tetaneutral.net/listinfo/technique>
>> 
> -- 
> Aymeric

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20210512/9392b7ad/attachment.htm>


Plus d'informations sur la liste de diffusion technique