[technique] Mises à jour du cluster machine virtuelle & ceph

Aymeric mulx at aplu.fr
Jeu 28 Juil 22:41:41 CEST 2022


Bonsoir,

Il n’y a pas eu trop de comm. de notre part sur les dernières avancé du 
cluster de machine virtuelle depuis le mois mai, on va essayer de 
rattraper ça :)

Dans les choses qui ont été faites :

Remplacement de toutes¹ les anciennes machines du cluster par les 
nouveaux boitier rackable avec 128Go RAM, processeur Ryzen 5900 et 
surtout 16 emplacements disques en facade "hot swap"², on en parle 
depuis décembre 2020 mais c’est maintenant terminé depuis mi mai.

Quelques semaines après cette intervention nous sommes revenu faire un 
"équilibrage" de charge au niveau des onduleurs, ces boitiers ont tous 
une double alim, ils ont été branché de manière a être tous sur 2 
onduleurs différents.
Les machines étant double alim, la puissance en nominale est réparti sur 
les deux alims, si on utilise une patte en direct, l'autre sur un 
onduleur, en cas de bascule suite a une coupure la charge risque de 
faire claquer l'onduleur.. et donc perdre la machine.

Ensuite, dans l'optique de mettre à jour ceph vers une nouvelle version, 
les anciens disques utilisé par ceph ont été converti au nouveau format 
de stockage.
Concrètement le cluster ceph date de 2014 et à l’époque ceph utilisait 
des disques formatés en ext4 ou xfs (format de fichier standard sous 
Linux) pour stocker les données. Ce format s'appelle filestore, depuis 
quelques années (depuis 2017) un nouveau format nommée "bluestore" est 
venu remplacé filestore permettant d'être plus rapide, robuste, etc.
A tetaneutral.net on a eu comme politique de ne pas convertir les 
disques en bluestore mais de se baser simplement sur le remplacement des 
disques par des neufs pour migrer progressivement en bluestore.

Il y'a quelques semaines il restait encore 16 disques³ sur 60 en 
filestore, nous avons pris la décision d'accélérer les choses même si la 
conversion entraine une charge plus importante et augmente les risques 
de casse de disque/ssd. En effet les disques doivent être formaté pour 
être converti, donc les données sont déplacés ailleurs avant d'être 
re-copié dessus.

Et enfin, nous avons mis à jour la version de ceph d'une version plus 
supporté a ... une version plus supporté (mais plus récente).
Aujourd'hui le cluster est en version 14 (nautilus) de ceph.

Cette mise à jour était un prerequis pour mettre à jour les OS des 
machines vers une version plus récente (ubuntu 20.04), maintenant il 
nous faut faire cette partie et ensuite on mettra, à nouveau, ceph à 
jour vers une version supporté (16 ou 17).

Voilà pour les nouvelles ... dans les grandes lignes ! Si vous voulez 
d’explication plus en détail n’hésitez pas à poser vos questions par 
mail ou a venir sur Matrix https://tetaneutral.net/contact/ pour les poser !

Aymeric pour tetaneutral.net.

PS : Si vous êtes motivés et/ou intéressé pour aider l’équipe "hosting" 
les tâches sont diverses (en ce moment c'est surtout mises à jour..) 
mais on est ouvert a avoir de nouvelles personnes :)

¹     il reste une vieille machine (stri) mais rackable avec deux 
disques qui participent au cluster, on attend sagement la fin de vie de 
cette machine

²     la partie hotswap, on a une petite blague car au final seul 8 
emplacements sont hot swap mais pas sur toutes les machines, on a 
quelques pistes liées probablement à la version du BIOS ou a des 
réglages légèrement différent. Malgré tout ça simplifie la vie, au pire 
il y'a un reboot de la machine a faire.

³    Le plus vieux disques du cluster à 95985 heures (soit presque 11 
ans) de fonctionnement !

-- 
Aymeric
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20220728/7aec3e16/attachment.htm>


Plus d'informations sur la liste de diffusion technique