[technique] [tetaneutral] Intervention sur le cluster de machine virtuelle

Alexandre GUY alex at euronode.com
Mar 8 Fév 07:32:23 CET 2022


Merci Aymeric pour toutes ces précisions

Le grafana est superbe

Comment peut-on savoir sur quelle machine physique est hébergée une VM, existe-t-il un « cat /proc/qquechose » pour le savoir depuis la VM ?

Merci et belle journée à tous,

Alex.


> Le 7 févr. 2022 à 16:51, Aymeric <mulx at aplu.fr> a écrit :
> 
> Je ne crois pas qu’on est ça proprement lisible accessible sur une page mais voici la liste des machines actuellement du cluster avec nombre de VM ; vCPU (allocation VM), CPUs physique et ram utilisé  / totale):
> 
> 	• g1: UP (5 VMs using 5 vCPUs on 8 CPUs and 8.0 GiB of 31.0 GiB RAM ; ram cached+free: 2.9 GiB) ; load average: 1.40 1.52 1.77
> 	• g2: UP (14 VMs using 18 vCPUs on 8 CPUs and 22.5 GiB of 31.0 GiB RAM ; ram cached+free: 6.1 GiB) ; load average: 1.65 2.13 2.11
> 	• g3: UP (14 VMs using 19 vCPUs on 4 CPUs and 22.8 GiB of 31.0 GiB RAM ; ram cached+free: 2.8 GiB) ; load average: 1.32 1.83 2.19
> 	• g4: UP (1 VMs using 1 vCPUs on 4 CPUs and 2.0 GiB of 62.5 GiB RAM ; ram cached+free: 32.3 GiB) ; load average: 1.57 1.74 1.91
> 	• g6: UP (2 VMs using 2 vCPUs on 4 CPUs and 1.2 GiB of 62.5 GiB RAM ; ram cached+free: 34.7 GiB) ; load average: 2.31 2.47 2.38
> 	• g8: UP (6 VMs using 10 vCPUs on 4 CPUs and 15.5 GiB of 31.0 GiB RAM ; ram cached+free: 14.1 GiB) ; load average: 1.03 0.78 0.77
> 	• g9: UP (7 VMs using 7 vCPUs on 4 CPUs and 9.8 GiB of 31.3 GiB RAM ; ram cached+free: 8.4 GiB) ; load average: 1.75 1.42 1.41
> 	• g10: UP (12 VMs using 13 vCPUs on 8 CPUs and 14.2 GiB of 31.1 GiB RAM ; ram cached+free: 10.6 GiB) ; load average: 2.97 2.84 2.95
> 	• g11: UP (11 VMs using 12 vCPUs on 4 CPUs and 10.5 GiB of 31.0 GiB RAM ; ram cached+free: 12.1 GiB) ; load average: 2.83 2.19 1.92
> 	• stri: UP (9 VMs using 13 vCPUs on 8 CPUs and 19.0 GiB of 31.3 GiB RAM ; ram cached+free: 9.0 GiB) ; load average: 1.44 1.36 1.35
> 	• g20: UP (20 VMs using 20 vCPUs on 24 CPUs and 28.8 GiB of 125.8 GiB RAM ; ram cached+free: 69.0 GiB) ; load average: 1.91 1.53 1.34
> 	• g21: UP (46 VMs using 62 vCPUs on 24 CPUs and 89.0 GiB of 125.8 GiB RAM ; ram cached+free: 20.9 GiB) ; load average: 7.42 6.94 6.34
> 	• g22: UP (37 VMs using 67 vCPUs on 24 CPUs and 82.0 GiB of 125.8 GiB RAM ; ram cached+free: 22.0 GiB) ; load average: 2.26 2.34 2.54
> 	• g23: UP (23 VMs using 24 vCPUs on 24 CPUs and 30.5 GiB of 125.8 GiB RAM ; ram cached+free: 62.1 GiB) ; load average: 2.40 2.09 2.25
> 
> g20, g21, g22 et g23 sont les AMD Ryzen dans des boitiers 3U.
> 
> stri est une machine rackable simple alim;
> 
> Les autres sont des boitiers PC tour que l’ont va remplacer par les nouveaux boitiers (on ne veut pas remplacer 1:1 mais plutôt faire 2:1 ou 3:1 selon les disques/RAM).
> 
> Toutes les machines sont interconnectés en 10Gb/s, la fois pour le stockage ceph et pour les VM.
> 
> Les nouveaux boitiers ont 16 emplacements SATA, actuellement on n'en utilise que 8 car il nous manque une carte extension sur la carte mère pour utiliser les 8 slots restants, on prévoit d’ajouter une carte extension a moyen terme.
> 
> Le cluster ceph est visible en "temps réel" ici : https://nagios.tetaneutral.net/grafana/d/r6lloPJmz/ceph-cluster ; un osd = disque physique, donc actuellement 61 disques (60 en vrai il y’en a un qui a été partiellement sorti pour des soucis de perf :) mais je ne crois pas qu'on est le detail des disques.
> 
> A noter aussi on ne remplace pas systématiquement un disque dur physique HS par un disque neuf, les nouveaux disques font 8To certains disques sont encore en 2 ou 3To.
> 
> Aymeric
> 
> On 2022-02-07 14:58, Richard Baret wrote:
> 
>> Bonjour Aymeric,
>> merci pour les details !
>> On a un diagramme quelque part pour l'orga logique des machines ? (La liste des noeuds du/des clusters de stockage et des hyperviseurs, leur liens etc ?)
>>  
>> Bonne journée,
>> Richard
>> 
>> Le lun. 7 févr. 2022, 14:35, Aymeric via tetaneutral <tetaneutral at lists.tetaneutral.net> a écrit :
>> Plop,
>> 
>> Je voulais envoyer un mail après l'opération pour dire que tout était 
>> fini.. puis d'une chose a une autre j'ai totalement zappé :).
>> 
>> Ce qui a été fait :
>> 
>> - Installation de deux boîtiers avec une carte mère ASRackRock X570D4U ; 
>> CPU AMD Ryzen 5900X et 128G de RAM ainsi que test des emplacement SATA 
>> du boîtier.
>>    Ceci a été fait sans impact sur le cluster entre fin décembre et début 
>> janvier dans le nouveau local à Picto.
>> - Installation d'un système d'exploitation sur une de ces deux machines 
>> (nommée g23) + préparation pour joindre la machine au cluster.
>> 
>> - Le vendredi 28 janvier après midi :
>> 
>>    - remplacement 1:1 d'un des hyperviseurs du cluster (g20) par le 
>> nouveau boîtier avec nouvelle carte mère, sans remplacement de disque ni 
>> réinstallation d'OS.
>>      La machine qui a été remplacé était dans le cluster depuis environ 1 
>> an mais pour une raison inconnu perdais les disques SATA environ 1 fois 
>> par mois, voir plus.
>>      => On va remplacer la carte mère de cette machine et la réintégrer 
>> en tant que nouvelle machine, il s'agit d'un boîtier 3U récent on 
>> suppose donc un problème sur la carte mère (il s'agit d'une asrock 
>> X470D4U acheté il y'a un peu plus d'un en vu d'expérimenter le 
>> renouvellement du cluster).
>>    - remplacement de deux anciens hyperviseurs (n7 et g12) du cluster par 
>> le nouveau boîtier (g23) avec récupération des disques durs.
>>      g12 est une machine qui avait des soucis de disque ou 
>> d'alimentation, en tout cas les nouveaux disques qui avait été branché 
>> dessus n'étais pas reconnu. On suppose un soucis sur la carte mère 
>> aussi.
>>      => Cette machine sera probablement benné après récupéré ce qui est 
>> intéressant (core i5 6500 avec 64G de RAM).
>>      n7 va être utilisé pour tester des montées de version de logiciel au 
>> niveau du cluster mais ne fait déjà plus parti intégrante du cluster.
>>      => A terme cette machine sera peut être proposé à des adhérents qui 
>> souhaitent venir avec leur disque mais sans hardware (il s'agit d'un i5 
>> 4570 avec 32G de RAM) ou juste vendu.
>> 
>> - Modification des associations disques/machines dans ceph pour prendre 
>> en compte le remplacement de n7 et g12 par g23 (ce qui a entraîné un 
>> déplacement d'environ 25% des données stocké sur le cluster).
>> 
>> 
>> Nous allons aussi continuer le renouvellement du cluster et retirer 
>> progressivement les anciennes machines pour les remplacer par les 
>> boîtiers 3U avec des AMD Ryzen.
>> 
>> 
>> L'intérêt de ces boîtiers a été annoncé en décembre 2020 ici : 
>> https://lists.tetaneutral.net/pipermail/technique/2020-December/004146.html
>> 
>> Aymeric
>> 
>> On 2022-02-07 11:27, Alexandre GUY wrote:
>> > Bonjour Aymeric,
>> > 
>> > L'intervention a été effectivement transparente, bravo et merci.
>> > 
>> > Par curiosité, vous avez fait quoi sur le cluster ?
>> > 
>> > Les accès disques sont beaucoup plus rapides, mon backup infernal se
>> > termine avec plus d'une heure d'avance par rapport à avant.
>> > 
>> > Belle journée à tous,
>> > 
>> > Alex.
>> > 
>> > 
>> >> Le 27 janv. 2022 à 21:24, Aymeric via tetaneutral 
>> >> <tetaneutral at lists.tetaneutral.net> a écrit :
>> >> 
>> >> Bonsoir
>> >> 
>> >> Demain (vendredi) à partir de 14h jusqu'à environ 18h nous allons 
>> >> effectuer des opérations de remplacement de matériel sur le cluster 
>> >> afin de moderniser.
>> >> 
>> >> En théorie c'est totalement invisible pour les adhérents, à part 
>> >> quelques ralentissements sur le stockage.
>> >> 
>> >> Aucune interruption sur les machines virtuelles n'est a prévoir, 
>> >> cependant il est possible que Murphy s'invite de force... :)
>> >> 
>> >> Les lenteurs sur le stockage pourront durer un peu plus durant le 
>> >> week-end le temps que les données se répartissent correctement.
>> >> 
>> >> Aymeric pour tetaneutral.net.
>> >> _______________________________________________
>> >> tetaneutral mailing list
>> >> tetaneutral at lists.tetaneutral.net
>> >> http://lists.tetaneutral.net/listinfo/tetaneutral
>> _______________________________________________
>> tetaneutral mailing list
>> tetaneutral at lists.tetaneutral.net
>> http://lists.tetaneutral.net/listinfo/tetaneutral
> 
> 


Plus d'informations sur la liste de diffusion technique