[tetaneutral] (fait) Migration du cluster de machines virtuelles vers Proxmox VE
Laurent GUERBY
laurent at guerby.net
Fri Aug 11 23:10:11 CEST 2023
On Mon, 2023-08-07 at 15:52 +0200, Guilhem Saurel via tetaneutral
wrote:
> Bonjour à toutes et à tous,
>
> Nous allons commencer à migrer les machines virtuelles vers notre
> nouvelle
> infrastructure proxmox + ceph.
>
> Cela va se faire petit à petit, VM par VM, dans les jours qui vont
> suivre.
>
> Si vous n’avez pas trop changé votre VM (ie. pas bloqué ICMP ni
> supprimé la clef
> des SSH de g1), cela va simplement se traduire pour vous par un
> downtime de
> votre VM dépendant de la taille utilisée du disque (de l’ordre d’1h
> tous les
> 100Gio).
>
> Sinon, il se peut que nous ayons plus de mal à migrer votre VM. Bien
> sûr, en cas
> de problème sur la nouvelle, nous pouvons ré-allumer l’ancienne.
>
> Dans tous les cas, n’hésitez pas à nous contacter si vous avez des
> questions ou
> des instructions particulières pour votre cas, sur matrix ou IRC
> (libera).
>
> Les services de l’asso (matrix, mastodon, etc.) subiront également un
> downtime.
Bonsoir,
Les 7 serveurs (g1, g2, g3, g20, g21, g22, g23 - 128 GB RAM, Ryzen
3900X ou 5900X) sont maintenant en cluster proxmox VE 7.4 avec les 59
disques (25 ssd total 22 TiB et 34 hdd total 148 TiB) gérés par ceph
version 17.2 "quincy".
Les 216 VMs de l'ancien cluster libvirt+ceph sont migrées.
Nous avons cependant une inquiétude sur la machine g22 qui pendant nos
tests avant intégration a "freeze" après 5-7 jours d'uptime, pourtant
en étant plutot idle.
Comme g22 est le premier Ryzen 3900X qu'on a intégré au nouveau cluster
on se demande si ce n'est pas un problème spécifique 3900X vs
AsrockRack X570D4U, par précaution nous n'avons pas mis de VM sur les 3
3900X du cluster (g2, g21, g22).
De son coté le premier 5900X (g20) est up sans soucis depuis 135 jours
avec 16 disques et une trentaine de VM occupant plus de 70% de sa RAM.
Si cela vient des 3900X nous acheterons 3 Ryzen 5900X a 350 EUR piece a
peu pres.
Nous copions actuellement les données d'une trentaine de VM qui étaient
sur un stockage ZFS temporaire. Cela devrait prendre quelques jours
encore, comme proxmox sait migrer les données en "live" il n'y aura pas
d'interruption de service pour les VM concernées.
Nous avons un premier jet de script de création automatisée de VM
(debian 12), il nous reste du travail pour adapter notre outil de
gestion djadhere a notre nouvelle infrastructure proxmox VE.
Nous préparons aussi une montée en version de Proxmox VE 7.4 a 8.x.
Sincèrement,
l’équipage hosting
More information about the tetaneutral
mailing list