[technique] DELL R720

FIORE François francois.fiore at protonmail.com
Lun 21 Sep 21:24:03 CEST 2020


Salut,

Personnellement, quand je vois la charge du cluster sur Grafana, j'ai surtout l'impression qu'il faudrait ajouter des hôtes au cluster actuel, afin de répartir au mieux la charge.

Le problème avec ta proposition, c'est qu'en cas de panne sur le serveur DELL, ça nous génère un "SUPER SPOF" (ainsi que pour toi), en plus si un élément critique tombe en panne (RAM spécifique, CM propriétaire, etc ...) on mettra un temps certain avant d'obtenir une pièce détachée compatible et ce sera extrêmement complexe de migrer tous les services/VM ver une autre machine puisqu'elle fonctionnera avec une configuration spécifique ...

PS: Il faut éviter d'envoyer un même message à plusieurs listes de diffusions en même temps, il est préférable de l'envoyer à une seule liste à la fois, puis de le copier X fois pour chaque listes de diffusions sur lesquelles tu souhaite l'envoyer.

FIORE François

Sent with ProtonMail Secure Email.

‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐
Le lundi 21 septembre 2020 20:57, Alexandre GUY via technique <technique at lists.tetaneutral.net> a écrit :

> Hello les lecteurs de la liste, hello le CA,
>
> Je suis motivé pour venir installer le DELL R720, et je vous propose d’aller vers une solution KISS.
>
> Le cluster Ceph, c’est sympa, mais en pratique, dès qu’une machine ou même qu’un disque grille, c’est de suite la misère : des heures ou jours de reconstruction pendant lesquels les accès disques sont du lenteur inacceptable.
>
> Cela fait plusieurs mois (années ?) que je rencontre ces problèmes de lenteur des disques, et samedi soir j’ai compris pourquoi : j’ai un cron qui se lance chaque nuit et qui fait des tar / gzip des répertoires importants de mon serveur, pour un total de 19Go. Ce cron met genre minimum 10 heures à s’exécuter sur le cluster Ceph, et pendant ce temps, ma VM est très très lente, le moindre accès disque met plusieurs secondes.
>
> Ca fait plus de 20 ans que j’ai ce type de cron sur mes serveurs, et je n’aurai jamais imaginé qu’un pauvre cron tel que celui-là puisse me créer de tel ralentissements sur les IO disques.
>
> Sur un serveur physique en RAID 1 avec des disques rotatifs, ce type de cron met moins de 30 minutes. Donc en gros, Ceph c’est 20 ou 30 fois plus lent. Minimum.
>
> On aura beau gaver les VM de RAM, ça ne résoudra pas ce problème.
>
> J’ai eu l’occasion il y a quelques mois de récupérer un serveur DELL 720 et je l’ai donné à l’association. C’est une machine qui a double alim, qui a été étudiée pour marcher H24 7/7, et qui dispose de 16 emplacements 2’’1/2.
>
> Apparement il n’est pas encore utilisé, je vous propose donc d’en faire l’usage suivant : on installe dessus un système Linux avec des disques en RAID1 logiciel + des spares, et on héberge dessus les VM critiques de l’infrastructure de TTNN + des VMs comme la mienne que l’on peut classer en professionnel / important.
>
> C’est du KISS, je veux bien me charger d’installer la machine et de configurer les disques, et d’en faire l’administration système.
>
> … si bien entendu vous acceptez ma proposition.
>
> Alex.
>
> technique mailing list
> technique at lists.tetaneutral.net
> http://lists.tetaneutral.net/listinfo/technique





Plus d'informations sur la liste de diffusion technique