[technique] DELL R720

Bertrand bertrand.cebador at gmail.com
Lun 21 Sep 23:48:04 CEST 2020


Salut,

Je plussoie les remarques d'Alex de manière générale sur le cluster
Ceph mais ceci étant il me semble que c'était avant tout un sujet
d'expérimentation.

Un entre deux avec un côté SPOF acceptable serait IMHO le même serveur
éventuellement redondé avec du ZFS natif à l'install de Proxmox.
C'est de quoi faire des conteneurs ou des VM simplement avec peu de
matos et peu de down en cas de panne, tu changes les disques de
serveur avec la distro et ça repart sans être obligé d'avoir matos
égal.
Et pour faire la redondance avec une seconde machine et du zfs send
les scripts fournis sont plutôt efficace.

my 2 cents.

Bertrand





Le lun. 21 sept. 2020 à 22:17, Alexandre GUY via technique
<technique at lists.tetaneutral.net> a écrit :
>
>
> > Le 21 sept. 2020 à 21:24, FIORE François <francois.fiore at protonmail.com> a écrit :
> >
> > Salut,
> >
> > Personnellement, quand je vois la charge du cluster sur Grafana, j’ai surtout l'impression qu'il faudrait ajouter des hôtes au cluster actuel, afin de répartir au mieux la charge.
>
> Cela ne résoudra pas la lenteur des accès disques, même en full SSD.
>
> >
> > Le problème avec ta proposition, c’est qu'en cas de panne sur le serveur DELL, ça nous génère un "SUPER SPOF" (ainsi que pour toi), en plus si un élément critique tombe en panne (RAM spécifique, CM propriétaire, etc ...) on mettra un temps certain avant d'obtenir une pièce détachée compatible et ce sera extrêmement complexe de migrer tous les services/VM ver une autre machine puisqu'elle fonctionnera avec une configuration spécifique ...
>
> C’est le risque, mais est-ce que le cluster ceph n’est pas également un « SUPER SPOF » à lui tout seul ? Une machine crame, ça y est, c’est la panique, et dès qu’on la rebranche, c’est pire.
>
> Et pendant ce temps, toutes les VM du cluster sont instables, les latences disques explosent.
>
> Si actuellement les VM critiques de TTNN sont sur le cluster ceph, autant vous dire que je ne suis pas du tout rassuré !
>
> Avec le DELL et RAID1, à terme, on récupère un second serveur et on met en place une solution KISS de haute dispo (ça existe). Bref comme cela se fait chez les autres FAI.
>
> >
> > PS: Il faut éviter d’envoyer un même message à plusieurs listes de diffusions en même temps, il est préférable de l'envoyer à une seule liste à la fois, puis de le copier X fois pour chaque listes de diffusions sur lesquelles tu souhaite l'envoyer.
>
> OK
>
> Alex.
>
> >
> > FIORE François
> >
> > Sent with ProtonMail Secure Email.
> >
> > ‐‐‐‐‐‐‐ Original Message ‐‐‐‐‐‐‐
> > Le lundi 21 septembre 2020 20:57, Alexandre GUY via technique <technique at lists.tetaneutral.net> a écrit :
> >
> >> Hello les lecteurs de la liste, hello le CA,
> >>
> >> Je suis motivé pour venir installer le DELL R720, et je vous propose d’aller vers une solution KISS.
> >>
> >> Le cluster Ceph, c’est sympa, mais en pratique, dès qu’une machine ou même qu’un disque grille, c’est de suite la misère : des heures ou jours de reconstruction pendant lesquels les accès disques sont du lenteur inacceptable.
> >>
> >> Cela fait plusieurs mois (années ?) que je rencontre ces problèmes de lenteur des disques, et samedi soir j’ai compris pourquoi : j’ai un cron qui se lance chaque nuit et qui fait des tar / gzip des répertoires importants de mon serveur, pour un total de 19Go. Ce cron met genre minimum 10 heures à s’exécuter sur le cluster Ceph, et pendant ce temps, ma VM est très très lente, le moindre accès disque met plusieurs secondes.
> >>
> >> Ca fait plus de 20 ans que j’ai ce type de cron sur mes serveurs, et je n’aurai jamais imaginé qu’un pauvre cron tel que celui-là puisse me créer de tel ralentissements sur les IO disques.
> >>
> >> Sur un serveur physique en RAID 1 avec des disques rotatifs, ce type de cron met moins de 30 minutes. Donc en gros, Ceph c’est 20 ou 30 fois plus lent. Minimum.
> >>
> >> On aura beau gaver les VM de RAM, ça ne résoudra pas ce problème.
> >>
> >> J’ai eu l’occasion il y a quelques mois de récupérer un serveur DELL 720 et je l’ai donné à l’association. C’est une machine qui a double alim, qui a été étudiée pour marcher H24 7/7, et qui dispose de 16 emplacements 2’’1/2.
> >>
> >> Apparement il n’est pas encore utilisé, je vous propose donc d’en faire l’usage suivant : on installe dessus un système Linux avec des disques en RAID1 logiciel + des spares, et on héberge dessus les VM critiques de l’infrastructure de TTNN + des VMs comme la mienne que l’on peut classer en professionnel / important.
> >>
> >> C’est du KISS, je veux bien me charger d’installer la machine et de configurer les disques, et d’en faire l’administration système.
> >>
> >> … si bien entendu vous acceptez ma proposition.
> >>
> >> Alex.
> >>
> >> technique mailing list
> >> technique at lists.tetaneutral.net
> >> http://lists.tetaneutral.net/listinfo/technique
> _______________________________________________
> technique mailing list
> technique at lists.tetaneutral.net
> http://lists.tetaneutral.net/listinfo/technique



Plus d'informations sur la liste de diffusion technique