[technique] Incident sur le cluster de machines virtuelles ce mercredi 10 novembre
Ludovic Pouzenc
ludovic at pouzenc.fr
Jeu 11 Nov 11:38:55 CET 2021
Sans être sur que c'était la panacée, dans mon précédent boulot j'avais
une salle avec des équipements qui n'avaient pas tous 2 alim.
(typiquement des routeurs fournis par des tiers + un serveur ou deux
arrivé là en mono-alim pour des raisons diverses et avariées).
J'avais :
1 circuit elec 240V --> 1 onduleur -> entrée A -\
inverter -> serveurs mono alim
1 circuit elec 240V --> 1 onduleur -> entrée B -/
(et des serveurs double alim directement branchés sur les 2 onduleurs)
Je ne suis pas sûr que ça vous aidera beaucoup car ça fait toujours un
SPOF. Il censé être moins compliqué que la régul d'un onduleur mais SPOF
qd même. Ça apporte le fait de pouvoir remplacer un onduleur sans
éteindre les serveurs mono-alim.
Les 2 sources ne sont pas forcément en phase, au moment où l'inverter
bascule ça fait un peu du random. Quand les charges sont uniquement des
alim à découpage, ça a le bon goût de fonctionner (ne surtout pas
brancher de moteurs/clims etc). Il me semble que le cas où l'inverter
passe automatiquement de la source A à B n'est pas pire en terme de
déphasage / spikes / bruit / blablabla que le cas où un onduleur
("merdique" de quelques kVA) passe de "passthrough" à "j'ondule depuis
les batteries". Si il y a des alims fatiguées prêtes à mourir, elles
vont mourir en même temps quoi.
Je n'ai pas trop de retour dans le temps sur ce montage là car je ne
l'ai vu fonctionner que 2 ans avant de partir (sans grands événements à
part des cas où les 2 circuits elec sont coupés simultanément genre
grève ErDF ou maintenance annuelle locale). Laurent G. a probablement
plus de recul là dessus :)
Ludo
Le 11/11/2021 à 08:52, Alexandre GUY via technique a écrit :
> Bonjour,
>
> Avant toute chose, merci infiniment à Matthieu et Aymeric pour leurs interventions.
>
>> Le 10 nov. 2021 à 18:50, Matthieu Herrb via technique <technique at lists.tetaneutral.net> a écrit :
>>
>> Bonjour,
>>
>> Ce matin tôt, un onduleur qui protège plusieurs machines du cluster de
>> machines virtuelles de l'association à lâché, entrainant avec lui
>> plusieurs 6 machines hôtes et les machine virtuelles associées, ainsi
>> que tout le stockage associé.
> L’onduleur est sensé nous protéger des coupures électriques, et s’avère au final un SPOF électrique lorsqu’il grille.
>
> Plutôt que de brancher 6 machines sur le même onduleur, pourrait-on envisager d’acheter 4 autres onduleurs pour ne brancher que 2 machines dessus ?
>
> A défaut d’avoir des machines avec deux alimentations électriques, existe-t-il des alim avec 2 entrées électriques et à prix raisonnable ? Si oui cela serait cool de brancher la même alim sur deux onduleurs différents.
>
> Merci encore pour l’intervention et belle journée à tous,
>
> Alex.
>
>> Cela a eu pour effet de bloquer les accès à l'ensemble des VMs des
>> adhérent·es à Tetaneutral.net ainsi qu'une bonne partie de
>> l'infrasutructure (serveur de listes de mail, sites web et wikis,
>> matrix, mastodon,...)
>>
>> Après une intervension cette après-midi vers 17h30, le courant est
>> revenu, l'alimentation d'un des hôtes a du être remplacée, mais le
>> cluster revient progressivement à la normale.
>>
>> Si d'ici demain matin l'un de vous services n'était pas de retour en
>> marche, contactez-nous via equipage-hosting at lists point
>> tetaneutral.net, sur matrix #question:tetaneutral.net ou sur IRC
>> #tetaneutral.net sur libera.chat.
>>
>> Merci pour votre compréhention.
>> --
>> Matthieu Herrb
>> _______________________________________________
>> technique mailing list
>> technique at lists.tetaneutral.net
>> http://lists.tetaneutral.net/listinfo/technique
> _______________________________________________
> technique mailing list
> technique at lists.tetaneutral.net
> http://lists.tetaneutral.net/listinfo/technique
--
Ludovic Pouzenc
www.pouzenc.fr
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20211111/cf5da00a/attachment.htm>
Plus d'informations sur la liste de diffusion technique