[iot] [incident loraserver] services opérationnels

Pierre Couderc couderc.pastel at gmail.com
Mer 27 Mai 15:52:06 CEST 2020


Bonjour,

un nouvel incident à du se produire cet après midi, le serveur lora est 
de nouveau inaccessible.

Pierre Couderc

Le 25/05/2020 à 22:14, Nicolas Gonzalez via iot a écrit :
> Bonjour à tous,
>
> L'incident survenu en fin de semaine dernière est clos et les services 
> IoT sont de nouveau opérationnels.
>
> L'incident concerne un onduleur qui a provoqué une micro-coupure 
> entraînant le redémarrage du routeur de l'association et d'une partie 
> du cluster de virtualisation où sont hébergés nos services.
>
> Lors du redémarrage des machines il s'est avéré que l'hyperviseur sur 
> lequel sont hébergés les machines virtuelles IoT avait sa pile de BIOS 
> hors d'usage ce qui a entraîner une perte des paramètres de 
> configuration (poweron failure & boot sur ssd).
>
> Je suis intervenu aujourd'hui à TLS00 et j'ai changé la pile du bios 
> et redémarré le nœud du cluster. Lors de la perte de ce nœud du 
> cluster, nous avons perdu l'accès au management du cluster qui reste 
> après investigations encore inaccessible.
>
> Une migration va être programmée afin de sortir de la technologie de 
> virtualisation actuelle (openstack) pour passer directement sur du 
> libvirtd.
>
> Je profite de ce mail pour vous rappeler la coupure électrique de ce 
> jeudi 28 matin afin de réaliser des travaux sur les installations. Je 
> vous conseille vivement d'éteindre proprement vos serveurs en 
> hébergement afin de ne pas subir de dégâts.
>
> Je tiens à vous remercie pour votre attachement à ce projet et suis à 
> votre disposition pour de plus amples informations.
>
> Amicalement,
> ngonzalez
> _______________________________________________
> iot mailing list
> iot at lists.tetaneutral.net
> https://lists.tetaneutral.net/listinfo/iot


Plus d'informations sur la liste de diffusion iot