[technique] 2020-05-27 13h Inconsistances de fichiers sur VM piou.tetaneutral.net

Ludovic Pouzenc ludovic at pouzenc.fr
Mer 17 Juin 11:37:52 CEST 2020


Merci pour vos réponses à tous les deux.

La situation semble stabilisée pour moi, j'ai dumpé des mails + recréé 
une boite vide pour la seule boite qui était abîmée (et qui est 
destinataire des mails de cron et logwatch au boot).

Peut-être que ça montre qu'il y a des IO pas forcément exécutées "dans 
l'ordre" sur le pool SSD avec le setup actuel alors que pourtant :

(ttn)root at piou:~# cat /sys/block/sda/queue/scheduler
[noop] deadline cfq

Habituellement (machine simple ou sur disques locaux), pour des fichiers 
de logs sur ext4 en tout cas, on se retrouve à avoir un fichier de la 
taille "d'avant" le power fail et pas des 0x00 dedans. Est-ce qu'il y a 
aussi du "noop" sur les schedulers des hôtes pour le pool SSD ? Est-ce 
que ce point a déjà été regardé dans le passé ?

Merci,

Le 14/06/2020 à 21:43, Hugues Brunel via technique a écrit :
> Hello,
>
> Il faut faire attention au mot "sans impact" des prévenances TLS00.
> Le qualificatif est relatif aux clients hébergés dans le datacenter (donc derrière les onduleurs "officiels").
>
> La salle associative n'étant pas derrière ces onduleurs, il y a toujours un impact (micro coupure) à chaque test des groupes electrogènes (tous les 3 mois).
> N'hésitez pas à demander si vous avez un doute sur l'impact d'une maintenance.
>
> Lors des tests de groupe voie A, l'impact est de 4 micro-coupures (~1 seconde) dans la journée (soit le matin à ~8h, soit l'apres-midi à ~13h).
> Les tests sur la voie B ne doivent pas induire de micro-coupure puisque la voie A est prioritaire.
>
> La séquence de coupure doit être la suivante pour la salle TTN:
> t0: arret elec voie A: bascule sur la voie B (microcoupure)
> t0+10s: démarrage groupe electrogene voie A: retour sur la voie A (microcoupure)
> t0+2h:arret groupe electrogene: bascule sur la voie B (microcoupure)
> t0+2h+2s: repassage sur Enedis voie A: bascule sur la voie A (microcoupure)
>
> Normalement les onduleurs TTN doivent tenir ces quelques secondes, mais vu la température dans la salle, les batteries souffrent beaucoup et régulièrement des onduleurs rendent l'âme à ces moments là :-(
> La mise en place d'un extracteur d'air sous peu devrait améliorer ce point.
>
> Une deuxième solution serait d'utiliser des onduleurs avec des types de batterie moins sensible à la chaleur, mais ces technos ne semble pas encore très matures... (certains se sont renseignés sur le sujet... (je n'ai pas vu passer les retours))
>
> ++
> Ughy.
>
>
>> Le 14 juin 2020 à 20:04, Aymeric via technique <technique at lists.tetaneutral.net> a écrit :
>>
>>
>> On 13/06/2020 22:08, Ludovic Pouzenc via technique wrote:
>>> Bonsoir,
>>>
>>> Je constate un behavior bizare à la suppression d'emails sur
>>> pouzenc.fr. C'est un dovecot sur la VM piou.tetaneutral.net.
>>>
>>> Les logs de dovecot continent des erreurs depuis le 27 mai vers 13h.
>>> Le fichier de log de dovecot est lui même abîmé (un bloc de 0x00 au
>>> beau milieu), et les index de mails (stockage mdbox) le sont aussi
>>> apparemment. Le fsck mdbox ne converge pas.
>>>
>>> J'ai un borg chez moi avec presque une version par jour s'il y a lieu
>>> d'investiguer. Est-ce que cette date correspond à une manip
>>> particulière côté hosting ?
>>>
>> Le 27 il y'a eu des tests "sans impacts" sur les groupes, effectués par
>> fullsave ce qui avait fait redémarré quelques machines (cause onduleur
>> hs ?).
>>
>> De mémoire c’était une bonne partie de la journée du 27, je ne serai pas
>> dire si des machines du cluster avait été touché, le routeur oui.
>>
>> --
>> Aymeric
>> _______________________________________________
>> technique mailing list
>> technique at lists.tetaneutral.net
>> http://lists.tetaneutral.net/listinfo/technique
>
> _______________________________________________
> technique mailing list
> technique at lists.tetaneutral.net
> http://lists.tetaneutral.net/listinfo/technique

-- 
Ludovic Pouzenc
www.pouzenc.fr

This is GNU/Linux land. In silent nights you can hear the Windows machines rebooting.

-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20200617/3d568311/attachment.htm>


Plus d'informations sur la liste de diffusion technique