[technique] I/O Error sur un volume de 788Go

manu chez Z emmanuel.courcelle at zaclys.net
Mer 19 Fév 10:27:35 CET 2020


Le 19/02/2020 à 07:49, Matthieu Herrb a écrit :
> On Wed, Feb 19, 2020 at 07:39:52AM +0100, manu chez Z via technique wrote:
>> Bonjour
> Bonjour Emmanuel,
>
>> Depuis quelques jours nous avons des ennuis avec la machine picbackup
>> hébergée par tetaneutral: les sauvegardes se font partiellement. Dans le
>> syslog j'ai des messages comme ça:
>>
> En général ce genre d'erreur c'est signe d'un problème coté ceph.
>
> Et en effet je vois parfois dans le status de ceph :
>
>      health: HEALTH_WARN
>                  142 slow ops, oldest one blocked for 102 seç daemons
>                  [osd.20,osd.35,osd.45,osd.51] have slow ops.
>
>
> Il faut probablement qu'on remplace des disques en train de lacher
> dans le cluster...
>
>
>> *Feb 19 03:17:49 picbackup kernel: [9090496.299702] sd 2:0:0:1: [sdb] tag#29
>> abort
>> Feb 19 03:17:49 picbackup kernel: [9090496.302511] sd 2:0:0:1: [sdb] tag#29
>> FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK
>>
>> Je pense exécuter cette commande:
>>
>> *fsck -y /dev/sdb >FSCK.LOG 2>&1*
>>
>> Est-ce que vous pensez que c'est une bonne idée, ou y a-t-il autre chose à
>> faire ?
>>
> Je pense qu'il vaut mieux attendre qu'on ait réglé le problème de
> notre coté. Là un fcsk va encore faire d'autres timeouts.
>
> Je transmets le problème à nos spécialistes de ceph...
>
OK

merci Matthieu !

Emmanuel





Plus d'informations sur la liste de diffusion technique