[technique] I/O Error sur un volume de 788Go
manu chez Z
emmanuel.courcelle at zaclys.net
Mer 19 Fév 10:27:35 CET 2020
Le 19/02/2020 à 07:49, Matthieu Herrb a écrit :
> On Wed, Feb 19, 2020 at 07:39:52AM +0100, manu chez Z via technique wrote:
>> Bonjour
> Bonjour Emmanuel,
>
>> Depuis quelques jours nous avons des ennuis avec la machine picbackup
>> hébergée par tetaneutral: les sauvegardes se font partiellement. Dans le
>> syslog j'ai des messages comme ça:
>>
> En général ce genre d'erreur c'est signe d'un problème coté ceph.
>
> Et en effet je vois parfois dans le status de ceph :
>
> health: HEALTH_WARN
> 142 slow ops, oldest one blocked for 102 seç daemons
> [osd.20,osd.35,osd.45,osd.51] have slow ops.
>
>
> Il faut probablement qu'on remplace des disques en train de lacher
> dans le cluster...
>
>
>> *Feb 19 03:17:49 picbackup kernel: [9090496.299702] sd 2:0:0:1: [sdb] tag#29
>> abort
>> Feb 19 03:17:49 picbackup kernel: [9090496.302511] sd 2:0:0:1: [sdb] tag#29
>> FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK
>>
>> Je pense exécuter cette commande:
>>
>> *fsck -y /dev/sdb >FSCK.LOG 2>&1*
>>
>> Est-ce que vous pensez que c'est une bonne idée, ou y a-t-il autre chose à
>> faire ?
>>
> Je pense qu'il vaut mieux attendre qu'on ait réglé le problème de
> notre coté. Là un fcsk va encore faire d'autres timeouts.
>
> Je transmets le problème à nos spécialistes de ceph...
>
OK
merci Matthieu !
Emmanuel
Plus d'informations sur la liste de diffusion technique