[technique] I/O Error sur un volume de 788Go

Matthieu Herrb matthieu at herrb.eu
Mer 19 Fév 07:49:46 CET 2020


On Wed, Feb 19, 2020 at 07:39:52AM +0100, manu chez Z via technique wrote:
> Bonjour

Bonjour Emmanuel,

> 
> Depuis quelques jours nous avons des ennuis avec la machine picbackup
> hébergée par tetaneutral: les sauvegardes se font partiellement. Dans le
> syslog j'ai des messages comme ça:
>

En général ce genre d'erreur c'est signe d'un problème coté ceph.

Et en effet je vois parfois dans le status de ceph :

    health: HEALTH_WARN
                142 slow ops, oldest one blocked for 102 seç daemons
                [osd.20,osd.35,osd.45,osd.51] have slow ops.


Il faut probablement qu'on remplace des disques en train de lacher
dans le cluster...


> *Feb 19 03:17:49 picbackup kernel: [9090496.299702] sd 2:0:0:1: [sdb] tag#29
> abort
> Feb 19 03:17:49 picbackup kernel: [9090496.302511] sd 2:0:0:1: [sdb] tag#29
> FAILED Result: hostbyte=DID_TIME_OUT driverbyte=DRIVER_OK
> 
> Je pense exécuter cette commande:
> 
> *fsck -y /dev/sdb >FSCK.LOG 2>&1*
> 
> Est-ce que vous pensez que c'est une bonne idée, ou y a-t-il autre chose à
> faire ?
>

Je pense qu'il vaut mieux attendre qu'on ait réglé le problème de
notre coté. Là un fcsk va encore faire d'autres timeouts.

Je transmets le problème à nos spécialistes de ceph...

-- 
Matthieu Herrb
-------------- section suivante --------------
Une pièce jointe autre que texte a été nettoyée...
Nom: signature.asc
Type: application/pgp-signature
Taille: 793 octets
Desc: non disponible
URL: <http://lists.tetaneutral.net/pipermail/technique/attachments/20200219/979c1077/attachment.sig>


Plus d'informations sur la liste de diffusion technique