[technique] INCIDENT cluster ceph/openstack : patch bug kernel ext4+xattr "remove mbcache"

Julien Rabier taziden at flexiden.org
Mer 11 Nov 20:55:23 CET 2015


J'ai peut être parlé un peu vite.
Laurent me faisait très justement remarqué que la discussion sur le 
bugzilla[1] laisse la porte ouverte à la suppression du cache.

Wait & see :)

[1] https://bugzilla.kernel.org/show_bug.cgi?id=107301

Le 11 nov. à 19:15, Julien Rabier a écrit :
> Bonsoir,
> 
> Le patch écrit et déployé par Laurent ne corrige pas vraiment le problème rencontré 
> dans ext4 mais est une solution de contournement. Il n'est pas souhaitable ni 
> envisageable qu'il intégre le noyau officiel.
> 
> Julien
> 
> Le 11 nov. à 11:54, François Laperruque a écrit :
> > Bonjour,
> > 
> > Bravo a vous pour cette intervention de haut vol!
> > Une integration de ce patch dans le kernel "officiel" gere par Linus, est
> > elle possible/envisagee?
> > 
> > A+
> > 
> > Le 11/11/2015 11:40, Laurent GUERBY a écrit :
> > >Bonjour,
> > >
> > >Nous avons finalement reconstruit un kernel 3.19 ubuntu trusty
> > >avec mon patch (1) de desactivation du "mbcache" de ext4 (dans la serie
> > >"fix the kernel yourself" :) et migré les machines du cluster sur cette
> > >version apres un test sur des VMs.
> > >
> > >Depuis la mise en production de ce kernel patché par nos soins nous
> > >n'avons plus aucun freeze et toutes les machines du cluster ont
> > >maintenant plus d'un jour d'uptime malgré des I/O tres intensives : il
> > >reste encore environ 10 TB a copier du pool erasure code 4+1 au nouveau
> > >8+2. Nous allons ensuite probablement reparametrer le cluster
> > >(straw=>straw2 (2)), ajouter deux machines, changer des disques (plus de
> > >disques plus petits) et essayer d'ameliorer globalement les
> > >performances.
> > >
> > >Avec un peu de chance c'est la fin de cet épisode d'instabilité
> > >de notre cluster openstack+ceph qui a débuté le lundi 26 octobre 2015.
> > >
> > >Merci a Loic pour le run teuthology de validation ceph+ext4+kernel et a
> > >Mehdi pour la mise a disposition de la VM de build du kernel.
> > >
> > >Et merci a tou-te-s les adherent-e-s pour leur patience et leur
> > >soutien.
> > >
> > >Sincèrement,
> > >
> > >Laurent
> > >
> > >(1) https://bugzilla.kernel.org/show_bug.cgi?id=107301#c6
> > >(2) http://www.spinics.net/lists/ceph-devel/msg21635.html
> > >
> > 
> > 
> > -- 
> > Francois Laperruque
> > --
> > http://viviers-fibre.net/
> > _______________________________________________
> > technique mailing list
> > technique at lists.tetaneutral.net
> > http://lists.tetaneutral.net/listinfo/technique
> _______________________________________________
> technique mailing list
> technique at lists.tetaneutral.net
> http://lists.tetaneutral.net/listinfo/technique



Plus d'informations sur la liste de diffusion technique