[technique] INCIDENT cluster ceph/openstack : patch bug kernel ext4+xattr "remove mbcache"

François Laperruque francois.laperruque at viviershautdebit.net
Mer 11 Nov 11:54:41 CET 2015


Bonjour,

Bravo a vous pour cette intervention de haut vol!
Une integration de ce patch dans le kernel "officiel" gere par Linus, 
est elle possible/envisagee?

A+

Le 11/11/2015 11:40, Laurent GUERBY a écrit :
> Bonjour,
>
> Nous avons finalement reconstruit un kernel 3.19 ubuntu trusty
> avec mon patch (1) de desactivation du "mbcache" de ext4 (dans la serie
> "fix the kernel yourself" :) et migré les machines du cluster sur cette
> version apres un test sur des VMs.
>
> Depuis la mise en production de ce kernel patché par nos soins nous
> n'avons plus aucun freeze et toutes les machines du cluster ont
> maintenant plus d'un jour d'uptime malgré des I/O tres intensives : il
> reste encore environ 10 TB a copier du pool erasure code 4+1 au nouveau
> 8+2. Nous allons ensuite probablement reparametrer le cluster
> (straw=>straw2 (2)), ajouter deux machines, changer des disques (plus de
> disques plus petits) et essayer d'ameliorer globalement les
> performances.
>
> Avec un peu de chance c'est la fin de cet épisode d'instabilité
> de notre cluster openstack+ceph qui a débuté le lundi 26 octobre 2015.
>
> Merci a Loic pour le run teuthology de validation ceph+ext4+kernel et a
> Mehdi pour la mise a disposition de la VM de build du kernel.
>
> Et merci a tou-te-s les adherent-e-s pour leur patience et leur
> soutien.
>
> Sincèrement,
>
> Laurent
>
> (1) https://bugzilla.kernel.org/show_bug.cgi?id=107301#c6
> (2) http://www.spinics.net/lists/ceph-devel/msg21635.html
>


-- 
Francois Laperruque
--
http://viviers-fibre.net/



Plus d'informations sur la liste de diffusion technique