Linux 3.18 trápí neznámá chyba, raději opatrně
Po více než týdnu víme, že tahle chyba vede k častějšímu padání systému, ba přímo ke kernel panicu. Vypadá to, že chyba souvisí s virtualizační částí Xen, konkrétně k patchi z roku 2005, kde jeho autor opravoval vmalloc_fault()
s komentářem, že to ne vždy funguje a potřebuje to další testovaní. A na něj již podle všeho nedošlo, takže jakási blíže nezkoumaná podivnost kolem této funkce přežívala v kernelu 9 let. Dave Jones z Red Hatu následně zkusili jiné scénáře, jak se k identifikaci chyby dostat, aby tím jen ještě více otevřel dvířka Pandořiny skřínky. A vypadá to, že navenek podobnou chybu (s podobným chováním) způsobují i jiné části kódu. Navíc může být postižen i stávající stabilní kernel 3.17 a vše může souviset s kernelovým watchdogem.
Dnes se objevil čerstvý kernel 3.18-rc7, ale ani on řešení nepřináší. Momentálně se několik vývojářů pokouší vystopovat problém(y) a připravit řešení. Ukazuje se, ale že věc vyžaduje složitější než triviální řešení. Linuxový kernel je patrně nejkomplexnější softwarový projekt, jaký existuje, takže je celkem pochopitelné, že takovéto „záhadné chyby“ se čas od času objevují a jejich řešení může trvat déle.
Na druhou stranu jelikož se problémy neobjevily s verzí 3.17, je pravděpodobné, že ucho se utrhlo až s ní. Navíc to chce mít trochu té smůly, aby vás problém postihoval. Já osobně mám nasazen kernel 3.18-rc6 (v rámci provozu distribuce Mageia 5) hned na dvou strojích (jeden desktop a jeden notebook, oboje platforma Intel) a žádné zamrzávání, padání či přímo panikaření kernelu se u mne neobjevuje. Pokud kernel 3.18 provozujete, pozorovali jste vy sami nějaké potíže?
Jistě lze ale také dodat, že s ohledem na to, jak málo se takovéto chyby objevují a kolik verzí kernelu je současně udržováno a updatováno, tak nezbývá než vývojářům poděkovat, že v rámci možností odvádějí výbornou práci.