Případová studie: Disková pole Western Digital v praktickém nasazení
Když jsme před několika lety vybírali v Aiře pevné disky pro naše disková pole postavená na ZFS filesystému, poměrně důkladně jsme testovali několik řad pevných disků od různých výrobců.
Výsledky našeho dlouhodobého testování byly jednoznačné a v podstatě ani ne příliš překvapivé. Jedním z důležitých faktorů pro výběr disků do diskových polí, je použití disků určených pro práci v RAIDu a to především pro jejich chování v případě chyby. Na rozdíl od běžného disku, je u RAID disku žádoucí, aby se nesnažil případnou chybu donekonečna opravit, ale využil redundance dat v RAIDu.
Výběr disků
V případě použití běžných desktopových disků (a to i vyšších řad) do RAIDových polí se totiž stává, že disk se případnou chybu snaží opravit často i velmi dlouhou dobu. U samostatného disku je toto řešení žádoucí, data je potřeba zachránit/obnovit pokud možno za každou cenu. U RAIDového pole se ale v závislosti na řadiči může stát, že chyba se čtením vadného sektoru zaneprázdní celé pole na dlouhé minuty a jedna z největších výhod RAIDu ztrácí svůj význam.
Disky určené pro RAID mají limit na opravu chyb většinou kolem 7 sekund, po které vrátí chybu a řadič může rozhodnout, zda disk z RAIDu odpojí nebo jen využije redundance a potřebná data si načte z jiného disku.
Chování v případě chyby však není jediným parametrem při volbě vhodného disku. Při našem výběru jsme se soustředili na několik dalších klíčových parametrů. Jedním z nich je MTBF, tedy střední doba mezi poruchami (Mean Time Between Failures), která je výsledkem statistického výpočtu na základě testování relevantního počtu disků výrobcem. Způsob výpočtu MTBF se může do značné míry lišit, a přesto že se jedná pouze o statistický odhad, je to jeden ze zajímavých ukazatelů spolehlivosti disku při porovnání konkrétních modelů stejného výrobce. Mezi nejlepší disky v tomto směru patří disky RE od Western Digital, u kterých je hodnota MTBF udávána 2 miliony hodin.
Dalším ukazatelem spolehlivosti disku je Non-recoverable read errors per bits read, který udává nejhorší možný scénář, při kterém se objeví neopravitelná chyba čtení. U většiny disků se tato hodnota udává jako menší než jedna chyba za 10 na 14 bitů, například u disků Seagate SV35 nebo WD RED. Tento údaj odpovídá méně než jedné chybě za 12.5 TB přečtených dat, což není v dnešní době nikterak závratné číslo a například u rozsáhlých RAID5 polí může být do určité míry nebezpečné. Jak však bylo zmíněno, je to „nejhorší možný scénář“ a v praxi bude spolehlivost disků reálně vyšší.
Kvalitnější pevné disky, jako například WD RE4 nebo WD RED Pro udávají tuto hodnotu jako menší než jedna chyba za 10 na 15, tedy desetkrát lepší než běžné disky, což byl pro nás další argument pro nasazení do produkčních polí.
Dalšími parametry, které jsme zohlednili ještě před samotným testováním disků, byly počet load/unload cyklů a při nárocích na výkon také rychlost otáček diskových ploten a velikost cache paměti. Na základě výkonnostního testování, které provádíme s každou novou řadou pevných disků a dlouhodobých zkušeností, které s danými disky máme v reálném produkčním nasazení upravujeme volbu konkrétních disků pro nasazení na našich serverech a diskových polích.
Řešení, které jsme zvolili
Pro servery a produkční disková pole s nejvyššími nároky na výkon a spolehlivost proto v současné době používáme disky WD RE4 a to jak v SAS tak v SATA variantě. S těmito disky máme dlouhodobě nejlepší zkušenosti a ani po několika letech jsme ze zhruba 60 disků WD RE4 při plném vytížení neřešili jediný problém či reklamaci, což je oproti minulosti, kdy jsme se spolehlivostí disků měli problémy, obrovský posun vřed. Tyto disky používáme pro disková pole složená ze čtyřech, častěji ale z deseti a více disků tam, kde naši klienti požadují co největší počet operací za sekundu a produkční nasazení s minimálními výpadky. V současné době používáme tyto disky například pro servery České televize, kde se podílíme na správě a vývoji jejich webového řešení.
Díky vysoké odolnosti je využíváme také pro offline zálohy, tedy v případech, kdy je potřeba data fyzicky přenášet mezi různými lokalitami. RE disky od Western digital se mimo jiné objevují také na předních místech v reportech společnosti Blackblaze, která reálně monitoruje velké množství disků v reálném nasazení, což je dalším potvrzením našich dobrých zkušeností.
Druhým typem disků, které v současné době ve velké míře používáme, jsou disky WD RED. Tyto disky jsou určené do menších polí a my je nejčastěji nasazujeme do čtyř až šestidiskových polí určených pro zálohování, případně vývoj. Tyto disky mají skvělý poměr cena/výkon/kapacita, což je pro záložní řešení optimální.
V posledním roce jsme se pro některá diskové pole rozhodli použít také relativně novou řadu disků WD RED Pro, která je určena pro disková pole až do kapacity 16 pozic. Svými vlastnostmi a parametry jsou tyto disky mnohem blíže diskům WD RE4 (viz parametry rozebrané v úvodu článku), jsou však cenově dostupnější a proto od nich očekáváme velmi dobrý poměr cena/výkon. Podle několika prvních nasazení z loňského a letošního roku tyto disky zatím naše očekávání potvrzují.