Diit.cz - Novinky a informace o hardware, software a internetu

RAID

Síťové úložiště
Na testy síťových úložišť, které jsme vám přinesli v uplynulých měsících, dnes navážeme článkem, ve kterém bychom vám chtěli popsat, jak si takový NAS postavit sami. Jaké zvolit technologie, software, nastavení, na co si dát pozor a jaké jsou výhody či nevýhody vlastního řešení.

RAID

Jako operační systém jsme zvolili linuxovou distribuci Debian. U diskového pole preferujeme stabilitu před nejnovějšími verzemi balíčků, ale nic nebrání tomu, využít jinou distribuci dle vašich preferencí. K dispozici jsou i přímo připravené distribuce právě pro stavbu diskových polí, jako například OpenFiler, FreeNAS nebo NexentaStor. Každý z těchto systémů nabízí vlastní řešení speciálně pro síťová úložiště, přičemž každý z nich k tomu využívá trochu jiné nástroje. Snaží se především o jednodušší konfiguraci (pomocí webového rozhraní) a implementací některých konkrétních nástrojů s přidanou hodnotou (ZFS, způsoby kešování, replikace dat, deduplikace atd.). Některé z nich si v budoucnu určitě ještě blíže představíme. Zmíněný Debian jsme v tomto případě zvolili pro jeho univerzálnost, podporu komunity a bohatému repozitáři dostupných balíčků.

Operační systém jsme nainstalovali na dva disky v RAID1. Nyní je potřeba rozhodnout, jak využít zbylých 12 disků. V úvahu přicházejí kombinace RAID6 a RAID10 a tak jsme 12 disků rozdělili na dvě disková pole a porovnali výkon obou variant. Disková pole jsme vytvářeli pomocí programu mdadm, tedy čistě softwarový RAID, kdy veškeré výpočetní operace provádí procesor.

Například RAID10 ze šesti disků vytvoříte takto:

mdadm --create /dev/md1 --level=10 --raid-devices=6 /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1 /dev/sde1 /dev/sdf1

Pro testování jsme zvolili tiotest, kterým jsme testovali vždy 32 threadů a v každém z nich 1GB soubor. Každý test proběhl vždy čtyřikrát za sebou a výsledná hodnota je průměrem z výsledků těchto čtyř testů. Pro získání každé hodnoty ve všech následujících grafech tedy proběhl přenos 128GB dat, které si tiotest vygeneroval.

Disky byly v tomto testu připojeny přímo k host bus adaptéru pomocí SATA kabelu. V tomto testu vítězí RAID10, což je konfigurace, která se nám zdá výhodnější. Vzhledem k použití diskového pole je ale třeba zvolit především správný způsob propojení serverů s diskovým polem. Jako možné řešení jsou NFS nebo iSCSI. Vyzkoušeli jsme tedy rozdíl mezi NFS a iSCSI nad oběma diskovými poli.

Tento graf nám ukázal dvě zásadní věci. Jednak je vidět zajímavý propad ve výkonu v případě čtení přes iSCSI, což má na svědomí nastavení I/O plánovačů, jak si ukážeme později, a druhou zajímavou věcí je lepší výkon RAID10 v případě náhodného zápisu (a z principu i v zápisu obecně). Proto jsme jako konfiguraci diskového pole pro naše síťové úložiště zvolili RAID10, která se nám zdá jako optimální poměrem výkon/kapacita/bezpečnost dat vzhledem k našemu cíli.

I když má NFS v prvním testu mnohem lepší výkon, soustředili jsme se dále na iSCSI. Jednak proto, abychom odhalili příčinu onoho poklesu výkonu, ale především proto, že práce s diskovým polem přes iSCSI má některé nezanedbatelné výhody. V některých případech je velice výhodné, že s logickými jednotkami připojenými přes iSCSI pracujete v systému naprosto stejným způsobem, jako s disky připojenými lokálně. Můžete nad nimi například vytvářet další disková pole (lze využít při replikaci dat na více diskových polí) a navíc každá logická jednotka pracuje nezávisle na ostatních a například v případě poškození filesystému to ostatní logické jednotky, respektive servery nad nimi pracujícími, vůbec neovlivní.

Otázkou zůstává, jak využít našich 12 disků, zda je lepší vytvořit dvě šestidisková pole nebo jedno dvanáctidiskové. Ve druhém případě sice získáme navíc důležité IOPS, na druhou stranu v případě nějakého hardwarového problému, kdy bude potřeba diskové pole nouzově připojit k jinému serveru či řadiči, může být práce s tolika disky v jednom poli komplikovanější. Navíc možnost odstavit jedno diskové pole a druhé nechat v síťovém úložišti funkční se může v některých nouzových případech také hodit. Záleží na konkrétním využití. Nakonec jsme tedy zvolili dvě pole po šesti discích.

Vytvářet opravdu velká disková pole z více než 12 disků se již příliš nedoporučuje, při velkém množství disků velmi rostou nároky na výkon procesoru, v některých konfiguracích výrazně narůstá náročnost a doba obnovy při výpadku disku a rychlost takového diskového pole s dalšími disky již pak neroste nebo dokonce klesá.

Filip Marvan

Administrátor serverů a diskových polí pracující pro společnost Aira Group.

více článků, blogů a informací o autorovi

Diskuse ke článku Postavte si vlastní NAS

Úterý, 19 Červen 2012 - 12:05 | Filip Marvan | FIO jsme také zkoušeli, funguje fajn. Tiotest...
Úterý, 12 Červen 2012 - 22:11 | X Polish | Jako dobry testovac vykonu povazuji fio (http://...
Úterý, 12 Červen 2012 - 09:50 | Filip Marvan | Souhlasím, také se nám z hlediska domácího...
Pondělí, 11 Červen 2012 - 19:24 | AK | Já jsem dlouho zvažoval všechny možnosti, pro a...
Pondělí, 11 Červen 2012 - 09:53 | Filip Marvan | Vypadá to zajímavě, nicméně nejlevnější...
Neděle, 10 Červen 2012 - 18:47 | pita_lbc | Osobne muzu doporucit na male NAS Microserver od...
Pátek, 8 Červen 2012 - 17:17 | Aigor | Obávám se, že univerzální článek na téma "...
Pátek, 8 Červen 2012 - 10:38 | Filip Marvan | Tak samozřejmě že by se o tématu dalo psát ještě...
Čtvrtek, 7 Červen 2012 - 23:54 | Peter Posvanc | Ano, na dalsej stranke to bolo spomenute, je...
Čtvrtek, 7 Červen 2012 - 16:05 | Filip Marvan | Pokud s tímto polem dosahujete sekvenčních...

Zobrazit diskusi