Uživatelský test: 8TB Seagate Archive na „domácí zálohování internetu“
Kapitoly článků
Seagate Archive je disk specifický několika parametry. Tím prvním je kapacita. 8 terabajtů dnes vypadá celkem zajímavě, byť to není nejvyšší vyráběná varianta mezi disky (a už vůbec ne mezi SSD, které se dělají i větší, ovšem stojí raketu) a za chvilku to možná bude něco jako dnes 1TB disk.
Tím druhým je cena, neb je známo, že právě tyhle disky mají nejlepší poměr ceny za jednotku dat. Disk se dá pořídit už lehce pod 6 tisíc Kč, já se však rozhodl jít s cenou trošku nad 6 tisíc a vybírat tam, kde uvádí 3letou záruku. Disk bych sice mohl reklamovat přímo u výrobce, ale je to pak už zbytečná komplikace.
No, a tím třetím parametrem je specifický způsob zápisu, který vychází ze skutečnosti, že zápisová hlava už je prostě širší než stopa. Myslím tu část zápisové hlavy, která se o ten zápis skutečně stará. A tak došlo na technologii Shingled Magnetic Recording (neboli zkráceně SMR), kterou asi nejen já nazývám familiérně „šindelový zápis“. Jakkoli se na řadě míst tvrdí, že se ty stopy „překrývají“ jako šindele na střeše (a řada obrázků toho níže nevyjímaje to „podporuje“), ve skutečnosti se nestane nic jednoduššího, než že se data na sousední stopě znehodnotí.
Zdroj: digitalpreservation.gov
Čtecí hlava (tedy ta část, která se o čtení stará) je stále dostatečně malinká na to, aby dokázala přečíst jen tu jednu stopu - tedy to, co z ní po zápisu další stopy zbude. S ohledem na fyzickou velikost bitů a jejich malou vzdálenost se dá dnes i bez nadsázky říci, že data jsou při čtení z ploten odhadována s překvapivě vysokou spolehlivostí.
Zdroj: open-zfs.org (© Seagate)
Zkrátka máme tu čest s technologií v podstatě na hranici možností před tím, než nastoupí technologie úplně jiná. Měla by to být de facto magnetooptika, kdy maličký laser bude zahřívat místo určené k zápisu tak, aby zápisová hlava, která už v podstatě víc zmenšit nejde, zapsala jen právě toto zahřáté místo a okolí nebylo ovlivněno. V pevných discích se jí, jak už jistě víte, bude říkat HAMR neboli Heat Assisted Magnetic Recording a na trhu by se měla objevit snad ještě letos.
A protože mně osobně přijde taková technologie i vzhledem k tomu, jak dlouho je na trhu, subjektivně nedůvěryhodná, rozhodl jsem se, že po nějakém čase koupím další takový disk, a to v jiném obchodě, abych zvýšil pravděpodobnost, že ty dva disky nesjely z výrobní linky alespoň z jedné směny, když už ne jeden den ;-). Půjdou totiž do mirroru a fakt bych nerad, aby se v případě závady odporoučely oba najednou. Dnes to ale bude o jednom kousku.
Šindelový zápis (s dovolením budu takto zjednodušovat) má z principu jedno úskalí. Není možné zapsat data do jedné stopy tak, aby tím nebyla přepsána stopa následující. Už z toho je jasné, že disk se musí dělit do jakýchsi zón (někdy se jim též říká pásy - bends) sestávajících z několika stop. Kolik je stop v každé zóně, není úplně známo (asi by se to dalo odhadnout), ale to nevadí, protože důležitější je, kolik dat taková zóna pojme. Pro Seagate Archive disk jsem tento údaj nenašel, takže čistě pro zajímavost: Seagate Surveillance disk (též 8TB či 6TB SMR), který je ale na rozdíl od Seagate Archive host-aware diskem, má těch šindelových zón celkem 29808 a každá má 256 MiB. To nám dává krásných 8 tera.
Jinými slovy: teoreticky by se dalo na disk dostat ještě o trochu víc dat, ale s takovým diskem by se muselo pracovat stejně jako kdysi dávno s CD-R: médium by se muselo zapisovat jako celek od začátku až do konce bez možnosti přepisu něčeho uprostřed. To je u pevného disku s požadavkem na náhodný přístup (především co se zápisu týče) krajně nežádoucí, takže musí být zkrátka disk rozdělen do zón, kde je vždy poslední stopa „širší“, aby se při jejím přepisu nezasáhlo do stopy další, která je začátkem další zóny.
S jednotlivými zónami se pak ale opravdu pracuje jako s „CD-R zamlada“: chceme-li přepsat nějaká data v zóně, disk ji musí načíst, co je potřeba změnit a následně znovu zapsat, a to minimálně od místa, kde ke změně došlo. Teoreticky by šlo rekonstruovat jen výseč zóny odpovídající např. omezenému počtu sektorů (třeba jednomu), ale pokud je mi známo, tak se to nedělá. Zóna se zapisuje buďto jako celek, nebo od požadované změny do konce.
Když jsem tento disk kupoval, s popsaným jevem jsem počítal. Není to tedy tak, že bych to považoval za negativum. Vyšší kapacita si při dané ceně zkrátka žádá jisté kompromisy a tady to tedy očekávám v rychlosti zápisu. Čtení by mělo být v pohodě. Co jsem ale vůbec netušil, je, jak to disk (resp. jeho firmware) interně ve skutečnosti řeší. Měl jsem dojem, že se při požadavku na změnu jednoho sektoru pásu musí celý pás načíst, v interní paměti pozměnit a zase zapsat. Jak v tomto článku uvidíte, realita je trochu jiná a pokud má disk zóny velké 256 MiB a cache jen 128 MiB, tak by to ani dost dobře nešlo.
Disk, který jsem koupil, pochází z běžného prodeje, nejde tedy o žádný „engineering sample“ či nějaký takový vzorek. Tyto disky už na trhu chvilku jsou, takže předpokládám, že se alespoň vychytaly nějaké prvotní mušky. Přesto musím neustále myslet na to, že se klidně může stát, že když odejde 8TB disk, vezme s sebou v krajním případě klidně i celých 8 TB dat (pakliže jich tam tolik bude). Moc mě neuklidňuje ani fakt, že disky většinou (na rozdíl od SSD) neodchází naráz, ale z jejich chování lze vyčíst problémy dříve, než budou fuč všechna data, takže se dá ještě něco zazálohovat. Totiž šindelový zápis je v tomhle vlastně ještě neprověřený (disky nejsou na trhu tak dlouho, aby vznikly smysluplné statistiky jejich poruchovosti). I solidních recenzí je pomikru a navíc jsem v průběhu článku došel ke zjištění, že všechno se může podělat mnohem snáz, než to na první pohled vypadá.
Co mě naopak těší, je určení disků do provozu 24/7, protože ten disk u mě opravdu pojede nonstop. Strčím ho do počítače, který slouží jako server a nevypíná se (žádný speciální NAS, prostě PC). Poběží tam Windows a souborovým systémem nebude nic jiného než NTFS. Jak jsem zmiňoval, hodlám si tam „zazálohovat internet“ (bez porna, protože jednak nemá smysl koukat pořád na to samé dokola a jednak by mi v takovém případě 8TB disk nestačil ;-), to znamená spíše velké soubory, samozřejmě i nějaké malé, ale především ležáky, žádná živá databáze nebo data, která se často mění (a když už, tak jen v malém množství).
Ono to „zálohování internetu“ není vůbec od věci, protože jak je ten internet stále dynamičtější a živější, čím dál tím častěji se stává, že co je tam dnes, tam zítra být nemusí. A upřímně: cloudu v tomhle dvakrát nedůvěřuji. Co je doma, to se počítá. Když mi odejde disk, mohu ho vzít a dát ho specializovanému servisu k obnově dat. Když skončí provozovatel cloudu (jakkoli to považuji za méně pravděpodobné, než že mi odejde disk), tak to do žádného servisu už nedám a pápá data.
A ještě než půjdeme dále, odpovím na jeden potenciální dotaz: ne, nemám žádná životně důležitá data, bez kterých by se mi zbořil svět. Ale jsou mezi nimi taková, bez kterých by ten svět byl o něco smutnější. A taková, kterých si cením nejvíce, samozřejmě rozmnožuji na větší množství různých úložišť na různých místech. 8TB Seagate Archive bude taková „velká L6 cache“.