Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Western Digital / HGST uvádí 14TB pevný disk

MTBF je 2,5 miliónů hodin. Nerozumiem tomuto pojmu odkedy ho uz vyse dekady vidavam. To mam chapat tak, ze disk sa pokazi v priemere az po 285 rokoch prevadzky? Lebo z tohoto viem hovno: https://cs.wikipedia.org/wiki/Střední_doba_mezi_poruchami a na zaklade ENG clanku mi to fakt vychadza tak, ze tie disky V PRIEMEIRE maju vydrzat 285 rokov (pretoze to je 2,5M hodin) https://en.wikipedia.org/wiki/Mean_time_between_failures, niektore 2M hodin, niektore 2,5M hodin, niektore 3M hodin ... proste nejake statisticke rozdelenie na sposob gausovej krivky a V PRIEMRE by to bolo 2,5M hodin. Co je ale totalna hovadina. Vsetky MTBF nad 50-100 tisic by mali byt v zasade velmi podozrive.

285 rokov !?!?!?!?! WTF ?

+1
0
-1
Je komentář přínosný?

2.5M hodin MTBF znamena, ze vyrobce vzal 10000 disku, vsechny naraz pustil a po 250 hodinach chcipnul prvni. Tenhle fakt prosel tvurcim procesem marketinkoveho oddeleni a vzniklo MTBF :)

MTBF ma jiste vyznam, akorat ne u HDD. Vyznam ma *mozna* AFR (annual failure rate - kolik procent disku daneho modelu vam za rok chcipne), pokud verite vyrobci ze si to neprikrasluje (haha).

+1
+1
-1
Je komentář přínosný?

Pokial sa marketing prepracoval k milionovym hausnumeram MTBF tymto sposobom, tak je to neskutocna, ale neskutocna hovadina najhrubsieho zrna. To mozem potom rovno scitat pravdepodobnosti a dostat pravdopodobnost napr. 1/2 miliardy % = vyjadruje to ten isty druh nezmyselnej zhovadilosti ako miliony hodin MTBF.

Aha, a keby zobral 100000 diskov v prvy by chcipol napr. po 100 hodinach (co je menej ako 250 hod v tvojom priklade), tak by to bolo 10M hodin?

Oproti tomu AFR je absolutne logicky koncept, zvycajne u solidnych znaciek a modelov byva aj pod 1%, u jednej nepodarenej smejdovej serie u jedneho vyrobcu to pred casom bolo aj 20%.

+1
0
-1
Je komentář přínosný?

K MTBF hausunmerům se nedopracoval marketing, ale jak někdo zmiňuje níže, je to technická záležitost. Vypadlo to z technické aplikace matematické statistiky, která se nazývá "Teorie spolehlivosti" - a zabývá se výpočty spolehlivosti složitých systémů, s přihlédnutím k redundanci, době zotavení z poruchy, ...

Vzniklo to už velmi dávno, cca před 100 lety, v souvislosti s prvními takto složitými systémy, což byly první velké telefonní ústředny, kdy jinak dostačující spolehlivost spojů a součástek v celkovém komplexu - protože jich bylo hodně - znamenala nefunkčnost celku (i samotné pájení mělo spolehlivost v řádu jen 10^5-6 a jelikož pájecích bodů v ústředně bylo třeba 5 mega, tak by celá nefungovala nikdy už jen z důvodu spojů).

Běžně se to učí na telekomunikačních oborech nebo dnes ohledně velkých instalací v datových centrech a rozlehlých sítích, kde se bez "Teorie spolehlivosti" nedá nic navrhnout. Nebo v leteckém/kosmickém průmyslu, prostě u všech složitých systémů. Mimo jiné se tím počítá předpokládaná cena servisu, potřebné člověkohodiny atd.

AFR je stejné hausenmero jako MTBF, jen to lépe vypadá, jedno se dá spočítat z druhého. AFR je vlastně převrácená hodnota, hodiny běhu za rok, v procentech. Často marketing "falšuje" AFR tím, že u neprofi disků nepočítá 24/7/365, ale jen pár hodin denně, 5 dní na týden, takže AFR na pohled vychází lépe.

Tato spolehlivostní čísla jsou ovšem sama o sobě k ničemu, protože jsou funkcí mnoha jiných hodnot, u disků například zátěže (a také teploty, chvění, ...). Takže běžné disky (např. WD RED) sice nemají coby MTBF uvedená vyloženě tragická čísla, ale ve srovnání třeba s HGST Ultrastary (konkrétně 7K4000) tragická jsou, jelikož platí jen pro velmi nízký roční nájezd (kdyby se udělaly testy s WD RED se zátěží, která je psaná u HGST Ultrastaru 7K4000, hodnoty by padly velmi nízko). Obdobně je to u novějších modelů.

+1
+2
-1
Je komentář přínosný?

> K MTBF hausunmerům se nedopracoval marketing, ale jak někdo zmiňuje níže, je to technická záležitost.

Je uplne jedno kdo a jak se k tomu dopracoval. Pokud vyrobce nezverejni presnou definici "Failure" v tom MTBF, a jak presne to vypocital, je to cele fraska, i kdyby to vypocital Einsten - a proto jsem pouzil slovo marketing.

> AFR je stejné hausenmero jako MTBF

Mozna to AFR, ktere udava vyrobce je hausnumero.

Rozdil mezi MTBF a AFR je ale ten, ze to prvni je vzdy fiktivni hodnota, kdezto skutecne AFR lze zjistit z realneho provozu. Uz i na diit-u byl parkrat zminena nejaka firma ktera ma tisice disku a pravidelne bloguje jejich statistiky kolik jim toho chcipne. A byly to rozhodne realnejsi cisla nez jakekoliv MTBF, pokud si dobre vzpominam tak nektere modely meli dokonce 10% AFR i kdyz beznejsi bylo 1-4%. A podobnych informaci bude na netu urcite vic.

EDIT: uz sem to nasel, firma se jmenuje Backblaze. Jeden Seagate tam ma 12% AFR :) takze asi tolik k tem milionum hodin..

+1
0
-1
Je komentář přínosný?

Jenže ta firma vyhodnocuje minulost, vyrobené disky se predikují do budoucnosti podle osazených součástek (u HDD asi hlavně ložiska, ramena hlav a nějaké ta elektronika - to garantují a vyhodnocují dodavatelé). Takže se tam osadí takové součástky ze kterých vzejde nějaké MTFB a podle toho si můžete vybírat pro diskovou farmu. Cílem není, že by to vydrželo 250 let, jednoduchým výpočtem se prostě dozvíte jaká je pravděpodobnost selhání za dobu co to chcete používat (třeba 5 let). +Matematická predikce samozřejmě nemůže odhalit vadnou sérii.

/tolik k těm milionům hodin/
Asi jste to pořád nepochopil a nečetl odkazy níže, ale tam nejde o miliony hodin (je to prostě konstanta), ale o pravděpodobnost selhání v nějaké časové periodě, což se dá z MTFB snadno vypočítat.

Problém je spíše, že to počítají podle typických scénářů použití (co je u enterprise disku 24/7/365 v pohodě, u greenů a jiných home disků není úplně jasně definováno, kolik hodin denně v chodu to má jako typicky být /moc ne/).

+1
0
-1
Je komentář přínosný?

Přesně jak píšete.

MTBF/AFR udávané výrobcem se predikuje ze spolehlivosti, množství, schematu (záleží na redundanci), ... jednotlivých součástek v disku. Není to experimentální hodnota, ale vypočtená syntetická hodnota, ... tedy většinou.

Úplně stejně se postupuje u výpočtu spolehlivosti například datového úložiště. Vezmete počet disků, jejich MTBF, způsob připojení, spolehlivost řadičů, serverů, kabeláže, ... a výsledkem je nějaké číslo.

Pokud je moc nízké (MTBF), tak je nutno koupit lepší disky s lepším MTBF nebo použít vyšší redundanci. Vzájemným porovnáváním se pak určí, zda není náhodou záhodno raději koupit dražší a lepší disky s vyšší spolehlivostí, přidat redundantní řadiče atd.

Je to pochopitelně složitější, u diskových úložišť pak počítáte dobu zotavení z chyb (dobu resilveringu pole) a díky MTBF pravděpodobnost souběžné další chyby. Pak dojdete například k tomu, že při daných discích a požadavcích musíte mít trojnásobné zrcadlení nebo podobnou šílenost (ale i to se někdy používá) - což je známka toho, že jste zvolili příliš mizerné disky.

Je to docela komplexní věc a velmi důležitá záležitost, profesionálnější datová centra na tyhle věci zaměstnávají spešl matematika.

Máte absolutní pravdu, že pokud výrobce nedá k dispozici, za jakých provozních podmínek to platí, jedná se o hádání z křišťálové koule a pro praxi je to úplně k ničemu. Což horší výrobci, hlavně u horších disků, nedávají.

Také je to zatemněno těmi scénáři použití - jak jsem už uváděl, například takový WD RED disk by proti stejné kapacitě HGST Ultrastar 7K4000 vypadal jako totální šunt (což je :-) ) a nikdo by si to nekoupil.

Někteří provozovatelé pak dojdou vlastními statistikami provozu k určité optimalizaci, známá je firma Backblaze, která to dokonce publikuje. Několikrát tyhle věci publikoval i Google, ale je to spíše výjimečné, protože výrobci disků to nesou značně nelibě. :-D

Backblaze dokáže provozovat mizerné desktopové disky v 24/7/365 provozu, jelikož vyvinul vlastní protiotřesové racky, do kterých to montuje, a hlídá teplotní poměry. Dokonce to dal k dispozici jako opensource hardware. Kromě toho svým soft řešením rozkládá zátěž na jednotlivé disky, aby je nepřetížil, to je také velmi důležité.

Dnes tato znalost (spolehlivostní matematiky) pomalu ale jistě upadá v zapomnění - alespoň v oboru datových úložišť - protože se objevily obrovské SSD disky (15 a více TB) s vysokými MTBF a provozovatelé za vypočtený návrh spolehlivosti už nechtějí platit jako dříve při točivých discích. Velkých zákazníků, kteří to nutně potřebují, je řádově méně. Což občas vyústí ve "fatal error", minimálně v podcenění rozpočtu na servis. :-D

+1
+1
-1
Je komentář přínosný?

"2.5M hour MTBF2 rating"

"MTBF and AFR specifications are based on a sample population and are estimated by
statistical measurements and acceleration algorithms under typical operating conditions
for this drive model. MTBF and AFR ratings do not predict an individual drive’s reliability
and do not constitute a warranty."

Tolik nahled do datasheetu disku.

V prekladu zjednodusene: je to cislo vycucane z prstu a neni to cislo, ktere by predvidalo spolehlivost jednotlivych disku. Cislo je zalozene na vzorku disku a odhaduje se podle statistickych mereni za typickych provoznich podminek. Bla, bla, bla, ....

+1
+1
-1
Je komentář přínosný?

To se nesmí brát doslova, je to statistická hodnota.

MTBF is a statistical term relating to reliability as expressed in power on hours (p.o.h.) and is often a specification associated with hard drive mechanisms.
It was originally developed for the military and can be calculated several different ways, each yielding substantially different results. It is common to see MTBF ratings between 300,000 to 1,200,000 hours for hard disk drive mechanisms, which might lead one to conclude that the specification promises between 30 and 120 years of continuous operation. This is not the case! The specification is based on a large (statistically significant) number of drives running continuously at a test site, with data extrapolated according to various known statistical models to yield the results.
Based on the observed error rate over a few weeks or months, the MTBF is estimated and not representative of how long your individual drive, or any individual product, is likely to last. Nor is the MTBF a warranty - it is representative of the relative reliability of a family of products. A higher MTBF merely suggests a generally more reliable and robust family of mechanisms (depending upon the consistency of the statistical models used). Historically, the field MTBF, which includes all returns regardless of cause, is typically 50-60% of projected MTBF.

Pro normálního smrtelníka to znamená maximálně to, že zařízení s vyššími hodnatomai by měla být spolehlivější, ale pokud člověk vlastní jeden kus, neznamená to zase tak moc, protože se může třefit do kusu, který je na spodní straně spolehlivostní křivky, i když série je jinak velmi spolehlivá.... Pokud stavíte diskovou farmu, tam už to je poněkud validnější hodnota.

+1
0
-1
Je komentář přínosný?

Takže si to shrneme:
MTBF = Meaningless Total Bullshit Figure

+1
-1
-1
Je komentář přínosný?

je to jen takove kouzlo se slovicky dle ktereho se da odvodit i kolik disku chcipne jeste behem zaruky (nechce se mi to pocitat) ale odhadem bude stred nekde mezi 3-5% takze kdyz si koupite 100 disku tak vam behem zarucni lhuty pravdepodobne odejde cca 3-5 ks ale muze umrit klidne 100 ks nebo taky 0 ks :D cim delsi doba tim se vice zvysuje pravdepodobnost poruchy ...no a z tohodle predpokladu s ohledem na vysledky spolehlivosti prodeju predchozich rad si vypocitali tech 285 let :) ac se ty disky minimalne kvuli vlastnostem helia a plosnym spojum ridici elektroniky nemaji sanci takoveho veku vubec dozit :)

+1
+1
-1
Je komentář přínosný?

Ve skutečnosti je to jen matematika (používaná široce v průmyslu), která umožňuje odhadnout pravděpodobnost selhání a podle toho systém dimenzovat.

http://www.profaceamerica.com/sites/default/files/cms/cms/resource_libra...

Výpočet na druhé stránce to dost jasně osvětluje na příkladu HDD.

+1
+1
-1
Je komentář přínosný?

Komu zalezi na svych datech kombinaci SMR a Helium jednoduse nebere(tak jako u SSD TLC a QLC pametove bunky). Radsi pevny disk o neco kapacitne mensi(8TB) bez Helia s PMR nez si lamat hlavu na ztracenych TB dat.

+1
0
-1
Je komentář přínosný?

Typickym uzivatelem bude pocitam Facebook a Google a dalsi podobni, co maji na svych pocitacich hromadu dat, za ktere nikomu neruci. ;-)

+1
0
-1
Je komentář přínosný?

typicky zakaznik muze byt i korporat kde potrebuji levne "skladiste" na data + levne reseni zaloh ...odejde jeden disk je nahrazen jinym atd. dulezite to nemit na jednom disku a bezpecnost zaloh tim rapidne stoupa :)

+1
+2
-1
Je komentář přínosný?

Mozna neruci ale prusvih by meli strasny. Kdepak, Facebook a Google (a Amazon) maji vsechny disky nejmene v RAID 1 a proto si muzou dovolit kdyz jim kazdy den nejaky odejde.

+1
0
-1
Je komentář přínosný?

komu opravdu zalezi na datech nevoli jen jednu moznost zalohy :) navic kolik lidi beznych lidi ma opravdu tolik dulezitych dat aby uzivili 14 TB disky troufam si tvrdit ze takovych bude minimum a ti co se tim zivy apod. to maji davno poresene takze i pro takove ucely je tento disky vhodny ...ale jo plno lidi si tu hraje na to jak jim strasne zalezi na datech data maji ulozene na externaku v supliku (bez duplikace) a pojem ECC, zfs btrfs atd atd jim vubec nic nerika :) a pak se jen divy co to kolikrat s daty udela i kdyz je disk v poradku a nedej boze kdyz se poskodi :)

+1
+3
-1
Je komentář přínosný?

Existuje nejakej prehled disku, kde by bylo videt pouzity technologie? Tzn. ktery jsou jeste normalni a ktery uz maji neco podezrelyho, cemu se opatrnej uzivatel muze chtit vyhnout? Ja si to vzdycky v nejaky novince prectu, zase to obratem zapomenu a potom kdyz neco vybiram, tak nevim.

+1
+1
-1
Je komentář přínosný?

První ukazatel je, že je to SMR disk, případně je navíc plněný heliem.

Ale na speciální účely dobré, třeba archivace, kdy se postupně zapisuje a někdy se z toho něco přečte asi OK. Ale výkonnostně je to nic moc.

+1
0
-1
Je komentář přínosný?

"cemu se opatrnej uzivatel muze chtit vyhnout?"

Opatrnej uzivatel se momentalne pocitam vyhne vsemu nad 3TB. (Osobne jsem dlouho prosazoval strop 2TB, ale myslim, ze uz i 3TB je dostatecne dlouho na to, aby ty disky byly provereny. Samozrejme muzou optimalizovat vyrobu, neco zmenit, zalohovat je nutne vzdy.)

+1
0
-1
Je komentář přínosný?

opatrny uzivatel se vyhne zaloham na jeden "disk" :)

+1
+2
-1
Je komentář přínosný?

Nedávno jsem málem přišel o část dat na pevném disku 2,5 palce SATA, připojeném na redukci USB, protože jsem jej zasunul do počítače již při startu Windows a systém na něm něco podělal a poškodil celý oddíl. Naštěstí jsem měl důležité věci již vypálené na blu ray DISCÍCH. To je vše co bych dodal k této problematice.

+1
+1
-1
Je komentář přínosný?

Tak to jses druhej clovek (jeste muj kamos), kterej vede BluRay. Mechaniky sice zlevnily, ale disky nic moc cena a furt je to pomaly.
Osobne data o ktera chci prijit na jednom HDD nebo SSD, data o ktera nechci prijit na dvouch HDD a data o ktera nemuzu prijit na trech HDD. Minimalne jeden HDD je offline a pripojuji jen pro zalohu pres USB. Prsknout ho tam pri startu Windows neni dobry napad vzhledem k tomu, jak se Windows k USB chovaji.

+1
+1
-1
Je komentář přínosný?

- cena za 1GB kvalitniho media se pohybuje od cca koruny po tri koruny (nepocitam opravdu velke packy BD disku kde je vyhodnost jeste vetsi)
- cena za 1GB u prumerneho HDD pohybuje cca 1-2 koruny :)

jak se Windows k USB chovaji ? :)

+1
0
-1
Je komentář přínosný?

Napriklad az od Windows 10 rozlisuji externi disk, driv ti na nej prdly instalak windows update jakoby se nechumelilo.
Windows v defaultu po odpojeni disku kliknutim na ikonu ho skutecne neodpoji a klidne si na nej jeste treba minutu dve hrabou. Musi se to nastavit pres registry. Velmi casto USB neodpoji vubec, staci aby se kousnul nejakej svchost. Az teprve s Windows 10 dochazi pomalu k standardni praci s USB, kterou umi linux uz desitky let.
Jestli obcas ctes me komenty, tak jsem sice byvaly uzivatel linuxu, ale zadny fanousek nejsem, takze me nelze podezrivat z nadrzovani, ale v linuxu nikdy zadny problem s USB, za to na Windows uz se mi taky stalo, ze jsem musel USB disk preformatovat, protoze se Windows k nemu chovaly nekorektne a rozbily nejspis FAT.

+1
0
-1
Je komentář přínosný?

Já mám pro změnu zkušenost s Acronisem, který je postaven na Linuxu - pokud je disk připojen lokálně (např. přes USB) a na disku NTFS je chyba (kterou nejspíše zavinily Windows, typicky mapa obsazených sektorů), tak Acronis (potažmo Linux) ten disk velmi pravděpodobně odpraví (po zápisu image zmizí celý oddíl). Windows s tou samou chybou dovedou žít dlouho, dokonce i od instalace Windows několik měsíců.
Takže spolehlivost archivu není jen ve spolehlivosti média, ale i v míře kontroly uložených dat.

+1
0
-1
Je komentář přínosný?

Taky pálím na BD, pro větší objemy dat je to jedna z mála levných možností. Páska je přecijen na doma nebo menší firmu trochu moc.
Windows se obecně chovají divně, ale nevím nic o tom, že by zrovna start s připojeným USB měl být něčím zvláštní.

+1
+1
-1
Je komentář přínosný?

Já taky archivuji fotky na BD. Je to asi nejlevnější možnost diversifikace archivu mimo oblast smazatelných/zavirovatelných/zašifrovatelných HDD (kde mám 4 různé kopie). Hlavně ta smazatelnost je u HDD nepříjemná, protože když někdo/něco omylem smaže něco co smazáno být nemělo, tak se to prozrcadlí i do záloh, ve většině případů bez povšimnutí.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.