Diit.cz - Novinky a informace o hardware, software a internetu

Archivace na CD-R v Národní knihovně ČR

diit.cz logo na CD-R serveru 1. dubna 2009
V Národní knihovně ČR se digitalizují již pátý rok vzácné rukopisy a staré tisky. Objem dat překročil 1TB a hodnota vznikajících dat je jen těžko vyčíslitelná. Vytvořená data se ukládají na CD-R disky již více než čtyři roky. Předpokládáme, že CD-R disky zůstanou ještě delší dobu základním mediem na němž jsou uchována tato data, která mají být bezpečně uchována pro budoucnost. Ve svém příspěvku chci poukázat na výhody i úskalí použití CD-R disků jako archivačního media a obecně na problematiku uchování CD disků pro budoucnost.

Prakticky všichni, kteří využívají CD-R disky pro archivaci dat, na CD-R vycházejí z předpokladu, že verifikace disku po vypálení je dostatečnou kontrolou, že data zapsána na disku jsou čitelná. Tento fakt bývá chybně vnímán tak, že data jsou uložena bezpečně. Bohužel tomu tak není. Záznam informací na CD disky z principu předpokládá, že záznam je vždy trochu poškozen, trochu neúplný.

Data jsou na disku uložena po blocích. Tyto bloky s užitečnými daty jsou opatřeny dalšími přidanými daty, která umožňují kontrolu, zda data ve čteném bloku jsou přečtena správně, dovolují ale také do určitého stupně poškození dat jejich rekonstrukci, a to (při mírném poškození) zcela bezpečně do původního stavu. Tato "nadbytečná" data tvoří cca 30% dat zaznamenaných na disku a nazývají se "redundance". Rekonstrukce dat probíhá ve více krocích, kde data se přerovnávají s příznaky zda pocházejí z perfektních nebo z podezřelých bloků, opakovaně dochází k rekonstrukci... Tato rekonstrukce dat je prováděna na hardwarové úrovni v signálovém procesoru současně se čtením dat. Na tuto činnost nemá nadřízený systém nijaký vliv a ani o jejím průběhu nemá nijaké informace. Pro ty koho zajímá tato problematika více, odkazuji například na knihu "Principles of Digital Audio, Ken C. Pohlmann, která vyšla poprvé r.1985".

Pro servisní účely je k disposici možnost monitorovat činnost signálového procesoru a vlastně zjišťovat, jak moc se signálový procesor musel snažit, aby data byla čitelná. Pro spolehlivé uchování informace na CD disku je žádoucí, aby disk minimálně využíval redundanci k rekonstrukci původních dat. Kvalitní disk lze pak velmi mechanicky poškodit. Poškození sice vyvolá potřebu využívat při čtení disku redundanci, avšak dokud není vyčerpána její informační kapacita, nic se neděje - disk je čitelný. Nežli začneme disk skladovat, používat, poškozovat, je žádoucí aby měl co nejkvalitnější záznam, aby bylo minimální "základní" využívání redundance. To dává jistotu, že disk hodně vydrží bez ztráty čitelnosti.

Bohužel, jediná informace, kterou poskytuje CD writer při verifikaci nebo CD mechanika při čtení, je informace zda rekonstrukce dat byla/nebyla úspěšná. Není k dispozici nijaká informace o tom, jak daleko je disk od hranice nečitelnosti. Toto je z hlediska archivace nebezpečný stav, protože mechanické poškození nebo degradace časem jsou ve svých výsledcích totéž. Pro archivaci je tedy třeba znát jak disk nutí signálový procesor využívat redundance, nikoli jen zda nyní je disk čitelný. Z hlediska posouzení kvality disku jsou užitečné i informace analogové, které poskytují informace o tom, jak kvalitní je geometrie zaznamenaných pitů , jaká je symetrie signálu ze snímací laserové hlavičky, což napovídá zda je medium správně exponováno. Je obecně známo, zvláště z počátků využívání CD-R, že některá media nemají ráda určité záznamové jednotky. To i nyní platí o discích, které jsou v některých svých vlastnostech blízko přípustných hranic. Znalost této problematiky vedla k tomu, že v Národní knihovně ČR bylo již od počátku archivace dat na CD-R využíváno zařízení dovolující tyto parametry měřit.

Redakce CDR (Google+)

Redakci CDR.cz tvoří tým mladých žurnalistů, které spojuje společná láska k moderním technologiím. Milují chytré gadgety, vylepšováky a nejnovější zařízení všeho druhu.

více článků, blogů a informací o autorovi

Diskuse ke článku Archivace na CD-R v Národní knihovně ČR

Středa, 14 Prosinec 2005 - 22:30 | Anonym | http://www.cdr.cz/

Zobrazit diskusi