Red Book: CD Audio (CD-DA) - ISO 908
Audio CD (Philips, Sony - 1980) jsou každému známá a jsou velmi populární v hudebním průmyslu. Velký úspěch tohoto média byl způsoben podstatným snížením cen nosičů a přehrávačů. CD-ROM technologie, jež využívala vývoje a výzkumu CD-DA (Digital Audio), se začala vyvíjet a používat daleko rychle-ji než se zprvu očekávalo.
Čistě z nostalgických důvodů připomínám, že první záznam a reprodukci zvuku uskutečnil v roce 1877 Thomas Alva Edison. Pravda, zvuk zaznamenal na fólií pokrytý váleček, což se s CD nedá srovnat. Uvědomíte-li si, že od tohoto nesmělého pokusu k hromadnému rozšíření LP desek uběhlo více než 50 let a dalších 50 let trvalo než jste si mohli doma přehrát vlastní kompaktní disk, je od uvedení CD v roce 1980 do dnešní doby vykonán obrovský skok. Dnes už domácí zápis na CD nikoho v úžas neuvádí samozřejmostí se začíná stávat zápis na DVD. Při této paralele mě vždy napadají otázky: "Co asi bude následovat?", "Bude ještě něco následovat?", "Je ještě možné vymyslet něco lepšího?". Ale praxe vždy ukáže, že rezervy ještě existují a zvláště ve výpočetní technice jsme se maximu ani zdaleka nepřiblížili.
Protože kompaktní disky byly vytvořeny pro hudbu, zůstal základním měřítkem i pro CD-ROM čas. Red Book definice popisuje, že kompaktní disk se skládá ze:
- Sektorů: Jak už jsme si říkali, každý sektor obsahuje 2 352 bytů pro audio data. Do jedné sekundy se vejde 75 sektorů
- Sekund: Každá sekunda obsahuje 75 sektorů. A 60 sekund je, jak známo, 1 minuta
- Minut: Minuta = 60 sekund
Šedesátiminutové CD tedy obsahuje:
60 minut × 60 sektorů × 75 sektorů = 270 000 sektorů
Poznámka: Povšimněte si, že informace o tom, že CD má například kapacitu 74m43s08f znamená, že se na něj vejde 74 minut, 43 sekund a 8 rámců (frames). Poslední číslo tedy nejsou setiny sekundy, ale rámce. Nikdy to tedy nebude větší číslo jak 74 (sekunda má 75 sektorů) - zde bohužel dochází k matení pojmů, sektor/rámec. Vy už totiž přece víte, že sektor má 98 rámců. V tomto případě ale splývá pojem sektor/rámec, ale rozhodně se nejedná o rámec, ze kterého se skládá samotný sektor! Maximální kapacita 80 min minutového CD pak tedy bude 79m59s74f (samozřejmě bez overburnu).
Data se přenášejí na výstup rychlostí 176 400 bytů/s (2 352 bytů × 75 sektorů). Proč je třeba přenášet data právě touto rychlostí odvodíme z parametrů nahraného zvuku. Ten musí být vzorkován 44,1 kHz (Nyquistův teorém; vzorkovací frekvence musí být alespoň jednou dvakrát taková, než vzorkovaný signál (přesnější vysvětlení najdete v odborné literatuře, částečně i v diskuzi pod článkem). Harry Nyquist tento teorém definoval již v roce 1928!), musí být 16bitový a stereofonní (2 kanály). Pak tedy:
2 kanály × 16 bitů × 44 100 vzorků = 1 411 200 bitů / 8 = 176 400 bytů
Nepodaří se vám tedy na CD-DA nahrát jiný WAV soubor, než ten, který právě vyhovuje těmto parametrům. Naštěstí pro ty, kdo potřebují nahrávat zvuk o nižší kvalitě, existuje spousta volně šířitelných utilit, které převedou i 8bitů mono na předepsané parametry (tyto převáděcí nástroje jsou často přímo integrované do nahrávacího programu, takže ani nezjistíte, že nahráváte WAV s nepovolenou kvalitou. Nero a další programy umí použít i MP3 a další formáty pro audio).
2 352 bytů uživatelský dat (hudba) |
Audio disk má také základní logickou strukturu. Ta se dělí na maximálně 99 stop (tracks) - obyčejně jedna stopa obsahuje jednu písničku. Tabulka o umístění těchto tracků (v minutách:sekundách:sektorech) se nachází na začátku disku. Podle ní hledá přehrávač jednotlivé písničky. Ne všechny tracky musí ale obsahovat audio data. Jak uvidíte, track systém může být například vytvořen také v tzv. mixed módu, jenž může obsahovat jak data pro počítač, tak i audio v oddělených stopách (tracks). Minimální délka tracku jsou 4 sekundy.
Každý track je pak ještě možné rozdělit pomocí tzv. indexů. Většinou obsahuje dva indexy 0 a 1. Index "0" značí pauzu (většinou 2s) na začátku tracku, zatímco index "1" označuje samotný začátek skladby. Již jsme o tom hovořili v souvislosti se subkanály (P-kanál). Další indexy se dají využít, když je třeba na CD umístit více jak 99 tracků.
Red Book dále dělí disk na tři části. Lead In, stopy s daty a Lead Out. Lead In (ještě si o tom povíme někdy více) obsahuje jakýsi seznam nahraných tracků (písniček) s jejich adresami. Datová část může obsahovat až 99 stop (písní). Poslední je Lead Out, který v podstatě CD přehrávači oznamuje konec CD. Lead Out obsahuje 90 sekund ticha, nebo též prázdný sektor.
Aby bylo zřejmé, jak náročná byla příprava tohoto formátu vzhledem k formátům následujícím, je dobré připomenout, že samotná definice Red Book neznamenala jen popis jednoho bloku na CD. Součástí definice je samozřejmě specifikace 16bitového audio záznamu a specifikace fyzického formátu, ale i popis optických parametrů, modulační systém a způsob opravy chyb nebo řídící a zobrazovací systém (jako jsou kanály subkódů - subcode channels - podle kterých jsou právě definovány CD+G (kanály R až W), CD+MIDI, atd.). O subkódech jsme si již říkali, zde tedy jen ve zkratce:
Existuje osm subkódů: P,Q, R, S, T, U, V a W. Každý z nich může být velký maximálně 4MB.
P kanál určuje začátek a konec audio stopy a používají ho některé starší rekordéry JVC/Pinnacle, Q kanál obsahuje informace, které je možné zapisovat a číst na mnoha rekordérech. Obsahuje hlavně informace identifikující jednotlivé skladby. Kanály R až W slouží pro uložení textových, grafických a dalších informací (CD+G, ).