Zkreslení, která posloucháme
Kapitoly článků
Geoff Emerick, technik alba Sgt. Pepper od Beatles: “Spousta toho, co dnes vychází, je totální průšvih. Chybí celé vrstvy zvuku a to jen proto, že nahrávací společnosti podezřívají posluchače, že nedokáže otočit volume doprava, když to potřebuje.”
Existuje několik způsobů, jak změnit poměr mezi nejhlasitějšími a nejtiššími pasážemi hudebního záznamu a vypíchnout tak některé nástroje nebo učinit celý záznam hlasitějším. Drtivá většina těchto postupů však významně redukuje původní dynamické vlastnosti nahrávky.
Jednou z nejméně škodlivých možností je normalizace záznamu: jde o to, že najdeme nejhlasitější špičku a tu potom spolu se zbytkem nahrávky vytáhneme až k úrovni 0dbFS. Normalizace nemění poměry mezi špičkami a průměrnou hlasitostí a je tak cestou, jak vykřesat z CD záznamu maximální hlasitost bez zkreslení a dynamických změn.
Někdy se stane, že pouze jeden nebo několik málo tranzientů výrazně vykmitne nad průměrnou hlasitost a normalizací bychom si příliš nepomohli. Proto přichází ke slovu limitace: pokud zkrotíme ojedinělé špičky, můžeme celý signál vytáhnout k vyšším hlasitostem. Je-li celý proces proveden citlivě, je možné dosáhnout vyšší hlasitosti záznamu s minimálním ovlivněním jeho kvality. Sice něco obětujeme, ale 99% hudební informace zůstává zachováno. Příkladem limitace je například album Paula Simona Surprise (1996, Warner). Ilustrací může být i skladba Katrin Who Smiles (Goaskinviellja, 521 388-2 Verve, 1993) od Mari Boine: na obrázku vidíte fantastický dynamický rozsah nahrávky, který se pohybuje na úrovni 15dBFS. Pokud si prohlédnete v dostatečném zvětšení špičky okolo 4’48 minuty, uvidíte, že jsou ořezané (mají plochý vršek).
Peter Mew, technik klasických alb Davida Bowieho: “Dříve tiché pasáže jsou dnes hlasité a z těch hlasitých se stalo bzučení. Mozek není naprogramován na příjem bzučení. CD se stávají psychicky unavující a prakticky neposlouchatelná.
Takovéto ořezání (izolovaný clipping) je na albu ojedinělé a v jeho důsledku může být nahrávka o nějaké 3dB hlasitější - těch několik málo obětovaných tranzientů není uchem postřehnutelných. Podobný postup zvolil i John Atkinson při masterování alba Attention Screen Live At Merkin Hall (STPH018-2) pro label Stereophile: bylo sice možné dostat na záznam špičky všechny a neořezané, ale pro jeho kvalitu to nebylo nezbytné. Dynamický rozsah pohybující se mezi 10 a 15dBFS je u jazzové nahrávky velmi slušný.
Pravděpodobně nejvíce zneužívanou metodou za účelem zvýšení průměrné hlasitosti nahrávky je komprese, kdy se hlasité pasáže zkomprimují (udělají se tiššími) a celá hlasitost záznamu se pak vytáhne nahoru. Komprese sice nevnáší do hudby zkreslení, ale mění dynamické poměry nahrávky. Pokud ji aplikujeme ve velkém rozsahu, zestejnoměrníme slyšitelnost jednotlivých nástrojů v mixu a pozměníme prostor nahrávky (všechno se posune víc dopředu a zmizí perspektiva). Komprese se běžně používá v rádiích, aby hrané písničky měly stejnou hlasitost a nemuseli jsme točit knoflíkem volume po každé skladbě. Rádia často kompresi kombinují s limitací a dodatečnou ekvalizací - proto se nám zdá, že hudba z éteru zní často lépe, než u nás doma na běžném reprodukčním zařízení.
Oko je vnímavější než ucho, alespoň co se představivosti týká. Abychom vám přiblížili rozdíl mezi přirozenou krásou hudby a její zkreslenou a komprimovanou podobou, vypůjčili jsme si slavnou Monu Lisu Leonarda da Vinciho:
První obrázek je nezměněnou reprodukcí obrazu. Druhý obrázek byl vytvořen "kompresí" prvního, tj. změnou rozlišení na nižší. Do třetího obrázku je zaneseno "zkreslení". Myslím, že není potřeba k tomu něco dalšího dodávat. Už chápete, jaký paskvil nás nutí nahrávací společnosti poslouchat?
Bob Dylan, hudebník, v interview pro magazín Rolling Stone: “Moderní nahrávky jsou příšerné. Je to zvuková stěna. Nemají definici, nemají nic - je to jen statický hluk.”
Tzv. brickwall limiting je novější způsob komprese v digitální doméně, který byl umožněn rozvojem softwarového vybavení studií. Opět platí, že v povolaných rukou je to velmi mocný nástroj, který dovoluje si pohrát s nahrávkou do nejmenšího detailu. Nemusí nutně způsobovat clipping, ale většinou nám pozmění tranzienty a způsobuje jistou nezáživnost takto upravené hudby.
V okamžiku, kdy není možné nahrávku už víc zkomprimovat, jedinou možností, jak dále zvednout její hlasitost, je prostě uříznout plošně všechny špičky. Důsledkem clippingu jsou perfektně rovné linie špiček záznamu, někdy i značně dlouhé. Problém je v tom, že takováta data se v hudbě přirozeně vyskytovat nikdy nemohou - clipping je nejhorší možný způsob, jak učinit zaznamenaný materiál hlasitějším a poslechově nesnesitelným.
CD záznam pracuje se vzorkovacím kmitočtem 44,1kHz, což představuje 44 100 vzorků za sekundu. Má-li skladba, řekněme, 10 za sebou jdoucích vzorků oříznutých, představuje to časový interval vyjádřený jako 10/44100 sekundy (neboli 0,0002 sekundy) - tedy tak krátký, že to ucho nemá šanci zaregistrovat. Sony zavedl před lety standard měření úrovně digitálního zkreslení, který je založen na 3 po sobě jdoucích vzorcích, tj. 3 oříznuté vzorky jsou již zkreslením. Dnes se však clipping nevyskytuje v jednotkách, ale ve stovkách vzorků, které jsou prostě z nahrávaného hudebního materiálu odstraněny.
Občas se používá malý trik, a to metoda soft clippingu, kdy se sice špičky nad 0dBFS oříznou, ale plochý vršek se softwarově zaoblí tak, aby připomínal součást hudebního signálu. Soft clipping prvním pohledem neodhalíte, ale pokud se vyskytuje v nahrávce často, je jeho výsledkem naprosto stejná míra zkreslení jako u clippingu normálního.
Jako příklad se podívejme na mou oblíbenou německou experimentální kapelu z osmdesátých let, Mekong Deltu. Skladba Transgressor z jejich nejlepšího alba Dances of Death (1990, Aaarrg ARG23/034-2, mastering Ralph Hubert) má velmi nízkou hlasitost a dynamické špičky stále nechávají do maxima rezervu dobrých 14dB (!). Abyste si CD opravdu vychutnali, musíte otočit knoflíkem volume opravdu hodně doprava. Odměnou je fantastický dynamický rozsah, který se pohybuje okolo 16dB a strčí tak do kapsy i nahrávky jako floydovskou The Dark Side of The Moon.
Tyto klady byly spolehlivě "vylepšeny" při dalším vydání na kompilačním albu Mekong Delty v roce 2005 (Membran 223132-311). Vidíte ten rozdíl na dalším obrázku? I když nahrávka není viditelně ořezaná (ona ořezaná je, ale metodou soft clippingu), její dynamika sotva přesahuje nějakých 5-6dBFS a nenajdeme na ní žádné tišší momenty - prakticky každý vzorek je špičkou sám o sobě. Není potřeba říkat, že zvukově je zde diametrální rozdíl v neprospěch novější verze. Ironií je, že v bookletu CD najdeme poznámku: 24bit/96kHz High-End Mastering! I kdybych neuvažoval hlasitá editační kliknutí, kterými "vylepšený"záznam oplývá, nutně se musím zeptat: Se vším obdivem k Vaší hudbě, jste při smyslech pane Huberte?
Pravděpodobně ne - podíváme-li se na nejnovější album stejné kapely, uvedené problémy se eskalovaly do maxima. Skladba Moderato je z posledního opusu Lurking Fear (2007, AFM Records, mastering opět Ralph Hubert). CD, které je nahrané tímto způsobem, je možné poslouchat snad pouze v autě, a i tam se ucho nemá čeho chytit a jasně rozliší, že jde o totální zvukový průšvih.
Pokud dynamickou špičku v digitálním záznamu ořízneme, je ztracena navždy a prakticky neexistuje způsob, jak ji dostat zpátky - nahraná hudba byla nenávratně poškozena.
Úder bicích je velmi dynamickou a hlasitou záležitostí s ostrou náběžnou hranou tranzientu. Pokud tranzient ořízneme, výsledkem bude pouze dutý hlasitý zvuk bez vnitřní definice, připomínající dupnutí nohou na udusané hliněné podlaze.
V osmdesátých letech bývaly na CD zaznamenány bicí zhruba na úrovni vokálů nebo o něco hlasitěji. V dnešních nahrávkách je vám zvuk přímo vmeten do tváře - v refrénu jsou všechny zvuky stejně hlasité, bicí se ztrácejí pod stěnou hluku, někdy přípomínajíc pouze tiché klikání na pozadí. Skvělými příklady takových nahrávek jsou známá Californication od Red Hot Chilli Peppers a Elect The Dead od Serj Tankiana, frontmana kapely System of A Down. Tato hudba je brutálně zkreslená a zmrzačená masteringovými technikami k nepoznání.
Na Right On Time (RHCP, Californication, Warner 9362473862), produkce Rick Rubin, na horním obrázku krásně vidíte, že dynamika nemá na nahrávce prakticky žádné místo. Nedá se zde mluvit o ořezaných špičkách - ořezané jsou totiž celé souvislé plochy záznamu, a to na maximální úroveň 0dBFS level. Pokud vysčítáte počty chybějících vzorků, dospějete v některých úsecích až k neuvěřitelnému číslu 55% - to je procento chybějících hudebních informací, které jsou nenávratně ztraceny a nahrazeny neurčitým digitálních hlukem!
Tankianův song Empty Walls byl ještě donedávna velkým rádiovým hitem. Nejen že je tato nahrávka zmasakrována podobně jako Californication, ale navíc, zcela nesmyslně, je hlasitost záznamu stažena o nějakých 5dB pod maximum, takže vlastně jde o další degradaci již degradovaného. Byla to náhoda nebo záměr? Může nám to být v podstatě úplně jedno, neboť ve výsledku je zvuk podobný (a to i na nejlepších hifi zařízeních) tomu, který leze z mobilního telefonu. Povšimněte si ořezaných ploch, které představují chybějící hudbu, často v rosahu několik stovek po sobě jdoucích vzorků, tj. mluvíme už o desetinách sekundy, kdy hudba prostě vypadává!