Akcelerace kódování videa
Kapitoly článků
Inu, je to tak, Intel grafiky už umí nejen bez problémů akcelerovat přehrávání videa (tedy dekódování), ale umí video i kódovat. Jak však ve výsledcích uvidíte, akcelerací bychom to zatím raději nenazývali (je to dáno také tím, že Intel značně zrychlil i procesorovou část ;-). Za tímto účelem obsahují ty nové v „Sandy Bridge“ procesorech technologii nazvanou „Intel Quick Sync“, což je technologie přímo dedikovaná pro danou práci (zatímco u AMD se používá obecně AMD Parallel Processing, dříve ATI Stream, u Nvidie pak obecně CUDA).
Možná je škoda, že je to technologie vázaná na grafiku, neboť pokud osadíte nějakou grafiku vlastní a tu integrovanou vypnete, tak máte pochopitelně po žížalkách a Intel Quick Sync nevyužijete, i když ta zpropadená část křemíku, která to umí, pořád leží tam, kde má (totéž se pochopitelně týká i Direct Compute). Na druhou stranu ono se obecně očekává, že když už použijete grafiku vlastní, že zkrátka věci, které zvládne ta integrovaná, zvládne ta vaše diskrétní podstatně rychleji. Nicméně rozumíme tomu, že je někomu proti srsti, když nemůže využít celý ten kousek křemíku, který je pod tepelným rozvaděčem procesoru (typicky se to týká desek s čipsetem P67, kde je zprovoznění integrované grafiky v procesoru a jejích funkcí mission impossible).
ArcSoft MediaConverter 7
Dost bylo řečí, pojďme se podívat, jak se s tím dělá. Kódovali jsme tradičně 2 a půl minuty dlouhý HD trailer filmu „Děkujeme, že kouříte“ (původní kodek DivX5), s nímž provádíme běžně testy kódování v Avidemuxu. Intel nám za účelem otestování poskytl dvě aplikace, jednu zajímavější než druhou, ovšem obě standardně placené. Ta méně zajímavá je CyberLink Media Espresso, která produkovala výsledky, s nimiž jsme nebyli spokojeni (výsledné video se poněkud cukalo, podrobnější analýzou jsme přišli na to, že zkrátka obsahuje některé snímky za sebou dvakrát, zatímco jiné byly vynechány, což je prostě špatně), navíc tato verze nebyla schopna pracovat třeba s grafikami od AMD, přestože by měla. Naproti tomu ArcSoft MediaConverter 7 uměl využít téměř vše, co jsme mu půjčili, nepochopil pouze integrovanou grafiku v čipsetu AMD 890GX (tedy Radeon HD 4290, proč, to jsme zase nepochopili my). Testy tedy proběhly s tím, co vidíte ve výsledcích (procesor vždy asistuje, takže jsme testovali i rozdíl v počtu vláken, navíc jedna z testovaných sestav měla pouhé dvoujádro, tak aby to bylo trošku srovnatelné) a jsou to skutečně výsledky pozoruhodné. Doplňme, že jsme nastavili kódování do H.264, rozlišení 1280×720, 4Mbit/s a v kontejneru MP4.
Výsledky jsou, jaké jsou, pokusíme se je mírně okomentovat. V první řadě je až legrační, že tento konkrétní kus práce zvládá CPU část procesoru stejně rychle jako GPU část. U procesorů, které nemají Hyper-Threading, už to téměř jistě vyhraje grafika, protože Hyper-Threading dnes svůj smysl rozhodně má. Protože si při kódování procesor šunky úplně neválí, znatelný rozdíl udělá i stav, kdy celé úloze odebereme část procesorových vláken (nevíme přesně, čím vlastně ArcSoft MediaConverter 7 zaměstnává procesor, ale v klidu jej rozhodně nenechává).
Jako „relativně pomalá“ se ukázala práce s grafikami Nvidia. Pomineme nyní ION přeznačený do GeForce 9300, který by byl na Atomech nejspíše ještě pomalejší, protože ani 3GHz Core 2 Duo se zrovna neflákal (na druhou stranu samotný Atom by možná byl ještě pomalejší než ten ION), ale od GeForce GT 335M bychom po zhlédnutí herních výsledků čekali více. Jde to téměř jistě na vrub konkrétní implementaci akcelerace, takže vinu házejme raději na vývojáře v ArcSoftu. Ona je totiž ta akcelerace v takovém případě vždy pomalejší, než kdyby nebyla použita, samotné procesory to zvládají rychleji, pouze Core i7 2600K to zvládá stejně rychle jako jeho sestra grafika.
Mějme také na paměti, že nám aplikaci k testování poskytl Intel. Ne, že bychom chtěli naznačovat jistou „aktivní de-optimalizaci“ pro konkurenční platformy, ale on i ten MediaConverter 7 je označen jako „7.1.15.55. Pre-release version optimized for 2nd gen Core with processor graphics“ (verze, kterou lze stáhnout přímo od ArcSoftu, je 7.0.0.20). Intel si tak mohl sám vybrat, která aplikace nejlépe pracuje právě s Quick Sync.
Asi nejzajímavější na této verzi MediaConverteru bylo, že nabídla volbu Intel Quick Sync i na notebooku s dosavadním Core i7 620M. Na rychlost kódování to překvapivě mělo vliv, bohužel opět negativní, nejvíce však, když jsme úloze poskytli pouze dvě vlákna, celý proces pak trval nechutných 14 minut (ty jsme do výsledků pro irelevantnost nezanášeli). Dle relativně vysoké zátěže procesoru při kódování to vypadá, že stávající procesory asi umí Quick Sync emulovat. Anebo je někde nějaká „finta na diváky“, kterou tato „pre-release“ verze nedopatřením poodhalila ;-).
Sluší se též říci, že jsme se mrkli i na kvalitu výsledného videa. I ta byla podezřelá. Subjektivně „nejkrásněji“ dopadly výsledky vytvořené procesory a oběma Intel grafikami (i když se téměř nepatrně lišily), na druhé místo ve „vizuální kvalitě“ bychom dali produkty CUDA práce (byly identické bez ohledu na to, zda je tvořila GeForce 9300, nebo GeForce GT 355M), pak dlouho nic a někde, kde záda přestávají mít slušné jméno, skončil výsledek ATI Streamu, jehož nekvalitu musí vidět i slepý (dlužno říci, že jsme testovali pouze jednu kartu, ale hodláme se do budoucna testováním kvality kódování zabývat více). Na obrázcích vám předkládáme dvě ukázky, první je částečně statická (na videu je černobílý obrázek a pouze se objevují červené křížky, s každým snímkem jich přibude několik, kdybyste si ho sami chtěli ve videu hledat, je to snímek, kdy se na druhé postavičce dole vlevo objeví první přeškrtnutí), druhá je snímek ze scény s pohybem, těsně po záblesku z jednoho fotoaparátu. Doporučujeme otevřít si každý na jednom panelu prohlížeče a přepínat mezi nimi.
Ačkoli na druhé ukázce vypadá výsledek CUDA hůře, celkově se na video koukat dá, zatímco na výsledek práce ATI Streamu se kouká opravdu špatně, video se ve statických scénách chvěje, což působí opravdu rušivě a právě první ukázka je toho typickým příkladem (rozmaže se na ní to, co v ostatních případech zůstává).
Každopádně nadále platí, že pokud to s kódováním videa do H.264 myslíte vážně, držte se rčení „práce kvapná málo platná“ a svěřte to raději procesoru a nějakému rozumnému kodéru (ideálně na několik průchodů). My bychom tuto snahu akcelerovat kódování videa raději stále nazývali „takovým tím domácím kódováním“ určeným typicky pro ty mobilní hračky, kde na prťavém displeji na nějakém tom detailu nesejde, důležitá je jen mobilita (to jsou ty předměty, na nichž se dá bez větší újmy sledovat i „kinobox rip Červeného trpaslíka“ ;).