Diit.cz - Novinky a informace o hardware, software a internetu

Rozkládání zátěže kódování x264 mezi jádra a vlákna: Core Parking OFF

Procesory v testu: AMD FX-8150, AMD Phenom II X6 1100T, AMD A8-3850, Intel Core i7 870 (ES), Intel Core i7 2600K, Intel Pentium 4 HT 3,6 GHz, Intel Pentium 4 EE HT 3,46 GHz
Naše recenze AMD Bulldozeru vás zaujala natolik, že se kolem ní rozhořela poměrně divoká diskuze, kterou z nemalé části obšťastnil jistý troll, o kterém nevíme, zda je skutečně tak zapálený pro AMD, nebo se snaží vědomě dělat AMD medvědí službu. Jinak byla ale v diskuzi řada přínosných podnětů, na které jsme se rozhodli zareagovat tím, co jsme pracovně nazvali „Service Pack 1 recenze Bulldozeru“ a co už tomuto článku zůstalo. Pojďme se tedy podívat na některá další měření a srovnání s jinými procesory, některými i poměrně starými, jako je třeba desktopová verze Xeonu Gallatin v podobě 3,46GHz Pentia 4 Extreme Edition HT…

Tato stránka se pokusí najít odpověď na to, zda je Bulldozer osmijádro, nebo čtyřjádro s nabušenou variací na Hyper-Threading. Abychom to zjistili, museli jsme se k Bulldozeru chovat jako ke čtyřjádru s Hyper-Threadingem. Každý Bulldozer modul budeme považovat za jedno jádro schopné zpracovat dvě vlákna, stejně jako je tomu u procesorů Intel Core i7 Sandy Bridge či Lynnfield.

Začneme takticky „od konce“, tedy s vypnutým Core parkingem. Jako příklad si vezmeme Bulldozer, abyste viděli, co se vlastně bude dít. Pustíme třikrát kódování videa pomocí nejnovější x64 verze x264 (build 2106, kde je už nějaká podpora AVX i XOP), přičemž první instance bude používat všechna jádra a vlákna, druhá pouze 1., 3. 5. a 7. vlákno (označeny jako 0, 2, 4 a 6) a třetí pouze první čtyři vlákna (0, 1, 2 a 3). Aby to bylo přehlednější, budeme pro označování používat binární vyjádření:

  • 1. instance: 11111111
  • 2. instance: 10101010
  • 3. instance: 11110000

Druhou instancí tak zaměstnáme u Intelu čtyři jádra bez vlivu Hyper-Threadingu a po jednom jádru z každého ze čtyř Bulldozer modulů. Třetí instance zaměstná v případě Intelu dvě jádra včetně Hyper-Threadingu a u AMD dva celé moduly (všechna jejich jádra).

Pokud by Bulldozer měl být považován za osmijádro, pak se musí znatelně lišit první instance od druhé a třetí, zatímco druhá a třetí instance by se měly lišit jen trochu. Faktem ale je, že vzhledem k podpoře AVX v x264 jistý rozdíl mezi 2. a 3. instancí očekáváme, protože osmijádrový Bulldozer má jen čtyři FPU jednotky schopné makat naplno s AVX. Otázkou je, co vlastně tato verze x264 používá v případě Bulldozeru: AVX, nebo XOP, nebo obojí a v jakém poměru ;-).

Zátěž jader: Bulldozer, Win7, Core Parking OFF, 11111111
Ukázka průběhu první instance

Na obrázku, který je typickou ukázkou práce x264 kodéru, je vidět průběh kódování. Graf začíná zhruba v momentě, kdy je spuštěn první průběh, druhý průběh je vyznačen oranžovou křivkou (jde o celkovou zátěž vybraného procesu ve sledovači prostředků) a samozřejmě není celý, ale přibližně tak, jak je to vidět, se to táhne až do konce průběhu.

Zátěž jader: Bulldozer, Win7, Core Parking OFF, 10101010 Zátěž jader: Bulldozer, Win7, Core Parking OFF, 11110000
Ukázka průběhu 2. instance (vlevo) a 3. instance (vpravo)

Graf druhé a třetí instance názorně ukazuje zátěž procesorových vláken 0, 2, 4 a 6, resp. 0, 1, 2 a 3. Připomínáme, že máme vypnutý Core Parking. Až ho zapneme, bude v tom správný hokej, uvidíte ;-). Jdeme na výsledky první instance pořízené ve Windows 7 a pro srovnání i Windows 8:

Mezi jednotlivými systémy vidíme minimální rozdíly, s drobnou výjimkou u prvního průchodu o Core i7 2600K, což ovšem považujeme za anomálii (měření tentokráte z časových důvodů neprobíhalo třikrát už každé situace, ale jen jednou). Důležitější jsou především druhé průchody, nicméně i ty první v tabulce zatím necháme, protože zde také ještě nastanou zajímavosti. Je otázkou, zda by byl Bulldozer poražen procesorem Core i7 880, který běhá o 133 MHz rychleji než model 870. Myslíme si, že spíše nikoli, nanejvýš v prvním průchodu, který zase až tolik nepotřebuje více jader jako spíše vyšší takt (on sice více jader využít dokáže, ale ne naplno).

Nyní ale zajímavější čísla: k první instanci přidáme druhou:

Toto už začíná vypadat zajímavěji. Bulldozeru ubrání druhého jádra v každém modulu ublížilo totiž hodně podobně jako ubrání Hyper-Threadingu u procesorů Core i7. Rozdíly mezi operačními systémy opět zanedbatelné, zajímavěji vypadá nárůst rychlosti prvního průchodu po odebrání sousedních vláken jader/modulů.

Do třetice všeho dobrého - přidáme třetí instanci:

Je vidět zajímavá věc: Bulldozeru tato změna ublížila méně než Intelu, tomu zase ublížilo méně odebrání Hyper-Threadingu. Je to logické: AMD o procesoru FX-8150 tvrdí, že jde o osmijádro a tudíž by mělo být do určité míry jedno, jestli se o dvouvláknovou práci podělí dvě jádra v jednom modulu, nebo dvě jádra, každé z jiného modulu. Jelikož ale v modulu jádra hodně věcí sdílí, zas tak úplně jedno to není. U Intelu jde též o logické vyústění: Hyper-Threading rozhodně není tak silný jako u Bulldozeru druhé jádro v modulu.

Abychom však řekli úplnou pravdu, pořád se nemůžeme rozhodnout, zda je Bulldozer modul spíše dvoujádro, nebo spíše jednojádro. Čistokrevné dvoujádro (jako třeba u Bobcatu) to určitě není, na jednojádro jde ale zase o dost velký nárůst.

WIFT "WIFT" WIFT

Bývalý dlouholetý redaktor internetového magazínu CDR-Server / Deep in IT, který se věnoval psaní článků o IT a souvisejících věcech téměř od založení CD-R serveru. Od roku 2014 už psaní článků fakticky pověsil na hřebík.

více článků, blogů a informací o autorovi

Diskuse ke článku Test mikroarchitektury AMD Bulldozer a vliv Core Parkingu ve Windows 7 i Windows 8

Pondělí, 21 Listopad 2011 - 08:45 | Hirogen | Tak jelikož stále nic nepřišlo, začínám...
Čtvrtek, 17 Listopad 2011 - 19:23 | Hirogen | Tak já se také přidávám, neb by mne zajímalo, co...
Čtvrtek, 17 Listopad 2011 - 16:59 | TESKATLIPOKA | Ja som tiez zvedavy na vysledky. e-mail: KRONOSFX...
Čtvrtek, 17 Listopad 2011 - 16:41 | radax.cz | Můj mail by měl být viditelný registrovaným, ale...
Čtvrtek, 17 Listopad 2011 - 14:02 | MiMo007 | Myslim ze prave proto se o tom diskutuje, aby to...
Čtvrtek, 17 Listopad 2011 - 12:23 | terrorist | prijde mi legracni, jak nekteri amd fanbois...
Čtvrtek, 17 Listopad 2011 - 09:29 | MiMo007 | Tomu nerozumim. Ty tvrdis, ze BIOS nastavi klidne...
Čtvrtek, 17 Listopad 2011 - 00:46 | Pavel Tongel | Jeste jsem zapomnel,tem nevericim co chteji videt...
Čtvrtek, 17 Listopad 2011 - 00:43 | Pavel Tongel | Myslim si,ze na pevno to vyply v biosu nemel....
Středa, 16 Listopad 2011 - 17:44 | MiMo007 | A mel jsi vypnuty Turbo a napevno nastavene...

Zobrazit diskusi