Testy
Kapitoly článků
O nějaké ty syntetické testy vás samozřejmě nemůžeme ochudit, takže něco málo nyní následuje s patřičnými komentáři. Testovalo se vždy na Windows Vista x64 SP1 s Intel X25-M SSD jako jediným diskem v systému. Pokud není u procesorů Core i7 uvedeno jinak, testovalo se vždy se zapnutým HyperThreadingem i funkcí Turbo, takže vlastně procesor nebyl tak rychlý, jak udávají jeho nominální parametry, ale rychlejší. V testu si všimněte zejména trojice Core i7 na 2,66 GHz (nejnižší model 920), Core 2 Quad taktéž na 2,66 GHz (Q9450) a do party jsme přibrali také AMD Phenom 9950 na obdobném taktu 2,6 GHz (vznikl z Phenoma 9850 Black Edition zvednutím násobiče o jedna).
SiSoft Sandra 2009
CPU Arithmetic
Dhrystone iSSE4.2 | ||
Whetstone iSSE3 | ||
Dhrystone iSSE4.2 | ||
Whetstone iSSE3 | ||
Dhrystone iSSE4.2 | ||
Whetstone iSSE3 | ||
Dhrystone ALU | ||
Whetstone iSSE3 | ||
Dhrystone ALU | ||
Whetstone iSSE3 |
Je to sice syntetický benchmark, ale výsledky už tohoto prvního naznačují, že „Nehalem“ = „tutus brutus“. Všimněte si, o kolik je na stejné frekvenci (tedy bez Turba) rychlejší oproti Core 2 Quad a Phenomu 9950 (což je to nejrychlejší, co AMD má, tedy samozřejmě pokud neuvažujeme o přetaktování žádného z reprezentantů).
CPU Multimedia Benchmark
Int. x16 iSSE4.1 | ||
Float. x8 iSSE2 | ||
Double. x4 iSSE2 | ||
Int. x16 iSSE4.1 | ||
Float. x8 iSSE2 | ||
Double. x4 iSSE2 | ||
Int. x16 iSSE4.1 | ||
Float. x8 iSSE2 | ||
Double. x4 iSSE2 | ||
Int. x16 iSSE4.1 | ||
Float. x8 iSSE2 | ||
Double. x4 iSSE2 | ||
Int. x16 aSSE2 | ||
Float. x8 iSSE2 | ||
Double. x4 iSSE2 |
Jelikož Sandra používá pro dané testy nejrychlejší dostupné technologie, ukazuje tak spíše potenciál procesoru jako takového, což je ovšem smyslem syntetických benchmarků. Proto je nejlepším arzenálem Core i7 instrukční sada SSE4.2, Core 2 Quad SSE4.1 a AMD Phenom … ehm … Sandra jaksi více než SSE2 nepoužije, přestože má Phenom SSE3 a vlastní SSE4A.
CPU Cryptography Benchmark
AES256 CPU Crypt. Bandwidth | ||
SHA256 CPU Hash. Bandwidth | ||
AES256 CPU Crypt. Bandwidth | ||
SHA256 CPU Hash. Bandwidth | ||
AES256 CPU Crypt. Bandwidth | ||
SHA256 CPU Hash. Bandwidth | ||
AES256 CPU Crypt. Bandwidth | ||
SHA256 CPU Hash. Bandwidth | ||
AES256 CPU Crypt. Bandwidth | ||
SHA256 CPU Hash. Bandwidth |
Nečekali bychom, že nachytáme v syntetických benchmarcích Core i7 na švestkách. Zatímco Core 2 Quad i Phenom X4, řekněme, „rychleji hashují než šifrují“, u Core i7 je tomu naopak a dokonce mají jak Core 2 Quad, tak Phenom X4 to hashování rychlejší než Core i7 (na dané frekvenci).
Memory Bandwidth
Paměťová propustnost je něco, co bylo až dosud určitou slabinou sestav postavených na platformě Intel. „Nehalem“ na tuto bolístku rozhodně je náplastí, což jasně ukazují výsledky měření.
Int. iSSE2 | ||
Float. iSSE2 | ||
Int. iSSE2 | ||
Float. iSSE2 | ||
Int. iSSE2 | ||
Float. iSSE2 | ||
Int. iSSE2 | ||
Float. iSSE2 | ||
Int. iSSE2 | ||
Float. iSSE2 |
Skončily doby vedení procesorů AMD v testech propustnosti paměti. „Nehalem“ vzal Phenomům pomyslnou korunu lehce jako lví pšouk a svého předchůdce umlátil hedvábným šátkem. Je to proto, že jsme nedali platformě Core 2 Quad do „rukou“ nic lepšího než DDR2 paměti, přestože už současná platforma Intel nějaký ten pátek běhá i na DDR3. Avšak až s procesory Core i7 má opravdový smysl do těch DDR3 pamětí jít (třeba prostě proto, že Core i7 jiné paměti nepojmou ;-).
Memory Latency
Random Access | ||
Random Access | ||
Random Access | ||
Random Access | ||
Random Access |
Výsledky jasně ukazují, že jsou v podstatě zanedbatelné, jednotlivé platformy si nemají co vyčítat.
WinRAR (3.80) Benchmark
Multi-threaded | ||
Single-threaded | ||
Multi-threaded | ||
Single-threaded | ||
Multi-threaded | ||
Single-threaded | ||
Single-threaded | ||
Multi-threaded | ||
Single-threaded | ||
Multi-threaded |
Nejnovější WinRAR 3.80 a jeho interní benchmark jsme tentokráte projeli jak v single, tak multi-threaded režimu, abychom si na jedné konkrétní aplikaci vyzkoušeli, kterak se v Intelu s Nehalemem připravili na běh aplikací neoptimalizovaných pro více jader. WinRAR se umí chovat pro takový běh jak jako aplikace optimalizovaná, tak neoptimalizovaná.
Na single-threaded výsledcích je vidět, že Core i7 je oproti Core 2 Quad méně lepší, než je Core 2 Quad oproti Phenomu X4. Rapidní nárůst však opět vidíme u multi-threaded výpočtů, kde WinRAR těží z HyperThreadingu v nových Core i7 a Core i7 je tak o obrovský kus lepší ve srovnání s Core 2 Quad než je Core 2 Quad oproti Phenomu X4, se kterým si téměř podává ruce.
CineBench R10
Single-threaded | ||
Multi-threaded |
(4.27×) |
|
Single-threaded | ||
Multi-threaded |
(3.99×) |
|
Single-threaded | ||
Multi-threaded |
(4.36×) |
|
Single-threaded | ||
Multi-threaded |
(3.53×) |
|
Single-threaded | ||
Multi-threaded |
(3.94×) |
Výsledky v CineBenchi potvrzují, že Core i7 je brutální multi-threaded monstrum.
Když kdysi uvedl Intel Hyper-Threading u Pentií 4, vypadalo to, že zkouší zachránit nezachranitelný NetBurst. Hyper-Threading však tenkrát zklamal hlavně proto, že se ještě hodně používaly Windows 9X, které více než jedno jádro neuměly použít (Windows 2000 se v domácnostech moc neujaly a Windows XP byly tenkrát ještě v dupačkách zahaleny podobnou volnou nevole jako dnes Windows Vista), a když už byl systém, který to uměl, bylo pro desktop aplikací, jenž by z více procesorů dovedly těžit, jako šafránu. Stačilo tedy jen stáhnout z trhu HyperThreading, nahradit jej uvedením dvoujádrových procesorů, udělat kolem toho patřičný marketingový humbuk, aby si lidé zvykli a začali vícejádrové procesory kupovat v době, kdy je ještě nepotřebovali, a uvést HyperThreading opět v době, kdy už na více jader vývojáři slyší, aplikací už zdaleka není tak „pomikru“ jako tenkrát a procesor má alespoň čtyři jádra, aby se dalo HyperThreadingem vytvořit virtuálních jader osm, což už vypadá opravdu našlapaně. A jak je vidět, některé testy potvrzují, že to není pouze zdání.
Avidemux: Převod DivX HD videa do x264
Kódování videa do H.264 v Avidemuxu 2.4.3 je záležitost, která sice osmi dostupných virtuálních jader využije, ale nikoli naplno. Procesor by při tom ještě klidně něco „pojedl“ ;-). Když se však vypne HyperThreading, je to skutečně pomalejší (jen tak mimo graf prozradíme, že to je 8:25 pro model 920 s Turbem), takže dostupnými virtuálními jádry skutečně vestavěný kodek x264 nepohrdá.
Závěr je opět jasný, jestli chcete na jednoprocesorové mašině kódovat video fakt rychle, kupte si Core i7 a pokud vám dá vaše peněženka zelenou, klidně to nejdražší. Odhadujeme, že v AMD pohledem na tato čísla opět zdecimováni polkli plány na uvedení procesoru s přídavkem FX v názvu.
oggDropXPd
Po kódování videa způsobem, který více jader užije, je tu kódování zvuku aplikací, která si naopak vůbec nedovede představit, že by svou činnost mohla rozdělit na několik současně běžících úloh. Jediné řešení, jak jí to vysvětlit, se rovná ručnímu rozdělení úlohy na několik menších (je-li k dispozici více souborů na kódování) a spuštění všech těchto menších úloh naráz. Nicméně vraťme se zpět k jedné úloze, protože zde opět nastupuje na scénu krása technologie Turbo Boost, kdy je oproti základní frekvenci procesoru u Core i7 zvýšen násobič o dvě čísla (nebo i o víc, když máte Extreme variantu ;), protože je zaměstnáno v jeden moment jen jedno jádro.
Doba kódování | ||
Doba kódování | ||
Doba kódování | ||
Doba kódování | ||
Doba kódování |
/div>
Nejprve ke špatnému výsledku Phenomu. Problém této úlohy spočívá ve skutečnosti, že vytížení se během práce přesunuje z jádra na jádro a čtyřjádrovému Phenomu to vůbec nedělá dobře, protože hodně „cvičí“ s jejich frekvencemi (vždy, když nějaké jádro dostane slovo, vyletí jeho takt na 2,6 GHz, zatímco takt ostatních jader spadne na 1,25 GHz a tahle estráda stojí procesor určité „tiky“). Když jsme proces natvrdo nastavili tak, aby běželo na jednom jádře od začátku až do konce, výsledek se zlepšil na 3:29, což je hodně znát, přestože to na stejně rychle taktované Core 2 Quad pořád nestačí. Naopak Core 2 Quad to problém nedělá, ani dělat nemůže, protože při zátěži jednoho jádra jedou beztak všechna na maximální frekvenci, takže proces „fluktuující“ mezi jádry není problémem („všechny vlaky jedou stejně rychle a přeskakovat mezi nimi není až takový problém“, zatímco u Phenomu „je potřeba vždy při přeskoku opouštěný vlak zpomalit a ten, na který se naskakuje, zrychlit“ – ano, není to přesné a v procesorech to funguje kapánek jinak, ale pro hrubou představu to snad nebude tak hrozné ;).
Nicméně ani procesoru Core i7 tohle kupodivu nedělá problém, v Intelu skutečně na jednovláknové aplikace mysleli stejně jako na vícevláknové, kterým přichystali pěkných osm virtuálních jader (rozdíl v neoptimalizovaném běhu a v běhu na konkrétním jádře udělal u Core i7 920 jednu sekundu, samozřejmě míníme zapnuté Turbo). Možná je to tím, že v Turbo režimu je rozdíl v rychlosti jednoho vytíženého jádra a ostatních, která vytížena nejsou, docela malý (pokud bychom se bavili o násobiči, je to typicky „o jedno číslo“). Spíše bychom však tipovali, že má Core i7 bravurně zvládnuté změny taktů (mezi přepnutím z 1,6 nebo z 2,66 na 2,8 GHz by neměl být žádný zásadní rozdíl, pořád jde o úkon změny taktu, ale nějaký důvod to nejspíše mít musí, že se i při zátěži jediného jádra zrychlí i ostatní, byť ne o tolik).
No, a nyní k té technologii Turbo, která pokud je vypnuta, ukazuje, že se od sebe Core i7 920 a Core 2 Quad Q9450 v tomto případě prakticky neliší. Zapnutí Turba pak musí mít kýžený efekt, protože zaměstnané jádro pak neběhá na 2,66 GHz a dokonce ani na 2,8 GHz, ale na 2,93 GHz, protože maká jen jedno (ostatní mu na 2,8 GHz nečinně přihlížejí).