Diit.cz - Novinky a informace o hardware, software a internetu

Jak si vede Intel Larrabee - Xeon Phi - oproti AMD a Nvidii?

Intel Xeon Phi Family
Výkon Intel Larrabee v nejnovější reinkarnaci zvané Xeon Phi byl vzhledem k netypické architektuře dlouhou dobu poměrně těžko představitelný. Pojďme se podívat, jak si vede v testu CLBenchmark a co nabízí ve srovnání s FirePro od AMD a Teslou od Nvidie.

Omáčka tentokrát není potřeba - výsledky Phi (22nm Larrabee) z CLBenchmarku, prvního profesionálního OpenCL testu, jsme utřídili do srovnávací tabulky a doplnili údaji z AMD FirePro W9000 (28nm čip Tahiti s 2048 stream-procesory) a Nvidia Tesla K20c (28nm čip GK110 s 2496 stream-procesory). Pro zajímavost jsme doplnili ještě APU Trinity ve verzi A10-5800K (tzn. dva moduly Piledriver a 384 stream-procesorů architektury VLIW-4):

  Xeon Phi
5110P
AMD Trinity
A10-5800K
AMD FirePro
W9000
Nvidia
Tesla K20c
jednotky body body vs. Phi body vs. Phi body vs. Phi
Raytrace 30 707 8 253 26,9 % 273 922 ×8,9 182 116 ×5,9
Sobel (GMU) 57 271 46 077 80,5 % 1 883 000 ×32,9 1 409 600 ×24,6
Sobel (LMU) 30 000 20 848 69,5 % 1 200 200 ×40,0 937 000 ×31,2
S. Gauss. Blur (GMU) 11 360 9 240 81,3 % 155 700 ×13,7 262 100 ×23,1
Bucketing (PAL) 6 049 969 16,0 % 25 075 ×4,1 13 054 ×2,2
Reduction (PC-LMU) 64 668 5 509 8,5 % 1 009 900 ×15,6 436 000 ×6,7
Scanning (PA-LMU) 12 681 1 480 11,7 % 377 100 ×29,7 145 200 ×11,5
Scanning (SA) 4 798 50 100 1044,2 % 30 439 ×6,3 13 453 ×2,8
Sum (GAA) 2 843 570 20,0 % 44 678 ×15,7 33 100 ×11,6
Sum (LAA) 149 800 9 761 6,5 % 562 500 ×3,8 15 920 ×0,1
Bitonic Merge Sort 192 182 94,8 % 3 800 ×19,8 10 269 ×53,5
Tree search 4 840 858 17,7 % 1 406 ×0,3 871 ×0,2

Stávající výsledky CLBenchmarku pro Xeon Phi nepůsobí zrovna lichotivě. Low-endové řešení v podobě Trinity se ve čtyřech případech dotahuje na Phi, v sedmi je výrazně pomalejší a v jednom zhruba 10× lepší.

Intel Xeon Phi

Při srovnání s FirePro a Teslou jsme upustili od procentuelního vyjádření - zajisté chápete proč. GPGPU/HPC karty od AMD a Nvidie si v CLBenchmarku podávají Phi levou zadní a nabízejí výkon na úrovni desetinásobk(ů); dílčí testy, ve kterých byla Phi překonána více než 30× jsme u těchto karet zvýraznili. Jediný test, v němž Phi dokázala převálcovat oba konkurenty, je „Tree search“. Zajímavých výsledků ještě dosáhla v „Programming Principles: Sum - Local atomic add“, kde se nejvíce přiblížila k FirePro W9000 a výrazně překonala Teslu K20c.

Tyto výsledky samozřejmě odrážejí požadavky jednoho konkrétního benchmarku, takže na jejich základě nemůžeme dělat rozsáhlejší závěry. Pokud však k vyjádření rozdílu namísto procent musíme ve většině případů použít násobky, je patrné že Phi není přinejmenším natolik univerzální řešení, jaká nabízí AMD a Nvidia.

Diskuse ke článku Jak si vede Intel Larrabee - Xeon Phi - oproti AMD a Nvidii?

Středa, 5 Červen 2013 - 09:04 | no-X | Díky za upozornění, překlep opraven.
Středa, 5 Červen 2013 - 08:43 | super master | rozhodne mate pravdu, ale presto mi prijde dobre...
Středa, 5 Červen 2013 - 00:09 | Solitary | Stale je ale jednodusi portovat jiz hotovy a do...
Úterý, 4 Červen 2013 - 17:33 | j j | JJ je to tak. OpenCL bohužel své poslání jakožnto...
Úterý, 4 Červen 2013 - 17:14 | Jack FX | Výsledky toho testu vypovídají pouze o tom, že...
Úterý, 4 Červen 2013 - 16:32 | Shini | chybiska se vloudila? Sum (GAA) 2 843 570 2,0...
Úterý, 4 Červen 2013 - 16:24 | Jan Ringoš | Já si myslím, že problém s hodnocením této karty...
Úterý, 4 Červen 2013 - 16:04 | Anonym | nastesti nakupy těchto karet se neridi benchmarky...
Úterý, 4 Červen 2013 - 15:45 | no-X | To v tuhle chvíli ví s jistotou asi jen Intel.
Úterý, 4 Červen 2013 - 15:37 | John Douberro | A není špatný výkon Phi daný neoptimalizovaným...

Zobrazit diskusi