Jak si vede Intel Larrabee - Xeon Phi - oproti AMD a Nvidii?
Omáčka tentokrát není potřeba - výsledky Phi (22nm Larrabee) z CLBenchmarku, prvního profesionálního OpenCL testu, jsme utřídili do srovnávací tabulky a doplnili údaji z AMD FirePro W9000 (28nm čip Tahiti s 2048 stream-procesory) a Nvidia Tesla K20c (28nm čip GK110 s 2496 stream-procesory). Pro zajímavost jsme doplnili ještě APU Trinity ve verzi A10-5800K (tzn. dva moduly Piledriver a 384 stream-procesorů architektury VLIW-4):
Xeon Phi 5110P |
AMD Trinity A10-5800K |
AMD FirePro W9000 |
Nvidia Tesla K20c |
||||
---|---|---|---|---|---|---|---|
jednotky | body | body | vs. Phi | body | vs. Phi | body | vs. Phi |
Raytrace | 30 707 | 8 253 | 26,9 % | 273 922 | ×8,9 | 182 116 | ×5,9 |
Sobel (GMU) | 57 271 | 46 077 | 80,5 % | 1 883 000 | ×32,9 | 1 409 600 | ×24,6 |
Sobel (LMU) | 30 000 | 20 848 | 69,5 % | 1 200 200 | ×40,0 | 937 000 | ×31,2 |
S. Gauss. Blur (GMU) | 11 360 | 9 240 | 81,3 % | 155 700 | ×13,7 | 262 100 | ×23,1 |
Bucketing (PAL) | 6 049 | 969 | 16,0 % | 25 075 | ×4,1 | 13 054 | ×2,2 |
Reduction (PC-LMU) | 64 668 | 5 509 | 8,5 % | 1 009 900 | ×15,6 | 436 000 | ×6,7 |
Scanning (PA-LMU) | 12 681 | 1 480 | 11,7 % | 377 100 | ×29,7 | 145 200 | ×11,5 |
Scanning (SA) | 4 798 | 50 100 | 1044,2 % | 30 439 | ×6,3 | 13 453 | ×2,8 |
Sum (GAA) | 2 843 | 570 | 20,0 % | 44 678 | ×15,7 | 33 100 | ×11,6 |
Sum (LAA) | 149 800 | 9 761 | 6,5 % | 562 500 | ×3,8 | 15 920 | ×0,1 |
Bitonic Merge Sort | 192 | 182 | 94,8 % | 3 800 | ×19,8 | 10 269 | ×53,5 |
Tree search | 4 840 | 858 | 17,7 % | 1 406 | ×0,3 | 871 | ×0,2 |
Stávající výsledky CLBenchmarku pro Xeon Phi nepůsobí zrovna lichotivě. Low-endové řešení v podobě Trinity se ve čtyřech případech dotahuje na Phi, v sedmi je výrazně pomalejší a v jednom zhruba 10× lepší.
Při srovnání s FirePro a Teslou jsme upustili od procentuelního vyjádření - zajisté chápete proč. GPGPU/HPC karty od AMD a Nvidie si v CLBenchmarku podávají Phi levou zadní a nabízejí výkon na úrovni desetinásobk(ů); dílčí testy, ve kterých byla Phi překonána více než 30× jsme u těchto karet zvýraznili. Jediný test, v němž Phi dokázala převálcovat oba konkurenty, je „Tree search“. Zajímavých výsledků ještě dosáhla v „Programming Principles: Sum - Local atomic add“, kde se nejvíce přiblížila k FirePro W9000 a výrazně překonala Teslu K20c.
Tyto výsledky samozřejmě odrážejí požadavky jednoho konkrétního benchmarku, takže na jejich základě nemůžeme dělat rozsáhlejší závěry. Pokud však k vyjádření rozdílu namísto procent musíme ve většině případů použít násobky, je patrné že Phi není přinejmenším natolik univerzální řešení, jaká nabízí AMD a Nvidia.
- Nové modely Intel Xeon Phi: vyšší výkon při stejném TDP
- Energetická efektivita Intel Knights Corner - Xeon Phi není příliš přesvědčivá
- Intel prý prodává Xeon Phi (Larrabee) za pouhých $400
- Bouchněte šampaňské, Intel Larrabee je v prodeji
- Intel Larrabee, tedy Knight's Corner, půjde do prodeje - celkový rozbor historie