Diit.cz - Novinky a informace o hardware, software a internetu

Intel: Ponte Vecchio je ~2× rychlejší než Nvidia A100 / Ampere

Intel na HotChips zveřejnil další údaje o akcelerátorech Ponte Vecchio. Předložil teoretické výkonnostní hodnoty i výsledky benchmarků, podle nichž je akcelerátor 1,4-2,5× rychlejší než Nvidia A100.

O akcelerátoru Ponte Vecchio hovořil Intel veřejně poprvé v polovině listopadu 2019. V březnu 2021 jej představil se sloganem „From idea to silicon in less than 2 years“, tedy „Od myšlenky ke křemíku v méně než dvou letech“. Již v listopadu 2019 jej však Intel představil jako základní kámen superpočítače Aurora. Ten je v plánu již od roku 2015, ale všechny produkty (čipy či karty), které připadaly v úvahu jako výpočetní akcelerátory pro Auroru, skončily neslavně:

  1. Xeon Phi - Knights Hill: zpožděn v důsledku 10nm procesu, nepodporoval akceleraci AI
  2. Xeon Phi - Knights Mill: přesunut z 10nm procesu na 14nm výrobu, nepodporoval akceleraci FP64
  3. Nervana Lake Crest: AI akcelerátor získaný akvizicí společnosti Nervana, propadák
  4. Habana Goya / Gaudi: akvizice dalšího výrobce AI akcelerátorů, které dosud nejsou na trhu
  5. Xe-HP: modulární řešení, které dle JPR trpělo vysokou spotřebou, zrušeno
  6. Xe-HPC alias Ponte Vecchio

Ponte Vecchio je řešení složené ze 47 kousků křemíku, z nichž některé budou vyráběné Intel 7 procesem, některé pak 7nm a 5nm procesem TSMC.

Intel představil strukturu cache, která se jeví jako silná stránka produktu. Se strmě rostoucím výkonem výpočetních akcelerátorů přestávají paměťové technologie držet krok a ani HBM3 na 8192bit sběrnici ne vždy stíhají. I u výpočetních akcelerátorů proto začíná pomalu (ale jistě a výrazně) narůstat kapacita cache. Dále Intel zveřejnil teoretické výkonnostní charakteristiky pro některé datové formáty. Jde však o zlomek hodnot, které pro své produkty uvádějí AMD a Nvidia, což je ostatně patrné z naší tabulky:

 AMD
MI250X
AMD
MI300
Nvidia A100Nvidia
H100
Intel
P. Vecchio
GPUAldebaranRigelGA100GH100Ponte
Vecchio
architekturaCDNA 2CDNA 3AmpereHopperXe-HPC
formátOAMOAMSXM4SXM5OAM
CU/SM220?108132128
FP32 jader14080?691215872
16896
16384
FP64 jader--34568448?
INT32 jader--69128448?
Tensor Cores880?432528?
takt1700 MHz?1410 MHz?~1600 MHz
 ↓↓↓ T(FL)OPS ↓↓↓
FP16
383?78120?
BF16
383?39120?
FP32
95,7
47,8
?19,56052
FP64
47,8?9,73052
INT4
383????
INT8383????
INT16?????
INT32??19,530?
FP8 tensor?2000/4000*?
FP16 tensor383?312/624*
1000/2000*839
BF16 tensor383?312/624*
1000/2000*839
FP32 tensor95,7?19,560??
TF32 tensor
?156/312*
500/1000*419
FP64 tensor
95,7?19,560?
INT8 tensor
383?624/1248*
2000/4000*1678
INT4 tensor
??1248/2496*
??
 ↑↑↑ T(FL)OPS ↑↑↑
TMU-??432528?
LLC16 MB?40 MB50 MB408 MB
sběrnice8192bit?5120bit5120bit8192bit
paměť128 GB128 GB40 GB80 GB80 GB128 GB
HBM3,2 GHzHBM 32,43 GHz3,2 GHz4,8 GHzHBM 3
pam. prop.3277 GB/s?1555 GB/s2048 GB/s3072 GB/s?
TDP500 W
560 W
?400 W700 W≥600 W
transistorů58,2 mld.
?54,2 mld.80 mld.?
plocha GPU2× ?4× ?826 mm²814 mm²2× 640 mm²
proces6 nm5nm7 nm4nmIntel 7
TSMC N5
TSMC N7
datum11. 202120235. 202011. 20202022??

Z dostupných údajů se zdá, že zatímco AMD Instinct MI250X je zaměřen tak nějak univerzálně na klasické (vektorové) i maticové výpočty (AI) a Nvidia A100 spíš na maticové (AI), Intel Ponte Vecchio se snaží tak nějak vklínit mezi ně. V klasických FP32 / FP64 výpočtech je podstatně rychlejší než Nvidia A100, srovnatelný s Instinct MI250X, ale pokud bude kód optimalizován pro FP32-packed formát, může být Mi250X téměř 2× rychlejší. Naproti tomu tenzorové / maticové / AI výpočty jdou podle specifikací Ponte Vecchio skoro stejně rychle jako Nvidia A100 a přinejmenším některé až 2-4× rychleji než AMD Instinct MI250X.

Zdá se, že ambicí Intelu bylo nabídnout řešení, které bude na podobné úrovni jako silné stránky produktů AMD a Nvidie, ovšem bez slabých stránek. Což by mohlo vyjít, kdyby Intel vydal Ponte Vecchio před rokem. Nyní je srovnávání s tímto hardwarem spíše formalitou - Nvidia koncem roku vydává Hopper, AMD někdy po Novém roce CDNA 3 / Instinct MI300.

Výše vidíte Intelem zveřejněné výsledky benchmarků, které srovnávají Ponte Vecchio s Nvidia A100. K nim jen dvě poznámky: 1. Jak už bylo řečeno, tyto dva produkty proti sobě v praxi stát nebudou. Nelze však Intelu vytýkat, že nesrovnává s Hopper, která ještě není dostupná. 2. Testované zátěže jsou většinou univerzální výpočetní úlohy (vektorové výpočty), přičemž těžištěm Nvidia A100 jsou maticové výpočty (AI). Zájemce o vysoký univerzální výpočetní výkon by neváhal mezi Nvidia A100 a Intel Ponte Vecchio, ale mezi AMD Instinct MI250X a Ponte Vecchio. Jak ale naznačují čísla v tabulce, kdyby Intel v těchto typech zátěže porovnával Ponte Vecchio a Instinct, nemohl by se ve slajdech chlubit ~2× vyšším výkonem. Stejně tak by se jím nemohl chlubit, kdyby srovnával Ponte Vecchio a A100 v maticových výpočtech. Srovnání tedy příliš nereflektují obvyklé chování potenciálního zákazníka.

Zkrátka když zemědělec kupuje polní techniku, bude vybírat mezi dvěma traktory různých značek, nikoli mezi traktorem a motorkou. A stejně tak závodník bude vybírat mezi dvěma motorkami, nikoli mezi traktorem a motorkou. Intel zde ovšem předkládá srovnání svého traktoru oproti konkurenční motorce při orbě brambor.

Zdroje: 

Diskuse ke článku Intel: Ponte Vecchio je ~2× rychlejší než Nvidia A100 / Ampere

Středa, 24 Srpen 2022 - 22:49 | bulldozer | No Intel nedokazal doteraz vyrobit Sapphire...
Středa, 24 Srpen 2022 - 21:43 | peliculiar | Já jsem zrovna chtěl napsat (možná hloupý)...
Úterý, 23 Srpen 2022 - 18:37 | aqt | Urcite sa daju programy kategorizovat ako viac...
Úterý, 23 Srpen 2022 - 14:03 | Petr66 | To bude tak 15-20 let zpátky.
Úterý, 23 Srpen 2022 - 10:47 | bulldozer | Intel skocil do chipletov bez rozmyslania a po...
Úterý, 23 Srpen 2022 - 10:23 | Ondar | Kdy naposled bylo něco od Intelu "pravda...
Úterý, 23 Srpen 2022 - 09:53 | Petr66 | Tak ať to Intel vypustí do světa a uvidíme jestli...
Úterý, 23 Srpen 2022 - 07:51 | Slavomir | Pre hoho? Pre spätné zrkadlo. Aby sa tam zmestila...
Úterý, 23 Srpen 2022 - 07:51 | Tom Buri | spis.. https://www.youtube.com/watch?v=...
Úterý, 23 Srpen 2022 - 07:44 | Libor Míšek | To víš že jó... https://www.youtube.com/watch?v=...

Zobrazit diskusi