Diit.cz - Novinky a informace o hardware, software a internetu

Jediný 44jádrový Xeon může být 3,5× rychlejší než 8 Tesel V100

Rice University s Intelem objevila způsob, jak dosáhnout s klasickými procesory řádově vyššího výkonu ve strojovém učení, než nabízejí nejrychlejší akcelerátory Nvidia Tesla V100 (Volta)…

Standardní metody strojového učení jsou postavené na násobení matic (matrix multiplication), pro které jsou vhodné grafické akcelerátory. Při úpravě architektury na míru (Tensor Cores) jsou pak ještě vhodnější a výkonnostně překonávají procesory. Na tom v podstatě stojí celý byznys s akcelerací AI. Ať už speciální akcelerátory nebo (GP)GPU jsou ne zrovna levným doplňkem, který ovšem umožňuje dosáhnout o tolik vyššího výkonu oproti procesorům, že se finančně i energeticky vyplatí.

Rice Univerzity ve spolupráci s Intelem se ale na celý problém strojového učení podívala z jiného hlediska a namísto maticového řešení přišla s vlastním konceptem, který označuje jako SLIDE. Jeho autoři (Beidi Chen, Tharun Medini, James Farwell, Sameh Gobriel, Charlie Tai a Anshumali Shrivastava) pojali problém strojového učení jako vyhledávání řešení pomocí hašovacích tabulek. To jde procesorům výrazně lépe a především díky tomu odpadá pro procesory nepraktická režie.

Tým autorů výsledek demonstroval na zátěži optimalizované pro klasický systém s osmi Teslami V100, který byl koncipovaný tak, aby se vešel do jejich paměti a dokázal je optimálně využít. Oproti tomu postavili jeden Xeon se 44 jádry (že by Cooper Lake s podporou BFLOAT16?) s použitím SLIDE. Systém s osmi Teslami V100 potřeboval na zpracování úlohy 3,5 hodiny, systému se 44jádrovým Xeonem stačila hodina.

Pokud by se potvrdilo, že tento přístup je běžně uplatnitelný (ne tedy pro velmi specifickou situaci, mimo níž funguje výrazně hůř), mohlo by to ve světě AI akcelerace znamenat solidní přeskupení sil - Intel by oproti Nvidii začal tahat za delší část provazu (AMD by se jen dál usmívala). Pokud tento koncept nějaké slabiny má, zajisté se o nich od Nvidie velmi brzy dozvíme.

Diskuse ke článku Jediný 44jádrový Xeon může být 3,5× rychlejší než 8 Tesel V100

Úterý, 10 Březen 2020 - 13:56 | thr | Tak tohle vypadá velmi zajímavě zcela obecně a...
Sobota, 7 Březen 2020 - 12:18 | J D | Tak to koukáš špatně. Intel koupil Alteru a je...
Sobota, 7 Březen 2020 - 12:08 | Kelley | Intel nevyrábí FPGA, pokud vím... Vyrábí je firmy...
Sobota, 7 Březen 2020 - 01:34 | paja | https://www.cs.rice.edu/~as143/Papers/SLIDE_MLSys...
Pátek, 6 Březen 2020 - 21:15 | Anonym | Od určité doby je třeba brát marketingové...
Pátek, 6 Březen 2020 - 18:09 | Nedos | Víte kdo je největší výrobce pneumatik na světe?...
Pátek, 6 Březen 2020 - 16:13 | Warden | nemohla by z toho profitovat larrabee...
Pátek, 6 Březen 2020 - 14:11 | maruširi | Grafika se nechá udělat i z FPGA, budeme je...
Pátek, 6 Březen 2020 - 13:35 | DrStr | Předpokládám, že se od NVidie dozvíme i o...
Pátek, 6 Březen 2020 - 12:45 | Tomas A | https://wccftech.com/intel-ai-breakthrough-...

Zobrazit diskusi