První ohlášené Xe GPU od Intelu se jmenuje Ponte Vecchio, cílí do HPC
O projektu Aurora, superpočítači chystaném s americkým Department of Energy (DOE) a Argonne National Laboratory, informujeme již téměř pět let. Kupodivu zatím neměl vlastní tag, což je již napraveno, takže si předchozí zprávy o projektu můžete jedním kliknutím zobrazit. Pokud však neplánujete trávit celé páteční odpoledne nad tímto tématem, poslouží asi lépe stručnější rekapitulace toho nejpodstatnějšího. Začínáme na jaře 2015…
2015
Majoritní část výpočetního výkonu zajistí čtvrtá generace akcelerátorů Xeon Phi vzniklá z projektu Larrabee, někdejšího pokusu o vstup Intelu na trh herních grafických karet. Půjde o generaci Knights Hill, která bude vyráběná 10nm procesem (podle aktuálních informací došlo k odkladu příprav továrny Fab 28 pro 10nm výrobu). Aurora dosáhne 18× vyššího výkonu než stávající systém Mira (10 PFLOPS), přičemž energetické nároky vzrostou pouze 3,3×. Tím bude dosaženo zhruba šestinásobku energetické efektivity dosavadního systému. Superpočítač složený z více než 50 tisíc uzlů by měl být připravený k předání v roce 2018. |
2016
Byly doby, kdy Intel věřil, že po 14nm generaci Skylake přijde 10nm Cannon Lake. Nakonec se situace změnila a namísto vydání první 10nm architektury dojde v této době jen k prvním experimentům s výrobou. |
2017
Přestože se 10nm výroba nevyvíjela v souladu s plány, podle kterých měl v roce 2018 superpočítač postavený, odladěný, předaný a funkční, nejde patrně o největší zádrhel projektu. Během posledních dvou let se situace ve světě superpočítačů zásadně změnila. Důvodem je rychlý nástup trendu umělé inteligence a technologií strojového učení. Zatímco výrobci grafických jader (Nvidia, AMD) zvládli velmi rychle přizpůsobit architekturu svých produktů těmto trendům a již v roce 2017 každý nabízí několik produktů specializovaných na tento segment, Knights Hill, který měl být v podobě systému Aurora dostupný v roce 2018, se pro tyto účely příliš nehodí. […] Intel má v laboratořích, krom projektu Knights Hill, také projekt Knights Mill, který již reaguje na soudobé trendy a jde strojovému učení, které staví na rychlém FP16, naproti. Jenže Argonne Labs vyžaduje univerzální řešení a Intel může nabídnout buďto Knights Hill optimalizovaný pro výkon v FP64, nebo Knights Mill optimalizovaný pro výkon v FP16 (na FP64 není tak vhodný). |
2018
V listopadu roku 2017 Intel v tichosti zrušil projekt 10nm Knights Hill, z čehož vyplynulo, že projekt Aurora jakožto superpočítač postavený na Xeon Phi nikdy nevznikne. V prosinci 2017 se na webu Intelu objevily specifikace tří modelů nové generace Knights Mill, která nakonec nebyla vyráběná na 10nm procesu, ale po fiasku s 10nm Knights Hill zůstala 14nm. S až 72 jádry, 288 vlákny, 1,5-1,6 GHz taktovací frekvencí a 320W TDP šlo o první Xeon Phi zacílený na akceleraci AI. […] 14nm generace Xeon Phi tedy byla zabitá před vydáním nástupce. Nu a nástupce - 10nm Xeon Phi - byl zrušen rovněž. Intel to vysvětluje slovy: „Market demand for the products […] have shifted to other Intel products“, tedy že poptávka se překlopila k jiným produktům Intelu. Zda tím Intel myslí výše zmíněný Lake Crest, který získal akvizicí Nervany, nebo formálně uvedený Knights Mill, o němž však od prosince nebylo slyšet, případně jde jen o prázdný obrat, se ze stručného textu rozklíčovat nedá. |
2019
Jak se ukazuje nyní, tím „jiným produktem Intelu“, přinejmenším v tomto kontextu, mohou být grafické čipy Intel Xe. Intel, americké Department of Energy (DOE) a Argonne National Laboratory totiž restartovaly projekt Aurora. Stávající plán je postavit procesorovou část na nadcházejících Xeonech s podporou Optane DC Persistent Memory (což může být očekávaný 14nm Intel Cascade Lake-Advanced Performance, případně jeho 10nm nástupce) a grafických jádrech Intel Xe, která budou využita jako akcelerátory AI. |
Intel odhalil plány ve světě procesorů a nových výrobních procesů. Dal však prostor i nadcházejícím grafickým akcelerátorům Xe, která má uvést v příštím roce. O Xe sice Intel informuje pravidelně, ale prozatím poněkud dietně, takže veškeré známé údaje lze shrnout do pár vět: První generace Xe vzejde z architektury Gen 12 / Arctic Sound, která původně vznikla jako základ integrovaných GPU. […] |
Tolik k tomu nejpodstatnějšímu z událostí předchozích pěti let. Pokud by na vás i tento výtah (čili zdviž) byl moc dlouhý, lze to shrnout ještě stručněji: Aurora měla být vybavena Xeony Phi (Larrabee) Knights Hill, které ovšem z důvodu odkladu 10nm procesu zastaraly dříve, než je byl Intel schopný vyrobit. Projekt Aurora se tedy odložil, přepracoval a čekalo se na Xeony Phi (Larrabee) Knights Mill, které měly být vhodné i jako AI akcelerátory. I ty zastaraly ještě před zahájením výroby, takže se projekt zrušil. Nakonec Intel ohlásil, že připraví řešení na bázi architektury integrovaných grafik, které propaguje pod označením Xe a jehož výpočetní varianta vznikne v roce 2021 na 7nm procesu.
O tomto plánu se Intel chystá v příštích dnech pohovořit. Podle informací z prezentace, jejíž obsah ve stručnosti předčasně zveřejnil web VideoCardz, se výpočetní GPU Xe bude jmenovat Ponte Vecchio, čímž Intel naráží na CXL (Compute Express Link), datové propojky vycházející z konceptu PCIe 5.0. Projekt Aurora by měl sestávat z Xeonů generace Sapphire Rapids, zmíněných GPU Ponte Vecchio a softwarové vrstvy oneAPI, jež má být unifikovaným programovacím modelem. GPU bude realizováno s použitím pouzdřící technologie Foveros, která umožňuje sendvičovat různé čipy na sebe. Redakce VideoCardz dále zmiňuje (cituji): „ultra-high cache and high memory bandwidth“, ale nejsem si jistý, jestli nemohlo dojít k přehození slov a správně nemělo být „high bandwidth memory“, tedy HBM. To by dávalo smysl. Systém má nabídnout i vysoký výkon v double-precision. Každá jednotka projektu Aurora bude vybavena dvěma (10nm) Xeony Sapphire Rapids a šesti (7nm) GPU Ponte Vecchio. Hotovo má bý v roce 2021.
VideoCardz, foto: Jan Drewes