Se superpočítačem Intel Aurora to vypadá bledě, objednatel jej přezkoumává
Generaci Xeonů Phi nazvané Knights Hill jsme se věnovali již dvakrát. Prvně v březnu 2015, kdy jej Intel zmínil jako nástupce 14nm Knights Landing a podruhé o měsíc později, kdy představil projekt Aurora, superpočítač postavený na této 10nm generaci.
- Larrabee (45 nm)
- Knights Ferry (32 nm)
- Knights Corner (22 nm)
- Knights Landing (14 nm)
- Knights Hill (10 nm)
- Knights Mill
Jenže už tehdy bylo známo, že 10nm výroba, pro kterou byla připravována továrna Fab 28, nejde podle původních plánů a její dostupnost dozná zpoždění. Nyní, po více dvou letech, již víme, jak to s tehdejšími 10nm plány dopadlo. Ostatně i díky nim dostala AMD příležitost k návratu do světa procesorů a konkurovat Intelu na procesoru stejné (14nm) generace. To je ale jiný příběh.
Přestože se 10nm výroba nevyvíjela v souladu s plány, podle kterých měl v roce 2018 superpočítač postavený, odladěný, předaný a funkční, nejde patrně o největší zádrhel projektu. Během posledních dvou let se situace ve světě superpočítačů zásadně změnila. Důvodem je rychlý nástup trendu umělé inteligence a technologií strojového učení. Zatímco výrobci grafických jader (Nvidia, AMD) zvládli velmi rychle přizpůsobit architekturu svých produktů těmto trendům a již v roce 2017 každý nabízí několik produktů specializovaných na tento segment, Knights Hill, který měl být v podobě systému Aurora dostupný v roce 2018, se pro tyto účely příliš nehodí.
Podoba projektu Aurora v době zveřejnění, duben 2015
Co tedy s projektem Aurora? Paul Messina, který má v Argonne Labs projekt na starosti, se v červnu vyjádřil v tom smyslu, že probíhá přezkoumání projektu za účelem změn. To by se samozřejmě odrazilo i na datu dokončení projektu. Jinými slovy Argonne Labs hledá cestu, jak zabránit tomu, aby superpočítač Aurora zastaral dříve, než bude předán. Messina nechtěl být konkrétnější kvůli probíhajícímu jednání s Intelem. O týden poté označil HPC Wire projekt Aurora jako „zpožděný, přepsaný a potenciálně zrušený“, což indikuje nesnadnost řešení vzniklé situace.
Kde je problém? Intel má v laboratořích, krom projektu Knights Hill, také projekt Knights Mill, který již reaguje na soudobé trendy a jde strojovému učení, které staví na rychlém FP16, naproti. Jenže Argonne Labs vyžaduje univerzální řešení a Intel může nabídnout buďto Knights Hill optimalizovaný pro výkon v FP64, nebo Knights Mill optimalizovaný pro výkon v FP16 (na FP64 není tak vhodný). Argonne Labs je vzhledem k odkladu 10nm procesu (v jehož důsledku nemůže Intel dodržet původně stanovené termíny) v pozici, kdy si může dovolit předkládat požadavky jakožto kompenzaci tohoto zpoždění - jednou z dalších možností je totiž definitivní zrušení projektu, které by pro Intel nebylo dobré.
Podle aktuálních informací neoficiálního charakteru je jednou z pravděpodobných možností, že Intel postaví projekt Aurora na generaci Knights Hill, jak bylo původně plánováno, která zajistí výkon v FP64 operacích. Ten by ale doplnil Lake Crest, ASIC získaný akvizicí společnosti Nervana, čip navržený pro akceleraci strojového učení. Lake Crest je v současnosti samostatný čip vyráběný 28nm procesem. Je možné, že Intel v budoucnu přistoupí k integraci obou procesorů do jednoho čipu - ať už formou spojení v rámci pouzdra, nebo sjednocení obou procesů a integraci na úrovni křemíku.