Překvapení: Pascal má zhruba 6144 SP, FP64 výkon je ale třetinový
Koncem listopadu jsme vás informovali o tom, že Pascal vrací rychlejší podporu FP64 (double-precision), kterou současná generace Maxwell musela z důvodu omezení 28nm procesem vypustit a dále, co obnáší podpora tzv. mixed-precision, kdy krom FP32 nabízí architektura i FP16 a nakonec překvapivě i Int8.
- Pascal razantně zvýší výkon v double-precision a vrátí i half-precision
- Arzenál Pascalu se neomezuje na 16, 32 a 64bit výpočty, zvládá i 8bit
Jeden bod ale zůstával nejasný. Přestože některé zdroje naznačovaly, že poměr výkonu v double-precision k single-precision, tedy FP64:FP32 bude 1:2, nedařilo se tyto údaje dobře zasadit mezi ostatní informace: Vycházelo totiž, že by velký Pascal měl nést 4096 stream-procesorů, což by byl jen třetinový nárůst oproti Maxwellu. Zvlášť při přechodu na nový výrobní proces by se dal čekat výraznější posun.
Trochu světla do situace vnesl objev jedné postarší prezentace. Ona je v podstatě už velmi vousatá, řada slajdů je věnována ještě HMC, ale ve spojitosti s Pascalem zmiňuje HBM a především, jak znázorňuje slajd výše, výpočetní výkon. Ten má být 4 TFLOPS v double-precision a - co je podstatné - 12 TFLOPS v single-precision. Pokud se Nvidia během vývoje neodhodlala k razantní změně architektury, což je velmi nepravděpodobné, podporuje Pascal double-precision k single-precision v poměru 1:3 a nikoli 1:2.
Rozvedeme-li tento údaj dál, vychází, že namísto spekulovaných 4096 stream-procesorů je největší GPU vybaveno zhruba o polovinu více, tedy ~6144 stream-procesory, dvojnásobkem oproti Maxwellu (3072). Lze nicméně připustit, že se údaj o 4096 stream-procesorech týká o řadu nižšího GPU (GP104). Protože se Nvidia na výpočetních roadmapách chlubila výpočetní efektivitou 14 GFLOPS na watt, lze dále odvodit, že ona karta nabízející 4 TFLOPS DP a 12 TFLOPS SP dosahuje tohoto výkonu při spotřebě kolem 285 wattů, ale to už je jen velmi orientační hodnota, hodnoty teoretického výkonu i energetické efektivity jsou jistě zaokrouhlené.
Top model Pascalu tedy dosáhne teoretického výkonu zhruba na úrovni dvojnásobku Maxwellu. Otázkou zůstává dostupnost desktopového modelu, GeForce - různé zdroje jsou v tomto ohledu velmi nejednotné. Některé, ať už dojde řeč na kterékoli GPU z rodiny Pascal, hovoří o polovině roku, ale to je nereálné už z toho důvodu, že Nvidia už po léta nevydává celou rodinu produktů zároveň, ale mezi jednotlivými modely bývají výrazné odstupy, někdy i několik měsíců. Je tedy možné, že se některého z Pascalů dočkáme již v létě, je ale jisté, že ostatní dorazí později.