Pascal vypadá na Maxwell s podporou HBM a mixed precision
Tento týden se opět začalo více mluvit o generaci Pascal. Můžete narazit na řadu článků a novinek; ve skutečnosti jsou ale z valné části recyklované a opakují, co je již známo. Podíváme se tedy jen na to, co opravdu stojí za pozornost. Jde o tři informace:
- Nvidia dnes (18. září 2015) pořádá GTC konferenci v Japonsku, kde prozradí více
- již bylo zveřejněno pár slajdů (které vidíte tady kolem :-)
- potvrzuje se 16nm výroba u TSMC (pro všechna GPU první generace Pascal)
Oficiální slide prezentuje Pascal zhruba jakožto Maxwell obohacený o technologii Mixed Precision (16bit aritmetika), 3D paměti (tzn. HBM) a rozhraní NVLink. Pokud bychom tyto informace přijali tak, jak jsou, byl by Pascal technologicky menším posunem, než se čekalo. Rozdíly oproti předchůdci (Maxwellu) by byly výrazně menší než rozdíly mezi Maxwellem a Keplerem nebo mezi Keplerem a Fermi. Právě v podpoře HBM a 16bit výpočtů se lišila např. třetí generace GCN (Fiji / Radeon Fury) oproti druhé (Hawaii / Radeon R9 290X).
Pro úplnou korektnost je třeba dodat, že Pascal zvládá 16bit výpočty v poměru 2:1 oproti 32bit, kdežto třetí generace GCN jen v poměru 1:1 (využívá je pouze pro snížení energetických nároků pro multimediální výpočty, nikoli pro zvýšení hrubého výkonu jako Pascal). To už je ale z celkového hlediska drobnost. Podpora HBM s sebou jistě ponese i nějaké změny na úrovni řadiče a cache, ale to už se týká všech čipů s HBM obecně, nikoli architektury jako takové. Nvidia ale patrně při této příležitosti přikročila i k některým změnám, které lze chápat spíš jako důsledek architektonické změny než prosté úpravy řadiče pro jiný typ pamětí a tím je sdílení paměti mezi CPU a GPU (obdobně jako u třetí generace GCN, tedy čipů Tonga a Fiji).
Tolik k oficiálním a doposud přiznanými změnám. Byť to Nvidia prezentuje, jako by šlo o jediné zásadní změny oproti Maxwellu, věřím, že se tímto způsobem prezentace snaží jen snížit očekávání a nakonec v souvislosti s Pascalem představí i něco zásadnějšího. Tedy alespoň z hlediska uživatelů desktopu a hráčů. Podpora FP16 i sdílená virtuální paměť jsou zatím technologie, které najdou uplatnění spíš v multimediální a profesionální sféře.