AMD prý připravuje 20nm Radeony na letošní podzim
Nvidia o nadcházející(ch) generaci(ch) hovoří poměrně otevřeně, v roadmapách dává najevo vývoj výpočetní efektivity (FLOPS/W), názvy jednotlivých generací a jejich označení. AMD je v posledních letech v tomto ohledu na slajdy skoupá a cosi v tichosti kutí.
Prakticky nulový průsak informací by nebyl překvapivý, pokud by, jak některé zdroje předpokládají, neměl vyjít první čip 20nm generace již tento červenec, tedy za tři měsíce. Ale pěkně popořadě. První zmínku o 20nm čipech jsme zaznamenali loni v srpnu, kdy německý web 3DCenter přišel s informacemi o 20nm generaci Pirate Islands a názvy čipů Bermuda, Fiji a Treasure. To o zhruba měsíc později „potvrdil“ i VR-Zone. Od té doby až do letošního jara bylo ticho, samotná AMD žádnou grafickou roadmapu nevydala (mluvila pouze o plánech na poli kombinovaných procesorů APU).
V posledních dnech a týdnech se ale na povrch dostalo několik informací, které možná stojí na rekapitulaci. Za prvé vyšlo najevo, že někteří výrobci grafických karet v rámci letošního CeBITu zmínili, že nástup nebo alespoň ohlášení 20nm generace od AMD očekávají letos na podzim (jednotlivé zdroje uvádějí mírně odlišné informace, objevují se termíny jako „podzim“, „nejdříve v srpnu“ a podobně).
Druhá část se týká samotných čipů a přišel s ní teprve nyní WCCFTech. Specifikace, které servíruje jako zcela jistě pravdivé (s poznámkou, že se mohou kdykoli změnit a je třeba je tudíž brát s rezervou ;-), se nápadně podobají údajům, které pocházejí ze (zřejmě spekulativní) roadmapy japonského webu ASCII.jp. Tam ji sice už zřejmě nenajdete, ale v březnu ji převzal web ExtremeSpec, kde stále visí.
Protože se roadmapa webu ASCII i zaručené informace internetové drbny WCCFTech shodují, je jasné, odkud vítr vane. Podívejme se na jednotlivé položky:
- GPU Bermuda
- 4224 stream-procesorů, 264 TMU, 96 ROP
- 512 bit, 7GHz GDDR5
- říjen 2014
- GPU Fiji
- 3072 stream-procesorů, 192 TMU, 72 ROP
- 384bit, 6GHz GDDR5
- 2015
- GPU Treasure
- 1536 stream-procesorů, 96 TMU, 48 ROP
- 256bit, 5GHz GDDR5
- červenec 2014
Ze společných vlastností všech tří čipů uvádí zdroj 20nm výrobu u TSMC a podporu DirectX 12. Při bližším pohledu ale na těchto specifikacích cosi nesedí. Celkem v pořádku se zdají být počty stream-procesorů, u všech tří čipů jde o číslo beze zbytku dělitelné 64 (=blok stream-procesorů architektury GCN). Sedí dokonce i konfigurace odpovídající velikosti čipu. Například stávající Hawaii má 2816 stream procesorů, tj. 44 GCN bloků, uspořádaných do 4 skupin po jedenácti. 20nm Bermuda by s 4224 stream-procesory nesla 66 GCN bloků, které by bylo možné uspořádat do 6 skupin po jedenácti, Fiji s by měla 3072 stream-procesory, tedy 48 GCN bloky, by snadno mohla být uspořádána do 4 skupin po dvanácti a tak dále.
Počtu stream-procesorů přesně odpovídají počty texturovacích jednotek (poměr 16:1), takže ani v tomto ohledu nic neindikuje, že by šlo o vysloveně amatérský podvrh. Co však příliš nesedí, jsou počty ROP jednotek v kombinaci s šířkou sběrnice. Vezměme to tentokrát od nejmenšího GPU: Treasure. 256bit sběrnice s 5GHz pamětmi dává datovou propustnost nižší, než jakou disponuje Radeon R9 270X (256bit + 5,6 GHz). Přitom ale parametry uvádějí o 50 % více ROP, tedy jednotek, jejichž využitelnost je přímo úměrná propustnosti sběrnice. Nemá sebemenší smysl drasticky zvyšovat počet ROP, pokud není úměrně zvýšena i propustnost sběrnice (zde je dokonce snížena).
Počty ROP a kanálů paměťového řadiče si u GPU AMD zpravidla odpovídají (GPU Hawaii)
K tomu navíc nesedí kombinace hodnot 48 a 256. Většina GPU AMD (ale i Nvidie) má přímo spojené kanály paměťového řadiče s jednotlivými bloky ROP, což konkrétně odpovídá 8 ROP na každých 64 bitů. V případě výše uvedených specifikací ale tento poměr nesedí. AMD by hypoteticky mohla použít asociativní rozhraní jako u čipu Tahiti (Radeon HD 7900 / R9 280), ale nedává smysl, aby něco takového implementovala u všech tří čipů a zvlášť, když to není třeba. Něco tu tedy nesedí a jako původ oněch nesrovnalostí se jeví počet ROP (pokud by jich namísto uváděných 96 / 72 / 48 bylo 64 / 48 / 32, pak by nebylo lze cokoli namítat).
Na uváděné hodnoty se ještě můžeme podívat ze dvou dalších hledisek. V první řadě to je počet ROP vůči rozlišení obrazovky. AMD již dlouhá léta vychází z filozofie (ona je to asi spíš celkem smysluplná praxe), že počet ROP musí odpovídat výstupnímu rozlišení, pro které je GPU určeno. Je to vcelku logické, právě ROP jsou ony jednotky, které tuto plochu vykreslují / vyplňují. S nástupem 2560×1600 došlo k navýšení z 16 na 32, s nástupem 3840×2160 došlo k navýšení z 32 na 64. Protože se nyní žádná změna nechystá a 8k v desktopu je ještě daleko, nedává aktuálně jakékoli navyšování počtu ROP smysl.
Mohli bychom předpokládat, že počty stream-procesorů a texturovacích jednotek skutečně unikly z oficiálních materiálů a počty ROP někdo „na koleně“ dopočítal. Je tu však ještě jedna drobná nesrovnalost. 20nm výroba poměrně výrazně sníží velikost čipů. Vezmeme-li v potaz čip Treasure, pak by se s 1536 stream-procesory jeho plocha dostala hluboko pod 200 mm², což by nestačilo pro implementaci uváděné 256bit sběrnice.
Závěrem stojí za připomenutí, že v souvislosti s rokem 2014 se v minulosti hovořilo i o nasazení HBM pamětí, které tyto specifikace nezmiňují (v případě použití technologie interposer a pamětí HBM by ani kombinace menších čipů a širších sběrnic nemusel být problém). Na základě rozporů lze však říct, že uvedené specifikace neodpovídají realizovatelným GPU a minimálně z části jsou smyšlené. Absence reálných specifikací na druhou stranu nijak nevyvrací možnost letošního vydání nové generace. Reálnější, než uvedení prvního GPU v červenci, se ale jeví spíše podzim letošního roku.