Fury Nano má plných 4096 stream procesorů, nižší TDP řeší jinak
Fury Nano je tak trochu experiment a zároveň ukázka toho, kam lze díky HBM pamětem zajít co do rozměrů karty. PCB i s chladičem je ještě o téměř 4 cm kratší než u vodou chlazené Fury X, přitom nese aktivní vzduchové chlazení. Krom rozměrů se ale pozornost upírá ke spotřebě karty; TDP bude podle AMD 175 wattů - o rovných 100 wattů nižší než u (již vydané) Fury X-
Jak toho AMD může dosáhnout? První spekulace mluvily u deaktivaci části výpočetních v kombinaci s nižšími takty. To ale podle informací webu Anandtech nebude pravda - minimálně z té první poloviny. Fury Nano má nabídnout vyšší energetickou efektivitu a je vcelku jasné, že deaktivací výpočetních bloků se pouze snižuje spotřeba, nikoli energetická efektivita. Zkrátka vypnutím poloviny čipu klesne (v mírně idealizovaném případě) na polovic nejen spotřeba, ale i výkon, takže se výsledný poměr spotřeba / výkon (~energetická efektivita) vlastně nezmění.
Radeon R9 290X | Radeon Fury Nano | Radeon Fury | Radeon Fury X | Radeon Fury X2 | |
---|---|---|---|---|---|
GPU | Hawaii 6,2 mld. tr. | Fiji 8,9 mld. tr. | Fiji 8,9 mld. tr. | Fiji 8,9 mld. tr. | 2× Fiji 8,9 mld. tr. |
Plocha jádra | 438 mm² | >500 mm² | >500 mm² | >500 mm² | >500 mm² |
Výrobní proces | 28nm TSMC | 28nm TSMC | 28nm TSMC | 28nm TSMC | 28nm TSMC |
Architektura | GCN | GCN | GCN | GCN | GCN |
Frekvence | ≤1000 MHz | ? | ≤1050 MHz | ≤1050 MHz | ? |
SPs | 2816 | 4096 | 3584 | 4096 | 2× 4096 |
TMUs | 176 | 256 | 224 | 256 | 2× 256 |
ROPs | 64 | 64 | 64 | 64 | 2× 64 |
Výkon | 5,63 TFLOPS | ? | 7,53 TFLOPS ? | 8,60 TFLOPS | >15 TFLOPS |
Výkon DP (64bit FP) | 0,70 TFLOPS | ? | 0,47 TFLOPS | 0,54 TFLOPS | ? |
Paměti | 4 GB 512bit GDDR5 | 4 GB | 4 GB 4096bit HBM | 4 GB 4096bit HBM | 2× 4 GB 2× 4096bit HBM |
Frekvence pamětí | 5,0 GHz | 1,0 GHz | 1,0 GHz | 1,0 GHz | 1,0 GHz |
Dat. propustnost | 320 GB/s | 512 GB/s | 512 GB/s | 512 GB/s | 2× 512 GB/s |
Spotřeba 2D | 15 W 3W long idle | ? | ? | ? | ? |
Spotřeba 3D | 250/294 W | 175 W | ? | 275 W | ? |
Napájení | 6+8-pin | 8-pin | 6+8-pin | 8+8-pin | ? |
Výstupy | 2× DVI-D HDMI, DP | ? | HDMI 3× DP | HDMI 3× DP | ? |
TrueAudio | |||||
XDMA CF | |||||
Rozhraní | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 | PCIe 3.0 ×16 |
API | DirectX 11.2 DirectX 12 Mantle | DirectX 11.2 DirectX 12 Mantle Vulkan | DirectX 11.2 DirectX 12 Mantle Vulkan | DirectX 11.2 DirectX 12 Mantle Vulkan | DirectX 11.2 DirectX 12 Mantle Vulkan |
Délka | 10,5″ PCB 10,8″ komplet | 6″ (152 mm) | podle modelu | 7,5″ (190 mm) | ? |
Vydání | - | léto | 10. července | 24. června | podzim |
Cena | - | ? | $549 | $649 | ? |
Počet stream-procesorů, texturovacích jednotek, ROP, šířka sběrnice a kapacita paměti, to vše zůstane na úrovni Radeonu Fury X. Jakým způsobem tedy bude zvýšena energetická efektivita o další třetinu? Zatím jsou známé tři prvky, které by jí měly ovlivnit:
1. Energetické optimalizace z APU Carrizo
Je známým faktem, že spotřeba čipu není lineárně závislá na taktovací frekvenci, ale že je tato závislost exponenciální. Tedy že při zvýšení taktů o určité procento vzroste spotřeba více než o toto procento (případně při snížení taktů o určité procento klesne spotřeba více než o toto procento). I když je toto pravidlo obecně platné, existuje v praxi dlouhá řada proměnných, která reálné chování ovlivňuje. Praxe potom může být značně složitější, než jednoduchá teorie. Příkladem budiž Radeon R9 290X oproti R9 290. Přestože druhý model běžel na nižších taktech, nebyla jeho energetická efektivita měřitelně vyšší - byly zde jiné vlivy, které způsobily, že poměr výkon / watt zůstal prakticky stejný.
Pokud si vzpomenete na vydání APU Carrizo a nové metody úspory energie (z nichž některé AMD aplikovala na grafické jádro Fiji), možná se vám vybaví, že většina těchto technologií výrazněji prohýbala křivku závislosti spotřeby na taktovací frekvenci. Zkrátka že při vyšších taktech nebyla energetická úspora tak citelná, jako při nižších (graf nad odstavcem to ilustruje na procesorových jádrech Steamroller a Excavator). Pokud tento model přeneseme na GPU Fiji, bude to znamenat, že snížení taktovacích frekvencí přinese mnohem citelnější snížení energetických nároků, než u předchozích grafických čipů - respektive že pro dosažení určité (nižší) spotřeby není třeba snižovat frekvence tak výrazně jako u dosavadních GPU.
2. Leakage
Leakage („prosakování“, ztrátové proudové úniky). Jsou věcí výrobní technologie, kterou nemůže autor čipu příliš ovlivnit. Tedy alespoň pokud mluvíme o statické složce těchto proudových úniků - té, která je daná jako charakteristika každého vyrobeného čipu při dané taktovací frekvenci. Co ale lze ovlivnit, je výběr čipů (binning) a to nejen co do statické složky, ale i co do dynamické složky (závislost leakage na taktovací frekvenci). To lze dále vhodně podpořit přiřazením konkrétního profilu řízení spotřeby (výběr vhodné křivky napětí / takt pro každý čip).
Je třeba zdůraznit, že čím vyšší statická leakage, tím vyšší spotřeba čipu a tím vyšší taktovací potenciál za předpokladu dostatečně efektivního chlazení (modelový příklad: 220W procesory řady FX-9000). Naopak čím nižší statická leakage, tím nižší spotřeba čipu, ale i nižší taktovací potenciál („línější“ tranzistory - nechtějí pracovat příliš rychle a díky tomu se u práce tolik nezapotí). Aby popsané závislosti takto fungovaly, je třeba, aby čipy s vyšší leakage byly velmi dobře chlazené. V opačném případě dochází k vyššímu zahřívání, které má za následek nejen další zvýšení spotřeby, ale také snížení stability. V rodině Radeonů postavených na čipech Fiji bude patrně modelem pro čipy s vyšší leakage Radeon Fury X, jehož cílem jsou vysoké takty a maximální výkon (chlazení řeší vodník) a modelem pro čipy s nižší leakage Radeon Fury Nano, jehož cílem jsou nižší takty, vyšší energetická efektivita a jemuž musí stačit vzduchové chlazení. U předchozích generací high-end GPU AMD patrně naopak používala čipy s vyšší leakage pro částečně deaktivované modely, kde jejich vyšší spotřebu kompenzovala vypnutím části výpočetních jednotek.
3. pokročilejší řízení spotřeby
AMD potvrdila nejen převzetí optimalizací z APU Carrizo a použití čipů s nižšími hodnotami leakage, ale také odlišné řízení spotřeby oproti Radeonu Fury X. Podle tohoto vyjádření by všechny Radeony postavené na GPU Fiji vydané po Fury X měly mít jinak vyladěný PowerTune: Zatímco vodou chlazená Fury X je nastavená tak, aby v co možná nejvyšším počtu případů držela taktovací frekvence na maximu (1050 MHz), u dalších čipů toto nebude priorita.
grafická karta | energetická efektivita |
---|---|
Radeon R9 290X | 1× |
Radeon R9 Fury X | 1,5× |
Radeon R9 Fury Nano | 2× |
PowerTune v rámci aktuální generace architektury GCN umožňuje upravovat napájecí napětí v řádu ~10 mikrosekund, což znamená, že během vykreslení jednoho snímku může čip několik-set-krát změnit napětí podle toho, kolik je pro právě prováděnou operaci třeba. Nadcházející modely grafických karet by toho měly využívat více než Fury X a umožnit tak snížení spotřeby především ve hrách, které nevytěžují GPU na maximum.
Kombinací těchto (a možná i dalších dosud nepředstavených) technologií by se energetická efektivita Fury Nano měla dostat na dvojnásobek Radeonu R9 290X, respektive o třetinu nad Fury X.