Diit.cz - Novinky a informace o hardware, software a internetu

Radeony RX 9070 (XT) ohlášeny: technologické novinky, specifikace, architektura

Zdroj: AMD

AMD představila novou architekturu RDNA 4, která toho přinesla v některých ohledech skutečně podstatně víc, než se očekávalo. Přepracováním prošly prakticky všechny části čipu…

Začněme u rámcových specifikací. Ty jsou již nějakou dobu známé a AMD je de facto jen potvrdila. Za zmínku snad stojí jen skutečnost, že dlouho nejistý počet ROP jednotek (některé zdroje hovořily o snížení počtu na 64) je minulostí a specifikována je hodnota 128.

 Radeon
RX 9060/9050
Radeon
RX 9060XT
Radeon
RX 9070
Radeon
RX 9070XT
GPUNavi 44Navi 48
53,9 mld. tranz.
Plocha~180 mm²356,5 mm²
Výr. proc.4nm TSMC4nm TSMC
Architekt.RDNA 4
takt??2070 MHz
2520 MHz
2400 MHz
2970 MHz
SPs2048?35844096
TMUs128?224256
ROPs??128128
FP32
TFLOPS
21,5?36,148,7
FP16
TFLOPS
43?72,397,3
Paměti8 GB
128bit
GDDR6
12 GB
192bit
GDDR6
16 GB
256bit
GDDR6
16 GB
256bit
GDDR6
Takt pam.18 GHz19 GHz?20 GHz20 GHz
Dat. prop.288 GB/s~450 GB/s640 GB/s640 GB/s
∞$32 MB48 MB?64 MB64 MB
TDP / TBP1xxW~200W?220W304W
Napájení8pin?8+8pin8+8pin
Výstupy??HDMI 2.1b
3× DP 2.1a
HDMI 2.1b
3× DP 2.1a
FreeSync
RozhraníPCIe 5 ×8?PCIe 5 ×16PCIe 5 ×16PCIe 5 ×16
APIDirectX 12U
Vulkan
VydáníQ2 2025?Q2 2025?6. 3. 20256. 3. 2025
Dob. cena??$549$599

Podívejme se na některé prvky jádra podrobněji.

Diagram jádra Navi 48 (AMD)

Paměťový subsystém

Začněme tentokrát od konce. Grafické jádro Navi 48 je vybaveno 256bit sběrnicí, na čemž není nic nového, které je osazeno 20Gb/s GDDR6 pamětmi, na čemž rovněž není nic nového. Právě proto, že výkon roste, ale sběrnice i paměti zůstávají, byly potřeba nějaké kroky ke snížení nároků na datovou propustnost. Jedním z nich bylo vylepšení kompresních algoritmů, druhým navýšení cache. Zatímco v posledních letech se ubírá pozornost ke cache poslední úrovně (LLC), což je v případě AMD L3 / Infinity Cache, jež se sice posunula generačně, nikoli však kapacitně, trochu stranou pozornosti zůstává rychlejší L2 cache. Ta už řadu generací nabývala v případě 256bit GPU 4MB capacity: (proti proudu času): Radeon RX 7800 XT / Navi 32, Radeon RX 6900 XT / Navi 21, Radeon RX 5700 XT / Navi 10). Radeon RX 9070 (XT) / Navi 48 přináší 8MB L2 cache. 64+8 (celkem 72) MB souhrnné cache může mít o něco vyšší nároky na plochu křemíku, než 64 MB u Nvidia GB203; na druhou stranu to umožňuje efektivní použití levnějších pamětí, GDDR6.

Compute Unit

Rámcová podoba základního stavebního bloku výpočetního jádra zůstala zachována, ale prakticky všechny její části byly významně přepracované.

CU architektury RDNA 4 (AMD)

Aritmetický výkon CU na takt stoupl ve formátech fp16 a bf16 na dvojnásobek, v i8 a i16 dokonce na čtyřnásobek. RDNA 4 nově podporuje i režimy sparsity (u AMD dosud jen v dedikovaných akcelerátorech architektury CDNA nebo v NPU). Pokud jej aplikace umí využít, znamená to pro tuto architekturu oproti jejímu předchůdci v fp16/bf16 formátech čtyřnásobný posun výkon, v i8/i4 dokonce osminásobný.

CU (op./takt)RDNA 4RDNA 3
FP32256256
FP6444
fp161024/2048512
bf161024/2048512
fp82048/4096-
bf82048/4096-
i82048/4096512
i44096/81921024

Osminásobný posun výkonu se týká i nově podporovaných formátů fp8/bf8, které RDNA 3 nepodporovala (pak musely být použity pomalejší fp16/bf16).

Dynamická alokace registru RDNA 4 (AMD)

Jednou z nejvýznamnějších novinek RDNA 4 je dynamická alokace registrů. Oproti RDNA 3 už není alokována kapacita podle nejnáročnější možné situace, ale tak, aby dostupná kapacita registru byla využita co nejoptimálněji. V případě potřeby lze zvýšit alokovanou kapacitu (a zase snížit). Díky tomu lze využívat výpočetní jádra efektivněji a snižovat latence. S dynamickou alokací registrů jsme se dosud (v různých formách) setkávali spíše u integrovaných grafik (Apple M3, Intel).

Raytracing na RDNA 4 (AMD)

AMD zaměřila hodně pozornosti na vylepšení výkonu při použití raytracingu. Již uniklé výsledky, kterým jsme se věnovali minulý týden (Radeony RX 9070 (XT) vypadají na $539-549 a 599, 35 FSR4 her, výkon ~RTX 5070 Ti), potvrzují velmi zajímavý výkonnostní posun - jinými slovy, že to funguje

Cyberpunk 2077 RT Ultra in 4K (custom scene, no upscaling)

  • Radeon RX 9070 XT: 28 FPS
  • Radeon RX 9070: 21 FPS
  • GeForce RTX 5070 Ti: 29 FPS
  • GeForce RTX 5080: 33 FPS

Pozoruhodné na tom je, že tohoto výsledku AMD dosáhla optimalizací stávajícího přístupu, kdy pro akceleraci raytracingu v maximální možné míře využívá stávajícího hardwaru. Tranzistory navíc přidává jen tam, kde to má podstatný dopad na výkon. Jinými slovy, ani RDNA 4 neobsahuje samostatné hardwarové jednotky BVH traversal.

AMD se s RDNA 4 výrazně zaměřila na efektivitu výpočetních jednotek (rasterizace, ray-tracing, AI akcelerace) i paměťových přenosů. Výrazné změny prodělala i multimediální výbava a výstupy, na což se podíváme příště.

Zdroje: 

AMD

Diskuse ke článku Radeony RX 9070 (XT) ohlášeny: technologické novinky, specifikace, architektura

Pondělí, 3 Březen 2025 - 13:01 | melkor | >> Kdyby si to hromadně vymýšleli, proč by...
Pondělí, 3 Březen 2025 - 12:24 | tombomino | Ale ty vysledky jsou dost dobre, minimlane +10%...
Pondělí, 3 Březen 2025 - 11:58 | no-X | Kdyby si to hromadně vymýšleli, proč by si...
Pondělí, 3 Březen 2025 - 11:38 | kypec | Cez ovládače neporiešia nič, ak by si mal premium...
Pondělí, 3 Březen 2025 - 11:36 | Mike123 | Jenže dělat na tomto nějaké závěry... jak chceš...
Pondělí, 3 Březen 2025 - 11:35 | Martes | Oni sice speciální RT jednotky nemají, nějaké...
Pondělí, 3 Březen 2025 - 10:47 | melkor | >> Už aby byla nová grafika, pokud možno...
Pondělí, 3 Březen 2025 - 10:44 | melkor | >> Divoký sen bude, keď AMD príde s...
Pondělí, 3 Březen 2025 - 10:42 | melkor | >> GPGPU vykon (zvlast FP64) ... 1) Zrovna...
Pondělí, 3 Březen 2025 - 10:22 | no-X | Radeon RX 7900 XT má 5376 SP, Radeon RX 9070...

Zobrazit diskusi