Diit.cz - Novinky a informace o hardware, software a internetu

Čiplety RDNA 3: O 10 % nižší latence navzdory spojování křemíku

Datová propustnost mezi čiplety GPU Navi 31 dosahuje více než desetinásobku toho, co mezi čiplety Epycu Genoa. Přitom tvoří energetické nároky tohoto spojení jen méně než 5 % TDP čipu…

Výrobní technologie přestaly škálovat u analogových rozhraních již někde kolem 2xnm generace a u integrované paměti (SRAM používané pro nejrůznější cache) ztratil smysl přechod na novou generaci výroby po 7 nanometrech. Rozumně škáluje již jen logika.

Vzhledem k tomu, že cena za jednotku plochy křemíku s novými procesy generaci od generace roste (a nárůsty jsou navíc s každou další generací výraznější), potřebovala AMD řešení pro segment GPU, který by pomohl podobně, jako moduly a po nich čiplety u procesorových architektur Zen a Zen 2.

Připomeňme, že pro Zen 2 znamenaly čiplety zlevnění nákladů na křemík o nižší desítky procent u dvoučipletové konfigurace a více než dvojnásobně u tříčipletové. Připomeňme, že to nemělo dopad jen na ekonomiku společnosti, ale i na celý trh, kdy toto řešení přineslo do běžných PC výkon na úrovni platformy Intel HEDT za poloviční cenu.

Překlopit tuto myšlenku do světa GPU ale není možné, respektive snadné. Použití konceptu pro Zen u grafických čipů je problematické proto, že mezi front-endem čipu a výpočetními jádry probíhá komunikace, která je minimálně o dva řády vyšší než je tomu u procesorů, čemuž žádná existující technologie (při energetických požadavcích, které by neanulovaly smysluplnost takového řešení) nestačí.

AMD proto provedla řez tam, kde jednak dochází k o řád nižším datovým přenosům a jednak má rozdělení lepší smysl i z hlediska vlastností výrobních procesů, jak bylo vysvětleno výše: Do samostatných čipletů byla oddělena paměťová rozhraní s Infinity Cache, kterým novější procesy nepřinášejí rozumné benefity. Tyto části zůstaly na 6nm výrobní technologii, což je derivát 7nm procesu využívající EUV ke snížení výrobních nákladů (a mírnému zvýšení energetické efektivity).

Požadavky na datové přenosy, byť zhruba o řád nižší než mezi front-endem a výpočetními bloky, jsou však stále enormní - více než o řád (+11,5×) vyšší oproti čipletům Epycu.

Pro dosažení tohoto cíle musela být vyvinuta a implementována pokročilejší verze Infinity Fabric, než používají procesory Ryzen / Epyc a aby i energetické hledisko zůstalo únosné, zvolila AMD k fyzickému propojení technologii TSMC Fanout bridge, která poskytuje řešení o řád efektivnější než standardní organické můstky z hlediska plochy a pětinásobně efektivnější z energetického hlediska.

Protože každé rozhraní vedoucí mimo křemík přidává na latencích, řešila AMD i tento problém. Kombinaci zrychlení taktovacích frekvencí Infinity Fabric o 43 % a celkového zvýšení taktů jádra o ~18 % dosáhla situace, kdy latence mezi jádrem a Infinity cache mezigeneračně (Navi 21 → Navi 31) klesla o 10 %.

Přestože jde tedy o vůbec první implementaci čipletů na komerčním GPU, nejde o kompromisní řešení, kde by jednu výhodu kompenzovaly jiné nevýhody. Výrobní náklady jsou nižší, latence cache je nižší a její datová propustnost je mezigeneračně více než dvojnásobná a přitom i vyšší než datová propustnost L2 cache výpočetních GPU Nvidie implementované v monolitickém křemíku.

Tagy: 
Zdroje: 

Diskuse ke článku Čiplety RDNA 3: O 10 % nižší latence navzdory spojování křemíku

Středa, 16 Listopad 2022 - 16:31 | Peter Fodrek | Áno, akrát si to vyberie pre výkon optimálnu...
Středa, 16 Listopad 2022 - 15:17 | JirkaK | Však to jen zapne FSR, Radeon Boost (VRS) a Anti...
Středa, 16 Listopad 2022 - 11:18 | Peter Fodrek | potom je to už iba Hypr-RX AMD Claims an 85%...
Středa, 16 Listopad 2022 - 10:18 | JirkaK | Pokud bude současný trend tak ale vyšší...
Středa, 16 Listopad 2022 - 10:14 | AndreasCZ | Je potreba rozlisovat cenu za mm2, za tranzistor...
Středa, 16 Listopad 2022 - 10:14 | AndreasCZ | Je potreba rozlisovat cenu za mm2, za tranzistor...
Středa, 16 Listopad 2022 - 09:33 | hor411 | Ten "ekonomický proces pokročilejší než 6nm...
Středa, 16 Listopad 2022 - 09:30 | Mirda Červíček | „Jisté je, že do budoucna budou muset nabídnout i...
Středa, 16 Listopad 2022 - 09:15 | Jon Snih | Tak pořád jedeme na FinFET. Uvidíme, co přinesou...
Středa, 16 Listopad 2022 - 08:54 | Mirda Červíček | „6nm výrobní technologii, což je derivát 7nm...

Zobrazit diskusi