Diit.cz - Novinky a informace o hardware, software a internetu

Jak si povedou AMD RDNA 3 a Nvidia Lovelace? (asi vcelku podobně)

V posledních týdnech jsme věnovali hodně pozornosti záplavě novinek týkajících se Intelu, a tak nebude na škodu změnit téma…

Objevilo se totiž i několik útržkovitých, ale zajímavých zpráv na téma nadcházejících grafických architektur AMD RDNA 3 a Nvidia Lovelace. Obě jsme si již představili, takže pro začátkek jen krátkou rekapitulaci:

RDNA 3 / Navi 3x / Radeon RX 7000(?)

RDNA 3 má být čipletový nástupce RDNA 2, který krom rozdělení GPU na několik kousků křemíku posune výrobu na 5nm proces. Objevila se zpráva o mezigeneračním výkonnostním posunu 2,5× (jen není jasné, zda se týká rasterizace, nebo jen raytracingu).

Lovelace / GeForce RTX 4000(?)

Lovelace je tzv. stop-gap generace, plán B. Původním nástupcem architektury Ampere měl být čipletový Hopper (nebo - chcete-li - čipletová Hopper). Hopper se však z neznámých důvodů odkládá a jako náhradník přijde (pravděpodobně monolit) Lovelace. V kontextu osoby, po níž dědí jméno, bychom opět mohli použít rod ženský. Lovelace má vzniknout na 5nm procesu.

Nyní k tomu novému:

RDNA 3

Je prakticky jisté, že architektura využije čipletů, ale stále panují neshody, kolik jich bude. Před časem se objevila informace o dvou symetrických, nicméně s ohledem na fakt, že řadu prvků není u grafického jádra potřeba duplikovat (PCIe rozhraní, obrazové výstupy, video dekodéry a enkodéry…) by dával smysl i koncept centrálního čipletu doplněný o (třeba ty dva) výpočetní, čímž by se celkový počet dostal přinejmenším na tři.

Dále se začaly objevovat nejasné zprávy o existenci RDNA3 ML čipletu (ML = machine learning, strojové učení). Původ zprávy je však nejasný a celé to je tak trochu na vodě. AMD rozdělila vývoj na grafickou architekturu RDNA a výpočetní CDNA. Čiplety cílící čistě na ML by dávaly smysl spíše jako součást CDNA. Na druhou stranu může AMD vidět smysl v možnosti volitelně obohatit grafickou architekturu RDNA o akcelerátor strojového učení. Například pro profesionální segment, nebo nějaký semi-custom projekt, kde se setkávají požadavky na grafickou akceleraci v kombinaci se strojovým učením. Osobně bych se ale zatím klonil spíše k možnosti, že jde o nějaký informační šum (podobně jako třeba některé zdroje tvrdily, že Ampere ponese nějaký samostatný čip na raytracing, což však byl zjevný nesmysl).

Lovelace

Leaker kopite7kimi, který více než rok před vydáním zveřejnil přesné parametry čipů generace Ampere, na přelomu roku uvedl, že konfigurace top-modelu Lovelace (AD102) může nést 12 GPC. Připomeňme, že Ampere GA102 disponuje 6 GPC (každý GPC obsahuje 12 SM bloků a každý z nich 128 FP32 stream-procesorů). Pokud by tato konfigurace zůstala zachována, znamenalo by to až 18432 stream-procesorů pro Lovelace (oproti maximálně 10752 u Ampere).

Objevovaly se názory, že zatímco AMD mezigeneračně zdvojnásobí počet stream-procesorů (5120->10240), Nvidia se posune pouze 1,7× (10752->18432), takže se relativní pozice AMD (vůči Nvidii) zlepší.

Tato úvaha ovšem opomíjí další (a neméně podstatná) fakta. Za prvé si musíme uvědomit, že nárůst v počtu funkčních jednotek srovnává maximální konfigurace, nikoli reálný hardware na trhu. GeForce RTX 3090 disponuje aktivními 10496 stream-procesorů z celkových 10752, takže posun mezi GeForce RTX 3090 a maximální konfigurací čipu architektury Lovelace nemusí být (jen) 71 %, ale 76 %.

Za druhé nelze opomíjet výrobní proces. Zatímco se AMD mezigeneračně posune ze 7nm na 5nm, mezi nimiž není velký prosotor pro nárůst frekvencí, Nvidia se posune z 8nm (fakticky derivát 10nm výroby) na 5nm, takže bude mít výraznější prostor pro zvýšení výkonu (také) vyššími takty. Pokud se tedy s ohledem na počet stream-procesorů u AMD očekává mezigenerační nárůst papírových TFLOPS na 200 % a u Nvidie na 176 %, chybí stále Nvidii 14 % (200/176=1,14), ovšem tento deficit může kompletně nebo z podstatné části vykompenzovat vyššími takty.

Velkou neznámou jsou pak architektonické změny vedoucí k vyšší efektivitě (ve smyslu reálného výkonu na stream-procesor). U AMD se očekává 200 % stream-procesorů a 250 % reálného výkonu oproti předchozí generaci; u Nvidie, která nejspíš rovněž plus mínus zdvojnásobí papírové TFLOPS, se rovněž očekává nárůst efektivity, jen zatím nikdo neví, jak významný bude. Hovoří se především o nějakých změnách na straně cache. Jakých, není známo. Změny týkající se cache mohou být (počínaje) úpravou struktury nutnou pro návrh většího jádra, která se sama o sobě výrazněji nedotkne efektivity, přes změny zaměřené na zvýšení efektivity, až po (konče) něco podobného, jako přinesla AMD na RDNA 2 (Infinity Cache).

Zdá se však, že celkové změny přinesou architektuře Lovelace podobný nárůst efektivity jaký se očekává u RDNA 3, takže to podle dostupných informací vypadá, že obě strany udrží status quo a obě firmy přinesou produkty, jejichž vzájemná výkonnostní pozice bude podobná tomu, co známe u současné generace.

Tagy: 
Zdroje: 

RedGamingTech (1, 2), kopite7kimi

Diskuse ke článku Jak si povedou AMD RDNA 3 a Nvidia Lovelace? (asi vcelku podobně)

Pátek, 5 Únor 2021 - 13:47 | Irving | Pokud jde jenom o přenosové rychlosti, tak to by...
Pátek, 5 Únor 2021 - 11:34 | no-X | Se schedulerem problém není, ale nějak se do těch...
Pátek, 5 Únor 2021 - 11:29 | no-X | „Ale u RDNA se IMHO použití čipletů ve smyslu...
Pátek, 5 Únor 2021 - 10:12 | Irving | Upřímně by mě zajímalo proč? Ano, objem dat je u...
Čtvrtek, 4 Únor 2021 - 23:32 | melkor | A já pořád, proč mi připopmínali, abych si po...
Čtvrtek, 4 Únor 2021 - 23:26 | melkor | Proč se trápit s oživováním něčeho, co nikdy...
Čtvrtek, 4 Únor 2021 - 21:13 | zero8324 | Ak si ešte raz prečíťaš ten môj text vyššie, tak...
Čtvrtek, 4 Únor 2021 - 18:42 | del42sa | "A AMD chiplety umí..." s GPU je to...
Čtvrtek, 4 Únor 2021 - 17:30 | del42sa | @zero8324 : "Ak pôjde "do tuhého"...
Čtvrtek, 4 Únor 2021 - 17:08 | Irving | Čipletové spotřební grafiky jsou ekonomická...

Zobrazit diskusi