Diit.cz - Novinky a informace o hardware, software a internetu

Nvidia představila Ampere: GeForce RTX 3090 bude za $1499

Nvidia představila GeForce RTX 3090 za $1499, GeForce RTX 3080 za $699 a GeForce RTX 3070 za $499. Karty budou vydané postupně v průběhu druhé poloviny září až října…

8nm proces Samsungu

Pokud začneme u největších otazníků, které provázely zprávy o generaci Ampere prakticky od počátku, bude první odstavec věnován výrobnímu procesu. Po zprávách o 7nm TSMC i Samsungu se začaly objevovat zvěsti o 8nm nebo 10nm výrobě u TSMC, které se nyní - k částečnému překvapení - potvrzují. Na jednu stranu bylo možné očekávat něco jiného než 7nm proces TSMC s ohledem na TDP, které hned u dvou modelů překonává 300 wattů. Na stranu druhou tu byla odpověď Nvidie, která při dotazu na téma výrobního procesu generace Ampere prohlásila, že většina objednávek je podána na 7nm proces. Nyní je potvrzeno, že všechny ohlášené herní modely vznikají na 8nm linkách Samsungu. Tento proces je derivátem 10nm výroby, oproti které dosahuje zhruba o 15 % lepších parametrů (alespoň podle veřejně dostupných údajů).

GeForce RTX 3070, 3080 a 3090

Zdvojnásobení počtu FP32 jednotek na SM blok

Druhý zajímavý bod se týká konfigurace architektonických bloků SM. Zhruba v polovině srpna jsme vás informovali o tom, že se očekává zdvojnásobení počtu FP32 jednotek na SM blok. Situace se má tak, že stream-procesory v SM byly tradičně vybaveny schopností počítat s plovoucí desetinnou čárkou (FP, Floating Point). Konkrétně u Nvidie tomu tak bylo do architektury Pascal. Poté přišla změna. Volta a Turing mají krom standardního setu FP(32) stream-procesorů i set Int32 (celočíselných) stream-procesorů. Obojích je stejně, 4 skupiny po 16, tedy 64 v každém SM bloku.

Vysvětlení této změny by se dalo stručně shrnout tak, že Int (celočíselné) jednotky jsou menší (než FP). Celočíselného výpočty tedy mohou být prováděny na samostatných menších Int32 jednotkách a není potřeba kvůli tomu vytěžovat FP32 jednotky, které se pak mohou věnovat pouze FP výpočtům. Tím dojde k nárůstu efektivního FP32 výkonu a není potřeba výrazně zvyšovat počet FP32 jednotek, které stojí více křemíku / tranzistorů. Nvidia uváděla, že v přepočtu na FP32 jednotku tato změna umožňuje zvýšení výkonu až o 36 %.

Jenže poměr FP:Int jednotek 1:1 nebyl ideální, neboť současné hry vyžadují spíše hodnoty bližší 2,5:1. Protože se Nvidia v prezentaci podrobněji nezabývala architektonickými detaily, nevíme, zda výše zmíněná změna (zdvojnásobení počtu FP jednotek v SM bloku) byla provedena tak, že ke stávající sadě 64 FP32 a 64 Int32 jednotek byla přidána ještě třetí sada obsahující 64 FP32 jednotek (celkem tedy 128 FP32 a 64 Int32), nebo zda zůstala sada 64 FP32 jednotek a sada 64 Int32 byla rozšířena o podporu FP32 (tzn. 128 FP32 jednotek, které zvládají též Int32 operace).

Výsledkem každopádně je, že každý blok obsahuje 2× tolik FP32 jednotek než doposud a Nvidia každou FP32 jednotku prezentuje jako samostatný stream-procesor (její terminologií CUDA Core), což znamená, že namísto dosud uváděných čísel jako 5248 pro GeForce RTX 3090, 4352 pro GeForce RTX 3080 a 2944 pro GeForce RTX 3070 se budeme setkávat s hodnotami 10 496 pro GeForce RTX 3090, 8704 pro GeForce RTX 3080 a 5888 pro GeForce RTX 3070.

 GeForce
RTX 2070
Super
GeForce
RTX 2080
Super
GeForce
RTX
2080 Ti
GeForce
RTX 3070
GeForce
RTX 3080
GeForce
RTX 3090
GPUTU104
13,6 mld. tr.

TU102
18,6 mld. tr.

GA104GA102
28 mld. tr.
plocha545 mm²754 mm²??
proces12 nm TSMC8nm Samsung
takt1605 MHz1650 MHz1350 MHz1500 MHz1440 MHz1400 MHz
boost1770 MHz1815 MHz1545 MHz
1635 MHz
1730 MHz1710 MHz1700 MHz
SP2560307243525888870410496
Tensor320384544???
RT
Core
404868???
TMU160192272???
ROP646488648096
FP329,111,213,4 /  14,220,429,835,7
FP640,280,350,42 / 0,440,640,931,11
RT7 GR/s8 GR/s10 GR/s???
RT-OP52 T63 T78 T40 T58 T69 T
paměti8 GB
256bit
GDDR6
8 GB
256bit
GDDR6

11 GB
352bit
GDDR6

8 GB
256bit
GDDR6

10 GB
320bit
GDDR6X

24 GB
384bit
GDDR6X

takt14 GHz15,5 GHz14 GHz16 GHz19 GHz19,5 GHz
data448 GB/s496 GB/s616 GB/s512 GB/s760 GB/s936 GB/s
napáj.8+6pin8+6pin8+8 pin8-pin8+8 pin
(12-pin)
8+8 pin
(12-pin)
TDP215 W250 W250 / 260 W220 W320 W350 W
vydání9. 7. 201923. 7. 201920. 9. 201810. 202017. 9. 202024. 9. 2020
cena$499$699$999 / $1199$499$699$1499

Jeden SM blok architektury Ampere tedy bude schopný dosahovat 2× vyšší FP32 výkonu než jeden SM blok architektury Turing (jak to je s Int32 výkonem, zatím nevíme). Pokud jde o výsledné FPS, tvrdila Nvidia u generace Turing, že doplnění setu Int32 jednotek zvyšovalo herní výkon SM bloku na 136 %. Teoreticky bychom se z těchto 136 % Turingu (oproti Pascalu) měli dostat na 200 % (Pascalu), tedy o zhruba 50 % nad Turing. Také je potřeba mít na paměti, že další prvky ovlivňující herní výkon, jako je počet ROP a šířka sběrnice, zůstávají u jednotlivých čipů na hodnotách předchozí generace (96 ROP GA102, stejně jako 96 ROP TU102).

Paměťová sběrnice, paměti a přesuny dat

Nvidia v rámci čipů zachovala šířky paměťových sběrnic, jak bylo dosud zvykem, tedy 384bit pro GPU TU102. Konkrétně karta GeForce RTX 3090 má však tuto sběrnici plně aktivní, na rozdíl od GeForce RTX 2080 Ti, jež jí měla zúženou na 352bit. Plná šířka sběrnice zvyšuje datovou propustnost o 9 %.

Nasazení PAM (pulzně-amplitudová modulace) namísto NRZ (Non Return To Zero) spočívá v tom, že dva stavy při NRZ (0, 1) nahradí stavy čtyři. Každý ze čtyř stavů bude interpretován jako dvojice bitů (00, 01, 10, 11), takže při stejné fyzické frekvenci bude možné přenést 2× více bitů.

Osazení nových pamětí GDDR6X, které připravovala Nvidia s Micronem a které dosahují vyšší paměťové propustnosti díky technologii PAM (viz výše), umožnilo zvýšit efektivní takt přenosu dat ze 14 GHz na 19,5 GHz, tedy o 39 %).

Kombinací rychlejších pamětí a plně využité sběrnice bylo dosaženo celkového zvýšení datové propustnosti o 52 % (GeForce RTX 2080 Ti -> GeForce RTX 3090).

Výkon

Nvidia ve většině případů demonstrovala výkonnostní posuny při použití raytracingu, což není divu s ohledem na fakt, že RT jednotky mají dosahovat 2× vyššího výkonu. Výkonnostních údajů, které by se prokazatelně netýkaly raytracingu, je zatím málo a určitý nástin přinášejí tři první položky v grafu níže:

Pokud porovnáme výsledky GeForce RTX 2080 Super a GeForce RTX 3080, liší se o 71 % v Borderlands 3, o 62 % v Doom Eternal a 55 % v Red Dead Redemption 2. Další tři sloupce obsahují výsledky s použitím raytracing, což je situace, které se týkala většina prezentovaných údajů o výkonu.

Srovnáme-li GeForce RTX 2070 s GeForce RTX 3070, liší se o 36 % v Borderlands 3, o 43 % v Doom Eternal a 38 % v Red Dead Redemption 2. 

Modely

17. září bude vydána GeForce RTX 3080, 24. září GeForce RTX 3090 a nakonec během října GeForce RTX 3070. Za pozornost stojí, že Nvidia pro GeForce RTX 3080 použila největší jádro GA102 namísto obvykle používaného GA104. Jeho pravděpodobné, že GeForce RTX 3080 už od počátku neměla být vybavena čipem GA104. Podle leakera kopite7kimi, který parametry čipů (správné) a použití 8nm procesu zveřejnil již loni začátkem léta, totiž byla v plánu ještě GA103 s 320bit sběrnicí a 3840 (7680) stream-procesory. Tu ale žádná ohlášená karta nenese a s ohledem na finální parametry GeForce RTX 3080, která je nakonec vybavena 4352 (8704) stream-procesory, je cítit, odkud vítr vane. Nvidia se v očekávání konkurenční Navi 21 rozhodla parametry GeForce RTX 3080 posílit a protože byl návrh GA103 uzavřen, rozhodla se jí větším čipem GA102 ořezaným na vyšší počet jednotek, než jakým fyzicky disponovala GA103.

Nejvyšší mezigenerační posun (~60 %?) tedy lze očekávat u GeForce RTX 3080 (oproti GeForce RTX 2080 Super), u GeForce RTX 3070 (oproti GeForce RTX 2070 Super) bude nižší, nejspíš kolem 40 % a v případě GeForce RTX 3090 (oproti GeForce RTX 2080 Ti) půjde o něco mezi - podle toho, zda bude hra těžit spíše z datové propustnosti, aritmetického výkonu nebo fillrate.

Patrně v očekávání konkurenční nabídky tentokrát Nvidia mezigeneračně nezdražila GeForce RTX 3070 a GeForce RTX 3080, které budou stát $499 a $699 jako minulá generace a ke zvýšení ceny došlo pouze u GeForce RTX 3090 ($1499) které se žádný produkt konkurence výkonnostně blížit nebude. Původní GeForce RTX 2080 Ti stála $999-$1199.

Diskuse ke článku Nvidia představila Ampere: GeForce RTX 3090 bude za $1499

Čtvrtek, 3 Září 2020 - 10:46 | skaven | mna takisto zaujima vyznam slova epilacia :)
Čtvrtek, 3 Září 2020 - 09:49 | Mali | Jeste si muzete najit i pojem kompilace ;-)
Čtvrtek, 3 Září 2020 - 09:20 | sajgon | Jsou takoví blázni i na CZC třeba - HIKORUST - @...
Čtvrtek, 3 Září 2020 - 08:49 | hor411 | To mám já - Pentium 60MHz do socketu4.
Čtvrtek, 3 Září 2020 - 08:39 | sajgon | To musí:) Neříkám, že je 14tis málo, ale za ten...
Čtvrtek, 3 Září 2020 - 08:07 | ajne | "ale jsou i výrobky, které prostě chci a tam...
Čtvrtek, 3 Září 2020 - 07:55 | hajčus | No vidíš a mě stačilo přilepit termistor na...
Čtvrtek, 3 Září 2020 - 07:54 | Snehulak | No prodávám běžně na aukru tam se moc podvádět...
Čtvrtek, 3 Září 2020 - 07:32 | rathanuviel | "Vymýšlet nesmysly nedává význam"......
Čtvrtek, 3 Září 2020 - 07:26 | rathanuviel | No asi máte pravdu, že nVidia na svém shopu ceny...

Zobrazit diskusi