Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Nvidia DGX A100, systém s osmi(?) ~800mm² Ampere GA100

Není těch jader nějak moc?

Třeba ty menší čipy s 256-bit, 192-bit a 128-bit paměťovou sběrnicí by mohly vyrábět u Samsungu na horším procesu. A ty velké GPU u TSMC s lepší a odladěnější 7nm výrobou.

+1
+1
-1
Je komentář přínosný?

To první zdroj, který zmínil tato jména, uváděl také. Výpočetní modely na 7 nm u TSMC a herní na 8nm procesu Samsungu. Pak ale Nvidia tvrdila, že u Samsungu bude vyrábět minoritu. Možná výpočetní a větší herní čip vzniknou u TSMC a pouze menší u Samsungu. Čipů je oproti současné generaci více jen o GA103. Nula, dvojka, čtyřka, šestka, sedmička a v některých generacích i osmička figurují běžně.

+1
0
-1
Je komentář přínosný?

Máš pravdu, zmátlo mne že k RTX řadě TU102, 104 a 106 ještě patří non-RTX TU116 a TU117.

A jak vidíš tu mobilní RNDA v Samsungu? Dá se nějak predikovat z dat co víme o Navi 5700XT, jak by musela být malá aby dosáhla toho 2.5x vyššího výkonu než má Adreno 650 v tom Snapdragonu? Na grafiky nejsem expert, ale kupeckými počty mi to vychází asi takto:

- Adreno 650 má 1.3 TFLOP FP32 při 580 MHz při 5W
- 5700XT má 10 TFLOP FP32 při 2 000 MHz při 180W
- Tedy pokud má dosahovat 2.5x většího výkonu tak to bude 1.3 x 2.5 = 3.25 TFLOP
- Aby 5700XT měla 3.25 TFLOP tak by musela mít frekvenci 2000 MHz*(3.25 TFLOP/10 TFLOP)= 650 MHz
- při 650 MHz by měla mít spotřebu 22W (2000/650=3.1^3=29x nižší než dynamický leak 162W/29=5,6W + statický leak 10% 18W = 23.6W)
- a to má 250mm2 na 7nm jen GPU Navi10
- celý Snapdragon 865 má 84mm2 včetně 4+4 CPU (A77 s L2$ má 1.2mm2 což s L3$ a malými jádry může dělat cca 10mm2) z toho bude cca 40-50mm2 GPU
- podle TFLOPs to moc nesedí

Když vezmu Basemark kde:
https://youtu.be/2SdIMiEjKD4?t=393

- 5700XT má ... 91 137
- Adreno ........... 8 639 .... což je poměr 10,5:1
- abych dostal 2.5x víc (21 597 bodů) tak 10,5 / 2,5 = 4.22x což je jiný poměr než u přepočtu TFLOP (3.07x)
- pokud zmenším plochu čipu dle Basemarku tak dostanu 1,37x menší Navi (4.22/3.07), a spotřeba klesne na 17.1W (dynamický leak by byl 4.1W). To už je lepší ale pořád v mobilu nepoužitelné i z hlediska plochy GPU.

Kdyby plochu GPU zmenšili 2,5x, tak se dostaneme ve spotřebě z 17.1W na 6.8W, což by odpovídalo výkonově Adrenu při o něco vyšší spotřebě. A plocha 80-90mm2 vs. 50mm2 záleží jak je velký paměťový řadič Navi, taky to celkem sedí. Navi má horší efektivitu cca 1.5x než Adreno a pokud RDNA2 bude mít lepší efektivitu, tak by se teoreticky mohli dostat už relativně blízko. Ale myslím, že zatím má AMD hodně co dohánet v efektivitě a na nějaké výkonovou dominanci můžeme rovnou zapomenout. Nadruhou stranu to nebude vyloženě fail jak jsem si původně myslel.

+1
-1
-1
Je komentář přínosný?

Vzhledem k tomu, že mobilní verze RNDA má kapku jiný návrh a výrazně jiné optimalizace, tak je ten výpočet jen s ničím nesouvisející hromadou čísel naházenou do počítače a skutečná čísla se dovíme až to fyzicky vyjde.

+1
+1
-1
Je komentář přínosný?

Jak jiný návrh? Vždyť to musí být z 90% stejné jako jejich desktop GPU. Architektura musí být stejná, tedy pipeline a z ní vyplývající frekvenční charakteristika je daná. Výrobní proces je také známý, bud 7nm TSMC nebo 8nm Samsung a jediné s čím si můžou pohrát je hustota tranzistorů, protože v mobilním nasazení nebudou potřebovat vysoké frekvence.

Ale jinak fyzikální zákony platí i pro AMD. Tvoje chyba že je neznáš.

+1
-1
-1
Je komentář přínosný?

Právě že to nemusí být stejné - stejná bude základní architektura, ale budou tam těžké optimalizace na mobilní použití (těch 90% shody je dost přehnaných). Vemte si, jak rozdílné jsou desktopová VEGA a VEGA použitá v notebookových procesorech - desktopová VEGA je víc než 200W monstrum a notebooková vleze i s procesorovými jádry do 15W

+1
0
-1
Je komentář přínosný?

AMD trvalo 10 let než se oddělili vývoj pro herní a výpočetní GPU, neměli na to peníze ani dostatek lidí. Navíc jakýkoliv zásah do architektury ať již malý či velký trvá cca 4 roky.

A podle tebe najednou AMD udělá 3 tým, který tu práci zvládne za jeden rok.... myslím že ne, Time :D

+1
-2
-1
Je komentář přínosný?

Vzhledem k tomu, ze AMD ma nekolik let zkusenosti se semi-custom navrhy napr. pro konzole, kde byli schopni adoptovat treba je nektere vylepseni z desktop herni grafiky, nemam absolutne zadny pochyb, ze dokazi udelat rozdilny navrh pro jiny segment trhu ;-)

+1
0
-1
Je komentář přínosný?

Ale jo, na takove to domaci hneteni by mi to do meho Ikea "racku" asi stacilo. Jen to ma jedno vyznamne minus, neni to AMD...

+1
+1
-1
Je komentář přínosný?

500w chernobyl edisn ? to je nejaky klon intelu?

+1
0
-1
Je komentář přínosný?

servery za pol miliona evri, boží

+1
0
-1
Je komentář přínosný?

Zas NVidia vsechny vydrti, ona uz s Voltou nemela moc konkurenci a ted pohrbi vsechny. Ja se vsak tesim spis na podzim, az se NVidia vytasi s novou generaci na hry. Jmeno nastupce Turingu jeste neuniklo?

+1
+1
-1
Je komentář přínosný?

Podle ceho se predpoklada NVLINK jako profesionalni segment? Protoze me to spis prijde jako nahrazka SLI - tj. jenom tento cip bude schopen tvorit 2 cipove karty, nebo umoznovat propojit vice karet dohromady. V podstate stejny pripad jsou TU104/TU102 cipy v 20xx a jako profesionalni segment to povazovat nelze.

Jedine PRO karty s nvlink jsou Quadro GP100/GV100.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.