Diskuse k Od Navi bude AMD vydávat jedno GPU ročně

del42sa | 12. 6. 2018 - 08:52

"Bod o překonání limitací GCN architektury je nejasný; není vysvětleno, co si pod tím představit. Stávající brzdou jsou pouze dosažitelné frekvence a spotřeba, což je spíše důsledek dostatečných optimalizací návrhu, na které AMD z důvodu finančního nedostatku neměla čas, lidi a finance"

těch bodů k překonání tam bude poměrně dost :

whitepaper naznacuje, ze upravy pro vyssi frekvence se sebou nesly zhorseni "IPC". Castecne to vykompenzovali (delta komprese, velke cache, atd.), ale porad jsou jen lehce nad Fijii.test ze zari 2017 na [H], tak ma nyni Vega o ~10% vyssi IPC v porovnani s minulymi 5%.
* Na vyssich rozlisenich se naskok v IPC smaze neresenym bottleneckem
* Ani nynejsich 10% IPC nad Fiji nestaci Veze k predehnani Polarisu...
* Rozdil mezi 56 a 64CUs - 14% - se casto projevi jen 2% narustem vykonu...

https://www.computerbase.de/2018-05/amd-radeon-rx-vega-untersucht/2/#dia...

I z mezigeneracniho AMD pohledu jsou ty frekvence k danemu IPC celkem "spravne"...
=========
To co neni ok je IPC. V AMD whitepapreu jsou zminene dve kategorie zmen:
* neustale omylane architekturni vychytavky jako: vetsi L2, DBSR, NGG, optimalizace distribuce prace mezi bloky, atd. => rust IPC
* optimalizace na vysoke frekvence (zvysovani latenci na mnoha mistech, krome hlavni 4clk ALUs) => snizeni IPC.

Je mozne, ze se podarilo jen komplenzovat IPC ztracene optimalizaci na vyssi frekvence. Takze zustava otazka, jestli je HW chyba, SW chyba, nebo proste nekdo spatne predikoval.

Dále geometrie (Primitive shader) - Front-End, omezení konfigurace čipu na pouhé 4SE (4trojuhelníky/takt) se ukazuje jako významné omezení výkonu, protože čip velmi špatně škáluje nad 3500SP, tento problém měla už Fiji a Vega bohužel přes všechna vylepšení v tomto mnoho nepokročila. Rozdil mezi 56 a 64CUs - 14% - se casto projevi jen 2% narustem vykonu... viz.CB testy.

Namísto fyzického navyšovaní počtu SE a geometrie AMD zvolila tzv. Primitive Shader, který ale není schopna zprovoznit a který vyžaduje přímé optimalizace her pro jeho použití. Do dneška AMD nevydalo ani jediné SDK, které by popisovalo, jak to funguje. Takže tahle featura zůstává jenom pouhým papírovým drakem a Nejzajímavjší featura Vegy zůstala tak nevyužitá....

Dále je to příšerná spotřeba čipu při vysokých frekencích. Odhadem (jasne je to nelinearni):
Vega 10 ~ Fiji * 1.15 => Pohodova spotreba
Vega10 ~ Fiji * 1.3 => OK spotreba?
Vega10 ~ Fiji * 1.45 => Priserna spotreba

atd.

"Bod o překonání limitací GCN

del42sa https://diit.cz/profil/del42sa

12. 6. 2018 - 08:52 https://diit.cz/clanek/od-navi-bude-amd-vydavat-jedno-gpu-rocne/diskuse "Bod o překonání limitací GCN architektury je nejasný; není vysvětleno, co si pod tím představit. Stávající brzdou jsou pouze dosažitelné frekvence a spotřeba, což je spíše důsledek dostatečných optimalizací návrhu, na které AMD z důvodu finančního nedostatku neměla čas, lidi a finance" těch bodů k překonání tam bude poměrně dost : whitepaper naznacuje, ze upravy pro vyssi frekvence se sebou nesly zhorseni "IPC". Castecne to vykompenzovali (delta komprese, velke cache, atd.), ale porad jsou jen lehce nad Fijii.test ze zari 2017 na [H], tak ma nyni Vega o ~10% vyssi IPC v porovnani s minulymi 5%. * Na vyssich rozlisenich se naskok v IPC smaze neresenym bottleneckem * Ani nynejsich 10% IPC nad Fiji nestaci Veze k predehnani Polarisu... * Rozdil mezi 56 a 64CUs - 14% - se casto projevi jen 2% narustem vykonu... https://www.computerbase.de/2018-05/amd-radeon-rx-vega-untersucht/2/#diagramm-battlefield-1-1920-1080-vega-vs-fiji I z mezigeneracniho AMD pohledu jsou ty frekvence k danemu IPC celkem "spravne"... ========= To co neni ok je IPC. V AMD whitepapreu jsou zminene dve kategorie zmen: * neustale omylane architekturni vychytavky jako: vetsi L2, DBSR, NGG, optimalizace distribuce prace mezi bloky, atd. => rust IPC * optimalizace na vysoke frekvence (zvysovani latenci na mnoha mistech, krome hlavni 4clk ALUs) => snizeni IPC. Je mozne, ze se podarilo jen komplenzovat IPC ztracene optimalizaci na vyssi frekvence. Takze zustava otazka, jestli je HW chyba, SW chyba, nebo proste nekdo spatne predikoval. Dále geometrie (Primitive shader) - Front-End, omezení konfigurace čipu na pouhé 4SE (4trojuhelníky/takt) se ukazuje jako významné omezení výkonu, protože čip velmi špatně škáluje nad 3500SP, tento problém měla už Fiji a Vega bohužel přes všechna vylepšení v tomto mnoho nepokročila. Rozdil mezi 56 a 64CUs - 14% - se casto projevi jen 2% narustem vykonu... viz.CB testy. Namísto fyzického navyšovaní počtu SE a geometrie AMD zvolila tzv. Primitive Shader, který ale není schopna zprovoznit a který vyžaduje přímé optimalizace her pro jeho použití. Do dneška AMD nevydalo ani jediné SDK, které by popisovalo, jak to funguje. Takže tahle featura zůstává jenom pouhým papírovým drakem a Nejzajímavjší featura Vegy zůstala tak nevyužitá.... Dále je to příšerná spotřeba čipu při vysokých frekencích. Odhadem (jasne je to nelinearni): Vega 10 ~ Fiji * 1.15 => Pohodova spotreba Vega10 ~ Fiji * 1.3 => OK spotreba? Vega10 ~ Fiji * 1.45 => Priserna spotreba atd. https://diit.cz/clanek/od-navi-bude-amd-vydavat-jedno-gpu-rocne/diskuse#comment-1154928 +

no-X | 12. 6. 2018 - 09:04

„Na vyssich rozlisenich se naskok v IPC smaze neresenym bottleneckem“

Naopak, Fiji vykazovala při nízkých rozlišeních mizerné škálování výkonu, krom 4k nebyla příliš konkurenceschopná. Limit v podobě pomalého front-end byl odstraněn, proto u Vegy došlo k nárůstu výkonu v nižších rozlišeních, kdy je limitujícím prvkem geometrie a rasterizace. Ve vyšších rozlišeních se tento limit neprojevoval, proto jeho odstranění nemělo ve 4k na výkon vliv.

„Ani nynejsich 10% IPC nad Fiji nestaci Veze k predehnani Polarisu...“

Nějaký důkaz?

„Rozdil mezi 56 a 64CUs - 14% - se casto projevi jen 2% narustem vykonu...“

Což ovšem není limit architektury jako spíš konkrétní konfigurace. 64 ROP pro 256 TMU a 4096 SP je málo, takže je zřejmé, proč navyšování počtu SP a TMU nepřináší lineární škálování výkonu.

„Dále geometrie (Primitive shader) - Front-End, omezení konfigurace čipu na pouhé 4SE (4trojuhelníky/takt) se ukazuje jako významné omezení výkonu, protože čip velmi špatně škáluje nad 3500SP“

To je zcela chybná logická konstrukce. Důkazem, že front-end je v pořádku, je právě výkonnostní posun při nízkých rozlišeních. U her, kde nedochází k posunu ve vyšších rozlišeních, je limitujícím prvkem fillrate. Spočítej si, o kolik má i taková GTX 1070 vyšší fillrate než Vega 64.

„Dále je to příšerná spotřeba čipu při vysokých frekencích.“

Což je jediný zásadní nedostatek architektury, o kterém mluvím - nedostatečná optimalizace návrhu pro vysoké takty. Na vině může být ale částečně(!) i výrobní proces. I Nvidia má na 14 nm Samsungu při stejných taktech se 16nm TSMC horší energetickou efektivitu, proto 14 nm čipy taktuje níž. Je to zkrátka proces, který byl vyvinutý primárně pro malé ARM SoC, které se mohou snadno držet v energetickém optimu procesu.

„Na vyssich rozlisenich se

no-X https://diit.cz/autor/no-x

12. 6. 2018 - 09:04 https://diit.cz/clanek/od-navi-bude-amd-vydavat-jedno-gpu-rocne/diskuse „Na vyssich rozlisenich se naskok v IPC smaze neresenym bottleneckem“ Naopak, Fiji vykazovala při nízkých rozlišeních mizerné škálování výkonu, krom 4k nebyla příliš konkurenceschopná. Limit v podobě pomalého front-end byl odstraněn, proto u Vegy došlo k nárůstu výkonu v nižších rozlišeních, kdy je limitujícím prvkem geometrie a rasterizace. Ve vyšších rozlišeních se tento limit neprojevoval, proto jeho odstranění nemělo ve 4k na výkon vliv. „Ani nynejsich 10% IPC nad Fiji nestaci Veze k predehnani Polarisu...“ Nějaký důkaz? „Rozdil mezi 56 a 64CUs - 14% - se casto projevi jen 2% narustem vykonu...“ Což ovšem není limit architektury jako spíš konkrétní konfigurace. 64 ROP pro 256 TMU a 4096 SP je málo, takže je zřejmé, proč navyšování počtu SP a TMU nepřináší lineární škálování výkonu. „Dále geometrie (Primitive shader) - Front-End, omezení konfigurace čipu na pouhé 4SE (4trojuhelníky/takt) se ukazuje jako významné omezení výkonu, protože čip velmi špatně škáluje nad 3500SP“ To je zcela chybná logická konstrukce. Důkazem, že front-end je v pořádku, je právě výkonnostní posun při nízkých rozlišeních. U her, kde nedochází k posunu ve vyšších rozlišeních, je limitujícím prvkem fillrate. Spočítej si, o kolik má i taková GTX 1070 vyšší fillrate než Vega 64. „Dále je to příšerná spotřeba čipu při vysokých frekencích.“ Což je jediný zásadní nedostatek architektury, o kterém mluvím - nedostatečná optimalizace návrhu pro vysoké takty. Na vině může být ale částečně(!) i výrobní proces. I Nvidia má na 14 nm Samsungu při stejných taktech se 16nm TSMC horší energetickou efektivitu, proto 14 nm čipy taktuje níž. Je to zkrátka proces, který byl vyvinutý primárně pro malé ARM SoC, které se mohou snadno držet v energetickém optimu procesu. https://diit.cz/clanek/od-navi-bude-amd-vydavat-jedno-gpu-rocne/diskuse#comment-1154934 +

del42sa | 12. 6. 2018 - 11:05

to je jen okecávání, nikdo kromě tebe nepochybuje o tom, že těch bottlenecků je tam spousta a je jedno jestli jde o architekturu nebo konkrétní konfiguraci čipu:

srovnání IPC dle generací :

GCN3 (Tonga, Fiji)
IPC = 100%

GCN4 (Polaris 10)
IPC = ~110%

GCN5 (Vega 10)
IPC = ~110%

s posledními drivery to dělá průměrně těch 10%, před rokem to bylo jenom 5% oproti Fiji https://www.hardocp.com/article/2017/09/12/radeon_rx_vega_64_vs_r9_fury_...

to procentuální srovnání ukazuje (mimo jiné další aspekty) důvod proč nemá cenu vydávat VEGA 11 jako dGPU coby nástupce Polarisu.

kombinace pouhých 4SE/GE a jen 64 rops s 4096SP se ukazuje jako úzké hrdlo Vegy ( to samé platilo pro Fiji ) jde prostě o nevyvážený poměr a ty jednotky zůstávají nevyužité a ny výkonu je to vidět.
Co se geometrie týče, tak 4 trojuhelníky za takt jsou už dneska také málo, ostatně kdyby si to AMD nemyslelo, tak by ani nevznikl Primitive Shader kde inzerují až 7trojuhelníků za takt ...( ať už se to číslo opírá o cokoliv )

Dobře to popsal Pavel Šantrůček tady v článku kde se spekulovalo o Fiji (varianta č.2) a ostatně to stejné platí i pro Vegu :
https://www.svethardware.cz/amd-fiji-jak-bude-vypadat-a-jaky-bude-vykon-...

Ani ty vyšší takty nejsou tak úplně pravdou, protože většina Vega karet ( vyjma vodou chlazených verzí ) pracuje někde okolo 1470 - 1550 MHz, což je ve srovnání s Pascalem který běžně boostuje ke 2GHz docela málo, nehledě na neúměrnou spotřebu toho čipu a vlastně přes použití úspornějších HBM, dostavají ty karta čočku od konkurence používající obyčejné GDDR5/GDDR5x paměti při nižší spotřebě....

GCN3 (Tonga, Fiji)

del42sa https://diit.cz/profil/del42sa

12. 6. 2018 - 11:05 https://diit.cz/clanek/od-navi-bude-amd-vydavat-jedno-gpu-rocne/diskuse to je jen okecávání, nikdo kromě tebe nepochybuje o tom, že těch bottlenecků je tam spousta a je jedno jestli jde o architekturu nebo konkrétní konfiguraci čipu: srovnání IPC dle generací : GCN3 (Tonga, Fiji) IPC = 100% GCN4 (Polaris 10) IPC = ~110% GCN5 (Vega 10) IPC = ~110% s posledními drivery to dělá průměrně těch 10%, před rokem to bylo jenom 5% oproti Fiji https://www.hardocp.com/article/2017/09/12/radeon_rx_vega_64_vs_r9_fury_x_clock_for/15 to procentuální srovnání ukazuje (mimo jiné další aspekty) důvod proč nemá cenu vydávat VEGA 11 jako dGPU coby nástupce Polarisu. kombinace pouhých 4SE/GE a jen 64 rops s 4096SP se ukazuje jako úzké hrdlo Vegy ( to samé platilo pro Fiji ) jde prostě o nevyvážený poměr a ty jednotky zůstávají nevyužité a ny výkonu je to vidět. Co se geometrie týče, tak 4 trojuhelníky za takt jsou už dneska také málo, ostatně kdyby si to AMD nemyslelo, tak by ani nevznikl Primitive Shader kde inzerují až 7trojuhelníků za takt ...( ať už se to číslo opírá o cokoliv ) Dobře to popsal Pavel Šantrůček tady v článku kde se spekulovalo o Fiji (varianta č.2) a ostatně to stejné platí i pro Vegu : https://www.svethardware.cz/amd-fiji-jak-bude-vypadat-a-jaky-bude-vykon-spekulace/40502-2 Ani ty vyšší takty nejsou tak úplně pravdou, protože většina Vega karet ( vyjma vodou chlazených verzí ) pracuje někde okolo 1470 - 1550 MHz, což je ve srovnání s Pascalem který běžně boostuje ke 2GHz docela málo, nehledě na neúměrnou spotřebu toho čipu a vlastně přes použití úspornějších HBM, dostavají ty karta čočku od konkurence používající obyčejné GDDR5/GDDR5x paměti při nižší spotřebě.... https://diit.cz/clanek/od-navi-bude-amd-vydavat-jedno-gpu-rocne/diskuse#comment-1154940 +

no-X | 12. 6. 2018 - 16:43

„to je jen okecávání“

To je pěkné, Tvé vlastní domněnky jsou fakta, ale když je vyvrátím konkrétními argumenty postavenými na měřitelném chování karty, je to okecávání :-)

„nikdo kromě tebe nepochybuje“
{{Citation needed}}

„srovnání IPC dle generací“
{{Citation needed}}

„před rokem to bylo jenom 5% oproti Fiji“
Záleží na výběru her. Když je hra limitovaná procesorem, tak je procesorem limitovaná stále. Už při vydání byl v některých hrách náskok Vegy při stejných taktech ~25 %.

„Co se geometrie týče, tak 4 trojuhelníky za takt jsou už dneska také málo, ostatně kdyby si to AMD nemyslelo, tak by ani nevznikl Primitive Shader“
To je spíš tvá neznalost toho, k čemu je PS určen. Už v předchozích příspěvcích naprosto nekriticky mícháš, kolik trojúhelníku za takt je čip schopný vykreslit a kolik trojúhelníků za takt jich je čip schopný odstranit. Primitive Shader nemá sebemenší vliv na trianglerate.

„Ani ty vyšší takty nejsou tak úplně pravdou“
Možná by bylo dobré, pokud by jsi četl, na co reaguješ, protože už podruhé píšu, že právě nedostatečné optimalizace pro vyšší takty jsou jediný zásadní problém Vegy.

del42sa | 12. 6. 2018 - 18:52

Asi neumis cist :-) ale to fakt neni muj problem....

PS: ja vim jak funguje PS a nikde jsem nenapsal ze zvysuje triangle rate ackoliv kazdemu alespon trochu inteligentnimu cloveku je jasne, ze vykreslovanim pouze viditelnych trojuhelniku dochazi k celkove vyssimu geometrickemu vykonu, respektive ty fyzicke ctyri GE pracuji mnohem efektivneji nez pri pouziti standartni geometrie.

https://radeon.com/_downloads/vega-whitepaper-11.6.17.pdf

Tolik sucha teorie, pravdou je ze nikdo krome nekolika vyvolenych lidi z laboratori AMD ale nevidel v realu Primitive Shader na Veze fungovat , SDK neexistuje a dodnes z teto featury zustava pouze jeden zajimavy slajd v prezentaci :- D Jestli to byla jen featura vycucana z prstu, ktera nikdy nemela byt funkcni a slouzila pouze k tomu, aby udelala Vegu atraktivnejsi necham na posouzeni druhych....

JonPhoenix | 12. 6. 2018 - 20:17

Co je všechno možné překopat na stávajícím designu, když to chtějí vydat v H1 2019? Asi moc ne, co? Základní limitace architektury tam asi zústanou...

Mali | 13. 6. 2018 - 12:58

"s posledními drivery to dělá průměrně těch 10%"

A tady je tvoje chyba. Nemuzes mluvit o IPC HW architektury a zaroven rici, ze optimalizace na strane SW (driver) udela nejake procenta.

Celkovy vykon, ktery zmeris v nejake mnozine her je poplatny:
1. Engine tech her a programatori to kolikrate prasi jako hovada
2. SW driver, casto resi prave nedokonalosti zpraseneho enginu. Navic se treba meni obecne naroky her, takze SW driver muze obsahovat zmeny, ktere ve starsich 179 hrach uberou 1% vykonu a u 15 novejsich pridaji 7%.
3. Frekvencni moznosti architektury
4. Nastaveni testu
5. IPC pro dane nastaveni (teselace, atp.)
6. Prostredi

Nahod link na testy, kde je presne stejny system (chlazeni v bedne, atp.), presne stejny vyber her, presne stejne nastaveni tech jednotlivych her, a pak se muzeme bavit.

Do te doby jen placas :)

Jaroslav Crha | 12. 6. 2018 - 10:29

Chvála bohu konečně někdo utne GCN architekturu, která se ukázala FAILem už v době uvedení Polarisek. Jde vidět ozdravný proces po odejití bankrotáře ATi a skoro bankrotáře GPU AMD Koduriho !!! Bravo AMD! Jen tak dál!

RedMaX | 12. 6. 2018 - 23:08

Sorry, ale nechval dne pred vecerem. Protoze uplne stejne dokonale to AMDecku vychazelo na papire pred vydanim Polarisu (coz ti uznavam, ze jsi odhalil jako prvni) a pred vydanim Vegy. Na papire to meli, v realu z toho bylo .... Takze ono je hezky utinat GCN, ale aby to pak meli taky cim nahradit nebo to muzou zabalit uplne.

Peter Fodrek | 13. 6. 2018 - 13:19

tak prelomovú architektúru ako GCN nikto nezahodí

Porting GCC to AMD GCN microarchitecture
Honza Hubička
SuSE ČR s.r.o
Prague
Joint work with Martin Jambor
GNU Cauldron 2016

AMD Graphics Core Next

First specification released in 2011
!!!!Similar to traditional CPUs (unlike the predecessors)!!!!!
https://gcc.gnu.org/wiki/cauldron2016?action=AttachFile&do=view&target=P...

A to že viac a viac rozvíjajú túto vlastnosť nie je chyba..

del42sa | 13. 6. 2018 - 15:03

a protoze je GCN tak prelomova, tak proto ji AMD opousti a nahradi ji nova jeste prelomovejsi
:-D

Tom | 14. 6. 2018 - 05:03

tak zatim ji nahradi pouze dalsi generace co bude dal a jak se to bude jmenovat je ve hvezdach :) (treba to jen prejmenuji aby to bylo vic cool ;) ale pojedou ve starych kolejich)

tombomino | 13. 6. 2018 - 08:46

Kdo ma chut, tady je zajimavy clanek pojednavajici o duvodech zpozdeni Navy, vyvoji grafickych cipu vazanych na Apple a Sonny... a jak to vlastne cele bylo :) Krome toho dava nahlidnout do moznych vydani Navy pristi a popristi rok.
https://wccftech.com/exclusive-amd-navi-gpu-roadmap-cost-zen/

no-X | 13. 6. 2018 - 13:54

Problém toho článku je, že je v přímém rozporu s tím, co prakticky zároveň zveřejnil Ashraf Eassa a krom toho je v rozporu i s posledním vyjádřením AMD. AMD jasně řekla, že v roce 2019 vydají herní 7nm produkt. Podle článku WCCFTech 7nm Vega jako herní produkt vydaná nebude a 7nm Navi může přijít až na začátku roku 2020. Nějak jim ze scénáře vypadlo, co 7nm tedy AMD vydá.

Dále tvrzení, že Navi a NextGen jsou stejná architektektura je rovněž v rozporu s vyjádřením AMD, podle které je NextGen jiná architektura.

Možná se dostali k nějakým pravdivým faktům, ale vybájili si kolem toho takový informační balast, že to nelze brát vážně.

del42sa | 13. 6. 2018 - 17:10

Dle původní roadmapy mělo být NAVI už v roce 2018
https://www.extremetech.com/wp-content/uploads/2016/03/AMDGPU.jpg

podle posledních informací jde o produkt pro rok 2019.
https://images.anandtech.com/galleries/6399/COMPUTEX%202018%20-%20Lisa%2...

Nějaké vysvětlení, proč by ho měli vydat až v roce 2020 ?

tombomino | 14. 6. 2018 - 09:04

S tim NextGen souhlasim, to zni divne, ale vydani prvni Navi uvadeji na 2019 a to dokonce 2 varianty pro 2019
- "Navi 10 will be the first Navi part to arrive and will be landing sometime in 2H 2019 or early 2020, depending on a couple of factors. The performance level of this part will be equivalent to Vega and it will be a small GPU based on 7nm."
- "Navi 14 will follow Navi 10 soon after."
2020 je v tom clanku myslene "velke Navi", pokud jeste vubec existuje po tech zmenach.
A jinak informace o tom, ze Navi byla vyvijena primarne pro PS5 je prinejmensim zajimava ;)

del42sa | 14. 6. 2018 - 07:19

https://www.pcgamesn.com/amd-navi-monolithic-gpu-design?tw=PCGN1

AMD’s Navi will be a traditional monolithic GPU, not a multi-chip module

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.

Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Od Navi bude AMD vydávat jedno GPU ročně

Komerční sdělení

CDR Hry

Epic rozdává zdarma dvě hry, které potěší hráče RPG her a adventur

Copilot mizí z Edge jen na oko. Ve skutečnosti je teď úplně všude

Existují mimozemšťané? Tohle dnes říká věda, armády i astronomové

„Budu v pohodě?“ ptal se ChatGPT. Krátce poté zemřel

Falešný TikTok znovu útočí. Nový malware krade bankovní účty i kryptoměny

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT