Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k APU s jádry Zen bude vyrábět GlobalFoundries ve spolupráci s Amkor

Pořád je zde možnost, že půjde o nějaké semicustom čip na zakázku a nikoliv o spotřební APU do běžných PC. ( byť by ta integrovaná grafika potřebovala nějak řešit propustnost jako sůl, bohužel AMD je v tomhle ohledu pořád zatvrzele konzervativní a spoléhá stále na standartní paměti DDR3/DDR4 a při ceně HBM se jim na druhou stranu nelze divit )

Už samotný zdroj té informace je poněkud pochybný.....

+1
+4
-1
Je komentář přínosný?

Nemyslím, že by AMD byla zatvrzele kozervativní, spíš u stávajícíh APU nemají HBM smysl a to nejen proto, že jsou drahé, ale i proto, že paměti nejsou brzdou. Zvlášť u Carrizo ne. Myslím, že by díky delta-kompresi mělo smysl i APU s 16 ROP (Kaveri a Carrizo mají 8) a 768-896 SP. DDR4 by stačily. Jenže takové APU nemá na 28nm smysl, bylo by příliš velké - a nic jiného než 28nm proces dosud AMD neměla.

+1
-7
-1
Je komentář přínosný?

Nesouhlasím, DDR3/4 paměti brzdou jsou a platí to bohužel i pro Carrizo s delta compresí: O tom, že hlavním důvodem nepoužití HBM v mainstreamu je cena jsem už psal ve svém prvním příspěvku.

http://semiaccurate.com/forums/showpost.php?p=257384&postcount=408

+1
-12
-1
Je komentář přínosný?

Souhlasit nemusíš, ono to tak prostě je ;-)

Carrizo má při 2400MHz pamětech k dispozici 38,4 GB/s na fillrate 6,4 GPix/s (8*800)
Tonga resp. Radeon R9 380X má k dispozici 192 GB/s na fillrate 31,04 GPix/s (32*970)
Hawaii, resp. Radeon R9 290X má k dispozici 320 GB/s na fillrate 64 GPix/s (64*1000)

vzájemným vydělením hodnot si snadno spočítáš, že na jeden GB/s mají jednotlivé čipy fillrate:

Carrizo: 166,67 MPix/s
R9 380X: 161,67 MPix/s
R9 290X: 200 MPix/s

Čím vyšší číslo, tím více je výkon čipu limitovaný paměťovou propustností. Carrizo je tedy méně limitovaná datovou propustností než Hawaii i s její 512bit sběrnicí a krom toho má navíc bonus v podobě delta-komprese. Oproti samostatným kartám se navíc nepočítá se scénáři náročnými na paměťovou propustnost jako např. použití MSAA 8× a dále odpadá šířka pásma, která je u samostatných GPU využita k přenosu textur z RAM do VRAM.

+1
-12
-1
Je komentář přínosný?

tohle šermování s čísly by se hodilo možná do nějaký prezentací AMD, ale praxe ukazuje něco úplně jiného :)

Už i Kaveri je výrazně limitováno propustností pamětí a Bristol Ridge má mít GPU s výrazně vyššími takty...

+1
-1
-1
Je komentář přínosný?

To není šermování s čísly, to je realita. Přes 2/3 datových přesunů generují ROPs. Už z toho důvodu má Kaveri poloviční počet ROP oproti samostatné HD 7750, která má jinak identické parametry. Zbylá necelá třetina jsou textury, ovšem jak už jsem zmiňoval, v případě APU je to ještě méně, protože tam nedochází k dvojitým přesunům.

První testy z doby vydání Kaveri nejsou vypovídající, později se ukázalo, že ta extrémní závislost na taktu pamětí byla bugem v ovladačích, který byl odstraněn v Catalystech 14.2 beta, se kterými vzrostl výkon a klesla závislost na rychlosti pamětí. Carrizo má navíc delta-kompresi, díky které třeba u R9 280X/380X mohla AMD snížit datovou propustnost o třetinu při zachování v průměru stejného výkonu.

+1
+6
-1
Je komentář přínosný?

DDR4-2400 dual-channel ~= 38,4GB/s
Memory compression is about 35%. (after Tonga)
In the best case, that would make 59GB/s

DDR3-1866 dual-channel ~= 30GB/s
Memory compression was about 5%. (before Tonga)
In the best case, that would make 31,6GB/s

That is +86,7% bandwidth, but still not enough:
Radeon R7 240 = 28.8 GB/s (and 0,73Ghz 320 SP's)
Radeon R7 250 = 73.6 GB/s (and 1Ghz 384 SP's)
Radeon R7 360 = 104.0 GB/s (and 1,05Ghz 768 SP's)
More than 512SP's wouldn't make sense.

+1
-1
-1
Je komentář přínosný?

Takova blba otazka, nema jeste GPU v APU orezanou datovou propustnost o to co potrebuje CPU cast? Nebo to uz je do vaseho vypoctu zapocitano?

+1
+4
-1
Je komentář přínosný?

Pokud je řeč o procesoru, skutečně jen o procesorových jádrech, tak se zpravidla počítá se 4 GB/s na plnohodnotné jádro v plné zátěži. V případě Carrizo jde o architekturu se sdílenými FPU, což nároky snižuje, stejně tak je snižuje fakt, že jde o konzervativně taktovaná jádra, která nejsou optimalizovaná pro maximální výkon, ale snížené energetické nároky. V plné zátěži tak můžeme počítat s cca 8-10 GB/s pro všechna čtyři jádra.

Vtip je v tom, že procesorová a grafická jádra nejsou v herní zátěži nikdy zároveň vytížena na maximum (to ani nedovolí TDP limit). Pokud máme mluvit o situaci, kdy je paměťová sběrnice vytížená, musí jít o okamžik, kdy je grafické jádro vytížené na maximum. V takovém okamžiku ale není procesor vytížený víc než z pár desítek procent, čemuž budou odpovídat i jeho nároky na paměťové přesuny (řádově nízké jednotky GB/s).

+1
-11
-1
Je komentář přínosný?

Použije AMD metódu Copy-Paste-and Optimize ako v prípade radiča pamätí z tunelu AMD762(Z čipovej súpravy AMD 760MPX) do Opteronu aj pre Fiji a Zen?

+1
-10
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.