Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD Kaveri ponese dva paměťové řadiče: DDR3 i GDDR5 - rozbor

Já vidím jen jeden (resp. dva) potenciální problém řešení APU+GDDR5 na jednom kusu křemíku: nižší spolehlivost pamětí oproti samotnému CPU. To se dá nazírat dvěma způsoby:

a) modul může vlivem teplot (i od APU) rychleji degradovat a vada rovná se výměně CPU

b) což plyne z a), potřeba účinného a kvalitního chlazení a zároveň vysoce kvalitních DRAM čipů ve vhodném balení.

a) i b) pravděpodobně zásadně zvýší cenu výsledného produktu (buď přímo, nebo nepřímo jako náklady na RMA)...

Jsem docela zvědav na výkon, cenu i spolehlivost..

+1
+2
-1
Je komentář přínosný?

Já si naopak myslím, že to bude menší problém než u grafických karet. PCB na high-end grafikách dosahuje teplot až ke 100 °C, ale GDDR5 čipy jsou výrazně chladnější (i díky kontaktu s chladičem), takže dochází k výraznému namáhání. Naproti tomu APU je přímo chlazené, takže jeho teplota bude odhadem do 70-80 °C a rozdíl oproti paměťovým modulům bude mnohem nižší.

Samotné GDDR5 čipy chlazení nepotřebujou, běžné mají TDP kolem 1,5 wattu a tyhle low-power 3GHz verze podle mě nepřelezou ani 1 watt.

Dívat se na to dá i z druhé strany. Jelikož pro notebook s určitým konkrétním výkonem nebude třeba APU + grafika s pamětmi, ale jen APU s pamětmi, měl by být naopak poměr cena/výkon příznivější a stejně tak i náklady na reklamační výlohy nižší (o čip - tzn. potenciální poruchu - méně).

+1
+4
-1
Je komentář přínosný?

Jak je to s tím bufferem? Zdá se mi hodně odvážné tvrdit, že 1GB stačí - už jen kvůli postprocess efektům kdy si do bufferu karty ukládají předrenderované snímky. Kdyby si to přehazovaly ddr3 <-> gddr5 tak zase způsobí řadiči hodně vysoký traffic. Jako neřeknu kdyby to bylo v silně optimalizovaných zařízeních (třeba jako playstation) kde byl důraz kladen primárně na stranu vývojáře, ale ja je u pcček zvykem tak jsou skoro všechny programy nenažraný (a proto mají profi karty násobně větší kapacity než ty herní zhruba od dob unifikace)

+1
+3
-1
Je komentář přínosný?

Myslim, ze 1GB asi stacit bude. Novy konzole jsou navrzeny na fullHD a Kaveri patri do booku, kde asi nikdo nepredpoklada vyuziti vyssiho rozliseni. Za dva roky to asi bude jinak, ale to uz nebude pro Kaveri aktualni.

+1
0
-1
Je komentář přínosný?

Pro 1920×1200 i při kombinaci FP16, 32bit Z-Bufferu a MSAA 8× (což je vysoko nad možnostmi Kaveri) je třeba přesně 147,2 MB. I když se k tomu připočtou jakékoli nestandardní či nadstandardní postupy, stále si nedokážu představit, jak by mohlo dojít k vyčerpání byť jen 512 MB, když klasické textury - největší konzument grafické paměti - nezabírají ani megabajt, protože leží jinde.

+1
+2
-1
Je komentář přínosný?

Rozlišení x hloubka x aa x fps? Počítáš tedy holý 2d frame při 30fps plus aa bez dalších pam. nároků? Připočti k tomu textury, stíny, geometrii atd. a moc paměti ti nezbyde. Jako doplňkový akcelerátor nebo storage, který by byl využitelný pro dedikovanou vga dobrý (něco na způsob sli s tím že by jedna karta viděla do paměti tý druhý)

+1
+2
-1
Je komentář přínosný?

To je ale ono, ne? Predrenderovane snimky uz textury zajimat nemusi. Veskere postprocess efekty se delaji na jednom celem obrazku, ne? Geometrie, stiny, atp. jsou uz soucasti. Tim padem by mela stacit i mala pamet.

Jestli to spatne chapu, tak mi to prosim osvetlete.

+1
+1
-1
Je komentář přínosný?

Tak ono záleží na konkrétní scéně - někdy je lepší volit třeba supersampling, zaplácat si framebuffer, ale ušetřit traffic a někdy naopak. Silně záleží na optimalizaci, která je bohužel na ústupu a všecko se vynahrazuje hrubým výkonem.

Předrenderované snímky taktéž mohou sloužit k dalšímu zpracovávání takže mohou být v paměti delší dobu (dejme tomu aa a přes to pak ještě overbright filtr - tohle má ve zvyku třeba crytek na sluníčku, které je velmi nenažrané na velikosti shadow mapy plus ještě k tomu přes to naflákaj volumetric aby to jó žralo).

Jako chcete po mě vysvětlit něco na co existují časově náročné školení a existují bible ;)

+1
+2
-1
Je komentář přínosný?

Termomechanika nebyla nikdy mou oblíbenou disciplínou, nicméně tady IMHO nejde přece o kondukci tepla ve smyslu gradientu PCB-čip-chladič, ale o to, že:

a) čip bude daleko, daleko blíže zdroji tepla (APU)

b) hmota a plocha PCB bude řádově menší (tedy i její tepelná kapacita, ergo změny teplot budou rychlejší, a to řádově

c) z důvodu menší plochy bude teplota vyšší (resp. v konečném důsledku rovnoměrnější). Přece jen PCB hiendových grafik mají těch 100° jen v okolí VRM, případně GPU, ale pod pamětmi už to málokdy bývá více než 80° - stačí se podívat na termosnímky..

d) plocha i objem chladiče APU určitě nebude mít barnumské rozměry jako mají chladiče GPU..

A co se cen týká - dovolil bych si rovněž nesouhlasit, viz Wift a jeho notebook s "nadnormativním" GPU nvidia. Obecně je z hlediska ceny spíše problém "hi-tech" řešení (např. to sofistikované chlazení a lepší materiály), než osazení PCB jedním levným (protože levně a masově vyráběným) čipem navíc. Totéž je vidět u subnotebooků a malých 13" notebooků - jejich ceny, ač osazeny "běžnými komponentami", jsou vyšší, než standardní 15,6" konfekce. Materiály, konstrukce atd. jsou prostě dražší, když je jich "míň."

+1
+3
-1
Je komentář přínosný?

Moment nieco mi unika ? V clanku sa nepise ze pamete GDRR5 budu na jednom kremiku s APU. Iba tolko ze v APU bude radic GDDR5.
Ked nevadi teplota radicu DDR3 spravia aby nevadila ani radicu GDDR5.

add "bude mít GPU k dispozici 51 GB/s na GDDR5, 20 GB/s na DDR3 - sečteno podtrženo 71 GB/s." IMHO to sa neda takto spocitavat.GPU predsa nebude moct vyuzit maximalnu rychlost do GDDR5 ak bude musiet cakat na pomalsi prisun udajov z DDR3. Iba pri casti vypoctov kde nepotrebuje "texturove" data z DDR3.Ale na zaver tie textury stejne musi vykreslit takze rychlost bude ciastocne obmedzovat DDR3.
Idealne pre APU by samozrejme bola dostatocne velka RAM integrovana na kremiku. Este par zmenseni vyrobneho procesu a mame to tu. Ked je mozne uz teraz 10 core E7-8870 + 30MB cache preco nevyrobia 4 Core+1GB cache/RAM ?

+1
+1
-1
Je komentář přínosný?

Heh teraz som to postol a o par minut clanok o eDDR integrovanej na buducich Intel Haswell APU :)

+1
+1
-1
Je komentář přínosný?

"bude mít GPU k dispozici 51 GB/s na GDDR5, 20 GB/s na DDR3 - sečteno podtrženo 71 GB/s." - to samozrejme mit NEBUDE :-)

+1
0
-1
Je komentář přínosný?

Důvod? :-)

+1
-1
-1
Je komentář přínosný?

http://diit.cz/clanek/do-prodeje-jdou-dve-nove-geforce-gtx-460-mozna-se-...

Zde pojednavate o 192bit karte ktera je vlastne 128+64bit. Rekl bych ze situace dvou radicu se bude chovat velmi podobne.

+1
0
-1
Je komentář přínosný?

Tady ale mluvíme o něčem zcela jiném. Nesymetrické využití jednotlivých kanálů v rámci jednoho řadiče s tímhle nijak nesouvisí. Ani mě nenapadá, proč by mělo. To, co popisuju u Kaveri, je v základu(!) podobný koncept, jaký je použitý třeba u Xboxu 360. Používala jej ale dříve i PowerVR, Real 3D a řada dalších. Koncept, kdy je pro textury použitá pomalá levná paměť o velké kapacitě a naopak pro operační buffery rychlá malá paměť - namísto jednoho sdíleného prostoru - není nic nového. V profesionální grafice to 3D Labs používal dlouhá léta. Oddělená texturová a pixelová paměť byly u prvních 3D akcelerátorů standardem. Nevím, proč by v tom měl být nějaký problém. Na jedné straně mám velký objem dat, který stačí načítat nízkou rychlostí, na druhé straně je třeba operační buffer, který není velký, ale je s ním třeba pracovat rychle. Není důvod, proč by nemohly být oddělené (dříve se to ani jinak nedělalo) a zvlášť když jde o situaci, kde je to s ohledem na poměr cena/výkon výhodnější.

+1
+1
-1
Je komentář přínosný?

Jo, jenomže 3dlabs měla taky ecc v úplně jiný kapacitě, žralo to jako kráva a stálo to půl mega. Přijatelnější to měly později quadra, ale ty měly paměť jednolitou a "trošku" větší než 1gb ;)

+1
-2
-1
Je komentář přínosný?

Nerikam ze to fungovat nemuze, ale bavime se o tom ze se to neda scitat, tak jako je popsano v tom odkazovanym clanku, nebo scitani frekvenci/vykonu multi-jadrovych procesoru. Jinak to reseni je efektivni a nechapu proc to uz neprislo driv na dedikovanych grafikach.

+1
+3
-1
Je komentář přínosný?

To scitanie bolo velmi zjednodusene. A nemyslim, ze grafika, si bude rovnomerne rozkladat data, pre optimalne vyuzitie priepustnosti. Skor sa bude spoliehat na tu GDDR5, tam kde to bude mat prinos. Takze priepustnost bude niekde medzi 51 a teoretickim maximom. Ale aj to by malo znacny prinos. Lebo tych 51GB/s ma k samostatnym grafikam ovela blizsie ako 20.

+1
+5
-1
Je komentář přínosný?

Zcela jednoduchy, tohle bude platit pouze za predpokladu, ze se jedna nebo druha pamet nezaplni - a vzhledem k tomu, ze ta rychlejsi bude podstatne mensi, tak si myslim, ze v realu tento jednoduchy soucet proste platit nebude. :-)

+1
0
-1
Je komentář přínosný?

Přenosy klasických textur tvoří ve většině her 25-40 % z celkových přenosů, které se na sběrnici odehrávají. Můžeš mi vysvětlit, proč by 20 GB/s mělo být brzdou pro samotné textury, když v současnosti těchto 20 GB stačí pro textury i buffery zároveň?

+1
0
-1
Je komentář přínosný?

Niesom odbornik ale ak som spravne pochopil vseobecny postup tak textury sa nenacitaju iba raz. Spracuje sa model->nacita textury-> "nejak ich predspracuje napr kvoli osvetleniu"-> odlozi do buffera pracovnu verziu "textur"->dalsi spracovanie gemotretrie efektov atd.-> nacitanie pracovnych "textur" na spracovanie full screen postprocesing efektov /AA-> znovu ulozenie finalneho renderu...
K tomu double/triple buffering kvoli vsync. Pri vyssich rozlisenia a stupnoch AA bude 20 GB/s DDR brzda. Inak by na hiend GK nemusela byt GDDR5 na 6 GHz

+1
+1
-1
Je komentář přínosný?

Tak v sucasnoti tych 20GB/s nestaci. Kazde zrychlenie RAM sa odrazi na grafickom vykone APU. Na druhu stranu 1GB pamate na karte staci prakticky na vsetko okrem extremnych pripadov, to je pekne vidiet na porovnani HD7850 s 1 a 2 GB. Takze ak by to riesenie malo byt urcene primarne pre notebooky, tak nie je velky problem davat par chipov GDDR5 hned pri CPU a mat 1GB videopamate.

+1
0
-1
Je komentář přínosný?

Súhlasim tuto s Noxom. Bohužiaľ, ale už to asi nikdy nevygoglím, ale čítal som na internete starší článok (v čase keď vyhladzovanie nebolo ešte bežné), ktorý pojednával o tom čo vo videopamäti VGAčky záberá pamäťovú priepustnosť.
Najviac zaťažuje videopamäť 1.snímok ktoré práve buduje GPU a z-buffer cca spolu až 60%. Nasavanie textur pre TMU tvorý len asi 20-30% pamäťovej priepustnosti. Ostatné (RAMDAC,...nepamätám sa už čo) tvorí ten zbytok 10-20% prenosu. Podotýkam, že článok bol dosť starý, takže dnešné moderné GPU môžu mať tieto čísla už odlíšné, no verím že v princípe ale stále podobné. Takže takéto rýchle "lokálky" s menšou kapacitou sú rozumným riešením ako neobmedzovať GPU.
Ako spomínal no-x, nečudoval by som sa že AMD so skúsenosťami s eDram s XBOXu podobný koncept zachová, kde by na ROPy zavesil len rýchly frame buffer GDDR5 (tam by naozaj aj 512MB bolo až až) a pre TMU by separátne (na "opačnej" strane čipu části GPU APU) samostatný radič pristupoval len a len k textúram so zdieľanej DDR3ky. Separátny radič na frm. buffer a textury zvlášť, by mohol mať nakoniec vyšší výkon než radič spoločný v rámci porovnávania prenosu 50+20=70GB/s. GBajty/s nie su všetko. A vieme že 1+1 nemusí byť zákonite 2. Potreby ROPs a TMUs sa nebudú byť o jednu zbernicu, ale každá jednotka si bude obťažovať svoj radič a latencie tým pádom budú priaznivejšie.

+1
+2
-1
Je komentář přínosný?

No jo, ale co treba takovy rendering do textury ;).

+1
+1
-1
Je komentář přínosný?

Pokud myslíš tzv. baked textury tak ty byly samzřejmostí jako součást optimalizací (typicky třeba u Quaka kdy se při natahování levelu spočítaly stíny a následně používaly jako textury) ;)

+1
0
-1
Je komentář přínosný?

Co maji vsichni proti slotum? Proc se vsechno musi hned letovat?

+1
+5
-1
Je komentář přínosný?

Slot je drahý, velký a málo spolehlivý. U věci, jejíž výměna za jinou se v době životnosti přístroje nepředpokládá, je hloupost jej použít.

Už jste někdy měnil v notebooku videopaměť?

+1
+3
-1
Je komentář přínosný?

Kdyby to šlo, tak určitě. Vyráběly se vůbec někdy grafické karty s výměnnou videopamětí?

+1
+2
-1
Je komentář přínosný?

Jistě - třeba takové S3 Trio nebo dokonce i u integrovaných ATIn šla pameť rozšířit http://bit.ly/Z0H6XF - a to není všechno, tenkrát nebyl problém přihodit i nějakou cache http://bit.ly/Z0HghS ;)

+1
-2
-1
Je komentář přínosný?

AMD vzdy malo vacsi problem s latenciou a datovym tokom
a ostalo to stale, aj ked tu to uz nie je tak vyrazne
http://hexus.net/tech/reviews/cpu/46073-amd-a10-5800k-trinity-needs-fast...
aj ako intel
https://cs.uwaterloo.ca/~brecht/courses/854-Scalable-Systems-Software/Po...

a cele sa to spravalo dost podivne, ak neie je problemom synchronny prenos
http://blogs.utexas.edu/jdm4372/2010/10/01/amd-opteron-memory-latency-ch...

ja si myslim,ze ten druhy GiB GDDR5 je urceny na zvysenie vykonu CPU znizenim latemcie

+1
+1
-1
Je komentář přínosný?

Vždycky ne, AthlonyXP a X2 byly podstatně rychlejší než Phenomy. V podstatě mě to jednu dobu štvalo natolik, že jsem šoupnul X4 do starší desky s DDR2 kde se dalo dostat pod 40ns díky ramkám. Toho samého jsem dosáhl na DDR3 jenom s hrstkou pamětí (GeiLy EVO, OCZ Platinum). A problémem GDDR5 jsou právě značné latence. Cestou navyšování frekvence šel odjakživa Intel což bylo dražší a kolikrát méně efektivní než u AMD (to dokázalo s DDR1 zle potrápit leckdy dražší pentia s DDR2), navíc teď už mě overclock jaksi nebaví jako tenkrát ať už kvůli času nebo kvůli málo zajímavým komponentám kde už se nevyplatí připlácet - maximálně koupím pasiv na cpu/gpu. Nemožné to určitě není, ale podle toho co AMD v poslední době předvádí je to velmi nepravděpodobné :(

+1
+1
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.