rochu teraz odbocim od temy, a mozno sa tomu moc nerozumiem co je za tym, ale dodnes nechapem preco sa pri dnesnych vyrobnych technologiach a rozmeroch GPU este stale nenachadza embded frame a z-buffer priamo na cipe. Najviac datoveho toku zatazuje prave pristup do frame a z-buffra. Svoju ?silu? emded videoramky uz ukazala PS-2ka(40GB/s) alebo Xbox360(neviem kolko lebo tam je to dake pseudo ?emded? - data predsa len idu z jedneho kremiku na druhy).
Velkost plochy cca 20MB (1920*1200/32bit, frame+z buffer) by sa malo pri 55nm vyr. procese zmestit na 50-60mm2 s interne obrovskym datovym tokom. U nasledujucej 40nm by to mohlo byt uz len 30-35mm2. Co je napr u Nvidie zanedbatelna velkost oproti celemu cipu. Nevraviac o tom, ze priblizne na stejnej velkosti sa nachadzaju pin-pads pre 8*64bitovu (512bit) zbernicu na 12 vrstvom plosaku!
+1
0
-1
Je komentář přínosný?
Rado https://diit.cz/profil/dlugy
8. 4. 2009 - 15:09https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuserochu teraz odbocim od temy, a mozno sa tomu moc nerozumiem co je za tym, ale dodnes nechapem preco sa pri dnesnych vyrobnych technologiach a rozmeroch GPU este stale nenachadza embded frame a z-buffer priamo na cipe. Najviac datoveho toku zatazuje prave pristup do frame a z-buffra. Svoju ?silu? emded videoramky uz ukazala PS-2ka(40GB/s) alebo Xbox360(neviem kolko lebo tam je to dake pseudo ?emded? - data predsa len idu z jedneho kremiku na druhy).
Velkost plochy cca 20MB (1920*1200/32bit, frame+z buffer) by sa malo pri 55nm vyr. procese zmestit na 50-60mm2 s interne obrovskym datovym tokom. U nasledujucej 40nm by to mohlo byt uz len 30-35mm2. Co je napr u Nvidie zanedbatelna velkost oproti celemu cipu. Nevraviac o tom, ze priblizne na stejnej velkosti sa nachadzaju pin-pads pre 8*64bitovu (512bit) zbernicu na 12 vrstvom plosaku!https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse#comment-480694
+
Hmm, nevím sám, ale i gpu čipy už mají v sobě určité cache paměti, takže je možné, že cena přístupu do paměti se odbourává právě na této úrovni...
+1
0
-1
Je komentář přínosný?
Mandarinka (neověřeno) https://diit.cz
8. 4. 2009 - 15:49https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuseHmm, nevím sám, ale i gpu čipy už mají v sobě určité cache paměti, takže je možné, že cena přístupu do paměti se odbourává právě na této úrovni...https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse#comment-480700
+
8. 4. 2009 - 16:59https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskusePěkně si Expreview poradilo s obrázkem co jsem jim poslal ... zde je pro zájemce originál : http://i44.tinypic.com/2r2lthy.pnghttps://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse#comment-480707
+
8. 4. 2009 - 19:49https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse>> OBR_:
A to ti vadí, nebo se tím chlubíš?
https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse#comment-480730
+
" jde tedy o kondenzátory snižující rušení/zpětnou vazbu"
Ani omylem
Tieto kondenzatory jednoducho sedia na napajacej vetvi. Co je prekvapujuce je to ze ich dodali po okrajoch. Ja som myslel ze je uz dnes samozrejmostou mat deep trench kondenzatory rozmiestnene po celom cipe, ale paraziticky tyristor mozno navrharov odradil, ako aj to ze to zabera nejaku plochu a vyzaduje znacne dopovanie.
Kam sli tie tri miliony tranzistorov? Hovori sa ze len HD4870 (a HD4850 a HD4830) nemaju este implementovanu istu instrukciu hromadneho kopirovania dat, ktore uz maju HD43xx, HD46xx a HD4890. Pri vyvoji sa tym usetril cas ktory umoznil uviest kartu vcas na trh. Pri vyvoji HD4670 sa to dorobilo a uplatnilo na refresh HD4890 - tak to je spravne cenovo efektivne.
+1
0
-1
Je komentář přínosný?
jojo2 (neověřeno) https://diit.cz
8. 4. 2009 - 21:27https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse" jde tedy o kondenzátory snižující rušení/zpětnou vazbu"
Ani omylem
Tieto kondenzatory jednoducho sedia na napajacej vetvi. Co je prekvapujuce je to ze ich dodali po okrajoch. Ja som myslel ze je uz dnes samozrejmostou mat deep trench kondenzatory rozmiestnene po celom cipe, ale paraziticky tyristor mozno navrharov odradil, ako aj to ze to zabera nejaku plochu a vyzaduje znacne dopovanie.
Kam sli tie tri miliony tranzistorov? Hovori sa ze len HD4870 (a HD4850 a HD4830) nemaju este implementovanu istu instrukciu hromadneho kopirovania dat, ktore uz maju HD43xx, HD46xx a HD4890. Pri vyvoji sa tym usetril cas ktory umoznil uviest kartu vcas na trh. Pri vyvoji HD4670 sa to dorobilo a uplatnilo na refresh HD4890 - tak to je spravne cenovo efektivne.https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse#comment-480734
+
jojo2: Ne, tu funkci podporují jen RV730/RV740. RV770 ani RV790 ne, to bylo ve specifikacích uvedeno omylem. AMD to myslím v den vydání uvedlo na pravou míru.
dlugy: Ono je to bohužel výhodné jen pro konzole, které jsou určené pro předem daná omezená rozlišení. Do kapacity té paměti musíš počítat i prostor pro AA a protože nikdy předem není známo, kolik pixelů bude vyžadovat AA, tak je třeba počítat s nejhorší možnou variantou a tomu design uzpůsobit. EDRAM má dnes již smysl jen tam, kde se očekává použití FSAA vyššího, než 4x, protože dnešní čipy zvládají i AA 4x naprosto bez problému. A pokud si spočteš, kolik MB bys potřeboval pro Z-buffer o 8-16 násobném rozlišení, než jaké jsi uvedl a odhadneš výslednou plochu takového čipu, dostaneš se mimo rentabilní výrobní náklady.
Daleko větší smysl by mělo použití tile-based architektury, kdy se Z-buffer drží v čipu jen pro určité omezené rozlišení obrazového výřezu (dokud se nedokončí rendering onoho výřezu), ale to by vyžadovalo od píky novou architekturu (jsou tam i určité komplikace v souvislosti se složitějšími PS efekty). Jediný, kdo to má v současnosti zvládnuté, je PowerVR.
+1
0
-1
Je komentář přínosný?
no-X (neověřeno) https://diit.cz
9. 4. 2009 - 11:01https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskusejojo2: Ne, tu funkci podporují jen RV730/RV740. RV770 ani RV790 ne, to bylo ve specifikacích uvedeno omylem. AMD to myslím v den vydání uvedlo na pravou míru.
dlugy: Ono je to bohužel výhodné jen pro konzole, které jsou určené pro předem daná omezená rozlišení. Do kapacity té paměti musíš počítat i prostor pro AA a protože nikdy předem není známo, kolik pixelů bude vyžadovat AA, tak je třeba počítat s nejhorší možnou variantou a tomu design uzpůsobit. EDRAM má dnes již smysl jen tam, kde se očekává použití FSAA vyššího, než 4x, protože dnešní čipy zvládají i AA 4x naprosto bez problému. A pokud si spočteš, kolik MB bys potřeboval pro Z-buffer o 8-16 násobném rozlišení, než jaké jsi uvedl a odhadneš výslednou plochu takového čipu, dostaneš se mimo rentabilní výrobní náklady.
Daleko větší smysl by mělo použití tile-based architektury, kdy se Z-buffer drží v čipu jen pro určité omezené rozlišení obrazového výřezu (dokud se nedokončí rendering onoho výřezu), ale to by vyžadovalo od píky novou architekturu (jsou tam i určité komplikace v souvislosti se složitějšími PS efekty). Jediný, kdo to má v současnosti zvládnuté, je PowerVR.https://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskuse#comment-480805
+
Diskuse k GPU Radeonu HD 4890 je opravdu vylepšenéhttps://diit.cz/clanek/gpu-radeonu-hd-4890-je-opravdu-vylepsene/diskusehttps://diit.cz/sites/default/files/diit-logo.png
rochu teraz odbocim od temy, a mozno sa tomu moc nerozumiem co je za tym, ale dodnes nechapem preco sa pri dnesnych vyrobnych technologiach a rozmeroch GPU este stale nenachadza embded frame a z-buffer priamo na cipe. Najviac datoveho toku zatazuje prave pristup do frame a z-buffra. Svoju ?silu? emded videoramky uz ukazala PS-2ka(40GB/s) alebo Xbox360(neviem kolko lebo tam je to dake pseudo ?emded? - data predsa len idu z jedneho kremiku na druhy).
Velkost plochy cca 20MB (1920*1200/32bit, frame+z buffer) by sa malo pri 55nm vyr. procese zmestit na 50-60mm2 s interne obrovskym datovym tokom. U nasledujucej 40nm by to mohlo byt uz len 30-35mm2. Co je napr u Nvidie zanedbatelna velkost oproti celemu cipu. Nevraviac o tom, ze priblizne na stejnej velkosti sa nachadzaju pin-pads pre 8*64bitovu (512bit) zbernicu na 12 vrstvom plosaku!
Hmm, nevím sám, ale i gpu čipy už mají v sobě určité cache paměti, takže je možné, že cena přístupu do paměti se odbourává právě na této úrovni...
Pěkně si Expreview poradilo s obrázkem co jsem jim poslal ... zde je pro zájemce originál : http://i44.tinypic.com/2r2lthy.png
>> OBR_:
A to ti vadí, nebo se tím chlubíš?
" jde tedy o kondenzátory snižující rušení/zpětnou vazbu"
Ani omylem
Tieto kondenzatory jednoducho sedia na napajacej vetvi. Co je prekvapujuce je to ze ich dodali po okrajoch. Ja som myslel ze je uz dnes samozrejmostou mat deep trench kondenzatory rozmiestnene po celom cipe, ale paraziticky tyristor mozno navrharov odradil, ako aj to ze to zabera nejaku plochu a vyzaduje znacne dopovanie.
Kam sli tie tri miliony tranzistorov? Hovori sa ze len HD4870 (a HD4850 a HD4830) nemaju este implementovanu istu instrukciu hromadneho kopirovania dat, ktore uz maju HD43xx, HD46xx a HD4890. Pri vyvoji sa tym usetril cas ktory umoznil uviest kartu vcas na trh. Pri vyvoji HD4670 sa to dorobilo a uplatnilo na refresh HD4890 - tak to je spravne cenovo efektivne.
jojo2: Ne, tu funkci podporují jen RV730/RV740. RV770 ani RV790 ne, to bylo ve specifikacích uvedeno omylem. AMD to myslím v den vydání uvedlo na pravou míru.
dlugy: Ono je to bohužel výhodné jen pro konzole, které jsou určené pro předem daná omezená rozlišení. Do kapacity té paměti musíš počítat i prostor pro AA a protože nikdy předem není známo, kolik pixelů bude vyžadovat AA, tak je třeba počítat s nejhorší možnou variantou a tomu design uzpůsobit. EDRAM má dnes již smysl jen tam, kde se očekává použití FSAA vyššího, než 4x, protože dnešní čipy zvládají i AA 4x naprosto bez problému. A pokud si spočteš, kolik MB bys potřeboval pro Z-buffer o 8-16 násobném rozlišení, než jaké jsi uvedl a odhadneš výslednou plochu takového čipu, dostaneš se mimo rentabilní výrobní náklady.
Daleko větší smysl by mělo použití tile-based architektury, kdy se Z-buffer drží v čipu jen pro určité omezené rozlišení obrazového výřezu (dokud se nedokončí rendering onoho výřezu), ale to by vyžadovalo od píky novou architekturu (jsou tam i určité komplikace v souvislosti se složitějšími PS efekty). Jediný, kdo to má v současnosti zvládnuté, je PowerVR.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.