Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Další spekulace o ATI R520

Jeden detail - *původní* počet pipelines R520 byl 16, nikoli 32 :-)

+1
+2
-1
Je komentář přínosný?

tak to jsi vedle, to maji uz dnesni mainstreamove karty (X800XL)

+1
+1
-1
Je komentář přínosný?

mimochodem 10000 bodů v 3DM05 už bylo prolomeno...

+1
+2
-1
Je komentář přínosný?

samozřejmě jsem myslel s jednou GF7800GTX

+1
+1
-1
Je komentář přínosný?

Mno a zase musim autora odkazat na Inquirer, sice je to klebetnk ale na druhu stranu maju najlepsie informacie.Zdrzanie sa nekona.A co sa tika 7800 Ultra tak kvoli nej asi vijde 32 pipelines verzia R520 alebo ak nebude dobra vitaznost tak vikonovo nadupane jadro R580.

+1
+3
-1
Je komentář přínosný?

adfbadfb: Vím, co píšu ;-)

+1
+1
-1
Je komentář přínosný?

NPTNS: na Inq. maj poslední dobou dost podivný informace. R520 nebude na trhu dřív než v září.

+1
0
-1
Je komentář přínosný?

no to nevim cece, ATI mela vzdy podle svyho planu dvojnasobny pocet pipeline na generaci -  8500 - 4  9700 - 8  X800 - 16  X900 - 32 pokud nepocitas ty neoficialni informace (ktery nebyly ani prvni) ze mel mit architekturu 16PPx2TJ

+1
+1
-1
Je komentář přínosný?

adfbadfb: Ne, to nepočítám, nebylo to pravdivé. Btw. ty si myslíš, že za rok přijde grafika s 64 pipelines a za dva roky se 128pipelines? :-D Taky bych tě ještě mohl upozornit, že R200 měla 2TMU/pipe, kdežto R300 jen jednu, takže nešlo v podstatě o žádný velký skok. nVidia vydala 5 generací grafických čipů se 4 pipelines a nikomu to divný nepřišlo :-). R520 byl plánovaný jako čip se šestnácti pipelines a zvýšen měl být počet ALUs. Rezervy až na 32pips byly už původně, ale nepočítalo se s jejich využitím (proto tvrdím, že R520 byl původně plánován jako 16-pip jádro). Zvyšování počtu pipelines je nesmysl, dokud není k dispozici odpovídající paměťová sběrnice (už 7800 je historicky nejlimitovanější karta nVidie z hlediska paměťový sběrnice; poměr bandwidth/pixel pipeline je velice špatnej). Zvyšování počtu pipelines je poslední zoufalej krok k dohnání konkurence. Řekni mi, k čemu je zapotřebí zvyšovat fillrate? Podívej se, jaké požadavky na fillrate mají nové hry a zjistíš, že by po této stránce měly stačit akcelerátory asi 20x pomalejší, než současná generace. Limit je jinde :-). Co potřebujeme je: propracovaný deferred rendering, výkonnější shadery, vyřešení situace s paměťovou sběrnicí, a pak bude stačit i nějakých 8 pipeline a ještě s rezervou :-)

+1
+1
-1
Je komentář přínosný?

ne tak uplne, generace jsou vydavany po 24 mesicich + mezigeneracni skoky po 6 mesicich (9700-9800 X800-X850), a to ze R600 bude mit 64 pipeline najdes napriklad v bleskovkach na zive ;) a to ze za 4 roky budou mit karty 128 pipeline mi nepripada az tak zcestny, ostatne drive se lidi snazili u supepocitacu dosahnout vykonu ktery ma dnes kazdy druhy na stole ;)
Jo, to R200 sice mela, jenze dnes karty zvladnou vice textur v jednom taktu, tak neni potreba a zato maji zase vice vertex shaderu.
nvidia vydavala taky karty bez HW pixelshaderu a potom s SM3, podle toho se to neda brat kdyz dela nesmysly, a navic pipeline v FX nejsou unifikovany, takze se neda rict kolik jich mela, vlastne jich mela 12
(prestoze se vetsinu chovaly jako 4x2)
na fillrate zalezi mnohem vice nez na propustnosti, to by totiz musel byt kazdy pixel vykreslen v jednom taktu aby byl vykon limitovan propustnosti ale to uz by byl vykon stejne tak vysoky ze bysme si nemuseli delat starosi, protoze pri 32bitove hloubce 2048x1536pixel je to pres 3000 FPS !!! (256bit 1200MHz pameti) = pameti jsou schopny dodat data rychlosti odpovidajici fillrate 9,6Gpixelu, takze tam problem neni, ty nebrzdi, brzdi pixelshadery ktere jsou obsazeny v pipeline, protoze jsou jejich vypocty casto vykonavany ve vice taktech, a pokud bys mel napriklad ve hre vodni hladinu ktera zabira pul obrazovky a jejiz presnost vyzaduje rozlozeni vypoctu do 4 taktu tak uz je fillrate pipeline snizen na pouhych 5,16Gpixelu/s a pamet je tedy naopak predimenzovana (a to nepocitam kompresni algoritmy ktere zvysuji propustnost) takze zalezi prave na fillrate=vykonu pixelshaderu=pipeline a ne na propustnosti, ta je brzdou jen v pripade ze se scena pocita rychleji v GPU nez je prenasena pameti = jednoducha grafika DX7, zatimco pri DX8 ci DX9 uz se scena pocita mnohem delsi dobu v GPU nez je prenasena pameti, pamet tedy ceka az GPU dopocita slozite shadery, a nemelo by tedy zadny vliv zvysovat proustnost pameti.

+1
+1
-1
Je komentář přínosný?

PS: uvedene vypocty jsou pro GF7800 430x1200MHz

+1
0
-1
Je komentář přínosný?

adfbadfb: píšeš nesmysl za nesmyslem

1) právě naopak, dnešní karty zvládají míň textur za *takt*; pleteš si takty, průchody a cykly

2) R600 v žádným případě nebude mít 64 pipelines, jestli nevidíš rozdíl mezi unifikovanými shadery a pipeline architekturou, tak vážně nemá cenu tohle dál rozebírat

3) HW pixel shader? to je nějaký neologizkus? která karta od nVidie má SW pixel shader? :-)))

4) všechny karty ze série FX mají 4 pixel pipeline. Nějakých 12 nebo co to uvádíš, je absolutní nesmysl

5) promiň, ale tvoje teoretické výpočty jsou další snůška nesmyslů. nevím, jestli má cenu ti to vůbec vysvětlovat, ale podívej se třeba na výsledky MSAA na GF6800U a 7800GTX a zjistíš, že novější GTX má procentuálně vyšší propady. proč asi?

6) FILLRATE NENÍ VÝKON PIXEL SHADERŮ!!!!!! výkon pixel shaderů závisí prvořadě na kvalitě a kvantitě ALUs

7) lol

+1
+1
-1
Je komentář přínosný?

1) ne, R200 zvlada 3 textury za takt na texturovaci jednotku (ma 2) takze 6 zatimco dnesni VGA zvladaji 16 a vysledky testu fillrate v singletexturingu a multitexturingu to potvrzuji, krom toho ze se tezko bude vyvijet neco co s novou generaci slabne na vykonu ;)
cyklus (=1cyklus) = takt (1 takt ne frekvence) = pruchod (= vykonani za 1 takt, ne rozlozeni do vice) = jeden impuls, to ze si napsal 3 identicke veci jako ze se jedna pokazde o jinou, jasne ukazuje ze nerozumis zakladum elektrotechniky/elektroniky.

2) to si pletes s architekturou v herni konzoli nove generace (udajne cip R600), ale timto zpusobem skutecny cip R600 vyvijen nebude, clanek o tom byl na doupe, jedna se o dva ruzne cipy.

3) Geforce 4 MX a je ALARMUJICI ze ti takova vec unikla kdyz okolo toho byl skandal na cely rok a miliony uzivatelu nemohly spustit nove hry diky klamave reklame.

4) ne, protoze prave uz serie FX nema unifikovane shaderpipeline, ma 12 vypocetnich jednotek ktere mohou pracovat v rezimu 12x0 (ne neni to blbost, jen opet nevis o co bezi a neznas proces zpracovavani pixelu) dale 8x1 ale u vetsiny dnesnich her se chova jako architektura 4x2, ale fyzicky je v jejim jadre 12pipeline, zalezi na rezimu vykreslovani sceny jake funkce vyuziva a podle toho se pipeline venuji zpracovavani pixelu nebo texelu v ruznem pomeru. vice o architekture FX kratce po jejim uvedeni najdes na theinquirer.net

5) promin ty, ale moje teoreticke vypocty se shoduji s praxi, jde o to ze nesmysly meles ty protoze pri antialiasingu se zvysuje pocet samplu a tudiz se nasobi i interne zpracovavany fillrate ktery samozrejme pozaduje vyssi propustnost, podivej se na testy BEZ AA a bude naprosto presne sedet to co jsem napsal/vypocital, v pripade AA je to prave naopak a nezalezi na fillrate, ale na propustnosti, mas v tom tedy bud pekny gulas a nebo si mohl alespon uvest ze mluvis o AA.

6) fillrate je udaj vyjadrujici kolik je GPU schopno vykreslit pixelu za 1 sekundu, je to prave vykon pixelshaderu ktere tento parametr udava, bohuzel patris ke generaci ktera si mysli ze pixelshadery jsou pouzivany na vykreslovani vodnich hladin a skelnych a kovovych povrchu a odlesku, to je bohuzel omyl, to jsou totiz komplexni pixelshadery, ale i obycejne pixely napriklad v grafice DX7 jsou vykreslovany pixelshader-jednotkami.
zalezi na poctu ALU (celociselne vypocetni jednotky) a prave proto na poctu pipeline protoze v nich jsou ALU obsazene, dvojnasobny pocet pipeline je tedy i dvojnasobny pocet ALU, a tim i tebou zminovany dvojnasobny vykon pixelshaderu a tedy i fillrate.

pokud zdvojnasobis pocet ALU na pipeline, pak muze byt pocet pixelpipeline zachovan a presto stoupne vykon, ale pouze u vypoctu ktere by jinak byly vykonany ve vice taktech (to co by bylo vykonano ve 4 taktech bude nyni hotovo ve 2, co bylo hotovo ve 2, bude nyni v jednom) ale operace ktere byly hotovy v 1 taktu budou opet pouze v 1, nedojde k zadnemu zrychleni protoze pocet pixelpipeline bude stale puvodni - nizky, ale to je prave pro dnesni dobu zadouci, jednoduche PS mame dnes vykonane dostatecne rychle, jsou to prave slozite PS ktere brzdi vykon rozlozenim do vice taktu (proto DX7 hry behaji 300FPS a DX9 30FPS) ale to lze prave docilit bud poctem pipeline nebo zvysenim vykonanych operaci za takt=vyssim poctem ALU na pipeline.

7)lol? -tvoje neznalost mi k smichu neprijde, diky ni jsi napadnutelny nesmyslnymi tvrzenimi marketingovych oddeleni firem jako nVidia ci Intel a tak prijdes o hodne penez za mene kvalitni HW

+1
+1
-1
Je komentář přínosný?

1) "3 textury za takt na texturovací jednotku"

ne, to není za takt, ale za průchod (pass), tzn. 3 takty. Každá pipeline R200 nese dvě texturovací jednotky, takže může v jednom taktu aplikovat dvouvrstvý multitexturing. R200 umožňuje trojnásobný loopback, tzn. že za tři takty (single-pass) realizuje až 6-ti vrstvý multitexturing. Jestli mi nevěříš, přečti si nějaký srovnání R200 a RV250 (R9000), kde zjistíš, že díky tomu, že má RV250 jen jednu texturovací jednotku na pipeline, neumožňuje v jednom taktu realizovat multitexturing. Proto byl umožněn šestinásobný loopback (tzn. 6-ti vrstvý multitexturing v 6-ti taktech/jeden průchod). techreport: "The R200 could deliver more textures per clock, but the RV250's ability to loop back six times may help it perform better when processing complex pixel shader effects in future games."

http://techreport.com/reviews/2002q3/radeon-9000pro/index.x?pg=1

"krom toho ze se tezko bude vyvijet neco co s novou generaci slabne na vykonu ;)"

proto se zvyšují frekvence a počet pipelines. Podívej se na hrubý fillrate a zjistíš, že R8500 má vyšší fillrate, než R9600PRO. Použití více texturovacích jednotek na kartách, které podporují pixel shadery, je vcelku zbytečné, protože naprostá většina reálných shaderů (ve hrách) využívá mnohonásobný loopback, takže se výhoda více TMU/ pipeline stírá.

2) To si nepletu. Unified Shader Architecture je požadavek Microsoftu pro shadery příští generace. Prvně byl realizovaný na ATi R500 (Xenos) pro Xbox360, R520 pro PC bude mít ještě klasickou pipeline-based architekturu, ale R600 už bude používat unified shader architecture, protože to bude součástí specifikací MS WGF2.0+. Doporučoval bych ti review Xenosu na B3D, nebo se alespoň podívat na nějaký článek o XboX360:

teamxbox.com: "But a graphics chip from ATI that incorporates all the technologies seen in the Xbox 360 graphics subsystem may not arrive until 2006, early 2007. That graphic processor, a so called R600, will be the generation after the R520 and is supposed to be the first GPU to take full advantage of Longhorn s WGF 2.0 features and finally incorporate the other fundamental aspect of the Xbox 360 GPU"

http://features.teamxbox.com/xbox/1145/The-Xbox-360-Dissected/p5/

3) Alarmující je, že tu šíříš takovýhle blbiny. GF4MX NEMÁ pixel shader. Softwarový PS na GMX je naprostý nesmysl. Kdyby byl PS emulátor součástí ovladačů, šly by ty hry spustit, ale nedaly by se hrát. Emulace pixelshaderů v takovém rozsahu, jaký vyžadují moderní hry, a v reálném čase, je na běžných PC naprosto nemožná. Běžné CPU nemá zdaleka takový výkon, aby mohlo při stejné přesnosti výpočtů nahradit HW implementaci v GPU. Takže není pravda, že GF4MX má SW pixel shader. Ona nemá PS VŮBEC.

4) "12x0 (ne neni to blbost, jen opet nevis o co bezi a neznas proces zpracovavani pixelu)"

Víš vůbec, co to znamená "x0"??? To nemá s pixely nic společnýho!!! To se týká Z/Stencil operací, které probíhají v raster outputs. Jestli získáváš svoje znalosti z inquireru, tak se už nedivím vůbec ničemu. Třeba by tě tam vzali na zástup za Fuada :-))) Všechny karty ze série GeForce FX mají 4 pixel pipelines. Vyšší modely (NV30,35,38 ~ FX5800, 59x0) mají dvě texturovací jednotky na pipeline a jejich ROPs zvládají celkem 8 Z/Stencil operací za takt (8x0). 4 pixel pipelines ~ 4 pixely/takt - singletexturing. Dvě TMU na každou pip. ~ 4 pixely s 2-vrstvým multitexturingem (4x2). Nižší modely (NV31,34,36 - FX5200, 5300, 5500, 5600, 5700) mají taktéž 4 pixel pipeline, ale jen s jednou texturovací jednotkou na každé (4x1). V praxi se ale používá spíš režim 2x2 (flexibilní architektura), který narozdíl od 4x1 umožňuje mnohonásobný loopback. Pro Z platí v obou případech 4x0 (jak už jsem jednou zmiňoval, není to součástí fragment pipeline). Na inquirer zapomeň; jestli chceš slušný zdroj informací, čti třeba 3Dcenter nebo Beyond3D a ne nesmysly Inquireru.

5) "se zvysuje pocet samplu a tudiz se nasobi i interne zpracovavany fillrate"

Pokud uvažujeme MultiSampling, je to další nesmysl. Naprostá většina pixelů má totiž přiřazenu jedinou barevnou hodnotu a odlišné je pouze Z. Jaký by pak byl rozdíl mezi SSAA a MSAA? :-))

6) "fillrate je udaj vyjadrujici kolik je GPU schopno vykreslit pixelu za 1 sekundu"

Určitě? :-) Rozlišuj color fillrate a pixel fillrate. Nebo si na svém tvrzení opravdu trváš? GeForce 6600 vykreslí 4 pixely za takt (300MHz pak odpovídá 1200MP/s) Radeon 9600 vykreslí 4 pixely za takt (325MHz odpovídá 1300MP/s). Proč je tedy GF6600 rychlejší, když má (podle tvojí definice) nižší fillrate? ;-)

"bohuzel patris ke generaci ktera si mysli ze pixelshadery jsou pouzivany na vykreslovani vodnich hladin a skelnych a kovovych povrchu a odlesku"

Já bohudík patřím ke generaci, která si termíny vykládá podle toho, jak je nadefinoval jejich autor. A jestliže Microsoft termín pixel shader nadefinoval tak, že mu technologicky odpovídají DX8+ akcelerátory, tak jakákoli karta, která nesplňuje požadavky DX8, NEMÁ pixel shader. Jestli máš na mysli nVidia shading rasterizer/nVidia "per-pixel shader" GeForce GTS, tak to je termín nVidie, nikoli Microsoftu; NSR na oficiálních specifikacích SM1.x vůbec nic nemění (natož aby je splňoval).

kolik nových her používá shadery, které lze provést s jednou ALU v jednom taktu, aby se ekonomicky vyplatilo zvyšovat počet pipelines spíš než počet ALUs na pipeline? :-) Nebo jinak. podívej se na architekturu Xenosu. Xenos se skládá v podstatě z 48 shader jednotek, ale jeho fillrate (max. 16 pixelů za takt, 500MHz = 8GT/s) je stejný, jako fillrate RX800XT. Pokud udáváš, že výkon pixel shaderů určuje fillrate, nemohly by být shadery Xenosu ani o setinu rychlejší, než shadery X800XT. To mi vysvětli, proč by asi MS nechával takovýhle čip vyvíjet, když by mu R420/X800XT nabídl totéž a okamžitě? :-)))

7) rofl

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.