aky je v kratkosti vztah medzi jednou z 64 vypoctovych jendotiek R600 a jednou zo 128 vypoctovych jednotiek G80?
+1
0
-1
Je komentář přínosný?
danno (neověřeno) https://diit.cz
2. 2. 2007 - 13:02https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuseaky je v kratkosti vztah medzi jednou z 64 vypoctovych jendotiek R600 a jednou zo 128 vypoctovych jednotiek G80? https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316048
+
re danno: za předpokladu, že u R600 budou podobné jednotky, jako u R580, tak asi takto:
1 jednotka G80 zvládne 1 skalární hodnota/takt
1 jednotka R600 zvládne 1 až 4-složkový vektor/takt (tzn ze 4 skalárů)
ale G80 běží na vyšší frekvenci(1350 vs 800) a je využit vždy na 100%, zatímco u R600 může efektivita klesnout až na 25%(za předpokladu, že se budou počítat nezávislé 1-složkové skaláry) - v praxi pochopitelně mnohem vyšší.
samozřejmě jedná se jen o odhady na základu předpokládaných vlastností R600...
+1
0
-1
Je komentář přínosný?
ptipi (neověřeno) https://diit.cz
2. 2. 2007 - 13:20https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskusere danno: za předpokladu, že u R600 budou podobné jednotky, jako u R580, tak asi takto:
1 jednotka G80 zvládne 1 skalární hodnota/takt
1 jednotka R600 zvládne 1 až 4-složkový vektor/takt (tzn ze 4 skalárů)
ale G80 běží na vyšší frekvenci(1350 vs 800) a je využit vždy na 100%, zatímco u R600 může efektivita klesnout až na 25%(za předpokladu, že se budou počítat nezávislé 1-složkové skaláry) - v praxi pochopitelně mnohem vyšší.
samozřejmě jedná se jen o odhady na základu předpokládaných vlastností R600...https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316052
+
i když lastně R580 umí počítat 2+2, takže by efektivita neměla klasnout pod 50%
+1
0
-1
Je komentář přínosný?
ptipi (neověřeno) https://diit.cz
2. 2. 2007 - 13:22https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskusei když lastně R580 umí počítat 2+2, takže by efektivita neměla klasnout pod 50%https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316053
+
ptipi: Všechny čipy R300-R580 jsou vec3+scalar. Vec2+vec2 umí NV4x-G7x. Co se týká R600, nemyslím si, že by ATi zůstala u vec3+scalar, zvlášť když Xenos žu měl konfiguraci vec4+scalar. Pokud by na tom R600 byla podobně, znamenalo by to, že v nejhorším možném případě by se čip choval jako čip se 128 skalárními jednotkami. Ovšem vzhledem k množství operací, které používají tři složky, si nemyslím, že by k takové situaci v reálu mohlo dojít.
Každopádně si myslím, že nám stále uniká nějaká podstatná informace o architektuře shader core R600, protože pokud jsou použity stejné výpočetní jednotky jako v Xenosu (které jsou výpočetně slabší než jednotky R5xx), pak se výkon R600 musí brát odjinud...
+1
0
-1
Je komentář přínosný?
no-X (neověřeno) https://diit.cz
2. 2. 2007 - 19:26https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuseptipi: Všechny čipy R300-R580 jsou vec3+scalar. Vec2+vec2 umí NV4x-G7x. Co se týká R600, nemyslím si, že by ATi zůstala u vec3+scalar, zvlášť když Xenos žu měl konfiguraci vec4+scalar. Pokud by na tom R600 byla podobně, znamenalo by to, že v nejhorším možném případě by se čip choval jako čip se 128 skalárními jednotkami. Ovšem vzhledem k množství operací, které používají tři složky, si nemyslím, že by k takové situaci v reálu mohlo dojít.
Každopádně si myslím, že nám stále uniká nějaká podstatná informace o architektuře shader core R600, protože pokud jsou použity stejné výpočetní jednotky jako v Xenosu (které jsou výpočetně slabší než jednotky R5xx), pak se výkon R600 musí brát odjinud...https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316164
+
Mnoho z Vás předpokládá podobnost s předchzím typem od ATI, ale tato karta právě je z gruntu nová a používá unifikované shadery, takže kromě brutální síly má našlápnuto ke skvělému výkonu i v reálu.
BTW. Jinak grafiky jsou poslední dobou fakt schopné, ale co mi přijde jako veliký nešvar, je jejich současná spotřeba a s tím také související potřeba aktivního chlazení, vzniká další zdroj hluku. Podle mě by VŠICHNI výrobci (nejen ATI) a to i externích karet, se spotřebou elektřiny přibrzdit. A pokud někdo potřebuje opravdu extra vysoký výkon, tak ať pro tyto uživatele více podporují škálování výkonu (více karet s nižší spotřebou) a třeba prodávají karty po více kusech levněji atp.
+1
0
-1
Je komentář přínosný?
Jiří Hlávka https://diit.cz/profil/georgeek
3. 2. 2007 - 02:33https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuseMnoho z Vás předpokládá podobnost s předchzím typem od ATI, ale tato karta právě je z gruntu nová a používá unifikované shadery, takže kromě brutální síly má našlápnuto ke skvělému výkonu i v reálu.
BTW. Jinak grafiky jsou poslední dobou fakt schopné, ale co mi přijde jako veliký nešvar, je jejich současná spotřeba a s tím také související potřeba aktivního chlazení, vzniká další zdroj hluku. Podle mě by VŠICHNI výrobci (nejen ATI) a to i externích karet, se spotřebou elektřiny přibrzdit. A pokud někdo potřebuje opravdu extra vysoký výkon, tak ať pro tyto uživatele více podporují škálování výkonu (více karet s nižší spotřebou) a třeba prodávají karty po více kusech levněji atp.https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316268
+
Georgeek: žádná karta téhož výrobce není NIKDY z gruntu nová. Dokud má výrobce vlastní know-how, patenty, technologie a hlavně tytéž lidi, tak se stále mnoho technologií / prvků v návrhu přebírá. Např. i taková NV40 má s NV30 mnohem více společného, než si jsou mnozí ochotni připustit. Je to jen tím, jak marketing kartu prezentuje.
Konkrétně na architektuře R600 (nevydané čipy R400->R500 (+Xenos)->R600) se pracovalo zhruba pět let a mnoho prvků, kterým se dospělo během tohoto vývoje, byly implementovány i do již vydaných čipů, takže nemalá část z technologií R600 nám už bude důvěrně známá. Co se týká shader core, neznamená, že když je unifikované, tak že je zcela jiné. Několik prvků v architektuře čipu zásadních pro unifikaci již bylo implementováno v generaci R520. V současné době bych čekal, že výpočetní jednotky R600 budou z části podobné jako u Xenosu, ale zřejmě efektivnější - možná bude vektorová ALU "dělitelná" v různých poměrech (pokud tedy s vektorovou ALU v současně uznávaném slova smyslu můžeme počítat)
Co se spotřeby týká - pokud by zákazníkům tolik vadila, nekupovali by high-end. Nízká spotřeba není standard; nízká spotřeba je jen dočasná záležitost, kdy jeden z výrobců může nabídnout pokročilejší řešení, které má náskok před konkurencí a může si dovolit silně konzervativní frekvence. Pokud by ale hodlal setrvat u pomalého taktování, zatímco by konkurent použil agresivnější frekvence a s tím spojený vyšší výkon, poklesly by mu prodeje.
Multičipová řešení jsou taktéž nevýhodná a budou nevýhodná do té doby, dokud nebudou schopna používat jeden efektivní sjednocený paměťový řadič (což je docela problém; pokud je třeba ze současných čipů balením a PCBčkem protahnout 384/512bit sběrnici, je téměř nemyslitelné, že bychom tudy mohlo protahnout ještě 1024bit sběrnici k propojení čipů). Dvojnásobení kapacity paměti související se současným SLI/CF, která se ale stále jeví, jako by byla stejně velká (tytéž textury musí být k dispozici v paměti pro každý čip) rozhodně není úsporné řešení. Stejně tak výkon, který v mnohých aplikacích, které nejsou zrovna SLI/CF-friendly, nevzrůstá víc, než o pár procent, zatímco spotřeba je téměř dvojnásobná... Další problém je s rozdělením výpočtů - dokud nebudou výpočty mezi čipy děleny stejným způsobem, jako jsou děleny mezi jednotlivé výpočetní jednotky na úrovni čipu, pak se zmíněného problému s nelineárním nárůstem výkonu a související neefektivitou těchto řešení nezbavíme.
+1
0
-1
Je komentář přínosný?
no-X (neověřeno) https://diit.cz
3. 2. 2007 - 09:16https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuseGeorgeek: žádná karta téhož výrobce není NIKDY z gruntu nová. Dokud má výrobce vlastní know-how, patenty, technologie a hlavně tytéž lidi, tak se stále mnoho technologií / prvků v návrhu přebírá. Např. i taková NV40 má s NV30 mnohem více společného, než si jsou mnozí ochotni připustit. Je to jen tím, jak marketing kartu prezentuje.
Konkrétně na architektuře R600 (nevydané čipy R400->R500 (+Xenos)->R600) se pracovalo zhruba pět let a mnoho prvků, kterým se dospělo během tohoto vývoje, byly implementovány i do již vydaných čipů, takže nemalá část z technologií R600 nám už bude důvěrně známá. Co se týká shader core, neznamená, že když je unifikované, tak že je zcela jiné. Několik prvků v architektuře čipu zásadních pro unifikaci již bylo implementováno v generaci R520. V současné době bych čekal, že výpočetní jednotky R600 budou z části podobné jako u Xenosu, ale zřejmě efektivnější - možná bude vektorová ALU "dělitelná" v různých poměrech (pokud tedy s vektorovou ALU v současně uznávaném slova smyslu můžeme počítat)
Co se spotřeby týká - pokud by zákazníkům tolik vadila, nekupovali by high-end. Nízká spotřeba není standard; nízká spotřeba je jen dočasná záležitost, kdy jeden z výrobců může nabídnout pokročilejší řešení, které má náskok před konkurencí a může si dovolit silně konzervativní frekvence. Pokud by ale hodlal setrvat u pomalého taktování, zatímco by konkurent použil agresivnější frekvence a s tím spojený vyšší výkon, poklesly by mu prodeje.
Multičipová řešení jsou taktéž nevýhodná a budou nevýhodná do té doby, dokud nebudou schopna používat jeden efektivní sjednocený paměťový řadič (což je docela problém; pokud je třeba ze současných čipů balením a PCBčkem protahnout 384/512bit sběrnici, je téměř nemyslitelné, že bychom tudy mohlo protahnout ještě 1024bit sběrnici k propojení čipů). Dvojnásobení kapacity paměti související se současným SLI/CF, která se ale stále jeví, jako by byla stejně velká (tytéž textury musí být k dispozici v paměti pro každý čip) rozhodně není úsporné řešení. Stejně tak výkon, který v mnohých aplikacích, které nejsou zrovna SLI/CF-friendly, nevzrůstá víc, než o pár procent, zatímco spotřeba je téměř dvojnásobná... Další problém je s rozdělením výpočtů - dokud nebudou výpočty mezi čipy děleny stejným způsobem, jako jsou děleny mezi jednotlivé výpočetní jednotky na úrovni čipu, pak se zmíněného problému s nelineárním nárůstem výkonu a související neefektivitou těchto řešení nezbavíme.https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316273
+
re no-X: nj, správně. takhle brzo po ránu člověk ještě pořádně nevnímá, to ještě cítí chuť zubní pasty;). Každopádně ať je to 2:2, nebo 3:1, tak to v tomto kontextu nic nemění. worst case scenario je stále těch 50%.
každopádně když se podíváš, která čísla se nejvíce zvedla, tak jsou to ta spojena s filtrací, takže výkon shader jednotek může vzrůst třeba "jen" 2x.
+1
0
-1
Je komentář přínosný?
ptipi (neověřeno) https://diit.cz
4. 2. 2007 - 16:27https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskusere no-X: nj, správně. takhle brzo po ránu člověk ještě pořádně nevnímá, to ještě cítí chuť zubní pasty;). Každopádně ať je to 2:2, nebo 3:1, tak to v tomto kontextu nic nemění. worst case scenario je stále těch 50%.
každopádně když se podíváš, která čísla se nejvíce zvedla, tak jsou to ta spojena s filtrací, takže výkon shader jednotek může vzrůst třeba "jen" 2x.https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316401
+
ptipi: jenže kouzlo je v tom, že R5xx FP texture filtering hardwarově vůbec nepodporuje (resp. podporuje , ale ne na úrovni texturovacích jednotek). Takže by mě zajímalo, od čeho se doráží to "2x vyšší..." :-) Pokud to nejsou teoretické hodnoty, ale rozdíly v FPS podle nějakého benchmarku, který je na testování jednotlivých operací zaměřen, tak to může být i tak zavádějící, protože FP texture filtering se v aplikacích, které ho vyžadují, na R5xx provádí přes shader. Předpokládám ale, že R600 bude mít texturovací jednotky a ROPs schopné provádět FP texture filtering a blending bez účasti pixel shaderů. Pokud ano, tak v tom případě srovnáváme výkon pixel sahderů R580 s výkonem texturovacích jendotek R600. Dost haluz, ne? :-)
Co se týká shader core, ještě mě napadá jedna možnost - vec4+scalar s tím, že vec4 část by byla ještě dělitelná (vec3+scalar, případně i vec2+vec2 jako v NV40). To by pak znamenalo, že při 64 jednotkách by R600 byla schopna provést najednou 192 skalárních operací, tj. při 800MHz cca 155 milionů operací za vteřinu. Pro G80 (1350MHz) je to 173 milionů operací za vteřinu. To už je velice srovnatelné a při hypotetickém vysokém výkonu R600 ve vektorových operacích, který G80 postrádá, by to hrálo silně ve prospěch R600. Ale to už se pouštím do příliš divokých spekulací :-)
+1
0
-1
Je komentář přínosný?
no-X (neověřeno) https://diit.cz
4. 2. 2007 - 19:20https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuseptipi: jenže kouzlo je v tom, že R5xx FP texture filtering hardwarově vůbec nepodporuje (resp. podporuje , ale ne na úrovni texturovacích jednotek). Takže by mě zajímalo, od čeho se doráží to "2x vyšší..." :-) Pokud to nejsou teoretické hodnoty, ale rozdíly v FPS podle nějakého benchmarku, který je na testování jednotlivých operací zaměřen, tak to může být i tak zavádějící, protože FP texture filtering se v aplikacích, které ho vyžadují, na R5xx provádí přes shader. Předpokládám ale, že R600 bude mít texturovací jednotky a ROPs schopné provádět FP texture filtering a blending bez účasti pixel shaderů. Pokud ano, tak v tom případě srovnáváme výkon pixel sahderů R580 s výkonem texturovacích jendotek R600. Dost haluz, ne? :-)
Co se týká shader core, ještě mě napadá jedna možnost - vec4+scalar s tím, že vec4 část by byla ještě dělitelná (vec3+scalar, případně i vec2+vec2 jako v NV40). To by pak znamenalo, že při 64 jednotkách by R600 byla schopna provést najednou 192 skalárních operací, tj. při 800MHz cca 155 milionů operací za vteřinu. Pro G80 (1350MHz) je to 173 milionů operací za vteřinu. To už je velice srovnatelné a při hypotetickém vysokém výkonu R600 ve vektorových operacích, který G80 postrádá, by to hrálo silně ve prospěch R600. Ale to už se pouštím do příliš divokých spekulací :-)https://diit.cz/clanek/dalsi-detaily-o-r600-generaci/diskuse#comment-316412
+
aky je v kratkosti vztah medzi jednou z 64 vypoctovych jendotiek R600 a jednou zo 128 vypoctovych jednotiek G80?
re danno: za předpokladu, že u R600 budou podobné jednotky, jako u R580, tak asi takto:
1 jednotka G80 zvládne 1 skalární hodnota/takt
1 jednotka R600 zvládne 1 až 4-složkový vektor/takt (tzn ze 4 skalárů)
ale G80 běží na vyšší frekvenci(1350 vs 800) a je využit vždy na 100%, zatímco u R600 může efektivita klesnout až na 25%(za předpokladu, že se budou počítat nezávislé 1-složkové skaláry) - v praxi pochopitelně mnohem vyšší.
samozřejmě jedná se jen o odhady na základu předpokládaných vlastností R600...
i když lastně R580 umí počítat 2+2, takže by efektivita neměla klasnout pod 50%
vdaka
ptipi: Všechny čipy R300-R580 jsou vec3+scalar. Vec2+vec2 umí NV4x-G7x. Co se týká R600, nemyslím si, že by ATi zůstala u vec3+scalar, zvlášť když Xenos žu měl konfiguraci vec4+scalar. Pokud by na tom R600 byla podobně, znamenalo by to, že v nejhorším možném případě by se čip choval jako čip se 128 skalárními jednotkami. Ovšem vzhledem k množství operací, které používají tři složky, si nemyslím, že by k takové situaci v reálu mohlo dojít.
Každopádně si myslím, že nám stále uniká nějaká podstatná informace o architektuře shader core R600, protože pokud jsou použity stejné výpočetní jednotky jako v Xenosu (které jsou výpočetně slabší než jednotky R5xx), pak se výkon R600 musí brát odjinud...
Mnoho z Vás předpokládá podobnost s předchzím typem od ATI, ale tato karta právě je z gruntu nová a používá unifikované shadery, takže kromě brutální síly má našlápnuto ke skvělému výkonu i v reálu.
BTW. Jinak grafiky jsou poslední dobou fakt schopné, ale co mi přijde jako veliký nešvar, je jejich současná spotřeba a s tím také související potřeba aktivního chlazení, vzniká další zdroj hluku. Podle mě by VŠICHNI výrobci (nejen ATI) a to i externích karet, se spotřebou elektřiny přibrzdit. A pokud někdo potřebuje opravdu extra vysoký výkon, tak ať pro tyto uživatele více podporují škálování výkonu (více karet s nižší spotřebou) a třeba prodávají karty po více kusech levněji atp.
Georgeek: žádná karta téhož výrobce není NIKDY z gruntu nová. Dokud má výrobce vlastní know-how, patenty, technologie a hlavně tytéž lidi, tak se stále mnoho technologií / prvků v návrhu přebírá. Např. i taková NV40 má s NV30 mnohem více společného, než si jsou mnozí ochotni připustit. Je to jen tím, jak marketing kartu prezentuje.
Konkrétně na architektuře R600 (nevydané čipy R400->R500 (+Xenos)->R600) se pracovalo zhruba pět let a mnoho prvků, kterým se dospělo během tohoto vývoje, byly implementovány i do již vydaných čipů, takže nemalá část z technologií R600 nám už bude důvěrně známá. Co se týká shader core, neznamená, že když je unifikované, tak že je zcela jiné. Několik prvků v architektuře čipu zásadních pro unifikaci již bylo implementováno v generaci R520. V současné době bych čekal, že výpočetní jednotky R600 budou z části podobné jako u Xenosu, ale zřejmě efektivnější - možná bude vektorová ALU "dělitelná" v různých poměrech (pokud tedy s vektorovou ALU v současně uznávaném slova smyslu můžeme počítat)
Co se spotřeby týká - pokud by zákazníkům tolik vadila, nekupovali by high-end. Nízká spotřeba není standard; nízká spotřeba je jen dočasná záležitost, kdy jeden z výrobců může nabídnout pokročilejší řešení, které má náskok před konkurencí a může si dovolit silně konzervativní frekvence. Pokud by ale hodlal setrvat u pomalého taktování, zatímco by konkurent použil agresivnější frekvence a s tím spojený vyšší výkon, poklesly by mu prodeje.
Multičipová řešení jsou taktéž nevýhodná a budou nevýhodná do té doby, dokud nebudou schopna používat jeden efektivní sjednocený paměťový řadič (což je docela problém; pokud je třeba ze současných čipů balením a PCBčkem protahnout 384/512bit sběrnici, je téměř nemyslitelné, že bychom tudy mohlo protahnout ještě 1024bit sběrnici k propojení čipů). Dvojnásobení kapacity paměti související se současným SLI/CF, která se ale stále jeví, jako by byla stejně velká (tytéž textury musí být k dispozici v paměti pro každý čip) rozhodně není úsporné řešení. Stejně tak výkon, který v mnohých aplikacích, které nejsou zrovna SLI/CF-friendly, nevzrůstá víc, než o pár procent, zatímco spotřeba je téměř dvojnásobná... Další problém je s rozdělením výpočtů - dokud nebudou výpočty mezi čipy děleny stejným způsobem, jako jsou děleny mezi jednotlivé výpočetní jednotky na úrovni čipu, pak se zmíněného problému s nelineárním nárůstem výkonu a související neefektivitou těchto řešení nezbavíme.
re no-X: nj, správně. takhle brzo po ránu člověk ještě pořádně nevnímá, to ještě cítí chuť zubní pasty;). Každopádně ať je to 2:2, nebo 3:1, tak to v tomto kontextu nic nemění. worst case scenario je stále těch 50%.
každopádně když se podíváš, která čísla se nejvíce zvedla, tak jsou to ta spojena s filtrací, takže výkon shader jednotek může vzrůst třeba "jen" 2x.
ptipi: jenže kouzlo je v tom, že R5xx FP texture filtering hardwarově vůbec nepodporuje (resp. podporuje , ale ne na úrovni texturovacích jednotek). Takže by mě zajímalo, od čeho se doráží to "2x vyšší..." :-) Pokud to nejsou teoretické hodnoty, ale rozdíly v FPS podle nějakého benchmarku, který je na testování jednotlivých operací zaměřen, tak to může být i tak zavádějící, protože FP texture filtering se v aplikacích, které ho vyžadují, na R5xx provádí přes shader. Předpokládám ale, že R600 bude mít texturovací jednotky a ROPs schopné provádět FP texture filtering a blending bez účasti pixel shaderů. Pokud ano, tak v tom případě srovnáváme výkon pixel sahderů R580 s výkonem texturovacích jendotek R600. Dost haluz, ne? :-)
Co se týká shader core, ještě mě napadá jedna možnost - vec4+scalar s tím, že vec4 část by byla ještě dělitelná (vec3+scalar, případně i vec2+vec2 jako v NV40). To by pak znamenalo, že při 64 jednotkách by R600 byla schopna provést najednou 192 skalárních operací, tj. při 800MHz cca 155 milionů operací za vteřinu. Pro G80 (1350MHz) je to 173 milionů operací za vteřinu. To už je velice srovnatelné a při hypotetickém vysokém výkonu R600 ve vektorových operacích, který G80 postrádá, by to hrálo silně ve prospěch R600. Ale to už se pouštím do příliš divokých spekulací :-)
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.