18. 9. 2015 - 11:18https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseARC je odložen. Prý kuli problémům s ovladačemi. http://steamcommunity.com/app/346110/discussions/0/520518053440119300/
edit: tak beru zpět. Nevím jestli už jim to jede nebo ne. Doma vyzkouším, už jsem to nějaký ten pátek nespustil.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818791
+
Tak nejde, tedy pokud se to nemusí spouštět nějak "speciálně" s nějakým příznakem pro podporu DX12.
+1
-2
-1
Je komentář přínosný?
Tak nejde, tedy pokud se to
Libor Míšek https://diit.cz/profil/cursedslayer
23. 9. 2015 - 13:12https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTak nejde, tedy pokud se to nemusí spouštět nějak "speciálně" s nějakým příznakem pro podporu DX12.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-819192
+
Doufám, že DX12 výpočtů bude využito k ještě reálnějšímu zobrazování chromatické aberace a jiným post-processingovým prasečinám, co jsou dnes moderní. :-D
+1
+15
-1
Je komentář přínosný?
Doufám, že DX12 výpočtů bude
Ache Ache https://diit.cz/profil/ache
18. 9. 2015 - 11:12https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseDoufám, že DX12 výpočtů bude využito k ještě reálnějšímu zobrazování chromatické aberace a jiným post-processingovým prasečinám, co jsou dnes moderní. :-Dhttps://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818792
+
Jo heh, asi tak. Chromatická aberace je zatim nejtypičtější příklad zpraseného postprocesingu, ala věc co nám cíleně kazí obraz, protože kdysi tímto trpěly kamery takže to musíme mít také pro onen "cinematic look". Sorry ale tohle já fakt nechi, heh, i sami výrobci kamer dost investovali až se toho nakonec zbavili, a mi si tady bude plejtvat výkonem pro něco co nám zhorší obraz? Hmm?
Já osobně vypínám i DOF + motion blur protože tak jak to v hrách bejvá implementovanýá mi přijde hnusný a total nerealistický, sorry ale moje oči takhle nefungujou... Já výhodu DX12 beru jako hlavně ten CPU overhead, zbytek je už méně podstatnej.
+1
+15
-1
Je komentář přínosný?
Jo heh, asi tak. Chromatická
Zenith https://diit.cz/profil/j-j1
18. 9. 2015 - 13:34https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseJo heh, asi tak. Chromatická aberace je zatim nejtypičtější příklad zpraseného postprocesingu, ala věc co nám cíleně kazí obraz, protože kdysi tímto trpěly kamery takže to musíme mít také pro onen "cinematic look". Sorry ale tohle já fakt nechi, heh, i sami výrobci kamer dost investovali až se toho nakonec zbavili, a mi si tady bude plejtvat výkonem pro něco co nám zhorší obraz? Hmm?
Já osobně vypínám i DOF + motion blur protože tak jak to v hrách bejvá implementovanýá mi přijde hnusný a total nerealistický, sorry ale moje oči takhle nefungujou... Já výhodu DX12 beru jako hlavně ten CPU overhead, zbytek je už méně podstatnej. https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818817
+
Chromaticka aberace neni vec kamer, ale optiky a zbavit se ji nejde. Jen potlacit na snesitelnou uroven.
Jinak souhlas, ze cpat to do postprocesiingu her je kravina.
+1
+2
-1
Je komentář přínosný?
Chromaticka aberace neni vec
BlackRider https://diit.cz/profil/blackrider
21. 9. 2015 - 09:27https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseChromaticka aberace neni vec kamer, ale optiky a zbavit se ji nejde. Jen potlacit na snesitelnou uroven.
Jinak souhlas, ze cpat to do postprocesiingu her je kravina.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818938
+
To DayZ si klidne skrtnete. Sleduji vyvoj z prvni ruky. Urcite pridaji jednu dve cepice, kabely k autobaterii a nejaky guny, coz rozbije zombiky a spawn lootu. Nejaky jak tomu rikaji "renderer" nebo dokonce reseni problemu ze ve mestech maji vsichni 12fps, zatimco na novem Exile na Chernu+ 80fps, to je vec podruzna.
+1
-4
-1
Je komentář přínosný?
To DayZ si klidne skrtnete.
Nest https://diit.cz/profil/nest
18. 9. 2015 - 12:02https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTo DayZ si klidne skrtnete. Sleduji vyvoj z prvni ruky. Urcite pridaji jednu dve cepice, kabely k autobaterii a nejaky guny, coz rozbije zombiky a spawn lootu. Nejaky jak tomu rikaji "renderer" nebo dokonce reseni problemu ze ve mestech maji vsichni 12fps, zatimco na novem Exile na Chernu+ 80fps, to je vec podruzna.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818800
+
Ja se jen bojim ze nakonec vetsina vydavatelu pred NVIDII stejne couvne a vyda jenom "umele" DirectX 11 hry, inu uvidime ale zas na stranu druhou Playstation 4 a Xbox One vyuziva AMD konceptu a tak by byla skoda ozelet vyhody api DirectX 12.
Nejake informace ohledem Half-Life 3 nejsou :-), uz me stvou :-D.
Doufam ze nam nesprasi podporu pro Windows 7, "jenom Windows 8.1 a 10 only" dnes je mozne proste vsechno.
+1
+5
-1
Je komentář přínosný?
Ja se jen bojim ze nakonec
Waffer47 https://diit.cz/profil/waffer47
18. 9. 2015 - 12:09https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseJa se jen bojim ze nakonec vetsina vydavatelu pred NVIDII stejne couvne a vyda jenom "umele" DirectX 11 hry, inu uvidime ale zas na stranu druhou Playstation 4 a Xbox One vyuziva AMD konceptu a tak by byla skoda ozelet vyhody api DirectX 12.
Nejake informace ohledem Half-Life 3 nejsou :-), uz me stvou :-D.
Doufam ze nam nesprasi podporu pro Windows 7, "jenom Windows 8.1 a 10 only" dnes je mozne proste vsechno.
https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818801
+
NVIDIA v Maxwelloch AS podporuje. Len nie v takej miere ako AMD. Je to ako s teseláciou len obrátene. Počkajme si radšej na reálne výsledky v daných hrách.
+1
-10
-1
Je komentář přínosný?
Prečítal by som si toto:
Marek Moravčík https://diit.cz/profil/mareknr
18. 9. 2015 - 13:08https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePrečítal by som si toto:
https://www.reddit.com/r/nvidia/comments/3j5e9b/analysis_async_compute_is_it_true_nvidia_cant_do/
NVIDIA v Maxwelloch AS podporuje. Len nie v takej miere ako AMD. Je to ako s teseláciou len obrátene. Počkajme si radšej na reálne výsledky v daných hrách.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818814
+
S teselací se to moc srovnávat nedá. Cílem teselace je zvýšit počet polygonů za určité snížení výkonu. Toto snížení výkonu bylo u AMD o něco výraznější než u Nvidie (důvody by byly na samostatný článek). U obou výrobců šlo ale o snížení výkonu. Proti tomu cílem asynchronních shaderů je zvýšení výkonu díky možnosti efektivnějšího využití architektury čipu. Jenže to není tak, že by zvýšení výkonu bylo u Nvidie méně výrazné než u AMD: prozatím je to tak, že u Nvidie dochází k propadu výkonu o desítky procent. Neděje se, co by se dít mělo - laicky řečeno to nefunguje.
O adekvátní srovnání s teselací by se dalo mluvit v tom případě, kdyby teselace na AMD hardwaru snižovala výkon a přitom nepřidávala žádné polygony :-)
Tohle spíš připomíná implementaci Shader Model 3.0 na GeForce 6000 a 7000. Formálně tato technologie podporovaná byla, ale když došlo na dynamic branching, šel výkon na jednotky FPS...
+1
+15
-1
Je komentář přínosný?
S teselací se to moc
no-X https://diit.cz/autor/no-x
18. 9. 2015 - 14:14https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseS teselací se to moc srovnávat nedá. Cílem teselace je zvýšit počet polygonů za určité snížení výkonu. Toto snížení výkonu bylo u AMD o něco výraznější než u Nvidie (důvody by byly na samostatný článek). U obou výrobců šlo ale o snížení výkonu. Proti tomu cílem asynchronních shaderů je zvýšení výkonu díky možnosti efektivnějšího využití architektury čipu. Jenže to není tak, že by zvýšení výkonu bylo u Nvidie méně výrazné než u AMD: prozatím je to tak, že u Nvidie dochází k propadu výkonu o desítky procent. Neděje se, co by se dít mělo - laicky řečeno to nefunguje.
O adekvátní srovnání s teselací by se dalo mluvit v tom případě, kdyby teselace na AMD hardwaru snižovala výkon a přitom nepřidávala žádné polygony :-)
Tohle spíš připomíná implementaci Shader Model 3.0 na GeForce 6000 a 7000. Formálně tato technologie podporovaná byla, ale když došlo na dynamic branching, šel výkon na jednotky FPS...https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818821
+
Porovnával som dopady na výkon. Nie cieľ oboch riešení. AMD aj NVIDIA majú v teselácii inak posunuté hranice a všetci vieme čo sa stane keď sa použije extrémna teselácia (tuším je aktuálne na stupni 64). Teda je to podobné ako keď sa kvôli benchmarku odošle do GPU neúmerné množstvo asynchrónnych úloh. Myslím, že v uvedenom odkaze je celkom pekne vysvetlené prečo došlo k prepadom výkonu u Maxwella. Použitý benchmark dosť presiahol možnosti Maxwella (nadmerným zahltením asynchróonych úloh - bolo použitých 128 a limit Maxwellu je 31) čím jeho výkon doslova zabil. AMD má hranicu posunutú na 64 asynchrónnych úloh. Vďaka tomu daný test zvládla lepšie. Rád by som videl situáciu kde by benchmark použil 31 asynchrónnych úloh, potom 64 a nakoniec trebárs 256 (to už by malo zabiť výkon aj u grafík od AMD). Ak je teda pravda to, čo sa píše na uvedenom webe.
Je to v podstate obdobné ako keď sa preťaží Geometry Shader. Ten pridáva do stávajúcej geometrie nové vertexy a tiež má svoju hornú hranicu, koľko ich pri jednom volaní môže vytvoriť. Ak sa táto hranica prekročí, ide výkon strmhlav dolu v závislosti od miery prekročenia.
+1
-4
-1
Je komentář přínosný?
Porovnával som dopady na
Marek Moravčík https://diit.cz/profil/mareknr
18. 9. 2015 - 14:29https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePorovnával som dopady na výkon. Nie cieľ oboch riešení. AMD aj NVIDIA majú v teselácii inak posunuté hranice a všetci vieme čo sa stane keď sa použije extrémna teselácia (tuším je aktuálne na stupni 64). Teda je to podobné ako keď sa kvôli benchmarku odošle do GPU neúmerné množstvo asynchrónnych úloh. Myslím, že v uvedenom odkaze je celkom pekne vysvetlené prečo došlo k prepadom výkonu u Maxwella. Použitý benchmark dosť presiahol možnosti Maxwella (nadmerným zahltením asynchróonych úloh - bolo použitých 128 a limit Maxwellu je 31) čím jeho výkon doslova zabil. AMD má hranicu posunutú na 64 asynchrónnych úloh. Vďaka tomu daný test zvládla lepšie. Rád by som videl situáciu kde by benchmark použil 31 asynchrónnych úloh, potom 64 a nakoniec trebárs 256 (to už by malo zabiť výkon aj u grafík od AMD). Ak je teda pravda to, čo sa píše na uvedenom webe.
Je to v podstate obdobné ako keď sa preťaží Geometry Shader. Ten pridáva do stávajúcej geometrie nové vertexy a tiež má svoju hornú hranicu, koľko ich pri jednom volaní môže vytvoriť. Ak sa táto hranica prekročí, ide výkon strmhlav dolu v závislosti od miery prekročenia.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818823
+
Ono cíl teselace je vytvéřet polygony na GPU, aby se nemusely vytvářet na CPU/enginem, CPU je počítat, štosovat přes sběrnici, proprvat je overheadem API, atd. V podstatě to co říkáš je pravda, pomocí AS se dá výkon na té či oné architektuře dokurvit easy, je to opravdu velice podobné kauze s teselací. Když třeba ve witcherovi dáš forced tes fakto 16x, tak to krásně zlepšuje geometrii aniž by rostl overhead a zátěž na CPU, dopad na výon minimální efekt pozitivní. Ale když to necháš by default je to na hairfowrks až 64x což je overkill kterej killne výkon na Radeonech mnohem více jak na Geforce.
To samé se zde může dít s AS, pokud by se opravdu použil AS kterej nemá více jak 30 úloh najednou, tzn i maxwell by jej dal single, pass opravdu by výsledek vypadal tak jak vypadá? Dobré by také bylo vědět co přesně ty AS dělaj, aby to nebylo schválně zahcení blbostma co killne výkon konkurence, stejně jako to udělala nv u těch vlasů či předtim třeba v Crysis2 DX11 patchi. Nezapomínejte že dnes AMD hraje stejně špinavou hru jak NV.
+1
+3
-1
Je komentář přínosný?
Ono cíl teselace je vytvéřet
Zenith https://diit.cz/profil/j-j1
18. 9. 2015 - 16:42https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseOno cíl teselace je vytvéřet polygony na GPU, aby se nemusely vytvářet na CPU/enginem, CPU je počítat, štosovat přes sběrnici, proprvat je overheadem API, atd. V podstatě to co říkáš je pravda, pomocí AS se dá výkon na té či oné architektuře dokurvit easy, je to opravdu velice podobné kauze s teselací. Když třeba ve witcherovi dáš forced tes fakto 16x, tak to krásně zlepšuje geometrii aniž by rostl overhead a zátěž na CPU, dopad na výon minimální efekt pozitivní. Ale když to necháš by default je to na hairfowrks až 64x což je overkill kterej killne výkon na Radeonech mnohem více jak na Geforce.
To samé se zde může dít s AS, pokud by se opravdu použil AS kterej nemá více jak 30 úloh najednou, tzn i maxwell by jej dal single, pass opravdu by výsledek vypadal tak jak vypadá? Dobré by také bylo vědět co přesně ty AS dělaj, aby to nebylo schválně zahcení blbostma co killne výkon konkurence, stejně jako to udělala nv u těch vlasů či předtim třeba v Crysis2 DX11 patchi. Nezapomínejte že dnes AMD hraje stejně špinavou hru jak NV.
https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818838
+
Ale jděte, Srovnávat tyto věci je zavádějící. Teselace má za úkol vylepšit obraz. Je ale nutné podotknout, že to růstem teselace zatížení teselačních jednotek roste, ale na obraze je každé navýšení pouhým okem méně patrné. To se přece již řešilo. AMD v ovladači udělalo omezení na tuším 32 násobnou propad výkonu není tak velký a rozdíl v obraze aby člověk lupou hledal. V AS je logika přesně obráceně, čím více AS využíváte jde výkon čipu nahoru. Protože rozložíte zátěž rovnoměrněji. Pokud omezíte AS omezíte výkon. Z logiky věci tedy vyplývá, navyšování AS není kontraproduktivní jako u teselace kde výkon jde dolů a rozdíl v obraze je těžko patrný.
+1
+1
-1
Je komentář přínosný?
Ale jděte, Srovnávat tyto
Rafan https://diit.cz/profil/rafan
19. 9. 2015 - 04:46https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseAle jděte, Srovnávat tyto věci je zavádějící. Teselace má za úkol vylepšit obraz. Je ale nutné podotknout, že to růstem teselace zatížení teselačních jednotek roste, ale na obraze je každé navýšení pouhým okem méně patrné. To se přece již řešilo. AMD v ovladači udělalo omezení na tuším 32 násobnou propad výkonu není tak velký a rozdíl v obraze aby člověk lupou hledal. V AS je logika přesně obráceně, čím více AS využíváte jde výkon čipu nahoru. Protože rozložíte zátěž rovnoměrněji. Pokud omezíte AS omezíte výkon. Z logiky věci tedy vyplývá, navyšování AS není kontraproduktivní jako u teselace kde výkon jde dolů a rozdíl v obraze je těžko patrný.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818862
+
Toto práve nie je logické. Akákoľvek architektúra GPU a aj CPU má svoje HW limity. To platí aj o počte spracovaných asynchrónnych úloh na GCN či Maxwelly. Čím viac túto hranicu presiahneš, tým menší výkon získaš navyše oproti synchrónnemu spracovaniu. A keď to prepískneš veľa, tak budeš mať výkon ešte menší. Problém je v správe takýchto úloh a prílišnému zaťaženiu čipu. Je to úplne rovnaké ako s threadmi na CPU. Tiež si ich nemôžeš alokovať koľko chceš s tým, že čím viac threadov, tým viac výkonu. A to počítam s úlohami, pre ktoré je vyšší počet threadov prospešný. Optimálne je alokovať si toľko threadov koľko podporuje CPU na HW úrovni. Čím ich alokuješ viac, tým menší nárast výkonu získaš až nakoniec nájdeš hranicu (ktorá je v tomto prípade veľmi malá) kedy pri multithreadingu budeš mať menší výkon ako keby si použil iba jeden thread.
Teda ak Maxwell podporuje iba 31 vykonávaných asynchrónnych úloh v jednom čase a ty mu ich pošleš 128 (ako v prípade benchmarku z Beyond3D), tak ho tým úplne zahltíš a jeho výkon zabiješ. AMD má s GCN hornú hranicu 64 a preto je dopad 128 úloh nižší a s takým prepadom, ktorý ešte stále zabezpečuje vyšší výkon oproti synchrónnemu spracovaniu. Čo by sa asi diaľo keby sme do AMD grafiky pustili 256 asynchrónnych úloh (čo je štvornásobok podporovanej hranice a bolo by to teda ako v prípade Maxwella)? Myslím, že by sme videli rovnaký prepad ako u NV. Týmto sa dajú robiť úplne rovnaké ťahy ako s teselačným faktorom. Je to proste ďalší spôsob akým je možné zabiť výkon grafík konkurencie. A povedal by som, že sú si momentálne NV a AMD kvit. :-)
+1
+2
-1
Je komentář přínosný?
"čím více AS využíváte jde
Marek Moravčík https://diit.cz/profil/mareknr
19. 9. 2015 - 11:11https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse"čím více AS využíváte jde výkon čipu nahoru"
Toto práve nie je logické. Akákoľvek architektúra GPU a aj CPU má svoje HW limity. To platí aj o počte spracovaných asynchrónnych úloh na GCN či Maxwelly. Čím viac túto hranicu presiahneš, tým menší výkon získaš navyše oproti synchrónnemu spracovaniu. A keď to prepískneš veľa, tak budeš mať výkon ešte menší. Problém je v správe takýchto úloh a prílišnému zaťaženiu čipu. Je to úplne rovnaké ako s threadmi na CPU. Tiež si ich nemôžeš alokovať koľko chceš s tým, že čím viac threadov, tým viac výkonu. A to počítam s úlohami, pre ktoré je vyšší počet threadov prospešný. Optimálne je alokovať si toľko threadov koľko podporuje CPU na HW úrovni. Čím ich alokuješ viac, tým menší nárast výkonu získaš až nakoniec nájdeš hranicu (ktorá je v tomto prípade veľmi malá) kedy pri multithreadingu budeš mať menší výkon ako keby si použil iba jeden thread.
Teda ak Maxwell podporuje iba 31 vykonávaných asynchrónnych úloh v jednom čase a ty mu ich pošleš 128 (ako v prípade benchmarku z Beyond3D), tak ho tým úplne zahltíš a jeho výkon zabiješ. AMD má s GCN hornú hranicu 64 a preto je dopad 128 úloh nižší a s takým prepadom, ktorý ešte stále zabezpečuje vyšší výkon oproti synchrónnemu spracovaniu. Čo by sa asi diaľo keby sme do AMD grafiky pustili 256 asynchrónnych úloh (čo je štvornásobok podporovanej hranice a bolo by to teda ako v prípade Maxwella)? Myslím, že by sme videli rovnaký prepad ako u NV. Týmto sa dajú robiť úplne rovnaké ťahy ako s teselačným faktorom. Je to proste ďalší spôsob akým je možné zabiť výkon grafík konkurencie. A povedal by som, že sú si momentálne NV a AMD kvit. :-)https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818869
+
Při paralelním zpracování úloh se vždy dočkáš vyššího výkonu, než při sériovém zpracování těch samých úloh, protože GPU je vždy vytíženo na maximum (jeho výpočetní zdroje), kdežto u sériového zpracování ne!
A právě těchto nevyužitých zdrojů při sériovém zpracování, využívají AS obdobně, jako je tomu u CPU a SMT.
+1
-1
-1
Je komentář přínosný?
Při paralelním zpracování
webwalker https://diit.cz/profil/webwalker
20. 9. 2015 - 00:59https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePři paralelním zpracování úloh se vždy dočkáš vyššího výkonu, než při sériovém zpracování těch samých úloh, protože GPU je vždy vytíženo na maximum (jeho výpočetní zdroje), kdežto u sériového zpracování ne!
A právě těchto nevyužitých zdrojů při sériovém zpracování, využívají AS obdobně, jako je tomu u CPU a SMT.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818899
+
Sorry, ale tohle je neskutečná blbost. Paralelismus má taky nějakou režii. Rozhlašovat, že více paralelismu je více Addidas, je dost nezodpovědné, protože se najdou pitomci, co se toho chytnou a budou tomu snad i věřit.
+1
-4
-1
Je komentář přínosný?
Sorry, ale tohle je
Shal https://diit.cz/profil/aaa-bbb
20. 9. 2015 - 11:28https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseSorry, ale tohle je neskutečná blbost. Paralelismus má taky nějakou režii. Rozhlašovat, že více paralelismu je více Addidas, je dost nezodpovědné, protože se najdou pitomci, co se toho chytnou a budou tomu snad i věřit.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818904
+
Práveže u CPU a multithreadingu je to tak, že ak si alokuješ viac threadov ako je HW dostupných, tak výkon mať vyšší nebudeš. Skôr naopak. Ako píše Shal, réžia toľkých threadov ťa bude stáť viac ako budeš mať z toho úžitok.
+1
0
-1
Je komentář přínosný?
Práveže u CPU a
Marek Moravčík https://diit.cz/profil/mareknr
20. 9. 2015 - 11:41https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePráveže u CPU a multithreadingu je to tak, že ak si alokuješ viac threadov ako je HW dostupných, tak výkon mať vyšší nebudeš. Skôr naopak. Ako píše Shal, réžia toľkých threadov ťa bude stáť viac ako budeš mať z toho úžitok. https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818905
+
červená čára - doba mixu compute a graphics shaderů
modrá čára - doba pouze compute shaderů
Z toho je patrné, že Maxwell opravdu neprovádí mix compute/graphics asynchronně (paralelně), ale o to tu nyní nejde. Koukněte se na tu žlutou čáru jdoucí až k nebesům - no a to je právě to sériové zpracování shaderů :)
+1
+2
-1
Je komentář přínosný?
Takto vypadá onen MDolenc
webwalker https://diit.cz/profil/webwalker
20. 9. 2015 - 13:39https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTakto vypadá onen MDolenc test na GTX 980 Ti provádění AS až 506 kernelů (tasks)
http://i.imgur.com/3NrhGRo.png
červená čára - doba mixu compute a graphics shaderů
modrá čára - doba pouze compute shaderů
Z toho je patrné, že Maxwell opravdu neprovádí mix compute/graphics asynchronně (paralelně), ale o to tu nyní nejde. Koukněte se na tu žlutou čáru jdoucí až k nebesům - no a to je právě to sériové zpracování shaderů :)
https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818907
+
Zrejme majú architektúry GPU lepšie zvládnutý paralelizmus, ale u CPU to nefunguje na princípe čím viac threadov (myslím teraz SW, nie HW), tým vyšší výkon. Grafiky musia ťažiť z vysokého počtu výpočtových jednotiek. Tu je trochu starší článok, ale niečo podobné som čítal aj v aktuálnej knihe k multithreadingu:
20. 9. 2015 - 15:18https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseZrejme majú architektúry GPU lepšie zvládnutý paralelizmus, ale u CPU to nefunguje na princípe čím viac threadov (myslím teraz SW, nie HW), tým vyšší výkon. Grafiky musia ťažiť z vysokého počtu výpočtových jednotiek. Tu je trochu starší článok, ale niečo podobné som čítal aj v aktuálnej knihe k multithreadingu:
http://www.codeguru.com/cpp/sample_chapter/article.php/c13533/Why-Too-Many-Threads-Hurts-Performance-and-What-to-do-About-It.htmhttps://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818911
+
GPU se chova presne stejne jako CPU, jen jde o specificky typ uloh, ktere maji nizkou rezii => jsou pro paralelni zpracovani vhodne. Ale jak uz bylo receno, nejaka rezije s obsluhou tu je vzdy, vetsi ci mensi, to je fuk, vzdy existuje hranice, kdy zacne vykon s poctem threadu klesat.
To vubec neznamena, ze se ty hranice da dosahnout na soudobym HW.
+1
-3
-1
Je komentář přínosný?
GPU se chova presne stejne
jako nac https://diit.cz/profil/xvp
22. 9. 2015 - 23:00https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseGPU se chova presne stejne jako CPU, jen jde o specificky typ uloh, ktere maji nizkou rezii => jsou pro paralelni zpracovani vhodne. Ale jak uz bylo receno, nejaka rezije s obsluhou tu je vzdy, vetsi ci mensi, to je fuk, vzdy existuje hranice, kdy zacne vykon s poctem threadu klesat.
To vubec neznamena, ze se ty hranice da dosahnout na soudobym HW.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-819170
+
Tady je otazka, co si clovek predstavuje pod pojmem vykon. Pokud thready plne vytezujou vsechny jadra CPU/GPU, pridavani dalsich threadu uz rychlost nezvysi, ale snizi o rezii prepinani threadu. Pokud, ale thready nevytizej CPU/GPU na plno pridavani threadu rychlost zpracovani zvysovat bude. U CPU se toho hodne vyuziva hlavne i sitovych spojeni, kde neni potreba skoro zadny vypocetni vykon, ale sou dlouhy cekaci doby na odezvu. U GPU to muze byt treba vice threadu bezicich na renderovacich jednotkach cekajicich na vystup z pixel shaderu.
Samozrejme zvysovani poctu threadu do nekonecna nema smysl, protoze pri urcitych poctu se kapacita kazdy vypocetni jednotky naplni.
Ale kazdopadne neplati, ze pocet threadu se musi rovnat poctu vypocetnich jednotech.
+1
0
-1
Je komentář přínosný?
Tady je otazka, co si clovek
BlackRider https://diit.cz/profil/blackrider
21. 9. 2015 - 09:59https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTady je otazka, co si clovek predstavuje pod pojmem vykon. Pokud thready plne vytezujou vsechny jadra CPU/GPU, pridavani dalsich threadu uz rychlost nezvysi, ale snizi o rezii prepinani threadu. Pokud, ale thready nevytizej CPU/GPU na plno pridavani threadu rychlost zpracovani zvysovat bude. U CPU se toho hodne vyuziva hlavne i sitovych spojeni, kde neni potreba skoro zadny vypocetni vykon, ale sou dlouhy cekaci doby na odezvu. U GPU to muze byt treba vice threadu bezicich na renderovacich jednotkach cekajicich na vystup z pixel shaderu.
Samozrejme zvysovani poctu threadu do nekonecna nema smysl, protoze pri urcitych poctu se kapacita kazdy vypocetni jednotky naplni.
Ale kazdopadne neplati, ze pocet threadu se musi rovnat poctu vypocetnich jednotech.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818942
+
Čítal som to ako doporučenie. Myslím, že je jasné, že každý HW má svoje konečné limity. Kždopádne dík za doplnenie.
+1
-3
-1
Je komentář přínosný?
Čítal som to ako doporučenie.
Marek Moravčík https://diit.cz/profil/mareknr
21. 9. 2015 - 12:20https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseČítal som to ako doporučenie. Myslím, že je jasné, že každý HW má svoje konečné limity. Kždopádne dík za doplnenie. https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818960
+
Pises kraviny a ani si neprectes, na co reagujes. Vetsi paralelizace vede k vyssimu vykonu jen do ty miry, dokud pro ty ulohy existuje HW, ktery je bude zpracovavat. Jakakoli paralelizace sebou pak nese i spravu tech uloh. Takze i kdybych mel CPU s nekonecnym poctem jader, tak se driv nebo pozdejs dostanu na hranici, kdy samotna obsluha tech uloh bude narocnejsi, nez jejich vlastni zpracovani => kazdy dalsi navyseni poctu paralelne zpracovavanych uloh pak uz vede naopak ke snizovani vykonu.
+1
-1
-1
Je komentář přínosný?
Pises kraviny a ani si
jako nac https://diit.cz/profil/xvp
22. 9. 2015 - 22:56https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePises kraviny a ani si neprectes, na co reagujes. Vetsi paralelizace vede k vyssimu vykonu jen do ty miry, dokud pro ty ulohy existuje HW, ktery je bude zpracovavat. Jakakoli paralelizace sebou pak nese i spravu tech uloh. Takze i kdybych mel CPU s nekonecnym poctem jader, tak se driv nebo pozdejs dostanu na hranici, kdy samotna obsluha tech uloh bude narocnejsi, nez jejich vlastni zpracovani => kazdy dalsi navyseni poctu paralelne zpracovavanych uloh pak uz vede naopak ke snizovani vykonu.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-819169
+
Takovy skromny dotaz:
Podle mne je toto resitelne jednoduse frontou. To znamena v momente kdy SW pridelujici paralelni prostredky alokuje vsechny prostredky, tak preci zacne jednoduse radit dalsi ulohy do fronty a v momente, kdy je dalsi paralelni prostredek volny, tak ulohu jednoduse prideli. Podle mne spise nez ke snizovani dochazi spise ke stagnaci vykonu.
Ke snizovani vykonu pak muze dochazet v pripade, pokud pocet prijatych uloh ke zpracovani neni uz kde radit a nebo je paralelizace napsana spatne. Jinak si to moc neumim predstavit co myslite.
+1
+1
-1
Je komentář přínosný?
Takovy skromny dotaz:
tombomino https://diit.cz/profil/tombomino
27. 9. 2015 - 08:13https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTakovy skromny dotaz:
Podle mne je toto resitelne jednoduse frontou. To znamena v momente kdy SW pridelujici paralelni prostredky alokuje vsechny prostredky, tak preci zacne jednoduse radit dalsi ulohy do fronty a v momente, kdy je dalsi paralelni prostredek volny, tak ulohu jednoduse prideli. Podle mne spise nez ke snizovani dochazi spise ke stagnaci vykonu.
Ke snizovani vykonu pak muze dochazet v pripade, pokud pocet prijatych uloh ke zpracovani neni uz kde radit a nebo je paralelizace napsana spatne. Jinak si to moc neumim predstavit co myslite.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-819578
+
Poznám výhody teselácie a aj jej účel. Porovnával som ale niečo iné. A mám v podstate rovnaké otázky ako ty. Preto by som rád videl benchmark, kde by sa dal počet odosielaných úloh konfigurovať a mohli by sme vidieť ich dopady na výkon GPU. Vtedy by sme mohli vidieť, či sa správajú podľa očakávania ak ich hranica prekročená nie je. A ak by sa správali v poriadku, vedeli by sme zistiť kde majú fyzické hranice.
+1
-4
-1
Je komentář přínosný?
Poznám výhody teselácie a aj
Marek Moravčík https://diit.cz/profil/mareknr
19. 9. 2015 - 11:33https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePoznám výhody teselácie a aj jej účel. Porovnával som ale niečo iné. A mám v podstate rovnaké otázky ako ty. Preto by som rád videl benchmark, kde by sa dal počet odosielaných úloh konfigurovať a mohli by sme vidieť ich dopady na výkon GPU. Vtedy by sme mohli vidieť, či sa správajú podľa očakávania ak ich hranica prekročená nie je. A ak by sa správali v poriadku, vedeli by sme zistiť kde majú fyzické hranice.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818871
+
Poslední info o hl3 je ze práva chtělo koupit studio, které dělalo na crash bandicoot. (Vím ze ta firma dělala i na jiných hrach ale nevím jak se teď menuje
+1
+2
-1
Je komentář přínosný?
Poslední info o hl3 je ze
Hadas https://diit.cz/profil/pavel-hadek1
18. 9. 2015 - 12:51https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskusePoslední info o hl3 je ze práva chtělo koupit studio, které dělalo na crash bandicoot. (Vím ze ta firma dělala i na jiných hrach ale nevím jak se teď menujehttps://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818812
+
Naughty Dog. Aktuálně jsou známí hlavně díky Uncharted a Last of Us. Každopádně on to byl jenom takový joke na Twitteru, kdyby Valve fakt chtěli prodat práva na HL značku, tak tipuju nejvíc by nabídli Activision a ti by z toho udělali roční sérii ala CoD.
+1
+3
-1
Je komentář přínosný?
Naughty Dog. Aktuálně jsou
r4in https://diit.cz/profil/petr-lazar
18. 9. 2015 - 16:09https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseNaughty Dog. Aktuálně jsou známí hlavně díky Uncharted a Last of Us. Každopádně on to byl jenom takový joke na Twitteru, kdyby Valve fakt chtěli prodat práva na HL značku, tak tipuju nejvíc by nabídli Activision a ti by z toho udělali roční sérii ala CoD.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818836
+
Tak na Armu 3 jsem nejvíc zvědav, zrovna před pár dny jsem to řešil, že tam mám průměrné využití grafické karty na 60% na 4GHz 6-jádru a nevím, co s tím. Tak snad mi to pomůže :-)
+1
0
-1
Je komentář přínosný?
Tak na Armu 3 jsem nejvíc
Martin Wessnitzer https://diit.cz/profil/zerogreat
18. 9. 2015 - 14:52https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTak na Armu 3 jsem nejvíc zvědav, zrovna před pár dny jsem to řešil, že tam mám průměrné využití grafické karty na 60% na 4GHz 6-jádru a nevím, co s tím. Tak snad mi to pomůže :-)https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818827
+
U Army 3 jsem se o tom jako laik kraťoučce pobavil na bugtrackeru a tady jsou odpovědi: http://feedback.arma3.com/view.php?id=23922 , růžově to nevypadá, nejspíš 20FPS ve městě při žádné komponentě vytížené na max zůstane.
Upvote pro ten thread prosím.
+1
-5
-1
Je komentář přínosný?
U Army 3 jsem se o tom jako
VashCZ https://diit.cz/profil/vashcz
19. 9. 2015 - 13:23https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseU Army 3 jsem se o tom jako laik kraťoučce pobavil na bugtrackeru a tady jsou odpovědi: http://feedback.arma3.com/view.php?id=23922 , růžově to nevypadá, nejspíš 20FPS ve městě při žádné komponentě vytížené na max zůstane.
Upvote pro ten thread prosím.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818878
+
Je k dispozici Infiltrator demo od Epicu ktere by melo behat jak pod DX11 tak pod DX12. Nenaslo by se par dobrovolniku co by to odzkouselo, ze by sme porovnali vysledky DX11/12. Ja to zrovna stahuju, ale pochybuju ze to rozbehnu.
18. 9. 2015 - 15:09https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseJe k dispozici Infiltrator demo od Epicu ktere by melo behat jak pod DX11 tak pod DX12. Nenaslo by se par dobrovolniku co by to odzkouselo, ze by sme porovnali vysledky DX11/12. Ja to zrovna stahuju, ale pochybuju ze to rozbehnu.
Link na stazeni v description https://www.youtube.com/watch?v=_YepxAtYvfghttps://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818830
+
To je jednoduché, více DX12 her bude, až se začne používat na Xbox One. Taky hraje velkou roli (ne)rozšíření Windows 10, pokud lidi budou stále na Windows 7 s DX11, tak motivace vývojářů používat DX12 nebude valná.
+1
-5
-1
Je komentář přínosný?
To je jednoduché, více DX12
r4in https://diit.cz/profil/petr-lazar
18. 9. 2015 - 16:00https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseTo je jednoduché, více DX12 her bude, až se začne používat na Xbox One. Taky hraje velkou roli (ne)rozšíření Windows 10, pokud lidi budou stále na Windows 7 s DX11, tak motivace vývojářů používat DX12 nebude valná.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818835
+
"Lidi" vývojáře nezajímají - a už vůbec ne MS hateři - vývojáře zajímají hráči. A ti na W10 kvůli DX12 prostě půjdou.
+1
+5
-1
Je komentář přínosný?
"Lidi" vývojáře nezajímají -
Pety https://diit.cz/profil/petyy
18. 9. 2015 - 16:24https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse"Lidi" vývojáře nezajímají - a už vůbec ne MS hateři - vývojáře zajímají hráči. A ti na W10 kvůli DX12 prostě půjdou.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818837
+
Gears of War: Ultimate Edition musí být blbost a nebo nebude Exkluzivně pro xbox ale i pro PC (xbox one má podle EN wikipedie podporu DX 11,2).
+1
-1
-1
Je komentář přínosný?
Gears of War: Ultimate
Daniel Křenský https://diit.cz/profil/daniel-krensky
18. 9. 2015 - 20:45https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseGears of War: Ultimate Edition musí být blbost a nebo nebude Exkluzivně pro xbox ale i pro PC (xbox one má podle EN wikipedie podporu DX 11,2).https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818858
+
XBOX one samozrejme nebude mať HW podporu nových DX12 features, ale bude môcť ťažiť z optimalizovanej CPU vrstvy a mal by teda vedieť s DX12 lepšie využívať viacjadrové CPU.
+1
-6
-1
Je komentář přínosný?
XBOX one samozrejme nebude
Marek Moravčík https://diit.cz/profil/mareknr
19. 9. 2015 - 11:14https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuseXBOX one samozrejme nebude mať HW podporu nových DX12 features, ale bude môcť ťažiť z optimalizovanej CPU vrstvy a mal by teda vedieť s DX12 lepšie využívať viacjadrové CPU.https://diit.cz/clanek/directx-12-hry-deus-ex-mankind-divided/diskuse#comment-818870
+
ARC je odložen. Prý kuli problémům s ovladačemi. http://steamcommunity.com/app/346110/discussions/0/520518053440119300/
edit: tak beru zpět. Nevím jestli už jim to jede nebo ne. Doma vyzkouším, už jsem to nějaký ten pátek nespustil.
Tak nejde, tedy pokud se to nemusí spouštět nějak "speciálně" s nějakým příznakem pro podporu DX12.
Doufám, že DX12 výpočtů bude využito k ještě reálnějšímu zobrazování chromatické aberace a jiným post-processingovým prasečinám, co jsou dnes moderní. :-D
Jo heh, asi tak. Chromatická aberace je zatim nejtypičtější příklad zpraseného postprocesingu, ala věc co nám cíleně kazí obraz, protože kdysi tímto trpěly kamery takže to musíme mít také pro onen "cinematic look". Sorry ale tohle já fakt nechi, heh, i sami výrobci kamer dost investovali až se toho nakonec zbavili, a mi si tady bude plejtvat výkonem pro něco co nám zhorší obraz? Hmm?
Já osobně vypínám i DOF + motion blur protože tak jak to v hrách bejvá implementovanýá mi přijde hnusný a total nerealistický, sorry ale moje oči takhle nefungujou... Já výhodu DX12 beru jako hlavně ten CPU overhead, zbytek je už méně podstatnej.
Chromaticka aberace neni vec kamer, ale optiky a zbavit se ji nejde. Jen potlacit na snesitelnou uroven.
Jinak souhlas, ze cpat to do postprocesiingu her je kravina.
To DayZ si klidne skrtnete. Sleduji vyvoj z prvni ruky. Urcite pridaji jednu dve cepice, kabely k autobaterii a nejaky guny, coz rozbije zombiky a spawn lootu. Nejaky jak tomu rikaji "renderer" nebo dokonce reseni problemu ze ve mestech maji vsichni 12fps, zatimco na novem Exile na Chernu+ 80fps, to je vec podruzna.
Ja se jen bojim ze nakonec vetsina vydavatelu pred NVIDII stejne couvne a vyda jenom "umele" DirectX 11 hry, inu uvidime ale zas na stranu druhou Playstation 4 a Xbox One vyuziva AMD konceptu a tak by byla skoda ozelet vyhody api DirectX 12.
Nejake informace ohledem Half-Life 3 nejsou :-), uz me stvou :-D.
Doufam ze nam nesprasi podporu pro Windows 7, "jenom Windows 8.1 a 10 only" dnes je mozne proste vsechno.
Prečítal by som si toto:
https://www.reddit.com/r/nvidia/comments/3j5e9b/analysis_async_compute_i...
NVIDIA v Maxwelloch AS podporuje. Len nie v takej miere ako AMD. Je to ako s teseláciou len obrátene. Počkajme si radšej na reálne výsledky v daných hrách.
S teselací se to moc srovnávat nedá. Cílem teselace je zvýšit počet polygonů za určité snížení výkonu. Toto snížení výkonu bylo u AMD o něco výraznější než u Nvidie (důvody by byly na samostatný článek). U obou výrobců šlo ale o snížení výkonu. Proti tomu cílem asynchronních shaderů je zvýšení výkonu díky možnosti efektivnějšího využití architektury čipu. Jenže to není tak, že by zvýšení výkonu bylo u Nvidie méně výrazné než u AMD: prozatím je to tak, že u Nvidie dochází k propadu výkonu o desítky procent. Neděje se, co by se dít mělo - laicky řečeno to nefunguje.
O adekvátní srovnání s teselací by se dalo mluvit v tom případě, kdyby teselace na AMD hardwaru snižovala výkon a přitom nepřidávala žádné polygony :-)
Tohle spíš připomíná implementaci Shader Model 3.0 na GeForce 6000 a 7000. Formálně tato technologie podporovaná byla, ale když došlo na dynamic branching, šel výkon na jednotky FPS...
Porovnával som dopady na výkon. Nie cieľ oboch riešení. AMD aj NVIDIA majú v teselácii inak posunuté hranice a všetci vieme čo sa stane keď sa použije extrémna teselácia (tuším je aktuálne na stupni 64). Teda je to podobné ako keď sa kvôli benchmarku odošle do GPU neúmerné množstvo asynchrónnych úloh. Myslím, že v uvedenom odkaze je celkom pekne vysvetlené prečo došlo k prepadom výkonu u Maxwella. Použitý benchmark dosť presiahol možnosti Maxwella (nadmerným zahltením asynchróonych úloh - bolo použitých 128 a limit Maxwellu je 31) čím jeho výkon doslova zabil. AMD má hranicu posunutú na 64 asynchrónnych úloh. Vďaka tomu daný test zvládla lepšie. Rád by som videl situáciu kde by benchmark použil 31 asynchrónnych úloh, potom 64 a nakoniec trebárs 256 (to už by malo zabiť výkon aj u grafík od AMD). Ak je teda pravda to, čo sa píše na uvedenom webe.
Je to v podstate obdobné ako keď sa preťaží Geometry Shader. Ten pridáva do stávajúcej geometrie nové vertexy a tiež má svoju hornú hranicu, koľko ich pri jednom volaní môže vytvoriť. Ak sa táto hranica prekročí, ide výkon strmhlav dolu v závislosti od miery prekročenia.
Ono cíl teselace je vytvéřet polygony na GPU, aby se nemusely vytvářet na CPU/enginem, CPU je počítat, štosovat přes sběrnici, proprvat je overheadem API, atd. V podstatě to co říkáš je pravda, pomocí AS se dá výkon na té či oné architektuře dokurvit easy, je to opravdu velice podobné kauze s teselací. Když třeba ve witcherovi dáš forced tes fakto 16x, tak to krásně zlepšuje geometrii aniž by rostl overhead a zátěž na CPU, dopad na výon minimální efekt pozitivní. Ale když to necháš by default je to na hairfowrks až 64x což je overkill kterej killne výkon na Radeonech mnohem více jak na Geforce.
To samé se zde může dít s AS, pokud by se opravdu použil AS kterej nemá více jak 30 úloh najednou, tzn i maxwell by jej dal single, pass opravdu by výsledek vypadal tak jak vypadá? Dobré by také bylo vědět co přesně ty AS dělaj, aby to nebylo schválně zahcení blbostma co killne výkon konkurence, stejně jako to udělala nv u těch vlasů či předtim třeba v Crysis2 DX11 patchi. Nezapomínejte že dnes AMD hraje stejně špinavou hru jak NV.
Ale jděte, Srovnávat tyto věci je zavádějící. Teselace má za úkol vylepšit obraz. Je ale nutné podotknout, že to růstem teselace zatížení teselačních jednotek roste, ale na obraze je každé navýšení pouhým okem méně patrné. To se přece již řešilo. AMD v ovladači udělalo omezení na tuším 32 násobnou propad výkonu není tak velký a rozdíl v obraze aby člověk lupou hledal. V AS je logika přesně obráceně, čím více AS využíváte jde výkon čipu nahoru. Protože rozložíte zátěž rovnoměrněji. Pokud omezíte AS omezíte výkon. Z logiky věci tedy vyplývá, navyšování AS není kontraproduktivní jako u teselace kde výkon jde dolů a rozdíl v obraze je těžko patrný.
"čím více AS využíváte jde výkon čipu nahoru"
Toto práve nie je logické. Akákoľvek architektúra GPU a aj CPU má svoje HW limity. To platí aj o počte spracovaných asynchrónnych úloh na GCN či Maxwelly. Čím viac túto hranicu presiahneš, tým menší výkon získaš navyše oproti synchrónnemu spracovaniu. A keď to prepískneš veľa, tak budeš mať výkon ešte menší. Problém je v správe takýchto úloh a prílišnému zaťaženiu čipu. Je to úplne rovnaké ako s threadmi na CPU. Tiež si ich nemôžeš alokovať koľko chceš s tým, že čím viac threadov, tým viac výkonu. A to počítam s úlohami, pre ktoré je vyšší počet threadov prospešný. Optimálne je alokovať si toľko threadov koľko podporuje CPU na HW úrovni. Čím ich alokuješ viac, tým menší nárast výkonu získaš až nakoniec nájdeš hranicu (ktorá je v tomto prípade veľmi malá) kedy pri multithreadingu budeš mať menší výkon ako keby si použil iba jeden thread.
Teda ak Maxwell podporuje iba 31 vykonávaných asynchrónnych úloh v jednom čase a ty mu ich pošleš 128 (ako v prípade benchmarku z Beyond3D), tak ho tým úplne zahltíš a jeho výkon zabiješ. AMD má s GCN hornú hranicu 64 a preto je dopad 128 úloh nižší a s takým prepadom, ktorý ešte stále zabezpečuje vyšší výkon oproti synchrónnemu spracovaniu. Čo by sa asi diaľo keby sme do AMD grafiky pustili 256 asynchrónnych úloh (čo je štvornásobok podporovanej hranice a bolo by to teda ako v prípade Maxwella)? Myslím, že by sme videli rovnaký prepad ako u NV. Týmto sa dajú robiť úplne rovnaké ťahy ako s teselačným faktorom. Je to proste ďalší spôsob akým je možné zabiť výkon grafík konkurencie. A povedal by som, že sú si momentálne NV a AMD kvit. :-)
Při paralelním zpracování úloh se vždy dočkáš vyššího výkonu, než při sériovém zpracování těch samých úloh, protože GPU je vždy vytíženo na maximum (jeho výpočetní zdroje), kdežto u sériového zpracování ne!
A právě těchto nevyužitých zdrojů při sériovém zpracování, využívají AS obdobně, jako je tomu u CPU a SMT.
Sorry, ale tohle je neskutečná blbost. Paralelismus má taky nějakou režii. Rozhlašovat, že více paralelismu je více Addidas, je dost nezodpovědné, protože se najdou pitomci, co se toho chytnou a budou tomu snad i věřit.
Práveže u CPU a multithreadingu je to tak, že ak si alokuješ viac threadov ako je HW dostupných, tak výkon mať vyšší nebudeš. Skôr naopak. Ako píše Shal, réžia toľkých threadov ťa bude stáť viac ako budeš mať z toho úžitok.
Takto vypadá onen MDolenc test na GTX 980 Ti provádění AS až 506 kernelů (tasks)
http://i.imgur.com/3NrhGRo.png
červená čára - doba mixu compute a graphics shaderů
modrá čára - doba pouze compute shaderů
Z toho je patrné, že Maxwell opravdu neprovádí mix compute/graphics asynchronně (paralelně), ale o to tu nyní nejde. Koukněte se na tu žlutou čáru jdoucí až k nebesům - no a to je právě to sériové zpracování shaderů :)
Zrejme majú architektúry GPU lepšie zvládnutý paralelizmus, ale u CPU to nefunguje na princípe čím viac threadov (myslím teraz SW, nie HW), tým vyšší výkon. Grafiky musia ťažiť z vysokého počtu výpočtových jednotiek. Tu je trochu starší článok, ale niečo podobné som čítal aj v aktuálnej knihe k multithreadingu:
http://www.codeguru.com/cpp/sample_chapter/article.php/c13533/Why-Too-Ma...
GPU se chova presne stejne jako CPU, jen jde o specificky typ uloh, ktere maji nizkou rezii => jsou pro paralelni zpracovani vhodne. Ale jak uz bylo receno, nejaka rezije s obsluhou tu je vzdy, vetsi ci mensi, to je fuk, vzdy existuje hranice, kdy zacne vykon s poctem threadu klesat.
To vubec neznamena, ze se ty hranice da dosahnout na soudobym HW.
Tady je otazka, co si clovek predstavuje pod pojmem vykon. Pokud thready plne vytezujou vsechny jadra CPU/GPU, pridavani dalsich threadu uz rychlost nezvysi, ale snizi o rezii prepinani threadu. Pokud, ale thready nevytizej CPU/GPU na plno pridavani threadu rychlost zpracovani zvysovat bude. U CPU se toho hodne vyuziva hlavne i sitovych spojeni, kde neni potreba skoro zadny vypocetni vykon, ale sou dlouhy cekaci doby na odezvu. U GPU to muze byt treba vice threadu bezicich na renderovacich jednotkach cekajicich na vystup z pixel shaderu.
Samozrejme zvysovani poctu threadu do nekonecna nema smysl, protoze pri urcitych poctu se kapacita kazdy vypocetni jednotky naplni.
Ale kazdopadne neplati, ze pocet threadu se musi rovnat poctu vypocetnich jednotech.
Čítal som to ako doporučenie. Myslím, že je jasné, že každý HW má svoje konečné limity. Kždopádne dík za doplnenie.
Pises kraviny a ani si neprectes, na co reagujes. Vetsi paralelizace vede k vyssimu vykonu jen do ty miry, dokud pro ty ulohy existuje HW, ktery je bude zpracovavat. Jakakoli paralelizace sebou pak nese i spravu tech uloh. Takze i kdybych mel CPU s nekonecnym poctem jader, tak se driv nebo pozdejs dostanu na hranici, kdy samotna obsluha tech uloh bude narocnejsi, nez jejich vlastni zpracovani => kazdy dalsi navyseni poctu paralelne zpracovavanych uloh pak uz vede naopak ke snizovani vykonu.
Takovy skromny dotaz:
Podle mne je toto resitelne jednoduse frontou. To znamena v momente kdy SW pridelujici paralelni prostredky alokuje vsechny prostredky, tak preci zacne jednoduse radit dalsi ulohy do fronty a v momente, kdy je dalsi paralelni prostredek volny, tak ulohu jednoduse prideli. Podle mne spise nez ke snizovani dochazi spise ke stagnaci vykonu.
Ke snizovani vykonu pak muze dochazet v pripade, pokud pocet prijatych uloh ke zpracovani neni uz kde radit a nebo je paralelizace napsana spatne. Jinak si to moc neumim predstavit co myslite.
Poznám výhody teselácie a aj jej účel. Porovnával som ale niečo iné. A mám v podstate rovnaké otázky ako ty. Preto by som rád videl benchmark, kde by sa dal počet odosielaných úloh konfigurovať a mohli by sme vidieť ich dopady na výkon GPU. Vtedy by sme mohli vidieť, či sa správajú podľa očakávania ak ich hranica prekročená nie je. A ak by sa správali v poriadku, vedeli by sme zistiť kde majú fyzické hranice.
Poslední info o hl3 je ze práva chtělo koupit studio, které dělalo na crash bandicoot. (Vím ze ta firma dělala i na jiných hrach ale nevím jak se teď menuje
Naughty Dog. Aktuálně jsou známí hlavně díky Uncharted a Last of Us. Každopádně on to byl jenom takový joke na Twitteru, kdyby Valve fakt chtěli prodat práva na HL značku, tak tipuju nejvíc by nabídli Activision a ti by z toho udělali roční sérii ala CoD.
Tak na Armu 3 jsem nejvíc zvědav, zrovna před pár dny jsem to řešil, že tam mám průměrné využití grafické karty na 60% na 4GHz 6-jádru a nevím, co s tím. Tak snad mi to pomůže :-)
U Army 3 jsem se o tom jako laik kraťoučce pobavil na bugtrackeru a tady jsou odpovědi: http://feedback.arma3.com/view.php?id=23922 , růžově to nevypadá, nejspíš 20FPS ve městě při žádné komponentě vytížené na max zůstane.
Upvote pro ten thread prosím.
Porid Intel, i dvoujadrova I3 ti tu grafiku vytizi vic nez pretaktovana FX-6300.
Je k dispozici Infiltrator demo od Epicu ktere by melo behat jak pod DX11 tak pod DX12. Nenaslo by se par dobrovolniku co by to odzkouselo, ze by sme porovnali vysledky DX11/12. Ja to zrovna stahuju, ale pochybuju ze to rozbehnu.
Link na stazeni v description https://www.youtube.com/watch?v=_YepxAtYvfg
To je jednoduché, více DX12 her bude, až se začne používat na Xbox One. Taky hraje velkou roli (ne)rozšíření Windows 10, pokud lidi budou stále na Windows 7 s DX11, tak motivace vývojářů používat DX12 nebude valná.
"Lidi" vývojáře nezajímají - a už vůbec ne MS hateři - vývojáře zajímají hráči. A ti na W10 kvůli DX12 prostě půjdou.
Gears of War: Ultimate Edition musí být blbost a nebo nebude Exkluzivně pro xbox ale i pro PC (xbox one má podle EN wikipedie podporu DX 11,2).
XBOX one samozrejme nebude mať HW podporu nových DX12 features, ale bude môcť ťažiť z optimalizovanej CPU vrstvy a mal by teda vedieť s DX12 lepšie využívať viacjadrové CPU.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.