Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Co stojí za energetickou efektivitou Maxwellu - GeForce GTX 980?

Nezbývá než smeknout před vývojáři nvidie. Běžný gamesník dostane to co chtěl a "počtář" si prostě bude muset přičíst těch cca 100W. Docela by mě taky zajímalo, zda se tento nárust spotřeby projeví i při využití Shadowplay.

+1
+8
-1
Je komentář přínosný?

No tak seriózní "počtář" si pravděpodobně Maxwellem moc nepomůže, zřejmě i proto, že jedním z důvodů nižší spotřeby Maxwellu nejspíše bude i ten už dost profláklý další pokles poměru DP:SP výkonu z dosavadních 1:24 na 1:32 - Maxwell je ještě více "zherněný". (AMD snad pořád ještě drží poměr 1:16, ale to už rýpám. ;-)) Aby nakonec v objemu DP výpočtů na joule neskončil hůře než předchozí generace...

+1
+12
-1
Je komentář přínosný?

No já bych to viděl jako návrat do minulosti. Prostě nepočítají 32 bit barvy ale jen 24 a pak se to tváří jako 32bit. Tím ušetří počítání :-) Tam je takového prostoru na optimalizace.

+1
+4
-1
Je komentář přínosný?

No pozor, tím už by narušili normu IEEE pro aritmetiku v plovoucí řádové čárce, což v zásadě znamená, že minimálně pro obecné výpočty tam ty standardům vyhovující jednotky být musí. Tam ten pes asi zakopaný nebude. Kromě toho pro úsporu v téhle oblasti už dlouho existuje half-precision FP, od roku 2008 standardizovaný formát.

+1
+5
-1
Je komentář přínosný?

To nechávám na rozhodnutí PT uživatelů. Mně to taky připadne mírně neprozíravé si hiend ořezat o tyto funkce (proto mj. volím pro sebe AMD), avšak zelení evangelists toto bagatelizují a tvrdí, že "běžný uživatel" to nepotřebuje. ;-)

+1
-9
-1
Je komentář přínosný?

Bagatelizovať ako bagatelizovať. Keď som pár rokov dozadu tvrdil že majú NV grafiky výhodu práve v DP, tak mi vtedy červení evengelists tiež písali, že je to pre bežného používateľa na nič. A dnes sú z nich skoro všetci počtári a nedajú na to dopustiť. Pokiaľ má človek kartu iba na hranie, tak to má ďaleko väčší prínos PhysX ako podpora DP, ktorá sa bežne nikde nevyužíva. Môžem vedieť aký prínos to pre teba má pokiaľ je to jedna z vecí ktorá ťa presviedča ku kúpe grafiky od AMD?

+1
+13
-1
Je komentář přínosný?

...dokud aplikace schopné nějakou funkci využít neopustí laboratoře a nezačnou se prodávat v krabicích vedle Office na pultech, tak to pro běžného uživatele skutečně není k ničemu dobré.

+1
-9
-1
Je komentář přínosný?

Tak já to vezmu za sebe: jako zájmovou záležitost nechávám na pozadí běžet projekty BOINC ( http://boinc.berkeley.edu/ ) ...některé podporované projekty DP vyžadují. Protože nejsem až takový fanatik do DC, tak se jako majitel keplera takovým projektům zkrátka vyhnu. Bylo by to plýtvání elektrikou. S maxwellem to bude ještě horší. A při tom by mne ty projekty svým zaměřením zaujaly a fandím jim.

Osobně jsem pro ořezávání DP funkcí herních grafik. Šetří to energii, protože většina lidí to fakt nevyužívá. Ale pak bych také velmi ocenil mít možnost si koupit grafiku z paralelní řady, která DP plně podporuje - a tím nemyslím monstra za 20k+.

+1
+13
-1
Je komentář přínosný?

Problém je takový, že při takové konstelaci by taková karta s podporou DP stála nejspíše nejméně 10x tolik co stojí dnes.

+1
-3
-1
Je komentář přínosný?

Nemyslím. Nvidie 500 řady okleštěné nebyly a nestály 10x tolik, co karty konkurence. A vzhledem k tomu, že ta technologie se stejně vyvíjí tak nebo tak (profesionální segment a řada Titan,) jde čistě o úmysl marketingu nalepit na DP nálepku exkluzivity, za kterou se musí extra hóóódně připlácet.

Volalo se po snížení spotřeby. Byla nám dána. Ale za cenu, že pokud máte zájem o původní funkce, musíte vysolit 20k za Titana i kdybyste měli použití jen pro třetinu jeho výkonu.

+1
+8
-1
Je komentář přínosný?

Ale no tak. Opravdu někdo věří tomu, že za celou to efektivností stojí ořezání DP výkonu? Kolik si myslíte, že taková DP jednotka žere?

+1
+6
-1
Je komentář přínosný?

No asi se shodneme, že všechny jednotky jsou z tranzistorů takže bych rozhodně netvrdil, že ta žere více a ta žere méně. Přišli na to jak vypnout nepoužívané jednotky pro celočíselné operace, přijdou na to jak omezit tak u DP kvůli TDP - časem. A krom toho, daná scéna vyžaduje nějaký výpočetní výkon (nějaký počet výpočetních jednotek), kdežto DP benchmark žádné scény nemá. Tam je to prostě o tom kolik ta karta dá. Používané jsou všechny dostupné výpočetní zdroje stejně jako u CPU stress benchmarku. Jediný rozdíl je v tom, že u DP evidentně nezavedli podtaktování kvůli TDP. Podívejte se zde http://www.anandtech.com/show/8526/nvidia-geforce-gtx-980-review/21 co udělal s takty furmark aby se to vešlo do TDP (to je celočíselný stress test pro GPU)

+1
+5
-1
Je komentář přínosný?

Prozradím ti takovou maličkost. Víš čím se liší SP FP jednotka od DP FP jednotky? Zjednodušeně řečeno, šířkou registru. Jestli si opravdu myslíš, že primitivní registr o 32 bitů větší než u SP FP jednotky potřebuje miliony a miliony tranzistorů, tak tě asi zklamu.

+1
-8
-1
Je komentář přínosný?

Já jaksi nechápu smysl toho kolik žere, který registr a jestli je to DP anebo SP. Jako kdyby jsi byl schopný to doložit nějakými čísly. Poku ta karta počíta v DP není ošetřené TDP. Jinými slovy, věřím tomu, že v té situaci je aktivní celé jádro na max takt bez regulace.

+1
-2
-1
Je komentář přínosný?

A na tvou výše uvedenou otázku, zda za skutečně věřím, že za efektivností stojí ořezání DP: nevěřím. Věřím tomu, že za tím stojí deaktivace jednotek nebo celých částí jádra a ta anomálie, kterou změřili je ovlivněná tím, že inženýři nvidie ani nepočítali s tím, že někdo bude DP na 980 používat a neřešili v tomto režimu TDP.

+1
-5
-1
Je komentář přínosný?

A k čemu by také na herní kartě někdo používal FP výpočty s 64 bitovou přesností? Schválně, kolik znáš (třeba i profesionálních) SW, které používají DP FP výpočty?
Pokud si doma nepočítáš štěpnou reakci v jaderném reaktoru, tak nevidím důvod, proč bys měl mít DP v plném výkonu.

Internetem se šíří spousta fám. Například, že nVidia ořezala jádro. Jenomže ona ho neořezala, pouze se vypínají určité části, když nejsou potřeba. Potom také fámy o nutnosti mít DP pro GPGPU a o tom, jak na GeForce nejdou GPGPU výpočty.

+1
-5
-1
Je komentář přínosný?

I když DP beru jen jako přidanou hodnotu herní karty, schválně ti to povím:
Photoshop(http://www.tomshardware.com/reviews/photoshop-cs6-gimp-aftershot-pro,320...)?
VLC player (https://wiki.videolan.org/VLC_GPU_Decoding/)?
Maya(http://www.develop3d.com/blog/2014/08/amd-previews-opencl-ray-trace-rend...)?
Bude toho asi víc řekl bych, ale toto pro demonstraci podle mě stačí.

Edit: U toho VLC si nejsem jistý zda jde o GPGPU

+1
-9
-1
Je komentář přínosný?
+1
-2
-1
Je komentář přínosný?

Ptal jsem se na praktické aplikace, které masivně využívají FP výpočty s 64 bit přesností.

Něco mi říká, že Photoshop a VLC to nebude.

+1
-15
-1
Je komentář přínosný?

Co třeba ANSYS

+1
-5
-1
Je komentář přínosný?

Chceš mi povedať že photoshop, VLC potrebuje DP nedaj sa vysmiať.

+1
+3
-1
Je komentář přínosný?

Pro experty jako jste vy jsem připojil pohotově v návaznosti další příspěvek ;) Vtipné jak jsou někteří lidé předvídatelní :D

+1
+4
-1
Je komentář přínosný?

Sorry, bavili sme sa o praktických veciach pre ľudí a nie benchmarky. Praktické veci sú prehrávanie videa, úprava fotiek, hry a tu nikde DP nepotrebuješ. Proste kým NV mala jeden čip na všetko nikto DP nepotreboval a zrazu keď AMD prešlo na túto filozofiu tak všetci rátajú v DP, je to úsmevné

+1
+3
-1
Je komentář přínosný?

Víte co je úsměvné? :) Nikde jsem nenapsal, že je DP v herních kartách důležité. Napsal jsem, že to je přidaná hodnota, ale celou dobu jsem se vyjadřoval k tématu článku. Přesto se tady do mě obouváte a přesvědčujete jak je DP k ničemu (zcela mimo téma). Trollové všech zemí se spojili :D

+1
-5
-1
Je komentář přínosný?

Nikdo se do tebe neobouvá. Ta informace o hrách pravděpodobně byla jenom přidaná hodnota. Nic neměla vyvracet, 7R7 ti nic nevyčítal, ta informace měla jenom rozšiřovat tvoje obzory. Pokud si myslíš, že diskuze se vždy musí skládat z argumentu a protiargumentu a ničeho jiného, pak jsi asi nepochopil podstatu komunikace. Zatímco já chápu komunikaci jako prostředek pro výměnu informací, ty si chceš něco dokazovat. Místo toho, abys byl rád, že ses dozvěděl, že ve hrách se operace s dvojnásobnou přesností příliš nepoužívají, tak jsi 7R7 seřval, protože ty jsi nic o hrách neříkal.

+1
-1
-1
Je komentář přínosný?

Podstata komunikace? :D Možná tak podstata rčení: "jeden o voze druhej o koze" ;) Tyhle diskuze už jsem tu několikrát četl. Právě proto jsem prozřetelně upozornil co bude následovat: že se budete se točit na DP. A co se stalo? Točíte se na DP :D Trollíci jsou zábavné bytosti :) AMD upouští od DP v herních. Minulá generace GCN 1/4 a stávající 1/8. nvidia upouští od DP v herních G500 1/8, G600 1/24, G700/G900 1/32. Nevím co tu řešíte chlapci ;)

+1
+5
-1
Je komentář přínosný?

A abych projevil nějakou sebereflexi, asi vím čím jsem toto vlákno rozvířil. Namísto GPGPU jsem na začátku použil výraz DP. Ono se to občas dost často zaměňuje. Samozřejmě chybně. Jen mě zaráží, že nevíte jak jsou ty programy napsané, na jakém principu použité algoritmy fungují a s jakými čísly operují atp. Jen předpokládáte. Může tam být 32bitové číslo a zbytek nějaký hash nebo v případě nějakého velkého matrixu opravdu 64bit. A i 32bit číslo uložíte do 64bit (i když ne přiliš efektivně). Prostě nejsou podklady a možností je spousta takže obdivuji vaše přesvědčení.

+1
-3
-1
Je komentář přínosný?

"Ono se to občas dost často zaměňuje."

Pravda, občas to zaměňují lidé, co o tom nemají ani páru.

"Jen mě zaráží, že nevíte jak jsou ty programy napsané, na jakém principu použité algoritmy fungují a s jakými čísly operují atp. Jen předpokládáte."

Nepředpokládám, vím.

"Může tam být 32bitové číslo a zbytek nějaký hash nebo v případě nějakého velkého matrixu opravdu 64bit. A i 32bit číslo uložíte do 64bit (i když ne přiliš efektivně). Prostě nejsou podklady a možností je spousta takže obdivuji vaše přesvědčení."

Tak už mi to je jasné, ty o tom nevíš vůbec nic. Rozhodně se nebude vyplňovat vzniklá mezera nějaký hashem (proč? co by to mělo za účel?).

"A i 32bit číslo uložíte do 64bit"
Aha, takže třeba takový Céčkový int je na 64 bitových procesorech strašně neefektivní.
Já jenom kroutím hlavou.

+1
-8
-1
Je komentář přínosný?

Víš? Programoval jsi je? Pokud ne, ocekaval bych nejake odkazy. Dokud něco nedotlacis, varis z vody. Já přijímám podlozena fakta, ne famy.

Co to má proboha společného s 64bit CPU? Když plnis long jednocifernymi cisly tak to neni efektivní. Nebo ano? Opravdu nechápu co tu obhajujes.

:/ Nechal jsem se zase po dlouhe době zatahnout do nikam nevedouci diskuze mimo tema diskuznim trollem co tady akorat šťoura a slovickari..to oc tu běží ti unika takže pro mě je tato diskuze u konce.

+1
+3
-1
Je komentář přínosný?

Edit: jsem tam pohanil inženýry nvidie, ale on je to problém Gigabyte. Asi to nebude problém jádra jako spíš výrobce karty. Mám také Gigabyte a užil jsem si s ní své takže bych se tomu vůbec nedivil..

+1
-1
-1
Je komentář přínosný?

"Kolik si myslíte, že taková DP jednotka žere?"

Odhadem tak třikrát více, než SP jednotka, v závislosti na realizaci. (Samozřejmě čip grafické karty není celý pokryt FP jednotkami, takže tu přichází do hry Amdahlův zákon, resp. jeho zobecnění pro spotřebu, ale zase grafické karty jsou stavěné na vysokou výpočetní hustotu, takže jich mají vyšší podíl než CPU, a přitom zrovna prováděcí jednotky patří k hotspotům co do spotřeby.)

+1
+3
-1
Je komentář přínosný?

Odhadováno na základě čeho?

+1
-11
-1
Je komentář přínosný?

Ehm, na základě výpočetní složitosti příslušných operací? (V dnešní době typicky FMA.) Nezapomeňte, že SP má mantisu délky 23 bitů, DP má mantisu délky 52 bitů, což je poměr 2,26:1, a typická násobička začíná jednotkou, která škáluje kvadraticky s délkou slova, takže DP násobička pro ni potřebuje pětkrát více hradel (která spotřebovávají úměrně více energie).

Jinak třeba tady http://www.cpe.virginia.edu/grads/pdfs/Jan13/VLSI.pdf najdete porovnání návrhů s různými trade-offy, ale vychází to celkem konzistentně napříč plošnou hustotou spotřeby: jednotky s obdobnou "uchladitelností" vždy spotřebují na DP operace aspoň třikrát více energie než na stejný počet SP operací.

+1
+9
-1
Je komentář přínosný?

Pěkně odcitovaná Wikipedie.

Trojnásobná složitost byla možná tak, když se na 32 bitovém procesoru emulovalo 64 bit. Nativní DP jednotka je něco trochu jiného.

Neobjasnil jsem, proč jsem se ptal, z jaké kávové sedliny jsi vyvěštil trojnásobnou spotřebu. Dovol mi to napravit. Teorie je sice krásná věc, ale někdy je to až aproximovaná skutečnost. GTX Titan umožňuje zvolit počet používaných DP jednotek. A víš co? Testy spotřeby neodpovídají tvé teorii.

+1
-5
-1
Je komentář přínosný?

To si piš že ano. Delší registr = větší počet tranzistorů = více tranzistorů = větší spotřeba, protože i zavřený tranzistor (resp. polovodičový přechod) má nějaký ztrátový proud, sice malý, ale při počtu několika miliard to už jsou dost velká čísla.

Ten problém je prostě ten, že taková jednotka musí být ze své podstaty méně účinnější, než jednotka optimalizovaná pouze na výpočty single precision.

+1
+7
-1
Je komentář přínosný?

To ano. Ja jen řekl, ze to nema smysl resit. Kdyby to bylo jak pise gatg vyse tedy 3xvice, stale to nevychází. Poměr je 1/32 (predpokladejme ze i registry). Fajn z ohledu spotreby by to stouplo na reálných
3/32 a fp64 tedy navýší spotřebu všech registru o 6%. I kdyby byly vyuzity vsechny a spotrebu karty by tvořily jen registry, obavam se, ze to stejne nebude delat tech 110W navic. Ja vidim problém u vyrobce karty ve vypnuti nějakých regulacnich obvodu popr sw deaktivaci.. Samozrejme jen hadam, ale davalo by to vetsi smysl nez spotreba dp obvodu. Tuplem kdyz referencni to nevykazovala..

+1
+1
-1
Je komentář přínosný?

jenže podle mě to není tak, že GPU má nějaké "obvody" na DP a jiné na SP (zde pouze odhaduju), ale tak, že výpočetní jednotka "umí" zpracovat takto dlouhý registr - a právě toto se podepisuje na nižší účinnosti, jinými slovy: čím je ten poměr DP/SP větší, tím méně ty jednotky jsou pro DP optimalizovány (např. tak, že registr zpracují ve čtyřech cyklech, protože jejich interní registry jednotky neumí zpracovat tak dlouhé slovo). Tím mohou být v SP účinnější (např. 4x, jednoduše proto, že jich může být paralelně více, jednodušších a výše taktovaných) a naopak v DP pomalejší, takže nakonec (vynásobením zvýšení účinnosti v SP a snížením v DP) to dává těch 1/16 nebo 1/32.

Samozřejmě, toto je pouhá moje teorie, designu a konstrukci GPU se nevěnuji, mám jen jakési trosky znalostí, které jsem kdysi aktivně používal. :-)

+1
+3
-1
Je komentář přínosný?

Hm. Možné to je. Obvody dp jsem myslel ty registry(o kterých se tu mluvilo). Tak to řeknu ještě jinak, ať tam jsou jakékoli registry, za tou spotřebou stát podle mě nebudou :D

+1
+5
-1
Je komentář přínosný?

mas v tom chaos , ty nas AMD GURU :)

+1
-1
-1
Je komentář přínosný?

otazkou je kdo je onen "počtář", pac kuprikladu v bezne dostupnych appkach kde se vyuziva GPGPU se spotreba nezveda prilis nad tu "herni" a ona silena spotreba je dosahovana v cistych benchmarcich bez jineho uziti nez srovnavani v tabulkach, kuprikladu v Luxrendru (k vyzkouseni i jako benchmark Luxmark) kde se vyuziva OpenCL se spotreba zvysuje asi o 2-5% oproti tomu co se uvadi jako herni prumer, zrejme se tak vracime zpet do doby PowerVirů a cekal bych casem v ovladacich redukci ktera to proste v benchmarcich opet omezi tak jak si to pamatujeme u Fermi kde to take v ovladacich casem zasekli, v Luxrendru mam u GTX980 spotrebu cele sestavy s i7-2600k (4GHz) 308W (v Arionu kde jede naplno jen VGA a vypocet jde prez CUDA mam 278W), takze stezi si jen VGA vezme vice nez 200W, pritom mam oproti puvodnimu Titanovi (ne Black) score lepsi o cca 20% (cca 1400 ku 1700 samplum za sekundu)

ostatne tucne EDITy na odkazovanem TomsHardware se v tom duchu taky zminuji

+1
0
-1
Je komentář přínosný?

Tak me hlavne fascinuje ten "vyvoj" nazoru na GPU vypocty... :-)

V dobe, kdy to razila nVidia, tak nebylo vubec dulezite, protoze jsou tady prece profi karty, ted kdyz to razi AMD, tak se v podstate na hernich grafikach nehraje, ale kazdy stale "neco" pocita v DP... :-)))

+1
-4
-1
Je komentář přínosný?

No tak ono taky trvalo, než přišel software, třeba SPICE zřejmě dostal akceleraci relativně nedávno.

+1
0
-1
Je komentář přínosný?

SPICE na svoje výpočty využíva DP? Aby to nebolo tak, že potrebuje klasické FP jednotky, ktoré pokiaĺ viem nie sú u NV osekané...

+1
+9
-1
Je komentář přínosný?

No tak řeší se tam mj. velká soustava lineárních rovnic (sparse). Nevím o žádné implementaci SPICE, která by se spokojila s SP. Možná vyhodnocování modelů by šlo dělat v SP, ale se zvětšujícím se obvodem pokud vím jeho podíl na době výpočtu klesá (a malé obvody pochopitelně nikoho se zájmem o akceleraci nezajímají).

Mimochodem, DP není o nic méně "klasické" než SP - bylo standardizováno ve stejnou dobu.

+1
-5
-1
Je komentář přínosný?

Tak prakticke (aplikacne) vyuzitie GPGPU v GTX980/970 vobec nie je take tragicke, castokrat prekonava AMD 290X, niekedy je to vyrovnane, no najdu sa aj pripady, kedy je to naopak. V pripadoch akymi su napr. Luxmark, Particle Simulation, Face Detection etc. GTX980 zabije 290X do zeme. Taktiez je vyrazny medzigeneracny narast napr. v CUDA renderingu, CUDA miner ... a v zasade aj v OpenCL/GL.

Sumasumarum, zavisi od konkretnych aplikacii a vyuzita, ale v mnohych pripadoch sa ani v pripade GPGPU GTX980/970 nestrati, inde zase vynika 290X resp. z rovnakej stajne Titan.

Zdroje:

http://www.anandtech.com/show/8526/nvidia-geforce-gtx-980-review/20

http://goo.gl/iFJSs1

http://www.extremetech.com/computing/190463-nvidia-maxwell-gtx-980-and-g...

http://www.digit.in/pc-components/nvidia-geforce-gtx-980-review-23956.html

+1
+3
-1
Je komentář přínosný?

http://www.extremetech.com/computing/190463-nvidia-maxwell-gtx-980-and-g...

Zadupani do zeme bych cekal, ze 980 povede ale je to naopak.
Priste kdyztak nejaky jiny link.

+1
+3
-1
Je komentář přínosný?

A preco ste este neurobili test napr. GTX970/980 ? :)

+1
+4
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.