Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Nový Titan X není herní karta, výpočty v Int8 podporuje rychleji než GP100

To jsou ty herni grafiky tedy zcela nevhodne na FP16 data? Jak muzou byt az 64x pomalejsi nez FP32?? Nedava me to smysl.. zatimco schema GP100 kde je to v pomeru k bitove sirce operandu chapu.

+1
0
-1
Je komentář přínosný?

Novinka GP100 (a asi i 102) je že nišší než 32-bit přesnost zvládá x krát rychleji, jinak to bylo 1:1 Tzn ano minimálně by to mělo být vždy 1:1, to že je to 1:64 je důvod SW omezení, které NV aplikuje aby člověk tyto výpočty nemohl provádět na herní grafice. To že tam vůbec jsou (ač extra slow) je jen z důvodu kompatibility. To samé FP64, i když jej to či ono jádro umí fast jediné GPU NV kde to nebylo ořezané byl GK110 Titan.

U AMD je to to samé. Poslední neořezané GPU kde i herní byla plně výpočetně silná bylo Tahiti. Od Hawaii to i AMD řeže stejnym stylem.

+1
+4
-1
Je komentář přínosný?

Tohle vysvětlení, proč je FP16 tak pomalé, neberu, musí v tom být něco jiného.

+1
-4
-1
Je komentář přínosný?

Je to jak jsem řekl, jedná se o SW omezení. Omezovač na 1:64 NV používá už dlouho a u více produktů.

+1
+2
-1
Je komentář přínosný?

Není to jak řekl. Ale není daleko od pravdy. Nové herní Pascaly mají v každém skupine 1 hardwarovou(!) FP16x2 jednotku pro potřebu kompatibility (na 128 FP32 jednotek). Tedy i když by z pohledu výkonu bylo lepší využít klasickou FP32 a jen "povýšit" FP16 výpočet na FP32(jak to dělá třeba maxwell), tak se toho nevyužívá. Podrobněji viz: http://www.anandtech.com/show/10325/the-nvidia-geforce-gtx-1080-and-1070...

+1
+2
-1
Je komentář přínosný?

Ne tak docela - co se tyce DP, zhruba od druhe generace 28nm produktu to vyrobci zacali orezavat i v hardwaru. Tzn, Tahiti ma jeste pomer FP:DP jednotek 1:4, Hawaii melo tusim 1:8 a novejsi maji jeste mene. Bylo to vicemene nutne, protoze pokud chteli na 28nm pozdejsich generacich dosahnout vyssi vykon, jinak nez vyhazenim malo pouzivanych casti to moc neslo.

Ale je pravda ze uz davno pred 28nm to Nvidie orezavala softwarove, v ovladaci. Jestli je FP16 orezano HW nebo SW ale netusim (neprekvapilo by me ani jedno).

+1
0
-1
Je komentář přínosný?

Hawaii má DP1/2 Tahiti 1/3. Ale Hawaii má u Radeonů SW ořez, pokud chceš DP musíš koupit Firepro. HW slabá v DP byla z velkejch čipů až Fiji, a Nvidia GM200 také.

+1
0
-1
Je komentář přínosný?

"HW slabá v DP byla z velkejch čipů až Fiji, a Nvidia GM200 také."

a obojí z důvodů limitace 28nm výrobním procesem, protože původně měly být oba čipy na 20nm.

+1
0
-1
Je komentář přínosný?

Asi nelze předpokládat, že při použití 256 barev bude 4x větší FPS :-)

+1
+1
-1
Je komentář přínosný?

GP100 určitě podporu instrukcí nad Int8 bude mít. NVidia ji jen pravděpodobně nezmiňuje, protože má stejnou rychlost jako instrukce nad Int32 nebo Int64 (tedy 1:1:1).

+1
0
-1
Je komentář přínosný?

"U Tesly P100 (resp. jádra GP100) je to obzvlášť překvapivé vzhledem k inzerování karty jakožto produktu pro strojové učení a neurální sítě."

Teda nevím, k čemu vám zrova v těchhle dvou oblastech budou osmibitová celá čísla k něčemu dobrá, takže mě naopak nijak nepřekvapuje, že zrovna tohle uřízli.

+1
0
-1
Je komentář přínosný?

Budou dobrá k tomu, že v int8 se počítá v reálu častějc jako s 8mi booleanovskýma hodnotama true/false. Jde s tím pak efektivně zacházet než mít tísíce booleanů (nebo taková pole). Datové (síťové) proudy, přebalování protokolů, rozhodování, indexery atd.

+1
+2
-1
Je komentář přínosný?

Tak na to první snad už Maxwell měl instrukce typu LOP3.LUT, plus logické operace s poli bitů by neměly být ovlivněny šířkou "packed" aritmetiky - fungují úplně stejně. Pokud jde o síťové proudy a protokoly, to by snad dávalo smysl, ale to jsou zrovna oblasti, kde už aspoň dvacet let frčí zakázkový křemík. Rozhodování, viz výše. Indexování je zajímavá oblast, ale tam historicky docela dobře fungovalo použití slov větší délky jako balených bitů, protože spousta operací byla logická, nikoli aritmetická, takže rozdíl v délce slova není podstatný. No dobrá, možná tak SAD je použitelná operace pro tyhle věci.

+1
0
-1
Je komentář přínosný?

No né, tak oni asi mají zpětnou vazbu z obrovské CUDA komunity, že zrovna tyto výpočty chroustají, tak to místo, který by zabíraly pipeliny o šířce 16bit, udělali 2x víc pipeline po osmi bitech, stejně tak ušetřili na 64bit šířkách a shrnuli to na slušnou podporu fp32 (což bych si tipl je dostačující přesnost pro každýho, kdo nepočítá kvantově mechanické fluktuace apod. psycha. Takže si to představ jako nádraží, kde uvolnili místo po kolejích 4x větší šířky a nasázeli tam radši 4 uzkokolejky nezávisle. S hrama to opravdu nesouvisí, nicméně shodou okolností je to ani nijak nepenalizuje, ber to jako ještě lepší Titan X (časté výpočty ok, hry stále superok). Ne jak v hrách byla 980ti pomalejší než Titan, ted to asi nebude už ten případ - 1080ti už bude i tak slabší.

+1
+2
-1
Je komentář přínosný?

Přidat podporu polovičních integerů je dost určitě jednodušší než přidat podporu polovičních FP hodnot. Třeba u sčítání je to víceméně otázka gatování přenosu na správných místech uprostřed stávajících slov a logické operace jsou dokonce beze změny. A protože i pouze 16b FP jednotka je pořád ještě složitější než 16b celočíselná jednotka, téměř úplné vynechání samostatného 16b FP hardware jim muselo dost ušetřit.

+1
+1
-1
Je komentář přínosný?

Jo a ten komentář ber jako tak, že tam, kam ta karta marketingově půjde, je strojové učení zrovna hype (neuronové sítě pracují s booleanama). Kolik hráčů si to koupí na hraní... tak 5 % bych tipl, ne-li procento kvůli datovejm centrům atd.

+1
+1
-1
Je komentář přínosný?

"neuronové sítě pracují s booleanama"

No právě že ne. :D Dokonce i inference musí být vícehodnotová, jinak to nemá smysl.

+1
+1
-1
Je komentář přínosný?

jeste pred 4 dny herni byla, pozitri zase bude...

+1
+6
-1
Je komentář přínosný?

Výrobca sa zrazu divý a dôrazne odmieta to, že weby ktoré sa zaoberajú testami, zaradili Titan X ako hernú kartu. A pritom je to práve Nvidia ktorá narobila v označovaní svojich grafík dokonalý chaos.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.