6. 4. 2016 - 12:02https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuseCo že se na konci článku porovnává? :)https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse#comment-874674
+
6. 4. 2016 - 17:18https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuseCo to je "DL TOPS"? Má to snad něco společného s http://www.urbandictionary.com/define.php?term=DL a http://www.urbandictionary.com/define.php?term=A+top ? A proč jich k té kartě dostanu hned čtyřiadvacet? A to všichni přijedou jednou dodávkou?https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse#comment-874697
+
DL TOPS znamená deep-learning tera-OPS (OPS = operations per second). Je to v podstatě obdoba pro TFLOPS, ale přesněji definovaná. Pro deep-learning algoritmy stačí přesnost Int8, se kterou Pascal umí pracovat několikanásobně rychleji. Proto jde o 4× vyšší číslo než standardní výkon udávaný v TFLOPS.
+1
-3
-1
Je komentář přínosný?
DL TOPS znamená deep-learning
no-X https://diit.cz/autor/no-x
7. 4. 2016 - 00:12https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuseDL TOPS znamená deep-learning tera-OPS (OPS = operations per second). Je to v podstatě obdoba pro TFLOPS, ale přesněji definovaná. Pro deep-learning algoritmy stačí přesnost Int8, se kterou Pascal umí pracovat několikanásobně rychleji. Proto jde o 4× vyšší číslo než standardní výkon udávaný v TFLOPS.https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse#comment-874755
+
V tom případě je dobré takovéto neologismy nejprve definovat, než jsou použity. Jako v učebnici. ;) Ba co více, tvrzení, že se jedná o "v podstatě obdobu pro TFLOPS, ale přesněji definovanou" vůbec nedává smysl, protože žádné standardní "deep-learning ops" neexistují. To se už třeba LIPS (logical inferences per second) blahé paměti jeví jako lépe definovaná jednotka. Stejně tak ani nutně nedává smysl, že by výkon v 8b celých číslech měl nutně být přesně čtyřikrát vyšší než FP výkon (v single precision?). Jednak prováděcích jednotek pro celá čísla může být jiný počet než pro plovoucí řádovou čárku, jednak na reálnou propustnost může mít vliv reálné chování logiky řazení instrukcí, a v neposlední řadě u "výpočetně hustých" architektur bude mít velký vliv skutečný příkon prováděcích jednotek. Už i AVX prý snižuje takty na intelovských CPU (které stále nemají takovou hustotu prováděcích jednotek jako GPU), aby se spotřeba vešla do limitů uchladitelnosti. A třeba čtyři součty osmibitových celých čísel spotřebují méně energie než součet dvou single precision desetinných čísel (kde se ošetřuje spousta věcí navíc, výsledek se normalizuje apod.).
+1
-4
-1
Je komentář přínosný?
V tom případě je dobré
Gath G https://diit.cz/profil/ggeal
7. 4. 2016 - 16:09https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuseV tom případě je dobré takovéto neologismy nejprve definovat, než jsou použity. Jako v učebnici. ;) Ba co více, tvrzení, že se jedná o "v podstatě obdobu pro TFLOPS, ale přesněji definovanou" vůbec nedává smysl, protože žádné standardní "deep-learning ops" neexistují. To se už třeba LIPS (logical inferences per second) blahé paměti jeví jako lépe definovaná jednotka. Stejně tak ani nutně nedává smysl, že by výkon v 8b celých číslech měl nutně být přesně čtyřikrát vyšší než FP výkon (v single precision?). Jednak prováděcích jednotek pro celá čísla může být jiný počet než pro plovoucí řádovou čárku, jednak na reálnou propustnost může mít vliv reálné chování logiky řazení instrukcí, a v neposlední řadě u "výpočetně hustých" architektur bude mít velký vliv skutečný příkon prováděcích jednotek. Už i AVX prý snižuje takty na intelovských CPU (které stále nemají takovou hustotu prováděcích jednotek jako GPU), aby se spotřeba vešla do limitů uchladitelnosti. A třeba čtyři součty osmibitových celých čísel spotřebují méně energie než součet dvou single precision desetinných čísel (kde se ošetřuje spousta věcí navíc, výsledek se normalizuje apod.).https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse#comment-874810
+
8. 4. 2016 - 15:51https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse„V tom případě je dobré takovéto neologismy nejprve definovat, než jsou použity. Jako v učebnici. ;)“
V tom případě je třeba si tu učebnici číst od začátku a ne až od poloviny ;-)
http://diit.cz/clanek/pascal-podporuje-int8https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse#comment-874934
+
Článek bohužel neodkazoval na předchozí díl, nebo jsem si toho alespoň nevšiml. Za doplnění ale děkuji.
+1
+1
-1
Je komentář přínosný?
Článek bohužel neodkazoval na
Gath G https://diit.cz/profil/ggeal
8. 4. 2016 - 15:58https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuseČlánek bohužel neodkazoval na předchozí díl, nebo jsem si toho alespoň nevšiml. Za doplnění ale děkuji.https://diit.cz/clanek/nvidia-denver-2-pascal-v-px2/diskuse#comment-874937
+
Co že se na konci článku porovnává? :)
Co to je "DL TOPS"? Má to snad něco společného s http://www.urbandictionary.com/define.php?term=DL a http://www.urbandictionary.com/define.php?term=A+top ? A proč jich k té kartě dostanu hned čtyřiadvacet? A to všichni přijedou jednou dodávkou?
DL TOPS znamená deep-learning tera-OPS (OPS = operations per second). Je to v podstatě obdoba pro TFLOPS, ale přesněji definovaná. Pro deep-learning algoritmy stačí přesnost Int8, se kterou Pascal umí pracovat několikanásobně rychleji. Proto jde o 4× vyšší číslo než standardní výkon udávaný v TFLOPS.
V tom případě je dobré takovéto neologismy nejprve definovat, než jsou použity. Jako v učebnici. ;) Ba co více, tvrzení, že se jedná o "v podstatě obdobu pro TFLOPS, ale přesněji definovanou" vůbec nedává smysl, protože žádné standardní "deep-learning ops" neexistují. To se už třeba LIPS (logical inferences per second) blahé paměti jeví jako lépe definovaná jednotka. Stejně tak ani nutně nedává smysl, že by výkon v 8b celých číslech měl nutně být přesně čtyřikrát vyšší než FP výkon (v single precision?). Jednak prováděcích jednotek pro celá čísla může být jiný počet než pro plovoucí řádovou čárku, jednak na reálnou propustnost může mít vliv reálné chování logiky řazení instrukcí, a v neposlední řadě u "výpočetně hustých" architektur bude mít velký vliv skutečný příkon prováděcích jednotek. Už i AVX prý snižuje takty na intelovských CPU (které stále nemají takovou hustotu prováděcích jednotek jako GPU), aby se spotřeba vešla do limitů uchladitelnosti. A třeba čtyři součty osmibitových celých čísel spotřebují méně energie než součet dvou single precision desetinných čísel (kde se ošetřuje spousta věcí navíc, výsledek se normalizuje apod.).
„V tom případě je dobré takovéto neologismy nejprve definovat, než jsou použity. Jako v učebnici. ;)“
V tom případě je třeba si tu učebnici číst od začátku a ne až od poloviny ;-)
http://diit.cz/clanek/pascal-podporuje-int8
Článek bohužel neodkazoval na předchozí díl, nebo jsem si toho alespoň nevšiml. Za doplnění ale děkuji.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.