Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Exkluzivně: Bývalý marketingový šéf AMD šíří zkreslené specifikace Vegy

Je to jednoduché, AMD prostě lže a Forbes mluví pravdu.

VEGA je snad ještě větší fail, než HD 2900 XT.

+1
-5
-1
Je komentář přínosný?

:oDDD pobavilo, Much dneska perlí

+1
+9
-1
Je komentář přínosný?

Že by zhrzený zaměstnanec, který nedostal zlatého padáka, ale jen obyčejného padáka? :o)
Pokud má ten chlap takovou náturu a takové znalosti, tak se nedivím, že marketing AMD byl tak špatný.

+1
+6
-1
Je komentář přínosný?

AMD může být rádo, že jim dělá reklamu zadara.... Špatná reklama taky reklama :-D

+1
-2
-1
Je komentář přínosný?

A proto má Volta V100 v DP 7 TFLOPS a Instinct MI25 0,7 TFLOPS. Tak to mělo být myšleno, 1/16tina se rovná v podstatě nepodpoře. Ano, mohli ten čip vydat ve tvaru 1/2, ale rozhodli se bohužel takto. Instinct je podle mě stejnej čip jak jakákoli jiná Vega (a že jich máme).

+1
-2
-1
Je komentář přínosný?

Nebude to tím, že Volta má daleko více FP64 jednotek?
Když je výkon nativní, znamená to, že má přímo FP64 jednotky, čili není to emulováno na 2 FP32 jednotkách. Tedy pokud karta má 16x méně FP64 jednotek, než F32, pak je FP64 výkon 1/16 FP32 výkonu.
Tedy alespoň takto to funguje na nVidia kartách, pokud GCN funguje nějak razantně odlišně, pak mě někdo prosím opravte.

+1
+1
-1
Je komentář přínosný?

Ano, jen význam slova „nativní“ je přesně opačný. Nativní podpora je taková podpora, kdy architektura zvládá danou funkci realizovat sama o sobě bez potřeby dalšího koprocesoru (koprocesorů) či specializovaných obvodů, v tomto případě samostatných FP64 jednotek.

Nvidia u architektur Kepler, Maxwell, Pascal a Volta používá samostatné FP64 jednotky. AMD s GCN ne, pro FP64, FP32 i FP16 jsou používána tatáž výpočetní jádra a liší se jen výkon, ve kterém s danou přesností umějí počítat. V případě FP64 lze z nativního poměru 1/16 určitým rozšířením datových cest zvýšit poměr na 1/4 nebo 1/2.

+1
0
-1
Je komentář přínosný?

V Navi bych se to dokonce nebál nazvat FP512 (všech 16 SP v jednom CU), nicméně to zatím jaksi není. AMD pravděpodobně postupovala tak, že GCN 5 teoreticky navrhla odshora jako FP256, nicméně prakticky tam ten dodatečnej křemík není, resp. profi verzi nevydala (a nedá se použít ani slovo "zatím", asi v generaci Vega nebude). Zřejmě čeká na Navi GCN 6 a ono "mikroturbo", obě technologie spolu "symbioticky profitují", teď mi to slovo z ekonomie vypadlo.

Je to v podstatě konkurence pro AVX512, kde to Intel taky řeší všelijak zatím (jako 2x256 při nějaké rychlosti mezi poloviční a plnou kvůli přehřívání nebo co tam byl/je za problém). Musel bych si dohledat ty obrázky ke Skylake-S a Ryzenu, jak to tam bylo... 2x128bit na vlákno nebo jak.

+1
0
-1
Je komentář přínosný?

Pomer 1/16 me neprijde jako uplne nativni podpora, to musite uznat :) Aneb, kdyz si na x86 pustim QEMU, bude z toho x64 pocitac? (s JIT by to snad dopadlo i lepe nez 1/16 vykonu ;)

+1
-4
-1
Je komentář přínosný?

1/16 je nativní hodnota architektury. To člověk, který v AMD pracoval několik let na pozici marketingového vice-prezidenta pro HPC systémy, musí vědět. Mohli bychom se bavit o tom, jestli nechtěl namísto „native double-precision“ napsat „fast double-precision“, ale když v jedné větě zároveň napíše, že nepodporuje ECC paměti, tak jde teorie překlepu v podstatě do kytek.

+1
+7
-1
Je komentář přínosný?

Nechci tomu cloveku krivdit, ale nebyl by prvni ani posledni reditel marketinku v technologicke firme co nerozumi technologii, kterou se snazi prodavat.

+1
+8
-1
Je komentář přínosný?

Heh to mohu potvrdit, obvykle mají ekonomku a když se jim snažím vysvětlit co vlastně mají prodávat, tak se ani neobtěžují tomu porozumět a rovnou chtějí po vývojářích ať jim dodají sales prezentaci, ať jim to nacení atd. To pak ukáží zákazníkovi aniž by věděli co mu předávají a když se to náhodou zákazníkovi líbí a zajímá ho o čem to je, tak ho ten markeťák spojí rovnou s naším architektem, který už je schopen to technicky vysvětlit. No a když se pak uzavře kontrakt, tak si markeťák shrábne svou provizi a dodávku už zase odsrávají technici/vývojáři, kteří provizi nemají

+1
+7
-1
Je komentář přínosný?

Ked je to take easy tak preco nerobis marketaka.

+1
-3
-1
Je komentář přínosný?

třeba mě by to nebavilo, raději si užívám technické práce, nějaký prezentace a tabulky mě moc neberou

+1
+4
-1
Je komentář přínosný?

za nula prace mnoho penez, technicky zmyslajuci clovek vidi vyhody

+1
-3
-1
Je komentář přínosný?

Asi na to nema zaludek. Nebo je problem s pokerovou tvari - marketak bude rikat co ma a protoze nic nevi, nepoznas co je pravda a co lez.

+1
+1
-1
Je komentář přínosný?

musim uznat, ze vetsi blbost jsem uz davno necetl... zhruba od vcerejska ;) vyvozovat jestli je neco nativne implementovano z jeho vykonu, to chce odvahu :)))

+1
+3
-1
Je komentář přínosný?

Chce to udelat test - zda ty vykony plati SP+DP, nebo SP|DP, pak bude jasno :)

+1
-2
-1
Je komentář přínosný?

"profesionální analytická firma"

To bude ten takzvany oxymóron, ze ?

+1
+4
-1
Je komentář přínosný?

Moje zkusenost je takova, ze vetsina technicky schopnych novinaru a fandu silne prekracuje znalosti vetsiny "talking head" analytiku.

+1
+3
-1
Je komentář přínosný?

Podľa toho, od čoho je odvodený pojem

analytická firma
1. firma robiacia analýzy
2. firma, ktorá lezie zákaznikom do análneho otvoru..

+1
+7
-1
Je komentář přínosný?

však 1 a 2 můžeš spojit dohromady a říct rovnou, že provádí anal-lýzu :-)

+1
+2
-1
Je komentář přínosný?

A ani ne tak oxy jako spíš moron? ;)

+1
+2
-1
Je komentář přínosný?

Zdravím z AMD. ;) GCN vždycky podporuje DP, akorát ta rychlost je různá. Není pravda, že rychlost DP je vždy 1/16, to platí pouze pro některé instrukce a uvádí se to z toho důvodu, že to je horní mez. Jiné DP instrukce běží na 1/8 rychlosti. Např. sčítání jede na 1/8 a násobení jede na 1/16. Většina GCN karet to tak má, tedy rozmezí DP rychlosti je 1/8 - 1/16 podle instrukce. Výjimky jsou Tahiti a Hawaii, které mají DP 4x rychlejší, tedy rychlost je 1/2 - 1/4. Tyhle informace se dají (netriviálně) vyčíst ze zdrojovém kódu LLVM, kde máme open source kompilátor pro GCN.

+1
+7
-1
Je komentář přínosný?

A hadal bych ze tez z svnkove verze GCC :)

+1
0
-1
Je komentář přínosný?

Jo to je supr, a DP+SP vykon se tedy scita? (pokud je tedy vubec mozno vytvorit takovy program)

+1
0
-1
Je komentář přínosný?

Nevím to přesně, ale myslím, že se výkon nesčítá, tedy nejde využít SP jednotky, když se právě zpracovává DP instrukce.

+1
0
-1
Je komentář přínosný?

Ta architektura je dělaná tak, že tyhle skupiny instrukcí mohou být zpracovány paralelně:
- skalární instrukce (specialita GCN, pouze integer instrukce)
- vektorové instrukce (SP a DP)
- instrukce k přístupu do sdílené paměti
- instrukce k přístupu do hlavní paměti

Je tedy možno provést např. DP instrukci a zároveň skalární instrukci a zároveň instrukci pro čtení ze sdílené paměti a zároveň instrukci pro zápis do hlavní paměti. Není ale možno provést DP instrukci zároveň s jinou vektorovou instrukcí, která není DP.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.