Ještě by to (pro nás líne) chtělo (aspoň přibližné) cenové srovnání všech řešení.
+1
-1
-1
Je komentář přínosný?
Ještě by to (pro nás líne)
corwin78 https://diit.cz/profil/corwin78
4. 6. 2013 - 15:10https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseJeště by to (pro nás líne) chtělo (aspoň přibližné) cenové srovnání všech řešení.https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656375
+
To je dost těžké. Na jedné straně jsou oficiální doporučené ceny, na druhé maloobchodní ceny pro jednotlivce a třetí věc pak jsou reálné ceny, za které se tyto produkty prodávají velkým korporacím (ty jsou většinou pro veřejnost neznámé). Pokud vezmu ceny pro jednotlivce z newegg, tak FirePro W9000 stojí $3399, Tesla K20 $3499 a Phi nikde nemají, respektive jsem našel Phi 5110P pouze v nabídce HP za $4099.
+1
-3
-1
Je komentář přínosný?
To je dost těžké. Na jedné
no-X https://diit.cz/autor/no-x
4. 6. 2013 - 15:17https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseTo je dost těžké. Na jedné straně jsou oficiální doporučené ceny, na druhé maloobchodní ceny pro jednotlivce a třetí věc pak jsou reálné ceny, za které se tyto produkty prodávají velkým korporacím (ty jsou většinou pro veřejnost neznámé). Pokud vezmu ceny pro jednotlivce z newegg, tak FirePro W9000 stojí $3399, Tesla K20 $3499 a Phi nikde nemají, respektive jsem našel Phi 5110P pouze v nabídce HP za $4099.https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656378
+
A není špatný výkon Phi daný neoptimalizovaným kompilátorem?
+1
-1
-1
Je komentář přínosný?
A není špatný výkon Phi daný
John Douberro https://diit.cz/profil/john-douberro
4. 6. 2013 - 15:37https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseA není špatný výkon Phi daný neoptimalizovaným kompilátorem?https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656379
+
4. 6. 2013 - 15:45https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseTo v tuhle chvíli ví s jistotou asi jen Intel.https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656380
+
Výsledky toho testu vypovídají pouze o tom, že mezi jednotlivými implementace OpenCL jsou tak velké rozdíly, že stejně musíte program psát na míru hardware, který máte k dispozici.
+1
-5
-1
Je komentář přínosný?
Výsledky toho testu
Jack FX https://diit.cz/profil/jackfx
4. 6. 2013 - 17:14https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseVýsledky toho testu vypovídají pouze o tom, že mezi jednotlivými implementace OpenCL jsou tak velké rozdíly, že stejně musíte program psát na míru hardware, který máte k dispozici. https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656396
+
JJ je to tak. OpenCL bohužel své poslání jakožnto univerzální API co sjednotí GPGPU aby se mohlo konečně v praxi začít používat v běžném SW selhává. Nvidia totaké sabotuje protože schválně pro něj vůbec neoptimalizuje a schválně ani nepodporuje jeno novější verze aby tlačila svou cudu.
A když už dojde na lámání chleba a specifické alikace kde se ty GPU fakt vplatěj, tak se musí jednat o kód psanej přímo na architekturu konkrétního GPU. Ne "OpenCL standard", jinak je to těžce neefektivní. Ani najde o jednotlivé tábory, zpětná komptibilita znavna moc nefrčí, co šlo efektivně naobře Cypress VLIW nejde tak dobře na GCN. A zdaleka ne ve všech aspektech jde výkon dopředu.
Lidi co přes OpenCL těží různé coiny by mohli vyprávět.
Takže v praxi člověk stejně zvolí toho kdo mu dá nejlepší support a nejlepší compiler. Protože SW bude tak jako tak muset bejt optimalizovanej pro konkrétní železo, takže už je pak fuk jestli je to OpenCL Cuda nebo x86 C++ že.... to že to ude v OpenCL nic nepřináší, stejně to na jiném HW použitelné nebude.
+1
-3
-1
Je komentář přínosný?
JJ je to tak. OpenCL bohužel
j j https://diit.cz/profil/doczenith
4. 6. 2013 - 17:33https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseJJ je to tak. OpenCL bohužel své poslání jakožnto univerzální API co sjednotí GPGPU aby se mohlo konečně v praxi začít používat v běžném SW selhává. Nvidia totaké sabotuje protože schválně pro něj vůbec neoptimalizuje a schválně ani nepodporuje jeno novější verze aby tlačila svou cudu.
A když už dojde na lámání chleba a specifické alikace kde se ty GPU fakt vplatěj, tak se musí jednat o kód psanej přímo na architekturu konkrétního GPU. Ne "OpenCL standard", jinak je to těžce neefektivní. Ani najde o jednotlivé tábory, zpětná komptibilita znavna moc nefrčí, co šlo efektivně naobře Cypress VLIW nejde tak dobře na GCN. A zdaleka ne ve všech aspektech jde výkon dopředu.
Lidi co přes OpenCL těží různé coiny by mohli vyprávět.
Takže v praxi člověk stejně zvolí toho kdo mu dá nejlepší support a nejlepší compiler. Protože SW bude tak jako tak muset bejt optimalizovanej pro konkrétní železo, takže už je pak fuk jestli je to OpenCL Cuda nebo x86 C++ že.... to že to ude v OpenCL nic nepřináší, stejně to na jiném HW použitelné nebude. https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656399
+
Stale je ale jednodusi portovat jiz hotovy a do jiste miry funkcni kod (jinymi slovy pouze optimalizovat pro ruzny hardware) nez to cele prepisovat na jinou platformu. Samozrejme tez zalezi na samotnem algoritmu, ktery paralelizujes. Pokud je to neco vhodneho pro CPU, tak ti samozrejme nezbude nic jineho nez ho prepisovat (i na jedne platforme), protoze ti to na jinem zeleze (GPU) pojede naprosto otresne, ale to je pochopitelne a zadna Cuda, nebo C++ a OpenMP apod. to taky neresi, psat pro konkretni hardware budes muset v kazdem pripade. OpenCL je ale ve vysledku porad to nejlepsi reseni jak mit kod prenositelny mezi ruznym HW, ikdyz jen v urcitych mezich.
+1
-2
-1
Je komentář přínosný?
Stale je ale jednodusi
Solitary https://diit.cz/profil/solitary
5. 6. 2013 - 00:09https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseStale je ale jednodusi portovat jiz hotovy a do jiste miry funkcni kod (jinymi slovy pouze optimalizovat pro ruzny hardware) nez to cele prepisovat na jinou platformu. Samozrejme tez zalezi na samotnem algoritmu, ktery paralelizujes. Pokud je to neco vhodneho pro CPU, tak ti samozrejme nezbude nic jineho nez ho prepisovat (i na jedne platforme), protoze ti to na jinem zeleze (GPU) pojede naprosto otresne, ale to je pochopitelne a zadna Cuda, nebo C++ a OpenMP apod. to taky neresi, psat pro konkretni hardware budes muset v kazdem pripade. OpenCL je ale ve vysledku porad to nejlepsi reseni jak mit kod prenositelny mezi ruznym HW, ikdyz jen v urcitych mezich.https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656418
+
rozhodne mate pravdu, ale presto mi prijde dobre, ze OpenCL existuje, protoze muzu napsat nekaou aplikaci a ta pojede na skoro libovolnem HW a bude porad radove rychlejsi, nez kdyby jela na samotnem CPU. dokonce pojede i bez jakekoli akcelerace. takova moznost tu drive nebyla. Nebo je mozne ty ruzne optimalizace zakomponovat do toho kodu a konkretni HW detekovat nebo prepipat v tom SW, stejne jako se detekuje SSEx a pod.
+1
-4
-1
Je komentář přínosný?
rozhodne mate pravdu, ale
super master https://diit.cz/profil/walkeer
5. 6. 2013 - 08:43https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuserozhodne mate pravdu, ale presto mi prijde dobre, ze OpenCL existuje, protoze muzu napsat nekaou aplikaci a ta pojede na skoro libovolnem HW a bude porad radove rychlejsi, nez kdyby jela na samotnem CPU. dokonce pojede i bez jakekoli akcelerace. takova moznost tu drive nebyla. Nebo je mozne ty ruzne optimalizace zakomponovat do toho kodu a konkretni HW detekovat nebo prepipat v tom SW, stejne jako se detekuje SSEx a pod.https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656430
+
nastesti nakupy těchto karet se neridi benchmarky, ten kdo takovou kartu/y vyuzije a zvazuje jejich nakup, je povětšinou někdo kdo tomu asi rozumi a presne vi co potřebuje :)
+1
-1
-1
Je komentář přínosný?
nastesti nakupy těchto karet
SamanCZ (neověřeno) https://diit.cz
4. 6. 2013 - 16:04https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskusenastesti nakupy těchto karet se neridi benchmarky, ten kdo takovou kartu/y vyuzije a zvazuje jejich nakup, je povětšinou někdo kdo tomu asi rozumi a presne vi co potřebuje :)https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656381
+
Já si myslím, že problém s hodnocením této karty je jinde. Její hlavní výhodou je možnost paralelně provádět 240 (4×SMT na ±60 jádrech) odlišných algoritmů, s komplikovaným větvením a skoky. To je něco, co je pro GPU problém.
Otázka je, existují takové úlohy?
Na úrovni OS a mezi klasickými serverovými procesy určitě ano. Pak je ale problém v tom, že karta musí být ládována daty přes rozhraní alá OpenGL a ne přímo schedulerem operačního systému jako klasická ALU. Skoro jako stvořené pro legacy Apache/PHP a miliardy řádků skriptů, kde není vůle je přepsat.
+1
-1
-1
Je komentář přínosný?
Já si myslím, že problém s
Jan Ringoš https://diit.cz/profil/tringi
4. 6. 2013 - 16:24https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuseJá si myslím, že problém s hodnocením této karty je jinde. Její hlavní výhodou je možnost paralelně provádět 240 (4×SMT na ±60 jádrech) odlišných algoritmů, s komplikovaným větvením a skoky. To je něco, co je pro GPU problém.
Otázka je, existují takové úlohy?
Na úrovni OS a mezi klasickými serverovými procesy určitě ano. Pak je ale problém v tom, že karta musí být ládována daty přes rozhraní alá OpenGL a ne přímo schedulerem operačního systému jako klasická ALU. Skoro jako stvořené pro legacy Apache/PHP a miliardy řádků skriptů, kde není vůle je přepsat.
https://diit.cz/clanek/intel-larrabee-xeon-phi-clbenchmark/diskuse#comment-656391
+
Ještě by to (pro nás líne) chtělo (aspoň přibližné) cenové srovnání všech řešení.
To je dost těžké. Na jedné straně jsou oficiální doporučené ceny, na druhé maloobchodní ceny pro jednotlivce a třetí věc pak jsou reálné ceny, za které se tyto produkty prodávají velkým korporacím (ty jsou většinou pro veřejnost neznámé). Pokud vezmu ceny pro jednotlivce z newegg, tak FirePro W9000 stojí $3399, Tesla K20 $3499 a Phi nikde nemají, respektive jsem našel Phi 5110P pouze v nabídce HP za $4099.
A není špatný výkon Phi daný neoptimalizovaným kompilátorem?
To v tuhle chvíli ví s jistotou asi jen Intel.
Výsledky toho testu vypovídají pouze o tom, že mezi jednotlivými implementace OpenCL jsou tak velké rozdíly, že stejně musíte program psát na míru hardware, který máte k dispozici.
JJ je to tak. OpenCL bohužel své poslání jakožnto univerzální API co sjednotí GPGPU aby se mohlo konečně v praxi začít používat v běžném SW selhává. Nvidia totaké sabotuje protože schválně pro něj vůbec neoptimalizuje a schválně ani nepodporuje jeno novější verze aby tlačila svou cudu.
A když už dojde na lámání chleba a specifické alikace kde se ty GPU fakt vplatěj, tak se musí jednat o kód psanej přímo na architekturu konkrétního GPU. Ne "OpenCL standard", jinak je to těžce neefektivní. Ani najde o jednotlivé tábory, zpětná komptibilita znavna moc nefrčí, co šlo efektivně naobře Cypress VLIW nejde tak dobře na GCN. A zdaleka ne ve všech aspektech jde výkon dopředu.
Lidi co přes OpenCL těží různé coiny by mohli vyprávět.
Takže v praxi člověk stejně zvolí toho kdo mu dá nejlepší support a nejlepší compiler. Protože SW bude tak jako tak muset bejt optimalizovanej pro konkrétní železo, takže už je pak fuk jestli je to OpenCL Cuda nebo x86 C++ že.... to že to ude v OpenCL nic nepřináší, stejně to na jiném HW použitelné nebude.
Stale je ale jednodusi portovat jiz hotovy a do jiste miry funkcni kod (jinymi slovy pouze optimalizovat pro ruzny hardware) nez to cele prepisovat na jinou platformu. Samozrejme tez zalezi na samotnem algoritmu, ktery paralelizujes. Pokud je to neco vhodneho pro CPU, tak ti samozrejme nezbude nic jineho nez ho prepisovat (i na jedne platforme), protoze ti to na jinem zeleze (GPU) pojede naprosto otresne, ale to je pochopitelne a zadna Cuda, nebo C++ a OpenMP apod. to taky neresi, psat pro konkretni hardware budes muset v kazdem pripade. OpenCL je ale ve vysledku porad to nejlepsi reseni jak mit kod prenositelny mezi ruznym HW, ikdyz jen v urcitych mezich.
rozhodne mate pravdu, ale presto mi prijde dobre, ze OpenCL existuje, protoze muzu napsat nekaou aplikaci a ta pojede na skoro libovolnem HW a bude porad radove rychlejsi, nez kdyby jela na samotnem CPU. dokonce pojede i bez jakekoli akcelerace. takova moznost tu drive nebyla. Nebo je mozne ty ruzne optimalizace zakomponovat do toho kodu a konkretni HW detekovat nebo prepipat v tom SW, stejne jako se detekuje SSEx a pod.
nastesti nakupy těchto karet se neridi benchmarky, ten kdo takovou kartu/y vyuzije a zvazuje jejich nakup, je povětšinou někdo kdo tomu asi rozumi a presne vi co potřebuje :)
Já si myslím, že problém s hodnocením této karty je jinde. Její hlavní výhodou je možnost paralelně provádět 240 (4×SMT na ±60 jádrech) odlišných algoritmů, s komplikovaným větvením a skoky. To je něco, co je pro GPU problém.
Otázka je, existují takové úlohy?
Na úrovni OS a mezi klasickými serverovými procesy určitě ano. Pak je ale problém v tom, že karta musí být ládována daty přes rozhraní alá OpenGL a ne přímo schedulerem operačního systému jako klasická ALU. Skoro jako stvořené pro legacy Apache/PHP a miliardy řádků skriptů, kde není vůle je přepsat.
chybiska se vloudila?
Sum (GAA) 2 843 570 2,0 %
Díky za upozornění, překlep opraven.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.