Takže to vypadá, že grafiku se zavrhli, tak co s načatou včelkou Májou (Larra Bee) :)
+1
+1
-1
Je komentář přínosný?
Takže to vypadá, že grafiku
Ondar https://diit.cz/profil/ondar007
20. 8. 2012 - 13:43https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseTakže to vypadá, že grafiku se zavrhli, tak co s načatou včelkou Májou (Larra Bee) :)https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630425
+
Tak to vyzerá, že Intel už opúšťa aj klasické binárne násobky v štruktúre chipov
"...61 výpočtových blokov..."
"...zvýši až na 62..."
To čo sú za počty boha jeho?!
+1
-1
-1
Je komentář přínosný?
Tak to vyzerá, že Intel už
kypec https://diit.cz/profil/kypec
20. 8. 2012 - 14:33https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseTak to vyzerá, že Intel už opúšťa aj klasické binárne násobky v štruktúre chipov
"...61 výpočtových blokov..."
"...zvýši až na 62..."
To čo sú za počty boha jeho?!https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630432
+
VR-Zone tvrdí, že 62 je maximum, co fyzicky nese čip, ale to číslo je tak nekulaté, že jsem ten údaj radši nepřebíral, dokud se nepotvrdí i z jiných zdrojů.
+1
0
-1
Je komentář přínosný?
VR-Zone tvrdí, že 62 je
no-X https://diit.cz/autor/no-x
20. 8. 2012 - 14:51https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseVR-Zone tvrdí, že 62 je maximum, co fyzicky nese čip, ale to číslo je tak nekulaté, že jsem ten údaj radši nepřebíral, dokud se nepotvrdí i z jiných zdrojů.https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630434
+
kypec: Asi jich mají fyzicky 64 a tvrdě pracují na snížení zmetkovosti.
+1
0
-1
Je komentář přínosný?
kypec: Asi jich mají fyzicky
PV https://diit.cz/profil/pv
20. 8. 2012 - 14:37https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskusekypec: Asi jich mají fyzicky 64 a tvrdě pracují na snížení zmetkovosti.https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630433
+
20. 8. 2012 - 14:59https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskusetaky mi to tak připadáhttps://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630435
+
Jednoznačná výhoda Phi bude ta kompatibilita - přecijen je to víceméně x86 procesor, takže skutečně stačí znovu zkompilovat zdrojový kód (ti, jenž jej zahodili si budou trhat vlasy) pro novou architekturu a všechno může pokračovat. Na tomhle CUDA (ta už je trochu v pohybu) a Steam troskotá.
+1
0
-1
Je komentář přínosný?
Jednoznačná výhoda Phi bude
Tomáš Bohuněk https://diit.cz/profil/tomas-bohunek
20. 8. 2012 - 16:07https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseJednoznačná výhoda Phi bude ta kompatibilita - přecijen je to víceméně x86 procesor, takže skutečně stačí znovu zkompilovat zdrojový kód (ti, jenž jej zahodili si budou trhat vlasy) pro novou architekturu a všechno může pokračovat. Na tomhle CUDA (ta už je trochu v pohybu) a Steam troskotá.https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630442
+
Jak jste na tohle prosimvás přišel? Instrukční sada je dnes zcela irelevantní, protože stejně nikdo nepíše kód v asembleru. Pokud pouze zkompilujete kód pro Phi, poběží 10x pomaleji než na CPU, protože poběží v jednom vlákně. Hlavní problém je spíš v úpravě algoritmu, tak aby mohl běžet ve více vláknech.
+1
+1
-1
Je komentář přínosný?
Jak jste na tohle prosimvás
Jack FX https://diit.cz/profil/jackfx
20. 8. 2012 - 16:54https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseJak jste na tohle prosimvás přišel? Instrukční sada je dnes zcela irelevantní, protože stejně nikdo nepíše kód v asembleru. Pokud pouze zkompilujete kód pro Phi, poběží 10x pomaleji než na CPU, protože poběží v jednom vlákně. Hlavní problém je spíš v úpravě algoritmu, tak aby mohl běžet ve více vláknech. https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630448
+
Ne.
Nikdo neprogramuje v assebleru, mluvím tu o vyšším programovacím jazyku, jako třeba C++. Nevím co používají tady. Nicméně aplikace (třeba Windows Kalkulačka), která běží na x86, aby běžela na CUDA, by musela být značně upravena. Ale pro Intel Phi, tedy skupinu x86 procesorů, je potřeba jen pár kosmetických změn (třeba mohou být jiné flagy procesoru, pořadí kroků jedné instrukce atp.), takže stačí, aby někdo sestrojil kompiler pro Phi (o to se Intel rád postará) a může se vesele pracovat.
Optimalizace pro více jader je věc druhá. Jelikož už teď máme logicky 16-ti jádrový (8 * HT) serverový Xeon, některé apliakce by s tím už mohly počítat a jádra zjišťovat automaticky a přizpůsobit se. Ovšem problém je zde stejný - jádra jsou nyní fyzicky oddělena a komunikují společně jnak, stejně tak se k nim může odlišně přistupovat. Všechny tyhle rozdíly řeší kompilace softwaru (ze zdrojového kódu) pro požadované architektury.
Nelze ale jednoduše vzít zdroják aplikace pro x86 procesor a překompilovat to na CUDA. Kdyby tohle šlo, jsme asi trochu jinde.
+1
0
-1
Je komentář přínosný?
Ne.
Nikdo neprogramuje v
Tomáš Bohuněk https://diit.cz/profil/tomas-bohunek
20. 8. 2012 - 17:15https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseNe.
Nikdo neprogramuje v assebleru, mluvím tu o vyšším programovacím jazyku, jako třeba C++. Nevím co používají tady. Nicméně aplikace (třeba Windows Kalkulačka), která běží na x86, aby běžela na CUDA, by musela být značně upravena. Ale pro Intel Phi, tedy skupinu x86 procesorů, je potřeba jen pár kosmetických změn (třeba mohou být jiné flagy procesoru, pořadí kroků jedné instrukce atp.), takže stačí, aby někdo sestrojil kompiler pro Phi (o to se Intel rád postará) a může se vesele pracovat.
Optimalizace pro více jader je věc druhá. Jelikož už teď máme logicky 16-ti jádrový (8 * HT) serverový Xeon, některé apliakce by s tím už mohly počítat a jádra zjišťovat automaticky a přizpůsobit se. Ovšem problém je zde stejný - jádra jsou nyní fyzicky oddělena a komunikují společně jnak, stejně tak se k nim může odlišně přistupovat. Všechny tyhle rozdíly řeší kompilace softwaru (ze zdrojového kódu) pro požadované architektury.
Nelze ale jednoduše vzít zdroják aplikace pro x86 procesor a překompilovat to na CUDA. Kdyby tohle šlo, jsme asi trochu jinde.https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630453
+
Jenže ta skupina x86 procesorů má vcelku ubohý výkon, srovnatelný s obyč CPU, pokud nebude využívat pro výpočet vektorové jednotky. Takže i pro Larrabee je nutné výpočet přepsat tak, aby mohl využít výpočetní výkon, který Larabee má.
+1
-1
-1
Je komentář přínosný?
Jenže ta skupina x86
Jack FX https://diit.cz/profil/jackfx
21. 8. 2012 - 10:23https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseJenže ta skupina x86 procesorů má vcelku ubohý výkon, srovnatelný s obyč CPU, pokud nebude využívat pro výpočet vektorové jednotky. Takže i pro Larrabee je nutné výpočet přepsat tak, aby mohl využít výpočetní výkon, který Larabee má.https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630494
+
23. 8. 2012 - 22:36https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseklid. uvidíme na podzim v aplikačních testech ;)https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630718
+
Mě se docela zamlouvá "odhad", že je to skupina ubohých x86 procesorů, používaných jako x86 procesory, s výkonem 1+ Tflop. Pokud ano, je to bomba. Pokud ne, bude se pro dohnání jak ty říkáš omezit nutnou úpravou, což ji připraví o nespornou výhodu.
+1
+1
-1
Je komentář přínosný?
Mě se docela zamlouvá
Tomáš Bohuněk https://diit.cz/profil/tomas-bohunek
23. 8. 2012 - 23:14https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuseMě se docela zamlouvá "odhad", že je to skupina ubohých x86 procesorů, používaných jako x86 procesory, s výkonem 1+ Tflop. Pokud ano, je to bomba. Pokud ne, bude se pro dohnání jak ty říkáš omezit nutnou úpravou, což ji připraví o nespornou výhodu.https://diit.cz/clanek/intel-phi-predbehne-velkeho-keplera-gk110/diskuse#comment-630719
+
Takže to vypadá, že grafiku se zavrhli, tak co s načatou včelkou Májou (Larra Bee) :)
Tak to vyzerá, že Intel už opúšťa aj klasické binárne násobky v štruktúre chipov
"...61 výpočtových blokov..."
"...zvýši až na 62..."
To čo sú za počty boha jeho?!
VR-Zone tvrdí, že 62 je maximum, co fyzicky nese čip, ale to číslo je tak nekulaté, že jsem ten údaj radši nepřebíral, dokud se nepotvrdí i z jiných zdrojů.
kypec: Asi jich mají fyzicky 64 a tvrdě pracují na snížení zmetkovosti.
taky mi to tak připadá
Jednoznačná výhoda Phi bude ta kompatibilita - přecijen je to víceméně x86 procesor, takže skutečně stačí znovu zkompilovat zdrojový kód (ti, jenž jej zahodili si budou trhat vlasy) pro novou architekturu a všechno může pokračovat. Na tomhle CUDA (ta už je trochu v pohybu) a Steam troskotá.
Jak jste na tohle prosimvás přišel? Instrukční sada je dnes zcela irelevantní, protože stejně nikdo nepíše kód v asembleru. Pokud pouze zkompilujete kód pro Phi, poběží 10x pomaleji než na CPU, protože poběží v jednom vlákně. Hlavní problém je spíš v úpravě algoritmu, tak aby mohl běžet ve více vláknech.
Ne.
Nikdo neprogramuje v assebleru, mluvím tu o vyšším programovacím jazyku, jako třeba C++. Nevím co používají tady. Nicméně aplikace (třeba Windows Kalkulačka), která běží na x86, aby běžela na CUDA, by musela být značně upravena. Ale pro Intel Phi, tedy skupinu x86 procesorů, je potřeba jen pár kosmetických změn (třeba mohou být jiné flagy procesoru, pořadí kroků jedné instrukce atp.), takže stačí, aby někdo sestrojil kompiler pro Phi (o to se Intel rád postará) a může se vesele pracovat.
Optimalizace pro více jader je věc druhá. Jelikož už teď máme logicky 16-ti jádrový (8 * HT) serverový Xeon, některé apliakce by s tím už mohly počítat a jádra zjišťovat automaticky a přizpůsobit se. Ovšem problém je zde stejný - jádra jsou nyní fyzicky oddělena a komunikují společně jnak, stejně tak se k nim může odlišně přistupovat. Všechny tyhle rozdíly řeší kompilace softwaru (ze zdrojového kódu) pro požadované architektury.
Nelze ale jednoduše vzít zdroják aplikace pro x86 procesor a překompilovat to na CUDA. Kdyby tohle šlo, jsme asi trochu jinde.
Jenže ta skupina x86 procesorů má vcelku ubohý výkon, srovnatelný s obyč CPU, pokud nebude využívat pro výpočet vektorové jednotky. Takže i pro Larrabee je nutné výpočet přepsat tak, aby mohl využít výpočetní výkon, který Larabee má.
klid. uvidíme na podzim v aplikačních testech ;)
Mě se docela zamlouvá "odhad", že je to skupina ubohých x86 procesorů, používaných jako x86 procesory, s výkonem 1+ Tflop. Pokud ano, je to bomba. Pokud ne, bude se pro dohnání jak ty říkáš omezit nutnou úpravou, což ji připraví o nespornou výhodu.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.