Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Plánuje Intel s Phi převálcovat velkého Keplera?

Takže to vypadá, že grafiku se zavrhli, tak co s načatou včelkou Májou (Larra Bee) :)

+1
+1
-1
Je komentář přínosný?

Tak to vyzerá, že Intel už opúšťa aj klasické binárne násobky v štruktúre chipov
"...61 výpočtových blokov..."
"...zvýši až na 62..."
To čo sú za počty boha jeho?!

+1
-1
-1
Je komentář přínosný?

VR-Zone tvrdí, že 62 je maximum, co fyzicky nese čip, ale to číslo je tak nekulaté, že jsem ten údaj radši nepřebíral, dokud se nepotvrdí i z jiných zdrojů.

+1
0
-1
Je komentář přínosný?

kypec: Asi jich mají fyzicky 64 a tvrdě pracují na snížení zmetkovosti.

+1
0
-1
Je komentář přínosný?

taky mi to tak připadá

+1
0
-1
Je komentář přínosný?

Jednoznačná výhoda Phi bude ta kompatibilita - přecijen je to víceméně x86 procesor, takže skutečně stačí znovu zkompilovat zdrojový kód (ti, jenž jej zahodili si budou trhat vlasy) pro novou architekturu a všechno může pokračovat. Na tomhle CUDA (ta už je trochu v pohybu) a Steam troskotá.

+1
0
-1
Je komentář přínosný?

Jak jste na tohle prosimvás přišel? Instrukční sada je dnes zcela irelevantní, protože stejně nikdo nepíše kód v asembleru. Pokud pouze zkompilujete kód pro Phi, poběží 10x pomaleji než na CPU, protože poběží v jednom vlákně. Hlavní problém je spíš v úpravě algoritmu, tak aby mohl běžet ve více vláknech.

+1
+1
-1
Je komentář přínosný?

Ne.
Nikdo neprogramuje v assebleru, mluvím tu o vyšším programovacím jazyku, jako třeba C++. Nevím co používají tady. Nicméně aplikace (třeba Windows Kalkulačka), která běží na x86, aby běžela na CUDA, by musela být značně upravena. Ale pro Intel Phi, tedy skupinu x86 procesorů, je potřeba jen pár kosmetických změn (třeba mohou být jiné flagy procesoru, pořadí kroků jedné instrukce atp.), takže stačí, aby někdo sestrojil kompiler pro Phi (o to se Intel rád postará) a může se vesele pracovat.

Optimalizace pro více jader je věc druhá. Jelikož už teď máme logicky 16-ti jádrový (8 * HT) serverový Xeon, některé apliakce by s tím už mohly počítat a jádra zjišťovat automaticky a přizpůsobit se. Ovšem problém je zde stejný - jádra jsou nyní fyzicky oddělena a komunikují společně jnak, stejně tak se k nim může odlišně přistupovat. Všechny tyhle rozdíly řeší kompilace softwaru (ze zdrojového kódu) pro požadované architektury.
Nelze ale jednoduše vzít zdroják aplikace pro x86 procesor a překompilovat to na CUDA. Kdyby tohle šlo, jsme asi trochu jinde.

+1
0
-1
Je komentář přínosný?

Jenže ta skupina x86 procesorů má vcelku ubohý výkon, srovnatelný s obyč CPU, pokud nebude využívat pro výpočet vektorové jednotky. Takže i pro Larrabee je nutné výpočet přepsat tak, aby mohl využít výpočetní výkon, který Larabee má.

+1
-1
-1
Je komentář přínosný?

klid. uvidíme na podzim v aplikačních testech ;)

+1
-3
-1
Je komentář přínosný?

Mě se docela zamlouvá "odhad", že je to skupina ubohých x86 procesorů, používaných jako x86 procesory, s výkonem 1+ Tflop. Pokud ano, je to bomba. Pokud ne, bude se pro dohnání jak ty říkáš omezit nutnou úpravou, což ji připraví o nespornou výhodu.

+1
+1
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.