Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD Teraflop v krabici oficiálně

1018 GFlop = 1 TFlop?

+1
0
-1
Je komentář přínosný?

1T = 1000G ... tak to drobne "slovni zaokrouhleni" AMD toleruj, preci jen rikat misto "Teraflop" neco jako "1,018Teraflop" se tak dobre nevyjima

+1
0
-1
Je komentář přínosný?

stefi
1000 GFlop = 1 TFlop, takze ked to chces tak presne, tak 1018 GFlop = 1,018 TFlop

+1
0
-1
Je komentář přínosný?

... :-))) ha ha  v energetice ... :-))) s tim  budou  benchmarkovat v elektrarnach turbinogeneratori :-))

+1
0
-1
Je komentář přínosný?

Andrew: Zkus si někdy přečíst, co vše spadá pod "Department of energy"

http://www.energy.gov/news/2820.htm

+1
0
-1
Je komentář přínosný?

Da se s tim pocitat elektromagneticke pole v generatorech a motorech, hledat mista, kde dochazi k presyceni magnetickych obvodu atd.

+1
0
-1
Je komentář přínosný?

ten case je Chenbro ?

+1
0
-1
Je komentář přínosný?

re JM: Andrew asi narážel na tu gigantickou spotřebu, pokud ti to nedošlo. přeci jen 300W na jednu kartu a k tomu mít tam dvě - to je něco k čemu se ani quadsli nikdy nepřiblížilo - to mělo dohromady "jen" necelých 300W(+zbytek počítače pochopitelně). Doufám, že obyčejné X2900 tak hrozně žrát nebudou

+1
0
-1
Je komentář přínosný?

Když už tak přepočet je 2 na 10 tj. 1024

+1
0
-1
Je komentář přínosný?

Pythagoras: To platí u jednotky informace, tj. bit, bajt. U výpočetního výkonu si myslím, že to není na místě.

Jinak je to dobrá zpráva pro BOiNC nadšence. ;)

+1
0
-1
Je komentář přínosný?

Ptipi: Výklady "co tím chtěl básník říci" jsem už vždy miloval (;-).

Jen trochu přemýšlím, proč se básník neozve sám, ale přes "vykladače"...

+1
+2
-1
Je komentář přínosný?

DuckDaffy -  1024 platí i pro výpočet výkonu ,proc myslíš ze se jsou Ramky 512, 1024 ....
Ale je pravda ze 6 GFlop  se dá tolerovat, vzhledem k tomu ze klasicky uživatel si tyhle grafiky asi nikdy nekoupí ,leda ze by pracoval v elektrárně.  I proto že 1Kw Zdroj stojí od 8000 do 12 000Kč

+1
0
-1
Je komentář přínosný?

Pytagoras> este to tak
miesat GFLOPS a GiFLOPS a TFLOPS a TiFLOPS

http://en.wikipedia.org/wiki/SI_prefix
http://en.wikipedia.org/wiki/Binary_prefix
http://en.wikipedia.org/wiki/Kilobyte

ale ja viem, ze MS uvadza kapacitu particie v GiB-och a pise GB a preto su partcie o tolko mensie ako udavana kapacita vyrobcami HDD, ked su realne GB. V pamatiach nastastie pisu GB a myslia GiB.

+1
0
-1
Je komentář přínosný?

Neo_luk
Co prosim ta maju RAMky spolocne s vypocetnym vykonom, RAMky nic nepocitaju len sa do nich ukladaju data s ktorimi sa pracuje.

+1
0
-1
Je komentář přínosný?

Neo_luk: u bytu to ma smysl a (i kdyz je to podle SI norem spatne) obecne se udava 1kbyte=1024bytu . Ale ja to proboha souvisi s GFLOPS kdyz to je pocet operaci s cisly s plovouci desetinnou carkou za vterinu a s bytem to nema zadnou souvislost. Kdyz je to o pocitacich jeste neznamena ze se kilo bude pocitat jako u bytu.

+1
0
-1
Je komentář přínosný?

to JM:  joo hochu kdyz mas dlouhy vedeni, tak s tim nic nenadelam

+1
0
-1
Je komentář přínosný?

No to jsou hlasky.. lidi, lidi.. to zas deti na zakladce pustili na internet nebo co..
Dobrej stroj pro toho, kdo to vyuzije a zaplati.

+1
0
-1
Je komentář přínosný?

Ako stvoreny pre Solitaire a Minesweeper

+1
0
-1
Je komentář přínosný?

mam pocit, ze podobnej vykon se da postavit nejen levnejs, ale i daleko energeticky uspornejs. Proc se asi nejvykonejsi "pocitace" stavi jako clustery "obycejnych" stroju ? No protoze to vyjde jak ekonomicky tak energeticky daleko vyhodnejs, nez to stavet z nejakych super duper jednotek, ke kterym by pak musely musto dratu tahat tyce jak telecum v ustrednach (kdo videl starsi verze ustreden s "tramky" cca 5x10cm ?)

+1
0
-1
Je komentář přínosný?

najvykonnejsie superpocitace IBM Blue Gene aj Red Storm su MPP nie cluster-e

a zabudni, ze by to bolo enegeticky menej narocne
TOP500 na 500. mieste je 800 Xeon-ov na NetBurste
to je 96-120kW spotreby len CPU aj keby to boli ultra Low voltage Xeony tak 27kW vykon je 2,7TFLOPS resp sickovy 4,8TFLOPS cize 5,6-10kW/TFLOPS pri low voltage Xeon-och @3,06Ghz
http://www.top500.org/list/2006/11/400

Mimochodom prvy petaFLOPS superpocitac IBM Roadruner bude postaveny na Torenza, teda na tom istom pricipe ako toto, len namiesto R600 bude Cell
http://news.zdnet.com/2100-9584_22-6112439.html

+1
0
-1
Je komentář přínosný?

to jjjjj:
Asi levněji a úsporněji to nepůjde. Pro adekvátní výkon bys musel tak postavit nejméně 30 pracovních stanic s procesory Conroe na 3 GHz. Tj minimálně s 8 kW spotřebou a cenou okolo 1 mil Kč.
Tady se vlezeš do 1 kW, cena bude okolo 100 000 a nezabere ti to 2 místnosti.

+1
0
-1
Je komentář přínosný?

Andrew: Postřehl jsi, že petaFLOPSový superpočítač od IBM z Fotobova odkazu si taky objednali "energetici" z DOE, resp. LANL?

A s ohledem na budget typického "profi" uživatele těchto "krabic" bude jejich příkon důležitý nejspíš jen při návrhu kapacit klimatizace + UPS...

+1
0
-1
Je komentář přínosný?

Myslim, ze s tymi R600 to vychadza na vyborny pomer vykon/watt. Ani nekcem vediet aky "Recent average credit" by som dosahoval s jednou R600 v BOINC, ked uz bude preprogramovany.

+1
0
-1
Je komentář přínosný?

NOX> Ono jak se to vezme. Na urcite tride uloh bude ten vykon skutecne obrovsky, bohuzel pokud se do nich neco nevejde, smula.

Kazdopadne se nam nejspis blizi doba fotorealistickych games, s timhle vykonem uz se da neco delat;)

+1
0
-1
Je komentář přínosný?

600W/1TFlops ? to je hodně slabej výsledek.

+1
0
-1
Je komentář přínosný?

to shinigami:
Po přečtení článku a všech příspěvků jsem se trošku zamyslel nad použití téhle mašiny. Na 100% se nechá použít na 3 a 4D modelování v reálném čase. Tzn., že pro kontrukci proudových motorů už nebudou muset technici a vědátoři po nastavení parametrů (a že jich teda je) si jít lehnout, než jim to mašiny přepočítaj a sestaví 3D model, ale po "odklepnutí" si budou moct model pocházet a měnit třeba několik desítek parametrů současně systém na jejich podněty budu reagovat téměř okamžitě (řádově s mikro-sekundovou prodlevou). A ani si kvůli tomu nebudou muset pronajímat super-mašiny (celkem drahá sranda).

+1
0
-1
Je komentář přínosný?

to n:
Znáte něco, kde nepotřebujete jedno patro a minimálně 20KW se stejným výkonem? Já tedy ne.

+1
0
-1
Je komentář přínosný?

shinigami: Zas takovej výkon to není využití by našel (a najde) i výkon o několik řádů větší, třeba takových 5000000 ExaFlops už by mohlo být zajímavých :-) (Vycházím z počtu prvků na scéně které mezi sebou interagují)

+1
0
-1
Je komentář přínosný?

honza198:Určitě už existují výkonná DSP na šrotování čísel, tohle má okorát výhodu že je to hotový na desce do se dá strčit do PC, z toho co znám a má stejný výkon je třeba 80ti jádrový procák od intelu, což je ale jenom výzkumný model pravda. Já myslím že by se něco našlo když by se pohledalo. Hlavně našlo co má příznivější poměr výkon/příkon.

+1
0
-1
Je komentář přínosný?

to n:
To nevím, možná jo, možná ne. Jen vím, že obdobná řešení mívají velké množství "ALE". Např. nároky na prostor, specifický instrukční soubor (většinou se používají RISC CPU) a hlavně i Vámi zmiňovaná možnost zacvaknout do CASE "jakéhokoliv" PC (samozřejmě MB je musí podporovat)

+1
0
-1
Je komentář přínosný?

No to těžko, DSP jsou chipy jako každé jiné ne nějaké krabice, prostor zabírá leda teraflopový výkon poskládaný z obyčejných PCek což se právě hodně používá protože se nemusí vyvíjet vlastní workchain ale stačí podojit státní nebo jiný rozpočet a nakoupit hromadu PC, dělá se to protože jsou na toto už hotové programovací nástroje a vůbec všechno (a na hotovou aplikaci se pak lehce dělá upgrade HW) ne proto že by tohle řešení mělo skvělý poměr cena/výkon nebo spotřeba/výkon.

+1
0
-1
Je komentář přínosný?

n: Dokud nemají produkty typu 80-jádro od Intelu (a ostatně i tento AMD Stream Processor) vlastní záznam v testech na http://www.spec.org/, jde o natolik předběžné produkty a informace o nich, že je nemá smysl navzájem srovnávat.

honza198: Slabinou jednodeskových superpočítačů typu AMD Stream Processor je přístup k paměti. Pro minidata velikosti jejich L1+L2 cache pravděpodobně zvládnou dělat rychle řekněme FFT v single přesnosti, při reálných "velkých" úlohách s metodami koneč. prvků či koneč. diferencí (typicky třeba Tvé výpočty proudění) ale jejich výkon nijak hvězdný nebude - nebudou stíhat načítat a ukládat mezivýsledky.

+1
0
-1
Je komentář přínosný?

to n:
:) OK, prostor ala obsazené místnosti jsou za námi. Každopádně by mne zajímala odpověď N-Vidie na tuto "kartičku". Na jejich Webu se moc neviznám, nemáte ponětí, jestli již nemají něco podobného? (Pro srovnání graf. výkonu/spotřeby/ceny a ostatních nároků)

+1
0
-1
Je komentář přínosný?

JM_:
Aha takže podle tebe by bylo lepší kdyby měl ještě sólo jednotku pro mezi výpočty a jednorázové údaje, které se použijí pouze jednou pro další algoritmus. Aby se Cache těmito výsledky nezpomalovala?

+1
0
-1
Je komentář přínosný?

Prosimvás a je někde uvedeno, pro jakou přesnost reálných čísel ten výkon platí? Obávám se totiž, že je to pouze pro 32bitový float, s kterým se ovšem moc simulovat nedá (na počítání grafiky to ale jakžtakž stačí). Otázkou je, jestli to vůbec zvládá 64bitový typ double.

+1
0
-1
Je komentář přínosný?

Lubor_Z: Používání instrukcí se single přesnosti je při prezentacích jako je tato běžný "trik". Obdobně určitě nejde o standard. FLOPSy počítané s LINPACK knihovnou, ale spíš o teoretické instrukce "schované" uvnitř rychlé Four. transformace.

honza198: Já říkal, že by něco bylo lepší než něco? Pokud ano, jde o nedorozumění.

Já se snažil říci opak = IMHO je před nezávislými testy na porovnávání numerického výkonu jednodeskových superpočítačů s MPP systémy typu http://www.top500.org/list/2006/11/100 příliš brzo.

Jedna věc je totiž teoretický špičkový výkon holé CPU při opakovaném provádění FTT nad "mikrodaty", druhá věc je výkon celého systému včetně HDD atp. dosažitelný v reálné aplikaci. Viz např. "škrcení se" C2D (ve srovnání třeba s Opterony) v aplikacích tvořících test ScienceMark

+1
0
-1
Je komentář přínosný?

JM_: Ale ne, myslel jsem, jako jestli by to pomohlo . Vím, že osobně nemám možnostr do vývoje zasáhnout jen se ptám, jestli by ty výsledky po vložení jednotky byli lepší - přesnější (i pro to 3D modelování).

+1
0
-1
Je komentář přínosný?

honza198: Zda to pomůže pro běžné 3-D modelování (rozuměno aplikaci postavenou na řešení diferenciálních rovnic metodou koneč. prvků)? Bez optimalizace SW určitě ne, a ani po ní se nedají očekávat zázraky (viz diskutovaná single vs double přesnost, pouze částečná paralelizovatelnost metody koneč. prvků, ...).

Ale než tvou (pravděpodobně komerční?) aplikaci pro tohle železo upraví, určitě už někde budou k doklikání hodnoty SpecFP200x, ze kterých budeme moudřejší

+1
0
-1
Je komentář přínosný?

>honza198: Slabinou jednodeskových superpočítačů typu AMD Stream
>Processor je přístup k paměti. Pro minidata velikosti jejich L1+L2
>cache pravděpodobně zvládnou dělat rychle řekněme FFT v single
>přesnosti, při reálných "velkých" úlohách s metodami koneč. prvků či
>koneč. diferencí (typicky třeba Tvé výpočty proudění) ale jejich výkon
>nijak hvězdný nebude - nebudou stíhat načítat a ukládat mezivýsledky.

Koli tomu ma Stream processor 2GB GDDR RAM s latenciou 0,9 ns aby to stihal...

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.