Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k 32jádrový Zen Opteron není ani z jednoho, ani ze dvou kusů křemíku

takze je mozne, ze novy desktop Zen bude mat cca 1/4 spotrebu tohoto 32 jadroveho Opterona?

+1
-19
-1
Je komentář přínosný?

Při stejných taktech by měl, ale reálně se budou frekvence velmi lišit. Viděl bych to na 2-2,5 GHz pro 32j serverový model a ~4 GHz pro desktopový 8j. Top model pro desktop má být 95W.

+1
-23
-1
Je komentář přínosný?

@no-x: proč myslíš, že Zen poběží v desktopech tak vysoko? Sám bych tipnul, že AMD půjde cestou více jader a nižších taktů. Alespoň při uvedení. 8jádrový Zen, s vylepšenou IPC, bude stát proti 4jádrovému Skylaku... (jen taková úvaha).

+1
-29
-1
Je komentář přínosný?

Ne, protože v desktopu se cílí na vyšší frekvence, 32 jádrový opteron rozhodně nepoběží na 3,5 Ghz(+).

+1
+22
-1
Je komentář přínosný?

tak ted by me zajimalo jak bude poreseny ten workstation apu model, 16 jader plus naslapla grafika ... tri ctvrecky pod pliskem?
kazde z tech 8mi jader bude mit integrovany NB, nebo veskery ty pocty sitovek sata pcie je jen soucet ze vsech ctyrech?

+1
-18
-1
Je komentář přínosný?

Podle té roadmapy (která je v současnosti jediným oficiálním zdrojem) má HPC APU vyjít výrazně později; prakticky až s následující generací procesorů (2017?). To už by výtěžnost 14nm procesu mohla být dostatečná i pro nějaký větší monolit. Ale kdo ví... :-)

+1
+14
-1
Je komentář přínosný?

tak aspon nejaka doba na setreni, nedelam si iluze o cene :) ale uvidime jaky bude vysledek a jestli utahne dooma 4 :))

+1
-23
-1
Je komentář přínosný?

CPU a GPU cast muzou spojit pomoci TSV interposeru. Budou to pouzivat na GPU s HBM pameti, tak nic moc nebrani nalepit GPU a CPU cast na interposer i u APU nebo serveroveho CPU.

Uz v nejake prezentaci od AMD z 2013 se psalo, ze prave TSV muze castecne prodlouzit zivotnost Mooreova zakona (i kdyz uz spis neplati), protoze dovoli pouzivat na stavebni bloky integrovanych chipu ruzne nastavene vyrobni procesy. Dalsi bonus skladani z mensich casti je potom vetsi vyteznost, takze se muze kompenzovat cena interposeru.

+1
-41
-1
Je komentář přínosný?

Jak se s touto granularitou vypořádá OS? Bude to vidět jako 4 sockety, nebo přibude ještě jeden mezistupeň mezi socket a hyperthreading?

+1
+17
-1
Je komentář přínosný?

no dnesni sestnacti jadro vidi jako jeden jeden cpu, a to jsou dve osmi jadra vedle sebe ...
a ukazuje to 16mb l3 cache, i kdyz defakto se vyuziva 14mb, protoze z kazdeho osmijadra se pouziva 1mb jako directory cache ...

+1
-36
-1
Je komentář přínosný?

OS to imho uvidí tak, jak mu řekne CPUID. 1 socket, 32 jader, 4 NUMA uzly.

+1
-40
-1
Je komentář přínosný?

Starý, dobrý a osvedčený MCM (Multi Chip Module) => 8 Cores per die on four die = 32 Cores processor.

+1
+36
-1
Je komentář přínosný?

A teraz sa podme bavit o vykone na jedno jadro, ktore je kriticke pre bezne desktopove pouzitie. Aby to zase nedopadlo ako teraz, kde 4jadro intelu je lepsie nez 8jadro amd.

+1
+42
-1
Je komentář přínosný?

"kriticke" pro desktopove pouziti?? ale no tak, me amd apu pro desktopove vyuziti dostacuje vice nez luxusne, vubec s nicim nemam problem, ani konvertovani rawu pres acr v zoneru popr jinaci upravy ... a pakovani v 7z? i kdyz pakuju 50gb, tak me to bezi na pozadi a u toho normal pracuju a pohoda klidek, max spokojenost ...
kritictejsi pro desktop pouziti je mozna tak ssd na system a aplikace, to je pak neco uplne jineho ...

+1
-19
-1
Je komentář přínosný?

okej, tak inak, herny vykon je u amd uplne k smiechu, viz vykon na jedno jadro. i5 to tam cele valcuju

+1
-63
-1
Je komentář přínosný?

bavime se o hrach co jsou v benchmarcich a recenzich? jako tech 10 nudnych her co jsou totalne neoptimalizovany predelavky z konzoli je skoda vubec piratit ... machinarium to urco utahne ...
a proc to beres tak ze v absolutnich cislech to je slabsi?? ze to ma 60% vykon za 30% ceny?? ne vsici hrajou 3d hry v 1080p s 100+ fps ... zalezi prece na segmentu kde to cpu chces nasadit ...
jako kdybych si na zpracovani videa koupil athlona 5350 ... budu dstit ohen a siru na amd, ale supnu to do htpc a chrochtam si blahem ...

+1
+50
-1
Je komentář přínosný?

60% za 30%? ale no tak neporovnavaj top end proti sebe ale priamu konkurenciu kde to uz je 100% za rovnaku cenu a ako bonus dostanes od intelu nizsiu spotrebu + vyssi vykon na jadro co je dnes a v blizkej buducnosti viac uzitocne ... tvojich 60% za 30% je v pripade top modelov kde si to intel aj nalezite necha zaplatit nakolko je to kategoria kde je pred konkurenciou 10 krokov a ako jedinemu sa podarilo posunut riadnu porciu vykonu do desktopu ... ja som svojho casu bol velky fanda amd ale dnes uz v 90% scen a pouziti je intel lepsia volba

+1
+14
-1
Je komentář přínosný?

narast fps vo vsetkych hrach konci na najvykonejsej i5, teda 4 jadra, cokolvek viacej ci uz i7 alebo 8jadra nema ziadny dopad na vykon, bavime sa o vsetkych hrach na vsetkych enginoch

a mojko mam pre teba tajomstvo, vsetky hry su neoptimalizovane predelavky z konzol, pc only hra uz ani ako kategoria skoro neexistuje, obzlvast ak sa jedna o velky 3A projekt

to je proste realita zmier sa stym a neplac

+1
+29
-1
Je komentář přínosný?

Význam procesorového výkonu v herní grafice klesá a s nástupem DirectX 12 klesne ještě výrazněji. Proč se dožadovat vyššího procesorového výkonu, když byla brzda na straně softwaru?

+1
-27
-1
Je komentář přínosný?

Staci se podivat jak ohromna zmena nastala na PS platforme. PS3 mela specificky lec velmi vykony PowerPC Cell and PS4 ma ultra mobilni a pomaly jaguar (pocet jader je prakticky stejny).
Stejna zmena se odehraje samozrejme se spozdenim na PC.
Proto je otazka zdali vubec Zen prinese vyssi IPC (nepotvrzene prezentovano bylo temer dvakrat vyssi) a zdali to bude vubec v 2016 potreba a vyssi pocet jader/vlaken neprinese vetsi uzitek.

+1
-15
-1
Je komentář přínosný?

Dvakrát vyšší IPC proti čemu? Bulldozeru? I to by mě překvapilo :-) Podle toho co prosakuje, si myslím, že půjde o jádra o něco jednodušší než je Haswell. Nemyslím, že by v IPC překonali Intel. Těžko za tři roky vyvinou architekturu, která by byla efektivnější než po léta Intelem pilované Core. Můžou se ale dostat akceptovatelně blízko a na celkový poměr cena / spotřeba / výkon, který bude pro většinu zákazníků velmi přijatelný.

+1
+17
-1
Je komentář přínosný?

právě proto že jde o léta starou a jen pilovanou architekturu. Výkon od SB prakticky neroste, jen se přidávají instrukce a jádra, takže dohnání v IPC nemusí být žádné scifi. A snažit se musí, pokud by to byl fail jako první Phenom tak to můžou zabalit, peníze jim už nikdo soudný půjčovat nebude.

+1
+41
-1
Je komentář přínosný?

Kriste, amd je uplna sračka co sa cpu tyka, kupovat cokolvek ine ako i5 na domaci pc nema zmysel.

Nenavidim agrumet typu ze problem je inde, preco pozdaovat lepsi vykon na jadro a radsej nepockat na software ktory si to posefuje. No pretoze veci sa maju tak ako sa maju, a viac ako 4jadra na i5 sa prejavi na vykone v hrach - nijak. Vyznam neklesa vyznam tu stale je obrovsky a dlho este bude. Klesa v horizonte za 6 rokov mozno.

DX12 a vulkan a podobne je hudba dalekej buducnosti, novej generacie konzol, dnes tuje UE3/UE4, CE4, Unity a Source. Ani jedno z toho nebere ohlady na dx12 a nove vymozenosti a ani dlho brat nebude. A ani nehovorim o tom ze bude treba novu generaciu grafik ktore to budu vediet a ziadny publisher neda do obehu hru ktoru si moze zahrat 1% hracov.

Amd je sračka, prave vdaka slabemu vykonu na jedno jadro. Pokial to nedaju doporiadku mozu si te nove procaky strcit niekam, a medzi tym si normlany clovek kupi i5 za 200€.

+1
+23
-1
Je komentář přínosný?

Treba rychlo napisat do Intelu aj AMD, ze vykonnejsie CPU nikto nechce, nech neplytavju $ na zbytocny vyskum.

+1
+22
-1
Je komentář přínosný?

argument rozmazlenyho fagana predskolniho veku ... vsak procesor si kupuju podle zamyslenyho pouziti, ne? no obyc domaci pouzivani urco poridim neco jineho nez jako programator, cadista nebo serverar ... nebo si mam predsravit nejaky neexistujici scenar v domacim pouziti pro 4x 18core xeon e7 s 2tb ramek ??

+1
+18
-1
Je komentář přínosný?

Jelikož "výkonnější" v dnešní době prakticky znamená "zvládne více operací na joule" (protože i desktopy jsou prakticky omezeny hlavně únosností chlazení), tak honba za výkonnějšími procesorovými návrhy má smysl v každém případě: budou z toho profitovat i mobilní zařízení.

+1
+22
-1
Je komentář přínosný?

Já mám teda na běžné desktopové použití 4jádro, na co 32jádro... :-)

+1
-24
-1
Je komentář přínosný?

teraz, a co za par rokov ? budu sa stale vyrabat 1,2,3,4 jadra ? Co ak si rozmyslia ze minimalne budu robit xy-jadra ?

+1
+24
-1
Je komentář přínosný?

Před pár roky Intel vyráběl přímotopy a vyhrabal se z toho, třeba za pár roků bude AMD dělat procesory s větším IPC, člověk nikdy neví...

+1
-43
-1
Je komentář přínosný?

Intel ma stokrat vacsi obrat a je stokrat vacsia firma ako amd, osobne sa divim ze este amd nezkrachovalo, intel si moze dovolit robit chyby, amd nie, a poslednych par rokov u amd je jedna velka chyba, v podstate od c2d nedali nic, len riesa dementne apu

+1
-37
-1
Je komentář přínosný?

To se říká už 10 let. A co... Core2 quad přišla 2007 a od té doby tu máme krom top high endu stále jen 4 jádra. Většina SW navíc neni multithread, a z těch co je, to neni dokonalej multithread, ala nad 4 jádra škáluje jen něco, nad 8 už je to spíš malej zázrak. Sám jsem měl 24 jader (2x12C Interlagos) Opterona a bylo to naprosto useless... Vzhledem k tomu jak malej pokrok v multithreadu jsme udělali za posledních 8 let v to nevěřim. Vesměs je dobře threadovaný jen to co bylo vždy protože je to easy, ala enkóding, rendering, hasking, komprese, šiforvání. Ale běžnej SW či herní enginy... heh....

+1
-40
-1
Je komentář přínosný?

Tak podle toho jak dlouho je to od posledniho zvednuti frekvence bych o moc vetsi vykon na jadro na kremiku uz necekal. Takze se proste uvidi, kolik jader budou lidi ochotni kupovat. Ono je jedno jestli to nejaka aplikace vyuzije nebo jestli to lidi budou kupovat podle hesla vic pruhu vic adidas, vic jader vic intel/AMD. Na serveru se vyuzije kazde jadro, na desktopu se holt vetsina CPU bude flakat.

Osobne neverim, ze by nekdo nekdy udelal herni engine s neomezenym poctem threadu, tak jako to jde udelat u toho encodingu. Proste se to nalame jak to jen jde, vyleze z toho X threadu s ruznou narocnosti a pak se uvidi kolik dalsich jader to vytizi kdyz ten nejnarocnejsi thread pojede na vlastnim jadru na maximum co da.

+1
+19
-1
Je komentář přínosný?

Preto je vykon na jedno jadro kriticky, pokial to nezvladnu tak mozu ist niekam.

+1
-8
-1
Je komentář přínosný?

Stejně si říkám, jestli ty jádra opravdu software dokonale využívá. Celkem o tom pochybuji. Např. si vezměme takový převod zvuku z WAV do FLAC. Existuje program dbPowerAMP, který naráz volá více procesů, z nichž každý enkóduje jednu stopu (podle počtu jader CPU). Co ale, když má jedna stopa minutu a druhá hodinu? Takový přístup se mi jeví jako jednoznačně zcestný. Chtělo by to, aby zátěž byla ROVNOMĚRNĚ rozdělena dle počtu jader CPU, aby to bylo opravdu efektivní...

+1
-10
-1
Je komentář přínosný?

proc zrovna prevod zvuku?? prevod videa uz je jina a s prichazejicim x265 to bude jiste zajimavy ... popr 3d modeling, cad/cam ...

+1
-13
-1
Je komentář přínosný?

prevod videa cez cpu dnes robi len idiot, vsetko sa to taha cez opencl/cuda a je to xkrat rychlejsie

+1
-3
-1
Je komentář přínosný?

Vicejadrove procesory vznikly jednoduse proto, ze IPC neslo jiz dale efektivne zvysovat a paralelizace byla jedina moznost zasadnejsiho zvyseni vykonu. Nejde tedy o rozhodnuti ale o nutnost.

+1
+1
-1
Je komentář přínosný?

Jako trochu off-topic chci upozornit na CUETools, maji v sobe FLACCL encoder. Pokud ma clovek slusne GPU, tak je vetsinou uzke hrdlo v HDD. Jen pozor na FLACCL 0.3, ktery jde na webu stahnout zvlast, je to strasne stara a zabugovana verze. Aktualni encoder je vzdycky v poslednich CUETools.

+1
-13
-1
Je komentář přínosný?

"Existuje program dbPowerAMP, který naráz volá více procesů, z nichž každý enkóduje jednu stopu (podle počtu jader CPU). Co ale, když má jedna stopa minutu a druhá hodinu?"

Slyšel jste někdy o matematickém programování? ;-) Už desetiletí takhle řešíme výrobní linky (kde jde o mnohem více peněz), proč myslíte, že by to třeba u té konverze mělo fungovat jinak?

+1
-11
-1
Je komentář přínosný?

Pro většinu diskutujících nade mnou: Proč pořád mluvíte o tom 32jádrovém CPU jako o produktu pro běžná PC? Nejsou náhodou Opterony určené pro enterprise sféru? Pro obyčejné desktopy budou určené nejspíše jen 8 jádrové max 16 v dalších generacích.

+1
+13
-1
Je komentář přínosný?

32Core navic snad jeste s HT by bylo asi hodne mimo misu xD.

+1
+4
-1
Je komentář přínosný?

Kedze sa sklada z 4x8 tak asi len to 8 bude zaklad bezneho cpu.

+1
-8
-1
Je komentář přínosný?

tak nejak me napadlo, ze g34 asi konci, coz? i kdyz by to byl opteron v ddr3 variante ...
btw a nejake info ohledne "amd open 3.0" ? bude treba 3.1 postavena na zenu ?

+1
-23
-1
Je komentář přínosný?

Myslim ze v najblizsej dobe sa, co sa tyka vykonu, bude musiet zapracovat na inej casti bezneho PC. Pre bezneho pouzivatela doteraz vecsinou hlavnou brzdou bol disk ale pri dnenych cenach a vykonoch SSD to uz tak moc neplati a pomali sa zacinaju tlacit PCIe disky. CPU su dnes dostatocne vykonne ale co je zufalo pomale je pamet. Pokial sa spracovava viac dat a cache uz nestaci tak CPU sa flaka a caka na ramku. A vzhladom na narast objemu spracovanych dat (audio,video, atd.) bud narastie cache alebo sa musi zvysit vykon ramky. Zvysovanie vykonu CPU cez vecsi pocet jadier je fajn ale stale to kladie vysoke naroky na sw (multithreading) a aj na samotny navrh platformy.

+1
-9
-1
Je komentář přínosný?

Na PC nieje uzke hrdlo, na PC je iny problem a tym su data. Niesu data, ktore by ten HW spracovaval.
Neviem, kde vidis ten narast dat ale ja som v mojom okoli nic taketo nepostrehol. Nikto nijak extra neriesi audio, video alebo ine data vo velkom.

+1
-3
-1
Je komentář přínosný?

Rychlejší paměti budou (HBM), dost možná ještě letos, ovšem ne kvůli tomu, že by je potřeboval procesor, nýbrž kvůli integrované grafice.

PS: jaké aplikace provozujete, které jsou limitovány rychlostí pamětí? Vždyť dneska si můžete vcelku lacino pořídit DDR3 2400 s propustností 40 GB/s ! (dual channel)

+1
-8
-1
Je komentář přínosný?

To je sekvenční rychlost. Tu Vám dá možná i SSD. Problém je přístupová doba. V 80-letech přístupová doba buďto nebrzdila vůbec nebo o několik strojových cyklů, což tehdy odpovídalo jedné instrukci. Dnes musí CPU čekat desítky až stovky strojových cyklů.
Ostatně, k čemu je rychlost 80 bytů za dvě nanosekundy, když nedřív musíte čekat 10 nanosekund. Pokud vím, přenáší se do L1 cache 64 bytů.

+1
-8
-1
Je komentář přínosný?

Problém latencí přístupu do pamětí je dnes do značné míry vyřešený. Většina plochy CPU je zaměřena na to, aby se výpočetní jednotky neflákaly (instruction pipelines, data prefetch, branch prediction, store to load forwarding, memory disambiguation atd.). Latence přístupu do RAM jsou dnes také poměrně malé, alespoň u Intelu, ~ 20ns, tzn. 60-70 taktů procesorů. Inženýři AMD musí na tomto problému ještě zapracovat, latence jejich paměťového řadiče je výrazně vyšší, ~55ns.

http://www.tomshardware.com/reviews/memory-scaling-gaming-haswell-richla...

Zapátral jsem, jak je na tom poslední generace AMD APU ohledně latencí přístupu do paměti. K mému zděšení jsou latence Kaveri o 30% horší než u Richlandu (60ns -> 80ns), 4x !!! horší než u Intelu . No prostě úplná tragédie.

http://techreport.com/r.x/a8-7600/sandra-latency.gif
http://techreport.com/review/25908/amd-a8-7600-kaveri-processor-reviewed/5

+1
-7
-1
Je komentář přínosný?

All of the AMD chips perform comparably until the 4MB block size. Starting at that point, the A8-7600 configs exhibit higher latencies than the A10-6700T and A8-6500T. The looser timings required by the A8-7600's 2133 MT/s memory could explain the difference.

+1
+1
-1
Je komentář přínosný?

No to asi těžko, vyšší latence (v cyklech) rychlejších pamětí jsou kompenzovány vyšší frekvencí, absolutní hodnota latence v ns zůstává víceméně stejná.

+1
-7
-1
Je komentář přínosný?

"Problém latencí přístupu do pamětí je dnes do značné míry vyřešený. Většina plochy CPU je zaměřena na to, aby se výpočetní jednotky neflákaly (instruction pipelines, data prefetch, branch prediction, store to load forwarding, memory disambiguation atd.)."

No to bych tedy chtěl vidět... V době funkcionálních jazyků a "chytrých" datových struktur jako jsou všelijaké typy stromů zcela určitě nelze tenhle problém označit jako vyřešený, prostě proto, že jejich traverzování předvídat nedokážete. Ani ty extra jednotky nedokáží zázraky. Možná fortranisté se cítí jako v nebi, to netuším.

+1
+10
-1
Je komentář přínosný?

Na http://stackoverflow.com/questions/7241922/how-has-cpu-architecture-evol... najdete přehled, jak se s voláním virtuálních funkcí vypořádávají moderní x86 CPU.

+1
+2
-1
Je komentář přínosný?

Nechápu, jak tohle téma souvisí s problémem, který jsem zmiňoval. Rozhodování na základě obsahu uzlů stromových struktur není obecně převoditelné na jednoduché nepřímé skoky. Mimochodem, "virtuální funkce", to je taky zajímavá floskule.

+1
+5
-1
Je komentář přínosný?

Pro Vás "virtuální funkce" je možná floskule, pro mně a ostatní, kteří se vývojem software živí, je to odborný termín http://en.wikipedia.org/wiki/Virtual_function .

Nějak sem nezaznamenal, že by se nějak moc v praxi používaly funkcionální jazyky a "chytré" datové struktury. Dost možná že je to proto, že z teoretického hlediska jsou sice pěkně vymyšlené, ale v praktickém nasazení moc pomalé z důvodů, které uvádíte.

+1
-18
-1
Je komentář přínosný?

"Pro Vás "virtuální funkce" je možná floskule, pro mně a ostatní, kteří se vývojem software živí, je to odborný termín http://en.wikipedia.org/wiki/Virtual_function"

Smalltalkeři samozřejmě vědí, jak message passing funguje, ale až C++ neandrtálci si pro to z nějakého důvodu vymysleli obskurní terminologii.

"Dost možná že je to proto, že z teoretického hlediska jsou sice pěkně vymyšlené, ale v praktickém nasazení moc pomalé z důvodů, které uvádíte."

No jasně, a protože jsou "moc pomalé", tak se čím dál tím více používají pro náročné aplikace, že? Mj. viz Repa, STM, podpora paralelního a souběžného zpracování, generativního programování apod.

+1
-3
-1
Je komentář přínosný?

Problem latencie je vyrieseny? Heh tak to je slusny humor. Staci si pozriet napriklad vysledky testov v latencii v AIDE64. Priemer je tak od 50 do 70ns kdezto pristup do zdielanej L3 sa pohybuje okolo 10ns. Uz len to je tak 5 az 7x rychlejsie ako do RAMky. A to uz sa nebavime o L2 ktora byva este vecisnou o polovicu rychlejsie (tak 5ns) alebo o L1 ktora ide pod 1ns.
Co sa tyka zvecseneho objemu dat. Dnes je bezne spracovavat video full hd a vo vyssich rozliseniach. Tak isto dalsie a/v data ale aj 3d grafika a podobne. Je idealne, zvlast ked je tam nejaka datova zavyslost, nech ma cpu koli algoritmu toho co najviac v cache a moze dane data spracovat. Ale ak musi koli objmemu stale cakat na dotiahnutie tak viac sa nacaka na ramku ako realne spracovava. Inak pekny clanok k tomu bol od J.M.P. van Waverena z id Softu - DOOM 3 BFG Technical Note. Vysvetluje tam ze v novom kode skininngu animacii Doom3bfg vyslo ako vykonnejsie si to vzdy v kazdom frame vyrata (cpu stiha) ako to cachovat do ramky, lebo nacitanie trva dlhsie a cpu sa flaka.

+1
+1
-1
Je komentář přínosný?

Jasně, by bylo super, kdyby někdo vymyslel, jak dále výrazně snížit latence. Kdyby si svůj nápad patentoval, tak by z něj byl milionář, firmy vyvíjející CPU by se mohly přetrhnout, aby ten patent mohly použít ve svých procesorech. Snížení latencí by totiž umožnilo prodloužení pipeline a navýšení počtu výpočetních jednotek, v důsledku výrazný nárůst výkonu jednoho vlákna.
Když na nějakém problému pracuje spousta chytrých lidí dlouhou dobu, není reálné očekávat, že nějakým zázrakem někdo přijde na nějaké lepší řešení. Podobně nemůžete očekávat, že někdo vymyslí spalovací motory do osobních aut se spotřebou 1L/100 km při zrychlení 0-100 pod 3 sekundy.

+1
+8
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.