Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD ThreadRipper bude 16 jader a 32 vláken pro desktop

Skylake, Kaby Lake, Skylake-X, Kaby Lake-X, Skylake-W, ....

Tak to na me dela dojem, ze Intel nazvama mlzi podobne jako AMD, kdyz byla totalne v prdeli s traktorama.

+3 +1-1 Je komentář přínosný?

Nic jiného jim nezbývá pokud nechtějí jít výrazně dolů cenou.

0 +1-1 Je komentář přínosný?

no to jsem zvedavej na ceny.. tipuju ze za cenu inteliho osmijadra daj dvanactijadro a za cenu desetijadra daj sestnactijadro (:

+3 +1-1 Je komentář přínosný?

Kdyz daji 12-jadro za 799 a 16 jadro za 1199 dolaru, maji vyhrano.

(dnesni 8 jadro od Intelu Core i7-6900K stoji dokonce vys, konkretne 1300 a deseti lidovych 2000€)

8 jaderny Ryzen 7-1800X stoji 570€, cili je to realne...

Otazkou je cena AM44 zakladnich desek, kdyz zacnou na 250/300 dolarech bude to dobry kauf.

A Intel doda do Skylake-X ctyrjadro, jo za 4-jadro si budeme jiste drahou LGA 2066 sestavu kupovat.

+2 +1-1 Je komentář přínosný?

Step by Ti vysvětlil, že jsou i lidé kterým se to vyplatí.

0 +1-1 Je komentář přínosný?

Nevím, proč zas dělají zvlášť celou platformu. Podle mě by stačil serverový a desktopový chipset a jeden stejný socket. Klidně se to všechno mohlo jmenovat "Opteron" nebo klidně i jinak, zákazníci by se v tom určitě v této oblasti vyznali. Ty požadavky na server a na pracovní stanici mi nepřijdou natolik různé, aby okolo toho vznikla celá platforma.

0 +1-1 Je komentář přínosný?

Opterony(Naples) bude mezi sebou komunikovat 64 PCI-Express 3.0 linkami, tudiz i socket pro servry bude mit vic pinu jak AM44 urceny pro "bezne" konzumni spotrebitele.

+3 +1-1 Je komentář přínosný?

Ale to je blbost, na desktopové desce by ty piny byly nepoužité, nebo by mohly vést do dalších PCIe slotů. Stejně tak budou "hluché" i na desce s jedním Naples socketem, kterých bude IMHO naprostá většina. Socket je už jenom kus plastu s cenou nula nula nic a ta deska pod křemíkem procesoru taky. To mi neříkej, že se vyplatí v těchto kusových sériích vyrábět všechno "dvojmo", obzvlášť když jádro je stejné.

0 +1-1 Je komentář přínosný?
Obrázek uživatele no-X

„Stejně tak budou "hluché" i na desce s jedním Naples socketem“

Opravdu?

http://diit.cz/sites/default/files/amd_naples_q1_2017_11.png

+1 +1-1 Je komentář přínosný?

Aha, teď si to po sobě čtu a napsal jsem to samozřejmě blbě. Myslel jsem tím to, co píšu v první větě - že v zásadě nevadí, že by byly některé piny / linky v některých kombinacích nevyužité, protože samozřejmě nevyužité budou i u Naples - budou určitě existovat desky, které nebudou mít všechny linky (někam) zapojené.

0 +1-1 Je komentář přínosný?

Každá nožka v socketu navíc stojí celkem významné prachy (není to jen o ceně socketu, ale signály je taky třeba z té omezené plochy vytáhnout ven, takže se to odrazí na ceně MB), takže kvůli těm paměťovým kanálům a PCIe linkám navíc to musí být dva sockety.

+3 +1-1 Je komentář přínosný?
Obrázek uživatele Much Doge

Kdyby místo pinů používali kontaktní plošky LGA style, tak by tento problém neměli. To by to ale nesmělo být zabugované AMD dělající prapodivná rozhodnutí.

-15 +1-1 Je komentář přínosný?

Ty si fakt kvalitny troll. Len by ma zaujimalo, ci je to profesia alebo diagnoza

+7 +1-1 Je komentář přínosný?

Profesni diagnoza

+7 +1-1 Je komentář přínosný?

Jako že pin v PGA je náklad a pin v LGA náklad není? To je fakt divná dedukce

+9 +1-1 Je komentář přínosný?
Obrázek uživatele WIFT

Už jsem viděl inteligentnější humor.

+8 +1-1 Je komentář přínosný?
Obrázek uživatele Hrdina

pošli link ;)

0 +1-1 Je komentář přínosný?

Ano, kvalitativně mnohem lepší než příspěvky Much Doge :)

+3 +1-1 Je komentář přínosný?
Obrázek uživatele Hrdina

Dal bych ti ban za ten link...

-1 +1-1 Je komentář přínosný?

Marketingove je to v pohode. Intel ma HEDT, AMD postavi platformu proti tomu. Aspn se to bude jednoduseji srovnavat.
Tady tohle "kopirovani" AMD celkem uspesne praktikovalo treba v dobe Athlonu XP XXXX, kdy cislo udavalo vlastne srovnatelnou frekvenci Pentii, na kterych tenkrat Intel postavil cely marketing a brainwash :))

0 +1-1 Je komentář přínosný?

Nevim lidi jak vy ale ja nevidim ze by Intel sva soucasna sesti a vosmjadra doted razantne slevnoval :-), vzdyt ony ty slevy pridou kdyz se AMD dohodne s OEM prodejci hotovych sestav nakolik zakaznici budou na ne tlacit tak k tomu pride AM44 HEDT AMD platforma s 12 a 16 jadry za polovicni cenu.

+4 +1-1 Je komentář přínosný?

At to vydrzi co nejdele :D
Jsem zvedavy jestli Intel zareaguje po vydani R5..

+2 +1-1 Je komentář přínosný?
Obrázek uživatele Much Doge

Není důvod zlevňovat, AMD je horší produkt a proto je levnější.

-12 +1-1 Je komentář přínosný?

AMD je firma, ne produkt.. ;)

+4 +1-1 Je komentář přínosný?

Vím, že jste opravdu zoufalý, ale už je to k smíchu.
AMD sice Intel pohřbívá výkonem Ryzenů, ale přihodím speciálně pro Vás ještě jednu perličku. Intel v mainstreamu vede k M2 nvme .... podržte se .... neuvěřitelné 2 linky PCIEx3. To ostatně krásně dokresluje situaci proč vydal zabugované a nepoužitelné ssd600 nvme s ubohou rychlostí. Oni by totiž víc tim rozhraním ani neprotlačili. Vtipné pak je na netu pozorovat stížnosti uživatelů, kteří si koupili Lepší Samsung a nejde jim tím rozhraním procpat více než polovina výkonu toho ssd :)

Ryzen má na M2 nvme vyhrazené 4x plnotučné PCIEx3 linky a neomezuje tedy moderní ssd jako Intel :)

+4 +1-1 Je komentář přínosný?

diagnoza: intel-idiot

+2 +1-1 Je komentář přínosný?

A kde sú tie desktopové dosky s podporou ECC, ktoré nám pred rokom sľubovali ?

-2 +1-1 Je komentář přínosný?
+4 +1-1 Je komentář přínosný?

Prima ;)

0 +1-1 Je komentář přínosný?

Ja chtel taky Ryzen s ECC ... ale v ECC proste nejsou vysoce taktovane (pretaktovane RAM). Coz pro nektere pouziti nevadi, ale na domaci univerzalni pociutac vadi docela dost - ve hrach Ryzen krasne skaluje s rycheljsi RAM.

+3 +1-1 Je komentář přínosný?

Mne by zajimalo, co se skryva za tou revizi B2. Jestli jsou tam napr. nejake optimalizace s ohledem na CCX architekturu, pametovy radic a nebo jestli je to treba jen vylepseny proces..

0 +1-1 Je komentář přínosný?
Obrázek uživatele Much Doge

Marketing

-6 +1-1 Je komentář přínosný?

Pravda, jenom Intel je schopný prodávat vadné produkty a pak přijít s novou revizí, která to opravuje :) (nádherný příklad kdy v prodeji byly dvě revize základních desek a obě prodávali, i když první revize byla vadná)

+2 +1-1 Je komentář přínosný?

intel-idiote: "najlepsi", najzavadzajucejsi a najagresivnejsi marketing maju dve firmy: intel a microsoft

+2 +1-1 Je komentář přínosný?

asi spíš jen odladěné bugy, co nechytli v první prodejní revizi.. Zavádět nové featury nebo dělat rozsáhlejší optimalizace v tak složitém čipu je na dlouho a o hubu.

+2 +1-1 Je komentář přínosný?

Uz s tim spamuji, ale neda mi to :D
Trochu z jineho soudku..Ryzenu
Tak to vypada, ze optimalizace na Ryzen muzou fakt fungovat. AOTS dostal Ryzen optimalizacni patch na verzi 26118. narust vykonu dle nastaveni a pameti od 17-31%. Vykon skoro na urovni Intel 6900 :)
https://www.pcper.com/reviews/Processors/Ashes-Singularity-Gets-Ryzen-Pe...

+4 +1-1 Je komentář přínosný?
Obrázek uživatele Much Doge

To někoho reálně zajímá jeden benchmark od hry, kterou nikdo nehraje?

-10 +1-1 Je komentář přínosný?

Ano, protoze, ten kdo nosi v te skebly na krku mozek, tak vi, ze to neni jen o te hre, ale o tom, ze se da na architekturu Ryzenu optimalizovat a ta optimalizace pridava vykonostni boost. Coz muze byt zajimave napriklad prave pro hry, ale nejen pro ne.

+3 +1-1 Je komentář přínosný?
Obrázek uživatele Much Doge

To je sice hezké, ale váhu by to mělo pokud by se ta optimalizace objevila u několika desítek her a dalšího software.

Takhle je to, máme optimalizaci u jedné hry, yay!

-6 +1-1 Je komentář přínosný?

Opet, ten kdo v te skebly pouziva to co se nazyva mozek, tak dojde relativne jednoduse k zaveru, ze vzhledem k cca 1 mesici od vydani RYzenu, nelze ocekavat ze by optimlaizace pribyla "u nekolika desitek her". Zvlaste take proto, ze vetsina her nema s Ryzenem zadny problem. Problemovych je prave nekolik her...ale to by si misto toho troleni, musel delat taky neco jineho...

+2 +1-1 Je komentář přínosný?

Bral by som do úvahy aj typ hry, ktorá tie optimalizácie dostane. Real time stratégia je asi ten najlepší prípad, kde sa môže prejaviť zlepšenie kvôli efektívnejšiemu využitiu CPU. V takých FPS hrách by som očakával menší prírastok. Ale aj tak dobré. Len škoda, že sa to musí takto robiť per hra. Optimalizácie tohto typu by sa mali časom dostať do herných engine-ov.

0 +1-1 Je komentář přínosný?

Vsak presne tak. Ve vetsine her podava Ryzen srovnatelne vykony dokonce s i 7700k. Ty rozdily jsou vyjma pro "nerdy" v pohode. AOTS byla prave jedna z her, kde se ryzenu nedarilo, a jak videt, i tam muze podat slusny vykon. Do budouctna je to dobry prislib i treba presto, ze Intel na tom bude o neco lip, diky obecne vyssim taktum a vubec dominanci na trhu.

0 +1-1 Je komentář přínosný?

Jakožto nerd nemůžu souhlasit - nerdy ten herní výkon zas tak moc nezajímá.. Pleteš si to s geeky ;)

+1 +1-1 Je komentář přínosný?

:)

0 +1-1 Je komentář přínosný?

Tak AMD má zřejmě mnohem lepší dekodér pro Vector Path/složitější instrukce: https://www.youtube.com/watch?v=lN5mxFfkr7g

Pokud je to pravda, je tu slušný prostor pro doladění kompilátorů.

+2 +1-1 Je komentář přínosný?

16 jadro/32 vlakno, 64 PCI-Express linek, 128/256GB DDR4, Vega 10 a 3DXPoint, to mi bude na hrani Solitaire stačit a nebude se mi k tomu konecne sekat Total Commander :-).

+2 +1-1 Je komentář přínosný?

Tezko, Solitaire umi jen jedno vlakno a tohle ma nizkej kmitocet, takze na tom 60FPS nedas.

0 +1-1 Je komentář přínosný?
Obrázek uživatele Much Doge

Co když používá novou verzi Solitaire, která benefituje z velké L3 cache, umí používat AVX2 instrukce a je to brutálně paralelizované?

0 +1-1 Je komentář přínosný?

Pak mas smulu a na Intel+NVidia se ti to bude sekat a mne taky. Za to Waffer47 si bude uzivat skveleho vykonu pod Vulkan. Takze nakonec vidis, jak ses mylil, prvni Solitaire s touto technologii uz je na svete. ;-)

0 +1-1 Je komentář přínosný?

Áno, a celý názov tej hry znie "Ashes of the Solitaire", skrátene AOTS.

+1 +1-1 Je komentář přínosný?

To je ona, uzasny efekty otaceni karet pod Vulkanem, prej na to bude i patch pro VR.

0 +1-1 Je komentář přínosný?
Obrázek uživatele Hrdina

2+2 CCX moduly... by mě zajímalo, jestli mezi nima bude Infinity Fabric aneb na hry bez NUMA optimalizace to asi moc nebude.

0 +1-1 Je komentář přínosný?

Hry az na vyjimky typu AOTS jsou v pohode...
http://www.techspot.com/review/1360-amd-ryzen-5-1600x-1500x-gaming/
https://www.youtube.com/watch?v=Rhj6CvBnwNk

rozdil je maly (4+0 vs 2+2) viz video.

0 +1-1 Je komentář přínosný?
Obrázek uživatele Hrdina

Na tom je asi nejzajímavější to, že 1600 3+3 dává za nižší cenu i5-7600K v některých hrách na prdel.... bohužel jen v některých.

0 +1-1 Je komentář přínosný?

Tohle bude slepenc ze 4 die místo 2, tzn problémy Zenu kvůli MCM a defakto numa provozu přetrvaj, naopak budou ještě horší. Uplatnění tohodle CPU bude jen hodně omezené. I u video enkoderů to moc neškáluje nad cca 16-20 threadů (když jsem měl své 20C 22C a 2x12C Xeony tak se ihmo jelo bez HT), jedinej SW kterej škáloval tak vysoko byl rendering (typu cinebench) + ony vlastnosti Zenu v podobě dělenejch L3 a pod z toho neudělaj dobrej univerzální high-end, Intely se svou monolytickou cache tomu krom renderu vesněs vytřou zrak, ale aspoň do toho AMD jde. Dobré užití to bude mít v serverech třeba při mass virutalizaci a obecně provozu numa-aware aplikací, kterej je na desktopu přesně 0.

-3 +1-1 Je komentář přínosný?
Obrázek uživatele Hrdina

Intel taky není škálovatelnej L3-unifikovaně do nekonečna: https://youtu.be/Rhj6CvBnwNk?t=209

0 +1-1 Je komentář přínosný?

ten 16core chip je MCM ze 2 die a 8core Ryzen není slepený vůbec.. CCX != die

A zatímco komunikace mezi CCX je o něco pomalejší, komunikace mezi jádry v rámci CCX je zase o proti Intelu rychlejší (jsou tam propoje každý-s-každým a ne ring bus jako používá Intel).

+2 +1-1 Je komentář přínosný?

8 core Ryzen je slepenec dvou CCX. Je to slepenec protože ony dva CCX bloky se chovaj jak dva CPU a nijak spolu nekomunikujou, musej jít přes infinite fabric což je stejné jako kdyby šly do jiného CPU. Takhle se akorát přidá další slepenec pod die a máme z toho 16C 32T dělanejch jako 2x die 4x CCX bloky. Easy.

Co se týče toho, že padlo že ani u Intelu to nejde do nekonečna, tak Intel o tom ví, poslední total monolytickej byl Ivy-Bridge-EX, ale die dělá monolytické a ač je L3 dělená fyzicky (v současnosti u modelů nad 10C) tak mezi jejími částmi běží ringbus kterej jí sjednocuje aby se chovala jako monolytická. AMD potřebuje něco takového.

Intel do budoucna plánuje naject na novej model, kde uprostřed bude NB, kde bude L3, řadiče ram, PCI-E, případné GPU, prostě zbytek NB a na to se budou napojovat jednotlivá jádra která budou na separé křemíku a budou na menšim výrobnim procesu než onen NB. Dává to smysl. V současnosti spolu jádra nijak nekomunikují až do L3 cache, je tedy celkem fuk jestli jsou vůbec na stejný DIE. A samotná jádra bez cache jsou dost malá. Umožní to tedy na ně nasadit nejnovější proces co je zatim příliš zmetkovej na velký čipy, prostě NB a jádra budou separé na jinym procesu velde sebe pod jednim HS, něco jako byl Clarkdale, ale v mnohem většim měřítku.

-2 +1-1 Je komentář přínosný?
Obrázek uživatele Hrdina

NB, pokud má být North Bridge, tak místo toho je tam dnes Infinity Fabric a Ring Bus. Takže tvoje fabulace "co má kdo udělat" už udělali.

Moje obava, resp. zvědavost, je to, zda ty dvě die budou propojený Infinity Fabric či ne:
1) zda současné řezy mají možnost se škálovat tak, že Infinity Fabric se prodlužuje s nimi = vlastně to bude jeden die
2) zda to budou 2 die (dva ryzeny 1800) a procáky (2 CCX) mají vývody Fabricu pro další škálovatelnost, a je mi jedno, jestli budou od sebe 14nm, milimetr nebo centimetr (určitý interposer)
3) zda tam bude další vyšší sběrnice, nějaká pomalejší L2-Infinity Fabric optimalizovaná např. na vzdálenost do 10 cm
4) zda to bude řešeno přes memory controler bez obtěžování paměti
5) zda to bude řešeno naprosto natupo přes RAMku

0 +1-1 Je komentář přínosný?

Ale nejde o 2 die, jak jsi psal v OP.. A jestli jde nebo nejde o dva kousky křemíku je klíčové z hlediska latencí komunikace mezi CCX bloky. A rozhodně není pravda, že tato komunikace neexistuje a jedná se o "samostatné CPU". Abychom si to ujasnili, tak z pohledu OS je každé HW vlákno samostatné CPU (což reálně samozřejmě není pravda). Z pohledu HW probíhá různá komunikace mezi jednotlivými jádry (i mezi CCX).

Nejjednodušší příklad je přístup do L3. Pokud Core 0 přistupuje do paměti, která již je načtená v L3 (byť je načtena v rámci jiného CCX bloku), pak nebude provádět nové načítání do "své" L3, ale přistoupí do druhého CCX. Toto bude velice časté a byť nebude výkon při přístupu do L3 v druhém CCX tak dobrý, stále to bude řádově výkonější než přístup do paměti.

Další kritická záležitost jsou synchronizace vláken (semafory, spinlocky, apod.) Toto je ve vícevláknových aplikacích zapotřebí dělat vždy (a je to asi největší limitace paralelizace výpočtů) a používá se pro to samozřejmě paměť. Jakmile provede jedno vlákno změnu společné proměnné (zápis), označí se příslušné místo v cache jako "dirty" a tato informace musí být zpropagována v rámci celé cache. Ve chvíli kdy jiné vlákno přistoupí k dané společné proměnné (řekněme, že oba jádra ji mají ve své L1), zjistí, že je dirty a musí načíst aktuální hodnotu (z příslušné L1 cache). Tento problém paměťové koherence je poměrně složitý a existují různé přístupy přičemž jsem nestudoval jaké řešení zvolila AMD. Samotná synchronizace je ale poměrně pomalá (přístup do cache jiného jádra je pomalejší než přístup do své vlastní) a obzvláště mezi jinými CCX, kde musí probíhat přes Infinity Fabric.

Myslím, že optimalizace pro Ryzen zahrnují (mimo jiné) právě svázání jednotlivých, mezi sebou komunikujících vláken do jedné CCX může významně zvýšit výkon (méně čekání na synchronizaci + přístup do "bližší" L3). Samotný návrh Infinity Fabric je ale naprosto geniální - poměrně jednoduše a "levně" řeší problém škálování na větší počty jader (je mnohonásobně jednodušší vyrobit 4x 230mm2 křemíky než jeden obrovský). Při optimalizaci kódu (spolu související vlákna v rámci jednoho CCX) je také snížení výkonu v důsledku MCM minimální... Bravo AMD.

K dalším odstavcům:
Místo ringbusu má AMD právě Infinity Fabric. Obě řešení mají své výhody a nevýhody - ringbus je rychlejší když přistupuješ do těch "vedlejších", ale pokud potřebuješ přistoupit do paměti přes několik uzlů, výhody se ztrácí a bude naopak o dost pomalejší než IF, které dělá propoje každý-s-každým.

"V současnosti spolu jádra nijak nekomunikují až do L3 cache" - zdroj? Možná se to u posledních architektur (Skylake?) změnilo, ale co jsem to studoval, tak to rozhodně neplatilo. Dále je možné, že to tak je u Intelu (používá inkluzivní cache hiearchii - když jsou data v L1, jsou vždy i v L2 a L3), ale u AMD ne (ta nemá ani inkluzivní ani exkluzivní hiearchii - stejná data mohou být souběžně ve více úrovních a nebo jen v jedné úrovni)..

+3 +1-1 Je komentář přínosný?

Inkluzivita cache se má změnit u nadcházejícího Skylake-X tak jsem zvědavej.

Jen ještě dodam že Ringbus co má Intel mezi L3 bloky (npleťme si jej s QPI kterou používá při komunikaci s dalšim CPU) s infintie fabric nemá moc společného. Ta je právě nejvíce podobná QPI (a samotná je nástupcem HTT). Ten ringbus právě dělá že 24C broadwell má k dispozici 60MB cache. Ryzen má 2x8MB dual-CPU style. Koukat do druhé cache je děsně slow to nemá moc smysl, to už se pak jede přes RAM, ta je latentní a hned víme kde se dělá bottleneck.

-1 +1-1 Je komentář přínosný?

No nevim :) Ryzen 7 1700 at 3,85 GHz
http://valid.x86.fr/bench/acbljh

Ryzen 7 20 000 + bodů
I7-6950x 16 000 bodů necelých

Ideálně si povšimněte pozice i7-6950x aneb cpu za 50 000Kč :P

+2 +1-1 Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.