Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Vzorek výpočetního GPU Arcturus se 7680 stream-procesory běží na 878 MHz

Architektura Arcturu neni stejna s Renoirem - GFX908 vs GFX909. Renoir je novejsi. Arcturus je nekdy mezi Vega 20 a Renoirem.

Jinak graficke ovladace doufam nebudou - tristit sily vyvoje na Vegu s 8k shadery, ktera mela problemy se 4k, namisto Navi je nerozum.

+1
-1
-1
Je komentář přínosný?

> tristit sily vyvoje na Vegu s 8k shadery, ktera mela problemy se 4k

Kolik ma shaderu je z hlediska vyvojare ovladacu docela irelevantni. Nastavit pocet shaderu je asi tak 0.00001% prace na ovladaci.

A tipuju ze tahle grafika bude urcena pro velke zakazniky typu Google. Jake budou ovladace do velke miry urci zakaznik...

+1
+4
-1
Je komentář přínosný?

Tak jiste, ze samotny proces navyseni shaderu neni zadna magie. Tedy krom udrzeni skalovani (load-balancing, struktury, atd.)

Jakakoli investice do vyvoje Vega grafickych driveru pro Arcturus je ztrata casu - herni vykon bude s nejvyssi pravdepodobnosti oproti nV a Navi odpudivy. To je dano neefektivitou Vegy, ktera bude jeste umocnena dvojnasobkem shaderu.

+1
0
-1
Je komentář přínosný?

Když už připravili grafický ovladač pro Renoir, tak nejde o žádný velký problém. Ten ovladač existovat bude, jen jde o to, jestli bude dostupný i mimo laboratoře AMD. Nakonec AMD může Arcturus vydat i jako profesionální grafickou kartu, to je taky segment se solidně vysokými maržemi, kde se HBM snesou.

+1
+3
-1
Je komentář přínosný?

Tak Vega64 s HBM měla dost příjemnou cenu :) Mám ji doma...

+1
+1
-1
Je komentář přínosný?

Arcturus = CDNA

+1
0
-1
Je komentář přínosný?

Toršku škoda, lebo to zoberie AMD kapacitu výroby CPU, y úrovne, akú snaď mala naposledy v 80. rokoch minulého storočia v pomere ku predaju PC, ak vôbec

AMD bude do půl roku největším odběratelem 7nm čipů TSMC
6. 1. 2020
Největší objemy „7nm křemíku“ v současné době od TSMC odebírají Apple, HiSilicon a Qualcomm. Ne však na dlouho. Zhruba do půl roku všechny tři jmenované překoná AMD…
Samotná TSMC ve druhém pololetí zvýší výrobní objemy 7nm procesu ze 110 tisíc waferů na 140 tisíc waferů měsíčně a AMD, která bude odebírat 30 tisíc waferů měsíčně, tak s 21% podílem překoná HiSilicon i Qualcomm (17-18 % každý) a MediaTek (14 %).
https://diit.cz/clanek/amd-bude-do-pul-roku-nejvetsim-zakaznikem-7nm-vyr...

0,21*140 000=29 400 wafferov pre AMD mesačne

na waferi je cca 906 čipletov zďaleka nie všetky sú dobré)
pre 300 mm waffer :(pi*150^2)/78=906,...

lebo
Zen 2 čiplet je menší než nejmenší 7nm SoC Applu
28. 1. 2019
Zen 2, tedy Zen 2 čiplet, je při ploše ~78 mm² menší čip než první 7nm sériově vyráběný čipy vůbec, 83mm² Apple A12
https://diit.cz/clanek/zen-2-ciplet-je-mensi-nez-jadro-iphone-xs

Inak povedané Keby AMF robilo len CPU tak čipletov v H2 je
26 643 122/mesiac= 319 717 467 čipletov za rok

Výtěžnost 7nm čipletů Zen 2 prý nyní dosahuje 70 %
24. 4. 2019
AMD za pět týdnů představí a s odstupem pár dalších týdnů vydá architekturu Zen 2 v podobě desktopových procesorů Ryzen 3000 pro socket AM4. První várka použitých 7nm čipletů dosahuje výtěžnosti kolem 70 %…
https://diit.cz/clanek/vyteznost-7nm-cipletu-zen-2-dosahuje-70-procent

to dáva 223 802 226 dobrých Zen2 čipletov/rok podľa podukcie v H2 2020

Čo je pozoruhodné číslo aj pri zvážení, že CPU majú viac CPU čipletov a časť bude pre GPU. A uvidíme aké budú Zen3 čiplety

lebo
v roku 2019 sa predalo 261 240 000 PC na svete.
https://www.statista.com/statistics/273495/global-shipments-of-personal-...

+1
-1
-1
Je komentář přínosný?

Řekl bych, že 7nm výroba je už hodně levná, tudíž i kapacitně dostačující. Cena grafik se 7nm GPU+GDDR6 je podobná jako cena grafik se 14nm GPU+GDDR5.

+1
+2
-1
Je komentář přínosný?

Jasne. Ja somskôr chcel demonštrovť, že AMD má dosť čipletov, aby 8-jjadrovými CPU zaplavil PC trh

A to som uvžovalo 78 mm2 čipletoch a Zen2 má

Zen 2 / 7nm EPYC tvoří kombinace 7nm a 14nm čipletů!
7. 11. 2018
8× 7 nm (~73 mm2)
https://diit.cz/clanek/zen-2-tvori-kombinace-7nm-14nm-cipletu

a pri 73mm2

78/73*223 802 226 =239 131 145 čipletov

z 261 240 000 PC

teda AMD je schopné dodať
do
91,54 % PC 7 nm 8-jadové svoje procesory, ak by nevyrábali nič iné.

Povedzme, že významú časť viac čiplotových CPU -vrátane Epycov pokryjú 12nm CPU

12nm Ryzen 3 1200 již v prodeji, ceně kolem 1400 Kč zvyšuje výkon o 15 %
před 12 hodinami
https://diit.cz/clanek/ryzen-3-1200-af-yd1200bbafbox-vydan-vykon-otestovan

FRAMINGHAM, Mass., April 13, 2020 – The global traditional PC market, comprised of desktops, notebooks, and workstations, declined 9.8% year over year in the first quarter of 2020
https://www.idc.com/getdoc.jsp?containerId=prUS46214420

T.j.,m že pradjaje v Q1 2020 sú na úrovni 90,2% predajov v Q1 2019, takže AMD bude schopné vyrobiť viac 8 jadrových 7nm CPU ako bude predaj PC, ak jej z kapacity príliš veľa neodčerpajú GPU a viacjadrové CPU. Čo je stav najvyššej núdze pre Intel, keďže hlavným deklarovaným dôvodom nepoužívania AMD OEM partnermi bol
1. nižší výkon AMD
2. neschopnosť AMD dodať dosť CPU

A oba týmto prestali platiť...

+1
+3
-1
Je komentář přínosný?

Je fajn že se AMD daří, protože to bude potřebovat aby přežila. Je sice fajn že s 21% odběru 7nm TSMC překoná QComm, HiSilicon a Mediatek, nicméně součet jejich podílů je dohromady 17+18+14=49%, tedy 2,5x víc než AMD. A to nepočítáme Apple, který s HiSiliconem právě rozjíždí výrobu 5nm, nicméně pořád Apple bude vyrábět obrovské množství A13 na N7P pro nový iPhone SE a A12X na N7 pro iPad Pro.

Mimochodem dnešní spekulace ukazují že nová Applí A14 má existovat ve 3 variantách, přičemž jedna z nich bude 12-ti jádro s 8 velkými a 4 úspornými jádry, pro 2021 NTB MacBook. Pokud bude mít A14 jen pouhých +10% IPC proti A13, pak 1.84 x 1.1 = 2.02, tedy IPC vyšší o 102% než Zen2. Pokud ten Geekbench leak byl pravdivý a opravdu max frekvence bude 3.1 GHz (pro NTB, iPhony povýší tradičních 100MHz na 2.75 GHz), pak AMD Renoir by musel mít 6GHz aby se tomu Applu vyrovnal.

No a příští rok 2021 přijdou i nové Cortex jádra na zbrusu nové architektuře Matterhorn, která má dosahovat IPC starého Applího A12 (+65% IPC Zen2), což znamená že i obyčejné Cortexy budou super široká jádra se 6xALUs jako Apple, byť Apple již bude mít A15 a náskok 3 generací v architektuře. Navíc Matterhorn má být ARMv9 a má umět nové SVE2 2048-bit vektory. FPU mají být údajně vnitřně 2x256-bit, což je docela slušný upgrade z 2x128-bit NEONu. Apple má v A13 3xFPU, takže můžou jít cestou 4x128bit nebo 3x256-bit.

2021 se dále očekává nový serverový ARM Graviton3 založený na 128 jádrech Cortex A78 na 5nm.
2022 přijde serverová Nuvia s něčím monstrozním jako 8xALU + SMT2, samozřejmě také ARMv9 2048-bit SVE.
2022 pak serverová ARM Neoverse založená na Matterhorn.

AMD se bude muset se Zen3 a Zen4 v 2022 hooodně snažit aby se tomuhle šílenému tempu přizpůsobila. Je dost možné že AMD bude do tří let stát znovu před krachem, minimálně CPU divize. Ale grafiky na tom nejsou o moc líp. Mobilní GPU mají cca 5x víc FPS/Watt než klasické PC grafiky a třeba takový rok starý Snapdragon 8cx si sáhl na 2.3 TFLOP při cca 7W. Xbox One má 1.3 TFLOPs. Do dvou let tu můžou být mobilní notebookové GPU co budou mít 10 TFLOPs při cca 10W, tedy výkon podobný nové PS5 a XBXs, které si papnou svých 80-100W. Já se obávám, že nějaký Arcturus a CDNA to vůbec nezachrání a problémy bude mít i nV. To tvrdé mobilní prostředí plné konkurence prostě vydarwinovalo brutálně silné predátory, kteří si dají současné dinosaury k snídani. Fakt nevím čím tomu chtějí AMD s Intelem konkurovat.

+1
-3
-1
Je komentář přínosný?

>IPC proti A13, pak 1.84 x 1.1 = 2.02, tedy IPC vyšší
>o 102% než Zen2.

RISC(ARM) IPC < CISC (x86) IPC

lebo I je inštrukcia a jedna CISC inštrukcia nahradí bežne 5-12 RISC inštrukcií.. Takže ak Apple Axy nemá IPC o 400% väčšie ako x86, stále bude vždy pomalší.

+1
+1
-1
Je komentář přínosný?

1) To co já uvádím jako IPC je PPC, neboli performance per cycle. Tedy benchmark score na GHz. Tedy ten Apple A13 je REÁLNĚ rychlejší o 84% na stejné frekvenci než Zen2.

2) Moderní instrukční sada jako AArch64 (ARMv8.2) už zdaleka není čistá RISC. Ve skutečnosti se počet instrukcí liší asi o 10-15% pro AArch64 vs. x86-64. Těch tvých 5-12 násobek je velká neznalost problému. Uveď prosím zdroj, tedy pokud sis to nevycucal z prstu.

Když půjdeme technicky do hloubky, tak moderní x86 rozkládá CISC instrukce na RISC mikroinstrukce, přičemž makroOps fusion a jiné techniky způsobují, že mikroinstruce má Intel a AMD jiné, a tedy, že identický x86 CISC kód se rozloží na různý počet mikroinstrukcí u AMD a jiný u Intelu, a bude se to lišit i u různých generací Intel jader. Tohle je porovnání počtu intrukcí u identického kódu.

Citace:
i386___ instructions=6896517827 size=20761288034 3.01 bytes/instr
x86-64_ instructions=7445258067 size=25713146061 3.45 bytes/instr
aarch64 instructions=6691899327 size=26767597308 4.00 bytes/instr
arm____ instructions=7721825824 size=30796498138 3.99 bytes/instr
thumb__ instructions=7877291651 size=23736719388 3.01 bytes/instr

Vidíš že rozdíl mezi x86-64 a AArch64 (ARMv8) je pouhých 16%. 32-bit ARM Thumb instrukce dokonce vyjdou nastejno s 32-bit x86. A to je to kouzlo ARMu, jednoduchost a efektivnost, přičemž všechna výhoda složitosti CISC je v úspoře pouhých 16% kódu (a teoreticky i paměťové propustnosti, ale ta je sdílená s daty, takže prakticky ten rozdíl opět klesne). Plus všechen ten historický bordel co sebou musí tahat přináší x-násobnou složitost návrhu x86 CPU a jeho front endu a praktická výhoda zanedbatelná. Inženýři ARM CPU můžou víc času strávit nad věcmi ovlivňujícími výkon, proto jde vývoj ARMu rychleji kupředu. Navíc u ARMu si zákazník může prosadit do ISA to co zrovna potřebuje a má to pádný důvod. Viz jak Apple si prosadil 64-bit ARMv8(64-bit 4xALU Apple A7 přišla 2013 kdežto první 64bit Cortex A35 až 2015, to není náhoda), nebo nyní Fujitsu pro japonský superpočítač si prosadilo 2048-bit SVE, z čehož nakonec rozšířením vzniklo SVE2 jakožto náhrada i původních NEON vektorů. Intel ti nedá ani licenci abys mohl vyvíjet x86 procáky natož aby poslouchal co ty jako konkurence potřebuješ zlepšit v ISA. X86 je brutální zaostalá totalita ala Severní Korea kde být nechceš pokud máš na výběr. V AMD tam být musí, protože jediný důvod proč investoři nenechali zadluženou AMD zkrachovat byla jedna ze tří monopolních licencí na x86. To že AMD odpískala vlastní vývoj ARM CPU K12 je bude velmi brzy mrzet, protože kolem roku 2023 s příchodem Nuvie a Matterhorn jader bude ARM dominovat v serverech a bude jasné že vsadili na špatného koně. A bude už pozdě na vlastní vývoj. Ukazuje se že Keller měl pravdu, byť to v roce 2015 vypadalo že se s tím ARMem fakt zbláznil. Ale vizionáři prostě vidí dál než ostatní, to už tak bývá.

Zdroj zde:
https://forums.anandtech.com/threads/aws-graviton2-64-vcpu-arm-cpu-heigh...

+1
-1
-1
Je komentář přínosný?

Ty ve svých predikcích ale zapomínáš na jednu věc - ta rychlost vývoje u ARMu se bude výrazně snižovat taky, pokud se více rozšíří mimo mobilní zařízení. Budou si prostě muset zachovávat zpětnou kompatibilitu stejně jako x86 procesory. Server, který za 3 roky nebude kompatibilní s aktuálním softwarem (a naopak) si nikdo nekoupí...

+1
0
-1
Je komentář přínosný?

A copak dokážeš dnešní Win10 se SW využívajícím AVX512 rozběhnout na Core2Duo? Zapomeň. Nebo naopak WinXP na nových Ryzenech? Ne, nemáš ovladače. Prostě starou mašinu budeš provozovat s dobovým SW jak se to dělá běžně již dnes. Ta kompatibilita x86 je jen iluze. Proč udržovat v ISA 40let starý balast když obměna HW stejně nastává po zhruba 6 letech?

Takže nakonec je to jenom zbytečná brzda vývoje x86, což bylo vpohodě dokud to byl monopol a nebylo nic lepšího. Jenže teď je tady ARM a RISC-V a všechny start upy v Silicon Valley se x86 vyhýbají obloukem. Je to minimálně na zamyšlení.

Já v tomhle zpětně dávám kredit Kellerovi, byť jsem si taky v roce 2015 myslel že ukončit vývoj ARM K12 byl dobrý nápad. Dnes si to už nemyslím a za 3 roky to dojde všem. On věděl že Apple má ve vývoji 6xALU monstrum a že ARM je budoucnosti už z hlediska flexibility a otevřenosti. Ve stejné době Intel vyvíjel 4xALU Skylake a AMD se motalo na hranici bankrotu s 2xALU Bulldozerem.

Ty levná licencovatelná nová 6xALU jádra Matterhorn s IPC Applu A12, což je cca +65% nad Zen2 budou pro Intel a AMD hrob, jestli budou furt šmudlat ty svoje 4xALU. Proto si myslím, že Zen3 jakožto Kellerův pohrobek by mohl taky mít těch 6xALU, protože Apple ukázal že to je jediná rozumná cesta jak posunout IPC zase o pořádný kus dopředu. Je divné že narozdíl od Zen1 a Zen2 nemáme absolutně žádné leaky benchmarků, vůbec nic! Navíc samply Zen3 mají bloknutý SMT údajně z důvodu vady v návrhu. Což je divné protože takové problémy neměl ani Zen1 a to byl pro AMD první procák se SMT.

+1
-2
-1
Je komentář přínosný?

K té první otázce....to je ale něco jiného. Win10 rozběhnes i bez AVX512. Pokud máš ale spesl soft, který bez AVX512 nerozbehnes (což je podle mě blbost, viděl jsem už dost testu, kde je prostě AVX512 jen pomalejší, pac na něj procesor nemá nativně instrukce), tak je to záležitost proprietárního softu nikoliv otázky, jestli někde rozjedes systém.

+1
+1
-1
Je komentář přínosný?

Kompiler do kódu vsune různé cesty pro různá rozšíření a dle detekce potom běží tou kterou podporuje, byť samozřejmě pomaleji. To je známá věc. Nicméně i dnešní obyč exáč na K6-2 nerozjedeš protože existuje nějaké minimum a dnešní kompilátor deaultně podporuje minimálně SSE3, a pro 64bit je minimum myslím SSE4. Jinak si to musíš vynutit ručně, ale k tomu třeba velkou firmu jako obyč user stejně nedonutíš, takže stejně musíš koupit nový CPU tak jako tak.

Jinak nic nemám proti kompatibilitě. Uznávám že je důležitá. Nicméně nic se nemá přehánět a pokud by zbytečně brzdila vývoj a výkon CPU tak je třeba staré věci opustit a posunout se dopředu. Nových ARM CPU se vyrobí 1,4 miliardy ročně jenom v mobilech, PC se vyrobí cca 300-400 milionů.... to je obrovské množství a kvůli pár stovkám nebo tisícům případů, kteří vyžadují běhat nějaký prehistorický SW, je prostě hloupost brzdit 99,9999% uživatelů (tisíce vs. miliardy jsou poměr 1:1000 000).

Staré věci se dájí řešit emulací. Nebo kdyby ten SW psali v multiplatformní Javě, tak to můžou spustit úplně na čemkoliv. Ale to je šumák, pan Darwin a přirozený výběr to rozhodne za nás a my tady můžeme mudrovat jak chceme. Ale zatím to vypadá, že ARM totálně válcuje x86 v rychlosti vývoje, inovacích ISA, efektivnosti, vyšším IPC....jen se ty zázraky zatím nedají koupit. Jako ARM už podle mne vyhrál (teče tam nejvíc peněz) a je jen otázkou času kdy Intel i AMD budou dělat obě jádra, přičemž x86 postupně do 20 let chcípne. Samo že to nebude hned.

Aby x86 přežila, tak to by musela vzít útokem smartphony a to je zatím sci-fi kvůli Intelu a jeho monopolu. IBM taky radši nechala PowerPC architekturu chcípnout než aby to otevřela a začala soupeřit s Intelem. Prostě evoluce, dobré věci přežijí, špatné vyhynou jako dinosauři.

+1
-2
-1
Je komentář přínosný?

Jo tak to souhlasím. Mně tam neseděl ten příklad s AVX512. Jinak vím a asi je dobře, že nepodporujes cpu starej třeba 10 let (tech 10 let jsem si teď vymyslel, neber doslova). Díky za odpověď.

PS: zaznamenal jsem dříve vlny s mmx, sse, atd... Nikdy jsem neměl pocit, že to bylo nějak vynuceny. Ty instrukcni sady tu už nějakou dobu byly. Naopak uživatele byly motivovany do toho jít, jelikož např bez mmx jsi byl dost znevýhodněný, i když jinak ten soft běžel. AVX512 je zatím poměrně čerstvá záležitost, takže bych se divil, kdyby už někdo riznul natvrdo cpu bez nativní podpory.

+1
0
-1
Je komentář přínosný?

Ty si evidentne zadnej kod vyuzivajici AVX512 nevidel. Zadny compiler, ale dela se to rucnima optimalizacema v asembleru. Ostatne ono i dneska je spousta kodu, kde jsou rucne delany optimalizace i na pomerne stary veci jako SSE2, protoze to compiler udelat sam na takovy urovni nedokaze.
Stejne tak tvuj blabol na konci o PowerPC. Dopln si vzdelani, protoze IBM zalozilo OpenPower v roce 2013.

+1
0
-1
Je komentář přínosný?

x86 do smartphonu žádný výrobce nechtěl i když je intel jednu dobu dával skoro zadarmo

+1
0
-1
Je komentář přínosný?

Tvuj priklad s AVX512 je naprosto nesmyslny. To ze aplikace umi AVX512 vyuzit neznamena, ze ho i vyzaduje. Nikdo dneska nenapise aplikaci co ma behat na beznem pc tak, aby vyzadovala neco co se v beznem pc nemusi vyskytovat. Rika se tomu kompatibilita...

+1
0
-1
Je komentář přínosný?

Já ti nechci brát iluze, ale viděl jsi třeba software, který používá Česká pošta, různé databázové systémy a programy, které používají ministerstva nebo nemocnice? To rozhodně není výkřik poslední doby. I v USA používají státní úřady software z 80. let (viz nedávné články o hledání programátorů v COBOLu). Obměna hardwaru možná nastává každých 6 let, ale o softwaru to zdaleka neplatí. Toho starého softwaru běží po světě spousta, i na novém hardwaru, a zpětná kompatibilita je prostě nezbytná. Už jenom proto, že nikdy nevíš, co může vypuštění nějaké, zdánlivě nepodstatné instrukce udělat. A pokud budou chtít výrobci s ARMem v tomto světě uspět, tak se budou muset přizpůsobit, jinak prostě nebudou mít šanci.
Jinak souhlasím, že ARM má výhodu v relativní otevřenosti což umožňuje rychlejší vývoj, na druhou stranu to může taky do budoucna způsobit problémy. Bude dost těžké nějak rozumně ukočírovat podporu instrukčních sad v procesorech, které budou chtít pokrývat vše u ULV systému (nositelná elektronika) až po HPC systémy.

+1
0
-1
Je komentář přínosný?

Ako Sys admin z/OS a pracujuci uz nejaky rok s Cobolem a REXXom, mozem jedine suhlasit. Ten pajac menom 6xALU, zo seba robi kazdym dnom iba vacsieho a vacsieho traposka. :) Aj ked sa ta mainframe platforma vyvija postupne, kompatibilita je na prvom mieste a zaklad je tam uz desiatky rokov. Ale to panacek, co zije vo svojom imaginarnom svete, nepochopi. A to z/OS, aspon sa hovori, obsluhuje 70% dolezitych dat na svete. :)

+1
0
-1
Je komentář přínosný?

AVX-512 je

- Kladivo na čaroidějnice
- Děsnej chaos
- Yetti (přiznejte se kdo ho viděl)

Mohl by někdo zpracovat přehled které instrukce který procesor umí ?

+1
-1
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.