Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k „Malá jádra“ pro Zen 5 nebudou až tak malá, půjde o derivát Zen 4

Pokud je to pravda, tak by mě zajímalo, co tím AMD sleduje. Pokud mezi jádry nebude zásadní výkonnostní rozdíl, tak je otázkou, proč si vůbec komplikovat život dvěma druhy jader. To, že by měl být Zen4D nějak výrazně úspornější se mi taky nezdá, respektive proč rovnou neudělat Zen5D? Možná chtějí šetřit výrobní kapacity (Zen4D čiplet na 5nm, Zen5 na 3nm a centrální IO na 12+nm?), ale...

+1
-2
-1
Je komentář přínosný?

Alespoň zatím nic nenaznačuje, že by mobilní APU měla přejít na čiplety (ono je to energeticky náročnější, propojení má nějakou spotřebu samo o sobě).

+1
+1
-1
Je komentář přínosný?

právě ten údajný 6nm IO dává smysl jedině u těch mobilních produktů, kvůli spotřebě. Jinak co se týká desktopu a serverů vzhledem k prodloužené smlouvě s GloFo až do konce roku 2024 vypadá na IO die od arabů

+1
-1
-1
Je komentář přínosný?

Zatím od nich AMD může brát centrální čiplety, ale i celé procesory (stále se vyrábí i původní 14nm Epyc). Pozvolna mohou přejít na paměti, jejichž výrobu GF loni avizovala (HBM2, HBM2E, LPDDR4X, GDDR6…). Mohou to být i podložky (interposer), které se vyrábějí na starších procesech. Proč by od GF AMD nemohla brát třeba interposer s integrovanou SRAM? Nevím, jestli je to aktuální, ale dříve byly procesy GF vyhlášené tím, že (přinejmenším u čipů od AMD) vykazovaly výrazně vyšší denzitu SRAM než procesy/procesory Intelu. Myslím, že je stále dost toho, co o dění v GF nevíme - mohou existovat nějaké speciální dohody na míru.

+1
+7
-1
Je komentář přínosný?

no nejspíš budou brát nové IO die s HBM a 2,5D interposerem (které GloFo vyvinulo spolu s 12nmLP+ procesem) pro Milan -X a verzi bez HBM pro Zen 4 (Genoa a Raphael). Teda aspoň mě to přijde logické vzhledem k nové WSA, ale třeba se pletu.

+1
-1
-1
Je komentář přínosný?

Jo tak, přehlédl jsem, že řeč je o APU. Pak to pochopitelně kombinovat nemůžou. Tím pádem mi ale dává smysl nižší spotřeba (ale opět viz můj původní příspěvek) nebo menší velikost (ve smyslu úspory celkové plochy), ale opět - proč ne rovnou Zen5D? Je ale příjemné vidět, jak se x86 stále posouvá. :)

+1
0
-1
Je komentář přínosný?

právě že můžou. Podle těch informací to vypadá, že výkonné procesory budou postavené pouze na Zen 5 jádrech (Granite Ridge), zatímco APU (Strix Point) bude kombinovat big-little jádra na dvou ruzných architekturách ( a dvou různých procesech ?) s údajným 6nm IO die od TSMC, takže z toho mi logicky vychází, že ani to APU už nebude monolit

+1
-1
-1
Je komentář přínosný?

Zen4D jakožto ořezaná varianta Zen4 dává smysl.
- bude umět AVX512 jak Zen5, takže ISA bude konzistentní (ne jak Intelům Lakefield)
- Cortex A78 byl ořezaná varianta plnokrevné X1 - úspora cca -35% plochy při -19% IPC
- menší ROB, uOP cache, poloviční šířka FPU, užší dekodér
- Zen4D může mít IPC Zen3 při o dost nižší ploše (1/2), zejména vzhledem k Zen5
- Gracemont v Alder Lake má mít 1/4 plochu Golden Cove při 60% IPC GC.

Otázka zní, dožije se AMD vůbec roku 2024?
- nový Cortex X2 má +25% IPC nad Zen3, tedy vyšší IPC než spekulace o Zen4
- X2 podporuje L4 cache sdílenou i pro GPU, už dnes
- X2 je čistě 64-bit CPU, žádná 32-bit kompatibilita, Performance is king.
- serverová N2 umí až 256 jaden v monolitu a 512 jader s čiplety, DDR5, PCIe5, HBM2E
- 128-jádrová Altra MAX i se starými N1 jádry je nejvýkonější serverový CPU na světě
- 96-c Zen4 sotva dorovná starou Altru MAX na 7nm, proti novým N2 na 5nm nemá žádnou šanci.
- 2048-bit SVE2 vektory s dopřednou kompatibilitou absolutně rozsekají x86 na maděru

Ale tohle cenzurované info se tady na Diitu nedozvíte.

+1
-13
-1
Je komentář přínosný?

Hlavně příští rok budou nová CPU:
- ARM vydá po 4 letech kompletně novou architekturu Makalu
- Makalu bude určitě minimálně 6xALU + 2xBrach jako Apple A11-A14/M1
- tedy v mobilech Cortex X3 bude mít +20-25% IPC (+50% IPC nad Zen3)
- mobilní telefony budou příští rok atakovat ST výkon Zen3 na 5 GHz.
- HPC servery a superpočítače budou mít novou Neoverse V2 core na Makalu s IPC +25% nad Zen4

- Qualcomm/Nuvia Phoenix s +80% IPC nad Zen3 v druhé polovině 2022 pro notebooky s Win10
- Apple M3 na 3nm a 40-jádry vydrtí i 64-jádrové EPYCY/ Threadrippery (a ty AMD stejně prdí jak je vidět z nevydání Zen3 Threadripperu)
- Apple s jejich 40 TFlop GPU bude nejvýkonější GPU na světě.

5nm proces TSMC je o 30% úspornější než 7nm, takže 24-jádrový Zen 4 by neměl být problém i v rámci současného 105W TDP. AMD navyšuje TDP v desktopu na 170W, protože jí teče do bot a bude ždímat každý MHz stejně jako to dělá ze zoufalství Intel.

"x86 je mrtvé, mrtvé a ještě jednou mrtvé" pravila doktorka Lanstromová.

+1
-11
-1
Je komentář přínosný?

to uz presiel tyzden? :(

+1
+8
-1
Je komentář přínosný?

Týden uběhl:

1) Ohlášení nejvýkonějšího serverového CPU na světě - 128c ARM Ampere Altra MAX
- o 50% výkonější než EPYC
- je to největší monolit CPU na světě

2) vydání 3 nových CPU jader od ARMu
- IPC 25% nad Zen3 asi není dostatečná událost pro Diit
- premiéra L4 cache sdílené mezi CPU a GPU taky je nic
- GPU s výkonem 3,2 - 3,6 TFlop taky není nic zajímavého
- malý Cortex A510 má sdílenou FPU jako Dozer .... taky nezajímavé asi

3) Hlavně že se dozvíme na Diitu, že na Taiwanu neteče voda :)

+1
-7
-1
Je komentář přínosný?

128 jadrovy Ampere Altra Max prekona 64 jadrovy Epyc. #tyvolekdobytocekal
A ze nezminis v tomhle pripade IPC. Protoze tady ten arm je pekna tragedie i podle tvych prekroucenych meritek :o)

+1
+5
-1
Je komentář přínosný?

Většina serverů nevypíná SMT takže je to 128-vláken Altra MAX vs. 128-vláken Zen2 EPYC.

IPC ARM Neoverse N1 = zhruba IPC Zen 2
- N1 je mírně lepší v INT
- Zen2 je mírně lepší ve FPU

Plocha jádra:
- N1 ....... 1,4 mm2
- Zen2 ... 3,6 mm2
- proto 128-jader N1 = 1,4 x 128 = 180 mm2....monolit není problém.
- proto 64c Zen2 EPYC má 1005 mm2 a musí být rozdělen na čiplety.

Navíc 2x větší výkon na vlákno protože N1 nemá SMT.
Spoustu side-channel útoků odpadá protože N1 nemá SMT.

+1
-3
-1
Je komentář přínosný?

Není to třeba zmiňovat, protože Neoverse N1 není top a nikdo to netvrdí.
Hodně zastaralých a „jen pro mobil hodících se ARM prdítek" 128C/128T překonává novějších 64C/128T v podobě x86 výkvětu.
#tobychnecekal

+1
0
-1
Je komentář přínosný?

Je to treba zminovat, protoze ASCII z toho zase dela zazrak kterym to neni.

+1
0
-1
Je komentář přínosný?

Stejné IPC z 2,5x menší plochy a samozřejmě při menší spotřebě...... jestli tohle není zázrak jako zmrtvýchvstání Ježíše Krista, tak už fakt nevím.

To je právě průser pro x86, protože ARM zvyšuje IPC víc jak počet tranzistorů. Tudíž N2 má +40% IPC jako cca Zen4, ale jádro zůstane pod 2 mm2, což na 5nm bude pod 1 mm2 a to je masakr.

Příští rok uvidíme 256-jádrové N2 CPU které si 96c Zen4 dají ke svačině. Jak výkonem, cenou, tak i 2048-bit SVE2 vektory :D

+1
-4
-1
Je komentář přínosný?

"protože ARM zvyšuje IPC víc jak počet tranzistorů"

Tak tohle neplatí pro žádnou architekturu. Všechny architektury za poslední dekády vyždímaly několikanásobek IPC z tisícinásobku tranzistorů, takže nikde není žádné "IPC se zvyšuje rychleji než počet tranzistorů".

+1
0
-1
Je komentář přínosný?

Nemáš pravdu:
- Cortex A77 má +20% IPC ..... při +17% tranzistorů
- Cortex A78 má +7% IPC.........při -5% tranzistorů (počet se zmenšil!!!! )

https://images.anandtech.com/doci/15813/A78-X1-crop-7.png
https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

- Starý Cortex A72 taky měl vyšší IPC jak A57 a měl o 20% míň tranzistorů.
https://www.anandtech.com/show/9184/arm-reveals-cortex-a72-architecture-...

- To samé Cortex A73, větší IPC o 10% při -25% menším počtu tranzistorů:
https://images.anandtech.com/doci/10347/10.PNG
https://images.anandtech.com/doci/10347/12.PNG
https://www.anandtech.com/show/10347/arm-cortex-a73-artemis-unveiled/3

To že se v zaostalém x86 světě plýtvá tranzistory a tedy i energií to ví každý. V telefonu nebo tabletu kde šetříš každým Joulem energie v baterce si plýtvání nemůžou dovolit. Proto žádný x86 vyhnaný frekvencema nemá šanci.

+1
-4
-1
Je komentář přínosný?

jednou to ARM bude jako perpetum mobile, IPC vyroste o 100% a tranzistory už nezbudou žádné :-D

+1
+1
-1
Je komentář přínosný?

„It’s to be noted although we’re talking about big cores here, the A77 is said to be only 17% bigger than the A76 – still significantly smaller than the next best microarchitecture from the competition."

„When actually looking at an ISO-process node comparison with a similar core configuration (essentially what Arm expects to be most commonly implemented), we’re seeing the A78 improve performance by roughly 7% over a Cortex-A77, all while reducing power by 4% and reducing area by 4%."

Atd. Ono máš asi pravdu, že ta čísla jsou těžko pochopitelná a marketing dokáže neuvěřitelně mlžit, ale z celkového pohledu je vývoj ARM dynamičtější než u x86. Když je na koni Intel, tak vývoj zabetonuje, když AMD, tak nemá moc síly a peněz na razantnější kroky - tohle svět ARM nezná, hráčů je víc a každý z nich si může vybrat jestli a jak bude architekturu dál upravovat.

+1
-2
-1
Je komentář přínosný?

Inženýři ARMových CPU musí mnohem víc namáhat makovice a přicházet s chytrými řešeními, aby v mobilním světě přežili. Tam se řeší spotřeba na miliWatty.

Intel Ice Lake byl +18% IPC za cenu +34% tranzistorů.
Zen3 .................. +19% IPC za cenu +23% tranzistorů

AMD odvádí lepší práci než Intel, ale na ARMy to nestačí ani náhodou.

+1
-1
-1
Je komentář přínosný?

Já: "za poslední dekády"

Vy: "Cortex A77 má +20% IPC ..... při +17% tranzistorů, Cortex A78 má +7% IPC.........při -5% tranzistorů"

Asi máte problém odlišit dlouhodobý trend od chybového faktoru mezi sousedními členy.

+1
+2
-1
Je komentář přínosný?

Dřív to bylo snazší, ovoce bylo nízko.
Dnes zvyšovat již tak vysoké IPC a ještě zmenšovat počet tranzistorů je IMHO mnohem těžší.

+1
-1
-1
Je komentář přínosný?

1. Človeče spamätaj sa...ty porovnávaš niečo čo je tu už roky (zen2) a potom nový zen3 je tu už od 08.10.2020 (desktop), 15.03.2021 (server) s niečim čo je len ohlásené a ktovie kedy sa dostane na trh a v akom množstve. Kým bude tá "Ampere Altra Max" reálne dostupná kvôli výťažnosti (dostupná je len 64 a 80 jadrová Altra), tak už bude na dohľad 96 jadrová/192 vláknová "Genoa" alias Zen4. A to ešte predtým, konkrétne 01.06.2021 bude podľa všetkého ohlásený Epyc Milan-X a to bude tiež fajné spestrenie HPC segmentu kvôli véééľkej L4 Cache pamäti.

2. - IPC × pracovná frekvencia = reálny výkon ....samotné IPC je len jedna premenná v rovnici...
- 3 nové ARM CPU jadrá alias hybridný paper launch (rozumej reči ARM kmeňa...zákazníci naši, dajte si to podľa vzoru vyrobiť niekde ak chcete)...žiadny produkt reálne na trhu....Epyc Milan-X, klope na dvere a zrejme nám tiež prinesie L4 cache a to v rádovo GB veľkostiach a zrejme bude v kombinácii s "Instinct" kartami tiež zdieľaná medzi CPU a GPU...a to už ako reálny produkt dostupný o pár týždňov po ohlásení u vybraných partnerov.
- ARM Mali-G710 bude musieť zvádzať boj s Qualcomm Adreno 660 a hlavne so Samsung/AMD semicustom čipom K12/RDNA2

3. To že na Taiwane prakticky došla voda bude znamenať to, že nič z toho o čom píšeš nebude dostupné a ak áno tak za cenu extra prirážky za dovoz "drahej" vody z iných krajín, či odsolovanej a pod.

+1
0
-1
Je komentář přínosný?

1) Altra MAX je produkt Q4 2021, takže letos. Příští rok už bude 5nm Graviton3 s jádry N2 a 2-gen Altry.

2) To není paper lauch, první Cortex X2 SoC se objeví letos v zimě nebo v lednu. To znamená, že právě rozjíždí výrobu a mají funkční vzorky. Tedy IP dostali výrobci ARMů k dispozici v Q3 2020, už před 3/4 rokem.

+1
-1
-1
Je komentář přínosný?

Nejspíše to ale bude tak, že i v roce 2024 bude sračkoidní arm stále živořit na mobilech se zasekaným androidem a na čínských serverech kvůli embargu, jinak by kupovali x86 :)

+1
-1
-1
Je komentář přínosný?

1) Čína dostala embargo a už si na ARM ISA nevyrobí vůbec nic. Přechází na RISC-V a LoonsonArch.

2) Mobilní telefony jsou 7x větší trh než servery. Co by za to Intel s AMD daly kdyby tam mohli prodávat. Intel utratil miliardy USD když se snažil dostat neúspěšně do tabletů. A to tehdy ARMy měly sotva 1/3 IPC x86 desktopu a stejně dostal nakládačku.

3) Příští rok budou notebooky s 8-jádrovýma Cortex X2, IPC 25% nad Zen 3, frekvence kolem 3,2 GHz, to bude ekvivalent APU Zen3 na 4 GHz. Nevím nevím jestli 8c APU Ryzen udrží 4 GHz při all-core loadu.

4) Nezapomeň že to bude umět LPDDR5 6400 MHz a tedy v 2-ch a díky L4/SLC cache to bude mít 3,2 TFlop GPU, tedy 2x tolik co iVega a zhruba 1/3 co má PS5. Obyčejné licenční ARMy zmasakrují dnešní nejlepší x86 8c APU.

+1
-2
-1
Je komentář přínosný?

Ano, nepoužitelný ekvivalent Atom notebooků, to je zcela nový segment trhu :)

+1
0
-1
Je komentář přínosný?

Ubohý Cortex A72 v Raspberry Pi 4 má 3x větší IPC než Intel Atom v netbooku nebo NAS :)

Dnešní mobil má ST výkon vyšší jak 4-jádrový APU Ryzen 2400G.
Dokonce i v MT už letos dostane Ryzen naprdel od mobilu s novým Cortex X2.

Chápeš? Mobil v rámci 5W spotřeby naklepe prdel 3 roky starému desktopovému x86 APU se spotřebou 65W. To nemluvím o tom, že mobily dávno od roku 2020 mají DDR5 paměti na frekvenci 5200 MHz o čemž si dnes x86 desktop může leda nechat zdát.

A letos ARMy všichni povinně musí mít podporu pro 2048-bit SVE2 vektory - o tom si x86 může nechat leda zdát do roku 2030.

+1
-3
-1
Je komentář přínosný?

Pi 4? S tím můžeš leda ovládat žaluzie a stojí to litr :)

Mobil je dobrej možná tak na telefonování, ale pouze v případě, že se v zasekaném Androidu na nepoužitelném armu někam proklikáš :)

+1
-2
-1
Je komentář přínosný?

Pi 4 má 50% IPC Zen 2............. což není vyloženě špatný. Resp mnohem lepší než Atomy.
Pi 4 má 4-jádro, takže to výkonově vydrtí všechny Atomy i s jejich SMT.

Jsou šílenci co RPi4 zkouší rozchodit s RTX1080 nebo vznikají šílené boardy:
https://www.youtube.com/c/JeffGeerling/videos

Nepoužívej Android a kup si Apple, ta A14 výkonově drtí Zen2 a kdyby AMD vydalo slabší verze Zen3 tak by vydrtila i ty :)

Navíc Apple iPhone s novou A15 za 3 měsíce bude drtit i nejrychlejší Zen3 na 5Ghz. Sice jen v ST ale i tak docela ostuda jako prase, mobil drtí nejrychlejší x86 desktop a ani šílených 5 GHz mu nepomůže :)

+1
-6
-1
Je komentář přínosný?

Jediný co se drtí jsou tvoje kule ve svěráku, když píšeš tyhle hovadiny :)

+1
+2
-1
Je komentář přínosný?

Zatím to vypadá, že někdo tady má zdrcené ego že x86 dostává naprdel :)

+1
-3
-1
Je komentář přínosný?

Fakt jo? A kde? Že jsem to za nějakých 30 let co x86 používám nějak neznamenal? :)

+1
+2
-1
Je komentář přínosný?

Tak si vyměň dioptrie dědku nebo přestaň kecat do věcí kterým nerozumíš :D

+1
-4
-1
Je komentář přínosný?

Aha, takže výplod inkluzivního školství, už to chápu :)

+1
+3
-1
Je komentář přínosný?

To se poněkud mýlíš, s tím Rpi 4B. Z čeho myslíš, že zrovna teď koukám na Diit?

Mám na tom Ubuntu 64-bit s lehčím LXQt desktopem, systém na SSD přes USB3.
Jede to parádně, na konzumaci obsahu to dokonale stačí (umí to dva monitory FHD nebo jeden 4K), má to akceleraci H.265 (nižší bitraty samozřejmě, extra velké HDR10+ to nepřehraje, no ale na 3GiB+ filmy stejně nekoukám, stahuji menší provedení). Linux je úsporný, s tím "lighweight" desktopem to žere naprázdno jen cca 800 MB RAMky i při mnoha puštěných službách a serverech, i s posledním 5.x kernelem. Na web a Libreoffice zcela OK. Takže pohoda.

Stačí to i na programování - ve skriptových jazycích, C/C++, Rustu, ... přes Visual Studio Code, třeba.
Dávno to není mašinka s výkonem leda na to "stahování žaluzií".

+1
+3
-1
Je komentář přínosný?

Jo, RPi 4 už má celkem slušný výkon, a hlavně více RAM.

+1
+1
-1
Je komentář přínosný?

Cortex A72 má IPC jako Dozer, cca 50% Zen 2.

RAM čipy to má LPDDR4 na 3733 MHz což nemá ani většina PC :)

+1
-2
-1
Je komentář přínosný?

Ve specifikaci vidím RAM 3200. To je jako mobilní Tiger Lake, když chce člověk více než 32 GB. Jo, není to úplně shit.

+1
0
-1
Je komentář přínosný?

čipy jsou 3733 MHz, ale běží na 3200 MHz. 32-bit bus.

Latence? Víc nezvládá řadič? Kdo ví proč.

Třeba to půjde přetaktovat :D

+1
-2
-1
Je komentář přínosný?

Tak to je zajímavé tvrzení, protože když jsem to měřil v několika úplně jiných softwarech, tak mi výkon RPi4 oproti 3.8 GHz Skylaku vycházel vždy zhruba pětinový. Což vychází na poloviční výkon na takt oproti Skylaku, ne oproti Zenu 2.

+1
+1
-1
Je komentář přínosný?

Protože běží na mnohem nižší frekvenci (a i tak dost topí).

+1
0
-1
Je komentář přínosný?

To jsem samozřejmě zohlednil, protože jinak bych nemohl výkon na takt vůbec porovnat.

+1
+1
-1
Je komentář přínosný?

Tak tak, to se ASCII nějak netrefil...
Cortex A72 je furt ještě slaboučký procesůrek, IPC ARMům v8/v9 začaly více zvedat až ty poslední generace. A78, X1, X2, A710. Běží to (v tom RPi 4B) jen na 1,5 GHz. Nicméně na linuxový desktop to více než stačí, s těmi 8 GB RAM už to je vážně slušné. Hlavní slabina RPi 4B je ta mizerná GPU.

Kdyby udělali RPi 5 s nějakou modernější verzí ARMů, s lepší GPU... a mohli by tam fláknout i nějakou tu AI akcelerační potvoru, když už, tak už. Uvidíme časem.

+1
0
-1
Je komentář přínosný?

Cortex A72 v RPI4 má zhruba 50% IPC Zen2.
To je 2,5x větší IPC jak Atom v neboocích.
Oproti RPI3 které má in-order Cortex A53 je to dělo se skoro dvojnásobným iPC

Stačí se podívat do databáze GB5.

+1
-1
-1
Je komentář přínosný?

Nechcelo by sa Ti na tom vyskúšať Handbrake a prevod väčšieho fHD videa do h265 (preset slow, cq = 26)? Q6700 dá cca 1,3 FPS (100min video prerobené za cca 30-32h).

+1
0
-1
Je komentář přínosný?

Dobrý nápad, zkusím to.
Tak až převedu "větší fHD video do H.265", tak se ozvu, počítám tak za rok asi by to mohlo dojet.
:-D

Fakt nevím, H.265 to má hw posílený dekodér, ale s převodem (dekodovaní H.264 a kodovaní do H.265) to bude určitě velmi bídné.

+1
0
-1
Je komentář přínosný?

Q6700 to dá za 30h, podstatne novší ARM to nedá aspoň za o čosi kratší čas?

+1
0
-1
Je komentář přínosný?

No mňa by zaujímala tá "ASCII-ho" obľúbená "M1-ka" ako rýchlo to dá cez CPU jadrá :-) . Pre porovnanie moja už "výbehová" Ryzen 5 3600 (6jadro/12vlákien, Zen2) dáva v 10bit x265 , slow presete a CQ26 (1080p) priemerne 13fps a presne 5 minútové video dala za 9m36s (interpoláciou to dáva na 100minutové video za cca 3h12m).

Ja používam na videá preset "medium" a CQ24 pri 1080p a "medium" a CQ20 pre 2160p...tiež som začínal so "slow", ale nevidel som rozdiel v kvalite a paradoxne to dalo o pár MB väčší súbor :) . Hľadal som kompromis medzi kvalitou a veľkosťou a skončil som na MEDIUM preset-e (já bych si dal taky to MÉDIUM :-) )

+1
0
-1
Je komentář přínosný?

Typoval som, že R5 5600X je 10x výkonnejší ako môj Q6700, ale ako vidím, už R5 3600 je 10x lepší :)

+1
0
-1
Je komentář přínosný?

No Ryzen 5 3600 drží takty v handbraku na cca 4Ghz na všetkých jadrách a nielen 3.6Ghz base clock. Už Zen 2 vie veľmi rýchlo "chrúmať" AVX2, ktoré pri x265 sú riadne cítiť.

+1
0
-1
Je komentář přínosný?

CPU pro mobily a laptopy s povinným SVE2 nebudou mít ani zdaleka fyzické 2048-bitové jednotky, minimum je podle specifikace 128 bitů (jako NEON). Proč plýtvat křemíkem na něco, kde práci beztak mnohem lépe odvede GPU (nebo nějaký akcelerátor)?

+1
+1
-1
Je komentář přínosný?

Nejde o to, že dnešní SVE2 mají jen 128-bit FPU.

Jde o to, že dnes investuješ do optimalizace SW pro 2048-bit FPU a ta poběží na budoucích Armech za 10 let se 1024-bit FPU jako z praku, resp 8x rychleji než na dnešních CPU.

AVX512 ti výkon v AVX2 SW na dvojnásobek nezvýší. SVE2 ano.

SVE2 s podporou až 2048-bit FPU přináší dopřednou kompatibilitu na cca 20 let. To je prostě revoluční věc. Asi přijde SVE3 a další, ale co se týče šířky to bude furt flexibiliní, to je geniální.

+1
-3
-1
Je komentář přínosný?

"AVX512 ti výkon v AVX2 SW na dvojnásobek nezvýší. SVE2 ano"

To ale nemůže platit ani pro SVE2, pokud tepelný výkon čipu bude omezený. Pokud budete neustále zdvojnásobovat počet vykonané práce na instrukci, dostanete se do stavu, kdy se podíl tepla generovaného výkonnými jednotkami bude asymptoticky blížit jedničce. V takové situaci každé zdvojnásobení počtu jednotek výrazně sníží frekvenci. SVE/SVE2/RV32V/RV64V jsou sice lepší instrukční sady, ale ani ony nemohou porušovat přírodní zákony.

+1
0
-1
Je komentář přínosný?

AVX-512 v nejnovějších 10 nm CPU už tolik frekvence nesnižuje, takže SVE2 na nejlepším procesu TSMC dá přinejmenším 512 bitů bez problémů. Pořád to ale bude kulhat daleko za GPU, proto třeba ani M1 nemá nic lepšího než Neon.

+1
0
-1
Je komentář přínosný?

Nejvýkonější super počítač je postaven čistě na CPU-only a drtí s-c postavené na obřích GPU od Nvidie. Proč? Protože obrovská latence mezi CPU a GPU. Když máš v kódu nějaký IF tak se to musí poslat do CPU s obrovskou latencí, kopírovat data mezi VRAM a RAM, nutnost programovat zvlášť CUDA/GPGPU a zvlášť CPU, no prostě hromada heterogenních problémů.

Ten Japonský Fugaku má vodou chlazený 48-jádrový ARM CPU Fujitsu A64FX který je krmen HBM2 pamětí přímo na čipu (obří propustnost, minimální latence) a využívá jen 2x 512-bit SVE FPU. A drtí všechny x86 + GPU s TEORETICKY obřím výkonem, ale v praxi nedosažitelným.

A drtit bude, protože ani dvojnádobný počet CUDA/shaderů nezmenší latence PCIe sběrnice. Naopak, nové superpočítače na ARMu velmi brzy můžou přijíst s 2x 1024-bit FPU nebo 2x 2048-bit FPU. Nebo třeba s 4x 2048-bit FPU, takže výkon vzroste celkem jednoduše 8x. Plus můžou znásobit počet jader.

+1
-2
-1
Je komentář přínosný?

Co to žvaníš, ti už úplně hrabe? GPU podmínky ("ify") zvládá stejně jako CPU, ostatně AVX-512 původně vznikalo pro GPU. Je nejvyšší čas na další ban, tohle už se fakt nedá číst.

+1
+2
-1
Je komentář přínosný?

1) Jakmile na GPU chceš řešit skoky tak výkon jde do háje, některé věci GPU neumí vůbec a nebo tak pomalu že CPU je řádově rychlejší. Zkus si nabootovat Linux na GPU a pak mi přijď dát ban :D

2) AVX512 pro GPU to ses asi musel zbláznit ne? Knights Mill mělo x86 CPU jádra, tak se laskavě prober.

3) Nejrychlejší super-počítač na světě je CPU only - TEČKA.

+1
-2
-1
Je komentář přínosný?

1) Zdroj? Pokud vím, tak Čína mohla zablokovat (a blokovala) akvizi ARMu Nvidií, tak nechápu jak by mohli v tomhle systému pravomocí odříznout Čínu od ARM.

+1
0
-1
Je komentář přínosný?

1) Huawei / HiSilicon dostal ban pro všechna jádra od ARMu už minulý rok. Poslední co vydali byl Kirin 9000 s jádry Cortex A77 z roku 2019.

2) Zároveň dostali ban pro výrobu u TSMC, takže si něco vyrobili do zásoby a letos Huavei mobily musí přejít na čipy od Mediateku a Qualcommu.

3) Letos Čína dostala ban i pro stroje, komponenty a SW pro vývoj čipů a výrobních procesů.

Čína nejspíš zablokovala Nvidii koupi ARMu, což je jenom dobře.

+1
-1
-1
Je komentář přínosný?

Přesně tak to je.

Dalo by se jenom dodat, že stejně tak típnuli Číně další vyspělejší Zen návrhy - přes VIA a AMD se dostali Číňani k vlastní výrobě procesorů pro servery na bázi Zen1, ale pokračování nebude...

Takže Žluťáci chtě nechtě musí narvat peníze a úsilí do vlastního průmyslu a návrhu. Jelikož situace s ARMem je přes (dočasnou, však oni to Amíci nějak obejdou) blokaci prodeje NVidii do budoucna pro Čínu zcela neperspektivní, musí potlačit vlastní procesorové návrhy a technologie. Asi na bázi těch svých MIPS64-like čipů a nového RISC-V.

Amíci dělají v posledních desetiletích jednu sebevražednou akci za druhou. Tohle je extrémně sebevražedný krok, pro USA a celý slavný "Západ". Do 20-ti let ze západních polovodičových fabrik budou brownfieldy. Slavné ICT značky časem překoupí Žluťáci. Ono to při "genderové matematice s kritickou rasovou teorií" stejně jinak dopadnout nemůže. Za 20 let prostě celé ICT bude "poněkud dožluta".

+1
-1
-1
Je komentář přínosný?

Přesně. Sranda bude až Nvidia opravdu koupí ARM a zničí jej jako Intel zničil původně otevřenou x86.

Čína se ani nemusí nějak zvlášť snažit, stačí jim nechrápat a nešpuntovat vývoj jako to dělal Intel skoro dvě dekády.

+1
-1
-1
Je komentář přínosný?

Zen5 má mať, podľa prvých únikov, IPC o 40% vyššie ako Zen4.

To je v súlade s autorom

> s ohledem na očekávatelný rozdíl jedené generace
>Zenu rozhodně nepůjde o rozdíl násobků IPC,

Ale 40% je nárast IPC medzi Zen4 a Zen2 alebo rozdiel medzi Zen a Bulldozer podľa plánu (reál +52%)

Takže to význam má..

+1
0
-1
Je komentář přínosný?

Jake uniky to jsou? Muzete je zdokumentovat? Link na ten unik, nebo alespon clanek/forum kde se to probira?

A vysvetlim vam jak 5 letemu znovu... narust vykonu mezi Bulldozerem a Zen1 nemuzete brat jako nejaky nastup trendu. Bulldozer mel hromady uzkych hrdel a spatnych reseni. Z tech nejvetsich jmenuju: nedosazene planovane takty, spatny planovac (AMD to melo brat jako 4 jadra s SMT, a ne 8 jader - to udelali kvuli marketingu), spatne predpovidani, spatna sprava instrukcni fronty... Zadny ze Zenu uz ale netrpi takovym prusvihem, cili rikat ze kdyz se to podarilo jednou pri prechodu na Zen je indikace toho, ze se to nejspis podari i pri prechodu jedne generace Zen na dalsi je HOVADINA!!! Kazdy kdo to pouziva ma v hlave exkrementy!

+1
0
-1
Je komentář přínosný?

40% IPC nárůst u Zen5 je jen vlhký sen AMD fanoušků poté, co zjistili že Apple M1 má o 60% vyšší IPC než Zen 3.

Vzhledem k tomu, že Apple M2 bude mít letos +80% IPC nad Zen 3, tak si někdo vysnil že Zen5 by mohl překonat letošní M2 z roku 2021.

Technicky vzato by Zen5 pokud by měl podobně širokou architekturu jako Apple A11 z roku 2017, tedy 6xALU + 2xBranch + 3xFPU, tak by těch 40% nad Zen 4 bylo reálné. Zejména s využitím SMT by nemusel být problém s vytížením jednotek.

Problém bude spotřeba odporné zastaralé x86 s variabilní délkou instrukce z roku 1978, navíc uzavřený monopol s naprosto zastaralýma AVX512 které dodnes po 7 letech skoro žádný SW nepoužívá. Proti tomu bude ARMv9 s variabilní délkou vektorů až 2048-bit jako povinný standard pro všechny.

Než se Zen5 objeví na trhu tak už tady bude tuna SW optimalizovaná pro 2048-bit SVE2. A to nemluvím že se chystá hromada super počítačů na ARM- SVE: EU, Korea, Japonsko.

+1
-7
-1
Je komentář přínosný?

Fanousky AMD naprosto nijak IPC u M1 netrapi. Fanousci AMD totiz nejsou retardovani jako uzivatel ASCII a chapou, ze pocet jednoduchych armovskych instrukci za clock u M1 nelze nijak srovnavat s poctem komplexnejsich CISC instrukci za clock u x86. Takze je uplne fuk jaky IPC ta M1 ma. Nas zajima vykon a tam v desktopu realne M1 vykonove konkuruje pouze lowendu od AMD. A taky na zajima, ze Apple ignorovanim specifikaci Armu.Takze jen M1 ma v cpu bezpecnostni diru M1RACLES.

+1
+6
-1
Je komentář přínosný?

ARMv8 binárka má 1,16x víc než x86-64 binárka.
ARMv8 instrukcí je potřeba 1,09x víc než x86-64 instrukcí.

To jenom kdybys nevěděl jaký je skutečný rozdíl mezi RISC ARMv8 a CISC x86-64 :)

Hlavně když IPC je jako výkon/GHz, tak to s instrukcema, ISA nebo OS nemá nic společného :D

Apple M1 prostě má +60% větší IPC jak Zen 3 .................. game over x86 ;-)

+1
-4
-1
Je komentář přínosný?

A kdyz retard nevi co je IPC, tak tam nacpe treba velikost binarek :o) Jak kdyby to psal Babica (a mozna i ten by o tom vedel vic nez ASCII)....

+1
+1
-1
Je komentář přínosný?

A že jsi nám tady nenapsal ty, kolik je třeba instrukcí pro běh identického C++ kódu?

PPK opět neví a píše nesmysly jako obvykle. Ještě tě to baví se tady veřejně ztrapňovat? :)

+1
-3
-1
Je komentář přínosný?

Retarde a vis o tom, ze vygenerovany vysledek se umi dost zasadne lisit pouzitim ruznych compilatoru. Pouzitim ruzneho nastaveni. A ze i kdyz pouzijes stejny compilator se stejnym nastavenim, tak ti v tom udelaji krasny gulas optimalizace, protoze ty se dost zasadne lisej podle toho pro jaky cpu se to generuje. Takze i kdyby ses na hlavu stavel, tak nemuzes porovnavat pocet instrukci... Coz by si byval vedel kdyby si mel alespon elementarni znalosti. Jenze ty ses jen retard bez znalosti co porad dokola opakuje nesmysly jak zaseknuta deska.

+1
+4
-1
Je komentář přínosný?

Samozřejmě je použito stejné nastavení GCC pro obě ISA aby to bylo porovnatelné.

Tebe to sebeztrapňování vyloženě baví, že? :D

Spíš to bude tím, žes vůbec neměl páru že ARMv8 je tak dobrý ve srovnání s tou fosilií x86-64.

+1
-2
-1
Je komentář přínosný?

GCC a porovnatelny ? Za mych mladych let se rikalo, ze GCC kod nekompiluje ale ze si to vymysli. A i dneska se clovek divi, co to z toho sakra vypadlo za bordel. A ty budes povidat pohadky o porovnatelnosti. Ja nechapu, jak to delas ze s kazdym postem dokazes jeste vic ukazat jak moc ses mimo realitu.
Moje x86 fosilie stale dava na prdel tomu tvymu vychvalovanymu M1. Fosilni ryzen 7 1700x vydany na jare 2017. Vyrobeny na historickych 14nm. S ubohyma 4.8 miliardama tranzistoru ma v cinebench R23 8805 bodu. A ta tvoje uzasna hypermoderni M1 vydana na podzim 2020. Vyrobena na modernich 5nm. S 16 miliardama tranzistoru ma v cinebench R23 jen 7760. Jednoduchy cisla. Historicka x86 8805 bodu vs moderni arm 7760 bodu. Arm prohral, zase...

+1
+2
-1
Je komentář přínosný?

Aha, takže ty už jsi v důchodu jo? No to leccos vysvětluje :)

Pane důchodče, ten váš starý Ryzen 1700X si v ST dávají ke snídani už i Androidí telefony, víme? :)
Letošní Cortex X2 si v mobilu namaže na chleba i Ryzeny 3700, Apple si je maže dávno :)

PS: Jak se pozná AMD fanboy když mu teče do bot? Vytáhne skore v Cinebech :D Nejlíp srovnat 8-jádro Ryzen proti 4-jádru Apple/Intel. Taková IT cigánská férovka :D

+1
-5
-1
Je komentář přínosný?

Porovnavam realne produkty. No a pak je tu ASCII ktery misto porovnani realnych produktu dostupnych na trhu z neho udela neexistujici jednojadrovy produkt, protoze jen takovym zpusobem mu muze vyjit lepsi vykon u produktu ktery ho celkove lepsi nema. A furt bude prekrucovat a lhat a vymyslet uzasne produkty, ktere svet nevidel. A ty vychvalovat do nebes, protoze jednou, mozna, nekdy dokaze nekdo neco takovyho vyrobit.

+1
+1
-1
Je komentář přínosný?

A já vezmu reálný 80-jádrový ARM Altra a srovnám ho s reálným 6c Ryzenem 5600X..... a AMD dostane neskutečně naprdel :D

Však už se ti to krátí a 8-jádrový Apple M2 už se blíží. Už se těším jak budeš kvičet :DDDDD
Kvííííííííííííííííííííííííííííííí

+1
-4
-1
Je komentář přínosný?

Ano M2 bude vykonejsi nez muj 4 roky stary x86. A co se stane ? No jen to porovnam s novejsim x86 a zase dostane arm na prdel. Stale bude mit arm vyhodu v novejsi vyrobni technologii. Stale bude mit arm o miliardy tranzistoru vic. Stale bude arm vyrobne vyrazne drazsi nez ta x86. A stale to nebude armu na x86 stacit...
Ostatne jaky procesor mas v pocitaci ? x86... ani nejvetsi arm troll siroko daleko na armu nejede.

+1
+1
-1
Je komentář přínosný?

Hoďte na ně někdo deku…

+1
-1
-1
Je komentář přínosný?

Nejsem Arm troll. Já jsem pravověrný AMD fanda za dob Kellera. To byl masér už když makal na K12. Keller dává na benchpress 120 kg a to je mu 62 let :) To je jinej řízek než ta korporátní pipina z IBM s tlustou prdelí.

S příchodem 8, 16 a 32 jádrové M2 se všem rozsvítí že Keller měl pravdu s K12. Třeba konečně pošlou tu tlustou prdel škodit někam jinam.

+1
-4
-1
Je komentář přínosný?

"Já jsem pravověrný AMD fanda"

...a další pohádky, které můžete dětem číst před spaním. :)

+1
+3
-1
Je komentář přínosný?

Máš doma AMD 8088 z roku 1984?

Tak mlč a nepřepínej :D

+1
-2
-1
Je komentář přínosný?

Například mám doma nějaké ty Intely, ale nikdy jsem nebyl fanouškem Intelu, takže mi ta souvislost uniká.

+1
+1
-1
Je komentář přínosný?

Som zvedavý čo budeš hovoriť keď v Samsung mobiloch (a nielen v nich) bude 5nm semicustom čip s K12 a RDNA2. Nemám nič proti ARM-u, sú segmenty kde má svoje miesto.

Benchpress to je taký GeekBench pre kvázi svalovcom....ale skús im dať odniesť aspoň 50-60kg drevený hranol na 50metrov, len tak v rukách, kde väčšinu váhy držíš nielen chrbtom a ramenami, ale hlavne kritická záťaž je na prstoch rúk a predlaktí, ktoré nemáš zavretú v päsť...to nieje ako držať činku..to väčšina nedá...neudýcha. Skutočný siláci nie sú v posilňovniach, ale na stavbách a podobne, čo pracujú rukami každý deň... ale to som odbočil od témy.

+1
0
-1
Je komentář přínosný?

„ani nejvetsi arm troll siroko daleko na armu nejede."

LOL.

+1
+1
-1
Je komentář přínosný?

Nic jako "troll" neexistuje. Spravne se tomu rika krasnym ceskym slovem na "D".

+1
+1
-1
Je komentář přínosný?

80jadrovú a 150-250W Altru sem neťahaj, tá sa do desktop či mobilného segmentu nikdy nedostane, je to serverový produkt. Navyše ty si to pletieš...M2-ka bude pre výkonné mašiny, čiže 16jadrová a zrejme aj 32 jadrová...8 jadrová je M1-ka a výhradne pre Apple ekosystém...čiže takmer nulová upgradovateľnosť a nulová servisovateľnosť mimo záruku a apple servis.

+1
0
-1
Je komentář přínosný?

Ale ale....M1ka je zrazu 4jadro? Ja som myslel, je 4+4 (big + little) jadro a používa všetky jadrá súčasne...aj silné aj slabšie a neprepína ich, čiže je to také asymetrické 8jadro. Ešte aj Apple ho nazýva ako 8core.

Uvedom si, že Zen1 bol už na trhu, keď M1 bola len v počiatočnej fáze návrhu. Ak chceš porovnávať, tak porovnávaj buď cenovo obdobné produkty, čiže Apple MacBook Air (M1) vs Lenovo YOGA 14c Ryzen Edition 2021, prípadne HP OMEN 15-en1001nc (oba s 15W Ryzen 7 5800U, zen3), alebo aspoň čipy porovnaj na výkon vs počet tranzistorov... M1 vs Cezanne = 16mld vs. 10.7mld.

+1
0
-1
Je komentář přínosný?

"Za mych mladych let se rikalo, ze GCC kod nekompiluje ale ze si to vymysli"

Takže už "za vašich mladých let" byl GCC kvalitní kompilátor? Každý dobrý současný kompilátor si "vymýšlí" svůj výstup. Kdyby kompilátory nepřišly s něčím lepším, než co vyprodukuje průměrný assemblerista, k čemu bychom je vůbec potřebovali?

+1
0
-1
Je komentář přínosný?

O kvalitach GCC muj post nebyl. Ale kdyz to musi byt. GCC tehdy umelo vyprodukovat rozbity kod, protoze to s tim vymyslenim prehanelo. Dodnes ma napriklad linuxovy kernel workaroundy na nektere z problemu. Ja jako widlak sem nastesti v te dobe s GCC nedelal. Kolem me to jen okrajove probehlo pri dobehu nekde v dobe GCC 4.7 - 4.8. Uzivatel si tehdy chtel zkompilovat moji aplikaci ze zdrojoveho kodu pro nejaky MIPS. A zaroven "aby to bezelo rychleji" tak zmenil -O1 na -O3 nebo tak nejak. A nejaka optimalizace z O3 tehdy zpusobila, ze GCC vygenerovalo rozbitou binarku. V GCC 4.9 uz se problem nevyskytoval.

+1
0
-1
Je komentář přínosný?

Tak u MIPSu bych se až tolik nedivil. Ona ta uživatelská základna ani v té době nebyla ani zdaleka srovnatelná.

+1
0
-1
Je komentář přínosný?

"Hlavně když IPC je jako výkon/GHz, tak to s instrukcema, ISA nebo OS nemá nic společného :D"

IPC je průměrný počet provedených instrukcí za jeden cyklus v nějaké konkrétní zátěži. Je to přímo v názvu, "Instructions Per Cycle". Takže o tom, že "to s instrukcema nemá nic společného", bych docela úspěšně pochyboval.

+1
+1
-1
Je komentář přínosný?

IMHO jde spis o to, ze se nedaji binarky na ruzncyh platformach 1:1 porovnavat podle velikosti a na zaklade toho vynaset jednoznacne soudy. V principu je to podobne i se 'stejnym' MPlatformovym softem, typicky treba GB, kde se bezne porovnavaji vysledky 1:1. Pritom nikde neni zaruka toho, ze ty vysedky odpovidaji nejakemu obecnejsimu schematu. Duvody si myslim dokaze kazdy najit.

+1
+1
-1
Je komentář přínosný?

Ascii, drive 6xALU, predtim jeste RichieRich, tohle ale nechape.

On si vali svoji dogmatickou a prekrucuje zavedene pojmy a jasna fakta tak aby se mu to libilo.

A kdyz mu vyvratis jednu jeho teorii, zacne si prikrucovat druhou. Tedka na to jde pres velikost binarek :D Drive napr. tvrdil, jak je ARM super a demostrnoval to superpocitacem na ARMu zalozenym, i kdyz ten je prave mnohem mene efektivni, nez ten zalozeny na x86.

Cas od casu tu dostane banana za ty jeho nesmysly, tedka se z jednoho akorat dostal, tak tu pleveli zas.

+1
0
-1
Je komentář přínosný?

My docela chápeme, že M1 poráží x86 procesory, jenže víme, v čem a proč. Ve třech vybraných benchmarcích z deseti - ve zbytku hanebně propadá. A potřebuje na to cca o třetinu víc tranzistorů. Takže se nekoná žádný zázrak.

A taky chápeme, že applí šunty s M1 ožily, ony by totiž ožily i se Zen3 a nejspíš mnohem víc. S osm let starými Intel Core to opravdu nebylo nic moc. Já vidím, jak mi ožil noťas, a to má proti předchozímu Intel Core jen Zen2.

+1
+2
-1
Je komentář přínosný?

Energeticka efektivita neni linearni. Kazda architeltura ma nejake optimum v urcite kombinaci frekvence a spotreby.

Takze napr. Zen4D muze byt maximalne efektivni pri frekcenci 2GHz, kdezto Zen5 jadro pri 4.5-5GHz.

Takovahle kombinace jim muze dovolit lepsi rizeni spotreby, nez by dovolilo jen proste nastavovani taktu(power stavu) pro jednotliva jadra, jak je tomu doted.

A stejny instrukcni set znamena vyrazne mensi naroky na planovac.

+1
+2
-1
Je komentář přínosný?

Vyznam by som hladal v klasickej formulke "x nm proces firmy XXXX poskytuje v porovnani s x+y nm procesom o zz% mensiu spotrebu pri rovnakej frekvencii, alebo o vv% vyssie frekvencie pri rovnakej spotrebe". Proste shrinknu zen4 na mensi proces, cim ziskaju nejake % TDP k dobru a tie mozu presypat do energetickeho balicka zen5, ktory s tymi Wattmi nalozi lepsie (meritko performance per watt).

Da sa tak ziskat krapet lepsi many-thread (partial load) vykon. Na single thread to asi vplyv nema, pretoze tam bude obmedzenim len tolko, kolko elektriny dokaze spalit jedno jadro bez sebedestrukcie a lepsia spotreba v nizkom loade, kedy sa mozu vsetky thready presuflovat na zen4 jadra, ktore budu zrat menej.

Ak urobia die shrink Zenu4 kvoli nejakemu medzigeneracnemu produktu, trebars nejakemu mobilnemu APU, ziskaju tie jadra v podstate zadarmo.

+1
0
-1
Je komentář přínosný?

SLC Infiniti cache, nástup DDR5 a nahrazení Vegy RDNA2 architekturou. Budoucnost vypadá pro APU hráče nádherně. :)

+1
+2
-1
Je komentář přínosný?

Možná slovíčkaření, ale co to znamená v tomto kontextu SLC? Dle mne Second Level Cache, ale to je v rozporu s uváděním L4 (Fourth Level Cache). Single Level Cell (SSD) neodpovídá této úrovni HW a nic jiného mě kromě Mercedesu nenapadá.

+1
+2
-1
Je komentář přínosný?

System Level Cache?

+1
0
-1
Je komentář přínosný?

To jako fakt nebo domněnka ? Co já si pamatuji, tak bývávalo L1, L2, L3 ... LL . System cache byla každá z nich ...

+1
+1
-1
Je komentář přínosný?

"SLC znamená System Level Cache a označuje cache nejvyšší úrovně, ke které mají přístup všechny (nebo alespoň všechny významné) komponenty SoC / APU. V našem kontextu tedy jak GPU, tak CPU."

z minulého odkazovaného článku z dubna (https://diit.cz/clanek/infinity-cache-pro-apu-amd-nejspis-chysta-neco-le...)

+1
0
-1
Je komentář přínosný?

Děkuji za dovzdělání.
Marketingové oddělení Apple nás má pořád, co učit :-) Ale jo, dává to smysl ...

+1
+1
-1
Je komentář přínosný?

SLC jako sdílenou cache pro GPU, CPU a NPU jako první zavedl Apple v roce 2017 u A11 Monsoon.
- v tichosti bez marketingu, Apple ostatně tají vše co se týče jejich architektury
- srovnejte s HSA a Fusion is Future u AMD, roky PR masáže a nakonec NIC
- takže AMD bude mít u Zen5 v 2024 konečně SLC po dlouhých 7 letech

Tohle úterý byl vydán Cortex X2:
- zvýšení IPC o 16% nad X1 (ten byl +10% nad Zen3)
- tedy Cortex X2 bude mít +20-25% IPC nad Zen3, masakr
- X2 už nemá 32-bit compatibilitu!!!! Zahodili 32-bit dekodér a uvolnili tranzistory pro max výkon
- X2 má také L4/SLC cache sdílenou s GPU a NPU
- X2 je samo ARMv9 a umí chroustat 2048-bit SVE2 vektory vyvinuté pro superpočítače
- L3 cache má 5x větší propustnost a max 16 MB
- až 4-ch LPDD5 ....míří na výkonné APU pro notebooky, případně konzole (MS Xbox?)
- GPU bude umět cca 3,2 TFlops 32-bit float, takže skoro 2x víc jak iVega a víc jak Apple M1
- poprvé bude možná konfigurace s 8x Cortex X2
- ARM míří jednoznačně do NTB, to bude masakr x86

Ale tohle byste věděli, kdyby tady na Diitu nebyla cenzura, že :)

+1
-9
-1
Je komentář přínosný?

Bože, ale ten čas letí :( ale za dve týždne bude aspoň výplata!

+1
+4
-1
Je komentář přínosný?

Jak chudý na duchu člověk musí být, aby neměl radost z uvedení zbrusu nových CPU a GPU jader?

Navíc s IPC lepším jak Zen3 a hromadou velmi zajímavých vychytávek jako L4/SLC. Takto si představuji "logiku" voličů komunistů. Nenávist ke všemu novému a nedejbože i lepšímu.

+1
-9
-1
Je komentář přínosný?

Nelibi se Apple firma / Apple CPU / Apple fanbois -> jasnej komous. Takhle si predstavuji "logiku" iOvecek.

+1
+6
-1
Je komentář přínosný?

Ale já nejsem zastánce Applu. Nemám od nich jediný HW. Nejsem jako JirkaK.

Všichni víme že díky Intelu se v zatuchlých vodách x86 nejméně 10 let chrápalo. To že Apple a ARM předběhl x86 včetně AMD je prostě holý fakt. Každý si může vzít benchmark a vypočítat body/GHz. To IPC Applu a těch nových ARMů je prostě fenomenální.

Já jsem zastánce vyspělé techniky a nezajímá mne jaká ISA nebo brand. Upínat se k AMD nebo k Applu je stejně stupidní, protože ty nejlepší produkty vytvořili inženýři, kteří z těch firem dávno odešli. Je lepší sledovat stopy inženýrů než adorovat značku. Proto s nadšením očekávám Qualcom Phoenix jakožto klon Apple M2.... dost možná mnohem lepší CPU než M2, protože Gerard Willams jakožto autor Phoenixu je autorem revoluční 6xALU A11 z 2017 i té nové 8xALU A15/M2.

+1
0
-1
Je komentář přínosný?

Zatím nepředběhl. Spíše to vypadá, že ARM dospívá a dotahuje. Ale zároveň s tím vyspívá a dotahuje i (řekněme) x86 architektura ARM. První co se týče výkonu a druhá co se týče energetické efektivity. A podle všeho, světe div se, se k sobě postupně přibližují. Ono to tak prostě v jednom a tomtéž vesmíru, kde platí jedna jediná sada přírodních zákonů, ani jinak nejde.
Takže až budou tyhlety "suprový" ARMy k mání a budou na nich postavené PC, budeme moci reálně srovnávat.

+1
+4
-1
Je komentář přínosný?

To co píšeš platí pro desktopy, kde se uplatní vysoké frekvence kolem 5GHz. V serverech, noteboocích a nebo mobilech už x86 prohrává brutálně snad skoro všude. Navíc to vypadá, že AMD se zbláznilo a zatímco Keller tlačil na úspornost a vysoké IPC, Zen1 byl s frekvencemi cca 3,6 - 3,8 GHz, což je ideální pro servery a notebooky, tak AMD se snaží za každou cenu dostat se Zen3 na 5 GHz. Přechod na K12 a na ARM instrukční sadu taky Keller viděl jako správnou volbu co týče efektivnosti.

S tím jak AMD chystá navyšovat TDP pro desktopy na 170W, tak to vůbec nevypadá, že chtějí konvergovat na úroveň ARMů. Naopak to vypadá, že se v AMD opět dostali k moci stejní dementi jako za dob Dozeru.

Však srovnej 4-jádrový Apple M1 se 4-jádrovým Tiger Lake. To je masakr jaký dostává klepec.
Dokonce i 8-jádrový Zen3 s dvojnásobným TDP a 16-vlákny není bůhví jak lepší. Letos jak vyjde 8-jádrová M2 tak všichni budou vykulení když si dá 8c Ryzen ke svačině při poloviční spotřebě.

To vůbec na konvergenci nevypadá, to vypadá na jednoznačnou smrt x86.

+1
-6
-1
Je komentář přínosný?

> S tím jak AMD chystá navyšovat TDP pro desktopy na 170W
> k moci stejní dementi jako za dob Dozeru

... hovno. Teda presneji bic. Vyberes si jeden nahodnej faktor (tady TDP, jindy IPC, jindy frekvence), totalne ignorujes kontext, a pak z pletes z hovna bic.

170W na 4jadro je hodne. 170W na 24/32 jadro, pokud to bude mit 2x nebo vetsi vykon jako 5950X, bude znamenat lepsi efektivitu, a zakazniky si to najde. Mozna ne hodne, ale najde.

+1
+3
-1
Je komentář přínosný?

Proč AMD navyšuje TDP ze 105W na 170W (tedy o +62%) když 5nm TSMC ušetří 30% příkonu proti 7nm?

Pokud zvýším počet jader o +50% na 24c, pak by mělo AMD stačit +15% TDP, tedy 125W.
Pokud zvýším počet jader o +100% na 32c, pak by mělo AMD stačit 160W (210W / 1,3).

Tedy 170W TDP a reálně přes 200W spíš indikuje příchod 32-jader.

AMD se bojí Apple M2, 32-jádrová M2 s IPC +80% nad Zen3 totiž vydrtí všechny 32c Ryzeny a EPYCy. Vlatně při tom skoro dvojnásobném IPC to bude spíš drtit 64c EPYCy :D

Největší sranda bude příští rok M3 na 3nm, IPC +100% nad Zen3 (+11% nad M2) a frekvencemi kolem 4 Ghz. To AMD nepomůže ani Zen4 na 8 Ghz :P

+1
-2
-1
Je komentář přínosný?

5nm ušetrí 30% príkonu oproti 7nm, ale pri rovnakom počte tranzistorov a frekvencii. A daj si Diazepan a už to tu nespamuj.

+1
+1
-1
Je komentář přínosný?

“ Však srovnej 4-jádrový Apple M1 se 4-jádrovým Tiger Lake. To je masakr jaký dostává klepec.”

Náhodou mám oba (oba 8 jader BTW) a M1 vede jen o fous, přičemž není jasné, nakolik se projevuje rychlejší paměť a SSD u Maca. Oba mají i slušně výkonnou GPU. Apple může letos Intelu utéct jen zvýšením počtu jader (u “M1X”). Kdyby byl Tiger Lake na 5 nm, tak možná vyhraje.

+1
0
-1
Je komentář přínosný?

"Však srovnej 4-jádrový Apple M1 se 4-jádrovým Tiger Lake. To je masakr jaký dostává klepec"
.. pises naproste kraviny. Apple zadny "4-jadrovy" CPU nema. Ty mala jadra, ktera si "vynechal" jsou ve vydledku schopny pridat 30% vykonu navic. Staci se podivat na testy CB23, kdy ST vykon Mac mini je cca 1500b, ale MT ma 7800b. Pokud by mel pouze "4C" tak se dostane na cca 6000b. V tom pripade je jen o neco lepsi nez TL-U, ktere ve sve 28W variante dava okolo 5500. Rozdil okolo 10% u tveho hypotetickeho 4C M1 se urcite neda nazvat necim zazracnym.
Krom toho je problem Intelu stale v jeho podstatne horsim vyrobnim procesu.

+1
+1
-1
Je komentář přínosný?

"Jak chudý na duchu člověk musí být, aby neměl radost z uvedení zbrusu nových CPU a GPU jader?"

Není třeba mít radost z něčeho, co si člověk nemůže koupit, nainstalovat na to vlastní software neomezený velkou firmou, atd.

+1
+2
-1
Je komentář přínosný?

Radost by měli mít všichni zákazníci protože ceny x86 CPU dost výrazně klesnou vlivem zvýšené konkurence - nikdo x86 nebude chtít kupovat.

Na Cortex X2 s IPC +25% nad Zen3 pojede Win 10 a Linux jako z praku.
Qualcom Nuvia Phoenix s IPC +80% nad Zen3 taky Win 10 + Linux.

To je nádhera. Akorát doufám že to není vlivem inkoustu z olihně beznaděje :D

+1
-1
-1
Je komentář přínosný?

Uz se nemuzem dockat, az podas reference jak to ve skutecnosti beha. Teda az nekdy v budoucnu nejaky z tech tvych vysnenych armu fakt vydaji a ty si ho konecne poridis misto ty fosilni x86 co mas ted....

+1
+1
-1
Je komentář přínosný?

Na RPI4, která má 4-jádro Cortex A72 a 4 GB LPDDR4 3733 MHz RAM běhá desktopové Ubuntu jako víno. Výkon 10x vyšší jak netbooky s Atomem a bez chladiče při spotřebě 4W. To všechno za 1500 Kč :)

Jedinou výhradu mám k výstupu na 4K monitor. Na 2x HDMI výstupech umí jen 2x FHD současně. 2x 4K monitor bohužel neumí. Na tom by mohly ještě zapracovat.

+1
+1
-1
Je komentář přínosný?

A to je presne ono. Mesice tu basnis o uzasnych supervykonych armech. A kdyz dojde na lamani chleba s realnym armem tak vytahnes lowend v podobe raspberry pi. Neco co v x86 svete konkuruje atomum. Tem atomum co by normalni clovek nedoporucil do desktopu ani nejvetsimu nepriteli...

+1
0
-1
Je komentář přínosný?

Občas básnil i o M1, ale o to přece nejde. Je to jako se zajímavými prototypy, které už prokázaly svoje kvality, ale díky molochům se ne a ne dostat do výroby. Proč se běžný člověk dostane jen k M1 a předražené microsoftí zkriplenině a nemá na výběr z vícero moderních řešení? Naštěstí je už jasné, že se tohle pomalu mění a na výběr bude. Když už jsou v serverech, tak je to jisté.

+1
0
-1
Je komentář přínosný?

To máš jednoduché - velcí výrobci do toho půjdou až bude k dispozici masový spolehlivě použitelný softwarový ekosystém (apple už ho vytvořil, zbytek světa bohužel ne - armové windowsy jsou zatím v podstatě beta a linux má rozšíření takové jaké má). A když se podíváš na servery, tak to co se masově nasazuje jsou většinou servery které si firma vytvořila sama pro sebe, do volně prodávaných serverů se ARMy taky nějak moc masově nehrnou.

+1
+2
-1
Je komentář přínosný?

"Masový spolehlivě použitelný softwarový ekosystém" tady už mnoho let je, říká se tomu linux. Nebo FreeBSD, nebo ... Nakonec i ty ARM-ové wokenice jsou někde funkční, v tom je ten nejmenší problém.

Jiné architektury - první asi ARMv9 - se ihned chytí samozřejmě v serverech, na počátku u těch cloudových operátorů Amazon, Microsoft, Google (a pár dalších větších). Protože ti si udělají vlastní procesory a servery nebo to někde nakoupí (a danou firmičku pro jistotu pozřou, aby to konkurence neměla také). Je to prostá otázka výkon/cena - kdo z nich se na to vykašle, bude mít vyšší ceny služeb nebo bude méně vydělávat a tak bude mít méně peněz na rozvoj. Otázka přežití a rozvoje, nic více.

Jakmile si Microsoft postaví Azure cloud na ARMv9, přeportuje všechen svůj soft na ARMv9 také, protože pokud výkon nových klientských mašinek s ARMv9 bude vysoký a bude to levnější, tak kdyby to ignoroval, nějaký linuxový producent ho vymete i z klientského trhu. I z korporátního. Což ostatně dnes při katastrofě s Windows10 není daleko - hodně velkých firem vážně zvažuje, že s Microsoft wokenicemi učiní krátký proces... prů*erů a to velmi drahých, bylo s W10 v poslední době až moc. Dost možná to ale dopadne naprosto opačně: Microsoft zahodí wokenice sám a udělá si vlastní distribuci linuxu... ani to není vyloučené, dokonce to je poměrně pravděpodobné.

Samozřejmě, nebude to hned "zejtra", bude to pár let trvat, třeba 5 nebo 10, ale dojde k tomu. Že x86-64/AMD64 nebude vůdčí a nejvýkonnější architektura. Nikdy samozřejmě nezmizí, dalších třeba 50 let se bude emulovat... ale na jiném železe.

+1
0
-1
Je komentář přínosný?

Nepopírám že linux je skvělý systém, ale u end userů není masový (můžeš s tím nesouhlasit, můžeš proti tomu protestovat ale to je tak všechno co s tím můžeš dělat, stačí kouknout na statistiky). U MS se spekuluje, že by mohl šoupnout linuxový podvozek pod windows API ale klasickou distribuci jak ji vnímáme dneska asi neudělá. Jinak jestli se nemýlím, Azure už z části na Linuxu jede, akorát to mají tak šikovně udělané, že je od toho zákazník odstíněný. Jinak s předpověďmi na delší období bych byl optarný, může přijít nějaký objev v non-silicon technologiích spolu s novou architekturou CPU a všechno dosavadní skončí v propadlišti dějin, nebo přijde průlom v AI a operační systémy jak je dneska známe budou považované za něco naprosto zastaralého a primitivního :-)

+1
+1
-1
Je komentář přínosný?

Souhlas, v podstatě se všemi body.

Jen si myslím, že starý "Wintel" je mrtvý, a že vazba mezi Windows a x86-64/AMD64 je dnes už minimální. Microsoft by mohl docela snadno udělat rekompilaci všech wokenic a software na Aarch64, nepochybně už to udělali, jen to neprodávají - a nabízet heterogenní software. V nějaké formě, přímo jako executable binárky, zahrnující více cílových ISA (což už dělali v době šílení s tím svým Windows Mobile/Phone posledních verzí, než to zařízli - ty jejich "univerzální aplikace", UWP) nebo přes emulační vrstvu, jako to dnes dělají jableční lidé.

Takže tento "problém" vlastně žádný problém ve skutečnosti není, už to řešili a nějak jim to fungovalo, dokonce spolu s další složitostí - že šlo o aplikace pro desktop i mobil/tablet najednou, s rozdílným uživatelským rozhraním. Není prostě už léta pravda, že na ty vyspělé ARMv8/9 Aarch64 architektury není potřebný softwarový environment, jiný než linux nebo ostatní Unix-like OS. Windowsy na tom chodí už léta.

A jistě, Azure používá jako nosnou a výkonnou infrastrukturu hlavně linuxové servery. Od počátku, což je velmi ironické samo o sobě - že neuznal své vlastní Windows Servery s tou jejich virtualizací hodné nasazení do vlastního cloudu. Zjevně ví velmi dobře, co to je za dáreček... :-D

Jistě, principiálně nová polovodičová technologie, která pojede na radikálně vyšších frekvencích, je klidně možná. Ovšem má to četné "ale", napadají mě hlavně dva body:
1) 5 GHz je z hlediska VF elektromagnetických vln už značná "duchařina" sama o sobě, kdy jakýkoliv kousek vedení správné velikosti a impedance funguje jako vysílací/přijmací anténa a jsou tam tedy vysoké ztráty a přeslechy. V dnešních počítačích je 5 GHz jen uvnitř procesoru, venku se jede maximálně do těch 2,4 GHz, výše problémy lavinovitě narůstají jak sněhová koule na svahu. Pokud to stoupne na 10 GHz nebo třeba 50 GHz, jenom se to velmi zhorší - takové počítače budou vypadat úplně jinak, nepůjde to dělat dnešním způsobem - se základní deskou, konektory, čipy v soklech, dlouhými sběrnicemi, ... Všechno bude muset být impedančně přizpůsobeno, chráněno proti rušení, místo drátů budou muset být používány vlnovody atd. Z VF hlediska to vidím značně komplikovaně až nemožně. Jestli taková věc bude, celé to ultra-vysokofrekvenční čudo bude nakopané rovnou do jednoho čipu, a ven to pojede "pomalu" (do 2,5 GHz) jako dneska.
2) Až se taková technologie objeví, skočí po tom státně-bezpečnostní složky, tedy vojensko-průmyslový komplex a armády a nepustí to z ruky. Do civilu se to nedostane, a jestli jo, tak za mnoho a mnoho let.

Průlom v AI a radikální změna architektury počítačů a operačních systémů, no nevím. Průlom v AI bude, je právě teď. Instalační báze AI systémů roste raketovým tempem, ale pořád se jedná o velmi chabé AI, použitelné na velmi úzký rozsah problémů, a samotný název "umělá inteligence" je silně parodický, mělo by se to jmenovat úplně jinak. S inteligencí to nemá vůbec nic společného - jsou to stupidní "neuronové" sítě a každý maličký brabenec je mnohem "inteligentnější" než celá dnešní instalovaná AI báze na celém světě. V tomhle jsme na samém absolutním počátku, není třeba podléhat přehnanému optimismu.

+1
-1
-1
Je komentář přínosný?

MS dávno Windows pro ARM64 prodává, má už druhou generaci Surfacu, a docela povedenou. Jen přestřelili cenu.

+1
0
-1
Je komentář přínosný?

Jj. Ale prodávají to jen na svůj Surface. Kromě toho je verze W10 IoT, ta existuje na všechno možné, také na Raspberry Pi 4B. Netuším ale, kolik to má společného s plnou verzi W10 na Surface.

+1
0
-1
Je komentář přínosný?

Zatím, ale mají veřejné preview třeba pro M1.

+1
0
-1
Je komentář přínosný?

Ta verze co je i pro raspberry je IoT Core. To core je dulezity, protoze maji i jen IoT a to je binarne shodne s LTSB/LTSC, ale prodavane s jinou licencni politikou. IoT Core jsem si osahal na raspberry. Nema to desktop. Aplikace s gui muze bezet jen jedna a musi byt napsana v UWP. Konzolovy aplikace to nepodporuje. Service muzou byt napsany v osekanem winapi. Proste jmenuje se to windows, ale takovy windows asi nikdo nechce.

+1
0
-1
Je komentář přínosný?

RPi 4B je fajn, ale také tomu zazlívám grafiku. Ta je silně podměrečná, nejde jenom o ty 4K výstupy (jenom jeden 4K nebo dva FHD), ale hlavně o nízký výkon toho GPU v OpenGL (OpenCL to zatím nemá), navíc to OpenGL je jenom ošizená ES varianta. KiCAD na tom jede, ale kreslení někdy drhne, při přesunu více objektů a tak. Navíc ta grafika není "open source", sice Broadcom vývoj podporuje, ale všechno neřekne. Také akcelerace videa by mohla být lepší. Prostě chce to, aby někdo udělal nějaké SBC s nějakým výkonnějším GPU. Třeba nějaká výkonná Mali by celkem stačila, nebo Ardeno...

+1
0
-1
Je komentář přínosný?

Nebudem vás ako trolla moc kŕmiť, ale nedal mi tento výrok
>SLC jako sdílenou cache pro GPU, CPU a NPU jako první zavedl Apple

Xbox 360 má (najvyššiu) L2 cache, ku ktorej má priamy prístup GPU - https://www.cis.upenn.edu/~milom/cis501-Fall08/papers/xbox-system.pdf (strana 2/3) som si na 99% istý, že toto nie je jediný príklad. Teda ak som správne pochopil termín SLC.

+1
+4
-1
Je komentář přínosný?

Xbox306 Xenos s tou jeho 10 MB EDRAM se dá považovat za předchůdce Infinity cache. Mimochodem navrženo Ati/AMD.

Není to ale SLC v pravém smyslu, protože neumí poskytovat data pro CPU (a NPU).

První eDRAM na světě sdílenou mezi GPU a CPU měl asi Intel v Haswellu:
https://en.wikipedia.org/wiki/EDRAM
https://www.anandtech.com/show/16195/a-broadwell-retrospective-review-in...

PS2 měla taky eDram, ale opět jen pro GPU.

+1
-4
-1
Je komentář přínosný?

Nikde som nespomenul eDRAM, ale L2 cache procesora (1 MB). Prosím, pozrite si ešte raz mnou linknutý dokument, konkrétne diagram na strane 3. Je z neho jasné, že v rámci GPU je umiestnený pamäťový radič, ktorý komunikuje s RAM. Ak nie je zrejmé zo šipiek ktoré naznačujú priamu komunikáciu GPU s L2 cache CPU, de facto nie je iná možnosť zápisu a čítania do RAM (a L2 cache CPU) ako práve cez GPU. Teda, v krátkosti, GPU (resp. jeho časť) MUSÍ poskytovať dáta pre CPU a vice versa. Ako si totiž môžete povšimnúť, všetká komunikácia s perifériami ide priamo do GPU časti (BIU/IO), kde sa následne prerozdelí.

+1
+2
-1
Je komentář přínosný?

Je tam pouze jedna šipka naznačující komunikaci z L2 do GPU, ale jen jedním směrem, což vyloženě na obousměrnou komunikaci jakou potřebuješ pro SLC cache, nevypadá. Jinak je L2 součástí CPU čipu a komunikuje přes FSB s GPU.

Na GPU je navěšeno úplně všechny IO, což je logické když má v sobě řadič RAM i řadič eDRAM. Je to takovej North bridge.

Nedává smysl mít L2 cache pro GPU na cizím čipu přes FSB. To výkonově zabije veškerou výhodu ikdyby ta L2 sdílená byla. SLC u mobilních ARMů je super protože je přímo na čipu, stejně ta Infinity cache v Radeonech. To už spíš ta eDram by mohla sloužit jako SLC kdyby nebyla navržena čistě pro GPU.

+1
-3
-1
Je komentář přínosný?

V prvom rade: https://ctrlv.link/Uwwh (rovnaký zvuk som vydal ja keď som si prečítal vašu reakciu)

V druhom rade, ak narážate na diagram 4, prečítajte si aj sprievodný text k nemu: "The two final steps are not shown in the diagram. [...] Then, the GPU commands tail pointer write-backs to the CPU to indicate that the GPU has finished reading data." Tzn. keď si prečíta, čo potrebuje, zapíše, že sa tak stalo. Kam? No priamo do istej časti L2 CPU predsa.

Pozor, to nie je L2 cache pre GPU, ale stále "iba" pre CPU, len ma k nemu GPU priamy R/W prístup. Istotne sa dôvody tohto riešenia dočítate práve v menovanom dokumente. Podotýkam, že zjavne to výkonovo nič nezabilo a stále sa bavíme o HW, ktorý bol navrhnutý v roku 2003/4, možno aj skôr. Pointa je, že Apple s tým ako prvý neprišiel (ako na začiatku tohto threadu tvrdíte vy), iba to, vďaka modernej technológii, veľmi zjednodušene povedané, nabachali na "jeden" kremík.

QED a howgh.

+1
+1
-1
Je komentář přínosný?

Na tom druhým obrázku, je tam obousměrná komunikace přes FSB a pak je tam přímo šipka z L2 do GPU. Ale to furt nemění nic na tom, že CPU připraví pro GPU posun polygonů a geometrie a to si je vyzvedne z L2 cache v rámci nějakého DMA přístupu (spíš Direct Cache Access). Tohle prostě není univerzální SLC cache.

Nechci shazovat jinak technicky velmi zajímavý a nadčasový Xenos, ale prostě žádnou SLC nemá. Místo SLC má eDRAM a přímý přístup do L2 CPU, což funkčně SLC v podstatě nahrazuje.

Ale SLC měl jako první pitomej Intel v 2013. Bohužel kužel.
Apple byl druhej v 2017.
Teď ARM má SLC v 2021.
AMD bude mít SLC až 2024.

+1
-2
-1
Je komentář přínosný?

Jj. v úterý ARM zase překvapil. Ale mě z toho všeho zaujala také ta "malá" jádra A510, ta jsou myslím ještě zajímavější než ta velká supervýkonná X2 nebo ořezanější výkonná A710. A510 má větší výkon než letitá A55, přitom se značně menším odběrem. Dokonce je to poněkud "Bulldozerové" čudo, má to 2x ALU a sdílené FPU. A nevím, zda jsem to pochopil na rychlo správně (měl jsem čas to jen přelétnout, podrobné čtení jsem si nechal na víkend), ale on to je možná dokonce in-order procesor! Čímž to má jednodušší design a odběr to má radikálně menší.

Fakt prostě je, že po docela "mrtvolných letech" se konečně zase něco děje. A to je nynější rychlý vývoj těchto univerzálních procesorů ještě Popelka proti tomu, co se děje v oblasti AI/ML/DL... tam dochází k úplnému převratu. Také proto můžeme najít "velká jména" minulosti jako Jim Keller a mnoho dalších v AI start-upech... místo aby si pižlali nějaké svoje geniální obyčejné procesůrky někde ve větších firmách.

+1
0
-1
Je komentář přínosný?

Cortex A510 má daleko silnější výpočetní jádro než píšeš:

- integer 4xALU + 1x Branch .... to je šířka jakou má Zen 3 (4xALU+1xBranch)
- bulldozer s těma trapnýma 2xALU se na tohle úsporné jádro architekturou vůbec nechytá
- ale dozer zase byl OoO kdežto A510 je široké in-order jádro
- IPC A510 je na úrovni A72 v RPI4, což je 50% Zen2 a tedy na úrovni Dozeru
- IPC A510 na úrovni Dozeru při spotřebě cca 200 mW je výborný výsledek
- Dozer na 4,8 GHz žral 225W i víc a to měl jen 4 moduly / 8 jader.
- 16-jader A510 dá zhruba výkon jako Dozer při spotřebě pouhé 2W

- float 2x 64-bit FPU nebo 2x 128bit FPU.... která může, ale nemusí, být sdílená mezi dvěma jádry.
- bulldozer měl sdílený i dekodery a celý front-end, ale A510 má sdílenou jen tu FPU a L2

Rozhodně je Cortex A510 nejširší in-order jádro na světě s překvapivě vysokým IPC. Velmi překvapivá architektura. Všichni čekali, že to bude úsporný 2xALU OoO na bázi A65 nebo něco jako má Apple.

Apple a jeho malá jádra Ice Storm mají IPC jako Sandy Bridge a jsou OoO - 3xALU + 1x Branch. Spotřebu kolem 450 mW. To jsou spíš střední jádra než malá.

Tolik zajímavých věcí se stalo v CPU a v ČR cenzura jak za komoušů.

+1
0
-1
Je komentář přínosný?

Díky za souhrn.

Však jsem psal, že jsem to jenom přelétl, a schovávám si to, až nebudu "v běhu".
Ale fakt teda čumím, to je naprostá nádhera!

16xA510 při 2W jako FX-8200 při těch řekněme 95W (nebo jenom při stejné frekvenci?), no to je rána do hlavy. Překvapilo mě to in-order, to jsem si pamatoval správně. Neskutečné, fakt.

Jsem zvědavý, kdo s tím (X2, A710, A510) něco postaví. Nejen telefonní placku, ale něco většího, třeba ultrapřenosný notes nebo nějaké SBC na hraní, jako je Raspberry nebo Odroid etc. Nebo mini-PC.

Je to super, ale komouše bych do toho nemotal. Cenzura to není, prostě o to lidi nemají zájem, není to zatím ve fóru a nejásá nad tím žumpa. Ono to přijde, uvidíš tak za rok dva tři. Nějaký čas to potrvá.
Nyní to lidi berou jako typické "jablečné kydy", protože Apple marketingu a jablečných jehovistů má každý plné zuby, je to většinou dost odporná pakáž. :-D

+1
0
-1
Je komentář přínosný?

Jestli to není jen fantazie, tak to vypadá velmi dobře... hlavně ta systémová cache L4 v APU by mohla značně pomoci výkonem nejen integrované grafice. Konečně by mohli dotáhnout tu slibovanou HSA (heterogenní systémovou architekturu) do plného hUMA (heterogennous unified memory access), zajištěné koherence cache a mapování přes virtuální adresy jak CPU, tak GPU a dalších akcelerátorů na čipu. Nejen v rámci normálního běhu, ale i přes hypervisor (vCPU, vGPU, vXXX...).

Vlastně ani nevím, jak jsou na tom z hlediska HSA dnešní AMD APU, protože po několika letech slibů, kdy to pořád nechodilo, a jediné co bylo, že si AMD furt vymýšlela nové a nové názvy (Fusion architecture, HSA, hUMA, ...) a skutek utek... nakonec to z jejich marketingu coby hlavní výhoda APU zmizelo beze stopy (možná úplně ne, přestal jsem prostě ty lži o HSA sledovat). Tehdy jsem to potřeboval do jednoho projektu, bylo by to moc šikovné, "ale dopadlo to jako vždycky", takže jsme to museli udělat postaru komplikovaně přes Intel + Nvidia karty a CUDA (protože ani OpenCL ještě nebylo dost stabilní a implementované a vývojová podpora těchto věcí u AMD včetně placeného supportu byla... vzdali jsme to cirka v roce 2016; a CUDA byla "po ruce a každý s tím uměl"). Prostě mám na AMD sliby ve směru integrace CPU/GPU vypěstovanou alergii. :-D

Jelikož nevíme, jak bude vypadat Zen4, těžko komentovat kombinaci Zen5+Zen4... Je ale jisté, že cesta ke zvýšení ST výkonu CPU vede jen přes zvýšení IPC, takže to při x86-64/AMD64 ISA povede k obřím jádrům (protože ISA...). Dokud nebude nějaká zlomová polovodičová technologie a nepovede se překonat 5 GHz meze, tak jinudy cesta nevede...

+1
0
-1
Je komentář přínosný?

> Tehdy jsem to potřeboval do jednoho projektu, bylo by to moc šikovné, "ale dopadlo to jako vždycky"

Ja sam jsem nad HSA delal jeden projekt. Myslenka nebyla spatna, ale byli tam jiste zasadni problemy. Hardware: v prvni verzi (s APU Kaveri) nebylo vsechno implementovano, az v dalsi (Carrizo) to bylo dotazeno. Software: tady byl vetsi prusvih. HSAIL - intermediate language - mel nejake umele (a velice nizke) limity, treba pocet virtualnich registru, takze pomerne snadno si narazil na spilling (a vykon sel do kytek). Treba LLVM IR tenhle problem nema. A samozrejme, HSAIL pridalo dalsi stupen kompilace - HSAIL binarka se pak musela jeste kompilovat do finalni GPU binarky.

Takze AMD se na to pomerne rychle vysralo, a presli na styl Zdrojak -> GPU binarka (komplet vynechali HSAIL). Co se tyce HSA (runtime) tak ta kniznice existuje a pouziva ji ROCm interne. Jinak je ale HSA defacto mrtve. Teoreticky muzes tu knihovnu pouzit primo, ale nema to smysl - ROCm i CUDA umi sdileny virtualni address space.

Nejvetsi problemy s HSA byly dve, 1) je to pomerne opruzni pouzivat, 2) neni zas tak moc problemu kde by heterogenni exekuce mela zasadni prinos. Nebo mozna jen zatim nikdo s necim zasadnim neprisel.

AMD je bohuzel v softwarove oblasti (myslim Linux) porad ponekud chaoticka. Hlavne "vypocetni" oblast. Treba posledni dobou se na OpenCL zcela vytoto, a misto toho propaguji ROCM (jejich klon CUDA), ktery ale ma zasadni problem - podporuje velmi malo hardwaru i verzi Linuxu. V oblasti grafiky je to mnohem lepsi - vlastne az na jednu vyjimku (existence 3 Vulkan driveru v Linuxu) je vsechno "vyreseno", ve smyslu existuje stabilni a vykonni open-source support.

+1
0
-1
Je komentář přínosný?

Jj. Dodnes vidím rudě, když slyším HSA. :-D

AMD mělo mnoho let (2002-2009) děsný bordel v ovladačích grafiky obecně. Děs a běs. Dělal jsem na tom zobrazení videa (mnoha videí současně) na vícemonitorových konfiguracích a byl to horor. Na wokenicích přes DirectX9, z čehož se používala jen volání DirectDraw, nic jiného. A v určité verzi ovladačů fungovalo něco, pak zase o 5 verzí dále přestalo, a naopak se objevily dávno odstraněné chyby... Ti z***i neměli snad ani žádnou správu verzí. Akceleraci dekódování videa slibovali léta (pokud tam aspoň nějaká byla, byl to zamčený mpeg2) bez realizace (až po cca 10-ti letech s tím opravdu začali a to ještě příšerně - jednou chodilo 8 streamů současně, v další verzi jen 2, pak třeba 4 - prostě podle toho, jak se jejich programátoři vyspali). AMD podpora OpenCL nebo nového ROCM, to je další temná kapitola. Předtím to bylo "CTM" (close to metal) a další marketingové pojmy, nikdy nefungující. Prostě a jasně, pokud to není na těžbu nebo hry, Nvidia je jediná odpověď.

+1
+1
-1
Je komentář přínosný?

Jo, dlouho meli v ovladacich bordel; ted alespon ty ovladace funguji docela rozumne. Bohuzel v tom zbytku okolo - ROCM, OpenCL atd - je porad zmatek.

> Ti z***i neměli snad ani žádnou správu verzí

Pokud si dobre vzpominam, meli dva separatni teamy na vyvoj GPU ovladacu, a ty vydavali ovladace na stridacku, takze meli defacto dve paralelni vetve zdrojaku, a bugy se nahodne prevalovali mezi nema :D

+1
+1
-1
Je komentář přínosný?

Jj.

Bylo to zkrátka příšerné, něco takového vyvíjet a nasazovat. Navíc jsme neměli žádnou kontrolu nad tím, jak si klient updatoval/upgradoval ovladače grafiky a systém (wokenice), a tak přicházela četná překvapení, nejlépe ve tři ráno. Třeba že z čistajasna nešla žádná videa na jiných než primárních monitorech. Nebo že jich místo 30-ti najednou jelo jen jedno (4, 8). Nebo že videookno při přetažení z primárního na další monitory zakouslo ovladač grafiky nebo rovnou vedlo k BSOD. Takových věcí bylo nepočítaně.

Větší prasárnu, než ovladače grafiky od AMD jsem zkrátka nikdy neviděl. Proto ve mně některé marketingové triky AMD dlouho vyvolávaly záchvaty zuřivosti. :-D

Nvidie je sice také konzerva s hnijícími červy, ale proti software pro AMD GPU je to pětihvězdičková restaurace. Že má AMD možná lepší nebo vyspělejší GPU hardware, je úplně na nic, když se s tím nedá pracovat. A to se bohužel týká dodnes třeba i karet pro OpenGL nasazení třeba v CAD oblasti. AMD APU by na spoustu věcí stačilo, ale je k ničemu, když z výkresu svévolně zmizí nějaké čáry při zobrazení. I když si AMD nechá udělat nějakou tu "profi" certifikaci a připíše si za název "pro", tak se nedá spolehnout, že v příští verzi ovladačů a knihoven to bude fungovat.

+1
+1
-1
Je komentář přínosný?

Fungují? Poslední AMD ovladače mi u RX480 zbortí systém po návratu ze sleep módu.

+1
+1
-1
Je komentář přínosný?

:-D
Sorry, ale neodolal jsem.
Je zvláštní, jak firma jako AMD dokáže být špičková v hardware a naprosto nemožná v software.
Copak ovladače na GPU, OpenGL/CL a ty další věci, ale oni léta nedokázali ani patchnout základní libc/glibc/libc++ knihovny, aby to poznávalo jejich procesory a nejelo jenom ve fosilním módu jako MMX/SSE1, no maximálně jako Hasswell. Jestli je něco fakt na vystřílení celého týmu do posledního z***a, tak tohle jo.

+1
0
-1
Je komentář přínosný?

3 Vulkan ovládače ale umožňujú, ak je tam aj PRO driver prepínať RADV, AMDVLK a AMDPRO Vulkan ovládače on the fly.

+1
0
-1
Je komentář přínosný?

To je pravda, Vulkan ma ICD takze clovek muze mit implementaci v systemu kolik chce.

+1
+1
-1
Je komentář přínosný?

Pomerne zásadne sa to ale vylepšuje práve teraz

AMD Preparing More Linux Code For The Frontier Supercomputer
Written by Michael Larabel in AMD on 27 May 2021 at 08:37 PM EDT.

Frontier as the first US exascale supercomputer being commissioned by Oak Ridge National Laboratory and the Department of Energy. while being powered by AMD CPUs/GPUs is in the process of seeing more Linux kernel changes for bringing up the new platform.

https://www.phoronix.com/scan.php?page=news_item&px=AMD-VMA-Changes-Fron...

+1
0
-1
Je komentář přínosný?

Hlavně že Apple má sdílenou cache pro GPU, CPU a NPU už od roku 2017.
AMD to bude mít už v 2024, hurá. Škoda že i licenční Cortexy to mají od letoška :)

AMD s Intelem vůbec nemají odpověď na 2048-bit SVE2 vektory, koncept flexibilní šířky FPU jako má SVE/SVE2 pro dopřednou kompatibilitu je revoluce. Oni nemají NIC (tedy cca 7 let zpoždění).

Nový rozhovor s Jimem Kellerem:
Kdo si chce počíst pravdu o návrhu Zenu, aneb jak Jim Keller musel přesvědčovat Mike Clarka že architekturu Zenu je možné realizovat a ten čuměl na seznam úkolů od Kellera jak vyoraná myš, přičemž většina AMD zaměstnanců byla proti. Tohle taky nezapadá do zdejší propagandy o úžasném Clarkovi co navrhl Zen naprosto sám a Keller jakožto manager neměl na Zen žádný vliv :D
https://www.anandtech.com/show/16709/an-interview-with-tenstorrent-ceo-l...

+1
-7
-1
Je komentář přínosný?

Buď neumíš anglicky nebo si to schválně upravuješ podle svého. V každém případě asi nevíš, co to je vést tým.

+1
+2
-1
Je komentář přínosný?

"Mike Clark was the architect of Zen, and I made this list of things we wanted to do [for Zen]. I said to Mike that if we did this it would be great, so why don’t we do it? He said that AMD could do it. My response was to ask why aren't we doing it - he said that everybody else says it would be impossible."

Jim Keller dal Clarkovi seznam věcí, které požaduje udělat pro nový Zen. Ten řekl že by to AMD mohla udělat (na rozdíl od jiných kteří tvrdili že to není možné).

- z toho plyne že Clark dostal zadání od Kellera jak má Zen vypadat
- z toho plyne že Clark neměl šajnu jak udělat výkoný CPU, ostatně pracoval na Dozeru

Však uvidíme co bude Zen5 za katastrofu. Už Zen 3 je pouze předělaný Kellerův K12, protože nevěděli kudy kam. Takže uvidíme jestli Clark a jeho melodyboys dokáží alespoň zkopírovat 6xALU Apple A11 z roku 2017. Mezitím sice už Apple bude mít 8xALU M2, Qualcomm/Nuvia budou mít 8xALU Phoenix, a příští rok i ARM Makalu bude 6xALU, Intel Alder Lake taky bude 6xALU nejspíš.... AMD bude několik let zoufale poslední co se týče architektury.

+1
-5
-1
Je komentář přínosný?

> "I made this list of things we wanted to do"
List jako treba:

- more IPC
- more hertz!
- more cores!
- MAKE IT HAPPEN!

:D

Kdybys umel anglicky poradne, a nebo nevybiral jen co se ti hodi, tak vidis dobre, ze Jim Keller nestoji za uspechem Zenu po technicke strance, protoze nebyl architekt, ale vzasade se ujal funkce projektaka, produktaka. Rekl architektu, Mike Clark, a vedouci inzenyrce tymu, Suzanne Plummer, aby udelali novy procesor a oni... to zvladli :D Jeho role teda byla takova, jakou ostatne mel i na smlouve.

+1
+2
-1
Je komentář přínosný?

Ředitěl Škody Auto přijde a řekne: udělejte novou Octávii 2x výkonější, s poloviční spotřebou, 2x lehčí, 2x větší a 4x levnější. Přesně takto probíhá vývoj podle Maliho :DDD

Všichni v AMD věděli že Intel Ivy Bridge má skoro 2x větší IPC než ta hrůza Dozer co navrhli.

Problém byl, že nevěděli jak navrhnout široké jádro jako má Intel aby nezabředli do nějakého šíleného 8 letého vývoje a mezitím nekrachli. Lidi co navrhli K7/K8/K10 už dávno uprchli jinam. Samsung jim přetáhnul tým Bobcatu a potom ještě tým Jaguaru. V AMD zůstali jen ti největší nýmandi co dělali na Dozeru, ty nikdo nechtěl.

Genialita Kellera je v tom, že Intel měl v té době na trhnu jen 3xALU Ivy Bridge, ale Keller rovnou zadal návrh na mnohem širší 4xALU Zen. Proto většina lidí v AMD považovala Zen jako nemožný projekt, protože papírově měl mnohem vyšší IPC než Intel. 4xALU Haswell přišel až v 2013, stejně jako 4xALU Apple A7 Cyclone. A tady je vidět že Apple už od prvního CPU v 2013 šlapalo Intelu co se týče IPC na paty, což je neuvěřitelné. Není se čemu divit že za pouhé 2 roky Apple A9 Twister měl už větší IPC než Skylake a za další 2 roky naprosto revoluční kulervoucí super-širokou architekturu se 6xALU+ 2xBranch.... aneb legendární Apple A11 Monsoon (ten měl už SLC cache sdílenou mezi CPU, GPU a NPU).

+1
-6
-1
Je komentář přínosný?

Kellerova role byla spíš mentorská, což pomůže iniciovat lidi v týmu k lepším výsledkům, ale to neznamená, že se k tomu dopracují automaticky, když dostanou od někoho seznam věcí k implementaci. Dobrý nápad je jedna věc, dobré provedení druhá. Jedno bez druhého je k ničemu. Nazývat inženýry Zenu nýmandy může jen zaslepenec. Fiasko s dozery souviselo s velkými úsporami a zásahy ze strany vedení v průběhu rozpracovaného projektu.

+1
+1
-1
Je komentář přínosný?

Kecy kecy kecy.

Keller je autorem Apple A7 Cyclone, který už v roce 2009 navrhl jako 4xALU jádro. V té době AMD dokončovalo katastrofický 2xALU Dozer a řítilo se ze skály.

Keller byl pro Zen a K12 (Zen3) naprosto klíčovou osobou bez něhož by nikdy nevznikly. To že AMD lže o Kellerovi a zlehčuje jeho úlohu při vývoji jenom ukazuje že v AMD je opět zazrmdováno. Však ono se už začíná ukazovat že Keller měl pravdu s tím ARMem. Ostatně Keller se radši tématu K12 a ARM v AMD zcela vyhnul. Proč asi? Nebylo to pěkné. Keller musel bojovat proti většině inženýrů v AMD aby prosadil vůbec Zen. K12 s o 20-30% větším IPC musela být úplnej červenej hadr pro korporátní blbce co nepoznali nikdy nic jiného jak x86. Se podívej tady kolik je tady IT lidí co nenávidí ARM ikdyž mají k dispozici čísla ukazující že je jednoznačně lepší, výkonější, efektivnější a modernější ISA.

+1
-4
-1
Je komentář přínosný?

Vymyslis si naprosty nesmysly. Pro tva tvrzeni neexistuje zadny duveryhodny zdroj.

+1
+1
-1
Je komentář přínosný?

https://www.anandtech.com/show/16709/an-interview-with-tenstorrent-ceo-l...

Ale to byste jako duchodce musel umět anglicky, což je zřejmě sci-fi.
Snad víte co to je sci-fi, to vás komouši snad naučili :)

+1
-2
-1
Je komentář přínosný?

A kdyz neni duveryhodny zdroj, tak se vytahne neco na anadtechu. Sice tam neni z tech pohadek skoro nic. Ale to je jedno. Hlavne aby ASCII vyplodil dalsi nesmysl.

+1
+4
-1
Je komentář přínosný?

Pro čtení mezi řádky je třeba trochu inteligence, což některým činí potíže. Nedá se nic dělat :)

+1
-5
-1
Je komentář přínosný?

Mezi radky neni nic... stejne jako v tve hlave. Presne jak sem napsal vejs. Pro zva tvrzeni nemas zadny duveryhodny zdroj.

+1
+3
-1
Je komentář přínosný?

Pro čtení mezi řádky je třeba trochu inteligence, což některým činí potíže :)

+1
-3
-1
Je komentář přínosný?

Inac ja len tak skromne, ze predpoklad, ze ak dve jadra roznej architektury nepodporuju vsetky podmnoziny tej istej instrukcnej sady, tak ani jadra, ktore by ich inac podporovat mohli, ich podporovat nemozu, je na celej ciare chybny. Podporovat ich mozu a dokonca to cele aj bude fungovat. Predpokladam, ze dokonca ani tak odflaknuta vec ako scheduler vo Widliach by s tym nemal zasadny problem. On totizto scheduler vie, ake vlastnosti jednotlive jadra podporuju (maximalne tak moze predpokladat, ze vsetky jadra podporuju to, co prve, to je potom kapusta Microsoftu, aby si to vyriesil) a zaroven pomerne dobre vie, ktore "rozsirene" vlastnosti instrukcnej sady ktore vlakno pouziva. Uz od cias MMX a prvych SSE sa to pouziva na to, aby sa usetril cas pri prepinani uloh a nezalohovali sa MMX registre, ak ich proces nepouziva. Muselo sa to riesit aj preto, lebo procesy pouzivajuce MMX invalidovali interny stav FPU a to rozbijalo ine procesy, ktore nepouzivali MMX ale zato pouzivali FPU. Predpokladam, ze podobne to bude aj s SSE (nie s tym, ze je to odflaknute, ale ze scheduler v skutocnosti vie, ktore vlakno co z procesora realne pouziva).

Riesenie v takom pripade je pomerne jednoduche. Ked vlakno zacne pouzivat napr. AVX512, kym bezi na Atome, scheduler dostane illegal instruction trap, zisti, ze aha, AVX512, premigruje thread na velke jadro, poznaci si, ze pouziva AVX512 (to si musi aj tak, aby vedel, ze ma zalohovat pri prepinani aj AVX registre) a potom proste taketo vlakno uz na Atom nenascheduluje. Jednoduchy dosledok bude ten, ze ak sa take vlakno vyskytne, aj v minimalnej zatazi zostane aspon jedno velke jadro bezat, aby tieto AVX vyuzivajuce vlakna mali kde bezat. Ziadna raketova veda.

+1
+2
-1
Je komentář přínosný?

JJ, to je obecně princip heterogeních systémů. MS ovšem nezvládá ani NUMA, natož aby si dokázal ošéfovat jinou verzi ISA.

Druhý problém nejsou jen instrukce, ale i šířka registrů a velikost registrů:
- 32-bit x86 FPU má 8 registrů po 80-bit + 8x registrů pro 128-bit SSE
- 64-bit x86-64 má 16x registrů pro 256-bit AVX2
- 64-bit x86-64 má 32x registrů pro 512-bit AVX512 (int zůstal na 16 registrech)
- ARMv9 má 32 registrů pro Int a 32 registrů FPU/SIMD o šířce až 2048-bit

Context switch není žádná sranda a výrazně omezuje i ARMy. Třeba šířka vektorů musí být kvůli 128-bit FPU u malých jader také 128-bit i u velkých přestože ty i s geniálními SVE2 můžou jít až na 2048-bit.

Třeží problém je, že AVX512 má 15 různých subsetů, což je neskutečný chaos a každé Intelí jádro podporuje jiné. Třeba CooperLake umí Bfloat16 a INT8, ale novější IceLake a Tiger Lake to už zase neumí. To je prostě chaos. Až tu bude CPU co bude podporovat všechny tak prosím, třeba Alder Lake nebo Zen4, ale do té doby tento neskutečný chaos bude pokračovat.

ARM SVE2 má tuším jen 1 volitelný subset navíc.

+1
-4
-1
Je komentář přínosný?

U SPARCů se problém s registry při kontext switchingu řešil celkem elegantně, že v procesoru byla obří banka registrů a aktuální běžící kontext měl pouze svůj pointer do této banky, což představovalo aktuální "registrové okno". Takže se při přepnutí nemuselo nic schovávat ani obnovovat, jen se změnila hodnota toho jediného pointru. Podobně to mají dělané třeba signálové nebo řídící procesory, tam je to zase na minimální latence při zpracování přerušení. Ostatně i to "přejmenování registrů" u současných Intelů/AMD x86-64/AMD64 je něco podobného.

Těch triků je prostě za ta léta vývoje spousta.

Ale asi úplně každému je jasné, že další zvýšení IPC těchto univerzálních procesorů bude možné tím lehčeji, čím méně rozháraná a zmatečná je jejich ISA. Dokud s tím x86-64/AMD64 Intel/AMD něco neudělá, proti modernějším ISA, které radikálně odvrhly "historické dědictví" 16-bit a 32-bitových verzí ISA, "packed instruction" věci zaměřené na bitovou úspornost kódu, nejednotnou šířku instrukcí, zmatky s 15-ti verzemi AVX-512 implementace, starý memory model, ... - což je například ARMv9 - tahá za kratší lano.

Zkrátka dokud Intel/AMD instrukční sadu těch svých procesorů důkladně nevyškrtají (a zpětnou kompatibilitu budou řešit jinak, třeba soft obsluhou přes trapy), tak zvýšení IPC povede k ohromné složitosti a obrovským jádrům, proti konkurenci lepších moderních ISA. Což nepůjde tak snadno a levně implementovat a bude to více žrát.

+1
+2
-1
Je komentář přínosný?

Jsi asi jediný člověk kterému dochází, že x86 má starý strong memory model, který z principu brutálně omezuje IPC díky omezení spekulací se ST instrukcemi.

Většina lidí už je tak zblblá, že si myslí že výkon se počítá v L3 cache a ALU a FPU jednotky jsou v CPU jenom pro parádu. Bože, kam jsme se to dostali.

+1
-2
-1
Je komentář přínosný?

Tomu bych se tolik nedivil. Prostě to je nové, lidi mají zažité ARM jako prdítko z telefonů, a nic více. Každý je navíc unavený různými "hype" nadšenými marketingovými prolhanci, kteří každou chvíli nepříčetně jásají nad nějakou kokotinou, ze které se za týden měsíc rok vyklube mega kokotina.

Navíc jsou fakt málo snesitelní ti otrapové z Jobsovy sekty, kteří poslední půlrok chodí nafouklí z M1 a nového jablečného čuda, jako kdyby to vlastnoručně upekli doma v kuchyni a naprogramovali přes víkend.

Když je člověk korporátní hypotéční nevolník a leasingový otrok k tomu, zařezává na nějakém hnusu, který za 5x větší peníze než bere on vyprasili na druhém konci světa indičtí cigoši a on to má za týden opravit, aby to aspoň trochu chodilo... a v práci je 5x denně místní vymydlený polobuzík nebo hnusná pizda začne otravovat s M1 čudem, a zmlátit je do bezvědomí je tak nějak zakázáno, no tak se nediv těm reakcím, že lidi při zmínce o ARMu vypění... :-D

+1
0
-1
Je komentář přínosný?

M1 je ještě v pohodě, ale ten kolovrátek o myriádě ALU už je moc :)

+1
-2
-1
Je komentář přínosný?

Nic z toho nie je principialny problem. Smerom k SW ako scheduler announcujem to, co vie najtucnejsie jadro v systeme. A ked sa proces realne odvazi to pouzit, tak proste na tom najtucnejsom jadre v systeme bude bezat. NUMA je v porovnani s tymto raketova technika, pretoze tam sa riesi vzdialenost a latencie k zdrojom (i.e. pre optimalny vykon/prostu spustitelnost moze byt potrebne s procesom z nody na nodu odmigrovat aj data). Toto je jednoducha uloha mam/nemam mozem/nemozem. Navyse je dost predpoklad, ze vacsinu potrebnych informacii k realizacii taketoho implicitneho core affinity uz scheduler ma.

+1
0
-1
Je komentář přínosný?

Tohle je teoreticky ideální řešení, které se bohužel pravděpodobně nikdy nestane. A pokud, tak se do této situace odvětví doklepe až už budou mít AVX-512 i Atomy, a už to bude stejně jedno. Není to totiž problém scheduleru OS (tam to jde udělat přesně jak píšeš), ale všeho ostatního.

Naprostá drtivá většina všech standardních knihoven programovacích jazyků dnes funguje tak, že při inicializaci otestují přítomnost SSE/AVX/AVX512 a dle toho vyberou rutiny, které používají po zbytek života procesu. Tyhle rutiny jsou hlavně i blbé memset/memcpy, takže i vlákno, které jinak nic vektorově nepočítá, použije AVX512. protože neustále se něco nuluje nebo přesouvá. Tzn. během prvního zlomku sekundy by všechny vlákna scheduler přesunul na velká jádra, a nic by se nevyřešilo.

Jasně, ideálním řešením by tedy bylo tyto instrukce používat/nepoužívat per-thread, ne globálně, a nechat aplikaci rozhodnout, který thread vyžaduje výkon a který může být "efficient". A to vyžaduje přepsat relevantní část VŠECH knihoven a udělat úpravy ve VŠECH aplikacích. Nebo alespoň významné většiny, aby to mělo sebemenší efekt. A to vůbec nevidím reálně.

Jinak, co tak různě sleduju úniky a informace o např. Alder Lake, tak CPU umožňuje v BIOSu dostupnost malých jader zapnout nebo vypnout. A pouze jsou-li vypnuté, pak CPU zpřístupňuje AVX-512. Tedy v CPUID. Co se stane, pokud je použije software připíchnutý na velké jádro, to nejspíš zatím nikdo nezkoušel.

+1
0
-1
Je komentář přínosný?

Je fajn, že sa chystá kopec nových vecí, ako Zen4 a Zen5, ale v poslednej dobe je to stále len fantazírovanie a čakanie na nové produkty. Mňa skôr zaujíma, čo môžem mať reálne v PC, NTB, takže okrem veľkých plánov by bolo fajn, aby AMD skompletizovala a dodala na trh aspoň súčasnú generáciu Zen3 od lowendu (5400G), cez mainstream (Ryzen 5600) až po TR a EPYC. S nejakým Zen5 môžu mazať med okolo úst akcionárom, ja som chcel 5600G alebo 5700G a doteraz nie je jasné či sa dostanú na trh. A nejaký Zen5??? Dajte mi vedieť, keď budú von prvé nezávislé testy a mimozemšťan bude škriekať, že má všetko skladom.

+1
0
-1
Je komentář přínosný?

Moje řeč. Tyhle vzdušné zámky, že za rok a půl bude Zen4 a za čas potom Zen5, mě čím dál více otravují - když se nedá koupit ani pojebaný levný Athlon s dvěma či čtyřmi jádry, ještě na 12 nm z GloFo. Když už se všude žvaní, jak AMD je vázána smlouvami na odběr od GloFo, že to má jako kámen na krku, tak by aspoň mohli vyrobit nějaké ty laciné staré verze na úrovni Zen1 nebo Zen1+, na spoustu věcí by to úplně stačilo. Stejně většinou je potřeba upgradovat nějaké 6-10 let staré "kancelářské" Intel Pentium nebo ještě větší a starší vykopávky, kde vyšší výkon než Zen1 dvoj až čtyřjádro není potřeba, s nějakou základní integrovanou grafikou, případně aspoň nějakou akcelerací dekódování videa.

A když už se tedy AMD budou jak je vidět dalších pár let kopat nudou do zadku místo vydávání nových procesorů, tak by mohli konečně dát do kupy ovladače a podpůrný software. Že jim trvalo léta, než dokopali tak stupidní věc, jako updatovat základní Glibc knihovny, aby to poznávalo procesor a používalo něco modernějšího než MMX/SSA je ostuda. Ovladače grafiky, OpenGL/OpenCL a fůra dalších nedodělků...

+1
+2
-1
Je komentář přínosný?

Ještě jsem chtěl dodat, že mě AMD tímhle vyloženě se*ou. Nedělají nic pro low-end, a pokud něco jo, nejde to koupit.

Tuhle jsem řešil náhradu nějakých klientských stanic, kde běžely 10+ let staré Intel vykopávky, a nakonec jsme tam dali - i když bychom rádi použili AMD řešení s rezervou výkonu - moooc pěkné Intel desky s Pentiem N řady 4000. Sakumprásk pasivně chlazený mainboard i s procesorem a chladičem za 2 400 Kč, no nekup to za ty peníze. Žere to v idle cirka 9W, maximálně asi 30W. Místo zdroje k tomu je píchnuté falešné žluťácké "PicoPSU-like" na malé destičce za 120 Kč a žluťácký 12V externí zdrojík za 150 Kč. Vše pasivní a tiché... a výkonově úplně dostatečné. 2-4-jádro AMD APU by bylo sice lepší, no ale není. Bylo toho kolem 300 kusů, takže výsledek byla dosti značná úspora nákladů - tím pádem se za stejné peníze mohly obnovit všechny klienty, na rozdíl od ušlechtilých korporátních nabídek nebo nějakých hotových mini-PC.

+1
0
-1
Je komentář přínosný?

Co na těch klientech běží? Když vidím, jak dokážou naši zákazníci zasekat i I5, tak N4000 bych jim fakt nedával...

+1
0
-1
Je komentář přínosný?

Naštěstí jen linuxová instalace, udělaná z Debianu. Takový "tenký klient", lokálně tam jede jen Chromium, aplikace jsou webové z intranetu z linuxových serverů nebo přes RDP z wokenicových serverů. Plus konferenční video aplikace, firemní na bázi WebRTC, takový jednoduchý kecálek, udělané to je dost surově v Electronu (nebo v NW.js, už nevím, no prostě webově s JavaScriptem a node.js). Slabá zátěž, kterou zvládaly bezvadně i prastaré Athlony64x2 s nějakou základní Nvidií grafikou (kvůli kodekům videa) a další obdobné zkameněliny od Intelu. Ten N4000 to dává s prstem v nose.
Takhle udělané to je hlavně proto, že jde o právní/nemovitostní firmu, a tak nechtějí mít žádná data nekontrolovaně na klientech, všechno musí být na chráněných serverech. A na plnotučné VDI (třeba Vmware Horizon) nechtějí vyšpulit peníze, jsou to kolenovrti. Přes to RDP to samozřejmě není úplně ono, nějaký lag tam je, ale jsou na to zvyklí a nevadí jim to. Klienty jsou bezdiskové, jede to přes PXE boot ze sítě a používá se lokální RAMdisk. Vcelku bezproblémové, skoro nulové potíže s provozem. Je to vlastně dost bastl, ale chodí to už roky.
V porovnání s nějakými W10 hrůzami je to fantazie.

+1
-1
-1
Je komentář přínosný?

@kvolaa: Teď koukám na czc a mají tu skladem (více než 5 ks):
- R3 1200 (4j) za cca 1750 Kč
- R5 1600 (6j) za cca 3150 Kč
Asi nová zavážka, takže koupit se dá. Viz odkaz níže:
https://www.czc.cz/procesory/produkty?q-c-1-f_2025182=sAM4%20socket&q-c-...

+1
+1
-1
Je komentář přínosný?

To nejsou APU:).

+1
-1
-1
Je komentář přínosný?

APU to nejsou, no ale kdyby to bylo, také by se o tom dalo uvažovat. Jenže to řešení s N4000 bylo mnohem levnější a stačí, no takže tak.

+1
-1
-1
Je komentář přínosný?

Počkajme si na zajtrajší livestream AMD (Computex 2021), má sa síce točiť okolo HPC, ale môžno utrúsi aj o iných produktoch...začína sa šuškať, že práve Ryzen 5000G mieria do Retail-u. Uvidíme čo je na tom pravdy.

+1
0
-1
Je komentář přínosný?

Až za 3 dlouhé roky?! Lisa asi v AMD zavedla školení o inkluzi a rozmanitosti a chytří asiati se raději vrátili domů.

+1
0
-1
Je komentář přínosný?

Možná část mančaftu musela na povinnou operaci z chlapečka na holčičku, aby zachovali povinné genderové kvóty. Kromě mančaftu musí nově mít i ženčaft. Vlastně lidočaft, protože staré názvy jsou maskulinně toxické. Proto to zdržení. :-D

+1
+3
-1
Je komentář přínosný?

Konecne biglittle nad kterym neohrnu nos. AMD jede, borci!

+1
-2
-1
Je komentář přínosný?

Doufám, že si amd tyhle hybridy ještě rozmyslí. Na papíře huj, v reálu fuj.

+1
-4
-1
Je komentář přínosný?

ASCII zase tapetuje. Zajímalo by mě jakou má motivaci a kolik mu je let :)

+1
+3
-1
Je komentář přínosný?

V pripade dusevniho vyvoje je vek pouze jednim z parametru a nikoli ten nejdulezitejsi. :-)

+1
+3
-1
Je komentář přínosný?

:)

+1
0
-1
Je komentář přínosný?

Ty jo, tady je od ASCII nehorázně nablito. To se nedá číst.

+1
+4
-1
Je komentář přínosný?

Ty v*le, ten pomatenec je zpatky :))

+1
+2
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.