Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k x86 jádra (Zen 3) jsou proporčně bližší malým (než velkým) ARM jádrům Apple M1

Krásná analýza, přesně důvod proč sem chodím.
https://giphy.com/gifs/4k184nfxSphcs/html5

+1
+23
-1
Je komentář přínosný?

Ja len ze vyvodzovat zavery vyssi pocet tranzistorov => mensia hranicna frekvencia moze byt pri odlisnej architekture s podstatne odlisnou dlzkou pipeline nemudre.

AArch64 je architektura, ktora ma nejakych 11-13 stage v pipeline. Skylake aj Ryzen maju 14-19 stage pipeline. (zdroj: ARM a Wikichip) Nemusi to byt pravidlo, ale kratsia pipeline vo vseobecnosti nenahrava moznosti hnat procesor na vysoke frekvencie (alebo len za cenu vysokeho Vcore), pretoze bud musia byt jednotlive instrukcie funkcne podstatne jednoduchsie (co prave pripad ARMu velmi nie je), alebo su jednotlive stage v pipeline odost tucnejsie a tym padom nachylnejsie na nestabilitu pri vysokych hodinovych frekvenciach.

Co sa vie, je to, ze M1 je jeden z mala ARMov, ktory podporuje total sort ordering pri zapise do pamate (to je to, co pouziva x86, obsah pamate vzdy zodpoveda poradiu instrukcii na vstupe aj ak su vykonane out-of-order, pri ARMe je taketo chovanie garantovane iba pri pouziti barier). Je mozne, ze cast kremika padla na jeho podporu. Dovod, preco sa k tomu Apple uchylil je asi ten, ze bez podpory TSO znacne klesa rychlost emulacie x86. Rozdiel moze byt cca 25-30%, pretoze bez TSO musi dynamicky translator emitovat velke mnozstvo barier. A kedze Apple cely ekosystem kontroluje, tak v dobe, ked usudia, ze dynamicky translator nie je treba, mozu celu podporu TSO z kremika vyhodit.

+1
+13
-1
Je komentář přínosný?

Mohu se zeptat co děláte, že máte tak detailní znalosti ohledně návrhu ?

+1
-1
-1
Je komentář přínosný?

Stačí aby to člověka trochu zajímalo a za dlouhých zimních večerů si četl... Ale třeba jsem ho urazil a je něco jako "cpu architekt". Já mám taky nějaké ty znalosti když jsme si na VŠ dělali "svoje CPU" - ano, bylo to cosi na úrovni 286, ale i tak člověk získal nějaké znalosti...

+1
-1
-1
Je komentář přínosný?

Toto su informacie, ktore sa daju v pohode zohnat na internetoch. Informacie o mikroarchitekturach su casto pomerne vseobecne dostupne, efekt dlzky pipeline sa da vystopovat v historickych architekturach (napr. Netburst a Bulldozer mali brutalne dlhe pipeline, lebo cielili na vysoke frekvencie). Zvysok je mozgove myslenie.

+1
+3
-1
Je komentář přínosný?

„Ja len ze vyvodzovat zavery vyssi pocet tranzistorov => mensia hranicna frekvencia“

Jen jedna drobnost - toto jsem nikde netvrdil :-) Reakce na obsah článku jsou v pořádku, ale pokud mají být k obsahu článku, tak prosím skutečně jen k tomu, co je v něm řečeno.

+1
+5
-1
Je komentář přínosný?

ehm, to "slc cache" na ty fotce die znamena, ze mame nand v procesoru? tzn az budou bunky tolikrat prepsany az budou mrtvy, tak cpu je mrtvy?

+1
+1
-1
Je komentář přínosný?

Že by? Ku**ítko... ? :-D To by mne taky zajímalo, v životě jsem neviděl NAND v CPU/SoC...

+1
+1
-1
Je komentář přínosný?

Applitko... :-)

+1
+2
-1
Je komentář přínosný?

Lx cache bývá většinou SRAM, jestli se nepletu ...

+1
+3
-1
Je komentář přínosný?

to urcite ano, ale kolikrat byla popsana jako "slc cache" ?

+1
+1
-1
Je komentář přínosný?

párkrát jo :-)

+1
0
-1
Je komentář přínosný?

SLC = system level cache, v podstate cache, ktera se sdili mezi cpu a gpu a u M1 treba i akceleratory.

Oproti tomu napr. v nvidia Tegra, takova cache neni, a i kdyz je GPU a CPU na jednom kremiku, a ty bloky maj vlastni cache - tak mezi nema neni cache coherence, takze musite resit synchronizaci (cache flush) explicitne, coz snizuje vykon.

Z podobneho soudku je termin LLC - last level cache.

+1
+9
-1
Je komentář přínosný?

Tak to je na tom AMD hůř než jsem si myslel. Neumí udělat velké jádro a ještě toho mrzáka zbytečně zatěžuje tím svým hyperthreadingem. Na Intelovské atomy už mně slova nestačí...

+1
-22
-1
Je komentář přínosný?

To mi přijde jako podivná logika. Za prvé z toho srovnání vyplývá, že AMD stačí ~2× menší jádro na dosažení >90 % výkonu jádra Applu a za druhé - pokud někdo zastává (nevím čím podložený) názor, že větší = efektivnější, pak stačí s jádry Applu pro 5nm proces srovnávat jádra AMD pro 5nm proces.

+1
+11
-1
Je komentář přínosný?

Jsem jen frustrovaný z toho, že i současný Zen není tak mohutný jak původně měl být. Intelu díky tomu stačí na srovnatelný single výkon i 14nm proces a lidem je celkem jedno kolik to žere, protože se to moc neuvádí.

+1
-16
-1
Je komentář přínosný?

„současný Zen není tak mohutný jak původně měl být“

Zdroj?

+1
+7
-1
Je komentář přínosný?

Chlupatezeny.com nebo diit.cz - už nevím, kde se o tom spekulovalo.

+1
-15
-1
Je komentář přínosný?

.

+1
+1
-1
Je komentář přínosný?

Chlupatezeny.com mi nejedou a na DIIT se o ničem takovém, co vím, nediskutovalo. První Zen (Zen 1) měl být podle prvotních plánů na papíře architektonicky na úrovni Zen 2, ale protože by se to nestihlo, snížila AMD laťku. Není mi ale známo, že by Zen 2, 3 a 4 byly v jakémkoli ohledu jiné oproti původním záměrům.

+1
+2
-1
Je komentář přínosný?

z tohohle se vylhat budes mit opravdu tezky. to mas lepsi drzet usta a soupat papucema

+1
+2
-1
Je komentář přínosný?

Neni to jen o spotrebe energie, ale i vyzarovanem teplu a vydavanem hluku. Pamatuju se na stare pocitace s prelomu tisicileti, ktere mely 80mm vetracky a desne hucely, ale nevadilo to, nemeli jsme srovnani s nicim lepsim.
Kdyz se podivas na takovy Skylake i7-6700, ten ma tak nizkou spotrebu, ze to do okoli nevyzaruje temer nic a neni ten pocitac slyset. Postavis-li se stejnym chlazenim Ryzen 5800X, tak ti bude rvat, jak utrzeny ze retezu, ale stale je mozne ho podtaktovat a dostat se na stejnou spotrebu a tim i stejnou hlucnost pri dvojnasobnem vykonu!!!
A ted srovnej takovy Rocket Lake, vubec nemas sanci to se stejnym chlazenim uchladit ani to nepodtaktujes tak, aby ti to nezralo vic nez ten Skylake.

Mozna ti AMD neni dost dobre, ale soucasnym Intelem si nepomuzes, naopak. Ano Intel umi stejny single vykon, ovsem za jakou cenu!

+1
+1
-1
Je komentář přínosný?

„A ted srovnej takovy Rocket Lake, vubec nemas sanci to se stejnym chlazenim uchladit ani to nepodtaktujes tak, aby ti to nezralo vic nez ten Skylake."

Pokud deska umožňuje nastavení frekvence a napětí, tak Rocket Lake musí Skylake porazit ve všech směrech. V Intelu zase takový exoti nejsou, aby vydali 11. generaci co je horší než 6. Při stejném výkonu musí Rocket Lake žrát méně.

+1
-2
-1
Je komentář přínosný?

Nedal jsem ti minus a doufam, ze ti co dali, je dali proto, ze reagujes na neco jineho nez jsem psal. Jinak mas samozrejme pravdu.
Cele to moje srovnani neni samozrejme fer, protoze micham i7-6700 4C/8T s 5800X 8C/16T. Slo mi jenom o to ukazat, ze clovek, ktery si v minulosti koupil tehdejsi skoro highend, si dnes pujde nejspis koupit zase highend v podobne cene okolo tech 10.000 Kc. Ze soucasnych procesoru ma na vyber 5800X a i7-11700(K). Kdyz bude chtit udrzet chlazeni na stejne urovni, dejme tomu ho nebude menit, koupi jen desku, procesor, pamet, tak mu to kazdopadne bude bud mnohem vic topit nebo to muze podvoltovat (dekuji JirkoviK za pripominku k pouzivani spravneho terminu). S 5800X se dokazes lehce dostat na 65W realneho odberu procesoru a budes mit dvojnasobny vykon procesoru (nebo-li podobny vykon na jadro jako pred lety ten Skylake), s i7-11700(K) budes mit velky problem toho vubec dosahnout a kdyz se ti to podari, tak ve vysledku na tom budes hur s vykonem na jadro.

Neporovnavam teda stary vs novy procesor, ale nove konkurencni procesory 5800X a i7-11700 pripadne i7-11700K a Intel zde taha za kratsi konec. Je teda usmevne, ze kritizujes AMD, kdyz jejich konkurence neni schopna docilit ani toho, co oni. Apple M1 je jina architektura, to nelze porovnavat, ale jako zajimavost uvest, ze AMD staci k dosazeni podobneho vykonu mensi jadra, tak jako bravo pro AMD.

+1
0
-1
Je komentář přínosný?

"s i7-11700(K) budes mit velky problem toho vubec dosahnout a kdyz se ti to podari"

Jedno nastavení v Biosu a ta 11700K nikdy neuvidí od desky víc než 65W, když to šlo na 10 jádrové 10900 proč by to nešlo na osmijádru? Tu 10900 pak krásně chladíš i stockem a s lepším chladičem jsi pod 40 stupni při stress testu. Musíš si ale vybrat zda chceš nízkou spotřebu nebo vysoký výkon. Na 65W ta i7 počítám udrží v AVX all core 3.8-4.0 GHz, když tomu pustíš 200W+ tak to vytočíš na 4.6-4.8 odhadem. Když to dáš na polovic tak z toho můžeš mít něco mezi

+1
0
-1
Je komentář přínosný?

a co takto si vybrat vyssi vykon pri nizsej spotrebe a intel si vobec nekupovat? :) </troll>

+1
+1
-1
Je komentář přínosný?

"A ted srovnej takovy Rocket Lake, vubec nemas sanci to se stejnym chlazenim uchladit ani to nepodtaktujes tak, aby ti to nezralo vic nez ten Skylake."

A proč by to někdo podtaktovával, stačí nastavit power limit, o takt už se postará deska.

Jinak 6700 má all core boost 4GHz pokud se nepletu, při TDP 65W. To TDP na ty 4c/8t stačí a spotřeba bude v poho 1:1. Kometa 6c/12t při nebinované 10400F drží spotřebu do 65W při stejném all core boostu at se SSE nebo AVX. Binovaná 10900 při 65W drží 4GHz all core při SSE a 3.7GHz all core v AVX. Trošku se bojím že i ta i9 při stejné spotřebě bude podávat výrazně lepší výkon než 6700. 150% více jader, 7.5% nižší takt v přípavě AVX, stejná spotřeba...

+1
-1
-1
Je komentář přínosný?

Porovnávaš starý rel. úsporný 65W (kedy sa TDP dodržiavalo) 8t CPU s novým 16t neúsporným (neviem či príde R7 5700, ale z logiky veci by mal)? To fakt máš takú logiku?

+1
-1
-1
Je komentář přínosný?

Porovnanie zahŕňa prepočet na výrobný proces (7nm vs 5nm × konštanta)?

+1
-1
-1
Je komentář přínosný?

Neoznacuju sa jadra skor za Vykonne a Usporne jadra? skor nez male a velke? (aby nenabudol clovek mylny dojem o realnej velkosti jadier) Skoda ze sa neda nejak vykon porovnat len pri vykonnych a len pri uspornych jadrach.
Ale ako som povedal, na macbookoch na vyber clovek nebude mat, a na windows bude rad, ze bude mat takuto moznost Vykonneho a usporneho AMD miesto Intelu.
Tak sa tesim na nejake real-world porovnania s notebookom, ktory ma 5800u, zatial som ziadne nenasiel.

+1
+1
-1
Je komentář přínosný?

Obojí se používalo. Respektive, ARMy jsou dlouhodobě zažité jako malá jádra a i mezi nimi se rozlišovalo výkonná a úsporná. To samé pro x86 = velká jádra. I když i u x86 se občas mluvilo o malých jádrech (např. Atomy).

+1
+1
-1
Je komentář přínosný?

Označení malá a velká jádra pramení z ARMovské architektury big.LITTLE. Pro dnešní marketing zní "výkonná" a "úsporná" samozřejmě líp, ale princip je stále stejný a nadto pořád platí, že malá jsou velikostí menší než velká. :)

+1
0
-1
Je komentář přínosný?

To je pravda, ale výraz malé vs velké není ve skutečnosti takový rozdíl, reálně se to liší snad jen o L1 cache kdy to "malé" má jen 60% kapacit L1 "velkého", funkčně jsou stejná, co je ale výrazný rozdíl je spotřeba 1.3W max příkon pro 4 "malá" jádra vs 13.8W max příkon pro 4 "velká" jádra, proto se dá snadno hovořit lépe o efektivním a výkonném jádře.

+1
+1
-1
Je komentář přínosný?

Zajímavé povídání.

Ale nemyslím, že vše je až tak jednoduché - že lze prostě "přepočítat plochu" mezi 5nm a 7nm (navíc jedno je s EUV a druhé bez). Morfologie některých struktur se sice s menším procesem zmenšuje, ale u jiných zůstává stejná nebo se může i zvětšit. Pokud jsou v porovnání i značně velké plochy L1 a L2, registrových bank (nejsou všechny řešeny statickými klopnými obvody, ale i dynamickými - tj. pak jde o kapacitu pro uchování náboje a to se zmenšit nedá, pokud menší proces nemá radikálně menší leaky)... tak je takové porovnání "přepočtením na 7nm" značně na vodě.

Sice vlastní procesory nebo větší ASICy nedělám už léta - a i kdysi jsem to dělal jen "uživatelsky" přes Verilog/VHDL - a s vlastními věcmi kolem morfologie čipu nemám skoro nic společného, ale tyhle věci jsou prostě obecně známé a platí furt stejně.

Kromě toho menší proces může přinášet mnohá další úskalí, např. větší počet kvantových "potíží", má většinou menší napětí, tj. i odstup signál/šum je menší a tudíž se může docela snadno stát, že aby vše fungovalo, musí se zavést různé "zodolňovací mechanismy", třeba opakovače/tvarovače signálů, samoopravné chybové kontroly - tj. třeba registry s vlastním ECC), znásobení struktur kvůli vyšší výtěžnosti výroby která může mít v porovnání se starým procesem větší chybovost atd.

Menší proces má samozřejmě mnoho jiných benefitů, než proklamované "zmenšení", třeba menší leaky, lepší poměr frekvence/spotřeba, ... Že je "velikost hradla" 5nm nebo 7nm, to neznamená pro velikost vlastního tranzistoru skoro nic. Ona "velikost hradla" je prostě ta nejmenší struktura, kterou s tím lze pěkně vytvořit - ale tranzistor kvůli určitým parametrům může mít těch hradel třeba 8. Nebo také jenom jedno - podle účelu. Menší proces umožňuje vše udělat "čistěji" a přesněji, takže pak se dají elektrické parametry obvodu doladit mnohem lépe, hodnoty "součástek" mají menší rozptyl atd. To vše neznamená, že ve výsledku to nutně musí být i plošně menší. Ano, někdy (dá se říci i že většinou) to tak je.

A navíc, jak tady už také někdo napsal v diskusi, Apple při návrhu M1 měl i jiná kritéria než pouhé IPC pro Aarch64 - procesor je optimalizovaný i na emulaci x86-64 instrukcí, což přirozeně znamená vyšší složitost návrhu a tudíž "větší křemík".

Prostě, námět článku je pěkný, ale zjednodušovat to až tímhle způsobem, to nejde. Každý redukcionismus musí mít své meze, jinak dostanete "Kulatou krávu". A výsledky úvahy budou úplně zavádějící - nebo moc fajn na propagandu, tj. pisatel si tím může podpořit "pravdu" jakou potřebuje.

S čísly kolem morfologie čipů se dá velmi "kouzlit": počet hradel kontra počet tranzistorů třeba. Záleží jak se to počítá, protože (FET) tranzistor může mít třeba více gate elektrod z mnoha důvodů. Třeba se tak dá realizovat - při vhodných impedancích a kapacitách - N/OR nebo N/AND hradlo, jindy to může být jenom propojené, aby to zrychlilo spínání a přesun náboje. Počet hradel/tranzistorů může být uváděn "návrhový" na úrovni Verilog/VHDL logického návrhu čipu, ne "implementeční" - kdy se do počtu přidávají různé makrostruktury, třeba ty zmíněné opakovače/tvarovače signálu, vícenásobné provedení hradel pro zodolnění, ECC kontroly a samoobnovení hodnost, zpracování hw chyb, ... Prostě ta čísla jsou značně pofidérní, pokud neznáte přesně kontext. Výrobce to většinou neřekne...

+1
+7
-1
Je komentář přínosný?

treba si uvedomit, ze "zjedodusenie" clanku je reakcia na prispevky viacerych diskutujucich typu "apple m1 je super mega vykonne delo ktore vo vsetkych ohladoch a kazdej situacii rozotiera x86 cpu intelu a amd na franforce". Po istej dobe sa to zmiernilo na komentare, kde tito ludia porovnavaju len s cpu obdobnej kategorie, a najnovsie sa to zmiernuje dalej ked sa hovori typu "na to ake je to male", alebo "na to ake je to usporne" "tak to stale natiera vo vsetkych ohladoch.....".

Clanok je proste len nastrelenim "ballparku" ze kde sa to pohybuje, a ze zdaleka to nieje tak ze apple vydal zazracnu arch/cpu ktora rozmlela (pritomny, resp. minuly cas, nie buduci - ze ked spravi tieto a tieto zmeny pripadne taketo zazraky) cely x86 svet.

+1
+3
-1
Je komentář přínosný?

Tak jistě, ale když už nějaké blbosti vyvracet, tak je lepší to nedělat psaním dalších blbostí, i když tedy neporovnatelně menších.

S adorováním Apple M1 to je těžké, určití lidé jsou prostě otroky té dryjáčnické jablečné propagandy, a berou to málem jako nějaký povinný džihád. Rozšiřování víry svaté. I když o tom často vědí v podstatě kulové, jen co jim nablili do hlav ti jejich jableční kněžouři - černoprdelníci - teda vlastně bíloprdelníci.

Nikdo neříká, že ARM nemůže být taky výkonný procesor, jako třeba x86-64, ale zázraky se nedějí, po 50-ti letech vývoje procesorů už všichni zkusili všechno, a tak pokud bude mít budoucí ARM výkon jako x86-64, bude to i naprosto stejně žravé, velké, komplikované.

BTW ARM konsorcium včera ohlásilo architekturu ARMv9.

+1
+8
-1
Je komentář přínosný?

" ... pokud bude mít budoucí ARM výkon jako x86-64, bude to i naprosto stejně žravé, velké, komplikované."

Ne nutně.
Nesmíme zapomenout na to, že x86_86 s sebou táhne ťěžjou kouli zpětné kompatibility až k prapočátku 16-bitů původního 8086 z roku 1978.

Apple se rozhodl tohle (už poněkolikáté) odřiznout a udělat "čistý" návrh. Takže při stejném výkonu může být jednodušší a/nebo méně žravý.

+1
0
-1
Je komentář přínosný?

Intel už taky ruší podporu 16 bitů, ale toho letitého balastu tam furt zůstane mraky (desítky let).
https://arstechnica.com/gadgets/2017/11/intel-to-kill-off-the-last-vesti...

+1
0
-1
Je komentář přínosný?

Nemyslím si že někdo označuje M1 čip za dělo co zazdí všechno z x86 světa.

Je logické že to nemá s 4 efektivními a 4 výkonnými jádry možnost překonat mnohajádrové x86 procesory. Ale M1 není jen CPU ale čip, který toho dělá daleko více. Víz třeba ten neural engine, který v určitém strojovém učení překoná 32c/64t Threadripper který to musí počítat hrubou silou svých jader. To samé encoding videa, HW akcelerátor dokáže násobně urychlit proces a to s minimální energetickou zátěží, a není to jen ten encoding ale i akcelerace přehrávání. Poradí si s některými novými RAW formáty v 8k rozlišení tak že násobně dražší a výkonnější stroje to nezvládají a editor videa musí používat nižší rozlišení náhledového videa nebo dokonce vytvářet proxy.

Jelikož uživatel neřeší co za tím výkonem stojí a stroj s M1 je pro jeho use case i několikanásobně rychlejší, tak jednoduše bude tvrdit že M1 je neskutečně výkonné a má v tomto směru pravdu, to jestli za výkonem stojí CPU jádra nebo HW akcelerátor je irelevantní. Ano někdo, kdo potřebuje pracovat s něčím co tomu M1 nesedí a vyžaduje to hrubý výkon mnoha univerzálních jader, pak to logicky není stroj pro něj a setrvá s tím co má nebo koupí pro něj výkonnější HW. To není raketová věda, ale logický úsudek uživatele počítače, koupí to, co je pro něj výhodné.

Autor si nedal práci aby popsal rozdíly mezi "malými" a "velkými" jádry M1, nepopsal co dalšího M1 obsahuje a k čemu je to dobré, jen to tupě přirovnává k nějaké velikosti produktu firmy, která ani nikdy procesory pro Apple počítače nedodávala. Pointa toho článku je čitelná už z první věty článku - obhájit produkty, autorem preferovaného výrobce.

+1
-2
-1
Je komentář přínosný?

Nechces ty svoje nekonecny jablecny moudra jit povidat nekam na jablecny web? :))

+1
+1
-1
Je komentář přínosný?

Časem dojde ke konvergenci, Intel a AMD přidají HW akcelerátory a lepší správu paměti a nakonec to bude jen o výrobním procesu.

+1
0
-1
Je komentář přínosný?

Ja si nemyslim, ze "zazracnost" M1 je v tom, aky ma surovy vykon. Koniec koncov, ked Apple prechadzal z PowerPC na Intel, tak pouzil procesory, ktore boli technicky sem-tam aj krokom spat (napr. Core Duo bol len 32bitovy procesor, G5 bol 64-bitovy, per-core vykon prveho x86 iMacu bol rovnaky s per-core vykonom posledneho PPC iMacu. Fungovalo to len preto, ze na PPC userspace 64bitovy nikdy nebol a G5 sa nikdy nedostali do notebookov a iMacy nikdy nemali dvojjadrove G5ky). Cize im ani tak nejde o to, aby urobili nejaky brutalny medzigeneracny skok. Im staci, ze to nie je vyrazne pomalsie.

To, co z M1 robi killer CPU je samotny fakt, ze sa Apple rozhodol, ze nanho prejde. Ze si myslia, ze s ARMom dokazu konkurovat x86tke ododna 0 a ze x86tku eventuelne dokazu vykonovo prestat. Bude to tak? Neviem. S PPC to bolo ako na hupacke. Raz x86tke nakladala, potom vyrazne zaostavala.

To najdolezitejsie, co sa moze zmenit je, ze ked sa niekto bude rozhodovat o CPU pre zariadenie, ktore je nieco tucnejsie, nez mobil, alebo tabletoid / convertible, tak prestane uvazovat medzi AMD a Intelom a zacne uvazovat medzi x86 a niecim inym. To sa nestane ani dnes ani zajtra, ale ked sa to zacne diat, tak sa lahko moze ukazat, ze svet bez x86tky existovat dokaze.

+1
+1
-1
Je komentář přínosný?

Analyza se mi libi, ale dovolim si ji zpochybnit.

Cache ma primy dopad na vykon, stejne jako dalsi periferie. Proto si troufam tvrdit, ze relevantni je srovnani plochy celeho kremiku a ne jen CPU casti.
Pripadne se samozrejme muzeme bavit o vynechani GPU, ale zbytek, ktery muze ovlivnit vykon, by se do dane kalkulace mel zapocitat.

Nenasel jsem velikost GPU na M1, ale rekneme, ze je cca o velikosti o 1/3 vetsi nez Firestorm jadra, tj. 40 mm. Za nepresnost se omlouvam.

Apple M1 ma velikost 119mm2, AMD Zen3 ma velikost 80,7mm2.

Pokud od M1 odecteme 40 mm2, tak jsme na cca 80 mm2 prakticky stejnych, jako u AMD Zen3.

V tomto pohledu nezohlednuji nm a pocty tranzistoru. Tam jich ma Apple vic a to pomerem hustot 5nm vs 7nm vyrobnich procesu, pokud rekneme, ze jinak je to plosne plichta.

+1
-1
-1
Je komentář přínosný?

Pokud vynecháme jednotlivé menší logické chyby ve výše popsaném srovnání, pak tuto…

„Apple M1 ma velikost 119mm2, AMD Zen3 ma velikost 80,7mm2.“

…přehlédnout nelze. Nelze srovnávat výkon konfigurace Zen 3 s 16MB L3 cache (Cezanne) a argumentovat přitom plochou konfigurace s 32 MB L3 cache (Vermeer).

+1
+2
-1
Je komentář přínosný?

Ano, mate pravdu. Moje chyba.
Nicmene Cezanne ma velikost cca 175 mm2 - nasel jsem jen odhady a zadne potvrzene informace.
I kdyby pulka byla GPU, tak to budou podobna cisla.

Z jineho pohledu. Opet jsem nenasel cisla o rozmerech L3 u Vermeer, ale z obrazku to vypada na 35-40% plochy chipu. Pouziji 38% pro dalsi vypocet. 31mm2 je tedy cache (opet se omlouvam za nepresnost, je to jen odhad).
16MB je pulka tj 15mm2. Zen 3 zredukovany o pulku L3 by tedy mel rozmer 65 mm2.

Srovnavali bychom tedy M1 s 80 efektivnimi mm2 (bez GPU) s Cezanne s rekneme 65 mm2.

Chapu, ze cela tahle rychlo analyza plave, ale snazim se dat do souvislosti zavislost plochy kremiku a vykon. Mnozstvi tranzistoru bude jeste vetsi extrem, protoze jsem v rychlosti nasel ze 5nm by melo mit 1,8x vice trazistoru nez 7nm technologie.
V konecnem dusledku tedy potrebuje na dany vykon cca 2x vice tranzistoru nez Cezanne.

+1
-1
-1
Je komentář přínosný?

Jenže ty "hustoty výrobních procesů" od výrobců jsou víceméně hausenmera. Samozřejmě, marketing udává čísla v nejlepším případě, což ale o samotné denzitě "průměrného moderního procesoru" (s cachemi atd.) neříká vůbec nic, tedy skoro vůbec nic.

Tohodle guláše v údajích všichni zneužívají - např. Intel (někdo od nich) včera publikoval článek, že Intel trpí uváděním "špatných čísel" u technologií, takže pak "vypadá zaostale", a tedy že by asi měli začít uvádět lepší čísla. :-D

Marketing Intelu vychrlil v poslední době plno takovýchto článků (zásobují s tím "svoje novináře"):
https://www.oregonlive.com/silicon-forest/2021/03/whats-in-a-nanometer-i...

Typická korporátní reakce, prostě Inteláci špekulují (asi nějaké hlavy z marketingu), že místo 14+++++ nm budou psát třeba 10nm, a místo 10nm třeba 6nm... protože v tom mají 2x slaninu a tatarku navíc zdarma...

+1
0
-1
Je komentář přínosný?

co se vyrobni hustoty tyce, tak to je snadno dohledatelne.
https://en.wikipedia.org/wiki/5_nm_process

je to jen wiki, ale udavaji, ze 5nm ma 1,8x vice tranzistoru nez 7nm od TSMC. Doufam, ze to wikipedie nezmastila.

Nijak nereaguji na relnou velikost hradel, ale jen na samotny pocet tranzistoru na mm2.

+1
-1
-1
Je komentář přínosný?

M1 nemá ale jen jádra a cache a výstupy na kontrolery, ale obsahuje další funkční celky, ať neurální engine nebo HW akcelerátory. Na ty také připadá nemálá část čipu i tranzistorů.

+1
0
-1
Je komentář přínosný?

hlavne tam ma este RAM nie?

+1
-2
-1
Je komentář přínosný?

Ty někomu nadávej do dementů. Na každý fotce k článku o M1 je jasně vidět, že ram je vedle čipu:).

+1
+1
-1
Je komentář přínosný?

U toho původního článku to skutečně někdo zmínil a myslel že v těch transistorech je i RAM. Není to ode mne, já ani nekomentoval počty tranzistorů, mě je u zadele kolik tranzistorů má který procesor.

Jestli jedna firma potřebuje 1 milion tranzostorů a druhá firma potřebuje 2 miliony tranzistorů pro stejný výkon mi je naprosto jedno, nekupuju tranzistory ale zařízení které má nějaký účel :)

+1
-2
-1
Je komentář přínosný?

RAM je součástí logic boardu ne M1 samotného čipu, tvrzení že je RAM součástí nebo snad dokonce započítaná do počtu transistorů není ode mne. RAM je na každé fotce jasně poznatelná, jsou to ty dva čipy které jsou hned vedle téměř stejně velkého M1, je to stejné jako kdyby člověk rozebral kdejaký mobil, taky tam je hlavní čip a vedle něj jsou paměti což má důvod - krátké spoje, což znamená nižší latenci. Takže netuším kam tím míříš.

+1
0
-1
Je komentář přínosný?

Souhlasim. Tyto prvky maji zvysovat vykon. Netroufam si tvrdit, ze se muzou z vypoctu odstranit.

Vesmes to byla cela pointa meho prispevku. Jen samotna vypocetni cast se za bernou minci brat neda, protoze je ovlivnena obvody okolo.

+1
-1
-1
Je komentář přínosný?

Z výpočtu se mohou a nemusí vyřadit. To záleží kdo a pro jaký účel to počítá.

Mě hlavně přijde absurdní vůbec počty tranzistorů řešit natož to porovnávat jak pindíky kdo je lepší. Jestli to má 8 nebo 16 miliard tranzistorů je informace pro toho komu na tom hodně záleží, tedy nějaký technik či entuziasta, běžný uživatel toho produktu nemusí ani vědět co je tranzistor nebo k čemu je to dobré, natož jestli je méně je více nebo více je méně.

+1
0
-1
Je komentář přínosný?

tohle je technicky web a resi se to ze zajimavosti.

V konecnem dusledku souhlasim, ze pro zakaznika je jedno, kolik tranzistoru a jakou plochu nebo nm dany chip ma.

+1
-1
-1
Je komentář přínosný?

Ano je technický, ale v tom článku jsem si žádných technických detailů moc nevšiml, třeba právě to že efektivní i výkonné jádro se liší v cache a o kolik, což má vliv na jejich velikost, nebo to že "malá" jádra zvládnou to identické co velká, liší se jen výkon a takt.

Nikde není třeba polemika na to proč tam efektivní jádra jsou a jaký vliv to má na výkon a výdrž.

Mě by třeba zajímalo kolik výkonu má E Cluster při příkonu 1.3W a kolik výkonu podává P cluster s 13.8W příkonu, nebo jak ty efektivní jádra ovlivňují idle time a zda a jak je to možné používat jako allways on zařízení. Tohle si myslím bude i pro fanoušky HW daleko zajímavější infromace, která bude uchopitelná i lajky nebo méně zapálenými.

Neměl bych nic kdyby v takovém článku autor v jednom odstavci zmínil že Apple má při nějaké velikosti a hustotě procesu, X tranzistorů a že u konkurence jsou ty čísla jiná, ale stavět celý článek na dvou, reálně bezvýznamných parametrech a ještě jako reakci na nějaký komentář který si dovolil tvrdit že je to lepší produkt autorova oblíbeného výrobce a článek se snaží tohoto výrobce obhajovat mi přijde jen jako výraz fanbojství, který právě v technicky zaměřeném obsahu nemá co dělat.

A kdyby to bylo jednou, ale on to dělá docela pravidelně. Pamatuji nedávný článek, kde intel rušil nějakou extra záruku pro OC kterou nechal jen u nějakého top Xeonu. Jedna krátká tisková zpráva a informace o ní, autor k ní ale musel přidat informaci že AMD má výkonnější procesor s nižší tabulkvovou cenou a obtěžoval se dokonce dohledat nějaké grafy z výkonnostního testu. To je jako zpráva kde bude pointou "Automobilka A ruší rozšířenou záruku pro nově prodávaná vozidla." a k tomu přidal jako doplněk "Automobilka B má levnější vozy s výkonnějším motorem.". Dvě naprosto nesouvisející informace.

+1
0
-1
Je komentář přínosný?

Opět tady vidím tendenční článek který působí jako obhajoba AMD, přitom základ je postavený na tvrzení

"V diskuzi pod touto zprávou se opakovaně objevoval názor, že polovina jader M1 je malých"

Článek pak pokračováním té věty jasně naznačuje jeho trend a účel "a tudíž srovnání s APU Cezanne není objektivní."

Proč se při řešení BigLittle řešení na Arm architekturě porovnává s x86?

Proč je v článku toto?

"V první řadě je potřeba říct, že konfigurace jader je strategické rozhodnutí výrobce, které učinil sám o vlastní vůli."

Je snad jasné že výrobce nenavrhuje takovéhle produkty pod nátlakem a naopak se jedná o rozhodnutí a směr který se rozhodoval po dobu několika let

Neuvědomuji si, že by se v diskuzi hojně objevovalo "velká a malá" jádra. Takto to neprezentuje ani samotný Apple, vždy hovoří o výkonných a efektivních jádrech.

Kdyby si dal autor tu práci a otevřel si alespoň wikipedii a napsal jaké jsou rozdíly mezi těmito jádry, tak bych řekl že si s tím dal práci a nesnaží se obhajovat produkty jiné firmy. Sám ale potvrzuje fakt že úsporná Icestorm jádra jsou menší, to je vidět jak na obrázku čipu tak to i autor potvrzuje uvedením jejich plochy, takže pokud někdo v diskuzi mluví o malých a velkých jádrech, má pravdu.

Takže jak se tedy liší?

Firestorm, tedy výkonná, či velká jádra, chcete li, mají 192kB L1 instrukční cache a 128kB L1 data cache, jejich takty jsou v rozmezí 0.6 až 3.204 GHz a všechna čtyři jádra, označována jako P cluster mají maximální příkon 13.8W

Icestorm, tedy efektivní, či malá jádra, chcete li, mají 128kB L1 instrukční cache a 64kB L1 data cache, jejich takty jsou v rozmezí 0.6 až 2.064 GHz a všechna čtyři jádra nazvaná jako E cluster mají maximální příkon 1.3W

Dohromady je tedy příkon všech jader maximálně 15.1W a díky nižší cache efektivních jader je logické že na čipu zaberou menší prostor ale zbytek zůstává stejně velký protože efektivní jádro není jakkoli funkčně ořezáno, oproti efektivním jádrům připravovaného Alder Lake, které nemají podporovat některé instrukční sady.

+1
-5
-1
Je komentář přínosný?

Zajímavé by bylo podobné porovnání s Intelem (1185G7).

+1
-1
-1
Je komentář přínosný?

Porovnání různých laptopů s M1 Macbooky člověk najde na YouTube tuny. Intely obvykle nestíhají, hlavně v syntetických testech.

Vždy ale záleží na konkrétním use case a workflow. Když člověk shlédne klidně desítky recenzí a srovávání, tak se setká se stejnými závěry:

M1 Macbooky jsou skvělé stroje pro ty co potřebují mobilitu, vysoký výkon a dlouhou výdrž při práci na baterii, kdo chce overall vysokou kvalitu zpracování, ten, jehož workflow M1 čipu sedí (překlady kódu, editace videa, i práce s fotkami) a obejdou se bez Windows, případně nutné Windows only aplikace lze spustut pod MacOS (například wine apod.). Kdo nutně potřebuje Win si to nekoupí. Kdo potřebuje hrubý univerzální výkon, třeba pro 3D rendering bude volit také jinak, nejspíše AMD. Pro editaci videa která nesedne M1 ale sedne QuickSyncu bude zase vhodnou volbou Intel.

Co ale padá snad v každém srovnání je, že je to tiché a je to neporovnatelné s čímkoli trošku porovnatelným (nesrovnávají to s pasivně chlazenými laptopy s atomy). Kdo to ochutná už těžce přejde zpět :)

+1
-2
-1
Je komentář přínosný?

"Kdo nutně potřebuje Win si to nekoupí."

Nebo kdo potřebuje více než 16 GB RAM.

+1
+3
-1
Je komentář přínosný?

Však jsem to psal, záleží na use case a workflow. Pokud moje využití vyžaduje víc než je M1 schpný, tak je nepoužitelný. Otázkou je, kdo by s potřebou více než 16GB paměti a tady je třeba myslet na to že potřeba paměti na x86 která je ve slotech je odlišná s Arm, kde je součástí SoC. Obecně se uživatelé M1 schodují na tom že ty počítač se chovají obdobně jako x86 stroje které měly 2 až 4x více paměti. Tzn pokud na x64 bylo potřeba 32-64GB paměti, tak by 16GB na Armu mělo dostačovat. Mělo, ne že musí.

tady je poměrně nerealistický scénář, kdy naloží M1 s 8 a 16GB paměti, ano 8GB verze je třeba při exportu videa při takovém množství běžících aplikací výrazně pomalejší než 16GB verze, ale běží, tudíž pro takový workload stále stačí 8GB.
https://www.youtube.com/watch?v=h487I_5xOZU

+1
-2
-1
Je komentář přínosný?

>> Obecně se uživatelé M1 schodují na tom že ty počítač se chovají obdobně jako x86 stroje které měly 2 až 4x více paměti. Tzn pokud na x64 bylo potřeba 32-64GB paměti, tak by 16GB na Armu mělo dostačovat.

Sorry jako, ale tohle je ohromna kravina. Uzivatele se shoduji = subjektivni nazor, popr na jakem mereni je zalozen?
Pokud na neco potrebuju 32-64GB RAM, tak si fakt s 16GB nevystacim. Neco muze udelat komprese RAM, ale to funguje i x86 Macu.

+1
0
-1
Je komentář přínosný?

Ano pokud na M1 na něco nestačí 16GB RAM, tak nestačí, ale nejde porovnávat že na x86 a třeba pod jiným systémem nestačilo 32GB tak s M1 16GB stačit nebude.

"Uzivatele se shoduji = subjektivni nazor, popr na jakem mereni je zalozen"

Není potřeba cokoli měřit, stačí to používat. Názor je podložený praxí, jestliže měl člověk před tím Mac s 32-64GB protože mu s 16GB docházelo k zavírání aplikací a když dělá to samé na 16GB M1, tak to asi znamená že nepotřebuje víc.

https://www.youtube.com/watch?v=59gAjXT7qyw tady není prove že by nestačilo méně RAM na Intelu, ale M1 s 16GB při všech těch činnostech překonává levou zadní Intelí mini s 64GB.

+1
-1
-1
Je komentář přínosný?

Tu je nutne podotknut, ze masox uz nejaky ten piatok zvlada online kompresiu RAM, takze masina s masoxom o 16GB RAM v odozve bez vaznejsich problemov presti Windowsiu masinu s 32GB. To je realna skusenost z prevadzky. Podobne je na tom Linux so zRAM.

+1
0
-1
Je komentář přínosný?

BTW já myslel konkrétní srovnání jako v článku, tj. plocha/počet tranzistorů na jádro.

+1
-1
-1
Je komentář přínosný?

Ty jsi pindal. Jsou lidi co si nekupuji nakously jabko, protoze presne vedi proc to nechteji. Omezenost platformy, sw, atd.. Treba moje malickost a neni to tim, ze by museli pouzivat widle.
Ty jsi jak alenka v risi divu z toho, ze jsi si poridil jablecny M1 a ted to tady jako spravny zverozvest budes omilat dokola, dokola, dokola..

+1
0
-1
Je komentář přínosný?

Jak píšeš:
macOS je omezený jak samotnou platformou tak SW, tzn. je nevhodný pro tvůj use case a logicky zvolíš jinou platformu a OS, ano jako alternativu jsem uvedl jen Win, jistě existují i jiné operační systémy než Win a macOS a pokud jsou pro uživatele vhodnější tak je logické že zvolí takovýto OS

Tzn přesně to co jsem psal výše.

Pokud ke mě člověk přijde s radou na počítač a zjistím že pro jeho činnost je nejlepší mnohajádrové CPU od AMD protože dělá nějaké univerzální výpočty nebo výpočty které škálují se silou grafické karty i procesoru a bude prokazatelně lepší tak nemám problém na takový laptop ukázat. Stejně jako rád ukážu na Intel s Win, Intel s macOS nebo M1 s macOS.

Vždy zohledňuji use case a další požadavky. Neexistuje univerzální pravda, taky když ke mě někdo přijde a radikálně řekne že "nechci macOS" tak mu nedoporučím macOS stroj, ale upozorním ho, že pro jeho potřebu by třeba mohl být macOS stroj výhodnější, stejně tak obráceně, někdo si řekne "nechci nic než macOS" tak mu navrhnu stroj s macOS a upozorním, že by pro něj bylo vhodnější vybrat něco jiného. Nikoho nebudu tlačit do toho či onoho když o to nestojí, jsou to jejich peníze, ne moje, ať si dělají co chtějí, já mám ale klidné svědomí že jsem vybral podle požadavku a zároveň jsem navrhl i řešené, které by dle mne bylo to nejlepší pro jeho potřebu.

+1
0
-1
Je komentář přínosný?

Obmedzenost jablcnej technologie by som si dovolil zaradit do kategorie mytov. A uz hodne dlho. Uz v dobach new world macov nebol zas tak strasny problem nabootovat na takom macu Linux.

A tie stroje nie su vonku ani rok a nie je to zas tak velky problem ani na M1. Apple to dokonca oficialne podporuje a "bless"nut custom kernel je mozne z applieho userspacu. Cela tato obstrukcia tam bude kvoli secure boot-ish chainu, aby nahodny bootnuty soft nenarobil v masine galibu.

Ze Apple nezverejnil specifikacie grafiky a driver treba reverse engineerovat? Chodte sa spytat vyvojarov Panfrostu, kolko speciek dostali k Tckovej Mali od ARM (btw su to ti isti ludia, co riesia podporu na GPU v M1), alebo vyvojarov Nouveau, kolko speciek dostali od Nvidie (zdvihnuty prostrednik a fakturu za konzultacie).

Isto, RMS to nie je, ale v porovnani s inym korporatom na tom nie su onic horsie, ani lepsie. Ba by som povedal, ze zvysok IT sveta naopak Apple v otvorenosti len dobieha, aj ked Apple mal aj svetlejsie chvilky, ktore sa skoncili s prechodom na x86.

+1
+1
-1
Je komentář přínosný?

Např. pokud vím, tak Apple M1 nahrává firmware před spuštěním (libovolného) OS (narozdíl od neřešitelného problému s NVidia GPU v Linuxu). Takže stačí napsat jen driver (prý jim pomáhá možnost reversovat ten v macOS).

+1
0
-1
Je komentář přínosný?

Ze všech jablečných technologií mě zaujal pouze štrůdl... ale to tu asi nikoho nezajímá. :)

+1
+5
-1
Je komentář přínosný?

Mne jo, ja strudl rad ;)

+1
+2
-1
Je komentář přínosný?

Co takhle ... Calvados?

+1
0
-1
Je komentář přínosný?

Paní Pohlová by taky dozajista nejraději všechny ty jablečné technologie, vyjma štrůdlu, zakázala.

+1
0
-1
Je komentář přínosný?

Poslední dobou mi příjde, že Věra Pohlová byla velký vizionář... :)

+1
+3
-1
Je komentář přínosný?

Paní Pohlová nejspíš nic z toho, co se jí přisuzuje, neřekla. Tehdejší redaktorka Metra si naprosto vymýšlela odpovědi, což jsem bohužel tehdy zažil na vlastní kůži.

+1
0
-1
Je komentář přínosný?

Fillipe: "Výsledok nie je žiadne prekvapenie vzhľadom na 4+4 vs 8/16. 2x toľko plnohodnotných jadier, 2x toľko vlákien. V MT o 23% rýchlejší"

no-X: "„2x toľko plnohodnotných jadier“
1. Co je plnohodnotné jádro?"

Filipe: "1. High performance "Firestrom" jadrá + energy-efficient "Icestorm"...ale to určite vieš."

no-X: "1. To není odpověď na moji otázku. Neptám se, jak marketing Applu říká jádrům v M1, ale co to jsou velká a co to jsou malá jádra (definice)."

Nakoniec si o tom "marketingu" Apple napísal celý článok. O velkých a malých jadrách si začal ty sám. Ja sám som použil výraz "plnohdnotné" na označenie rozdielu vo výkone aký podávajú. Inak výborný článok len vznikol z nesprávneho popudu. Stále však nevidím žiaden "háček" v multi core výkone M1. R7 4700U (8 jadier bez SMT) v multi core vo väčšine testov zaostáva za M1.

+1
0
-1
Je komentář přínosný?

Ono nejde srovnávat "výkonné" jádro M1 a jadro Zen 2/3 přímo.
Jádro Firestorm je navržno jako jádro (v podstatě) dvojnásobné šířky. Krmit těch "6 ALU" naplno by nešlo při použití instrukční sady x86.
Jádro Zen i kdyby obsahovalo stejný počet ALU (FPU a dalších srandiček), tka je kvůli zpětné kompatibilitě (až k roku 1978) nedokáže nakrmit a některá se flákají. SMT umožňuje získat nějaký výkon navíc použitím nevyužitých jednotek pro druhé vlákno. Pokud se SMT zakáže, nevyužívají se všechny zdroje jádra.

Cinebench R23 (10 min test)
3700x PBO SMT+ 1293 / 12497 (ca 75% výkonu, resp 25% nevyužito)
3700x PBO SMT- 1290 / 9412
5800x ECO SMT- 1569 / 11577 (ca 80% výkonu, resp 20% nevyužito)
5800x ECO SMT+ 1591 / 14446
5800x PBO SMT+ 1590 / 15498

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.