Jak si vede Apple M1 v CineBench R23?
Apple označuje svůj nový SoC jako „M1“, ale nehovoří o modelech. Mluvit tedy o výkonu nebo spotřebě M1 jako takového, může být značně zavádějící. Verze pro MacBook Air s pasivním chladičem má nižší TDP než verze pro Mac Mini s aktivním chlazením, ale Apple neuvádí ani TDP, ani veřejně nerozlišuje mezi těmito modely. Formálně uváděné taktovací frekvence jsou sice stejné, ale jak víme z praxe s x86 jádry, to samo o sobě nic neznamená - v segmentu úsporných produktů je podstatnější omezení ze strany TDP. To je primárním určujícím prvkem, zda vůbec a jak často bude uváděných taktů dosaženo, respektive na jakých taktech jádro reálně běží.
Příkladem za všechny může být APU Renoir od AMD. 15W Ryzen 7 4800U, 35W Ryzen 7 4800HS i 45W Ryzen 4800H mají všechny totožný maximální takt 4,2 GHz. TDP a řízení spotřeby ovšem určuje, kolik z osmi jader, jak často a jak moc se této hodnotě blíží.
U M1, které modelové značení chybí (či spíše zůstává interním údajem) a u které není uváděno ani TDP, je tedy zapotřebí striktně rozlišovat, o kterou verzi jde alespoň označením produktu, ve kterém byla testována. Nejvyšší výkon totiž nabízí model určený pro stolní mini-PC Mac Mini, o chlup níže je model určený pro MacBook Pro a nejníže model pro tenký MacBook Air.
model | SoC | konf. | trans. | proces | TDP | CB-R23 MC | CB-R23 SC |
---|---|---|---|---|---|---|---|
Ryzen 9 5950X | Vermeer | 16 / 32 | ? | 7nm | 105W | 28782 | 1684 |
Ryzen 7 5800X | Vermeer | 8 / 16 | ? | 7nm | 65W | 14532 | 1600 |
Ryzen 5 5600X | Vermeer | 6 / 12 | ? | 7nm | 45W | 9435 | 1524 |
Core i7-1065G7 | Ice Lake | 4 / 8 | 7 mld. | 10nm+ | 28W | 4254 | 1178 |
Core i7-1165G7 | Tiger Lake | 4 / 8 | nesp. | 10nm++ | 17W | 4732 | 1510 |
Core i7-1165G7 | Tiger Lake | 4 / 8 | nesp. | 10nm++ | 28W | 4904 | 1532 |
Core i7-1185G7 | Tiger Lake | 4 / 8 | nesp. | 10nm++ | 28W | 6266 | 1541 |
Ryzen 7 2700U | Rav. Ridge | 4 / 8 | 4,94 mld. | 14nm | 15W | 2586 | 823 |
Ryzen 5 4600U | Renoir | 6 / 12 | 9,8 mld. | 7nm | 15W | 8044 | 1162 |
Ryzen 7 4800U | Renoir | 8 / 16 | 9,8 mld. | 7nm | 15W | 9286 9674 | 1199 1241 |
Ryzen 7 4800U | Renoir | 8 / 16 | 9,8 mld. | 7nm | 25W | 10235 | 1237 |
Ryzen 9 4900HS | Renoir | 8 / 16 | 9,8 mld. | 7nm | 35W | 10641 | 1260 |
„Mac Mini“ | M1 | 4 + 4 | 16 mld. | 5nm | 20-24W? | 7833 | 1522 |
„MacBook Pro“ | M1 | 4 + 4 | 16 mld. | 5nm | 18-22W? | 7783 | 1493 |
„MacBook Air“ | M1 | 4 + 4 | 16 mld. | 5nm | 12-15W? | 7032 | 1493 |
Dále je potřeba mít na paměti, že podle měření webu Anandtech není spotřeba M1 až tak nízká, jak se podle předchozích zpráv mohlo zdát (Apple avizoval až 3× vyšší výkon a až 2× nižší spotřebu oproti neupřesněným konkurenčním produktům), přičemž Anandtech se dopracoval ke zjištění, že spotřeba SoC v Mac Mini odpovídá TDP zhruba v rozmezí 20-24 wattů. Při srovnávání s konkurencí je proto potřeba toto zohlednit.
Dalším faktem, který by neměl být opominut, je rozpočet tranzistorů, který si Apple stanovil a který je, mírně řečeno, neskromný. Jde o 16 miliard tranzistorů, což se nevymyká jen ULV segmentu, ale je to více, než se odhaduje například u SoC nového Playstation 5. GeForce RTX 2080 Super disponuje 13,6 miliardy tranzistorů.
- Apple M1: 16 miliard tranzistorů
- Playstation 5 SoC: 13-15 miliard tranzistorů (odhadováno)
- GeForce RTX 2080 Super: 13,6 miliard tranzistorů
- Zen 3 16 jader (Ryzen 9 5950X): 10,9 miliard tranzistorů (odhad; 2× 4,4 + 2,09)
- GeForce RTX 2060: 10,8 miliard tranzistorů
- Renoir (Ryzen 9 4900HS): 9,8 miliard tranzistorů
- Zen 2 16 jader (Ryzen 9 3950X) : 9,69 miliard tranzistorů (2× 3,8 + 2,09)
APU Renoir, které slouží i pro 65W desktop, sestává z 9,8 miliard tranzistorů a pro 16 jádrový Zen 3 s velkým centrálním čipletem integrujícím plnohodnotný čipset stačí méně než 11 miliard tranzistorů. Pokud bychom vzali například grafické jádro GeForce RTX 2060 a integrovali do něj osmijádrový čiplet Zen 3 i s jeho velkou L3 cache, stále by takový produkt nesl skoro o miliardu tranzistorů méně než Apple M1.
Na Apple M1 tudíž nelze pohlížet - jak bylo u mobilních ARM SoC prakticky po dekádu obvyklé - jakožto na „malé úsporné ARM“ jádro. Velké množství z tranzistorového rozpočtu evidentně padlo na zvýšení IPC a energeticky efektivnější fungování čipu. Co do energetické efektivity samozřejmě pomohl i 5nm proces s EUV litografií.
20-24W 5nm Apple M1 s 16 miliardami tranzistorů dosahuje celkového procesorového výkonu, který je nižší, než u 15W 7nm APU Renoir s 9,8 miliardami tranzistorů postaveného na minulé generaci architektury Zen (2). Výkonnější není jen osmijádrová verze, ale i mainstreamová šestijádrová.
V jednojádrovém výkonu se Apple dostal na úroveň architektur Intel Willow Cove a AMD Zen 3, byť opět s výhodou 5nm procesu TSMC. Je otázka, nakolik je jednojádrový výkon relevantní v mobilním segmentu, zvlášť v ekosystému Applu. Jsou tu totiž tři pádné argumenty, které jej odstavují na vedlejší kolej:
- aplikace Applu jsou zpravidla dobře optimalizované pro využití více jader
- v ekosystému Applu nehrozí harakiri v podobě scheduleru Windows, který nebyl schopný efektivně využívat všechna jádra některých procesorů a tím zvýhodňoval produkty s vyšším výkonem nižšího počtu jader
- jednojádrový výkon je v desktopu ceněn především kvůli zajištění herního výkonu na high-endových grafikách, což jde zcela mimo zaměření Applu
M1 je tedy podstatnou změnou z hlediska strategie Applu, ale nedá se říct, že by přinášel vyšší výkonnostní pokrok než kdyby se Apple domluvil na odběru procesorů na zakázku s AMD nebo Intelem. Z hlediska výkonu totiž Apple dotahuje vícejádrový výkon 7nm šestijádrového Zen 2, zatímco za pár měsíců chystá AMD uvedení APU s jádry Zen 3, která přes 7nm proces v rámci 15W TDP nabídnou o třetinu vyšší vícejádrový a zhruba stejný jednojádrový výkon než >20W M1. Intel je v tuto chvíli limitován energetickou stránkou 10nm++ procesu, ovšem architektura Willow Cove nabízí velmi podobné IPC a do ~25W TDP by Intel jistě byl schopen dostat šest jader (chystá osmijádrový model pro 35W TDP), která by rovněž překonala možnosti M1.
Apple tedy přichází s produktem, který mu umožňuje přejít na vlastní řešení, aniž by ztrácel výkon oproti předchozím řešením Intelu, která používal. M1 oproti nim však nabízí spíše obvyklý mezigenerační posun, který nejde nad rámec nabídky x86 světa. Vrátíme-li s k nadpisu našeho předchozího článku, tedy CPU Apple M1 je 3× rychlejší a 2× úspornější, ale nikdo neví v čem a oproti čemu, platí i nadále, že není jasné, jak Apple těchto výsledků dosáhl.
Anandtech, ComputerBase aj. (odkazy ve článku)