Podrobně: Nejambicióznější částí Lunar Lake je GPU, Intel mu věnoval nejvíc
Příští měsíc plánuje Intel uvést novou generaci mobilních procesorů Lunar Lake. Ta bude historicky druhou, nebo vlastně již třetí mobilní řadou od Intelu, která je postavena na dlaždicích. I když, jak se to vezme. Již některé starší generace mobilních procesorů tvořily dva kousky křemíku - samotný procesor a čipset v jednom společném pouzdru. Pokud je ale řeč o přímém spojování křemíku, jde skutečně o druhou či spíš třetí generaci.
Mobilní dlaždice 1. generace - Lakefield
Intel Lakefield (Intel)
Tou první, již i Intelem opomíjenou, byl totiž Lakefield. Malý mobilní čip integrující jedno velké jádro, čtyři Atomy a složený z na sobě navrstvených křemíků. Intel jim tehdy ještě říkal čiplety, až později jeho marketing vyhodnotil, že označení prvku, se kterým jako první přišla konkurence, není vhodné a zavedl vlastní označení dlaždice. Lakefield tvořil 14nm systémový křemík, na němž ležel 10nm křemík s CPU a GPU překrytý vrstvami pamětí. Skončil jako propadák, velké jádro totiž nepřinášelo prakticky žádný užitek. Problém spočíval v tom, že v důsledku překrytí vrstvami pamětí a nevalných vlastností tehdejšího 10nm procesu nemohlo běžet na frekvencích, které by jednojádrový výkon posouvaly smysluplně nad úroveň Atomů. Další zádrhel spočíval ve skutečnosti, že z důvodu omezení architektury muselo mít jádro vypnuté HT (déjà vu po čtyřech letech?), vypnuté AVX-512 (platí stále), vypnuté AVX-2 i AVX (s čímž se už Intel u novějších čipů zvládl vypořádat).
Mobilní dlaždice 2. generace - Meteor Lake
Meteor Lake (Intel)
Druhou generací mobilních dlaždicových procesorů Intelu je dobře známý Meteor Lake, takže Lunar Lake je tedy třetí. Přestože je Lunar Lake konkrétním pojetím dlaždic podstatně blíže Meteoru než Lakefieldu, i oproti Meteoru se výrazně liší. Meteor Lake vycházel ze tří základních dlaždic (čtvrtou můžeme v rámci vysvětlení hlavní myšlenky ignorovat). Dlaždice procesorová, dlaždice grafická a dlaždice systémová. Systémová dlaždice byla největší (~100 mm²) a vznikala na nejlevnějším procesu (6nm TSMC), grafická a procesorová měřily obě kolem 70 mm², přičemž grafickou vyrobila TSMC na 5nm procesu a procesorovou Intel na svém 4nm procesu.*
*z hlediska dnešního srovnání je nepodstatná malá IO dlaždice vzniklá na 6nm procesu TSMC a základní dlaždice (interposer) vyrobená 22nm procesem Intelu
Idea kolem Meteor Lake byla taková, že systémová dlaždice bude disponovat vším nutným pro běh systému včetně dílčích grafických a procesorových prvků, aby při nízké zátěži mohl čip fungovat i s vypnutou procesorovou a grafickou dlaždicí a tím šetřit energii (energii těchto dlaždic i sběrnic, které je propojují).
Myšlenka to byla zajímavá, ale ze dvou důvodů v praxi moc nefungovala. Prvním důvodem bylo, že obvody vyrobené na 6nm procesu (tedy v centrální dlaždici) mají logicky vyšší spotřebu než obvody vyrobené na 5nm nebo 4nm procesu (GPU a CPU dlaždice). Druhý zádrhel spočíval v praxi, kdy procesy běžící na pozadí neustále probouzely procesorovou dlaždici, takže řada recenzí (bez umělých zásahů v podobě povypínání procesů běžících na pozadí) nedokázala dosáhnout energetické úspory, kterou Intel avizoval.
Mobilní dlaždice 3. generace - Lunar Lake
Třetí pokus se Intel rozhodl koncipovat opět odlišně. Lunar Lake tvoří dvě základní dlaždice. První (výpočetní) nese prakticky všechny obvody (CPU, GPU, NPU a to i řadič pamětí včetně rozhraní), zatímco druhá obsahuje (s výjimkou několika linek PCIe, k čemuž se vrátíme) pouze pomalá rozhraní (USB, Thunderbolt, rozhraní pro Wi-Fi ap.), což docela připomíná starý koncept procesoru + čipsetu v jednom pouzdru. Výpočetní dlaždice je vyrobena na 3nm procesu TSMC (původní plán byl proces Intel 18A) - navzdory tomu je několikanásobně větší než IO dlaždice, neboť jde vlastně o kompletní řešení s výjimkou pomalých rozhraní.
Lunar Lake (Intel)
Zatímco s Meteor Lake byla v jednom kusu křemíku procesorová jádra, ve druhém grafická jádra a ve třetím řadič pamětí, s Lunar Lake jsou všechny tyto (a další) klíčové prvky v jedné velké dlaždici. To je výhodnější z energetického hlediska (v podstatě to připomíná i monolitická APU AMD), na straně druhé jde o relativně velký 3nm monolit, což znamená podstatně vyšší výrobní náklady, zároveň však při zachování potřeby dražšího dlaždicového pouzdření (Foveros ap.)
Grafika, grafika, grafika…
Největší dlaždice Lunar Lake je tedy zároveň vyráběná na nejdražším (3nm) procesu, za který Intel ještě platí externímu dodavateli (TSMC). Může tak působit trochu překvapivě, že zatímco po stránce procesorových jader Intel na Lunar Lake docela šetřil (4 velká jádra a 4 Atomy, což je proti Meteor Lake s 6+8+2 jádry docela propad), s grafikou naopak vůbec nešetřil a naopak ji po všech stránkách citelně přifoukl.
I v tomto ohledu jde tedy o diametrálně odlišnou filozofii než u Meteor Lake. Tam byla grafika na samostatné dlaždici, při zhruba 67 mm² a podstatně levnějším 5nm procesu TSMC nemohla být nějak zásadně drahá a přitom ji Intel oproti původním plánům zmenšil. Naopak v případě Lunar Lake, kde je grafika integrována v poměrně velkém funkčním monolitu (náklady na výrobu rostou s plochou exponenciálně) a to ještě na nejdražším dostupném procesu (3nm TSMC) se nezdá, že by Intel po stránce grafiky jakkoli šetřil.
GPU | Lunar Lake | Strix Point |
---|---|---|
proces | 3nm TSMC | 4nm TSMC |
L2 cache | 8 MB | 2 MB |
SLC | 8 MB | - (uvažována 16MB) |
Není zde patrný jen kontrast s předchozí generací, ale i oproti konkurenci. AMD s APU Strix Point (Ryzen AI 300) byla v důsledku integrace výkonnějšího NPU (AI akcelerátoru) nucena ušetřit nějaký křemík a rozhodla se proto vypustit 16MB SLC / Infinity Cache, která měla být společná pro CPU i GPU a jejímž cílem bylo snižovat omezení výkonu GPU dané propustností paměťové sběrnice. Grafice ve Strix Point tak zůstala jen vlastní 2MB L2 cache. Naproti tomu grafika Lunar Lake obsahuje vlastní 8MB L2 cache a k tomu může využívat i sdílenou 8MB SLC (systémovou cache). Obojí je rovněž integrováno ve velké 3nm dlaždici.
Situace tak působí dojmem, že zatímco byl Intel ochotný přistoupit k kompromisu na úrovni procesorových jader (mezigenerační snížení počtu fyzických jader i navzdory ztrátě HT), z nějakého důvodu nechtěl v žádném ohledu omezit integrovanou grafiku, které obětoval poměrně dost křemíku:
Lunar Lake se zvýrazněnými částmi GPU (Intel)
Největší tmavě modrá část zvýrazňuje 3D jádro, středně modrá část výše jsou obvody pro video a světle modrá část níže vpravo jsou obvody pro obrazové výstupy. Pouze tyto tři části zabírají 38 % plochy dlaždice, 8MB SLC nepočítaje (pokud bychom ji počítali, dostáváme se na 43,4 % plochy).
Důvody
Takový přístup samozřejmě vyvolává otázky. Co může vést Intelu k tomu, že upřednostňuje grafickou část prakticky bez ohledu na náklady, zatímco procesorová zůstala podstatně skromnější? Z hypotetických scénářů se jeví jako pravděpodobné dva.
Lunar Lake s popisy (DIIT)
První trochu koresponduje i se skromnou výbavou PCIe linkami. Lunar Lake disponuje všeho všudy 4 linkami PCIe 5.0 a 4 linkami PCIe 4.0. Část z nich navíc bude využita pro úložiště případně přídavné řadiče. Dále je potřeba mít na paměti, že žádné stávající samostatné GPU nepodporuje PCIe 5.0, takže libovolné hypotetické GPU připojené k Lunar Lake by běželo maximálně v režimu PCIe 4.0 ×4, což je pro výkonnější řešení více či méně limitující. Intel tedy může výkonnějším GPU v kombinaci s omezenou PCIe konektivitou tlačit výrobce notebooků k tomu, aby nevyráběli modely vybavené samostatnou grafikou. To se Intel (nutno říct, že nepříliš úspěšně) snažil prosadit od doby Ivy Bridge (2012). Jakékoli výkonnější GPU současné generace by bylo omezeno efektivním PCIe 4.0 ×4 a jakékoli slabší GPU s ohledem na výkon integrované grafiky Lunar Lake nedává valný smysl. Smysl to dává.
handheld konzole Claw (MSI)
Druhý důvod může spočívat ve snaze o upoutání výrobců handheld konzolí. Do těch se sice dokázal okrajově dostat již Meteor Lake, ale testy ukázaly, že ani s dvojnásobnou spotřebou nedokáže dosáhnout výkonu konkurenčního APU Phoenix. Meteoru se ve světě konzolí příliš prorazit nepodařilo. Intel možná nyní považuje za důležitější vstoupit do rodícího se segmentu a využít příležitosti, než jednorázově ušetřit křemík + náklady a mobilní konzole přenechat konkurenci (AMD+Nvidia). Někdo ve společnosti to může považovat za podstatné poté, co si Intel před lety nechal utéct nastupující segment procesorů pro chytré telefony a následně vypadl i z mobilních zařízení Applu navzdory tomu, že fakticky neměl konkurenci. Cílem tedy může být nepromrhání další příležitosti.