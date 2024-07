Konference AMD Tech Day byla rozdělena do dvou dní, přičemž do Los Angeles byli pozváni novináři ze všech zemí světa a to včetně ČR, Srbska, Švédska a dalších menších zemí. První den proběhlo několik úvodních přednášek, kde přednášeli "hlavouni" z AMD, konkrétně Mark Papermaster, Jack Huynh a Vamsi Boppana.

Druhý den obsahoval spíše kratší úvodní přednášku a poté jsme byli rozděleni do několika skupin a rotovali jsme po místnostech, kde došlo na detailnější přednášky a možnosti diskuze, nechyběla ani místnost s produkty na ozkoušení.

Pokusil jsem se tedy vypíchnout některé zajímavější body celé akce, přičemž celé dva dny byl kladen velký důraz na XDNA2 a AI technologie. Aby byla nějaká legrace, rozhodl jsem se využít místo hezkých obrázků z PDF souborů od AMD, použít fotografie, které jsem na akci pořídil telefonem a které vylepšilo AI.

Mobilní produkty

První přednášku zahájil Jack Hiyunh, který nezapomněl připomenout historii Ryzen procesorů od roku 2017 a také prohlásil, že AI je velké jako byla kdysi průmyslová revoluce. Zaměření bylo primárně na nové mobilní procesory generace Strix Point, ty totiž mají zbrusu nové XDNA2 NPU s výkonem až 50 TOPS a nové iGPU založené na RDNA 3.5 architektuře.

Jack také zmínil zlepšující se stav množství notebooků s AMD procesory, údajně je pro Strix Point (Zen5 + RDNA 3.5) připraveno 300+ různých modelů, výběr tak má být značně lepší než u předchozích generací.

Nové mobilní procesory budou mít poněkud jiné značení, což je známo, vrcholový model je pak zajímavý tím, že má dvanáct fyzických jader a největší iGPU Radeon 890M. Nechybí samozřejmě XDNA2 NPU. Velký důraz byl i na tenčí notebooky, některé modely mají mít tloušťku jen 11 milimetrů, což osobně nevnímám jako požadovanou vlastnost notebooku, po které všichni křičí, ale je to trend posledních pár let.

Zajímavá byla i zmínka ohledně RAM, 8GB paměti je už delší dobu celkem málo, AMD tak chce, aby výrobci notebooků nabízeli notebooky s Ryzeny AI vybavené minimálně 24GB RAM, což je zajímavý krok. Otázka je, jak to bude implementováno, u notebooků s pájenou pamětí doufám v nějaké rychlé LPDDR5X-7500 paměti a u dalších modelů dojde snad na použití veselého standardu LPCAMM2(nebo dvou SODIMM slotů), ale potvrzené to nemám. Notebooky mají být dostupné koncem tohoto měsíce.

AMD dále ukázalo i jeden výkonnostní graf, kde srovnává integrovaný Radeon 890M oproti diskrétní GeForce RTX 2050 @ 60W, přičemž Radeon byl testován s AMD Fluid Motion Frames technologií, což je ekvivalent Frame Generation u NVIDIA karet. Toto je poněkud zvláštní srovnání, jelikož RTX 2050 je spíše v levnějších noteboocích a jedná se o starší hardware, který Frame Generation nepodporuje.

Je tedy otázka, jak by si Radeon 890M vedl bez technologie přidávající FPS. Z jiného úhlu pohledu je toto srovnání zajímavé z hlediska energetické efektivity, jelikož APU v napájecím rozpětí 15-54 Wattů poráží kombinaci 40W CPU a 60W GPU.

Zen 5 a RDNA 3.5

Další přednášku zahájil starý známý Mark Papermaster. Tato část se týkala několika architektonických změn procesorů založených na Zen5 architektuře. Vylepšení se konají v predikci, ale také například v L1 cache, ta je prý dvakrát rychlejší, než u Zen4 procesorů, je nově dvanácti cestná s kapacitou 48 kB, propustnost mezi L1 a L2 cache navíc byla také navýšena.

AMD má nově v každém jádru šest ALU. Ano, 6x ALU je opravdu zde a plánovač pro ALU je prý nyní unifikovaný, což Zen4 a starší také nemají.

Další novinkou si prošla podpora instrukce AVX-512, chová se 512-bitově a ne 2x 256-bit, jako to je u Zen4. Teoreticky by to mohlo zlepšit výkon. Tedy dle AMD jsou zrychlení celkem značná, byť IPC jao takové vyrostlo průměrně o 16%.

Zajímavou novinkou Zen5 EPYCů pak má být technologie TrustedIO, cílem je zajistit bezpečnost a šifrování komunikace mezi důvěryhodnými PCIe kartami a procesorem, tedy něco jako TSME, tedy šifrování paměti. Další detaily se dozvíme snad časem, jedná se o nový standard. Mark Papermaster v této fázi neopomněl zmínit, že produkty dodávají na trh včas již několik let.

Mobilní procesory Strix Point mají oproti desktopu navíc i nové XDNA2 NPU a novější grafické jádro založené na architektuře RDNA 3.5, tato mezigenerace se týká pouze mobilních Strix Point iGPU a vznikla údajně na základě spolupráce se společností Samsung a Radeony pro ARM SOC Samsungu. Hlavním rozdílem oproti RDNA3 je tak více optimalizací pro snížení spotřeby a zlepšení energetické efektivity.

Inženýři se zaměřili na paměťový subsystém a zvýšení výkonu shaderů, co se paměti týče, s daty se pracuje přímo v cache, než se přesunou do RAM, což zlepšuje výkon. Dále jsou zde nějaká HW vylepšení pro LPDDR5 paměti, za účelem zvýšení výkonu.

AMD pak uvádí navýšení výkonu až o 32% v 3D Mark Time Spy oproti předchozí generaci, na reálný výkon si samozřejmě počkáme a očekávám značné rozdíly podle napájecích limitů procesorů.

Bohužel žádné další grafické produkty oznámeny nebyly, tak trochu jsem doufal v nějaké zajímavé APU s HBM2, či nějaké mobilní dGPU, ale RDNA 3.5 se týká čistě iGPU v procesorech Strix Point. Snad tedy příště.

AI - XDNA 2

Další přednášející Vamsi Boppana se ujal přednášet o AI. Dejte si panáka, pokaždé, když uslyšíte slovo AI. To byl samozřejmě vtip, když jsem odcházel z hotelu, zatlačil jsem slzu v oku a věděl jsem, že miluji AI, mířící do nejbližšího metra. Zpátky k přednášce.

Asi nikoho nepřekvapí, že AI je veliké téma, někteří tvrdí, že se jedná o bublinu, ale je to odvětví, které prudce roste a společnosti jako AMD do něj značně investují. AMD se aktuálně snaží zlepšit svou celkovou softwarovou podporu na poli AI technologií.

AMD se samozřejmě nezapomnělo pochlubit, že NPU v CPU měli jako první a to sice u mobilních Zen4 produktů a chtějí v prvenství pokračovat. Mobilní procesory Strix Point tak mají aktuálně nejrychlejší NPU s výkonem 50 TOPS a je velmi pravděpodobné, že to nějakou dobu konkurence nepřekoná. Hlavní výhodou NPU v CPU má být energetická efektivita.

AMD XDNA 2 NPU má v rukávu několik vychytávek vylepšující výkon, je zde například možnost jednorázově načíst data a multicastem je posílat do dalších jednotek, na slajdu jsou označené jako AIE tiles. Propojení mezi těmito dlaždicemi lze přeprogramovat, asi tedy dědictví Xilinxu.

Další zajímavostí je pak podpora nového datového typu (nebo spíše instrukce) "Block Floating Point", což má spojovat výhody INT8 a FP16, ale nebudu se tvářit, že tomu detailně rozumím.

Samozřejmá je pak spolupráce s Microsoftem v rámci Copilot+, přičemž zde trochu nešťastně figuruje i technologie Recall.

Známým problémem je halucinace různých LLM, AMD si tak připravilo demo svého RAG systému, je to takový hadr na hlavu pro LLM, kdy je možné dané LLM "doučit" nějaké nové informace, abychom pak dostali kvalitnější informace a získali méně halucinací.

AMD ohlásilo i rozsáhlou podporu a spolupráci s různými modely, společnostmi a technologiemi, je to něco, co opravdu potřebují pro úspěch na trhu. Došlo i na ohlášení Ryzen AI software suite, který má zajistit lepší celkovou podporu AMD produktů a dostatek "omáčky" pro vývojáře.

První den pak zakončil Rahul Tikoo, který se po dvanácti letech v DELLu vrací do AMD a bude řešit klientská PC. Panel se skládal ze čtyř dříve přednášejících a za zmínku stojí hlavně Ultra Ethernet, což je prý nové konsorcium, které řeší nové standardy použitelné pro síťování AI systémů.

Další den se odehrávala hlavní část celé akce, přičemž zde byly hlavně menší přednášky pro menší skupiny novinářů v několika místnostech, mezi kterými jsme rotovali, samozřejmě čas byl omezený, lidí bylo hodně a zájem hovořit s lidmi z AMD byl relativně velký. Ohledně novinek v přetaktování jste si mohli přečíst dva články toto pondělí.

K dispozici byla i místnost, kde byly desktopy osazené novými Ryzeny 9000 a notebooky se Strix Point procesory. Byla zde kromě her i nějaká pracovní a AI dema.

Desktopy byly hotové sestavy od společnosti Cyberpower a iBUYPOWER, hned první sestava na fotografii níže měla humorný problém, paměti byly nastavené na 4800 MT/s, někdo zapomněl zapnout EXPO profil, což jsem vyřešil společně s jedním zaměstnancem AMD dříve, než na scénu dorazil Steve z Gamer's Nexus.

Na herních demo počítačích bylo možné vyzkoušet jak běží Space Marine 2, Counter-Strike 2 či Cyberpunk 2077. Asi nikoho nepřekvapí, že počítače s Ryzeny 9 9900X a Radeony RX 7900 XTX takové hry utáhnou bez potíží s prstem v nose.

Mimo desktopů zde bylo možné osahat dosud nevydané notebooky s novými Ryzeny AI 9 HX procesory, mnoho z nich mělo připravené různé programy využívající NPU. Osobně mě nejvíce zaujal ASUS TUF A14, jedná se o zajímavý notebook s vysokým výkonem v 14" provedení, kvalita zpracování vypadala velmi dobře, ale uvidím, pokud nějaký testovací kus dorazí. Poněkud humorné je, že právě TUF A14 v sobě měl dGPU NVIDIA GeForce RTX 4060.

Několik notebooků zde měla i společnost Acer včetně podivného 3D-holografického monitoru, který poněkud tahal za oči. Zároveň zde byly představeny i brýle, které mají integrované displeje a zrcadlí obrazovku notebooku do těchto brýlí. Nepovedlo se mi to rozumně vyfotit, je to něco, co se musí vyzkoušet na vlastní bulvy, ale jevilo se mi to jako překvapivě použitelné. Možná by se mi něco takového líbilo třeba při cestování v letadle, brýle se připojují přes USB-C, ale příliš detailů neznám.

V rámci AI věcí zde také vystupoval nový ASUS Zenbook S16, který se může pyšnit označením "nejtenčí 16" notebook na trhu, pouze 11 mm tloušťky včetně víka displeje". Na tomto notebooku bylo připravené generování obrázků skrze Stable Diffusion XL Turbo, což funguje velmi dobře skrze NPU v APU a nepotřebujeme tak velké dGPU.

Velký důraz byl tedy kladen na AI, což nemusí všichni ocenit. Ohledně AI přednášel Sebastian Nussbaum, AMD opět vnímá AI jako průmyslovou revoluci, padlo také přirovnání k vynálezu elektrické energie a přístrojů, které ji využívají. Za zmínku stojí to, že BlackMagic nabízí podporu NPU a AMD GPU ve svých produktech, například v DaVinci Resolve.

AMD Ryzen AI 300 mobilní procesory

Došlo i na lehce detailnější informace o mobilních procesorech generace Strix Point. AMD se samozřejmě pochlubilo vyšším výkonem oproti Intel Core Ultra 9 185H a Qualcomm Snapdragon X Elite X1E-84-100. To je samo o sobě uvěřitelné, byť nebyly známé detailní konfigurace testovaných notebooků, resp. neznáme napájecí limity jednotlivých procesorů.

Dále se AMD chlubí vysokým výkonem v tvorbě obsahu, opět se jedná o grafy bez nějakých konkrétních čísel, přičemž si povšimněte, že v Cinebench 2024 1T testu je Qualcomm Snapdragon X Elite X1E-84-100 o něco rychlejší. Tedy soudím tak dle grafu bez čísel.

Důležitý je i herní výkon, u Qualcommu je samozřejmě problém v tom, že některé hry není možné spustit a nejspíše nikdo nečekal, že by řešení Intelu mohlo být rychlejší, nicméně opět nemáme žádná reálná čísla, což je škoda. S reálnými FPS by se totiž pracovalo lépe, než s údaji typu 1.49X.

Desktop a Ryzeny 9000

Na jeviště vystoupil znovu Mark Papermaster a v rychlosti představil předpokládaný výkon desktopových Ryzenů řady 9000, to samo o sobě není extrémně zajímavé.

Zajímavý mi ale přišel následující slide, AMD se pochlubilo, že jejich nejprodávanější herní procesor je AMD Ryzen 7 5800X3D. A není se čemu divit, jedná se o výborné CPU pro AM4 platformu. Co jsem ale úplně nepochopil byl pokus o prodání myšlenky, že nový Ryzen 7 9700X, který má také osm jader je průměrně o 12% rychlejší a je tak vhodný pro upgrade.

Osobně si myslím, že uživatelé Ryzenu 7 5800X3D nemají důvod k upgradu vlastně žádný, typicky je bude brzdit hlavně grafická karta a procesor jistě pár let vydrží. Smysl může mít situace, kdy je potřeba více než osm jader, pak může dávat smysl přejít na AM5, ale nový Ryzen 7 9700X není nijak zásadně rychlejší oproti 5800X3D a v některých situacích je dokonce pomalejší, byť spotřeba je nižší.

Dále nám bylo sděleno, že desktopové Ryzeny 9000 mají dosahovat nižších teplot v zátěži, nejteplejší jádra mají být prý až o 7°C chladnější. Myšleno to bylo u procesorů se stejným TDP jako u Zen4, otázka je, jak s tím zamává PPT limit. Uvidíme tedy později při opravdových testech, zda jsou teploty opravdu nižší. AMD se dále pochlubilo nižší spotřebou, což je očekávané, jelikož všechny Ryzeny 9000 mají nižší hladinu napájecích limitů oproti Ryzenům 7000.

Nechyběla i zmínka ohledně přetaktování RAM za chodu a dlouhé životnosti AM4 platformy, což je něco, v čem chce AMD pokračovat s AM5.

S Ryzeny 9000 půjdou na trh i nové základní desky s "novými" čipsety. Novinkou je levný čipset B840, ten je prý určen primárně do různých OEM desktopů, nebo levnějších systémů, má technicky vzato nahrazovat řadu A čipsetů, přičemž výbava by měla být lehce lepší. Zásadní novinkou je přítomnost USB 4 s X870E a X870 čipsety, tam je to dokonce povinnost.

Nyní je čas na zbylé "mikropřednášky", ty probíhaly v menších místnostech a hovořilo se opět s lidmi z AMD, kteří pochází z konkrétních oddělení a nejednalo se o PR zástupce či něco takového.

Ryzen AI

Začali jsme opět s detaily ohledně AI, AMD vnímá čtyři základní pilíře potřebné pro skutečný zážitek AI na PC platformě. A to sice výkon, přesnost, využití paměti a spotřeba. Mluvilo se tak o postupných zlepšováních různých jazykových modelů, generátorů obrázků a tak podobně.

Softwarová podpora se má značně zlepšovat, je to něco, do čeho se AMD údajně značně opřelo, můžeme tak očekávat lepší nástroje pro vývojáře a snad i nějaké veselejší produkty, které poběží lokálně na NPU.

Zajímavá je zmínka o spekulativním dekódování, využívají se dva jazykové modely, malé LLM a velké LLM. Idea je, že malý model je velmi rychlý, běží na NPU a chystá predikce, které předhodí velkému modelu pro kvalitnější výsledky. Nicméně toto prý vyžaduje trénování dvou různých modelů, což téměř nikdo nedělá.

Měřit výkon s AI technologiemi je obtížné, aktuálně neexistují nějaké standardizované benchmarky a vše se akčně vyvíjí, uvidíme tedy časem co přežije a co ne.

Graphics a ISVs

Během této akce jsme se dozvěděli další informace o AI, tentokrát i v nějakém kontextu iGPU, přičemž nám bylo řečeno, že AMD prochází radikální transformací z čistě tranzistorové společnosti na HW+SW společnost. Cílem je kvalitnější podpora a software, což se doufáme podaří.

AMD Fluid Motion Frames, tato technologie umožňuje navýšení FPS, tedy něco jako Frame Generation, přičemž podpora je řešena skrze ovladače a vývojáři údajně nemusí prakticky nic dělat, ale je lepší, když něco dělají. Aktuálně je podporované pouze DirectX API (informace jaká verze se mi vykouřila z hlavy), na podpoře Vulkan a OpenGL se prý aktivně pracuje.

XDNA roundtable

Je čas na další detaily ohledně nového XDNA2 NPU a AI. Tato sekce se odkazovala na některé informace, které padly předchozí den, tedy Block Floating Point FP16, 50 TOPS, Flexible partitioning a tak podobně.

Tím konference prakticky skončila, samozřejmě proběhly i nějaké večeře, neformální "pokec" s dalšími novináři, zaměstnanci AMD a také bowling. Čechy však musím zklamat, pivo je v Los Angeles extrémně drahé, cena se pohybuje se v rozpětí 9 až 11 USD bez daně za třetinkovou lahev, což je skoro na vyhlášení osobního bankrotu.

Plánujeme projít materiály z konference ještě jednou a pokud narazíme na nějaké zajímavé informace, je možné, že napíšeme nějaké doplňující články. Osobně čekám hlavně na nové produkty.