APU Carrizo přináší 4-15 % IPC, hardwarové 4k video a delta-kompresi
APU Carrizo asi není třeba sáhodlouze představovat, jde o kombinaci nových procesorových jader Excavator (nástupce Steamrolleru, který známe z APU Kaveri) a grafických jader GCN třetí generace, která známe z GPU Tonga (Radeon R9 285). AMD pro implementaci tohoto APU použila řadu nových technologií pro snížení spotřeby a zvýšení poměru výkon na watt.
Mikrosnímek jádra APU Carrizo: vpravo červeně grafické jádro (GCN), vlevo nahoře rozhraní pro paměti, pod ním procesorová jádra Excavator, pod nimi integrovaný čipset a při spodním okraji ostatní vstupy a výstupy
Počínaje samotnou architekturou grafických a procesorových jader přes nové knihovny pro návrh procesorových jader, které umožňují na stejnou plochu vměstnat více tranzistorů a snížit jejich energetické nároky až po rozšíření power-gating a clock-gating. Cílem bylo vytvořit návrh, který i přes 28nm výrobní proces umožní snížit spotřebu srovnatelně s přechodem na nový výrobní proces a umožnit výrobu výrazně rychlejších 15W APU a to i přesto, že se tentokrát do 15W limitu bude počítat i čipset, který je nově integrovaný v APU.
Procesorová jádra - Excavator
Procesorovým jádrům Excavator jsme se věnovali v našem únorovém rozboru, takže jen shrneme to nejpodstatnější. Jejich architektura sama o sobě přináší nárůst IPC o 4-15 % (oproti Steamrolleru). To je důsledkem mj. následujících změn:
- zvětšení L1 cache (datové)
- nižší latence cache
- vylepšení prefetch
- o 50 % větší branch prediction buffer (lepší odhad větvení)
- akcelerované plnění FPU
- nové instrukce: AVX2, MOVBE, SMEP, BMI 1/2
Další porce výkonu se týká především modelů s nízkým TDP, kdy energetické optimalizace umožňují dosahovat až o ~40 % vyšších taktů (ve srovnání s APU Kaveri o stejném TDP limitu).
Výdrž na 50Wh baterii s totožnými pamětmi a diskem v idle:
Carrizo FX-8800P: 813 minut / 3,69 W
Kaveri FX-7600P: 348,8 minut / 8,6 W
Core i5-5200U: 626 minut / 4,8 W
V mezních situacích tak procesorová jádra Excavator dokážou při stejném TDP nabídnout i o >50 % vyšší výkon. To se týká především 15W a jiných úsporných modelů. U klasických 35W APU pro větší notebooky jde nárůst procesorového výkonu nahoru v rozmezí 10-20 %. Naopak díky novým úsporným režimům klesá spotřeba v klidu o téměř 5 wattů, což umožňuje prodloužit běh na baterii při minimálním vytížení na více než dvojnásobek.
4K, video a multimedia
V době nástupu 4k videa je podstatnou součástí multimediální výbava. Začněme rovnou u podpory 4k videa, respektive u standardu HEVC. Jeho hardwarová podpora je v mobilním segmentu o to podstatnější, že softwarové nebo jen částečně akcelerované přehrávání vytěžuje procesorová a (nebo) grafická jádra a tím řádově snižuje výdrž notebooku při běhu na baterii. AMD proto rozšířila UVD video-dekodér pro podporu až 4× vyšších datových toků. Tato změna s sebou nese hned tři výhody. Jednak UVD zvládá zpracovat HEVC ve 4k při 60 FPS a tím realizovat energeticky nenáročné přehrávání tohoto formátu, dále vyšší výkon zrychluje převod mezi formáty videa a nakonec snižuje energetické nároky při přehrávání Full-HD videa.
To si asi zaslouží trochu rozvést. Nové UVD 6 zvládá dekomprimovat stream v 1080p 4× rychleji než předchozí generace. AMD toho využila ke snížení energetických nároků, a to takovým způsobem, že po dekompresi každého snímku ze streamu je UVD obvod i příslušná paměť, ke které přistupuje, převedena do úsporného režimu (nejnižší power-state). Díky tomu je spotřeba systému při přehrávání 1080p h.264 videa méně než poloviční oproti Kaveri, což znamená víc než 2× delší výdrž na baterii. Reálně lze podle AMD dosahovat 8,3-9,5 hodiny výdrže na jedno nabití při přehrávání 1080p h.264. Při přehrávání 1080p h.265 (HEVC) je výdrž kolem 5 hodin.
Pro kompresi videa slouží obvod VCE, který povýšil do verze 3.1. Navíc je nyní dvoujádrový, takže zvládá vyšší datové toky a tím i rychlejší převod mezi formáty. Nechybí obvod TrueAudio, audioprocesor určený především pro akceleraci herních zvukových efektů. Čip podporuje Eyefinity, disponuje trojicí nezávislých obrazových výstupů.
Grafické jádro - GCN 3. generace
Grafické jádro je stejně jako u Kaveri vybaveno (až) 512 stream-procesory; vyššího výkonu je tentokrát dosahováno několika optimalizacemi. Ty lze opět rozdělit do dvou skupin. První vychází z vyšší energetické efektivity. Ta umožňuje v rámci konkrétního TDP dosahovat vyšší taktovacích frekvencí a tím zvyšovat hrubý výkon - u 15W modelu lze tímto postupem dosáhnout o 18 % vyššího výkonu. U 15W modelu je pokles v reálné spotřebě tak významný, že AMD umožňuje 15W modely stavět na APU s plně aktivní grafikou (512 SP), zatímco modely postavené na Kaveri musely mít dva grafické bloky (CU) vypnuté (zbývalo 384 SP). To zvyšuje výkon o dalších >20 %.
Druhý zdroj výkonu přinášejí architektonické změny, například efektivnější zpracování geometrie (teselace) a delta-komprese frame-bufferu. Ty přinášejí dalších 10-15 % výkonu (AMD toto srovnávala oproti předešlé generaci ve 3D Marku; ve hrách mohou být výsledky odlišné podle toho, jaké má konkrétní titul nároky na geometrii a na datové přenosy). Se všemi popsanými změnami dosahuje grafické jádro 15W modelu o 65 % vyššího výkonu než u Kaveri (opět měřeno ve 3D Marku). V případě 35W modelu, kde jsou rezervy pro energetické optimalizace nižší, dochází ve 3D Marku k výkonnostnímu posunu v rozmezí 15-20 %.
I v herní zátěži, kdy jsou využita procesorová i grafická jádra zároveň, dochází k výraznému snížení spotřeby - i přes totožné 35W TDP a vyšší výkon dosahuje top model Carrizo FX-8800P o 60 % delší výdrž na baterii než Kaveri FX-7600P.
Ostatní novinky a závěr
Krom popsaného je Carrizo oproti Kaveri vybavené širší podporou HSA akcelerace (HSA 1.0) a jako první z „velkých“ APU nabízí i bezpečností procesor AMD TrustZone, kterému jsme se věnovali v souvislosti s menšími APU (Beema, Carrizo-L). Nechybí samozřejmě podpora pro Windows 10 a podpora moderních API jako DirectX 12 a Mantle, počítá se samozřejmě i s chystaným API Vulkan.
AMD