AMD uvádí Fusion APU „Llano“ A-Series pro desktopy
Kapitoly článků
AMD již před dvěma týdny uvedla A-Series procesory pro notebooky, takže nelze říci, že by dnes uváděla první 32nm procesem vyráběné procesory. Ani před těmi dvěma týdny nešlo říci, že by uvedla první procesory s integrovanou grafikou, těmi byly v lednu procesory „Ontario“ a „Zacate“ alias E-Series a C-Series. Ty jsou však vyráběny jinou technologií v jiné továrně, konkrétně 40nm bulk v TSMC. Procesory „Llano“ jsou vyráběny 32nm SOI procesem v továrnách GlobalFoundries (bývalé výrobní továrny AMD).
Sice už to všechno víte, ale neuškodí si to zopakovat: procesory AMD A-Series APU obsahují čtyři CPU jádra a integrovanou grafiku s až 400 stream procesory, konkrétně A8-Series mají 400 SP, A6-Series o něco méně, jen 320 (a pomalejší takt grafiky). Vedle toho obsahují také DDR3 paměťový řadič, PCI Express řadič a rozhraní pro komunikaci s okolím, plus samozřejmě rozhraní pro výstup z integrované grafiky.
AMD „Llano“ die - popis jednotlivých částí
AMD „Llano“ potřebuje komunikovat s čipsetem, který je už vlastně jen jižním můstkem, od dob APU nazývaný FCH (Fusion Controller Hub). Reálně jde o novější variaci na SBxxx, vzhledově se moc neliší, nicméně po stránce technologické obsahuje navíc USB 3.0 řadič poskytující čtyři USB 3.0 porty (kromě dalších USB 2.0 a USB 1.1, dohromady je USB portů vždy 14, samozřejmě výrobci desek se mohou rozhodnout, že nepoužijí všechny).
Co se grafických výstupů týče, je to vyřešeno tak, že procesor přímo poskytuje dva digitální výstupy (mohou to být HDMI, DVI či DisplayPort), analogový VGA výstup obhospodařovává čipset. Procesor nabízí celkem 24 PCI Express linek druhé generace, čipset další čtyři (pro srovnání platforma postavená na Intel „Sandy Bridge“ nabízí 16 linek v procesoru a 8 v čipsetu). Komunikace mezi procesorem a čipsetem probíhá přes transparentní PCIe ×4 Gen2 spoj na protokolu UMI (Unified Media Interface - obsahuje i DisplayPort protokol pro jižní můstek, který jej používá pro analogový VGA výstup).
CPU jádra nejsou v podstatě ničím jiným než K10 jádry známými z Athlonů II a Phenomů II. Chybí zde zcela L3 cache, takže CPU část by se dala klidně nazvat Athlonem II X4, jen s tím rozdílem, že jsou použita jádra Athlonu II X2, která mají celý 1 MB L2 cache. Příští generace APU by měla zaměstnat jádra „Bulldozer“, naopak první APU (E-Series, C-Series a další) mají energeticky nenáročná (a také patřičně pomalá) jádra „Bobcat“. Jádra „Stars“ (tedy v podstatě K10) použitá v APU „Llano“ navíc podporují AMD Turbo Core (mají to ale jen některé modely).
Grafické jádro APU Llano vychází z architektury Evergreen a z velké části kopíruje čip Redwood, který je známý spíš jako Radeon HD 5670. Nezměnil se počet funkčních jednotek (400 stream procesorů, 20 TMUs a 8 ROPs), ale právě ROPs už nejsou připojené na vlastní paměťový řadič, ale sdílejí ho s procesorem. Aktualizace se proti původnímu Redwoodu dočkal UVD procesor; ve verzi 3.0 podporuje navíc plnou akceleraci formátů MPEG2, MPEG4 (DivX, Xvid) a MVC (Blu-ray 3D). Ke snížení spotřeby přispěl power gating a 32nm SOI proces GlobalFoundries.
Samotná ALU tudíž není ničím novým, VLIW-5 architektura se z hlediska požadavků 3D akcelerace osvědčila jako velice efektivní, v podstatě žádné firemní ani konkurenční řešení ji zatím nedokázalo v tomto ohledu překonat. Jistou nevýhodou je nižší efektivita v některých výpočetních úlohách, například při širokém použití I2F či F2I instrukcí, které umí provádět jen pátý (tlustý) stream procesor, na který pak čtyři hubené musejí čekat. Z hlediska běžného použití ale nejde o nijak typickou situaci a vzhledem k tomu, že Llano do HPC sféry nemíří, to ani teoreticky nepředstavuje problém.
Podpora pamětí je u AMD „Llano“ poměrně důležitá. Procesor oficiálně podporuje až DDR3-1866, ovšem málokde se dočtete, že tuto rychlost podporuje pouze v situaci, kdy dáte na každý paměťový kanál jen jeden modul (dohromady tedy max. dva). Pokud dáte dva moduly na kanál (tedy celkem čtyři), snižuje se rychlost na max. DDR3-1600. Podpora takto rychlých pamětí je klíčová především pro integrovanou grafiku, která nemá lokálně žádnou větší cache (naproti tomu grafika v procesorech „Sandy Bridge“ používá poměrně velkou L3 cache celého procesoru, takže se tam rychlejší paměti téměř neprojevují). Z obrázku výše také pochopíte, že datová propustnost až 29,8 GB/s je věnována především grafice (ta je v podstatě upřednostňována před CPU jádry).
Pravděpodobně vám neuniklo, že Fusion APU „Llano“ je stále srovnáváno se „Sandy Bridge“. Dělá to ve svých materiálech i AMD, jedno z prvních srovnání říká, že zatímco Intel kladl velký důraz na výkon x86 jader, u AMD se to snažili vyvážit, takže mají zcela pochopitelně výkonnější grafiku a méně výkonná CPU jádra.
Podobně zajímavé je i srovnání Core i3 a AMD A6-Series APU (to srovnání je záměrně posazeno takto, protože ty procesory mají srovnatelnou cenu). Trochu bychom chtěli AMD poopravit: procesory „Sandy Bridge“ umí DirectCompute, akorát výkonnostně nemůže Intel HD Graphics Radeonu HD konkurovat. Intel jednoduše kraluje ve výkonu x86, AMD naopak ve výkonu GPU. Je na zákazníkovi, co si vybere.
Integrovaná grafika v procesorech AMD A-Series je kombinovatelná s grafikami diskrétními podle uvedené tabulky, z níž také vychází výsledné značení daného řešení. AMD v dalších materiálech stručně hovoří o tom, že ke grafice v AMD A-Series APU lze párovat takovou grafiku, jejíž výkon je zhruba v rozmezí 0,5 až 3násobku té integrované v APU. Optimální řešení je použít grafiku s výkonem v rozmezí 1 až 2násobku grafiky v APU.
Aplikace, které nebudou podporovat kombinaci dvou grafik, dostanou k dispozici jen jednu, a to tu rychlejší, s výjimkou aplikací pracujících s OpenGL, které dostanou vždy tu, která hraje roli grafiky primární. AMD při kombinaci výkonu doporučuje nechat integrovanou grafiku jako primární a připojit k ní všechny monitory. Pointa je v tom, že momentálně implementace Dual Graphics neumožňuje použití druhé grafiky pro výstup obrazu, vše musí být na primární grafice. Uživatel, který chce použít více výstupů (kombinovat integrovanou a diskrétní grafiku), nemůže kombinovat výkon obou grafik současně (může je použít nanejvýš pro „2D“ zobrazení). V AMD prý pracují na nových ovladačích, které tento nedostatek vyřeší, bude to ovšem chtít také aktualizovat BIOS. A ještě jednu věc je dobré vědět: pokud obsadíte na procesoru pouze jeden paměťový kanál, nemusí se Dual Graphics režim vůbec nechat spustit.
Prezentace od AMD, AnandTech