Mohou příští generace Zenu podporovat 3 nebo 4 vlákna na jádro?
Objevily se zvěsti o tom, že by Zen 3 mohl podporovat 4 vlákna na jádro. Pak i verze, že by to mohl být až Zen 4, případně že by nešlo o čtyři vlákna na jádro ale tři vlákna na jádro. Mohlo by to vůbec teoreticky něco přinést? Abychom mohli odpovědět, podívejme se v první řadě na to, co přinesl dosavadní vývoj a jaká další vylepšení připadají v úvahu.
AMD již s generace Zen překvapila modularitou, kterou srazila výrobní náklady vícejádrových procesorů až o 40 %, díky čemuž dokázala nabídnout high-endové a serverové modely za poloviční ceny, než bylo pro daný počet jader obvyklé. Přestože to vypadalo jako nová, překvapivá a funkční strategie, na které se společnost mohla ještě pár generací vézt (původně to tak opravdu mělo být a Zen 2 měl přinést především přechod na 7nm proces a téměř nic víc), došlo ke změně. AMD se rozhodla pro ještě agresivnější změnu strategie a z modulárního konceptu přešla na čipletový. Toto rozhodnutí bylo více než prozíravé, protože změna situace v GlobalFoundries a vysoké ceny 7nm procesu TSMC v podstatě nemohly být řešeny efektivněji a elegantněji, než omezením 7nm výroby pouze pro tu část čipu, u které to má nejpodstatnější efekt, tedy na samotná procesorová jádra a jejich cache.
Když už muselo dojít ke hlubšímu zásahu do čipu, sáhla AMD k úpravám vedoucím ke zvýšení IPC a podpory rychlejších pamětí. Zen 2 nakonec přináší mnohem více novinek, než původně měl a nabízí se otázka - co vlastně může přinést Zen 3?
Bylo by přehnaně optimistické očekávat další revoluci. Na druhé straně by bylo pesimistické neočekávat nic víc než přesun Zen 2 na EUV variantu 7nm procesu. Prostá logika říká, že když AMD do Zen 2 implementovala prvky, které původně podporované být neměly, plánovala tedy jejich implementaci u Zen 3. Některé z novinek Zen 3 se tedy dostaly již do Zen 2 - patřit k nim bude právě zmíněné navýšení IPC, AVX256 a hlavně koncept čipletů. Zen 3 by tedy měl přinést méně novinek, protože část z nich byla implementována již v Zen 2, ale jistě zůstaly prvky, které v rozhodující době nebyly dotažené do stavu použitelného u Zen 2, které teprve přijdou.
Určitě se opět dočkáme lepšího poměru spotřeba / výkon a vyšších maximálních taktů v souvislosti s nasazením EUV procesu 7nm+ (i když půjde spíše o drobnější rozdíly srovnatelné s přechodem ze 14nm procesu na 12nm), pravděpodobně dojde na nějaké vylepšení IPC, byť asi procentuální nárůst bude nižší než u Zen 2. Co tentokrát nelze očekávat, je zvýšení počtu jader. Se Zen 2 dostane desktop 16, Threadripper pro pracovní stanice a high-end 64 a serverový Epyc rovněž. Mělo by smysl nabízet se Zen 3 pro standardní desktop 32 jader? Asi těžko, navíc by se výrazně větší čiplety (nebo výrazně více čipletů) nemuselo na pouzdro určené pro socket AM4 vejít.
Jak by tedy mohla AMD vylepšit výkon? Se Zen 2 přichází podpora AVX256 a související posílení FPU. AMD zdvojnásobila datovou propustnost pro load / store a FP, zvýšila výkon pro instrukce využívající 256bit registry a zkrátila latence MUL jednotky. Přestože tyto změny ve své podstatě znamenají zdvojnásobení FP výkonu, může ho v praxi být dosaženo jen při použití AVX256. Ve standardní zátěži půjde o avizované ~15 % zvýšení IPC při FP výpočtech. Je tedy otázkou, zda by po takovém rozšíření FPU jednotky nestála za to její úprava umožňující, aby zvládala pracovat (i) se dvěma 128bit vlákny. Pak by totiž bylo možné využít její potenciál i v úlohách nevyužívajících AVX256 - stačila by podpora více vláken.
V podpoře více vláken na jádro by se tedy určitý smysl najít dal. Na jedné straně by se dalo říct, že by taková úprava byla značně neortodoxní. Na straně druhé AMD v posledních letech (a zvlášť se Zen 2) předvedla, že neortodoxní rozhodnutí jí problém nečiní. Navíc - pokud není možné zvýšit počet jader, je zvýšení počtu vláken zajímavou cestou, jak efektivněji využít posílenou FPU.
V kontextu podpory AVX256 na Zen 2 stojí za pozornost ještě jedna informace. Nové Ryzeny nemají přednastavenou žádnou nižší frekvenci, na kterou by se přepnuly, pokud dojde na AVX256. S AVX256 i bez jsou pro výpočet boostové frekvence využívány tytéž algoritmy a tytéž vstupy, takže s dostatečně výkonným chlazením a napájením nemusí frekvence s AVX256 na Ryzenech 3000 klesat.