Intel vydal záplatu na pátou příčinu nestability procesorů Raptor Lake
Příčiny problémů s procesory Raptor Lake a Raptor Lake-refresh lze rozdělit do dvou skupin. První, která se z desktopových modelů patrně týká pouze klasického Raptor Lake (Core 13000), je věcí oxidace, jíž měly trpět procesory této řady vyrobené do roku 2023 a kterou Intel dlouho bagatelizoval, až nakonec přiznal, že se oxidující procesory reálně dostaly do distribuce a nelze vyloučit, že jsou takové kusy ještě v prodeji.
Druhá skupina se týká obou řad (Raptor Lake a Raptor Lake-refresh, tzn. Core 13000 i 14000) a Intel ji označuje jako tzv. Vmin Shift. Příčinou má být kolísání napětí, které v kombinaci s vysokými teplotami vede k degradaci obvodu zodpovědného za taktování procesoru (clock tree circuit). Intel nově uvádí již čtyři příčiny:
- Napájení procesoru základní deskou překonává doporučení Intelu.
- eTVB [enhanced Thermal Velocity Boost] mikrokód chybně udržuje vyšší výkon i při překonání teplotního limitu.
- Algoritmus SVID vyžaduje vysoké napětí při takové taktovací frekvenci a po takovou dobu, která může způsobit Vmin Shift.
- Mikrokód a BIOS mohou vyžádat zvýšené napětí, které mohou způsobit Vmin Shift především v klidovém stavu (idle) nebo lehké zátěži.
V první řadě stojí za pozornost, že Intel opět na první místo staví vinu výrobců základních desek. Ti přitom již v minulosti uváděli, že je Intel ke zvyšování limitů spotřeby v podstatě vyzýval sám. Koresponduje to i se stavem, že zatímco u AMD výrobci základních desek drží doporučené limity, v případě Intelu měly prakticky všechny lépe vybavené desky v tovární konfiguraci limity zvýšené. Dále připomeňme, že i s BIOSy, které vrátily limity spotřeby do specifikací Intelu, procesory degradovaly a nezdálo se, že tato změna situaci nějak prospěla. Redakce HardwareTimes provozovala Core i9-13900KF s původním BIOSem zhruba rok, než se stabilita začala zhoršovat, nový kus již provozovala s „bezpečným“ profilem napájení, přesto odešel po 2 měsících a třetí kus provozovala s „bezpečným“ profilem napájení a první záplatou BIOSu a přesto odešel po týdnu.
Kontakt procesorů pro LGA1700 s chladičem (GamersNexus)
Za druhé, pokud Intel hovoří o vlivu zvýšených teplot, nelze vzpomenout na aféru Intel bentgate, kdy bylo prokázáno, že procesory pro socket LGA1700 se v důsledku tenké konstrukce a obdélníkového tvaru v socketu prohýbají. V místě jádra je špatný kontakt s chladičem a procesory proto dosahují teploty o zhruba 5 °C vyšší než při vyztužení, kdy k prohybu nedochází a kontakt je lepší. Intel tehdy tyto stížnosti zlehčoval a tvrdil, že se s prohnutím počítá a zvýšená teplota neznamená fungování mimo specifikace. Nyní se dozvídáme, že zvýšená teplota je jedním z důvodů degradace. Budeme-li věřit tvrzení, že vyšší teplota je jedním z faktorů vedoucích k degradaci, pak je potřeba říct, že i prohýbání má na situaci negativní vliv.
Pokud jde o body 2. až 4. uváděné Intelem, druhý bod řešil BIOS 0x125, třetí řešil BIOS 0x129 a čtvrtý je nově řešen BIOSem 0x12B, který Intel distribuuje výrobcům základních desek.
V oficiálním vyjádření není uvedeno, že by Vmin Shift v idle byl posledním problémem, ani že by BIOS 0x12B byl definitivním řešení Vmin Shift, zkrátka nic, co by naznačovalo, že je kauza degradace procesorů 13. a 14. generace definitivně uzavřena.
Již před několika generacemi bylo poměrně obtížné udržet přehled v tom, kolik typů boostu jaká řada podporuje, čím se liší, jaký má být jejich přínos oproti jiným a podobně. Zcela nemožné pak je zorientovat se v jejich hierarchii, tedy jak se za určitého hypotetického scénáře bude procesor chovat a který typ boostu vlastně rozhodne o konkrétní nastavené frekvenci pro daný okamžik. Připomeňme, že ve specifikacích (například) Core i9-13900KS fingurují hodnoty Max Turbo Frequency, Intel Turbo Boost Max Technology 3.0 Frequency, Intel Thermal Velocity Boost Frequency, Performance-core Max Turbo Frequency, Efficient-core Max Turbo Frequency, Performance-core Base Frequency a Efficient-core Base Frequency. - Některé modely mají boost závislý na teplotě, jiné ne a limituje jen maximální bezpečná teplota, pro každý model jsou nastavené různé hodnoty a v každé generaci se trochu liší, jak se konkrétní typ boostu chová. S ohledem na to, že Intelu trvalo prakticky rok a tři čtvrtě od vydání těchto procesorů, než objevil chyby boostu (tedy chyby související s řízením momentálních taktů a napětí), to vypadá, že se v tomto systému již neorientují ani samotní inženýři společnosti a překomplikovaná struktura daná evolučním růstem ve stylu lepení vosího hnízda už je matoucí i pro samotné pracovníky společnosti. Ve srovnání se situací u AMD, kde se po výrobě každé jádro otestuje, stanoví se mu maximální podporované frekvence a boost spočívá v tom, že se nastaví maximální možné frekvence s ohledem na aktuální teplotu a spotřebu, působí řešení Intelu (alespoň na papíře) jako značně překomplikované. |
K úryvku z našeho červencového článku nezbývá dodat, že záplatování netrvalo rok a tři čtvrtě od vydání procesorů, ale již dva roky, takže to skutečně vypadá, že teorie o překomplikované struktuře řízení taktů, se kterou mají problém i samotní inženýři společnosti, asi nestojí úplně mimo reálný rámec.