Diit.cz - Novinky a informace o hardware, software a internetu

AMD vysvětlila změny monitoringu teploty u Navi

Radeony RX 5700 přinesly odlišný systém sledování teplot, na jehož základě jsou nastavované taktovací frekvence. Umožňuje přesněji monitorovat chování čipu, ale výstupy pro uživatele jsou odlišné…

Nějaký systém sledování teploty je v grafických jádrech integrován již léta. Zatímco původně bylo jediným účelem jediného snímače vypnout GPU, kdyby bylo dosaženo nebezpečené teploty, postupem času se systém vyvíjel a začal sloužit i jiným účelům. Během let se okamžitá teplota stala jedním z prvků, které rozhodují o okamžitých taktech grafického jádra, tedy o výkonu. Při jednom snímači (nebo několika snímačích) v rámci GPU ale není podchycena nejvyšší teplota, protože ta může být v závislosti na typu zátěže dosažena v odlišných částech čipu.

Systém řízení výkonu a spotřeby s tím musel spočítat, takže jako nejvyšší bezpečná teplota bývala nastavena výrazně nižší hodnota, než jaká byla pro čip skutečně bezpečná. Muselo se počítat s tím, že pokud je jako mez nastavena např. 95 °C, může být v některých částech čipu, kde není umístěn teplotní snímač, být reálná teplota bodově výrazně vyšší. Mez (např. zmíněných 95 °C) tedy byla nastavena výrazně níž, než jaké reálné teploty mohly některé části jádra dosahovat. Pracovalo se tedy s poměrně velkou rezervou.

S GPU Vega 20 začala AMD tuto situaci řešit a do GPU implementovala síť 64 teplotních snímačů. Architektura Navi šla ještě dál a na síti závisí i nový systém řízení spotřeby Radeonů RX 5700 (XT). Protože je monitorována teplota prakticky každého obvodu GPU, nemůže nastat situaci, že reálná teplota některé části GPU bude výrazně vyšší než teplota v části, kde je snímač. Snímače jsou zkrátka všude, takže AMD mohla eliminovat výraznou rezervu, se kterou byly okamžité takty jádra nastavovány níže než by čip reálně zvládl, protože se muselo předpokládat, že teplota některých částí jádra může být výrazně vyšší než je skutečně naměřeno. Navi, která je pokrytá sítí snímačů, má nově jako limitní teplotu nastavenou hodnotu 110 °C.

K omezení ze strany limitní teploty tedy dojde, pokud je na libovolném jednom z mnoha desítek snímačů dosaženo teploty ~110 °C. Nadále je však sledována i reportována tzv. průměrná teplota jádra, která je bližší hodnotám sledovaným u starších generací. Mezi průměrnou teplotou a limitní teplotou tedy může být velmi výrazný rozdíl, který odpovídá právě výše popsané rezervě, se kterou se pracovalo u starších GPU.

Tento rozdíl teplot je součástí běžného chování a monitoringu GPU v zátěži. Dosažení limitní teploty 110 °C pak neznamená, že GPU běží při teplotě 110 °C, ale že v jednom z mnoha desítek bodů jádra bylo této hodnoty dosaženo (na což pak jádro automaticky reaguje minimálním možným snížením taktů, které stačí pro snížení teploty pod tuto mez).

Zdroje: 

Diskuse ke článku AMD vysvětlila změny monitoringu teploty u Navi

Sobota, 17 Srpen 2019 - 13:18 | DRK | 1. Nauč se číst... 2. Mimochodem jak jsi přišel...
Sobota, 17 Srpen 2019 - 10:05 | IT Joker | „Místo kde bude vždy nejhorší (v naprosté většině...
Pátek, 16 Srpen 2019 - 21:02 | Tom | tak axiální mají snad jen ty nejzákladnější...
Pátek, 16 Srpen 2019 - 20:54 | JirkaK | Nevidím v tom problém. Když to dosáhne maxima,...
Pátek, 16 Srpen 2019 - 20:49 | JirkaK | Pokud deska má vstup teplotního čidla a umí dle...
Pátek, 16 Srpen 2019 - 20:16 | Gembler | Jj, multigpu jsem pocital pod prvni duvod. U...
Pátek, 16 Srpen 2019 - 19:32 | Gembler | Neni potreba zadny slozity zarizeni. Pujdu cestou...
Pátek, 16 Srpen 2019 - 14:56 | spidsta | "Porad ale plati, ze blower je nejhorsi typ...
Pátek, 16 Srpen 2019 - 12:56 | DRK | "ale většinou to tak bude" Ne nebude...
Pátek, 16 Srpen 2019 - 12:35 | IT Joker | „Pokud je v GPU jeden snímač, pak jím reportovaná...

Zobrazit diskusi