Diit.cz - Novinky a informace o hardware, software a internetu

Dual Warp Scheduler

Nvidia Fermi logo (jako)
Kalifornská Nvidia právě v tuto chvíli oficiálně uvolňuje informace o chystané nové (nejen DirectX 11) generaci GPU, o které jsme doposud psali jako o GT300. Její krycí jméno je Fermi a rovnou si řekněme: jde o malou revoluci ve stylu, s jakým přišlo GPU G80 na GeForce 8800. Pojďme se tedy společně podívat, co Nvidia právě ve svých laboratořích a ve spolupráci s TSMC usilovně finišuje, co hodlá postavit proti Radeonům a FireGL/FireStream kartám generace HD 5800 a čím hodlá zatopit pod kotlem nejen AMD, ale i Intelu. Architektura nové generace Nvidia čeká na své představení…

Nvidia představila Fermi: Dual Warp Scheduler

SM ve Fermi obsahuje dva warp plánovače a dvě instruknčí dispatch jednotky, což umožňuje zpracovávat dva warpy najednou. Duální plánovač vybere dva warpy, vezme jednu instrukci z každého warpu a přiřadí je skupině šestnácti jader, šestnácti load/store jednotkám nebo čtyřem SFU (speciální funkční jednotky). Protože jsou warpu vykonávány okamžitě, plánovač ve Fermi nepotřebuje provádět kontrolu závislostí uvnitř toku instrukcí. Tento duální model tak umožňuje dosahovat na Fermi téměř maximální výkon dostupný na daném hardwaru.

A nyní ta dobrá zpráva: většina instrukcí může být řešena touto duální cestou: dvě integer instrukce, nebo dvě floating instrukce, nebo mix integer a floating, načítání, uchovávání a SFU instrukce, vše může být zpracováváno současně.

64kB konfigurovatelná sdílená paměť a L1 cache

Další architektonická inovace se týká malé ale rychlé části paměti sídlící velmi blízko samotným výpočetním jednotkám. Sdílená paměť umožňuje threadům v daném bloku sdílet vzájemně data, čímž šetří nutné datové přenosy jinak realizované "vzdálenějšími" částmi GPU a snižují tak provoz na jednotlivých vnitřních sběrnicích. Sdílená paměť je dle Nvidie klíčem k navýšení výkonu mnoha high-performance CUDA aplikací.

G80 (GeForce 8800) a GT200 (GeForce GTX) měly 16kB sdílenou paměť na každý SM, Fermi jí má rovnou 64 kB a ta může být nakonfigurována jako 48kB sdílená paměť plus 16kB L1 cache, nebo naopak 16kB sdílená plus 48kB L1 cache. Pro existující aplikace výrazně sdílenou paměť využívající tak Fermi dosahuje trojnásobného nárůstu využití této paměti, což zvyšuje rychlost běhu těchto aplikací.

Pro existující aplikace pak lze upravit jejich kód správy sdílené paměti tak, aby efektivně využíval cache a přitom měl stále k dispozici očekávaných oněch nejméně 16kB sdílené paměti. A nakonec aplikace, jejichž autoři do kódu nezakomponovali využití sdílené paměti, budou automaticky těžit z L1 cache.

Nvidia představila Fermi: srovnání G80, GT200, Fermi

Takto pak vypadá celkové srovnání parametrů Fermi se staršími generacemi.

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Nvidia představila novou architekturu Fermi

Neděle, 4 Říjen 2009 - 09:01 | mukade | ja som zvedavy na larrabee, ci zamuti stojate...
Pátek, 2 Říjen 2009 - 12:00 | Anonym | Charlie Demerjan pátrá, radí, informuje: http://...
Pátek, 2 Říjen 2009 - 08:38 | Anonym | ba te prezentaci byla ukazovana jenom maketa...
Pátek, 2 Říjen 2009 - 08:26 | Anonym | až to uvidím tak to posoudím, ale marketing maj...
Pátek, 2 Říjen 2009 - 08:25 | Mad MaxII | >>David: Omluva, vy jste to nikde...
Pátek, 2 Říjen 2009 - 07:43 | Mad MaxII | >>David: Pane redaktore, s tim ze...
Čtvrtek, 1 Říjen 2009 - 22:23 | Anonym | Neklesly akcie nVidie protože pořád hlásala, že...
Čtvrtek, 1 Říjen 2009 - 21:27 | qee | Bezva článek, díky. Jinak bych si tipnul, že...
Čtvrtek, 1 Říjen 2009 - 20:12 | Anonym | Fermi ma vela veci ktore sa budu dat pouzit v...
Čtvrtek, 1 Říjen 2009 - 19:51 | Anonym | Osobně si myslím, že hardwarově nebude mezi...

Zobrazit diskusi