Čeká Nvidia GM200 jen omezená podpora double-precision?
Již potřetí prolétla internetem informace, že Nvidia GM200 nebude podporovat FP64 (double-precision) výpočty při vysokém výkonu, jako předešlé generace grafických čipů. Tentokrát to už jako hotovou věc uvedl německý web 3DCenter. Vzhledem k tomu, že hovoříme o dosud nevydaném produktu, není způsob, jak tuto informaci oficiální cestou ověřit - což mějme na paměti. Přesto ale leccos naznačuje, že by na těchto zvěstech mohlo něco být a že tedy 3DCenter ví, o čem mluví. Co by to znamenalo? Předně by šlo o první velké (>500mm²) GPU Nvidie bez rychlé podpory pro double-precision:
- GT200 (576 mm²): DP:SP = 1:8
- Fermi - GF100 (529 mm²): DP:SP = 1:2
- Kepler - GK110 (551 mm²): DP:SP = 1:3
- Maxwell - GM100 (~600 mm²): DP: SP = ?
Nižší čipy buďto nepodporovaly FP64 vůbec (generace GT200) nebo v omezeném poměru jako 1:12 (např. GF104), 1:24 (např. GK104) a 1:32 (např. GM204).
Nvidia GT200 (576 mm²), GF100 (529 mm²) a GK110 (551 mm²)
Pokud bychom pro srovnání doplnili specifikace top modelů AMD, pak generace VLIW5 (Cypress) nabízela poměr 1:5, generace VLIW4 (Cayman) 1:4, první generace GCN (Tahiti) rovněž 1:4 a druhá (Hawaii) 1:2. Nižší modely nepodporovaly FP64 vůbec (generace VLIW5 - s výjimkou GPU Juniper), případně v poměru 1:16 (všechna nižší GPU s architekturou GCN).
Přístup Nvidie a AMD se liší ve způsobu implementace podpory pro FP64 na úrovni jádra. AMD preferuje nativní podporu, kdy jsou FP64 výpočty realizované na základních výpočetních jednotkách a konkrétní výkon závisí především na menších úpravách, které se týkají především šířky datových cest. Nvidia oproti tomu používá pro FP64 výpočty samostatné jednotky, které jsou určené výhradně pro tento účel. Čistě hráčské čipy jich proto obsahují výrazně méně než čipy, které jsou určené i pro top modely výpočetních karet řady Tesla.
Z tohoto důvodu lze připustit, že v okamžiku, kdy má Nvidia z důvodu staršího procesu omezený rozpočet tranzistorů pro high-endové GPU, může FP64 jednotky vypustit, aby mělo jádro ještě akceptovatelné rozměry (některé zdroje uvádějí, že současný limit 28nm výrobních linek TSMC je omezený na maximálně 650 mm²).
Možnost, že top model řady Maxwell bude mít omezený FP64 výkon, je také v souladu s listopadovými událostmi, kdy Nvidia - k obecnému překvapení - vydala čip generace Kepler (GK210) podporující FP64:FP32 v poměru 1:3. Už to vyvolalo dohady a otázky, jaký smysl může mít vydání nového profi-čipu předchozí generace (Kepler), když se na svět klube generace nová (Maxwell). Možnost, že právě 28nm Maxwell nebude podporovat rychlé FP64 výpočty, byla jedním z potenciálních vysvětlení existence GK210.
Dosud jsme mluvili o profesionální, respektive výpočetní sféře. Měla by absence rychlých FP64 výpočtů vliv i na herní trh? Ano i ne. Ne proto, že pro stávající hry není této fíčury třeba (a ještě hodně dlouho nebude). Ano proto, že to bývalo uváděno jako hlavní deviza řady Titan. Před pár týdny se diskutovalo o Titanu postaveném právě na novém ~600mm² GPU GM200. Podle neoficiálních zpráv by měl být tento Titan naceněn dokonce výš než předchozí dvě generace - namísto $999 se hovořilo o $1349. Zda se tak skutečně stane, zůstává otázkou (pro tento okamžik nepodstatnou); teď jde jen o fakt, že (a proč) jsou Titany výrazně dražší než číselně značené modely.
O pár desítek MHz vyšší taktovací frekvence nebo vyšší kapacita paměti zpravidla není důvodem k nárůstu ceny o více než 50 %. Nejčastější vysvětlení vysoké ceny spočívalo v podpoře pro rychlé FP64 výpočty podobně jako na kartách řady Tesla (sama Nvidia ale Titany řadí mezi herní grafiky). Pokud ale Titan z generace Maxwell nebude podporovat rychlé FP64 a zároveň bude dražší než jeho předchůdci, pak tento argument padne. Pokud se tak skutečně stane, bude zajímavé, jak se s tím marketing Nvidie dokáže vypořádat.