Diit.cz - Novinky a informace o hardware, software a internetu

GeForce GTX 1660 Ti: nízká spotřeba, očekávaný výkon, bez TC, ale s něčím novým

GeForce GTX 1660 Ti je venku. Výkonem nepřekvapila, podle očekávání se blíží GeForce GTX 1070, oproti níž snížila spotřebu. Přesto přinesla i jedno překvapení…

GeForce GTX 1660 Ti lze považovat za první skutečný mainstream generace Turing. Při ceně začínající na $279 sice stále nejde o tradičních $199-$249, které až na výjimky většina modelů z šedesátkové řady stála, ale naplní již význam slova mainstream - hlavní proud, segment, ve které se prodá nejvyšší objem produktů.

GeForce GTX 1660 Ti je prvním modelem z řady Turing, kterému v názvu schází RTX. To indikuje absenci hardwarových jednotek pro raytracing (RT-cores) a - jak se potvrdilo - nejsou podporována ani tensor-cores. U těch se ale na chvíli zastavíme, neboť je situace zajímavější, než se zprvu zdálo. Dokonce vyplynuly na povrch i informace, které v době vydání Turingu nebyly známé. Totiž, zatímco výpočetní Pascal (GP100) nebo Volta podporuje FP16 operace 2× rychleji než FP32 operace tím způsobem, že jejich FP32 jednotky jsou flexibilní a dokážou zpracovat buď jednu FP32 operaci v taktu nebo dvě FP16 operace v taktu, u dosavadních Turingů tomu bylo jinak. FP16 operace nezpracovávala FP32 jádra, jako tomu bylo třeba u Volty, ale byly přesunuty na (oproti Voltě) pokročilejší tensor cores.

To tedy znamená, že dosavadní jádra z řady Turing mají tensor cores rozšířená tak, že jsou přinejmenším z hlediska FP16 univerzálně použitelná pro herní účely a Nvidia je takto využívá. Jaké mohou být k této změně důvody: Pokud jsou tensor cores již téměř standardní výbavou, pak zkrátka může mít smysl ušetřit tranzistory vynaložené na dosažení kompatibility s FP16 u FP32 jednotek (datové cesty, registry) a ponechání těchto operací na tensor cores. Je tu ale ještě jedna zásadnější výhoda - respektive výhoda pro čip, který již tensor cores má: FP32 a FP16 operace mohou být prováděny paralelně. Zatímco kupříkladu Volta může na konkrétní výpočetní jednotce buďto FP32 operace nebo FP16 operace, Turing může FP32 a FP16 provádět zároveň obojí paralelně. Zkrátka a dobře, zatímco takový Titan V může buďto dosáhnout 13,8 TFLOPS FP32, nebo 27,6 TFLOPS FP16, Titan RTX může dosáhnout 16,3 TFLOPS v FP32 a k tomu 32,6 TFLOPS v FP16.

V praxi zatím využívá FP16 jen pár her a výkonnostní bonusy nejsou velké, ale pokud by se našla aplikace, která mohutně využívá FP32 s FP16 zároveň, mohla by na Turingu dosahovat zajímavého výkonu. To nás ovšem vede k myšlence, že bychom např. o zmíněném Titanu RTX neměli hovořit jakožto o GPU s 4608 stream-procesory, ale spíš jako o GPU se 4608 FP32 stream-procesory a 9216 FP16 stream-procesory. V praxi je to ještě o něco komplikovanější, nicméně to alespoň o něco lépe odráží realitu: tedy že čip má a pro shading využívá více než jen uváděných 4608 jednotek.

Schéma SM bloku Turing TU116: Tensor Cores byly nahrazeny FP16 jednotkami

Nyní se vraťme k GeForce GTX 1660 Ti. Jak to je s FP16 u ní, když žádné tensor cores nemá? Podle schématu od Nvidie byla prostě tensor cores nahrazena samostatnými FP16 jednotkami, který je 2× více než FP32 jednotek. Netroufnu si říct, zda skutečně fyzicky na úrovni jádra byla tensor cores odstraněna a nahrazena FP16 jednotkami, nebo zda jsou fyzicky stále přítomná a jejich použití je pouze omezeno na FP16 výpočty. Je však možné, že když Nvidia z návrhu odstranila RT-cores, došlo i na tensor cores. Každopádně je taková změna zajímavá, v podstatě nečekaná.

 GeForce
GTX 1060
GeForce
GTX 1650
GeForce
GTX 1660
GeForce
GTX 1660 Ti
GeForce
RTX 2060
GPU

GP106
4,4 mld. tr.

TU117?TU116

TU106
10,6 mld. tr.

Plocha200 mm²<200 mm²284 mm²445 mm²
Proces16 nm TSMC~12 nm12 nm TSMC
Zákl. takt1506 MHz~1500 MHz1530 MHz?1500 MHz
1365 MHz
Boost1708 MHz~1700 MHz1785 MHz?1770 MHz
1680 MHz
SPs1280896128015361920
Tensor-??-240
RT Cores----30
TMUs80568096120
ROPs4832484848
tens. Int4----?
tens. FP16----?
FP164,4??10,813,0
FP324,4~34,6?5,4
6,5
FP640,14???0,20
RT----5 GR/s
RTX-OPS----37 T
paměti6 GB
192bit
GDDR5

(2-)4 GB
128bit
GDDR5

6 GB
192bit
GDDR5

6 GB
192bit
GDDR6
6 GB
192bit
GDDR6
takt8 GHz7-8 GHz8 GHz?12 GHz
14 GHz
dat. prop.192 GB/s112-128 GB/s192 GB/s288 GB/s
336 GB/s
napájení6pin??8pin8pin
TDP120 W~75 W120W?120 W
160 W
vydání19. 7. 20163. 20193. 201922. 2. 201915. 1. 2019
dob. cena$249-299$179$229?$279
$349

Jádro TU116 je malinko menší než námi původně očekávaných ~300 mm², dosahuje 284 mm². To je dáno i další trochu nečekanou úpravou a to zmenšením L2 cache. Zatímco dosavadní čipy generace Turing disponují 0,5 MB L2 cache na každý 32 bitů široký úsek paměťového řadiče (256bit GeForce RTX 2080 má 4 MB, 192bit GeForce RTX 2060 má 3 MB), jádro TU116 je fyzicky vybaveno pouze polovinou, takže při své 192bit sběrnici nenese 3 MB L2 cache, jak by se dalo na základě dosavadních konfigurací očekávat, ale 1,5 MB L2 cache. Rovnou mohu avizovat, že se nezdá, že by to z hlediska herního výkonu čipu nějak zásadně vadilo.

Výkon v 1920×1080 podle ComputerBase (průměr 16 her)

Herní výkon dopadl přesně dle očekávaní. V průměru 16 her webu ComputerBase chybí GeForce GTX 1660 Ti zanedbatelná 2 % výkonu na dotažení GeForce GTX 1070 a 8 % výkonu na Radeon RX Vega 56. Protože jsou všechny tři karty na trhu, reálně si konkurují a má tedy smysl se jejich srovnáním dále zaobírat.

Herní výkon v 2560×1440 podle ComputerBase

V rozlišení 2560×1440 se výkonnostní rozdíly mezi jmenovanými karty o procento snižují.

Spotřeba grafické karty

Nejsvětlejší stránkou GeForce GTX 1660 Ti je bezesporu spotřeba. Zatímco taková GeForce RTX 2060 nabízela v podstatě výkon i spotřebu GeForce GTX 1070 Ti a chyběl zásadní důvod, proč ji preferovat, GeForce GTX 1660 Ti papá o 27 wattů méně než GeForce GTX 1070 (a o 44 wattů méně než GeForce RTX 2060 / GeForce GTX 1070 Ti).

Poměr výkon / spotřeba

I poměr výkon / spotřeba je u GeForce GTX 1660 Ti bezkonkurenční. A to doslova. Zatímco Turing řady RTX posouval poměr oproti Pascalu mírně, u Turingu GTX nebo alespoň u stávající GeForce GTX 1660 Ti, je posun mnohem výraznější. Dokonce i přes to, že oproti kupříkladu GeForce RTX 2060 běží na frekvenci zhruba o 100 MHz vyšší, kdy by se naopak dalo očekávat zhoršení tohoto poměru. Pokud k tomu připočteme, že i přes poloviční L2 cache nedochází k žádnému citelnému propadu po stránce výkonu, vypadá to, jakoby šlo o cosi jako Turing druhé generace. Podobně jako Pascal druhé generace (GP2xx) dále zlepšil poměr spotřeba / výkon a snížil nároky na datové přenosy oproti Pascalu první generace (GP1xx).

Menší cache a samostatné FP16 jednotky na druhou stranu nic nemění na tom, že karta nabízí očekávaný výkon (jde spíše o architektonické zajímavosti) a nakonec je to především výkon, cena, výbava a spotřeba, které rozhodnou o celkovém přijetí karty. Cena i výkon odpovídají očekávání. Výbava z hlediska paměti sice odpovídá očekávání, ale opět nelze opomenout, že 6 GB paměti je kapacita nižší, než dosud bylo v tomto výkonnostním segmentu obvyklé (viz 8 GB GeForce GTX 1070). Spotřeba je pak jednoznačně příznivá.

Poměr cena / výkon

Alternativy jsou v podstatě dvě: GeForce GTX 1070, jak již bylo řečeno, nabízí více paměti a má mírně vyšší spotřebu. Nejlevnější modely ale postupně mizejí. Pokud vyjdeme z oficiální ceny GeForce GTX 1660 Ti, $279, tak lze říct, že ještě před nedávnem bylo možné na zahraničních e-shopech najít GeForce GTX 1070 za $329, v akcích i za ±$299. Kdo takovou kartu sehnal, může být spokojený. ~$20 příplatek za 8GB paměť jistě stojí. Dnes jsou již dostupné spíše dražší karty, takže asi budou převažovat zákazníci, kteří uvidí vyšší hodnotu v úspoře kupříkladu $60+ než ve 2 GB paměti navíc. GeForce GTX 1070 tedy již pozici GeForce GTX 1660 Ti nepodetne, alespoň nyní to vypadá, že se jen doprodává a levnější nejspíš nebude.

Druhé alternativě, Radeonu RX Vega 56, AMD minulý týden snížila cenu. Vypadá to, že partnerům, jejichž karty jsou již v distribuci, kompenzuje snížení cen na ohlášených $279 a po modelu od MSI by se za nižší ceny měly objevit i karty jiných značek. Radeon RX Vega 56 nabízí o něco vyšší výkon, o 2 GB vyšší kapacitu paměti, ale výrazně (o cca 90 wattů) vyšší spotřebu.

Krom všeho jmenovaného přináší GeForce GTX 1660 Ti v rámci řady Turing ještě jedno prvenství, které již bylo nastíněno, ale ještě nebylo vyřčeno: Je vůbec první Turingem, který přiměl AMD snížit cenu vlastního produktu. Dosud to nebylo třeba, protože poměr cena / výkon stávajících karet z řady Turing nepřinášel nic nového. V tomto je GeForce GTX 1660 Ti první a dost možná to Nvidii dopomůže i ke zlepšení prodejů, které v posledním kvartálu loňského roku po vydání GeForce RTX nedopadly podle očekávání.

Diskuse ke článku GeForce GTX 1660 Ti: nízká spotřeba, očekávaný výkon, bez TC, ale s něčím novým

Středa, 27 Únor 2019 - 15:06 | Jaroslav Brümmer | ANo, ale obecně americké firmy doporučené ceny...
Úterý, 26 Únor 2019 - 02:43 | Artael | Na tom celém se mi líbí, že už jen to zmenšení a...
Úterý, 26 Únor 2019 - 02:32 | Artael | Tak ono celkově, hi-res textury = více paměti....
Úterý, 26 Únor 2019 - 02:13 | Artael | No, nemyslím si, že by to úplně konkurovalo...
Pondělí, 25 Únor 2019 - 22:39 | ados | SLI je na tom asi lépe, komunita je aktivní a...
Pondělí, 25 Únor 2019 - 21:36 | littleon | To se uvidí, jak odolný budu, až vyjde Tropico 6...
Pondělí, 25 Únor 2019 - 19:38 | tombomino | Ono pokud nespechas, tak se muze vyplatit pockat...
Pondělí, 25 Únor 2019 - 19:02 | Tom | :) tak když APU na 16nm má 6Tflop tak jistý...
Pondělí, 25 Únor 2019 - 18:24 | littleon | Neviděl, konzole nejsou můj šálek :). Nová APU na...
Pondělí, 25 Únor 2019 - 18:20 | Tom | jj většinou to tam i úvadějí jestli s nebo bez...

Zobrazit diskusi