GeForce GTX 1660 Ti: nízká spotřeba, očekávaný výkon, bez TC, ale s něčím novým
GeForce GTX 1660 Ti lze považovat za první skutečný mainstream generace Turing. Při ceně začínající na $279 sice stále nejde o tradičních $199-$249, které až na výjimky většina modelů z šedesátkové řady stála, ale naplní již význam slova mainstream - hlavní proud, segment, ve které se prodá nejvyšší objem produktů.
GeForce GTX 1660 Ti je prvním modelem z řady Turing, kterému v názvu schází RTX. To indikuje absenci hardwarových jednotek pro raytracing (RT-cores) a - jak se potvrdilo - nejsou podporována ani tensor-cores. U těch se ale na chvíli zastavíme, neboť je situace zajímavější, než se zprvu zdálo. Dokonce vyplynuly na povrch i informace, které v době vydání Turingu nebyly známé. Totiž, zatímco výpočetní Pascal (GP100) nebo Volta podporuje FP16 operace 2× rychleji než FP32 operace tím způsobem, že jejich FP32 jednotky jsou flexibilní a dokážou zpracovat buď jednu FP32 operaci v taktu nebo dvě FP16 operace v taktu, u dosavadních Turingů tomu bylo jinak. FP16 operace nezpracovávala FP32 jádra, jako tomu bylo třeba u Volty, ale byly přesunuty na (oproti Voltě) pokročilejší tensor cores.
To tedy znamená, že dosavadní jádra z řady Turing mají tensor cores rozšířená tak, že jsou přinejmenším z hlediska FP16 univerzálně použitelná pro herní účely a Nvidia je takto využívá. Jaké mohou být k této změně důvody: Pokud jsou tensor cores již téměř standardní výbavou, pak zkrátka může mít smysl ušetřit tranzistory vynaložené na dosažení kompatibility s FP16 u FP32 jednotek (datové cesty, registry) a ponechání těchto operací na tensor cores. Je tu ale ještě jedna zásadnější výhoda - respektive výhoda pro čip, který již tensor cores má: FP32 a FP16 operace mohou být prováděny paralelně. Zatímco kupříkladu Volta může na konkrétní výpočetní jednotce buďto FP32 operace nebo FP16 operace, Turing může FP32 a FP16 provádět zároveň obojí paralelně. Zkrátka a dobře, zatímco takový Titan V může buďto dosáhnout 13,8 TFLOPS FP32, nebo 27,6 TFLOPS FP16, Titan RTX může dosáhnout 16,3 TFLOPS v FP32 a k tomu 32,6 TFLOPS v FP16.
V praxi zatím využívá FP16 jen pár her a výkonnostní bonusy nejsou velké, ale pokud by se našla aplikace, která mohutně využívá FP32 s FP16 zároveň, mohla by na Turingu dosahovat zajímavého výkonu. To nás ovšem vede k myšlence, že bychom např. o zmíněném Titanu RTX neměli hovořit jakožto o GPU s 4608 stream-procesory, ale spíš jako o GPU se 4608 FP32 stream-procesory a 9216 FP16 stream-procesory. V praxi je to ještě o něco komplikovanější, nicméně to alespoň o něco lépe odráží realitu: tedy že čip má a pro shading využívá více než jen uváděných 4608 jednotek.
Schéma SM bloku Turing TU116: Tensor Cores byly nahrazeny FP16 jednotkami
Nyní se vraťme k GeForce GTX 1660 Ti. Jak to je s FP16 u ní, když žádné tensor cores nemá? Podle schématu od Nvidie byla prostě tensor cores nahrazena samostatnými FP16 jednotkami, který je 2× více než FP32 jednotek. Netroufnu si říct, zda skutečně fyzicky na úrovni jádra byla tensor cores odstraněna a nahrazena FP16 jednotkami, nebo zda jsou fyzicky stále přítomná a jejich použití je pouze omezeno na FP16 výpočty. Je však možné, že když Nvidia z návrhu odstranila RT-cores, došlo i na tensor cores. Každopádně je taková změna zajímavá, v podstatě nečekaná.
GeForce GTX 1060 | GeForce GTX 1650 | GeForce GTX 1660 | GeForce GTX 1660 Ti | GeForce RTX 2060 | |
---|---|---|---|---|---|
GPU | GP106 | TU117? | TU116 | TU106 | |
Plocha | 200 mm² | <200 mm² | 284 mm² | 445 mm² | |
Proces | 16 nm TSMC | ~12 nm | 12 nm TSMC | ||
Zákl. takt | 1506 MHz | ~1500 MHz | 1530 MHz? | 1500 MHz | 1365 MHz |
Boost | 1708 MHz | ~1700 MHz | 1785 MHz? | 1770 MHz | 1680 MHz |
SPs | 1280 | 896 | 1280 | 1536 | 1920 |
Tensor | - | ? | ? | - | 240 |
RT Cores | - | - | - | - | 30 |
TMUs | 80 | 56 | 80 | 96 | 120 |
ROPs | 48 | 32 | 48 | 48 | 48 |
tens. Int4 | - | - | - | - | ? |
tens. FP16 | - | - | - | - | ? |
FP16 | 4,4 | ? | ? | 10,8 | 13,0 |
FP32 | 4,4 | ~3 | 4,6? | 5,4 | 6,5 |
FP64 | 0,14 | ? | ? | ? | 0,20 |
RT | - | - | - | - | 5 GR/s |
RTX-OPS | - | - | - | - | 37 T |
paměti | 6 GB 192bit GDDR5 | (2-)4 GB | 6 GB | 6 GB 192bit GDDR6 | 6 GB 192bit GDDR6 |
takt | 8 GHz | 7-8 GHz | 8 GHz? | 12 GHz | 14 GHz |
dat. prop. | 192 GB/s | 112-128 GB/s | 192 GB/s | 288 GB/s | 336 GB/s |
napájení | 6pin | ? | ? | 8pin | 8pin |
TDP | 120 W | ~75 W | 120W? | 120 W | 160 W |
vydání | 19. 7. 2016 | 3. 2019 | 3. 2019 | 22. 2. 2019 | 15. 1. 2019 |
dob. cena | $249-299 | $179 | $229? | $279 | $349 |
Jádro TU116 je malinko menší než námi původně očekávaných ~300 mm², dosahuje 284 mm². To je dáno i další trochu nečekanou úpravou a to zmenšením L2 cache. Zatímco dosavadní čipy generace Turing disponují 0,5 MB L2 cache na každý 32 bitů široký úsek paměťového řadiče (256bit GeForce RTX 2080 má 4 MB, 192bit GeForce RTX 2060 má 3 MB), jádro TU116 je fyzicky vybaveno pouze polovinou, takže při své 192bit sběrnici nenese 3 MB L2 cache, jak by se dalo na základě dosavadních konfigurací očekávat, ale 1,5 MB L2 cache. Rovnou mohu avizovat, že se nezdá, že by to z hlediska herního výkonu čipu nějak zásadně vadilo.
Výkon v 1920×1080 podle ComputerBase (průměr 16 her)
Herní výkon dopadl přesně dle očekávaní. V průměru 16 her webu ComputerBase chybí GeForce GTX 1660 Ti zanedbatelná 2 % výkonu na dotažení GeForce GTX 1070 a 8 % výkonu na Radeon RX Vega 56. Protože jsou všechny tři karty na trhu, reálně si konkurují a má tedy smysl se jejich srovnáním dále zaobírat.
Herní výkon v 2560×1440 podle ComputerBase
V rozlišení 2560×1440 se výkonnostní rozdíly mezi jmenovanými karty o procento snižují.
Spotřeba grafické karty
Nejsvětlejší stránkou GeForce GTX 1660 Ti je bezesporu spotřeba. Zatímco taková GeForce RTX 2060 nabízela v podstatě výkon i spotřebu GeForce GTX 1070 Ti a chyběl zásadní důvod, proč ji preferovat, GeForce GTX 1660 Ti papá o 27 wattů méně než GeForce GTX 1070 (a o 44 wattů méně než GeForce RTX 2060 / GeForce GTX 1070 Ti).
Poměr výkon / spotřeba
I poměr výkon / spotřeba je u GeForce GTX 1660 Ti bezkonkurenční. A to doslova. Zatímco Turing řady RTX posouval poměr oproti Pascalu mírně, u Turingu GTX nebo alespoň u stávající GeForce GTX 1660 Ti, je posun mnohem výraznější. Dokonce i přes to, že oproti kupříkladu GeForce RTX 2060 běží na frekvenci zhruba o 100 MHz vyšší, kdy by se naopak dalo očekávat zhoršení tohoto poměru. Pokud k tomu připočteme, že i přes poloviční L2 cache nedochází k žádnému citelnému propadu po stránce výkonu, vypadá to, jakoby šlo o cosi jako Turing druhé generace. Podobně jako Pascal druhé generace (GP2xx) dále zlepšil poměr spotřeba / výkon a snížil nároky na datové přenosy oproti Pascalu první generace (GP1xx).
Menší cache a samostatné FP16 jednotky na druhou stranu nic nemění na tom, že karta nabízí očekávaný výkon (jde spíše o architektonické zajímavosti) a nakonec je to především výkon, cena, výbava a spotřeba, které rozhodnou o celkovém přijetí karty. Cena i výkon odpovídají očekávání. Výbava z hlediska paměti sice odpovídá očekávání, ale opět nelze opomenout, že 6 GB paměti je kapacita nižší, než dosud bylo v tomto výkonnostním segmentu obvyklé (viz 8 GB GeForce GTX 1070). Spotřeba je pak jednoznačně příznivá.
Poměr cena / výkon
Alternativy jsou v podstatě dvě: GeForce GTX 1070, jak již bylo řečeno, nabízí více paměti a má mírně vyšší spotřebu. Nejlevnější modely ale postupně mizejí. Pokud vyjdeme z oficiální ceny GeForce GTX 1660 Ti, $279, tak lze říct, že ještě před nedávnem bylo možné na zahraničních e-shopech najít GeForce GTX 1070 za $329, v akcích i za ±$299. Kdo takovou kartu sehnal, může být spokojený. ~$20 příplatek za 8GB paměť jistě stojí. Dnes jsou již dostupné spíše dražší karty, takže asi budou převažovat zákazníci, kteří uvidí vyšší hodnotu v úspoře kupříkladu $60+ než ve 2 GB paměti navíc. GeForce GTX 1070 tedy již pozici GeForce GTX 1660 Ti nepodetne, alespoň nyní to vypadá, že se jen doprodává a levnější nejspíš nebude.
Druhé alternativě, Radeonu RX Vega 56, AMD minulý týden snížila cenu. Vypadá to, že partnerům, jejichž karty jsou již v distribuci, kompenzuje snížení cen na ohlášených $279 a po modelu od MSI by se za nižší ceny měly objevit i karty jiných značek. Radeon RX Vega 56 nabízí o něco vyšší výkon, o 2 GB vyšší kapacitu paměti, ale výrazně (o cca 90 wattů) vyšší spotřebu.
Krom všeho jmenovaného přináší GeForce GTX 1660 Ti v rámci řady Turing ještě jedno prvenství, které již bylo nastíněno, ale ještě nebylo vyřčeno: Je vůbec první Turingem, který přiměl AMD snížit cenu vlastního produktu. Dosud to nebylo třeba, protože poměr cena / výkon stávajících karet z řady Turing nepřinášel nic nového. V tomto je GeForce GTX 1660 Ti první a dost možná to Nvidii dopomůže i ke zlepšení prodejů, které v posledním kvartálu loňského roku po vydání GeForce RTX nedopadly podle očekávání.