Diit.cz - Novinky a informace o hardware, software a internetu

Nvidia v EULA zakázala použití GeForce v datacentrech

Pokud jde o nasazení umělé inteligence, zdá se, že Nvidii zprvu unikla jedna drobnost, která se zřejmě nakonec ukázala být natolik závažná, že vedla k úpravě EULA…

Nvidia upravila znění EULA (End User License Agreement) takovým způsobem, které fakticky znemožňuje použití grafických karet z řady GeForce v datových centrech. Výjimku dává pouze pro tzv. blockchain processing, což můžeme v tomto kontextu a s trochu přimhouřenými očima (či přicloněnými objektivy) chápat jako tolerování těžby kryptoměn.

Proč Nvidia zakazuje použití GeForce v datacentrech?

Nebudeme řešit, do jaké míry a ve kterých zemích je toto kontrolovatelné a právně vymahatelné; spíš si položíme otázku, proč vlastně toto Nvidia dělá. Je jasné, že ji vývoj softwaru pro profesionální nasazení něco stojí a to si nechává platit v ceně dražších profesionálních karet (Tesla pro výpočty, Quadro pro grafiku). Pokud tedy uživatel, respektive spíš v tomto případě společnost, použije GeForce, nemá z toho Nvidia víc než z nákupu řadového hráče.

Je tedy jasné, proč si nepřeje, aby datacentra používala GeForce. Otázka číslo dvě: Jak je možné, že se použití GeForce v datových centrech vyplácí? Tady je třeba předeslat, že kdyby se to nevyplácelo, nikdo by to nedělal a Nvidia by nemusela dodatečně měnit licenční podmínky EULA.

Proč se vyplatí použít GeForce v datacentrech?

Aby bylo jasné, proč se nyní nasazení GeForce v datacentrech začalo vyplácet, když se dříve nevyplácelo, musíme stručně zabrousit do historie. Donedávna byl jedním z požadavků na výpočetní akcelerátor vycházející z GPU vysoký výkon v double-precision, FP64. Ten tradičně Nvidia u pomalejších a herních karet ořezávala - buďto na softwarové nebo na hardwarové úrovni (to už je z hlediska pochopení současné situace jedno). Kupříkladu taková GeForce GTX 1080 má výkon v double-precision (FP64) 32× nižší než v single-precision (FP32), takže se pro toto nasazení nehodí a tím je věc uzavřena.

Jenže pro akceleraci procesů tzv. umělé inteligence dostačuje často nižší přesnost, half-precision (FP16). Někdy stačí i čtvrtinová celočíselná (Int8), ale to jen pro úplnost, teď je podstatná half-precision. Právě FP16 totiž četná moderní GPU zvládají zpracovávat 2× rychleji než standardní FP32, takže pro potřeby datových center dosahují 2× vyššího výkonu. Stejně jako v případě double-precision, FP64, mají herní karty výkon v FP16 hardwarově nebo softwarově omezen, aby firmy kupovaly dražší profesionální modely. Jenže některé zjevně kupují GeForce i tak. Proč?

V podstatě je to jednoduché. Představte si situaci, kdy máme herní kartu A a výpočetní kartu B. Obě jsou postavené na stejném GPU, obě mají stejný výkon v FP32, ale výpočetní karta B má 2× vyšší výkon v half-precision (FP16). Teoreticky by tedy měla být pro datacentrum výhodnější karta B. Jenže pokud je profesionální karta B 4× dražší než herní karta A, zásadně to mění situaci. I když má karta A až do mrtě ořezaný výkon v FP16, disponuje stále plným výkonem v FP32. Ten je sice poloviční než FP16 výkon profesionálního řešení, ale při 4× nižší ceně je zkrátka výsledný poměr cena / výkon 2× lepší.

Krátce: Pokud je FP16 výkon výpočetní karty dražší než FP32 výkon herní grafiky, začínají se výhody výpočetní karty ztrácet a není důvod, proč namísto ní nepoužít GeForce. Což se samozřejmě Nvidii kvůli nižším maržím nelíbí. Pokud firmy vybavené kartami GeForce budou chtít fungovat v souladu s EULA, mohou je buďto nahradit dražšími Teslami, nebo konkurenčním hardwarem.

Závěrem je třeba zmínit, že se nová EULA vztahuje i na Titany (ačkoli už v posledních generacích nespadají do řady GeForce), což dále zužuje segment jejich určení (připomeňme, že poslední Titan V neadresovala Nvidia hráčům - byť je zřejmé proč - ale profesionálům). A to ještě u Titan X Nvidia propagovala 4× rychlejší Int8 výpočty oproti FP32

Zdroje: 

Diskuse ke článku Nvidia v EULA zakázala použití GeForce v datacentrech

Pondělí, 8 Leden 2018 - 10:14 | r23 | Např. R&S RTO2064 nebo asi tak vše 20 GSps+...
Neděle, 7 Leden 2018 - 16:07 | J D | Mohu poprosit odkaz? Klasičtí výrobci jako...
Neděle, 7 Leden 2018 - 11:53 | r23 | Klasický přístup ultranenažrané nVidie. Je to...
Neděle, 7 Leden 2018 - 11:49 | r23 | Není problém mít osciloskop za několik mega.
Pátek, 5 Leden 2018 - 17:15 | Tomcat2 | Tak firewall a je hotovo:)
Čtvrtek, 4 Leden 2018 - 21:02 | Spirit_pcf | Myslim, ze nebude tak narocne implementovat nieco...
Čtvrtek, 4 Leden 2018 - 17:04 | Tomcat2 | To možná ano, ale pak se nabízí otázka, kdo...
Středa, 3 Leden 2018 - 23:28 | franzzz | > Toto je už skutočne nehoráznosť Neni april,...
Středa, 3 Leden 2018 - 23:18 | franzzz | Mate sice pravdu, ale mohl by tady byt drobny...
Středa, 3 Leden 2018 - 23:16 | franzzz | > A jsou pro dané použití dostatečně kvalitní...

Zobrazit diskusi