Nvidia v EULA zakázala použití GeForce v datacentrech
Nvidia upravila znění EULA (End User License Agreement) takovým způsobem, které fakticky znemožňuje použití grafických karet z řady GeForce v datových centrech. Výjimku dává pouze pro tzv. blockchain processing, což můžeme v tomto kontextu a s trochu přimhouřenými očima (či přicloněnými objektivy) chápat jako tolerování těžby kryptoměn.
Proč Nvidia zakazuje použití GeForce v datacentrech?
Nebudeme řešit, do jaké míry a ve kterých zemích je toto kontrolovatelné a právně vymahatelné; spíš si položíme otázku, proč vlastně toto Nvidia dělá. Je jasné, že ji vývoj softwaru pro profesionální nasazení něco stojí a to si nechává platit v ceně dražších profesionálních karet (Tesla pro výpočty, Quadro pro grafiku). Pokud tedy uživatel, respektive spíš v tomto případě společnost, použije GeForce, nemá z toho Nvidia víc než z nákupu řadového hráče.
Je tedy jasné, proč si nepřeje, aby datacentra používala GeForce. Otázka číslo dvě: Jak je možné, že se použití GeForce v datových centrech vyplácí? Tady je třeba předeslat, že kdyby se to nevyplácelo, nikdo by to nedělal a Nvidia by nemusela dodatečně měnit licenční podmínky EULA.
Proč se vyplatí použít GeForce v datacentrech?
Aby bylo jasné, proč se nyní nasazení GeForce v datacentrech začalo vyplácet, když se dříve nevyplácelo, musíme stručně zabrousit do historie. Donedávna byl jedním z požadavků na výpočetní akcelerátor vycházející z GPU vysoký výkon v double-precision, FP64. Ten tradičně Nvidia u pomalejších a herních karet ořezávala - buďto na softwarové nebo na hardwarové úrovni (to už je z hlediska pochopení současné situace jedno). Kupříkladu taková GeForce GTX 1080 má výkon v double-precision (FP64) 32× nižší než v single-precision (FP32), takže se pro toto nasazení nehodí a tím je věc uzavřena.
Jenže pro akceleraci procesů tzv. umělé inteligence dostačuje často nižší přesnost, half-precision (FP16). Někdy stačí i čtvrtinová celočíselná (Int8), ale to jen pro úplnost, teď je podstatná half-precision. Právě FP16 totiž četná moderní GPU zvládají zpracovávat 2× rychleji než standardní FP32, takže pro potřeby datových center dosahují 2× vyššího výkonu. Stejně jako v případě double-precision, FP64, mají herní karty výkon v FP16 hardwarově nebo softwarově omezen, aby firmy kupovaly dražší profesionální modely. Jenže některé zjevně kupují GeForce i tak. Proč?
V podstatě je to jednoduché. Představte si situaci, kdy máme herní kartu A a výpočetní kartu B. Obě jsou postavené na stejném GPU, obě mají stejný výkon v FP32, ale výpočetní karta B má 2× vyšší výkon v half-precision (FP16). Teoreticky by tedy měla být pro datacentrum výhodnější karta B. Jenže pokud je profesionální karta B 4× dražší než herní karta A, zásadně to mění situaci. I když má karta A až do mrtě ořezaný výkon v FP16, disponuje stále plným výkonem v FP32. Ten je sice poloviční než FP16 výkon profesionálního řešení, ale při 4× nižší ceně je zkrátka výsledný poměr cena / výkon 2× lepší.
Krátce: Pokud je FP16 výkon výpočetní karty dražší než FP32 výkon herní grafiky, začínají se výhody výpočetní karty ztrácet a není důvod, proč namísto ní nepoužít GeForce. Což se samozřejmě Nvidii kvůli nižším maržím nelíbí. Pokud firmy vybavené kartami GeForce budou chtít fungovat v souladu s EULA, mohou je buďto nahradit dražšími Teslami, nebo konkurenčním hardwarem.
Závěrem je třeba zmínit, že se nová EULA vztahuje i na Titany (ačkoli už v posledních generacích nespadají do řady GeForce), což dále zužuje segment jejich určení (připomeňme, že poslední Titan V neadresovala Nvidia hráčům - byť je zřejmé proč - ale profesionálům). A to ještě u Titan X Nvidia propagovala 4× rychlejší Int8 výpočty oproti FP32…