Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Test: Blender Benchmark 1.0 beta 2

Tak co kdy tady bude zpráva o nových ovladačích nVidie? Za týden?

+1
-3
-1
Je komentář přínosný?

Hlavne to ne, NVidia prida par radku kodu a tady bude zase az prilis dlouha zprava, jak moc se toho zase nepovedlo.

+1
+3
-1
Je komentář přínosný?

Nevím.

+1
+1
-1
Je komentář přínosný?

Tak nějak mi uniká pointa. Můj osobní závěr z článku je, že Blender je špatně optimalizován pro novější hardware a lépe využívá OpenCL než CUDA. Ale je taky možný, že si to jenom špatně vykládám.

+1
0
-1
Je komentář přínosný?

kde je v tom clanku graf co srovnava vykon opencl vs cuda na stejnym hardwaru? zadnej takovej tam nevidim.. koukam spatne?

+1
0
-1
Je komentář přínosný?

,,Při renderingu přes GPU se používá buďto OpenCL ve spojení s kartami AMD Radeon a CUDA s NVIDIA GeForce."

A jelikož mají karty s vyšším výpočetní výkonem a CUDA horší výsledky než karty s nižším výpočetním výkonem a OpenCL tak tímto nepřímím srovnáním výde, že Blender lépe využívá OpenCL.
Jinak srovnání CUDA vs OpenCL můžete udělat jen u NVIDIe a tudíž to nemá moc smysl.

+1
0
-1
Je komentář přínosný?

kdyz neni srovnani na stejnym hardwaru, tak se neda vyvozovat, ze to je implementaci cuda/opencl.. stejne tak to muze bejt ruznou architekturou nebo jinejma duvodama

+1
0
-1
Je komentář přínosný?

Blender pro NVIDIA karty používá pouze CUDA, OpenCL není podporované, to lze použít jen s Radeony. Takže přímé srovnání NVIDIA karet v Blenderu CUDA vs OpenCL není aktuálně možné.

+1
+1
-1
Je komentář přínosný?

To uz opakovane ukazalo tezeni kryptomen... nvidie ve vypoctech vykazuje dlouhodobe horsi vysledky, nez by mela mit s danym hrubym vypocetnim vykonem.

+1
+3
-1
Je komentář přínosný?

... coz neni vubec prekvapive. Nvidia dlouhodobe usiluje vsechny zajemce o vypocty nasmerovat na Tesly, a ne-Tesla karty miri na gaming, takze maji vypocetni featury osekany na minimum. Nejnovejsi pridavek Tensor cores do gaming karet je spis vyjimka, a jediny duvod je DLSS. Z business hlediska to dava smysl...

+1
+2
-1
Je komentář přínosný?

Jak jsem zmiňoval na začátku, je to spíš takové informační, jak si různý HW vede v Blenderu. Bohužel jsem neměl v nedávné minulosti žádné GeForce RTX či 1080 Ti, velká Quadra, Radeony Pro a tak podobně. Zda je lepší implementace OpenCL oproti CUDA, to netuším, nepřijde mi, že by si ty NVIDIA karty vedly zle.

+1
0
-1
Je komentář přínosný?

tak nVidia RTX 2070 test take nedobehne. Po chvilce se ukonci s chybou.

+1
0
-1
Je komentář přínosný?

Crashne jen první barbershop? Nebo i ostatní? Ve Windows?

+1
0
-1
Je komentář přínosný?

Ano, Windows 10 a crashnou vsechny testy.

+1
0
-1
Je komentář přínosný?

Pro zajímavost pár výsledků na chybějícím Pascalu 1080Ti, Vega 64 a na více na CPU "vydatném" hardwaru :-). OS vždy Linux 64bit:

Vega 64: OpenCL
Barber - 973s, BMW2 - 112s, Classroom - 233s, Fishy Cat - 239s, Koro - 266s, Pavillon - 341s

Geforce 1080Ti: CUDA
Barber - 1006s, BMW2 - 116s, Classroom - 279s, Fishy Cat - 222s, Koro - 499s, Pavillon - 297s

AMD Epyc 7551P:
Barber - 531s, BMW2 - 98s, Classroom - 298s, Fishy Cat - 138s, Koro - 223s, Pavillon - 242s

2xAMD Opteron 6380
Barber - 1339s, BMW2 - 289s, Classroom - 864s, Fishy Cat - 389s, Koro - 621s, Pavillon - 695s

+1
+2
-1
Je komentář přínosný?

Díky moc! Zajímavé je, že Vám jede ta 1080 Ti v linuxu v pohodě, asi to tedy bude nějaký problém ve Windows. Ten Epyc má výkon fakt kulervoucí.

Zrovna mi tu dnes jedna 1080 Ti přistála, tak to schválně zkusím, zda crashne ve woknech jako ty ostatní karty.

+1
0
-1
Je komentář přínosný?

To ano, 180W Epyc je rychlejší než 250/280W herní GPU a to o hodně, samotného mě to překvapilo :-). On má 8 kanálový řadič s propustností 170 GB/s, to mu tady významně pomáhá. Ty Opterony jsou výkonově na úrovni 1700X až 2700X s cca trojnásobnou spotřebou ale zase je to už 6 let stará platforma. Osazeny jsou tam taky 2x4 DIMM pro jejich maximální propustnost 51,2 GB/s, je to quad channel. Serverový hardware tu trošku chyběl, tak jsem to pustil když je ta možnost ;-). Jestli se hecnu, pustím to i na profi WX7100PRO ale to bude ve windows :-).

+1
0
-1
Je komentář přínosný?

Za to může nejspíš ten tile-based rendering, ten EPYC prostě počítá tolik tiles, kolik má threadů a i když jeden tile trvá déle než třeba na Ryzenu 7 2700X, tak jich dělá tolik najednou, že to prostě předběhne, to samé vs GPU. Nicméně pořizovací cena takového Epyckého stroje bude spíše vyšší než PC s V64. Ale i tak je to moc pěkný výsledek.

Já mám k dispozici také nějaký serverový HW, ale aktuálně všude něco běží a nechce se mi migrovat hromady virtuálů, abych nějaký server uvolnil pro Blender, možná až někdy bude nějaké maintenance okno ;D

+1
0
-1
Je komentář přínosný?

Tak cena bude vždy vyšší, zase ten Epyc je energeticky mnohem víc efektivní v rámci dlouhodobého provozování. Celá sestava se 128 GB RAM má v plné zátěži menší spotřebu než samotná Vega 64 - cca na úrovni 255W. Když odhlédneme od toho že do běžného počítače obvykle nedáš ECC paměti s bezproblémovou kapacitou stovek GB ani ho neumístíš do racku po X kusech s řádově lepší vzdálenou správou apod., tak máš vyšší šanci na chyby a pořád potřebuješ celý počítač aby tu Vegu krmil, tedy i další spotřebu navíc.

Spíš je to tu jen pro porovnání - pro obyčejného člověka se vyplatí koupit si třeba tu Vegu nebo jiné vhodné GPU a nějaké rozumně výkonné a drahé CPU. Když to ale potřebuješ dělat paralelně ve velkém, protože takových obrázků musíš mít dnes i 60 na 1 sekundu filmu, začne se ti provoz rychle prodražovat na klidně i více než dvojnásobné spotřebě energie a celkové náklady tak ve finále mohou být při použití těch CPU znatelně nižší, případně koupíš profesionální výpočetní karty, které jsou stejně nebo ještě násobně dražší než většina CPU ale poskytovaný výkon tomu odpovídá. Tak ale uvažuje vlastník - profesionál, co se tím živí ve velkém protože si může dovolit tu velkou klidně mnohamilionovou investici na začátku.

+1
0
-1
Je komentář přínosný?

DObre vysledky ma i 980Ti:
bmw27:133.381
classroom:364.208

+1
+1
-1
Je komentář přínosný?

To není špatné :)

+1
+1
-1
Je komentář přínosný?

{
"benchmark_client": {
"client_version": "1.0b2"
},
"blender_version": {
"build_commit_date": "2018-03-22",
"build_commit_time": "14:10",
"build_date": "2018-03-22",
"build_hash": "f4dc9f9d68b",
"build_time": "09:59 AM",
"version": "2.79 (sub 0)"
},
"device_info": {
"compute_devices": [
"AMD Radeon R9 Fury Series"
],
"device_type": "OPENCL",
"num_cpu_threads": 8
},
"scenes": [
{
"name": "bmw27",
"stats": {
"device_memory_usage": 1675.71,
"device_peak_memory": 1675.71,
"pipeline_render_time": 241.11,
"render_time_no_sync": 207.953,
"result": "OK",
"total_render_time": 221.634
}
},
{
"name": "classroom",
"stats": {
"device_memory_usage": 1943.16,
"device_peak_memory": 1943.16,
"pipeline_render_time": 484.12,
"render_time_no_sync": 461.505,
"result": "OK",
"total_render_time": 465.248
}
}
],
"system_info": {
"bitness": "64bit",
"cpu_brand": "AMD FX(tm)-9370 Eight-Core Processor ",
"devices": [
{
"name": "AMD FX(tm)-9370 Eight-Core Processor",
"type": "CPU"
},
{
"name": "AMD Radeon R9 Fury Series",
"type": "OPENCL"
},
{
"name": "GeForce GTX 780",
"type": "CUDA"
}
],
"machine": "AMD64",
"num_cpu_cores": 4,
"num_cpu_sockets": 1,
"num_cpu_threads": 8,
"system": "Windows"
},
"timestamp": "2018-11-17T13:43:06.209711+00:00"
}

+1
0
-1
Je komentář přínosný?

{
"benchmark_client": {
"client_version": "1.0b2"
},
"blender_version": {
"build_commit_date": "2018-03-22",
"build_commit_time": "14:10",
"build_date": "2018-03-22",
"build_hash": "f4dc9f9d68b",
"build_time": "09:59 AM",
"version": "2.79 (sub 0)"
},
"device_info": {
"compute_devices": [
"GeForce GTX 780 (Display)"
],
"device_type": "CUDA",
"num_cpu_threads": 8
},
"scenes": [
{
"name": "bmw27",
"stats": {
"device_memory_usage": 149.48,
"device_peak_memory": 149.48,
"pipeline_render_time": 250.61,
"render_time_no_sync": 236.161,
"result": "OK",
"total_render_time": 248.601
}
},
{
"name": "classroom",
"stats": {
"device_memory_usage": 352.3,
"device_peak_memory": 352.3,
"pipeline_render_time": 746.48,
"render_time_no_sync": 742.026,
"result": "OK",
"total_render_time": 745.098
}
}
],
"system_info": {
"bitness": "64bit",
"cpu_brand": "AMD FX(tm)-9370 Eight-Core Processor ",
"devices": [
{
"name": "AMD FX(tm)-9370 Eight-Core Processor",
"type": "CPU"
},
{
"name": "AMD Radeon R9 Fury Series",
"type": "OPENCL"
},
{
"name": "GeForce GTX 780",
"type": "CUDA"
}
],
"machine": "AMD64",
"num_cpu_cores": 4,
"num_cpu_sockets": 1,
"num_cpu_threads": 8,
"system": "Windows"
},
"timestamp": "2018-11-17T19:00:21.949258+00:00"
}

+1
0
-1
Je komentář přínosný?

Testovano na AMD Athlon II X2 250 (quick test)
bmw27: 4350.31
classroom: 15610.6

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.