Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k $3999 Spark od Nvidie se vyšplhá na 50 FPS na 1080p v Cyberpunk 2077

Ono to asi nebude zamýšleno zrovna na Cyberpunk :)

+1
-6
-1
Je komentář přínosný?

Nebylo a není.

Ale spousta fanoušků už to pouožívala jako "Kladivo na Čarodějnice" z AMD s tím, že tam přeci je rtx 5070 a to všechno rozmetá na prach.

+1
+11
-1
Je komentář přínosný?

no a ono nee :)

+1
+1
-1
Je komentář přínosný?

Jenže není. GPU sice ano, ale paměť je víc jak 2x pomalejší.

+1
0
-1
Je komentář přínosný?

v premiu pisou ''Protože Nvidia s použitým čipem GB10 plánuje osazovat i notebooky''.. na co je notebooku integrovana rtx5070 kdyz ne na 3d grafiku?? btw. ai sparku moc nejde, takze je logicky, ze lidi zajima, jestli tomu jdou aspon hry..

John Carmack: Nvidia DGX Spark jede na dva válce, přehřívá se a padá
https://diit.cz/clanek/john-carmack-nvidia-dgx-spark-jede-na-dva-valce-p...

+1
+2
-1
Je komentář přínosný?

Od začátku je to dělané na AI.

+1
-1
-1
Je komentář přínosný?

Ale ani to mu moc nejde.

+1
+3
-1
Je komentář přínosný?

Apple M5 opět vítězí, ani NVIDIA ARM na ně nestačí. Je konec.

+1
+8
-1
Je komentář přínosný?

Někteří z toho drží v rukou chomáče vlasůů a nevědí proč a odkud se vzaly...?

+1
+3
-1
Je komentář přínosný?

Z ozáření. To pak padají vlasy po chomáčích. :)

+1
+3
-1
Je komentář přínosný?

M5 neni zadny novy CPU, je to jen prejmenovavana nejvyssi rada M4 pro (ten silnejsi) - a ano je dost vykonny - sam jej mam doma ;-) - ale na plnohodnotnou kartu samozrejme nema ani nahodou - ani na kvalitni CPU, nestiha ani na ARM-Ampere, ani na vykonne AMD s Nvidia kartou ...

+1
0
-1
Je komentář přínosný?

Problém plnohodnotné karty je velikost paměti. Apple dokázal dodat její datovou propustnost do integrované podobně výkonné grafiky, takže navíc má i tu (V)RAM.

U té Ampere myslíte ST, nebo MT výkon? Protože počítač na práci nebude mít 100 jader, ale zas CPU do serveru nepotřebuje ST výkon.

+1
0
-1
Je komentář přínosný?

Jenomže M5 je základ. A přejmenovaná M4 to není, jsou tam úpravy v GPU části. V poměru výkonu na watt se mu kombinace "AMD s Nvidia" podle mě moc nepřiblíží. V celkové spotřebě už vůbec ne.

+1
+1
-1
Je komentář přínosný?

Beru zpet, M5 je pomalejsi RAM ma 1/2 rychlost a ma mene GPU jader ;-)
M4 pro - 10 jader +4 - GPU:20 jader 32 EU 320 ALU, RAM 273 GB/s a umi 64GB RAM
M5 - RAM 153 GB/s a ma jen 10 GPU jader - a umi jen 32GB RAM

Takze M5 je pomalejsi nez nejvyssi M4pro
https://nanoreview.net/en/cpu-compare/apple-m5-vs-apple-m4-pro-14-cores?...

A jako bonus M5 je jen 4 jadro+6 pomalych moje je 10 jadro +4 pomale - clovek si jen rika LOL - jo a boost GPU zapomen ;-) to nefunguje ;-) dam AI a monitor mi ukazuje 99stupnu, coz bude asi chyba reportu v OS, ale jede na max a MacMini musis stat ve vzduchu, na stole se prehreje ;-) takze mam stojanek a vetrak se spusti na plno - takjze boost je jen na chvili v relu jedes na zakladni frekvneci --- cili po vereni faktu uznavam svoji chybu M5 je vyrazne pomalejsi a u me ktery mam multicore apky je to 1/2 az 1/3 vykonu M4pro -14 jadro ano mam 64GB RAM - GPU umi dat max 48GB - mozna to jde zmenitt rika to llmstudio - mam jeste apku, co umi dedikovat RAM pro GPU, nebo to jde z prikazove radky

+1
0
-1
Je komentář přínosný?

Porovnáváš M4 Pro se základní M5? Asi jako porovnávat Core i3 a i5.

+1
+1
-1
Je komentář přínosný?

zrovna tobe by mohlo s tvym uzasnym 60fps lockem krasnych 50 fps stacit, stejne si toho ani nevsimnes, sekacka jako sekacka

+1
0
-1
Je komentář přínosný?

Já jsem v klidu s opravdickou normální 4070.
Využití GPU i v náročné hře na plný knedlík 40-75%..
Cajk..
Sorry můj projektor víc neumí :)
Mrzí mě to.

+1
0
-1
Je komentář přínosný?

On by ten Spark o moc více stejně nedal.
Na to je moc přiškrcenej a emulace x86 na ARM tomu taky moc nepřidá.

4070 @ 2475 MHz, 200W - 29.15 TFlops (FP16)
5070 @ 2512 MHz, 250W - 30.87 TFlops (FP16)
Spark @ 1665 MHz - 140W - 30~31 TFlops (FP16)

Jak se tomu vede při práci s ML:
Engine Model_Name Model_Size Quantization Batch_Size Prefill_(tps) Decode_(tps) Device
ollama qwen-3 32b q8_0 1 89.74 8.09 Mac_Studio_M1_Max
ollama qwen-3 32b q8_0 1 37.85 6.24 NVIDIA_DGX_Spark
ollama qwen-3 32b q8_0 1 2,841.80 38.35 RTX_Pro_6000_Blackwell_Edition

https://docs.google.com/spreadsheets/d/1SF1u0J2vJ-ou-R_Ry1JZQ0iscOZL8UKH...

+1
0
-1
Je komentář přínosný?

> a emulace x86 na ARM tomu taky moc nepřidá.

Ten Spark má obyčejné Cortexy, tj. bez hardwarové akcelerace emulace x86.

+1
0
-1
Je komentář přínosný?

Ta tzv. hardwarová akcelerace emulace x86. znamená jen pár instrukcí navíc.

+1
0
-1
Je komentář přínosný?

Ale výkon je pak 5násobný. Bez akcelerace 1/8 nativního výkonu, s akcelerací 2/3.

+1
-1
-1
Je komentář přínosný?

Fakt bych chtěl na stejné architektuře vidět test emulace bez a s použitím těch instrukcí.

+1
0
-1
Je komentář přínosný?

Ty počítače jsou venku už roky, takže ty testy jsou. Sami jsme to doma testovali.

+1
0
-1
Je komentář přínosný?

A máš nějaký odkaz?

+1
0
-1
Je komentář přínosný?

Mám to doma v Excelu.

+1
0
-1
Je komentář přínosný?

> na stejné architektuře vidět test emulace bez a s použitím těch instrukcí.

To je nakonec docela jednoduché. Apple Silicon a Snapdragon X Elite vyvíjel stejný tým. Parametry jader jsou velmi podobné, 8 instrukcí za cykl, podobné frekvence, architektura cachí, práce s RAM, ... Ti inženýři odešli z Apple a založili startup Nuvia, který Qualcomm koupil.

A jak to otestovat? Na Qualcommu máš nativní Windows, kde emulátor umí využít speciální podpory pro emulaci. Na Applu pustíš Parallels, v něm nativní Windows on ARM. Ale tam integrovaný emulátor nenajde Snapdragon X Elite, tak použije kód pro obecný ARM procesor (Cortex), který podporu pro emulaci x86 nemá. Tedy nevyužije se ta v Apple Silicon - narozdíl když bys to pustil v Rosetta 2.

+1
0
-1
Je komentář přínosný?

Podobné ale není stejné. Takový argument neberu.

+1
0
-1
Je komentář přínosný?

Našel jsi někdy významný rozdíl? Ti chlapi jeli po paměti.

+1
0
-1
Je komentář přínosný?

Aha paměť je pro CPU důležitá, hmmm to jsem nevěděl, tak proto L1, L2, L3 a někdy i L4 ceche... To jsou jen ty nejvíc viditelné věci.

+1
0
-1
Je komentář přínosný?

Ano 🤗

+1
0
-1
Je komentář přínosný?

Čekal bych u tebe strong memory model, small / big memory.

+1
0
-1
Je komentář přínosný?

Já se nepotřebuju opakovat. Najdi si příslušné vlákno.

+1
0
-1
Je komentář přínosný?

Jediné co jsem opravdu našel, je přepínání paměťového režimu a optimalizace jako pro výpočet x86 flags, ale nic přímo o speciálních instrukcích. Byť ano, jsou to rozdíly proti jiným ARM jádrům. Ale emulaci tak SW zajišťuje Rosetta 2.

+1
0
-1
Je komentář přínosný?

Speciální instrukce se říká pro zjednodušení. Strong memory model je přepínač, který vypne jednu z optimalizací práce s pamětí. Pak je pro SIMD instrukce přepínač, že mohou vracet speciální hodnoty, jako plus mínus nekonečno. Standardně jednotky NEON hodnoty jen oříznou, ale to není kompatibilní s x86. Pro zajímavost, skalární FPU jednotka v ARM umí ty speciální výsledky. Tedy výrobce CPU to stejně má implementované, šlo jen o zpřístupnění pro emulátor. Pak mě ještě napadá bitová maska pro zápis do registrů, protože v x86 můžeš zapsat třeba do dolních bitů a horní nechceš měnit. To má ARM v základu, ale do RISC-V to museli přidat jako extenzi ISA, aby v emulaci x86 nebyly práce s registry série bitových operací.

+1
0
-1
Je komentář přínosný?

Ty 2 přepínače chování (strong memory model a speciální výsledky SIMD operací) jsou technicky "drobnosti", ale díky nim emulátor nemusí vkládat memory barriers pro synchronizaci dat mezi procesorovými jádry a kontrolovat výsledky SIMD operací.

+1
0
-1
Je komentář přínosný?

Tím "drobnosti" mám na mysli to, že už potřebuješ inženýry pro vývoj CPU jader a složité testování. Už nestačí jen licencovat hotová jádra, s dokumentací, jak je zapojit do výsledného SoC.

+1
-1
-1
Je komentář přínosný?

Firem, co opravdu navrhují CPU a neprovádí jen implementaci jader, je stále ještě dost.

+1
+1
-1
Je komentář přínosný?

Ale spousta z nich vyvíjí jen tzv. malá, úsporná, efektivní, pomalá jádra. Napr. RISC-V jádra či ta čínská Zhaoxin a Longsoon.

+1
0
-1
Je komentář přínosný?

Aha a svět mimo ARM neexistuje. Podobné diskuse tady nekončí dobře.

+1
+1
-1
Je komentář přínosný?

Oprav si svou reakci. Já právě poukazuju na svět mimo ARM (RISC-V, Zhaoxin = x86, Longsoon = pokračování MIPS).

+1
-1
-1
Je komentář přínosný?

Tohle uznívám, jenže je dost firem co navrhují CPU komplet a ne jen malá jádra.

+1
+1
-1
Je komentář přínosný?

Jsou firmy, které navrhují malá jádra. Firmy, co dělají velká jádra (těch je jen pár). A nakonec firmy, co poskládají hotová jádra do výsledného procesoru.

+1
0
-1
Je komentář přínosný?

Už se točíš v kruhu.

+1
0
-1
Je komentář přínosný?

Zato ty jsi žádnou konkrétní firmu či jádro neuvedl.

+1
0
-1
Je komentář přínosný?

To zní reálně.

+1
0
-1
Je komentář přínosný?

no vida.. vykopavkovej amd fx zvlada moderni hru v 1080p na 40 fps, nejmodernejsi a nejrychlejsi integrovana grafika nVidie za 4000 usd v 1080p na 50 fps.. kupujte nVidii, je rychlejsi.. ;)

+1
+8
-1
Je komentář přínosný?

to je zavadzanie. cena je "iba" 3999$

+1
+1
-1
Je komentář přínosný?

Ta cena je taky ... zaváděcí.

+1
0
-1
Je komentář přínosný?

Za 3999$ si clovek:

->koupi "NUC" slozene ze Strix Halo a LPDDR5X-8533 v roli 96GB RAM jako zaklad + dolozeni
->koupi DTR-ko zalozene rovnez na Strix Halo(jiz mobilni komplet)
->a nebo si posklada desktop se Zen 5 X3D(od jara 9950X3D2)

Vykon, pokoj a klid..., +to bude zrat jako vino... Zen 7(AM5)...

Intel, Nvidia, Microsoft, denni vojeby, lhani a nekvalita, jeste ze tu mame AMD a Linux.

+1
+2
-1
Je komentář přínosný?

do kamena tesat

+1
0
-1
Je komentář přínosný?

Tohle není věc, kde se počítá s velkým CPU výkonem. Tohle je lokální stroj na ladění modelů, co pak jdou na velké akcelerátory. I proto tam je další port pro spřažení do clusteru (když člověk potřebuje ještě víc paměti), případně levná alternativa velkého železa pro týmy, co si jedou lokální modely, ale nemají využití, co by ospravedlnilo investici do více RTX 6000 Ada, případně dokonce H100.

Pokud člověk musí vyloženě napjatě řešit cenu, případně může DGX Spark nahradit Strix Halo, případně dokonce klasickou GPU + CPU, není zamýšleným klientem DGX Spark a ostatně Nvidia to jasně deklaruje. Víc, než cokoliv jiného, je DGX Spark prostě jen lokální doplněk k velkému železu a výukový nástroj. Pokud to člověk kupuje na běh konkrétních modelů, nejspíš už ví, proč sahá zrovna po DGX Spark a že se mu vyplatí. Pokud to někdo kupuje "naslepo" a jen na základě reklamy... well... dělá sakra špatně.

Jinak DGX Spark na Linuxu běží. Dodávají to s Ubuntu LTS + předinstalovaným toolsetem s tím, že daný toolset testují i pro RHEL (+ klony).

+1
+1
-1
Je komentář přínosný?

Superpocitac Frontier postaveny na AMD technologiich stoji 600 mln USD a cyberpunk na nem nejde spustit vubec. Takze nVidia opet vitezi :-p

+1
+1
-1
Je komentář přínosný?

'' cyberpunk na nem nejde spustit vubec ''

{{citation needed}}

+1
+2
-1
Je komentář přínosný?

https://www.techpowerup.com/gpu-specs/radeon-instinct-mi250x.c3837

Graphics Features
DirectX: N/A
OpenGL: N/A

Board Design
Outputs: No outputs

:-p

+1
0
-1
Je komentář přínosný?

Protože nemá ROP a texturové jednotky. Ale to jde emulovat výpočtem. Např. RPi 3 nemá ROPy, jen přidali do instrukcí GPU takové, které např 4 floaty složí to int32 RGBA, a to se zapíše do (V)RAM.

+1
-1
-1
Je komentář přínosný?

tak ale co by clovek cakal za 3999$ ...

+1
+2
-1
Je komentář přínosný?

Když si vezmu, za kolik jsme v přepočtu kupovali tehdá doma 286tku a 9jehličkovou tiskárnu...

+1
-1
-1
Je komentář přínosný?

Jenže v té době i servery a superpočítače byly cenově úplně jinde.

+1
0
-1
Je komentář přínosný?

Máme se prostě už moc dobře.

+1
-2
-1
Je komentář přínosný?

A proto si lidi tak vymýšlí. Nikdy v minulosti lidi tolik nevěřili konspiracím.

+1
0
-1
Je komentář přínosný?

Stačilo pár let počkat a cena 286 se propadla řádově. Nevim o tom že by se třeba 3090 prodávala dnes za 7t. nová.

+1
+1
-1
Je komentář přínosný?

Ale třeba 3070 už dostal brácha jako vyřazenou.

+1
0
-1
Je komentář přínosný?

Taky sem v té době dostaL zadarmo Didaktik M :-)

+1
+1
-1
Je komentář přínosný?

Tohle má být jako "superpočítač"? :-)

+1
+2
-1
Je komentář přínosný?

Cray 2 by porazil :-)

+1
+1
-1
Je komentář přínosný?

Nedává to smysl ani proti jiným nVidia produktům a to myslím nehernim. A4000 SFF ADA je profi grafika 1500$ (Quadro) s plně funkčním čipem shodným s RTX 4070, navíc s 20GB ECC!!! pamětma , certifikacemi a ovládači pro profi sféru. A to s TDP 70W a low profile format. To znamená podobné tomu co má nVidia v tom křápu když to dám třeba do 4,5 litrové N10 Jonsbo skříně, k tomu flex ATX 300W gold zdroj, low profile Noctua chladič , nejdražší 870 mini itx Asus desku, ECC RAM a třeba 9800X3D v Eco mode s low profile Noctua chladičem, tak získam něco co žere 150W, stojí o 1500$ méně, má vyšší výkon , full ECC, certifikace na profi SW a AI, pořád je to malá krabička 4,5L, takže to vejde do auta nebo průmyslu, tak proč toto

+1
-1
-1
Je komentář přínosný?

Jenže na AI potřebuješ paměť. 20 GB nic není, to je až pak na spouštění výsledného optimalizovaného modelu na herní grafice doma. Když spojíš (maximálně) dvě přes NVLink, tak máš paměti x2, ale rychlost už poloviční.

+1
-3
-1
Je komentář přínosný?

A co Strix halo? Výkon je +- jako 4060, takže podobné, navic model s 128gb RAM umí přiřadit 96gb VRAM. NV link fungoval jen s predchozi generaci, Ada lovelace ho neumí. Stejně tak je výkon ala gf4070/Strix point málo. Paměti sice dost ale tokenů to dává proti 5090 málo. Bavíme se o 4000 dolarů. Porad nevidím ten superpočítač v tomhle produktu. Spíše vidím jen arm-based předražené Strix halo, takže nahovno, respektive pro jisté účely jsou lepší RTX/Ax000 grafiky a pro jiné zas Strix halo

+1
+3
-1
Je komentář přínosný?

Za 4000$ je to shit. 1500$ handheld Strix halo dělá při 45W v CP 2077 ve fullHD a to na ultra detaily 71fps. Tohle 20% ztráta CPU vykonu kvůli emulaci neobhájí https://partofstyle.com/at-1500-the-strix-halo-handheld-delivers-71-fps-...

+1
+2
-1
Je komentář přínosný?

Koukám že nVidia dostává bídu za něco, co neprodává zatím vůbec na hraní... Tak až to vydá v tom herním laptopu, tak začnu soudit.

+1
0
-1
Je komentář přínosný?
+1
+1
-1
Je komentář přínosný?

Připomíná mi to příběh Itania, které mělo nahradit x86. Jenže se ukázalo, že je to shit, tak šlo jen do serverů, kde dožilo.

+1
0
-1
Je komentář přínosný?

Tak ze všech věcí, na který bych DGX Spark nepoužil, je hraní tak v TOP3.

Jinak na lokální ladění modelů asi fajn. Cenovka odpovídá konkurenci (Mac Studio, AMD Strix Halo...), ale navrch dostává člověk celý ekosystém okolo CUDA, takže odpadá řešení závislostí u nasazení, kde vývojáři natvrdo hodili CUDA verze (zpravidla se to dá přemapovat na HIP / ROCm alternativy, ale je to otravné). Zamrzí mizerná propustnost paměti a nedoladěný SW. Každopádně super, že se segment těchto pracovních stanic hýbe.

Jinak kdo nadává na cenu => pořád platí, že plnohodnotná alternativa (3x 6000 Ada) přijde na minimálně 6x víc.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.