Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Nvidia zdražila DGX Spark z $3999 na $4699

"nVidia, na rozdíl od AMD, nebude své produkty zdražovat."
-- Huang Jen Jsem Lhal

... pouze jim upraví cenu.

+1
+10
-1
Je komentář přínosný?

Tak logicky, když jim to rvou z rukou tak, že nestíhají dodávat na trh.

+1
+2
-1
Je komentář přínosný?

Tak kurva Huang chce iba nahrabať viacej, vzhľadom na to, že Samsung vyrába LPDDR5X pamäte a patrí medzi ich najväčších producentov. Takže si ich vlastne sám sebe "predáva" za vyššiu cenu. Kto by nevyužil situáciu na trhu na vyššie marže.

+1
-3
-1
Je komentář přínosný?

"Tak kurva Huang chce iba nahrabať viacej.."
.. a co cekas..to je jedine na cem mu v zivote asi jeste zalezi :)

+1
-1
-1
Je komentář přínosný?

hmm, ked zariadenie, ktore ide na pol zrde, a dodava polovicny vykon
https://videocardz.com/newz/john-carmack-says-nvidia-dgx-spark-runs-at-h...
dokaze zdraziet, a firmy to kupia, to uz skladam vymysleny klobucik nad urovnou blbosti zakaznikov

+1
+1
-1
Je komentář přínosný?

A co jiného si můžeš koupit? Apple má sice víc VRAM, ale menší výkon, a AMD má o hodně menší výkon. Plus nejsou oficiální CUDA.

+1
-3
-1
Je komentář přínosný?

AMD s strix halo bude mat trosku mensi vykon, ale vseobecnejsie pouzitie...sa uvidi, o par tyzdnov

+1
+1
-1
Je komentář přínosný?

Snad to nedopadne jako minule.

+1
0
-1
Je komentář přínosný?

Po vydání byly nabízeny krabičky se Strix Halo.
32 GB od $1200
64 GB od $1500
128 GB od $2000

Ale některým to přišlo drahé, protože to nemá CUDA. Oficiálně.

+1
0
-1
Je komentář přínosný?

Ono to má taky zlomek výkonu a špatnou softwarovou podporu. Jednička je CUDA a dvojka Metal (Apple). AMD ROCm ani nejede ve Windows, jen v Linuxu (ve Windows v podobě WSL2).

Mimochodem zkusil jsem ROCm na svém APU a moc nefunguje. Oficiálně jsou podporované jen asi 3 karty, z toto jedna serverová.

+1
-2
-1
Je komentář přínosný?

>> Ono to má taky zlomek výkonu

14.85 TFLOPS vs 13.13 TFLOPS

+1
0
-1
Je komentář přínosný?

Situace uz je o dost lepsi, ofiko podpora je pro RDNA3 a RDNA4 vykonnejsi radu + Instinct a novejsich Radeon PRO. Z APU je Ryzen AI 300 Strix + Ryzen AI MAX+.
Konkretne https://rocm.docs.amd.com/projects/install-on-linux/en/latest/reference/...
U starsich generaci je to bohuzel ruzne a je potreba pouzivat starsi ROCm verze. I vykon uz se lepsi.
Jinak existuje i ZLUDA pro CUDA apky na nonVidia grafikach:
https://github.com/vosen/ZLUDA
Nevim co mas za problem, ale doporucuju Ubuntu 24.04.3 (cerstve je i 4) a samozrejme podporovanou kartu.

+1
-1
-1
Je komentář přínosný?

Já samozřejmě nainstaloval načisto přesnou verzi Ubuntu. Ale později jsem to už nezkoušel, takže nevím, o kolik se to zlepšilo. A když bych kupoval nový notebook, tak bych hardware vybíral na výpočty na GPU a AI a na základě zkušenosti znovu neriskoval.

+1
+1
-1
Je komentář přínosný?

Myslím, že v tomto článku je lepšie zhodnotené, načo sa DGX Spark hodí a načo nie, hlavne po januárovej aktualizácii.
https://medium.com/data-science-collective/i-was-ready-to-return-my-dgx-...

+1
0
-1
Je komentář přínosný?

lol.. medium..

'' Here’s the thing I didn’t understand in October: I was evaluating the Spark like a GPU.

It’s not a GPU.

The DGX Spark is a capacity play, not a throughput play. It’s not trying to generate tokens faster than your RTX 5090. It can’t. The memory bandwidth physically won’t allow it. What it can do is hold entire models that would crash your 24GB graphics card. A 120B parameter model in NVFP4 fits in memory. Try that on an RTX 5090.

But I only understood this after the January update forced me to rethink everything.

The Verdict: A Platform, Not a Product
The DGX Spark is the most misunderstood piece of hardware in AI right now.''

to zni jak povinna sebekritika za komousu.. damage control od nVidie jak vysitej.. ((:

a reakce v diskusi tomu odpovidaj:

'' Until the support for vLLM is in a place, where it actually leverages NVFP4 fully without the community needing to hack dependencies together, I would advise people to be cautious. Many blackwell optimisations are also not possible due to GB10 being based on sm121. ''

'' Subject: Your 5,000 words won't hide the painful truth about NVIDIA’s artificial scarcity
To the Author,
You’ve written 5,000 words, but they cannot cover up the painful truth. The "man in the leather jacket" has disappointed us once again. He is simply a master of managing the politics of scarcity. Every RTX card could easily have more VRAM, but they don't because he won't allow a collision with $100k enterprise cards.
Returning to the Spark and your article: I don't know what you need Nvp4 for, but it’s not for anyone serious. The scale of hallucinations statistically blurs every third response. Researchers and scientists need FP16—or, in cases of extreme budget constraints, 8-bit.
This "champagne gold" hardware will never handle that for obvious reasons: a 273 GB/s bandwidth. No amount of marketing talk or "January updates" will turn a lie into the truth.''

+1
0
-1
Je komentář přínosný?

Dík za shrnutí. Před přečtením článku jsem skoro myslel, že je to něco jako Rentable Units od Intelu a January Update odemkl např. širší sběrnici 😆

+1
0
-1
Je komentář přínosný?

Cina ma pameti za stare ceny, ale jen pro Cinske firmy, Allibaba vyrabi novou krabicku na AI a tu bude prodavat, cena bude NIZSI a tim vas vschny prevalcuji ;-)

+1
-1
-1
Je komentář přínosný?

Že se to zatím nikdy nepovedlo. Navíc by dávalo smysl takovou zázračnou krabičku (bohužel bez použitelných ovladačů) prodávat jen v Číně a nevyvážet.

+1
0
-1
Je komentář přínosný?

vypocetni vykon ma velmi slusny, ale pro pouziti v LLM to zabiji nizka pametova propustnost. Stavajici Mac studio bylo ve vetsine LLM inferenci rychlejsi, nova M5 jej zabije uplne.

+1
0
-1
Je komentář přínosný?

Smutný je, že inženýři nVidie by možná chtěli nabídnout dobrý produkt, ale kožená bunda to nedovolí kvůli segmentaci trhu. Dojede na to.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.