Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k ARM v AI serverech netáhne, nezvládá GPU scheduling tak efektivně jako x86

Že by nVidia koupila Intel? 😁

+1
-4
-1
Je komentář přínosný?

A pak ses probudil s rukou v nočníku ;-)

Stačí si vzpomenout, jak a hlavně proč dopadlo jejich laškování s ARMem...

+1
+5
-1
Je komentář přínosný?

Na druhou stranu ...

nVidia dokáže prevzít firmu i bez koupení. Oficiálního.

+1
-2
-1
Je komentář přínosný?

Co si představit pod "méně efektivní scheduling než u standardních x86"?

+1
0
-1
Je komentář přínosný?

gpu maj z velky casti scheduling softwarovej a bezi na cpu.. proste typ zateze, kterej z nejakyho duvodu asi armu nesedi..

+1
+2
-1
Je komentář přínosný?

Protže ARM nikdy nebyl dělaný na HPC zátěž, kdežto historicky veké RISC ano a x86 se jim vždy snažil konkurovat a časem přebíral stejné techniky. ARM se ale dlouho ubítal jinou cestou, začal v levných počítačích a pak se prosadil jako úsporné a levné mobilní řešení. Jeho vývoj tedy šel úplně jinou cestou.

+1
+2
-1
Je komentář přínosný?

Tak to by teoreticky mohlo zvýhodnit Risc-V procesory. Ne že bych věděl o nějakém použitelném. Ale už mě to i napadlo, že se možné někdo odkloní od ARM a zkusí prorazit s Risc-V. Vím, že to je jenom ISA, ale implementace existují a IMHO se je snaží rozvíjet vícero firem, které v tom vidí potenciál.

+1
0
-1
Je komentář přínosný?

OpenPower má větší šanci než RISC-V. RISC-V se jaksi nevyvíjí, jde do něj málo peněz, Power je hotový a ověřený.

+1
0
-1
Je komentář přínosný?

"Protže ARM nikdy nebyl dělaný na HPC zátěž" - urban legend

+1
-2
-1
Je komentář přínosný?

A který přesně, všechny serverové jsou stavěné na Cloud. Jediný HPC nebyl od začátku vyvíjený jako ARM, ale je pokračováním vývoje SPARC řady. A tak jak je řešený, je spíš hybrid PCU a akcelerátoru. Vysoké propustnosti a docela malé cache.

+1
+1
-1
Je komentář přínosný?

Je to pravdedpodobne o tom, ze ARM CPU pouzivane v cloude su optimalizovane na velky pocet jadier/threadov (96/128/192...) a tento task vyzaduje silny single thread. Akonahle by sa pouzili v cloude sirsie ARM jadra (Oryon alebo Apple Mx) padla by tato vyhoda x86 v cloude.

+1
+1
-1
Je komentář přínosný?

Potřebuje silné hlavně ALU.

+1
0
-1
Je komentář přínosný?

Moderne ARMy optimalizovane na ST vykon maju dekoduju 8+ instrukcii naraz, pricom x86 max 6 a v ALU zatazi nijak nezaostavaju, skor naopak.

+1
0
-1
Je komentář přínosný?

Jenže se to netýká těch ARM, které jsou aktuálněm v serverech, tam je maximálně Neoverse V2, nic lepšího. A i ty jsou optimalizované na cloud.

+1
0
-1
Je komentář přínosný?

> Potřebuje silné hlavně ALU.

... citation needed. Proc zrovna ALU ? co konkretne obnasi "scheduling akceleratoru" takoveho, ze na to potrebujeme nevimkolik ALU ?

Ja bych tipoval, ze je problem uplne jinde: PCIe implementace. Bud malo linek, jsou pomale, nebo chybi nejake featury PCIe. Ale to je jen tip, tezko rict, bez dalsich detailu.

+1
0
-1
Je komentář přínosný?

>> Ja bych tipoval, ze je problem uplne jinde: PCIe implementace.

Při návrhu ARM se spolupráci s PCIe nepřikládala velká váha.
Vera (ARM based CPU z platformy Vera-Rubin, nástupce Grace+Blackwell) má problém spolupracovat s GPU jiných výrobců.
Právě kvůli implementaci přístupu k PCIe.
Je to vlastnost ARM.

+1
+1
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.