Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Talos Secure Workstation - tak trochu jiná pracovní stanice s POWER8

8 vlaken na jadro? Takze jestli to dobre chapu, postavili 96ti vlaknovy (rekneme) mrtvy bazmek vuci 12ti vlaknove i7 a bylo to tak sul nul. Teda krom dvojnasobne spotreby ......
A jak znam marketing, tak merili celkovy (nerealny) vykon vsech jader. Kdezto skutecne neco-rikajici vykon je v jednom vlakne, takze hrubou trojclenkou je ta i7 cirka 8x rychlejsi:) Abych zase nekrivdil, pise se o "benchmarcich", pocitam takove ty irelevantni nesmysly typu passmark, geekbench, tututu .... ktere jsou uz dobrych 15 let nicnerikajici. Ale i tak je to celkem bida.
Nejak mi unika pointa (jestli jsem ji prehledl, prosim vysvetlit:) proc kupovat zhruba 10x drazsi procesor, ktery bude mit zhruba 10x nizsi vykon, 2x vyssi spotrebu a nebude to x86, takze stejne s tim budou akorat problemy rozjet spoustu veci.
Chapal bych, ze nekde nejaky zaprcany zapraseny server, na kterem bezi nejaka miliardu let stara SS7 aplikace, kde firma, ktera to vyrobila uz 20 let neexistuje ..... tak to treba chciplo nebo to chcou nahradit hardwarem z tohoto tisicileti a nechcou to vyvijet znova .... to jsem schopen pochopit ..... ale proc by si nekdo kupoval "workstation" s powerPC proboha? PROC?

+1
-24
-1
Je komentář přínosný?

Zajímavé otázky, škoda toho podání ála čtvrtá cenová po třech rumech:
1. Benchmark na webu výrobce je porovnání single thread výkonu POWER8 versus Xeon E3-1270 u kompresního algoritmu LZ4 a hashovacích funkcí. Někde je Xeon rychlejší, někde pomalejší, za podstatné beru, že nejnižší model procesoru má těch vlánek 64, kdežto Xeon osm.
Benchmarkování na webu phoronix.com bylo multithreadové, ale podle použitých algoritmů pravděpodobně zdaleka nejelo přes všechna vlákna a navíc autoři sami říkají, že bez optimalizace použitých knihoven pro POWER to není regulérní výsledek.

2. Pointa nákupu: První důvod vzniku stanice, který uvádí i sám výrobce: jsou lidé, co vyvíjí pro POWER servery a nebaví je mít doma v pracovně rack a v něm server s hlučností boeingu. Tohle bude běžný ATX deska, která v běžném ATX toweru bude i relativně tichá.
Další pointa nákupu: jsou lidé, kteří chtějí otevřený hardware, nebude jich v porovnání se zbytkem světa mnoho, ale prostě jsou. A tohle je aktuálně nejvýkonnější počítač na světě, od kterého bude kompletní dokumentace a zdrojáky.

Stačí to takhle?

+1
+24
-1
Je komentář přínosný?
+1
-5
-1
Je komentář přínosný?

Prečítaj si aj komentáre pod článkom od ľudí, ktorí to reálne využívajú ;)

+1
-5
-1
Je komentář přínosný?

to byl odkaz na alespon nejaky porovnani vykonu s x86, znas jinej?

+1
-4
-1
Je komentář přínosný?

Také porovnávanie nemá zmysel. Je to ako keby si ich porovnával s nejakým AVR: vyhrá ten procesor, ktorému sa najviac prispôsobia benchmarky.

+1
-4
-1
Je komentář přínosný?

ja su vdecnej za jakekoliv poctenicko o archytekturach a nej cist nejaky prezentace a pdf ...
tak jasne, ze power se neda s x86 srovnavat, ze to neni delany na maximalni vykon jednoho cpu, ale spis o vykonu/spolehlivost celku a devitkovym hodnoceni, rozsiritelnost a RAS, neco o cem se muze x86 leda zdat a intel se tam snazi propasovat s jejich xeonama e7, ale stale to jeste neni ono ... atd ...
stejne tak jak v diskuzi pod tim clankem je odkaz na oracle a jeho porovnani sparcu s power/x86, taky jim ty testy vychazely nejlepe pro jejich kone :)

+1
0
-1
Je komentář přínosný?

ew...

"ze to neni delany na maximalni vykon jednoho cpu"

ono to práve je robené na výkon jedného cpu respektíve jadra. inak by nešaškovali s MCM a SMT8 (ktoré zaberá značnú časť jadra), ale zrobili by niečo ako x malých grafík... ale to len tak mimochodom ;)

"odkaz na oracle a jeho porovnani sparcu s power/x86, taky jim ty testy vychazely nejlepe pro jejich kone :)"

Tu ale ide o to, že SparcM7 je viac ako raz tak väčší, ako konkurencia:

12 jadrový POWER8: 4mld. tranzistorov
18 jadrový Xeon: 5,5mld
32 jadrový SparcM7: 10mld. tranzistorov

+Sparc má pár akcelerátorov na databázy tak ako Intely na multimédiá (x265). A predpokladám, že v ich benchmarkoch testovali asi skôr tie databázy, ako nejaké konvertovanie videa a 7-zip obmedzený na jedno vlákno.

+1
+1
-1
Je komentář přínosný?

1) Nevim jak funguje LZ4, ale hashovaci funkce jsou zcela neparalelizovatelne sekvencni vypocty a u univerzalniho CPU zavisi defacto jen na GHz. Proto treba v geekbencu porazi lowendovy arm, desktopove procesory:) BTW, to je ten duvod, proc takove benchmarky naprosto neuznavam.
Navic je to RISC, takze bude vice zavisly na tech GHz nez "slozitejsi" procesory, zvlaste u komplexnejsich uloh. A taky je tu to, ze to ma 8x vice "jader", ale jen o neco malo vetsi spotrebu (divam se, ze ta i7ka ma 140W) ...... takze bych cekal, ze to bude mit celkovy hruby vykon stejny, cili na jedno vlakno bude ten vykon mizerny.

2) Taky jsme meli alphu, ale nikdo ji nemel u stolu:o) A nikdo by ji ani nechtel. Ted se vyvyji pro linuxove servery, no a myslis, ze tu ma nekdo ..... no, par lidi linux ma ..... ale myslis, ze tu ma nekdo 8mi procesorovy desktop? Dela se to vzdalene. Na desktopu mit powerpc, proc? Budes tam davat nejaky OS (hadam, ze linux tezko, my tam na tech par pohrobcich mame tusim solaris nebo jeste nejakou vetsi hruzu), nebude tam ani zadny prohlizec, graficke prostredi .... proste nekde ve vimu budes sedet a neco programovat ... neni lepsi byt pripojeny k takove sracce nekde z venku a poslouchat si u toho na pozadi aspon MP3?:o)
Otevreny HW, no tomu neverim, ze by to bylo pro nekoho kriterium, ale budiz ...... furt a porad to ale neobhajuje ten "workstation" .... jako nejaky zapadly server, ktery je potreba nahradit, budiz ... ale na powerpc uz dnes nikdo nebude vyvijet novy SW .... a to to jeste mit jako desktop, promin ale to mi "DOES NOT COMPUTE":o)

+1
-3
-1
Je komentář přínosný?

"BTW, to je ten duvod, proc takove benchmarky naprosto neuznavam."

Takze benchmark ktery dava vysledek ktery nesedi do tveho vnimani sveta, staci neuznavat ? ja myslim ze zbytecne marnis cas v IT, je treba se dat na politiku...

+1
+4
-1
Je komentář přínosný?

Kdybys nebyl uplny hlupacek, tak sis precetl i tu vetu predtim ".... CPU zavisi defacto jen na GHz. Proto treba v geekbencu porazi lowendovy arm, desktopove procesory", kde je vysvetleni proc ty benchmarky neuznavam ..... odpoved: protoze jsou k nicemu!

+1
-8
-1
Je komentář přínosný?

Takže frekvencia nie ale "instruction level paralelism" skrz širokú FPU a rôzne DSP áno?

+1
0
-1
Je komentář přínosný?

A tobě přijde reálné aby ARM s TDP asi 4W měl podobný výkon jako x86 s 80W TDP? Na srovnatelném výrobním procesu?

+1
-4
-1
Je komentář přínosný?

A tebe príde reálne, aby mal 100W Xeon lepší výkon ako 250W POWER8?

Proste sa jedná o iný benchmark testujúci inú časť/vlastnosť procesora. A v niektorých prípadoch môže byť low power ARM skutočne výkonnejší, ako 90W Skylake, najme ak tam netreba ILP a viac závisí na skutočnej serializácii (teda inštrukcia čaká na výsledok predchádzajúcej) kde je výhoda na strane kratšej pipeline.

Skrátka také benchmarky treba správne interpretovať.

"Navic je to RISC, takze bude vice zavisly na tech GHz nez "slozitejsi" procesory, zvlaste u komplexnejsich uloh."

Toto je už dávno prežitok, pretože:
1) "zložitejšie" operácie trvajú spravidla viac cyklov (iné sú zreťazené, ale to je ďalšia kapitola)
2) všetky x86 procesory sú vlastne RISC86 s prekladačom inštrukcií. Napríklad add r0, [mem] sa preloží na load a add, teda typicky RISC inštrukcie
3) RISC procesory majú rovnakú paletu rozšírení, ako CISC. Dokonca aj počet inštrukcií je podobný, takže šanca, že bude na "komplexnejšiu úlohu" dedikovaná inštrukcia je v CISC aj RISC rovnaká.

btw.: dnes existuje už asi len jeden čisto CISC procesor, ostatné šli buď smerom RISC, alebo VLIW.

"A taky je tu to, ze to ma 8x vice "jader", ale jen o neco malo vetsi spotrebu (divam se, ze ta i7ka ma 140W) ...... takze bych cekal, ze to bude mit celkovy hruby vykon stejny, cili na jedno vlakno bude ten vykon mizerny."

Nemá 8x viac jadier, má SMT8 :D

A výhody SMT neuvidíš v úlohách, kde sú dáta k dispozícii okamžite, ale kde je viac vlákien a na dáta sa musí čakať.

+1
+5
-1
Je komentář přínosný?

„A tebe príde reálne, aby mal 100W Xeon lepší výkon ako 250W POWER8? "

Ano. Procvič si základy matematiky. 100W vs. 250W je hodně odlišné od 4W vs. 80W.

+1
-2
-1
Je komentář přínosný?

Ty si uvedom, že na zložitejšie problémy nemôžeš aplikovať matiku, ktorú ťa učili na základnej. (si tie dvojice čísiel dal do pomeru predpokladám).

Ale o tom som už písal príspevok vyššie, očividne to ale nemalo význam.

+1
-1
-1
Je komentář přínosný?

Chápu co ses snažil sdělit, ale mnou uvedený nepoměr je až moc velký na to, aby ARM v čemkoliv vyhrál. Chápu, že 100W CPU na přibližně srovnatelném procesu může v něčem porazit 250W CPU na podobném procesu, ale u toho ARMu jsem uvedl 20x nižší spotřebu. Instrukční sady to nemohou ovlivnit (u kvalitních benchmarků), protože oba CPU jsou moderní a úmyslné nevyužití potenciálu jednoho z CPU znamená nereálné výsledky.

Prosím konkrétní ARM s TDP cca 4W co v jakékoliv REÁLNÉ úloze (ne z prstu vycucané číslo z nekvalitního benchmarku) porazí dvoujádrový-čtyřvláknový skylake@4,4GHz (cca 80W) nebo čtyřjádrový-čtyřvláknový skylake@3.8GHz (cca 80W) nebo čtyřjádrový-osmivláknový skylake@3,6GHz (cca 80W).

+1
-1
-1
Je komentář přínosný?

Nechápeš že 512bit FPU zaberie viac plochy ako 64bit? Teda aj spotrebuje viac energie. Rovnako aj ostatné akcelerátory a issue logika k nim. Celkovo tak jedno 4W ARM jadro zaberá len zlomok toho, čo zaberá taký Haswell (čísla ti nedám, ak chceš tak si to nájdi).

A ide o to, že celá tá plocha navyše je tam nanič. Len mŕtva váha ktorá spotrebuje energiu, pretože sa testuje napríklad len kvalita out-of-order enginu. Preto keď už chceš porovnávať pomer medzi tými spotrebami, tak by si mal odrátať spotrebu toho navyše (čo je samozrejme tak nejak nemožné :D )

Tak isto porazí 100W procesor 250W. Stačí nevyužiť niečo, čo ten 250W má ale 100W nie (SMT8 napríklad). Tak ale ten rozdiel taký veľký nieje pretože tie čipy sú už podobne veľké.

"protože oba CPU jsou moderní a úmyslné nevyužití potenciálu jednoho z CPU znamená nereálné výsledky."

wtf.: a opäť. Testy až fetišisticky založené na šírke FPU sú OK? Pretože to zase ja nepovažujem za test. Na to, aby som vedel ktorý procesor bude mať aké výsledky v takom Cinebenchi ich nepotrebujem testovať. Stačí ak sa pozriem do charakteristík na to, ktorý má širšiu FPU, a hneď viem aký výsledok budú mať. Schválne si to porovnaj na desktopových procesoroch:
Buldozer - 128bit/jadro
Sandy/Ivy - 256bit/jadro
Haswel/Skylake - 512bit/jadro
Nevidíš žiadnu koreláciu s výsledkami tých tvojich obľubených benchmarkov? A to je podľa teba reálne testovanie? (ešte dodám že 512bit nieje 2x výkonnejšie ako 256bit jednak preto, že tam nedali dvojnásobok portov, a jednak to asi tak nejak naráža na power target)

"Prosím konkrétní ARM s TDP cca 4W co v jakékoliv REÁLNÉ úloze"

To je dobrá poznámka, ale zabudol si, že s tým 4W ARM si prišiel ty. Výkonne ARM majú reálne 10-20W a napadá ma len málo úloh, kde by 4W ARM porazilo Skylake.

Ale tým som ťa už nechcel zaťažovať pretože evidentne nielenže nečítaš, čo napíšem ja, ale ani to čo píšeš ty sám :D

+1
-3
-1
Je komentář přínosný?

Kličkuješ jak malý kluk. S tím 4W ARMem jsem přišel já a BTJ (on napsal „lowendovy arm"). Tys na to pak začal reagovat a moc dobře si věděl, že reaguješ na 4W ARM-lowendovy ARM a ne 10-20W výkonný ARM, co sis v posledním příspěvku vycucal z prstu. Projdi si diskuzi a trapně se nevymlouvej.

+1
-1
-1
Je komentář přínosný?

Ty mi teda dávaš :D

Nikde nekľučkujem. To som spomenul len tak mimochodom... Pretože to môže byť celkom jedno. :D

Ide o to, že sú testy zamerané na kvalitu out-of-order enginu na neparalelizovateľnej úlohe. Tam bude 4W ARM kľudne nad 80W Intelom pretože tam je úplne jedno, akú má šírokú FPU alebo aký má počet pipeline. Bude tam lepšie proste preto, že má jednoduhší dekóder a kratršiu pipeline.

Inak určite som nikde netvrdil, že to je jediný správny test procesorov, a iné by sa nemali používať, tak čo ťa ser*e?

Radšej prestaň kľučkovať ty sám, a povedz aký zmysel má to, že si všetky benchmarky honia na šírke FPU? Totiž ak sa pozriem napríklad na recenzie na ehw, tak je tam každý jeden benchmark založený buď priamo na FPU, alebo na nejakom akcelerátore. Nie len niektoré. Každý jeden je založený na ILP a teda v ňom vedú procesory, ktoré majú správnu konfiguráciu prostriedkov.

Toto je podľa mňa ale test kvality FPU a DSP ktoré tam napchali. Ale o návrhu procesora ti to nič moc nepovie. To, ako je procesor navrhnutý zistíš len tak, že vplyv týchto vecí navyše zanedbáš.

+1
-2
-1
Je komentář přínosný?

Testy na exhw se mi nelíbí z jiného důvodu - testování na zastaralém nebo úmyslně silně singlethread SW, ale to teď řešit nebudem.

K té tvojí kvalitě out-of-order enginu na neparalelizovatelnej úloze. Vážně to udělá tolik, že x86 s frekvenčním náskokem cca 2GHz bude poraženo ARMem z mobilu? Kvůli jednoduššímu dekodéru a kratší pipeline? Klidně uznám svojí chybu, ale zatím je to pro mě nepředstavitelné. Předpokládám, že jednoznačné důkazy zatím neexistují.

+1
0
-1
Je komentář přínosný?

V nedávné historii byly úlohy, kdy 800MHz PowerPC G4 s 10-stage pipeline poráželo 2GHz Pentium4 s pipeline 31 kroků dlouhou. Pochopitelně nebyly to všechny úlohy, ale kdyby se na nich šikovně založil benchmark... :-)

+1
-1
-1
Je komentář přínosný?

"Nevim jak funguje LZ4, ale hashovaci funkce jsou zcela neparalelizovatelne sekvencni vypocty a u univerzalniho CPU zavisi defacto jen na GHz."

Normální člověk by řekl, že v reálu má na tenhle typ žonglování s bity mnohem větší vliv dobrá podpora instrukčních sad, ale to vy samozřejmě nejste. :)

+1
-1
-1
Je komentář přínosný?

BTJ: prosímtě přečti si nejdřív jak ten multivláknový režim na Power8 funguje než začneš plácat takové hovadiny.....

" Single-threaded jobs would not see the other threads, and they would performance worse on machines with SMT, so there is always a bit of a balancing act. Luckily, most modern implementations of SMT allow for users to turn it on and off, and with the Power8 chips, it can be dynamically changed as applications, middleware, and databases require."

+1
+3
-1
Je komentář přínosný?

:-)
BTJ je nervózní, protože se ve článku nezmínilo, jak na tomto stroji skvěle běhají Win10 a že Win10 jediné dokáží přinutit HW k maximálnímu výkonu, ... bla, bla, bla. Prostě není to stroj pro Windows = není vůbec k ničemu a nemá právo žít.
:-)

+1
+16
-1
Je komentář přínosný?

Tak kazdy x86 stroj je pro windows a kazdy nex86 stroj to nema co delat:o)
The PowerPC versions of Solaris, OS/2, and Windows were discontinued after only a brief period on the market. Only on the Macintosh, due to Apple's persistence, did the PowerPC gain traction.
Myslim, ze to mluvi za vse, kdyz tu platformu pred 20ti lety vsichni zarizli (takze ano, W10 na tom nebezi, jenom 20 let stare NTcka) ..... to, ze to jeste preziva dodnes je celkem zahadou ..... nebo asi takovou, jako stale preziva ZX spectrum .... ale to neznamena, ze by to stalo za rec ..... da se to vysvetlit par staryma serverama, kde se jim nechce portovat SW a novy nikdo vyvijet nebude, ale proc na workstation, to opravdu nechapu ...

P.S.: ze vsech tech v historii podporovanych systemu, krom applu, ktery by na tom samozrejme nejel, kdyz to neni specialni cip od applu, tak asi jediny vzdalene desktopove pouzitelny system by byly prave ty windows NT ... vim, ze v solarisu je problem zkopirovat blby soubor, takze hadam, ze tam nejake graficke rozhrani s webovym browserem asi nebude:o)

+1
-12
-1
Je komentář přínosný?

"vim, ze v solarisu je problem zkopirovat blby soubor, takze hadam, ze tam nejake graficke rozhrani s webovym browserem asi nebude"

ehm, no OK. Ta poznamka o politice vejs byla celkem trefna...

+1
+5
-1
Je komentář přínosný?

Ad PS: Pche, tak tos neviděl OS X na Power platformě. Oproti NT úplně jiné kafe. :-) Ty procesory byly stejně speciální od Applu jsou jsou dnešní Intely. Takže normální sériové procesory. To že se teď v posledních asi 4 letech pustili do tunění ARMu s tím nijak nesouvisí.

No nic, stejně je to od tématu

+1
-1
-1
Je komentář přínosný?

Chlapce, ty vis o solarisu (a pravdepodobne o vsech newindows systemech) uplne kulovy. Prekvapine kopirovani souboru je na solarisu stejny, jako na kazdym normalnim unixu... nebo pro ty neznalejsi jako ses ty.. jako na linuxu ;)

+1
-1
-1
Je komentář přínosný?

"Zatímco v serverech, zejména v těch velkých, ještě přetrvává alespoň náznak diverzity"

V serveroch nieje žiadna diverzita. HPC - Intel AMD a Nvidia (a custom asic, samozrejme), malé servery (databazy, web...) rovnako x86 a veľké servery (veľká databáza kde sa vyžaduje napríklad aj koherencia, zabezpečenie a podobne, napríklad banky) IBM a Oracle. Tak nejak je to rozdelené ale tie procesory si nekonkurujú, pretože taký POWER8 napríklad nieje stavaný na HPC takže v tom ani Xeonom konkurovať nemôže, rovnako ako Xeony nemôžu byť nasadené v high-end databázových serveroch.

Tá "recenzia" na andatechu a všetky ostatné, ktoré sa ich snažia porovnávať s Xeonmi sú úplne mimo. Xeony sú totiž celé roky vyvíjané na to, aby také benchmarky drvili. Majú širokú FPU ktorú dokáže utilizovať jediné vlákno, majú tony akcelerátorov na video, render atď. POWER8 ale väčšinu z tých vecí nemá.

Na druhej strane POWER8 má lepšiu pamäťovú priepustnosť a napríklad CAPI (a neskôr Nvlink). Tak rozmýšľam, prečo neotestovali aj toto?

A aby som nezabudol, cena. POWER8 už dávno nieje nejaká bájna architektúra s cenou niekoľkokrát vyššou ako x86! Áno, táto doska stojí 3100$ ale je to vecou toho, že to je nízkonákladová záležitosť. Reálne ale 10 jadrový POWER8 stojí okolo 1500$! To je toľko, koľko by mal stáť 10 jadrový i7. Na druhej strane sú tu ale Xeony e7 za 7-8000$!

+1
+3
-1
Je komentář přínosný?

milý Dolane.. jde vidět že jsi v zivotě neviděl Mainframe

+1
-7
-1
Je komentář přínosný?

No jasné :D

+1
-1
-1
Je komentář přínosný?

Nemůžu se ubránit tomu, že pokud počítače popsané v druhém odstavci komentáře označím jako "servery", pak je v serverech slušná diverzita.

+1
-3
-1
Je komentář přínosný?

Filozofická otázka, či sa to všetko dá označiť ako servery? :D

Ale aj tak, to akú architekturú použiješ je určené tým, kam ten server smeruje, nie tým, že máš na výber viac možností.

+1
-2
-1
Je komentář přínosný?

Pokud jde o velky databaze, tak tam se pouzivaj bezne jak Xeony a tak Sparcy. Takze minimalne tam na vyber porad je, i presto, ze Xeony postupne Sparcy vytlacujou...

+1
-5
-1
Je komentář přínosný?

ehm .. ale ano .. a potom sa divim, ze zakaznik chce "enterprise a business critical" - aplikaciu (erp a obchodny system) na wintel a mssql platforme .. a este sa cuduje ze pri poziadavke na "vaic ako 4 deviatky" to nestoji par stovak .. :(

+1
-3
-1
Je komentář přínosný?

Rec byla o velkych databazich. U me konkretne tradindovy a bankovni systemy. Tam vladne Oracle, Sybase ale i ten MS SQL.
Tam se o cenach ani nema smysl bavit....

+1
0
-1
Je komentář přínosný?

Pročítám si https://cs.wikipedia.org/wiki/Pracovn%C3%AD_stanice a nějak nechápu, proč autor naznačuje, že kompy postavené kolem POWER za workstation považovat lze a kompy postavené kolem x64 nikoliv. Jako majitele kompa s dvojicí 2687W v2 mě to zajímá, abych lidem nelhal když jim říkám, že mám workstation ;-)

+1
-2
-1
Je komentář přínosný?

Autor něco takového naznačuje? Může mu být sděleno, kde? Autor měl dosud totiž pocit, že psal článek o tom, že po letech, kdy se vyráběly pouze x86_64 stanice je tu první na jiné architektuře. Že z toho někdo pochopí přesný opak by autora nenapadlo ani ve snu.

+1
+3
-1
Je komentář přínosný?

Je pravda, ze pokud si clovek neprecte poradne perex, tak je prvni veta clanku dost zavadejici...

+1
-3
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.