Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Potvrzeno, Zen 4 je optimalizován pro „vícejádrové IPC“

IPC sa ale meniť nemôže pri prepnutí so Single na multicore

IPC je technický parameter a je pevný

Mení sa len pozorovaná hodnota aktuálne využitej časti IPC a tá sa mení so SW a s využitím jadier

+1
-5
-1
Je komentář přínosný?

Tak nám tu hodnotu IPC prosím prozraďte když je pevná.

+1
+1
-1
Je komentář přínosný?

To je opět slovíčkaření. IPC se udává pro každou instrukci zvlášť a pro některé instrukce je to proměnné podle zadání.
To o čem se mluví v článku je průměrné IPC a to ještě pro konkrétní set výpočtu. Pokud pominu tu nepřesnost v označení, tak je to v článku správně a průměrné IPC opravdu může vycházet pokaždé jinak.

+1
+7
-1
Je komentář přínosný?

Udajte procesor a zstíte IPC

pre Zen3 je to
+4 nové jednoduché + 2 ešte nedokončené zložité
na jadro. Čiže IPC Zen3 je 6
https://digitalmasta.com/wp-content/uploads/2022/04/AMD-Zen-3-vs-Zen-4-3...

max. zverejnené využitie toho IPC je 4,25, tuším pri jadre Zen2,
teda ešte bolo možné iba zemnou podporných mechanizmov v CPU zvýšiť IPC o 41,17%

+1
0
-1
Je komentář přínosný?

IPC se mění, pro každou aplikaci může být jiné.

The number of instructions executed per clock is not a constant for a given processor; it depends on how the particular software being run interacts with the processor, and indeed the entire machine, particularly the memory hierarchy.

https://en.wikipedia.org/wiki/Instructions_per_cycle

+1
+1
-1
Je komentář přínosný?

To je trochu nešťastné používať wiki ako jediný zdroj.
lebo toto je pozorované IPC a to má ďaleko od technologického IPC dokonca ani kód

.A:
NOP
JMP .A

nedá technické IPC pri prvom zbehnutí a už vôbec nie

.A:
INC LAX
JMP .A

+1
0
-1
Je komentář přínosný?

Asi máte na mysli maximální teoreticky dosažitelné IPC na daném CPU. Ale to nemá s praktickým využitím moc společného.

+1
+1
-1
Je komentář přínosný?

>Ale to nemá s praktickým využitím moc společného.

Samozrejme, že nemá.

+1
-1
-1
Je komentář přínosný?

IPC je naozaj vlastnost kombinacie SW + HW. Pretoze ak budem mat instrukcie, ktore su na sebe zavisle (napr. jedna instrukcia pouziva vysledok vypocitany druhou, alebo zapisuje do rovnakeho registra, ako prva) mozem mat moznost vykonat aj 40 instrukcii paralelne, ale ta druha musi do istej miery pockat na to, kym sa ta prva nedokonci. Zalezi potom na roznych mechanizmoch v procesore (register renaming, ....) ktore z tychto pripadov ide eliminovat.

Co sa da uvadzat je superskalarnost procesora, vacsinou sa uvadza pocet ALU, LSU atd. a sem-tam sa uvadza sirka dekodera instrukcii. To cislo 4,25 uvadzane vyssie je IMHO priemerny pocet instrukcii, ktory dokaze dekoder instrukcii dekodovat za jeden takt. To cislo je prakticky skor obmedzene velmi nestastnym navrhom architektury x86, nez konstrukciou procesora. Zvysenie vykonu fetch stage by znamenalo brutalne zvysenie energetickych narokov, kedze akykolvek paralelny fetch v podstate znamena bruteforce hladanie v bytestreame programu. A obcas sa ten fetcher sekne (zacne spracovavat nieco, co vyzera ako instrukcia, ale v skutocnosti je to vnutro predoslej instrukcie) a potom sa cela ta praca musi zahodit.

To o com sa tu my bavime vo forme "Procesor A ma o X% vyssie IPC ako I" su len pomery casov behu programov, pretoze:
1) typicky sa to IPC netestuje na fixnej frekvencii, ani sa neprepocitava ako IPC/1GHz. Cize presnejsi nazov by bol skor "IPT - Instructions per time". Pocet "clockov" je tu totiz premenlivy.
2) Nevieme ani jeden z udajov, ktore by sme na vypocet IPC potrebovali

To, co sa tu AMD snazi povedat je zrejme o tom, ze optimalizovali vyuzitie sharovanych resourcov medzi dvoma threadmi na jednom core. Multi-threading sa v podstate robi tak, ze sa na jedno napakovane superskalarne jadro zavedie druha pipeline, ktora superi o zdroje s tou prvou (a v pripade prvych HT Pentii obvykle pri supereni druhe vlakno zlyhalo a malo ovela mensi vykon, ako to hlavne). Moznosti ako to riesit je viacero, od zvysenia stupna paralelizmu jednotiek na uroven, kedy jedno jadro je v podstate napakovane tak, ako dve single-threadove az po nejaky kooperativny scheduling instrukcii, kedy hlavny a vedlajsi thread vedia, co sa kde bude spustat a instrukcie preusporiadaju nie tak, aby bol maximalny ST vykon, ale aby sa dve vlakna v ramci jadra moc nebili o zdroje.

+1
0
-1
Je komentář přínosný?

K bodu "1) typicky sa to IPC netestuje na fixnej frekvencii, ani sa neprepocitava ako IPC/1GHz...":
IPC se právě používá k porovnání výkonu při stejné frekvenci. I v článku je vidět, že v grafech jsou frekvence všech cpu fixně na 3.6GHz. Jinak máte pravdu, že není důležitá absolutní hodnota, ale jde o relativní porovnání.

+1
0
-1
Je komentář přínosný?

Este v dobach takeho ZX Spectra (Z80A) boli v priruckach pri instrukciach uvedene pocty cyclov. Napr. taky PUSH HL mal myslim 11 taktov, takze sme boli happy ze 1 bajt sme vedeli zapisat za 5.5 taktu.
Ale odvtedy sa veci skomplikovali pipelineningom, superskalarnostou a out-of-order execution. Takze prepocitane, naozaj za 1 clock moze byt dokoncenych viac instrukcii.
Stale podla mna plati, ze ziadna samotna instrukcia sa nikdy nevykona za menej nez 1 clock cycle - na to tam tie hodiny su. T.j. vyraz IPC (instructions per clock) je skor nejaky synteticky ukazovatel "zdravia"/fitnesu danej architektury v konkurencnom prostredi a zalezi aj od typu zataze. T.j. IPC = vykon/frekvencia.

https://stackoverflow.com/questions/692718/how-many-cpu-cycles-are-neede...

+1
+3
-1
Je komentář přínosný?

>instructions per clock

instructions per cycle

Ale inak správne

+1
0
-1
Je komentář přínosný?

když už chceš být přesný, tak je to "instructions per clock cycle", jinak obě výše uvedené spojení se používají pro to samé.

+1
+3
-1
Je komentář přínosný?

OK

+1
0
-1
Je komentář přínosný?

IPC jako zkratka pro "instructions per clock cycle" se uz davno v tomto pojeti nepouziva, protoze nemas jen jednu instrukcni sadu, atd.
Dneska je to v podstate vykon v urcite tride aplikaci pri "fixni" frekvenci.

+1
0
-1
Je komentář přínosný?

A preto píšem

>Čiže IPC Zen3 je 6
>max. zverejnené využitie toho IPC je 4,25, tuším pri jadre Zen2,

+1
0
-1
Je komentář přínosný?

Pokud porovnáváš různé implementace téže samé instrukční sady, což je případ tohoto článku, tak je to použití vcelku na místě. Pokud ovšem odhlédneme od té nepřesnosti v pojmenování. Možná by NoX mohl udělat nějaký kratičký článek, kde by uvedl význam jednotlivých (sporných) zkratek a pojmenování, tak jak je chápe on ;-) , aby nedocházelo k omylům.

+1
+1
-1
Je komentář přínosný?

Otázka, ktorá skratka nie je sporná :))

+1
0
-1
Je komentář přínosný?

TLA - three letter acronym

+1
0
-1
Je komentář přínosný?

TLA - ten letter acronym ?

+1
0
-1
Je komentář přínosný?

Aneb trik XOR A. :-)

+1
0
-1
Je komentář přínosný?

Pozor A= A xor A je na moderných CPU asi 3x rýchlejšie ako A=0

+1
-1
-1
Je komentář přínosný?

Toto tvrdenie plati, ak za moderny CPU budeme povazovat aj 8086.

+1
0
-1
Je komentář přínosný?

osobný test
Dell Vostro 3300

Servisný tag: G1DY5N1
Processor : Intel Core i5-520M(2.4GHz)
https://www.dell.com/support/home/sk-sk/product-support/servicetag/0-VFp...

XOR je rýchlejšie o 66%

+1
0
-1
Je komentář přínosný?

Počty cyklů na zpracování jednotlivých instrukcí byly uváděny i u 80486/80487.

V příručce Borland Turbo Assembler jsou uváděny 8086, 286, 386, 486.
Pro Pentium už exaktní hodnoty takhle hezky pohromadě nemám :(

+1
0
-1
Je komentář přínosný?
+1
+1
-1
Je komentář přínosný?

Pipelining je zhruba rovnako stary, ako Z80 :) Uz uplne prvy RISC CPU mal troj-, ci stvor- stupnovu pipeline. Navyse oni to zobrali tak trocha extremisticky a instrukciu, ktoru neslo dokoncit v troch taktoch CPU ani neimplementovali, navyse HW neriesil niektore druhy hazardov, takze prekladac musel vkladat instrukcie NOP, aby sa program nesekol, alebo nespocital hovadinu. Tym dosiahli fixne IPC 1 (aj ked niektore z instrukcii boli NOPy).

Pocet taktov, ktore trva vykonanie instrukcie sa bezne uvadza aj dnes, akurat v podrobnejsich programatorskych manualoch architektury, pretoze to zdaleka nie je tak dolezity udaj, ako vtedy. Skor sa ale oznacuje "latencia".

IPC potom oznacuje pocet instrukcii, ktore dokaze procesor "commitnut" v jednom takte. To v praxi znamena, ze ich spocitane vysledky su ulozene tam, kam patria. Bud do registrov, alebo *fuj fuj* do pamate. To vdaka vsemoznym skratkam, premenovaniu registrov a podobne moze byt tiez stale dost gumovy pojem.

Ale hej, to o com sa my tu bavime ako o "IPC" je v podstate presne to, co uvadzate. Mozno ani nie vykon/frekvencia, ale hruby vykon v case, pretoze pokial mi je znamo, frekvencie tych procesorov sa nefixuju ani sa tie udaje neprepocitavaju na nejaku fixnu bazu.

+1
+1
-1
Je komentář přínosný?

V podstate by malo ist o pocet dokoncenych instrukcii jedneho threadu, jedneho jadra za 1 sekundu / (deleno) frekvencia. T.j. ak za sekundu urobi miliardu ADD-ov pri 1GHz, tak je IPC = 1. A tu hned vidime, ze to zavisi od programu. Ratat IPC z miliardy takych XRSTOR instrukcii, ktore na Bulldozeri maju latenciu 250 cyklov, by asi nedopadlo slavne. IPC=0,004. Nehovoriac uz o tom, ze zatazit aj dalsie jadra, by IPC zhorsilo aj tomu testovanemu.

+1
0
-1
Je komentář přínosný?

Ved to som uz na par miestach pisal. IPC je viac zalezitost SW (+HW) nez HW samotneho.

Ten pripad s XRSTOR ale tipujem, ze vobec nebude fungovat tak, ako ho prezentujete. Latencia 250 cyklov neznamena, ze procesor 250 cyklov nerobi nic ine, nez jednu XRSTOR instrukciu. Procesor moze bud ihned, alebo s latenciou niekolko cyklov naplanovat a spustit dalsie instrukcie, ktore nie su zavisle od vysledku tej jednej dlho beziacej instrukcie. Trebars aj dalsi XRSTOR, alebo cokolvek ine, co v tom programe je. Ak je cely prud instrukcii v kode na sebe skrz operandy zavisly, tak hej, IPC takeho kodu bude biedne.

Aj ten pripad s instrukciami ADD bude asi vysoko pravdepodobne smerovat k vyssiemu IPC, pretoze jadro bude mat 2, 3 alebo 4 ALU a pokial vysledky jednotlivych suctov na sebe nebudu zavisiet, bude mozne spustit 2, 3 alebo 4 ADD paralelne iba s malymi pauzami. Procesor tak kludne moze vykazovat IPC od 2 do 4, pokial sa nebude pocitat prave nejaky rad, ako trebars Fibonacciho cisla. Aj tam by muselo ist o masakralne optimalizovany kod, aby zavislost ADD-ov na sebe robila problem.

+1
0
-1
Je komentář přínosný?

to sa velmi mylis
https://en.wikipedia.org/wiki/Instructions_per_cycle#Calculation_of_IPC

nejaku "teoreticku hodnotu" mozme vypotit a odvodit od poctu ALU a inych jednotiek a vseliakych inych podpornych, predpovedacich obvodov, mozes hadzat hausnumera typo 4,5 ci 4,75 alebo bars aj 6 (aj ked som cital nazory ze to nemoze byt viac ako 5, kedze kazda instrukcia moze byt iba v piatich stavoch), ale to vsetko je hruba teoria

v praxi to VZDY zalezi od konkretneho beziaceho kodu a typu zataze a vypoctu, preto sa spravi 30-40 typov zataze a urobi sa priemer

na typ zataze a sposob prace jadier (ked sa logicky zamyslime) vplyva aj to, ci ide iba jedno jedine jadro, ktore ma k dispozicii absolutne vsetko napr. v 8C chiplete, alebo ide vsetkych 8 jadier v tom chiplete, je to proste uuuuuuplne iny sposob prace jadier (ked sa chudatenko kazde jadro musi o vsetko delit s dalsimi siedmymi jadrami v chiplete) a ako vidno v Zen4, bolo este aj toto zlepsene o dalsie 4-5% ...

teraz je iba otazka ako to IT obec zoberie: ci to zahrnie pod pojem IPC a bude sa to prezentovat iba suchoparne ako narast IPC, alebo sa budu analyzy tykat uzt troch aspektov:
A) narast IPC (narast v 1T zatazi, ta ista frekvenia)
B) narast medzijadrovej efektivity, tu prezieravo nazvane "viacjadrove IPC" (narast v multiT zatazi, ta ista frekvenia MINUS narast vykonu v 1T zatazi, ta ista frekvenia)
C) narast vykonu zo zvysenia frekvencii

no a celkovy narast vykonu by bol kombinacia A, B, C

+1
+1
-1
Je komentář přínosný?

Také to ceny procesorov sú dnes na Alze Ryzen 9 5900X 442,90 €, Ryzen 7 7700X 470,90 €. Podľa tých grafov, ak chcete výrazne lepši multicore výkon ako je nejakých 13 percent, pri porovnaní procesorov s rovnakým množstvom jadier, oplatí sa kúpiť 5900X a nepotrebujete ani novú dosku a nové pamäte.

+1
-1
-1
Je komentář přínosný?

Přesně do chvíle než Vám AM4 řešení přestane stačit.

+1
0
-1
Je komentář přínosný?

Podle mne AM4 reseni s Ryzen-em 9 5900X prestane stacit tak o 7-9 let, lepsi bude pridat RAM.

+1
+4
-1
Je komentář přínosný?

To je individuální, pro můj use case nestačilo řešení s Ryzen 7950X již včera. Proto jsem ve vyčkávacím módu na nabídku(ceny) Epyc Genoa.

+1
+1
-1
Je komentář přínosný?

Jasne a proto sis nekoupil jiz dostupneho 64 jaderneho/128thr ThR 5995WX s 8ch...

+1
+3
-1
Je komentář přínosný?

Jde mi především o IO(RAM), procesorově mi postačí i pomalejší 16c(24c) podle toho jak nenasytná bude s Genoa AMD. Platforma 59x5WX je v kontextu blízkého příchodu SP5 holt příliš málo, příliš pozdě, za příliš draho.

+1
0
-1
Je komentář přínosný?

"Jde mi především o IO(RAM)" -> vzdyt to prave sWRX8 aktualne v ThR Pro poskytuje

"procesorově mi postačí i pomalejší 16c(24c)" -> cili intel(fanda)

"podle toho jak nenasytná bude s Genoa AMD" -> naopak nenazran je intel

"Platforma 59x5WX je v kontextu blízkého příchodu SP5" -> ne SP6 nahradi sWRX8

"holt příliš málo, příliš pozdě, za příliš draho" -> pro fandu intel-u urcite

Lazar vis ty co vlastne chces?

Podle mne jenom zkousis co ti projde..., neprojde...

+1
-1
-1
Je komentář přínosný?

"vzdyt to prave sWRX8 aktualne v ThR Pro poskytuje"
Poskytuje to na platformě WRX80 MB za 22kKč s minimální cenou CPU 72kKč(24c 5965WX), pro srovnání 24c Epyc 7443P stojí 46kKč a MB jsou cca do 20kKč (jsou i levnější Epyc, pro IO/MEM orientované případy užití).

"cili intel(fanda)"
Jsem od 9/2017 spokojeným majitelem stanice Thr 1950X/X399/GTX1080Ti a pozdějším uživatelem stanic s Thr 2950X, Epyc 7343. Cca 1,5 roku vlastním/užívám notebook s Ryzen 5800H/RTX3070M. Svou nezměrnou lásku k Intelu jsem prokázal naposledy nákupem ASUS NUC s Pentium 5100 za 5kKč včetně DPH.

"SP6 nahradi sWRX8"
To je možná problém, pokud tedy půjde o platformu s limitovanou CPU vykoností (max. 32c Zen4 až 64 Zen4c). https://diit.cz/clanek/vyvoj-epycu-se-rozstepi-na-2-sockety-sp5-pro-400w...

"holt příliš málo, příliš pozdě, za příliš draho"
add příliš málo) ThrPro nabízí nabízí již překonané technologie DDR4, PCIe 4.0 na končícím CPU socketu.
add příliš pozdě) Reálná dostupnost ThrPro Zen3-based v ČR jednotky měsíců před Epyc Genoa a skoro dva roky po uvedení Zen3-based Ryzen.
add přiliš draho) Viz výše uvedený cenový rozbor ThrPro versus Epyc Milan (za vstup do Zen2, 128x PCIe a 8-channel DDR4).

"naopak nenazran je intel"
Uvádím nenasytnost společnosti AMD (předpokládaný opětovný růst cen Epyc Genoa proti Epyc Milan, proto zminka 16c ci 24c modelu, ktere nejspíše zapadnou do planovaneho budgetu a nikoli o nenasytnosti CPU (produktu).

"Lazar vis ty co vlastne chces?"
Vím docela přesně co chci (potřebuji).

"Podle mne jenom zkousis co ti projde..., neprojde..."
Třeba to s detailnějším vysvětlením konečně pochopíte.

+1
+1
-1
Je komentář přínosný?

jasne, kvoli 39 € v pripade samotneho CPU - ide o to ci chceme upgrade alebo uplne novu zostavu

pokial niekto ma platformu s nejakym 2700X a je si isty ze mu tam pojde napr. 5950X, tak si moze kupit 5950X a bude to signifikatny upgrade

ak niekto ide kupovat v oktobri uplne novy komp, bol by blazon aby kupoval staru platformu s 5900X
ano, nova platforma ma drahsie RAM, MB a vyjde ho to o 500 € drahsie ... ale nova platforma prave zacina, stara platforma konci a zrejme nic vykonnjsie po 5950X tam nebude
a za dva roky si bude trieskat hlavu o stenu ze do starej platformy AM4 nemoze dat 32C64T Zen5 R9 8950X alebo 9950X alebo jak sa bude oznacovat

+1
-1
-1
Je komentář přínosný?

Takových případů asi moc nebude. Já jsem jeden mnohem běžnější příklad. Funguju na APU Ryzen 3 2200G (4C/4T), moje deska ani neumí PCIe 4.0 a mám v plánu tak do roka přejít na APU Ryzen 7 5700G. Věřím, že s tím vystačím do konce životnosti platformy AM5 a pak případně přejdu na AM6 nebo Intel, pokud se do té doby vzpamatuje. :-)

+1
0
-1
Je komentář přínosný?

AM6 prijde nejdriv v roce 2028(AM4 tu byla s nami od roku 2016 <-> 2022).

+1
0
-1
Je komentář přínosný?

Však ano, ale Ryzeny tu jsou od února 2017, takže to nyní máme 6,5 roku. 2022 + 6 = 2028. 5700G mi přinese dvoj až trojnásobný výkon oproti 2200G, takže by to snad mělo stačit. Nehraju hry ani nevyužívám nějaké extra náročné úlohy. Čas od času demuxuju DVD do nějakého aktuálního videoformátu, zbytek je víceméně jen webový prohlížeč s miliónem tabů, poslech a enkódování hudby. V podstatě taková domácí rádoby "kancelářina". :-)

PS: Přecházel jsem teprve začátkem roku 2019 z LGA 1155 - Intel Ivy Bridge (od 2013 Pentium G2020 > nějaký i5 4C/4T), ten má nyní máma. :-)

+1
0
-1
Je komentář přínosný?

B550 + 16GB/3200/2x8 + R7 5700X = 151+62+281=494€
X670-P +16GB/5200/2x8 + R5 7600X=317+101+356=774€

Rozdiel 280€ - to je rozdiel 2-och tried. (a to ešte k 7600X treba chladič)

B550 + 32GB/3600/2x16 + R9 5900X=151+121+442=714€ teda ešte 60€ ostáva na pekný vzduchový chladič. 2x taká RAM, +40% MT výkonu, chladič.

To že je na trhu nová platforma neznamená že stará je na odpis. Ono, už bolo 1000x opakované, 95+% ľudí nikdy uprade CPU robiť nebude, proste nie takže tie sockety sú im k *****.

Sám som bol na strane kúpiť už radšej novú platformu ale pri tých brutálnych cenách dosiek to tak jasné už nie je (ak nekupuješ 7950X)

PS: X670-P doska je najlacnejšia na mimozemšťanovi (a samozrejme nie je skladom), iné dosky cenu posielajú raketovo hore, rozdiel bude ešte väčší.

+1
+1
-1
Je komentář přínosný?

Tak pokud ti jde jen o MT a věříš, že upgrade potřebovat nebudeš, tak samozřejmě proč ne, ale pořád ti to nenabídne třeba ten vyšší ST, za který to má prostě právo si něco naúčtovat navíc (samozřejmě záleží na každém, jestli mu to za ten příplatek stojí) a je nepopiratelné, že některé operace to prostě urychlí, i když je to jako celek výkonné stejně, takže vyšší cena je ospravedlnitelná.

+1
0
-1
Je komentář přínosný?

+ještě přijdou i levnější B650 ZK, které ještě několik litříků uberou, takže to zas tak předražené nebude... samozřejmě Zen4 má takovou „nevýhodu“ v tom, že už prostě potřebuje nový socket, aby se ta platforma mohla časem zas někam posunout dál, který teď prostě bude vycházet o něco dráž než když můžeš kupovat zlevněné a starší AM4, pokud ti stačí co nabízí. Ale pokud trochu využiješ i ten ST, už to zas tak nevýhodné nebude.

+1
+1
-1
Je komentář přínosný?

AM4 = max 32t R9 5950X
AM5 = max 64t R9 9590X
Takže aj keď je Zen 4 drahší, dá sa počkať na lacnejšie dosky (je blbosť porovnávať staršie mainstreamové dosky s novými high-endovými) a časom mať dajme tomu 3× vyšší MT výkon. Nerozumiem prečo neurobiť upgrade CPU zvlášť ak by sme dnes šli do 6-8 jadra a po 4-6 rokoch by bolo aktuálne 32 jadro. Lepšie je vymeniť CPU aj dosku? Iné bolo v s. 1150, 1155 a 1151 v1, kde sa dalo ísť z 2 jadra do 4 jadra, alebo dokonca zo 4jadra iba do 8 vlákna s nárastom výkonu o pár %. Dnes u AM5 je možný upgrade niekde inde.

+1
0
-1
Je komentář přínosný?

MSI B550M PRO-VDH 113€
5800X3D 455€
Mushkin Redline Black 16GB 3600 CL16 75€.
Spolu: ---- 643€ -------
A mas rovnaky herny vykon nez s 7600X + 5200 CL38 - ale testovali len 4 hry s 5200 CL38.
7600X s 6000MHz CL32 by mal o 5% vyssi vykon nez 5800X3D - priemer z 12 hier.
https://www.youtube.com/watch?v=_WubXd2tXOA

Podla Techpowerup je v hrach 7600X + 6000 CL36 rychlejsi o 2% nez 5800X3D.
Podla Computerbase je v hrach 5800X3D + 3200 CL14 o 3% rychlejsi nez 7950X/7700X + 5200 CL32.

+1
-1
-1
Je komentář přínosný?

I kdyby byly v Intelu polobohové (což zdaleka nejsou), tak nikdy nevyladí svojí big-little na stejnou bezproblémovost jakou mají jen big koncepce (nebo jen little koncepce) a důkazem je právě toto ladění multithread výkonu u CPU s jen jedním typem jader. Složitost té výzvy se dvěma typy jader je neskutečná!
Z tohodle důvodu by bylo lepší vzít jen Atomy a pracovat jen s nima a vzniklo by něco zajímavého pro lidi co koukají hlavně na multithread výkon.

+1
-1
-1
Je komentář přínosný?

Pro lidi, co koukají hlavně na MT výkon, je tu Zen 4.

+1
+4
-1
Je komentář přínosný?

Naštěstí ten výběr není tak omezený ani dnes a 6-32 jádrový Atom by ho dále rozšířil. Minimálně 6-8 atom jádra má Intel v plánu, tak se uvidí, jak si povedou proti 2-4 velkým jádrům. Poměr cena/výkon, poměr výkon/spotřeba.

+1
0
-1
Je komentář přínosný?

Atom nikdy nenahradi velke jadra protoze:

->nema vsechny potrebne jiz dobou zadane instrukcni sady
->ma mensi velikost cache
->nepodporuje SMT

Je lepsi koupit si Athlon 3000 nez mit procesor ciste z 8 atomu, vic to bude zrat nez ta 3000.

+1
0
-1
Je komentář přínosný?

->už má a ty co nemá (AVX-512) ty můžeme oželet nebo v budoucnu to udělat jako AMD u Zen 4 - chytře
->to ničemu nevadí, jsou případy, kdy ani 2x větší cache nijak nepomůže
->nepodpora SMT/HT je vzhledem k těm neustálým bezpečnostním problémům spíš výhoda

Athlon 3000 by proti moderním/aktuálním 8 atomům prohrál.

+1
0
-1
Je komentář přínosný?

Pro lidi, kteri koukaji po Multithread vykonu je tu ThreadRipper, pripadne Epyc.

+1
0
-1
Je komentář přínosný?

V roce 2022 porovnavat generace procesoru(jejich IPC) vychazejicich z naprosto novych architektur jednoduse nema zadny smysl, vykon na jedno jadro dnes proste neresi jiz nikto(!) jenom naprosto dementni intel a na miru mu uzpusobene benchmarky.

V dnesni realite je proste zaklad 4 jadro schopne zpracovat 8 vlaken a basta, vemte si OS, antivirus vyuzivajic jiz aktivne cloud, dale komunikacni IP klienty(Zoom, Teams, Skype), k tomu internetovy prohlizec, blokovac reklam, novy balik Office, uz jenom to zabije ciste 2 jadra jako nic.

Doba se vyviji a proto nam aktualne nastupuje AVX-512, jinak pry i intel vylepsil komunikaci(jak ns(latence) tak samotne zasobovani daty v Rocket Laku, konkretne L2 cache pozdvihl ze 1,25 na cele 2MB), jenomze zas to zabil ve svem stylu a to ze stredni trida mimo K rady bude cela vojeb v podobe Alder Lake Refresh, prida +100/200MHz navic a smitec.

+1
0
-1
Je komentář přínosný?

Dokud budou výrobci dvoujádra nabízet jako nejlevnější lowend, tak se budou i prodávat. Já bych byl pro kompromis - lowend v podobě 6 malých jader nebo velká jádra 4C/4T, ale takhle kriplit velká jádra asi nemá ekonomický smysl. Rozhodně lepší než 2C/2T jako u dnešního Celera G6900.

+1
+3
-1
Je komentář přínosný?

Vykon na na 1 jadro, pripadne vlakno je jen kripleni IPC. IPC nemluvi o 1 vlaknu. Doslovny preklad je Instruction per Cycle.
Protoze tam je ale jader vic, tak se toho za 1 takt stihne vic. Neni duvod se zabyvat tim, kolik vykona 1 z napriklad osmi jader. Tenhle hloupy a nespravny argument s jednovlaknovou zatezi pro srovnani IPC je jen ohybani reality.

Jinym zpusobem ohybani reality zase muze byt frekvence, na ktere se dany system provozuje z duvodu ruzneho omezeni vykonu danych spotrebou a teplotou. Nastesti je vetsina testu daleko od limitnich hodnot a zkresleni je male.
Jako priklad muzu dat srovnavani MT IPC na 4 GHz mezi 12600K a 13900K. 13900K z toho vyjde lepe, ale nebude to umerne IPC na nizsich frekvencich. To vse navic ovlivnene chladicem a nastavenim PL2. Na 3 GHz by IPC 13900K vychazelo lepe.

Co je ale nejdulezitejsi, je skutecny vykon v absolutni hodnote a ne srovnavat ho vuci normalizovanym frekvencim. Takze i presto, ze jako nadsenec sleduju vyvoj IPC, tak v praktickem zivote je pro me nepodstatne - narozdil od absolutniho vykonu v danych oblastech uziti.

+1
+3
-1
Je komentář přínosný?

Jen tak ze srandy si někdy zkuste i takovou blbost, jako ve Windows zobrazit náhledy obrázků ve složce.

Věc, která se dá prakticky dokonale paralelizovat. Ten blbinec vám to bude vykreslovat obrázek po obrázku, i když procák zvládne 32 vláken. Když máte těch obrázků ve složce tisíc, můžete si jít uvařit kafe, než to ty náhledy vygeneruje, abyste to pak mohl rychle probrat.

A takhle se chová prakticky každý manažer pro správu obrázků. Ani s takovouhle kravinou se nikdo z vývojářů nenamáhá, ani je nehne (čest výjimkám, kterým to už docvaklo).

A podobně jsou na tom s optimalizací pro vícejádra prakticky všechny aplikace. Jediné, kde už brutální optimalizaci na vícejádra vzali za svou, jsou renderery a programy pro enkódování multimédií.

Pro všechny ostatní vývojáře je to fast enough a nic s tím nedělají. Podobně idiotsky se chová třeba i řada programů pro dávkové zpracování souborů. Není nic jednoduššího, než vzít šestnáct obrázků, prdnout to na šestnáct vláken, a převádět je z bitmapy do jpegu současně. Šestnáct najednou, na každém jádru jeden.

Programy, které to umí, budete muset mezi tím balastem dost pracně hledat, většina z nich to tam bude hrnou hezky postupně obrázek po obrázku na jednom vláknu.

Proto má smysl řešit jednovláknový výkon, a ještě dlouho to smysl mít bude.

+1
+6
-1
Je komentář přínosný?

"Lajkoval" jsem ač se mi to vůbec nelíbí. Snad je na tom Linux o fous lépe než platforma Windows. Já netuším, moje poslední Windows na domácím PC byly XP.

+1
0
-1
Je komentář přínosný?

U náhledů obrázků je úzké hrdlo komunikace s úložištěm, ne procesor.

+1
0
-1
Je komentář přínosný?

Pri SSD ani náhodou

+1
-1
-1
Je komentář přínosný?

jsem ted z legrace otevrel slozku se 600 JPEG fotkama.. i ty blbe vidle ten nahled umeli takrka instantne a to jak na SSD, tak na HDD. Mozna pokud skaldujes RAW soubory, tak tam to bude jine.

+1
-1
-1
Je komentář přínosný?

Ano. Pokud jsou už náhledy v databázi, že. A pak se ještě jpegy rozlišují na jpegy s thumbnailem a jpegy bez thumbnailu.

+1
+2
-1
Je komentář přínosný?

pokazde jsem otviral jinou slozku na jinem disku.. mozna ze nejaky 50MB RAW fotky trvaji. Mel jsem tam jak 5MB, tak 500kB JPEgy. Jestli maji "vnitrni preview" netusim.

+1
-1
-1
Je komentář přínosný?

V RAWu bývá standardně uložený JPEG třeba s polovičním rozlišením, v JPEGu bývá malý náhled.

Radost jsou třeba screenshoty v PNG ve 4K a podobné věci, RAW je zabiják totální, pokud to nebere info z těch náhledů.

https://www.youtube.com/watch?v=oWK1et3mobU

+1
0
-1
Je komentář přínosný?

A od kdy umí nějaké úložiště číst víced souborů současně? SSD sice umí rychle skákat z jednoho místa na druhé, ale v jednom okamžiku umí číst jenom jeden datový stream.

+1
-2
-1
Je komentář přínosný?

To máte odkiaľ takúto blbosť? Prečo majú potom SSD mnohonásobnú rýchlosť pri zvýšení fronty čítania alebo zápisu z Q1 na povedzme Q32?

Taky problém bol len s HDD, ktorý dokázal v jednom čase čítať len z jednej stopy.

Ako písal Adams, problém je, že stále mnoho programov je neprepisanych a fungujú sériovo a nezohladnuju súčasné dostupné zdroje ako Multicore cpus a rýchle ulozistia. Našťastie sa to zlepšilo a každý lepší soft už áno.

+1
+2
-1
Je komentář přínosný?

To je důsledek té první věty - SSD umí rychle přeskakovat z jednoho místa na druhé - pokud čte více souborů, tak je čte v časovém multiplexu (přečte kousek z prvního, přeskočí, přečte kousek z druhého ... a tak pořád dokola) ale v jednom okamžiku umí číst jenom z jednoho místa. Ten rozdíl rychlostí při Q1 a Q32 je z jiného důvodu. Při Q1 musí SSD obsluhovat požadavky přesně v tom pořadí jak jsou mu zadávané. Při Q32 si může v rámci těch 32 požadavků dělat změny pořadí operací tak aby rychlost byla co nejvyšší (tj např pokud tam je pořadí čtení z 1.bloku, čtení z 2. bloku, čtení z 1. bloku, čtení z 2. bloku tak nejdřív vyřídí všechna čtení z 1. bloku a potom všechna čtení z 2. bloku protože přepínání bloků je relativně pomalé, případně pokud má flashka více čipů tak se operace přeuspořádají tak aby se četly čipy na střídačku). Jinak u SATA to ani technicky nejde, je to sériová sběrnice a v jednom okamžiku se můžou přenášet jenom jedny data. NVMe má sice max 4 datové linky ale vzhledem k tomu že ten počet je flexibilní (musí to fungovat jak při 4 linkách, tak při 2 a taky při jedné) tak je návrh rozhraní udělaný tak že logicky je přenos sériový.

+1
-1
-1
Je komentář přínosný?

Tak treba u zpracovani audia a hudebni produkce se vedle vicevlaknoveho vykonu resi i jednovlaknovy. Ulohy je sice vetsinou mozne rozdelit na mnoho vlaken, ale i tak mohou byt vypocty v jiz nerozlozitelne casti zateze hodne slozite. A aby nebylo problemum konec, tak vse musi byt spocitano za jasne dany usek casu. Pokud se to nestihne, tak je to zcela nevyhovujici a nepouzitelne.....

Vypocet by casto sel rozlozit treba na 128 Atomu, ale ty by to nebyly schopne spocitat vcas..... Tedy jednovlaknovy vykon je v techto ulohach dosti vyznamny.

+1
0
-1
Je komentář přínosný?

Duplicita...

+1
0
-1
Je komentář přínosný?

No, blbý je akorát to, že Windows, většina majkrosoftích aplikací pod Windows a spousta dalších používaných programů je taková jedna velká historická výjimka.

+1
+1
-1
Je komentář přínosný?

...něco málo o tuzemské výrobě polovodičů (spousta lidí ani neví, že v tuzemsku nějaká výroba vůbec probíhá):
https://www.onsemi.com/company/news-media/press-announcements/cz/onsemi-...

+1
+2
-1
Je komentář přínosný?

Nemá smysl číst, výroba polovodičů bude do půl roku z důvodu drahé energie přesunuta do Asie nebo USA.

+1
+2
-1
Je komentář přínosný?

"AMD sice s Ryzeny 7000 nezvýšila počet jader, ale nárůst vícejádrového výkonu je velmi výrazný."

Já bych to viděl jinak. To, že bylo vedle zefektivnění architektury (nějaká procenta navíc) a zefektivnění cache (nějaká procenta navíc) nutno sáhnout po razantním nárůstu TDP, tedy nastavení možnosti běhu CPU mimo optimální pásmo výkon/spotřeba, je důkazem, že se věci nepovedly tak, jak by bývalo bylo pro AMD vhodné. Holt je tlačil Intel s Raptorem a museli tohle udělat. Nenazýval bych to "velmi výrazným" nárůstem, protože když se smahne 5950X na 170/230W odběr, jistě ten nárůst zas tak "výrazný" nebude.

Výrazný nárůst přináší důležitější části architektur jako nové instrukční sady. Třeba když přišlo (a začalo se používat MMX), nebo SSE1-2-3, nebo AVX a AVX2. To byly ty klíčové věci, co někam hejbaly svět. Kde je nějaká instrukční sada od AMD, která takovýhle posuv naposledy přinesla? Spíše mi to celé přijde jako "mírný pokrok v mezích zákona". Nic proti, vlastně je to OK, ale rozhodně to není "velmi výrazný" nárůst.

+1
+1
-1
Je komentář přínosný?

Davide, Ty si musíš vždycky něco najít, abys do NoXe rýpnul, ale kdyby ses pořádně podíval na ty grafy, tak bys viděl. že všechny ty testy probíhají na 3.6 GHz, takže tam nějaké zvýšení TDP nehraje roli a věřím, že ty nové procesory tam budou úspornější i při tom větším výkonu.

+1
0
-1
Je komentář přínosný?

Nekdo tady psal, ze filozofie D. Jezka je "curat proti vetru". Myslim, ze tohle docela nektere jeho prispevky vystihuje.

+1
0
-1
Je komentář přínosný?

"protože když se smahne 5950X na 170/230W odběr, jistě ten nárůst zas tak "výrazný" nebude."
.. co kdyby si misto tech svych hypotez, dodal nejaka cisla, zalozena na faktech? :)
"nutno sáhnout po razantním nárůstu TDP"
.. kdyby jsi daval v prvni tride pozor, vedel by jsi, ze "eco" zastropovany 105/142W 7950X dosahuje 95% vykonu 170/230W defaultniho mofu. Z toho vyplyva jen jedna vec. Tohle vysoke nastaveni je apriori uplne zbytecne a je delane pouze na benchmarkove "testy", prave k vuli nesmyslnemu honeni Intelu. Jinak je to CPU pohoda lahoda, oproti AL a RTL.

+1
+1
-1
Je komentář přínosný?

Tak tak, nieco pomerane aj tu:
https://youtu.be/-sDDA_2USwg

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.