"Jeden dvoujádrový modul bez L2 cache tvoří 6 % (14,7 mm²), takže jedno jádro excavator odpovídá 3 % (7,36 mm²)."
ehm, jak modul tak jadro bez zapocitane FPU jednotky?? nevim, ja tak nejak od 486 povazuju FPU za soucast CPU, neberu experiment NextGenu kdy ho zase oddelili ...
a nebo to jsou pouze zmineny ALU jednotky??
+1
-4
-1
Je komentář přínosný?
"Jeden dvoujádrový modul bez
cyberreality https://diit.cz/profil/cyberreality
25. 2. 2015 - 15:48https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse"Jeden dvoujádrový modul bez L2 cache tvoří 6 % (14,7 mm²), takže jedno jádro excavator odpovídá 3 % (7,36 mm²)."
ehm, jak modul tak jadro bez zapocitane FPU jednotky?? nevim, ja tak nejak od 486 povazuju FPU za soucast CPU, neberu experiment NextGenu kdy ho zase oddelili ...
a nebo to jsou pouze zmineny ALU jednotky??https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768232
+
Celé procesorové jádro bez L2 cache, tzn. včetně FPU.
+1
-8
-1
Je komentář přínosný?
Celé procesorové jádro bez L2
no-X https://diit.cz/autor/no-x
25. 2. 2015 - 15:55https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseCelé procesorové jádro bez L2 cache, tzn. včetně FPU.https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768240
+
neni to u bulldozer architektury tak, ze jeden modul ma dva integer clustery, ktere sdileji jednu fpu jednotku? ta je navic na onom screenu oznacena zvlast, pod 2x CL je obdelnicek FLOAT ...
+1
-9
-1
Je komentář přínosný?
neni to u bulldozer
cyberreality https://diit.cz/profil/cyberreality
25. 2. 2015 - 16:27https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseneni to u bulldozer architektury tak, ze jeden modul ma dva integer clustery, ktere sdileji jednu fpu jednotku? ta je navic na onom screenu oznacena zvlast, pod 2x CL je obdelnicek FLOAT ...https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768242
+
To je poměrně nepřesný výklad, který se rozšířil v době vydání Bulldozeru než byly dostupné detailnější informace. Modul má dvě FPU, které mohou na realizaci některých operací pracovat společně jako jedna. Fyzicky jde o dvě jednotky, které sdílí část prostředků.
+1
-2
-1
Je komentář přínosný?
To je poměrně nepřesný výklad
no-X https://diit.cz/autor/no-x
25. 2. 2015 - 19:18https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseTo je poměrně nepřesný výklad, který se rozšířil v době vydání Bulldozeru než byly dostupné detailnější informace. Modul má dvě FPU, které mohou na realizaci některých operací pracovat společně jako jedna. Fyzicky jde o dvě jednotky, které sdílí část prostředků.https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768344
+
ide o jednu jednotku s dvoma portami. FPU v module ma spolocny register file aj spolocny scheduler, dva porty, pricom kazdy vie vykonat 128bit scitanie alebo nasobenie alebo FMA. 256bit AVX operacie sa delia na dve 128bit v dekoderi. Integer jadra v module maju samostatne schedulery aj registre.
V principe rovnako to ma intel, avsak iba pre jedno jadro. dvojportova fpu, po ivy bridge bol jeden port pre nasobenie a jeden pre scitavanie, u haswellu oba porty dokazu vykonat 256bit FMA operaciu sucasne
+1
+6
-1
Je komentář přínosný?
ide o jednu jednotku s dvoma
Doug Quaid https://diit.cz/profil/doug
25. 2. 2015 - 19:29https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseide o jednu jednotku s dvoma portami. FPU v module ma spolocny register file aj spolocny scheduler, dva porty, pricom kazdy vie vykonat 128bit scitanie alebo nasobenie alebo FMA. 256bit AVX operacie sa delia na dve 128bit v dekoderi. Integer jadra v module maju samostatne schedulery aj registre.
V principe rovnako to ma intel, avsak iba pre jedno jadro. dvojportova fpu, po ivy bridge bol jeden port pre nasobenie a jeden pre scitavanie, u haswellu oba porty dokazu vykonat 256bit FMA operaciu sucasnehttps://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768352
+
ano jde o jednu jednotku, ale ta pracuje v režimu SMT a je tzv "thread agnostic" to znamená, že ani jeden thread není upřednostňován před druhým. Nejlépe to vystihuje tento obrázek. Každý port může pracovat pro jiné vlákno s vyjímkou AVX, kdy je potřeba zpracovávat 256bit příkaz.
Jinými slovy pokud je zpracováván standartní 128bitový FP příkaz (což je dnes drtivá většina ), sdílená FPU se chová v podstatě jako dvě samostatné FPU.
+1
-11
-1
Je komentář přínosný?
ano jde o jednu jednotku, ale
del42sa https://diit.cz/profil/del42sa
25. 2. 2015 - 20:03https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseano jde o jednu jednotku, ale ta pracuje v režimu SMT a je tzv "thread agnostic" to znamená, že ani jeden thread není upřednostňován před druhým. Nejlépe to vystihuje tento obrázek. Každý port může pracovat pro jiné vlákno s vyjímkou AVX, kdy je potřeba zpracovávat 256bit příkaz.
http://del42sa.rajce.idnes.cz/AMD_Bulldozer/#Flex_FP.jpg
http://www.lostcircuits.com/cpu/amd_bulldozer-bobcat/bulldozer4b.jpg
Jinými slovy pokud je zpracováván standartní 128bitový FP příkaz (což je dnes drtivá většina ), sdílená FPU se chová v podstatě jako dvě samostatné FPU. https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768364
+
neviem co je na tejto sprave zvlastne, ako pozeram die shot haswellu, tak jedno jadro bez L2 cache tam tiez zabera vyrazne menej ako 10%.
Odhadom mozno nejakych 5% a to ma 256bit fpu aj alu jednotky a podstatne vacsi physical register file a reorder buffer ako amd procesory
+1
-5
-1
Je komentář přínosný?
neviem co je na tejto sprave
Doug Quaid https://diit.cz/profil/doug
25. 2. 2015 - 19:06https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseneviem co je na tejto sprave zvlastne, ako pozeram die shot haswellu, tak jedno jadro bez L2 cache tam tiez zabera vyrazne menej ako 10%.
Odhadom mozno nejakych 5% a to ma 256bit fpu aj alu jednotky a podstatne vacsi physical register file a reorder buffer ako amd procesoryhttps://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768332
+
Kapacitou a rychlostí je obdobou L2 cache u AMD L3 cache Intelu a stejně tak L2 cache Intelu je kapacitou obdoba L1 cache AMD.
U čtyřjádrového Haswellu má jádro bez LLC 6,7 % plochy čipu; u Carrizo je to 3 % plochy čipu. Relativní rozdíl je více než dvojnásobný.
+1
+6
-1
Je komentář přínosný?
Kapacitou a rychlostí je
no-X https://diit.cz/autor/no-x
25. 2. 2015 - 19:32https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseKapacitou a rychlostí je obdobou L2 cache u AMD L3 cache Intelu a stejně tak L2 cache Intelu je kapacitou obdoba L1 cache AMD.
U čtyřjádrového Haswellu má jádro bez LLC 6,7 % plochy čipu; u Carrizo je to 3 % plochy čipu. Relativní rozdíl je více než dvojnásobný.https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768354
+
hm? amd ma 96kB L1 code cache zdielanej v ramci modulu, 16kB L1 data cache pre kazde jadro v module, to je podla mna o dost menej ako 256kB L2 u intelu. Intel ma 32+32kB L1 na jadro, co je velmi podobne ako 96+16+16kB na amd modul.
+1
-7
-1
Je komentář přínosný?
hm? amd ma 96kB L1 code cache
Doug Quaid https://diit.cz/profil/doug
25. 2. 2015 - 19:36https://diit.cz/clanek/carrizo-die-shot-excavator/diskusehm? amd ma 96kB L1 code cache zdielanej v ramci modulu, 16kB L1 data cache pre kazde jadro v module, to je podla mna o dost menej ako 256kB L2 u intelu. Intel ma 32+32kB L1 na jadro, co je velmi podobne ako 96+16+16kB na amd modul.https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768356
+
Matematicky je to sice správně, ale netýká se to čipu, o němž je řeč :-) Excavator má 32 kB datové L1 na jádro, takže celkem 160 kB L1 na jádro. S ohledem na rychlost (resp. pomalost) L1 cache u všech generací vycházejících z BD je skutečně na místě srovnání spíš s L2 Intelu.
+1
-7
-1
Je komentář přínosný?
Matematicky je to sice
no-X https://diit.cz/autor/no-x
25. 2. 2015 - 19:51https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseMatematicky je to sice správně, ale netýká se to čipu, o němž je řeč :-) Excavator má 32 kB datové L1 na jádro, takže celkem 160 kB L1 na jádro. S ohledem na rychlost (resp. pomalost) L1 cache u všech generací vycházejících z BD je skutečně na místě srovnání spíš s L2 Intelu.https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768368
+
aha, som nevedel, ze zdvojnasobili data cache. ale aj tak teda, je to 160kB na modul vs 128kB na haswell dvojjadro, pricom haswell dvojjadro ma 512kB L2 cache. A myslim, ze sa tu porovnava plocha cipu a nie nejake rychlosti, takze aj tak by som porovnaval haswell bez L2 cache. Ale aj tak je toto porovnavanie pomerov velkosti medzi roznymi cpu blbost :D
+1
-3
-1
Je komentář přínosný?
aha, som nevedel, ze
Doug Quaid https://diit.cz/profil/doug
25. 2. 2015 - 20:05https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseaha, som nevedel, ze zdvojnasobili data cache. ale aj tak teda, je to 160kB na modul vs 128kB na haswell dvojjadro, pricom haswell dvojjadro ma 512kB L2 cache. A myslim, ze sa tu porovnava plocha cipu a nie nejake rychlosti, takze aj tak by som porovnaval haswell bez L2 cache. Ale aj tak je toto porovnavanie pomerov velkosti medzi roznymi cpu blbost :Dhttps://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768374
+
To porovnání velikosti a rychlosti cache bylo míněno obecně, nejen ve vztahu k této situaci. Jinak jsou mezi výrobci u cache obrovské rozdíly co do denzity, ale už si to moc nepamatuju (mám dojem, že nejlíp to zvládala IBM, ale už je to několik let, co jsem to zjišťoval naposledy).
+1
-5
-1
Je komentář přínosný?
To porovnání velikosti a
no-X https://diit.cz/autor/no-x
25. 2. 2015 - 20:10https://diit.cz/clanek/carrizo-die-shot-excavator/diskuseTo porovnání velikosti a rychlosti cache bylo míněno obecně, nejen ve vztahu k této situaci. Jinak jsou mezi výrobci u cache obrovské rozdíly co do denzity, ale už si to moc nepamatuju (mám dojem, že nejlíp to zvládala IBM, ale už je to několik let, co jsem to zjišťoval naposledy).https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768378
+
hmm Carrizo má 96kB L1 Instrukční cache a každé jádro má 32kB L1 datové cache. Modul má celkově 96/64 kB L1 cache + 1MB L2 sdílené cache.
+1
-11
-1
Je komentář přínosný?
hmm Carrizo má 96kB L1
del42sa https://diit.cz/profil/del42sa
25. 2. 2015 - 19:53https://diit.cz/clanek/carrizo-die-shot-excavator/diskusehmm Carrizo má 96kB L1 Instrukční cache a každé jádro má 32kB L1 datové cache. Modul má celkově 96/64 kB L1 cache + 1MB L2 sdílené cache.https://diit.cz/clanek/carrizo-die-shot-excavator/diskuse#comment-768370
+
"Jeden dvoujádrový modul bez L2 cache tvoří 6 % (14,7 mm²), takže jedno jádro excavator odpovídá 3 % (7,36 mm²)."
ehm, jak modul tak jadro bez zapocitane FPU jednotky?? nevim, ja tak nejak od 486 povazuju FPU za soucast CPU, neberu experiment NextGenu kdy ho zase oddelili ...
a nebo to jsou pouze zmineny ALU jednotky??
Celé procesorové jádro bez L2 cache, tzn. včetně FPU.
neni to u bulldozer architektury tak, ze jeden modul ma dva integer clustery, ktere sdileji jednu fpu jednotku? ta je navic na onom screenu oznacena zvlast, pod 2x CL je obdelnicek FLOAT ...
To je poměrně nepřesný výklad, který se rozšířil v době vydání Bulldozeru než byly dostupné detailnější informace. Modul má dvě FPU, které mohou na realizaci některých operací pracovat společně jako jedna. Fyzicky jde o dvě jednotky, které sdílí část prostředků.
ide o jednu jednotku s dvoma portami. FPU v module ma spolocny register file aj spolocny scheduler, dva porty, pricom kazdy vie vykonat 128bit scitanie alebo nasobenie alebo FMA. 256bit AVX operacie sa delia na dve 128bit v dekoderi. Integer jadra v module maju samostatne schedulery aj registre.
V principe rovnako to ma intel, avsak iba pre jedno jadro. dvojportova fpu, po ivy bridge bol jeden port pre nasobenie a jeden pre scitavanie, u haswellu oba porty dokazu vykonat 256bit FMA operaciu sucasne
ano jde o jednu jednotku, ale ta pracuje v režimu SMT a je tzv "thread agnostic" to znamená, že ani jeden thread není upřednostňován před druhým. Nejlépe to vystihuje tento obrázek. Každý port může pracovat pro jiné vlákno s vyjímkou AVX, kdy je potřeba zpracovávat 256bit příkaz.
http://del42sa.rajce.idnes.cz/AMD_Bulldozer/#Flex_FP.jpg
http://www.lostcircuits.com/cpu/amd_bulldozer-bobcat/bulldozer4b.jpg
Jinými slovy pokud je zpracováván standartní 128bitový FP příkaz (což je dnes drtivá většina ), sdílená FPU se chová v podstatě jako dvě samostatné FPU.
neviem co je na tejto sprave zvlastne, ako pozeram die shot haswellu, tak jedno jadro bez L2 cache tam tiez zabera vyrazne menej ako 10%.
Odhadom mozno nejakych 5% a to ma 256bit fpu aj alu jednotky a podstatne vacsi physical register file a reorder buffer ako amd procesory
Kapacitou a rychlostí je obdobou L2 cache u AMD L3 cache Intelu a stejně tak L2 cache Intelu je kapacitou obdoba L1 cache AMD.
U čtyřjádrového Haswellu má jádro bez LLC 6,7 % plochy čipu; u Carrizo je to 3 % plochy čipu. Relativní rozdíl je více než dvojnásobný.
hm? amd ma 96kB L1 code cache zdielanej v ramci modulu, 16kB L1 data cache pre kazde jadro v module, to je podla mna o dost menej ako 256kB L2 u intelu. Intel ma 32+32kB L1 na jadro, co je velmi podobne ako 96+16+16kB na amd modul.
Matematicky je to sice správně, ale netýká se to čipu, o němž je řeč :-) Excavator má 32 kB datové L1 na jádro, takže celkem 160 kB L1 na jádro. S ohledem na rychlost (resp. pomalost) L1 cache u všech generací vycházejících z BD je skutečně na místě srovnání spíš s L2 Intelu.
aha, som nevedel, ze zdvojnasobili data cache. ale aj tak teda, je to 160kB na modul vs 128kB na haswell dvojjadro, pricom haswell dvojjadro ma 512kB L2 cache. A myslim, ze sa tu porovnava plocha cipu a nie nejake rychlosti, takze aj tak by som porovnaval haswell bez L2 cache. Ale aj tak je toto porovnavanie pomerov velkosti medzi roznymi cpu blbost :D
To porovnání velikosti a rychlosti cache bylo míněno obecně, nejen ve vztahu k této situaci. Jinak jsou mezi výrobci u cache obrovské rozdíly co do denzity, ale už si to moc nepamatuju (mám dojem, že nejlíp to zvládala IBM, ale už je to několik let, co jsem to zjišťoval naposledy).
hmm Carrizo má 96kB L1 Instrukční cache a každé jádro má 32kB L1 datové cache. Modul má celkově 96/64 kB L1 cache + 1MB L2 sdílené cache.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.