Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Procesorové jádro Excavator zabírá jen 3 % plochy APU Carrizo

"Jeden dvoujádrový modul bez L2 cache tvoří 6 % (14,7 mm²), takže jedno jádro excavator odpovídá 3 % (7,36 mm²)."
ehm, jak modul tak jadro bez zapocitane FPU jednotky?? nevim, ja tak nejak od 486 povazuju FPU za soucast CPU, neberu experiment NextGenu kdy ho zase oddelili ...
a nebo to jsou pouze zmineny ALU jednotky??

+1
-4
-1
Je komentář přínosný?

Celé procesorové jádro bez L2 cache, tzn. včetně FPU.

+1
-8
-1
Je komentář přínosný?

neni to u bulldozer architektury tak, ze jeden modul ma dva integer clustery, ktere sdileji jednu fpu jednotku? ta je navic na onom screenu oznacena zvlast, pod 2x CL je obdelnicek FLOAT ...

+1
-9
-1
Je komentář přínosný?

To je poměrně nepřesný výklad, který se rozšířil v době vydání Bulldozeru než byly dostupné detailnější informace. Modul má dvě FPU, které mohou na realizaci některých operací pracovat společně jako jedna. Fyzicky jde o dvě jednotky, které sdílí část prostředků.

+1
-2
-1
Je komentář přínosný?

ide o jednu jednotku s dvoma portami. FPU v module ma spolocny register file aj spolocny scheduler, dva porty, pricom kazdy vie vykonat 128bit scitanie alebo nasobenie alebo FMA. 256bit AVX operacie sa delia na dve 128bit v dekoderi. Integer jadra v module maju samostatne schedulery aj registre.
V principe rovnako to ma intel, avsak iba pre jedno jadro. dvojportova fpu, po ivy bridge bol jeden port pre nasobenie a jeden pre scitavanie, u haswellu oba porty dokazu vykonat 256bit FMA operaciu sucasne

+1
+6
-1
Je komentář přínosný?

ano jde o jednu jednotku, ale ta pracuje v režimu SMT a je tzv "thread agnostic" to znamená, že ani jeden thread není upřednostňován před druhým. Nejlépe to vystihuje tento obrázek. Každý port může pracovat pro jiné vlákno s vyjímkou AVX, kdy je potřeba zpracovávat 256bit příkaz.

http://del42sa.rajce.idnes.cz/AMD_Bulldozer/#Flex_FP.jpg

http://www.lostcircuits.com/cpu/amd_bulldozer-bobcat/bulldozer4b.jpg

Jinými slovy pokud je zpracováván standartní 128bitový FP příkaz (což je dnes drtivá většina ), sdílená FPU se chová v podstatě jako dvě samostatné FPU.

+1
-11
-1
Je komentář přínosný?

neviem co je na tejto sprave zvlastne, ako pozeram die shot haswellu, tak jedno jadro bez L2 cache tam tiez zabera vyrazne menej ako 10%.
Odhadom mozno nejakych 5% a to ma 256bit fpu aj alu jednotky a podstatne vacsi physical register file a reorder buffer ako amd procesory

+1
-5
-1
Je komentář přínosný?

Kapacitou a rychlostí je obdobou L2 cache u AMD L3 cache Intelu a stejně tak L2 cache Intelu je kapacitou obdoba L1 cache AMD.

U čtyřjádrového Haswellu má jádro bez LLC 6,7 % plochy čipu; u Carrizo je to 3 % plochy čipu. Relativní rozdíl je více než dvojnásobný.

+1
+6
-1
Je komentář přínosný?

hm? amd ma 96kB L1 code cache zdielanej v ramci modulu, 16kB L1 data cache pre kazde jadro v module, to je podla mna o dost menej ako 256kB L2 u intelu. Intel ma 32+32kB L1 na jadro, co je velmi podobne ako 96+16+16kB na amd modul.

+1
-7
-1
Je komentář přínosný?

Matematicky je to sice správně, ale netýká se to čipu, o němž je řeč :-) Excavator má 32 kB datové L1 na jádro, takže celkem 160 kB L1 na jádro. S ohledem na rychlost (resp. pomalost) L1 cache u všech generací vycházejících z BD je skutečně na místě srovnání spíš s L2 Intelu.

+1
-7
-1
Je komentář přínosný?

aha, som nevedel, ze zdvojnasobili data cache. ale aj tak teda, je to 160kB na modul vs 128kB na haswell dvojjadro, pricom haswell dvojjadro ma 512kB L2 cache. A myslim, ze sa tu porovnava plocha cipu a nie nejake rychlosti, takze aj tak by som porovnaval haswell bez L2 cache. Ale aj tak je toto porovnavanie pomerov velkosti medzi roznymi cpu blbost :D

+1
-3
-1
Je komentář přínosný?

To porovnání velikosti a rychlosti cache bylo míněno obecně, nejen ve vztahu k této situaci. Jinak jsou mezi výrobci u cache obrovské rozdíly co do denzity, ale už si to moc nepamatuju (mám dojem, že nejlíp to zvládala IBM, ale už je to několik let, co jsem to zjišťoval naposledy).

+1
-5
-1
Je komentář přínosný?

hmm Carrizo má 96kB L1 Instrukční cache a každé jádro má 32kB L1 datové cache. Modul má celkově 96/64 kB L1 cache + 1MB L2 sdílené cache.

+1
-11
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.