19. 7. 2010 - 12:03https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskusetak na toto jsem zvedavej...https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547531
+
Hodně pochybuji, že letos bude komukoliv dostupný bulldozer a i s příštím rokem (rozhodně první polovinou) mám velké pochyby. Tohle není GPU, kde po tapeoutu to jde poměrně rychle.
Pro srovnání - intel už na IDF 2009 ukazoval funkční sandy bridge(tzn skoro rok nazpět) a už nějakou dobu před tím na netu koloval dieshot(ani v této fázi bulldozer ještě není). A ještě stále cpu se sandy bridge nikde nejsou a chvilku nebudou.
+1
+3
-1
Je komentář přínosný?
ptipi https://diit.cz/profil/ptipi
19. 7. 2010 - 12:43https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseHodně pochybuji, že letos bude komukoliv dostupný bulldozer a i s příštím rokem (rozhodně první polovinou) mám velké pochyby. Tohle není GPU, kde po tapeoutu to jde poměrně rychle.
Pro srovnání - intel už na IDF 2009 ukazoval funkční sandy bridge(tzn skoro rok nazpět) a už nějakou dobu před tím na netu koloval dieshot(ani v této fázi bulldozer ještě není). A ještě stále cpu se sandy bridge nikde nejsou a chvilku nebudou.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547535
+
nemuzu si pomoct, ale o 1 a 3/4 jadru se mluvilo uz kdyz intel u starych p4 (tech co byly jeste hodne dobre, jeste pred tragedii prescott) uvedl hyper-threading, ktere se take v systemu tvarilo jako dve jadra. obe jadra take sdilela cache atd.
prijde mi, ze stejne jako se amd snazi "zkopirovat" do svych cpu intelacky turbo boost, hodla to same udelat i u hyper-threadingu. pripomenu, ze nikdo vlastne nevi, co bylo soucasti dohody intelu a amd o mimosoudnim vyrovnani. a je docela dobre mozne, ze jim intel patenty na hyper-threading a na technologie zabyvajici se turbo boostem uvolnil. turbo boost v podani amd je sice docela tragicky v poravnani s intelem, ale ve viceprocesorovych resenich ma amd docela dobre know-how a tim padem by v tomhle mohla intel dohnat
+1
-1
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
19. 7. 2010 - 14:13https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskusenemuzu si pomoct, ale o 1 a 3/4 jadru se mluvilo uz kdyz intel u starych p4 (tech co byly jeste hodne dobre, jeste pred tragedii prescott) uvedl hyper-threading, ktere se take v systemu tvarilo jako dve jadra. obe jadra take sdilela cache atd.
prijde mi, ze stejne jako se amd snazi "zkopirovat" do svych cpu intelacky turbo boost, hodla to same udelat i u hyper-threadingu. pripomenu, ze nikdo vlastne nevi, co bylo soucasti dohody intelu a amd o mimosoudnim vyrovnani. a je docela dobre mozne, ze jim intel patenty na hyper-threading a na technologie zabyvajici se turbo boostem uvolnil. turbo boost v podani amd je sice docela tragicky v poravnani s intelem, ale ve viceprocesorovych resenich ma amd docela dobre know-how a tim padem by v tomhle mohla intel dohnathttps://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547541
+
Kdy se v době P4 mluvilo o 1 a 3/4 jádru? Tohle je celkem dost odlišná situace. Hyperthreading u Intelu je spíš takové 1 a 1/4 jádro, virtuální dvoujádro s minimem tranzistorů navíc, kde jednotlivá vlákna sdílejí stejné výpočetní jednotky, kde díky tomu že je jedno vlákno většinou nevytíží dochází k mírnému zvýšení výkonu. Bulldozer má dvě samostatný jádra sdílející jednu FPU a výkonový nárůst je tak proti jednojádru vyšší než u hyperthreading, samozřejmě za cenu vyššího nárůstu počtu tranzistorů. AMD nejspíš počítá s tím že vysoce paralelizované výpočty se přesunou na grafické karty a FPU v procesoru nebude tolik potřeba.
+1
0
-1
Je komentář přínosný?
zdenek11 https://diit.cz/profil/zdenek11
19. 7. 2010 - 15:42https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseKdy se v době P4 mluvilo o 1 a 3/4 jádru? Tohle je celkem dost odlišná situace. Hyperthreading u Intelu je spíš takové 1 a 1/4 jádro, virtuální dvoujádro s minimem tranzistorů navíc, kde jednotlivá vlákna sdílejí stejné výpočetní jednotky, kde díky tomu že je jedno vlákno většinou nevytíží dochází k mírnému zvýšení výkonu. Bulldozer má dvě samostatný jádra sdílející jednu FPU a výkonový nárůst je tak proti jednojádru vyšší než u hyperthreading, samozřejmě za cenu vyššího nárůstu počtu tranzistorů. AMD nejspíš počítá s tím že vysoce paralelizované výpočty se přesunou na grafické karty a FPU v procesoru nebude tolik potřeba.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547548
+
Taky i když počítáš čistě ve FP, tak potřebuješ cykly, skoky, adresace.... a to všechno dělaj ALU.
Na druhou stranu inspirace HT se nedá zapřít, byť tu vidím i inspiraci z GPU - řídící logika ovládá různý výpočetní jednotky a přiřazuje je jak je zrovna třeba k threadům. Ale na skutečný soudy bych počkal až to opravdu vyleze.
Nicméně o bagru je slyšet už hodně dlouho, tak doufám, že to bude stejně povedená architektura jako K8, čím budou výkonnostně AMD s intelem blíž, tím líp (s tím, že díky marketingové převaze a tržní síle intelu je lepší, když vede AMD než naopak).
+1
-1
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
19. 7. 2010 - 15:58https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseTaky i když počítáš čistě ve FP, tak potřebuješ cykly, skoky, adresace.... a to všechno dělaj ALU.
Na druhou stranu inspirace HT se nedá zapřít, byť tu vidím i inspiraci z GPU - řídící logika ovládá různý výpočetní jednotky a přiřazuje je jak je zrovna třeba k threadům. Ale na skutečný soudy bych počkal až to opravdu vyleze.
Nicméně o bagru je slyšet už hodně dlouho, tak doufám, že to bude stejně povedená architektura jako K8, čím budou výkonnostně AMD s intelem blíž, tím líp (s tím, že díky marketingové převaze a tržní síle intelu je lepší, když vede AMD než naopak).
https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547551
+
tak to si muze kazdy precist na wikipedii. vyznam zdvojeneho ALU k jednomu FPU je u x86 architektury dost sporny. x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat, protoze jejich vyuziti je jen obcasne. zcela jiste se hyper-threadingu bude hure darit naplanovat incrementaci promenne nez nejakou slozitejsi bitovou transformaci. moc dobre si vzpominam jak nekteri lide pri nastupu tvrdili (i z mych pratel s athlony xp), jak bude hyper-threading k nicemu. ani je moc nepresvedcily me ukazky vypoctu super pi za rekneme minutu a kdyz jsem ty programy pustil dva najednou, nedaly to za 2 minuty, ale za 1.4 minuty (ale take ani ne za 1 minutu, jak by to dnes bylo s dvoujadry). dneska chteji multicore processory vsichni a ti sami lide, co ht zatracovali, mi rikaji, ze muzou mit i sest jader na jejich platforme
abych to schrnul, mas pravdu, ze fyzicky je to u HT spise 1 a 1/4 jadra, vykonove to uz ale dost zalezi na pripadu pouziti a nasazeni a pro bezne pouziti muze byt HT docela dobre 1 a 3/4 jadra
+1
0
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
19. 7. 2010 - 16:07https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskusetak to si muze kazdy precist na wikipedii. vyznam zdvojeneho ALU k jednomu FPU je u x86 architektury dost sporny. x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat, protoze jejich vyuziti je jen obcasne. zcela jiste se hyper-threadingu bude hure darit naplanovat incrementaci promenne nez nejakou slozitejsi bitovou transformaci. moc dobre si vzpominam jak nekteri lide pri nastupu tvrdili (i z mych pratel s athlony xp), jak bude hyper-threading k nicemu. ani je moc nepresvedcily me ukazky vypoctu super pi za rekneme minutu a kdyz jsem ty programy pustil dva najednou, nedaly to za 2 minuty, ale za 1.4 minuty (ale take ani ne za 1 minutu, jak by to dnes bylo s dvoujadry). dneska chteji multicore processory vsichni a ti sami lide, co ht zatracovali, mi rikaji, ze muzou mit i sest jader na jejich platforme
abych to schrnul, mas pravdu, ze fyzicky je to u HT spise 1 a 1/4 jadra, vykonove to uz ale dost zalezi na pripadu pouziti a nasazeni a pro bezne pouziti muze byt HT docela dobre 1 a 3/4 jadrahttps://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547552
+
"x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat,
protoze jejich vyuziti je jen obcasne"
Procesor má ALU, AGU, Load/Store jednotky, dnes už nepříliš používaný FPU a MMX a SSE. Nejsi troll? Ty taky
počítaj stylem jedna, dva, tři, moc :-). Navíc mimo SSE každej program ty první tři jmenovaný bude využívat
(ALU na cykly, countery, velikosti, AGU je jasná a data taky potřebuje každej).
To, že SSE jednotky uměj (plácnu) desetkrát tolik instrukcí než co v PIII, to je jaksi procesoru jedno, protože
ta jednotka v jednu chvíli udělá jen jednu instrukci (zanedbávám pipeline).
Jak s tim souvisí počet registrů už jaksi vůbec netušim (teda vlastně vim, čim je jich víc, tim spíš půjdou
ty jednotky zaplnit, protože budou mít k dispozici data).
Jednotky v procesorech jsou nevyužitý hlavně díky tomu, že a) plánovač je nezvládne naplánovat, b) v threadu
jsou závislý instrukce, který nejdou paralelizovat c) čeká se na data (vzhledem k nepříliš velkýmu zisku při
zvětšení cache je todle ale spíš minoritní důvod)
"vyznam zdvojeneho ALU k jednomu FPU je u x86 architektury dost sporny"
Proto např. nehalem i C2D má poměr ALU+AGU ku SSE 5 ku 3.
edit: "k jednomu FPU" ma byt "k jednomu radici"
edit: A proto intel při přechodu od CD k C2D zvětšil počet ALU o jedna na tři a u nehalemu zdvojnásobil počet AGU....
HT byl samozřejmě dobrej nápad jak využít volný jednotky, ale v některejch případech to nešlo, protože tam byly úzký místa.
Tadle architektura vypadá, že některý z nich bude schopná odstranit. Jestli se odstranění těch úzkejch za navýšení počtu
tranzistorů vyplatí ukážou až reálný testy, jen mě udivuje, jak nějakej terorista z horní dolní je chytřejší než špičky
v oboru, který se analýzou využití jednotek a návrhem efektivního CPU zabejvaj třeba celej život.
Holt každej nejsme tak geniální, no....
+1
+3
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
19. 7. 2010 - 17:13https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseTeda promiň, ale teda tomu fakt rozumíš:
"x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat,
protoze jejich vyuziti je jen obcasne"
Procesor má ALU, AGU, Load/Store jednotky, dnes už nepříliš používaný FPU a MMX a SSE. Nejsi troll? Ty taky
počítaj stylem jedna, dva, tři, moc :-). Navíc mimo SSE každej program ty první tři jmenovaný bude využívat
(ALU na cykly, countery, velikosti, AGU je jasná a data taky potřebuje každej).
To, že SSE jednotky uměj (plácnu) desetkrát tolik instrukcí než co v PIII, to je jaksi procesoru jedno, protože
ta jednotka v jednu chvíli udělá jen jednu instrukci (zanedbávám pipeline).
Jak s tim souvisí počet registrů už jaksi vůbec netušim (teda vlastně vim, čim je jich víc, tim spíš půjdou
ty jednotky zaplnit, protože budou mít k dispozici data).
Jednotky v procesorech jsou nevyužitý hlavně díky tomu, že a) plánovač je nezvládne naplánovat, b) v threadu
jsou závislý instrukce, který nejdou paralelizovat c) čeká se na data (vzhledem k nepříliš velkýmu zisku při
zvětšení cache je todle ale spíš minoritní důvod)
"vyznam zdvojeneho ALU k jednomu FPU je u x86 architektury dost sporny"
Proto např. nehalem i C2D má poměr ALU+AGU ku SSE 5 ku 3.
edit: "k jednomu FPU" ma byt "k jednomu radici"
edit: A proto intel při přechodu od CD k C2D zvětšil počet ALU o jedna na tři a u nehalemu zdvojnásobil počet AGU....
HT byl samozřejmě dobrej nápad jak využít volný jednotky, ale v některejch případech to nešlo, protože tam byly úzký místa.
Tadle architektura vypadá, že některý z nich bude schopná odstranit. Jestli se odstranění těch úzkejch za navýšení počtu
tranzistorů vyplatí ukážou až reálný testy, jen mě udivuje, jak nějakej terorista z horní dolní je chytřejší než špičky
v oboru, který se analýzou využití jednotek a návrhem efektivního CPU zabejvaj třeba celej život.
Holt každej nejsme tak geniální, no....https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547559
+
"Procesor má ALU, AGU, Load/Store jednotky, dnes už nepříliš používaný FPU a MMX a SSE. Nejsi troll? Ty taky
počítaj stylem jedna, dva, tři, moc :-)."
mozna bys presvedcil lidi, co o tom nemaji ani shajn, ale ne me. to co ty jsi jmenoval, jako MMX a SSE nejsou instrukce omg, ale instruction sety. dal jsem si tu praci a zkusil spocist instrukce x86 u p4 (bez SSE). napocital jsem 322 (!!!) instruckci. pak jsem zacal pocitat instrukce z instrukcnich setu SSE, SSE2, x86-64, SSE3, SSSE3, SSE4, SSE5 a AES-NI, ale u 400 me to prestalo bavit a nedostal jsem se snad ani k SSE3. pokud se chce nekdo presvedcit, jak vam vesi logik buliky na nos, muzete si to overit zde
pocet instrukci a registru s tim souvisi dost jasne. kazda ta instrukce ma nejaky vypocetni obvod, mozna nekolik, mozna i sdilenych. zjednodusene: kdyz mam vlakno #1, ktere chce provest instrukci A a vlakno #2 ktere chce provest instrukci B, muzu udelat to, ze pokud mam volne registry, dam data pro vlakno #1 a instrukci A napriklad do registru R1 a R2, vystup operace pujde do R3, a pak data pro #2 a instrukci B do R4 a R5, vysledek pujde do R6 a pokud jsou ta data nezavisla a ty obvody nesdilene, muzu v jedne exekuci provest dve operace. samozrejme je tohle extremne zjednodusene, ale principielne by to mohlo odpovidat. ja jsem ale software it, lepe by to asi popsal muj kolega hardware it, jeste ze skoly, ale ten je ted v australii
"tranzistorů vyplatí ukážou až reálný testy, jen mě udivuje, jak nějakej terorista z horní dolní je chytřejší než špičky
v oboru" k tomuhle bych rekl ze je snad v celku jasne videt z toho meho prispevku, ze se jedna o dva ruzne pristupy. ja urcite nerozumim lip architekturam nez inzenyri amd a intel. ja se zastavam pristupu intelu, nic vic, nic min. pristup amd je proste trochu jiny a me nedava moc smysl. intel si ocividne mysli take ze jeho pristup je lepsi
takze ahoj, trole. doufam ze mas dost potravy, cekam rageflame
+1
+1
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
20. 7. 2010 - 10:59https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseachjo, logiku, ty si fakt logik :)
"Procesor má ALU, AGU, Load/Store jednotky, dnes už nepříliš používaný FPU a MMX a SSE. Nejsi troll? Ty taky
počítaj stylem jedna, dva, tři, moc :-)."
mozna bys presvedcil lidi, co o tom nemaji ani shajn, ale ne me. to co ty jsi jmenoval, jako MMX a SSE nejsou instrukce omg, ale instruction sety. dal jsem si tu praci a zkusil spocist instrukce x86 u p4 (bez SSE). napocital jsem 322 (!!!) instruckci. pak jsem zacal pocitat instrukce z instrukcnich setu SSE, SSE2, x86-64, SSE3, SSSE3, SSE4, SSE5 a AES-NI, ale u 400 me to prestalo bavit a nedostal jsem se snad ani k SSE3. pokud se chce nekdo presvedcit, jak vam vesi logik buliky na nos, muzete si to overit zde
http://en.wikipedia.org/wiki/X86_instruction_listings
pocet instrukci a registru s tim souvisi dost jasne. kazda ta instrukce ma nejaky vypocetni obvod, mozna nekolik, mozna i sdilenych. zjednodusene: kdyz mam vlakno #1, ktere chce provest instrukci A a vlakno #2 ktere chce provest instrukci B, muzu udelat to, ze pokud mam volne registry, dam data pro vlakno #1 a instrukci A napriklad do registru R1 a R2, vystup operace pujde do R3, a pak data pro #2 a instrukci B do R4 a R5, vysledek pujde do R6 a pokud jsou ta data nezavisla a ty obvody nesdilene, muzu v jedne exekuci provest dve operace. samozrejme je tohle extremne zjednodusene, ale principielne by to mohlo odpovidat. ja jsem ale software it, lepe by to asi popsal muj kolega hardware it, jeste ze skoly, ale ten je ted v australii
"tranzistorů vyplatí ukážou až reálný testy, jen mě udivuje, jak nějakej terorista z horní dolní je chytřejší než špičky
v oboru" k tomuhle bych rekl ze je snad v celku jasne videt z toho meho prispevku, ze se jedna o dva ruzne pristupy. ja urcite nerozumim lip architekturam nez inzenyri amd a intel. ja se zastavam pristupu intelu, nic vic, nic min. pristup amd je proste trochu jiny a me nedava moc smysl. intel si ocividne mysli take ze jeho pristup je lepsi
takze ahoj, trole. doufam ze mas dost potravy, cekam rageflamehttps://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547597
+
Auu. Kupodivu vim, že je těch instrukcí hafo.
Ty si ale tvrdil, že duplikovat jednotky se nevyplatí, protože je moc instrukcí a jednotky jsou nevytížený. To je prostě blbost.
Ve skutečnosti je ale (u x86) šest typů instrukcí (doufam, nepočítal jsem přesně) a každá jednotka v procesoru umí počítat libovolnou instrukci danýho typu
(viz dál). Ale zároveň umí počítat v jednu chvíli právě
jednu instrukci danýho typu (neberu v úvahu pipeline, ta na princi pu nic nemění). Navíc se některý (MMX, FP) nepoužívaj a jednotky často uměj víc typů (ALU/AGU).
Takže na tom, kolik těch instrukcí je opravdu NEZÁLEŽÍ. I když je spočítáš třeba třikrát a vyjde
Ti, že jich je 975 a půl, tak furt když máš v jádru
tři ALU jednotky, tak spočítáš najednou max tři ALU operace. I kdyby nakrásně každou z nich počítal úplně jinej kousek křemíku (což je další blbina, protože přinejmenším dekodér a datový cesty budou mít u jedný ALU stejně všechny instrukce společný).
Proto taky ALU (SSE atd..) jednotky má smysl duplikovat a dělaj to snad všechny procesorový architektury co znam. Naopak je to v podstatě jediná cesta, jak navýšit výkon procesoru v okamžiku, kdy se narazí na frekvenční strop danýho typu litografie.
"Já tomu nerozumím, já jen zastávám..."
To je právě to. Když nerozumíš, tak nezastávej, budou se Ti lidi smát.
PS: Upřesnim, aby mě zas netahali za slovo: ve skutečnosti často např. jen jedna z X jednotek umí opravdu všechny instrukce danýho typu, protože spousta instrukcí se buď vůbec nepoužívá, nebo tak zřídka, že by to bylo plejtvání.
PPS: A už vůbec jsou úsměvný argumenty o počtu instrukcí, když známá pravda je, že 90% kódu používá pouze 10% instrukcí. Instrukcí je sice hafo, ale to neznamená, že se používaj.
+1
0
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
20. 7. 2010 - 14:15https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseAuu. Kupodivu vim, že je těch instrukcí hafo.
Ty si ale tvrdil, že duplikovat jednotky se nevyplatí, protože je moc instrukcí a jednotky jsou nevytížený. To je prostě blbost.
Ve skutečnosti je ale (u x86) šest typů instrukcí (doufam, nepočítal jsem přesně) a každá jednotka v procesoru umí počítat libovolnou instrukci danýho typu
(viz dál). Ale zároveň umí počítat v jednu chvíli právě
jednu instrukci danýho typu (neberu v úvahu pipeline, ta na princi pu nic nemění). Navíc se některý (MMX, FP) nepoužívaj a jednotky často uměj víc typů (ALU/AGU).
Takže na tom, kolik těch instrukcí je opravdu NEZÁLEŽÍ. I když je spočítáš třeba třikrát a vyjde
Ti, že jich je 975 a půl, tak furt když máš v jádru
tři ALU jednotky, tak spočítáš najednou max tři ALU operace. I kdyby nakrásně každou z nich počítal úplně jinej kousek křemíku (což je další blbina, protože přinejmenším dekodér a datový cesty budou mít u jedný ALU stejně všechny instrukce společný).
Proto taky ALU (SSE atd..) jednotky má smysl duplikovat a dělaj to snad všechny procesorový architektury co znam. Naopak je to v podstatě jediná cesta, jak navýšit výkon procesoru v okamžiku, kdy se narazí na frekvenční strop danýho typu litografie.
"Já tomu nerozumím, já jen zastávám..."
To je právě to. Když nerozumíš, tak nezastávej, budou se Ti lidi smát.
PS: Upřesnim, aby mě zas netahali za slovo: ve skutečnosti často např. jen jedna z X jednotek umí opravdu všechny instrukce danýho typu, protože spousta instrukcí se buď vůbec nepoužívá, nebo tak zřídka, že by to bylo plejtvání.
PPS: A už vůbec jsou úsměvný argumenty o počtu instrukcí, když známá pravda je, že 90% kódu používá pouze 10% instrukcí. Instrukcí je sice hafo, ale to neznamená, že se používaj.
https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547644
+
hezky si moje
"ja urcite nerozumim lip architekturam nez inzenyri amd a intel. ja se zastavam"
tise zamenil na
"Já tomu nerozumím, já jen zastávám..."
kazdy ctenar s IQ vetsim nez forrest gump si o verohodnosti tve argumentace jiste udela obrazek :D
opet pokus o spis zde
"Ty si ale tvrdil, že duplikovat jednotky se nevyplatí, protože je moc instrukcí a jednotky jsou nevytížený. To je prostě blbost."
nic takoveho jsem netvrdil. tvrdim, ze se to da udelat jinak, ne ze to nejde tak, jak to dela amd (a jak ty si myslis, ze tomu rozumis, i kdyz ocividne netusis)
20. 7. 2010 - 16:04https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskusehezky si moje
"ja urcite nerozumim lip architekturam nez inzenyri amd a intel. ja se zastavam"
tise zamenil na
"Já tomu nerozumím, já jen zastávám..."
kazdy ctenar s IQ vetsim nez forrest gump si o verohodnosti tve argumentace jiste udela obrazek :D
opet pokus o spis zde
"Ty si ale tvrdil, že duplikovat jednotky se nevyplatí, protože je moc instrukcí a jednotky jsou nevytížený. To je prostě blbost."
nic takoveho jsem netvrdil. tvrdim, ze se to da udelat jinak, ne ze to nejde tak, jak to dela amd (a jak ty si myslis, ze tomu rozumis, i kdyz ocividne netusis)
prosim a precti si nekdy neco o tom, co pouzivas ve svych pokusech o argumenty, trochu si pletes pojmy s dojmy. treba tady o ALU
http://en.wikipedia.org/wiki/Arithmetic_logic_unit
tohle me opravdu bavi :DDDDhttps://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547663
+
Nějakej argument? Nebo alespoň co jsem napsal špatně?
Ok, končim diskusi, stejně to nemá cenu. Jen připomenu, s čim jsem od začátku polemizoval
"vyznam zdvojeneho ALU k jednomu FPU/řadiči je u x86 architektury dost sporny. x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat, protoze jejich vyuziti je jen obcasne"
(reakce na to, zdali má smysl mít v jádru více ALU).
a to sem úplně pominul, že FPU se už moc nepoužívá zřídka (FP se počítá pomocí SSE) a něco jako řadič
se v procesoru jaksi nenachází: http://upload.wikimedia.org/wikipedia/commons/6/64/Intel_Nehalem_arch.svg
(micro instruction sequencer je dekodér instrukcí a ne řadič)
+1
0
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
20. 7. 2010 - 16:46https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseNějakej argument? Nebo alespoň co jsem napsal špatně?
Ok, končim diskusi, stejně to nemá cenu. Jen připomenu, s čim jsem od začátku polemizoval
"vyznam zdvojeneho ALU k jednomu FPU/řadiči je u x86 architektury dost sporny. x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat, protoze jejich vyuziti je jen obcasne"
(reakce na to, zdali má smysl mít v jádru více ALU).
a to sem úplně pominul, že FPU se už moc nepoužívá zřídka (FP se počítá pomocí SSE) a něco jako řadič
se v procesoru jaksi nenachází:
http://upload.wikimedia.org/wikipedia/commons/6/64/Intel_Nehalem_arch.svg
(micro instruction sequencer je dekodér instrukcí a ne řadič)
https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547669
+
je fajn ze koncis, ale diskusi to prosim nenazivej, kdyz naprosto ocividne menis vyroky jinych tak, jak se ti to zrovna hodi :D
+1
+2
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
20. 7. 2010 - 17:36https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseje fajn ze koncis, ale diskusi to prosim nenazivej, kdyz naprosto ocividne menis vyroky jinych tak, jak se ti to zrovna hodi :Dhttps://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547683
+
Mno ... podle wiki Intelu zabíral Hyper-Threading na křemíku tak 5% navíc. A to ten procesor neměl L3 cache a paměťový řadič.
+1
+3
-1
Je komentář přínosný?
WIFT https://diit.cz/autor/wift
19. 7. 2010 - 16:37https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseMno ... podle wiki Intelu zabíral Hyper-Threading na křemíku tak 5% navíc. A to ten procesor neměl L3 cache a paměťový řadič.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547554
+
No imho v to ale nepočítaj všechny možný zdvojení cest, kapacity deko´dérů instrukcí atd., aby měl HT smysl.
+1
-6
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
19. 7. 2010 - 19:07https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseNo imho v to ale nepočítaj všechny možný zdvojení cest, kapacity deko´dérů instrukcí atd., aby měl HT smysl. https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547573
+
To nevím, jen jsem napsal, co jsem četl. Ověřit si to beztak nemám jak ;-). Jen tak od oka bych ale řekl, že dnes zabírá HT v procesorech asi trochu víc (čistě per jádro, a to jak v Core iX, tak třeba i v Atomu, i když tam je to těžko říci).
+1
+1
-1
Je komentář přínosný?
WIFT https://diit.cz/autor/wift
19. 7. 2010 - 19:51https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseTo nevím, jen jsem napsal, co jsem četl. Ověřit si to beztak nemám jak ;-). Jen tak od oka bych ale řekl, že dnes zabírá HT v procesorech asi trochu víc (čistě per jádro, a to jak v Core iX, tak třeba i v Atomu, i když tam je to těžko říci).https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547576
+
Stav turbo boostu u AMD je podle me danej tim, ze je to funkce pridana za pochodu. Pro poradny vysledky by se s tim muselo pocitat uz v navrhu CPU a urcite by taky pomohly mensi tranzistory. Intelu to tak krasne chodi jen diky odladenymu 32nm procesu.
+1
+3
-1
Je komentář přínosný?
JoHnY3 https://diit.cz/profil/johny3
19. 7. 2010 - 16:38https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseStav turbo boostu u AMD je podle me danej tim, ze je to funkce pridana za pochodu. Pro poradny vysledky by se s tim muselo pocitat uz v navrhu CPU a urcite by taky pomohly mensi tranzistory. Intelu to tak krasne chodi jen diky odladenymu 32nm procesu.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547556
+
Nesmysl. Turboboost krásně chodí od prvních 45nm nehalemů (i když tam byl pro jistotu konzervativní). Žádné změny krom agresivity se nedějí.
+1
+1
-1
Je komentář přínosný?
ptipi https://diit.cz/profil/ptipi
19. 7. 2010 - 17:49https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseNesmysl. Turboboost krásně chodí od prvních 45nm nehalemů (i když tam byl pro jistotu konzervativní). Žádné změny krom agresivity se nedějí.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547567
+
Jenze prave lepsi vyrobni proces umoznuje ty agresivitu, ktera z prijemny funkce dela dulezitou funkci. Souhlasim s tebou, ze i na 45nm to intelu chodi naprosto skvele.
+1
-2
-1
Je komentář přínosný?
JoHnY3 https://diit.cz/profil/johny3
19. 7. 2010 - 18:49https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseJenze prave lepsi vyrobni proces umoznuje ty agresivitu, ktera z prijemny funkce dela dulezitou funkci. Souhlasim s tebou, ze i na 45nm to intelu chodi naprosto skvele.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547572
+
Agresivní turboboost přišel už se socketem 1156(tzn je i na 45nm i7 8xx), ne až s 32nm procesory.
+1
+2
-1
Je komentář přínosný?
ptipi https://diit.cz/profil/ptipi
19. 7. 2010 - 22:20https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseAgresivní turboboost přišel už se socketem 1156(tzn je i na 45nm i7 8xx), ne až s 32nm procesory.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547582
+
Holt todle je přesně oblast, kde AMD platí daň za to, že to je hodně navrhovaný jako serverový procesory. Tam se prostě nosej jiný vlastnosti, než výkon jednoho jádra (a popř. jeho zvyšování).
Navíc když s TB navrhuješ čip od začátku, tak se třeba můžeš snažit nejvíc hřející části jednoho jádra dát daleko od sebe, aby nedošlo k lokálnímu přehřívání. U už hotovýho čipu něco takovýho uděláš těžko.
A navíc na tom AMD neni o tolik hůř: 860 jde z 2.8Ghz na 3.46, 1055T je z 2.8Ghz na 3.3, tzn. výsledná frekvence je jen o 5% nižší než u Intelu, a k tomu na tudle frekvenci u AMD stačí 50% zatíženejch jader zatimco u intelu musí běžet jen jedno.
Problém je víc v prostě už X let starý dejchavičný architektuře, která nemá tak dobrej poměr výkon/takt, než v o horší implementace turboboost/core. AMD holt potřebuje bagr jako sůl.
PS: Tim nemam nic proti K8/9, obzvlášť K8 byla svýho času dosti přelomová. Jen už je tu holt prostě dlouho.
+1
+1
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
19. 7. 2010 - 23:44https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseHolt todle je přesně oblast, kde AMD platí daň za to, že to je hodně navrhovaný jako serverový procesory. Tam se prostě nosej jiný vlastnosti, než výkon jednoho jádra (a popř. jeho zvyšování).
Navíc když s TB navrhuješ čip od začátku, tak se třeba můžeš snažit nejvíc hřející části jednoho jádra dát daleko od sebe, aby nedošlo k lokálnímu přehřívání. U už hotovýho čipu něco takovýho uděláš těžko.
A navíc na tom AMD neni o tolik hůř: 860 jde z 2.8Ghz na 3.46, 1055T je z 2.8Ghz na 3.3, tzn. výsledná frekvence je jen o 5% nižší než u Intelu, a k tomu na tudle frekvenci u AMD stačí 50% zatíženejch jader zatimco u intelu musí běžet jen jedno.
Problém je víc v prostě už X let starý dejchavičný architektuře, která nemá tak dobrej poměr výkon/takt, než v o horší implementace turboboost/core. AMD holt potřebuje bagr jako sůl.
PS: Tim nemam nic proti K8/9, obzvlášť K8 byla svýho času dosti přelomová. Jen už je tu holt prostě dlouho.
https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547583
+
"Problém je víc v prostě už X let starý dejchavičný architektuře, která nemá tak dobrej poměr výkon/takt, než v o horší implementace turboboost/core"
turboboost/core mi rozhodne neprijde horsi, spis technologicky mnohem vyspelejsi. nevsiml jsem si ze by amd sporila energii powergatingem (a vypinanim celych casti procesoru, driv jen core, ted i un-core). pokud vim tak amd pouze podtaktovava
+1
+5
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
20. 7. 2010 - 10:26https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse"Problém je víc v prostě už X let starý dejchavičný architektuře, která nemá tak dobrej poměr výkon/takt, než v o horší implementace turboboost/core"
turboboost/core mi rozhodne neprijde horsi, spis technologicky mnohem vyspelejsi. nevsiml jsem si ze by amd sporila energii powergatingem (a vypinanim celych casti procesoru, driv jen core, ted i un-core). pokud vim tak amd pouze podtaktovavahttps://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547595
+
No tak to víš (zas :-)) špatně. I AMD vypíná části čipu:
"AMD CoolCore™ Technology - Helps users get more efficient performance by dynamically activating or turning off parts of the processor. "
byť to asi nedělá tak efektivně jako nehalem http://www.amd.com/us/products/technologies/cool-n-quiet/Pages/cool-n-qu...
A navíc turboboost a turbocore jsou názvy konkurenčních technologií (intel/AMD), takže dost nevim, kdo proti čemu maj bejt horší (teda vim, ale spíš z toho vyplývá, žes to nevěděl ty a tak nepochopil předchozí větu), ale to je detail.
Ale jinak ano, Nehalem má myslím o něco vyspělejší správu napájení (seřadil bych to Nehalem - Phenom II - C2D), nicméně správa napájení není špatná ani u Phenomu, to co schází Phenomu ke konkurenceschopnosti oproti Nehalemu je výkon, nikoli spotřeba, ať v idle nebo v zátěži.
+1
0
-1
Je komentář přínosný?
Logik KarelVomáčka https://diit.cz/profil/logik
20. 7. 2010 - 19:54https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseNo tak to víš (zas :-)) špatně. I AMD vypíná části čipu:
"AMD CoolCore™ Technology - Helps users get more efficient performance by dynamically activating or turning off parts of the processor. "
byť to asi nedělá tak efektivně jako nehalem
http://www.amd.com/us/products/technologies/cool-n-quiet/Pages/cool-n-quiet.aspx
A navíc turboboost a turbocore jsou názvy konkurenčních technologií (intel/AMD), takže dost nevim, kdo proti čemu maj bejt horší (teda vim, ale spíš z toho vyplývá, žes to nevěděl ty a tak nepochopil předchozí větu), ale to je detail.
Ale jinak ano, Nehalem má myslím o něco vyspělejší správu napájení (seřadil bych to Nehalem - Phenom II - C2D), nicméně správa napájení není špatná ani u Phenomu, to co schází Phenomu ke konkurenceschopnosti oproti Nehalemu je výkon, nikoli spotřeba, ať v idle nebo v zátěži.https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547699
+
az na to ze se tu bavime o turbu a to tve coolcore je v amd cpu uz jaksi podstatne delsi dobu, nez turbocore. alas, s tim, ze amd pri turbu pouziva pouze podtaktovani to nema nic spolecneho. takze pokracuj v dokazovani ze modra je modra a proto i ty musis mit pravdu. celkem dobre se bavim :)
+1
0
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
20. 7. 2010 - 22:06https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseaz na to ze se tu bavime o turbu a to tve coolcore je v amd cpu uz jaksi podstatne delsi dobu, nez turbocore. alas, s tim, ze amd pri turbu pouziva pouze podtaktovani to nema nic spolecneho. takze pokracuj v dokazovani ze modra je modra a proto i ty musis mit pravdu. celkem dobre se bavim :)https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547717
+
Reagovat na terrorista nemá smysl, vždy si bude stát za svým ikdyž mu napíšete milion argumentů. Znám pár takových případů, býval jsem moderátor na jednom hojně fregmentovaném fóru, avšak jsem právě neměl čas ani nervy se s individui typu terrorist apod. otravovat, a vám radím to samé :-)
+1
-4
-1
Je komentář přínosný?
tslany https://diit.cz/profil/tslany
21. 7. 2010 - 17:36https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseReagovat na terrorista nemá smysl, vždy si bude stát za svým ikdyž mu napíšete milion argumentů. Znám pár takových případů, býval jsem moderátor na jednom hojně fregmentovaném fóru, avšak jsem právě neměl čas ani nervy se s individui typu terrorist apod. otravovat, a vám radím to samé :-)https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547954
+
za to u tebe neni na co reagovat, ne? zadne argumenty, spousty urazek :) a ocividne jsi tak rozezleny a navstekany, ze mas potrebu zaspamovat vsechny clanky na diit.cz tim samym copy+paste urazko-blabolem ;)
+1
0
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
21. 7. 2010 - 19:16https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuseza to u tebe neni na co reagovat, ne? zadne argumenty, spousty urazek :) a ocividne jsi tak rozezleny a navstekany, ze mas potrebu zaspamovat vsechny clanky na diit.cz tim samym copy+paste urazko-blabolem ;)https://diit.cz/clanek/amd-poslala-prvni-vzorky-procesoru-s-jadry-bulldozer-do-vyroby/diskuse#comment-547975
+
tak na toto jsem zvedavej...
Hodně pochybuji, že letos bude komukoliv dostupný bulldozer a i s příštím rokem (rozhodně první polovinou) mám velké pochyby. Tohle není GPU, kde po tapeoutu to jde poměrně rychle.
Pro srovnání - intel už na IDF 2009 ukazoval funkční sandy bridge(tzn skoro rok nazpět) a už nějakou dobu před tím na netu koloval dieshot(ani v této fázi bulldozer ještě není). A ještě stále cpu se sandy bridge nikde nejsou a chvilku nebudou.
nemuzu si pomoct, ale o 1 a 3/4 jadru se mluvilo uz kdyz intel u starych p4 (tech co byly jeste hodne dobre, jeste pred tragedii prescott) uvedl hyper-threading, ktere se take v systemu tvarilo jako dve jadra. obe jadra take sdilela cache atd.
prijde mi, ze stejne jako se amd snazi "zkopirovat" do svych cpu intelacky turbo boost, hodla to same udelat i u hyper-threadingu. pripomenu, ze nikdo vlastne nevi, co bylo soucasti dohody intelu a amd o mimosoudnim vyrovnani. a je docela dobre mozne, ze jim intel patenty na hyper-threading a na technologie zabyvajici se turbo boostem uvolnil. turbo boost v podani amd je sice docela tragicky v poravnani s intelem, ale ve viceprocesorovych resenich ma amd docela dobre know-how a tim padem by v tomhle mohla intel dohnat
Kdy se v době P4 mluvilo o 1 a 3/4 jádru? Tohle je celkem dost odlišná situace. Hyperthreading u Intelu je spíš takové 1 a 1/4 jádro, virtuální dvoujádro s minimem tranzistorů navíc, kde jednotlivá vlákna sdílejí stejné výpočetní jednotky, kde díky tomu že je jedno vlákno většinou nevytíží dochází k mírnému zvýšení výkonu. Bulldozer má dvě samostatný jádra sdílející jednu FPU a výkonový nárůst je tak proti jednojádru vyšší než u hyperthreading, samozřejmě za cenu vyššího nárůstu počtu tranzistorů. AMD nejspíš počítá s tím že vysoce paralelizované výpočty se přesunou na grafické karty a FPU v procesoru nebude tolik potřeba.
Taky i když počítáš čistě ve FP, tak potřebuješ cykly, skoky, adresace.... a to všechno dělaj ALU.
Na druhou stranu inspirace HT se nedá zapřít, byť tu vidím i inspiraci z GPU - řídící logika ovládá různý výpočetní jednotky a přiřazuje je jak je zrovna třeba k threadům. Ale na skutečný soudy bych počkal až to opravdu vyleze.
Nicméně o bagru je slyšet už hodně dlouho, tak doufám, že to bude stejně povedená architektura jako K8, čím budou výkonnostně AMD s intelem blíž, tím líp (s tím, že díky marketingové převaze a tržní síle intelu je lepší, když vede AMD než naopak).
tak to si muze kazdy precist na wikipedii. vyznam zdvojeneho ALU k jednomu FPU je u x86 architektury dost sporny. x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat, protoze jejich vyuziti je jen obcasne. zcela jiste se hyper-threadingu bude hure darit naplanovat incrementaci promenne nez nejakou slozitejsi bitovou transformaci. moc dobre si vzpominam jak nekteri lide pri nastupu tvrdili (i z mych pratel s athlony xp), jak bude hyper-threading k nicemu. ani je moc nepresvedcily me ukazky vypoctu super pi za rekneme minutu a kdyz jsem ty programy pustil dva najednou, nedaly to za 2 minuty, ale za 1.4 minuty (ale take ani ne za 1 minutu, jak by to dnes bylo s dvoujadry). dneska chteji multicore processory vsichni a ti sami lide, co ht zatracovali, mi rikaji, ze muzou mit i sest jader na jejich platforme
abych to schrnul, mas pravdu, ze fyzicky je to u HT spise 1 a 1/4 jadra, vykonove to uz ale dost zalezi na pripadu pouziti a nasazeni a pro bezne pouziti muze byt HT docela dobre 1 a 3/4 jadra
"k jednomu FPU" ma byt "k jednomu radici"
Teda promiň, ale teda tomu fakt rozumíš:
"x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat,
protoze jejich vyuziti je jen obcasne"
Procesor má ALU, AGU, Load/Store jednotky, dnes už nepříliš používaný FPU a MMX a SSE. Nejsi troll? Ty taky
počítaj stylem jedna, dva, tři, moc :-). Navíc mimo SSE každej program ty první tři jmenovaný bude využívat
(ALU na cykly, countery, velikosti, AGU je jasná a data taky potřebuje každej).
To, že SSE jednotky uměj (plácnu) desetkrát tolik instrukcí než co v PIII, to je jaksi procesoru jedno, protože
ta jednotka v jednu chvíli udělá jen jednu instrukci (zanedbávám pipeline).
Jak s tim souvisí počet registrů už jaksi vůbec netušim (teda vlastně vim, čim je jich víc, tim spíš půjdou
ty jednotky zaplnit, protože budou mít k dispozici data).
Jednotky v procesorech jsou nevyužitý hlavně díky tomu, že a) plánovač je nezvládne naplánovat, b) v threadu
jsou závislý instrukce, který nejdou paralelizovat c) čeká se na data (vzhledem k nepříliš velkýmu zisku při
zvětšení cache je todle ale spíš minoritní důvod)
"vyznam zdvojeneho ALU k jednomu FPU je u x86 architektury dost sporny"
Proto např. nehalem i C2D má poměr ALU+AGU ku SSE 5 ku 3.
edit: "k jednomu FPU" ma byt "k jednomu radici"
edit: A proto intel při přechodu od CD k C2D zvětšil počet ALU o jedna na tři a u nehalemu zdvojnásobil počet AGU....
HT byl samozřejmě dobrej nápad jak využít volný jednotky, ale v některejch případech to nešlo, protože tam byly úzký místa.
Tadle architektura vypadá, že některý z nich bude schopná odstranit. Jestli se odstranění těch úzkejch za navýšení počtu
tranzistorů vyplatí ukážou až reálný testy, jen mě udivuje, jak nějakej terorista z horní dolní je chytřejší než špičky
v oboru, který se analýzou využití jednotek a návrhem efektivního CPU zabejvaj třeba celej život.
Holt každej nejsme tak geniální, no....
achjo, logiku, ty si fakt logik :)
"Procesor má ALU, AGU, Load/Store jednotky, dnes už nepříliš používaný FPU a MMX a SSE. Nejsi troll? Ty taky
počítaj stylem jedna, dva, tři, moc :-)."
mozna bys presvedcil lidi, co o tom nemaji ani shajn, ale ne me. to co ty jsi jmenoval, jako MMX a SSE nejsou instrukce omg, ale instruction sety. dal jsem si tu praci a zkusil spocist instrukce x86 u p4 (bez SSE). napocital jsem 322 (!!!) instruckci. pak jsem zacal pocitat instrukce z instrukcnich setu SSE, SSE2, x86-64, SSE3, SSSE3, SSE4, SSE5 a AES-NI, ale u 400 me to prestalo bavit a nedostal jsem se snad ani k SSE3. pokud se chce nekdo presvedcit, jak vam vesi logik buliky na nos, muzete si to overit zde
http://en.wikipedia.org/wiki/X86_instruction_listings
pocet instrukci a registru s tim souvisi dost jasne. kazda ta instrukce ma nejaky vypocetni obvod, mozna nekolik, mozna i sdilenych. zjednodusene: kdyz mam vlakno #1, ktere chce provest instrukci A a vlakno #2 ktere chce provest instrukci B, muzu udelat to, ze pokud mam volne registry, dam data pro vlakno #1 a instrukci A napriklad do registru R1 a R2, vystup operace pujde do R3, a pak data pro #2 a instrukci B do R4 a R5, vysledek pujde do R6 a pokud jsou ta data nezavisla a ty obvody nesdilene, muzu v jedne exekuci provest dve operace. samozrejme je tohle extremne zjednodusene, ale principielne by to mohlo odpovidat. ja jsem ale software it, lepe by to asi popsal muj kolega hardware it, jeste ze skoly, ale ten je ted v australii
"tranzistorů vyplatí ukážou až reálný testy, jen mě udivuje, jak nějakej terorista z horní dolní je chytřejší než špičky
v oboru" k tomuhle bych rekl ze je snad v celku jasne videt z toho meho prispevku, ze se jedna o dva ruzne pristupy. ja urcite nerozumim lip architekturam nez inzenyri amd a intel. ja se zastavam pristupu intelu, nic vic, nic min. pristup amd je proste trochu jiny a me nedava moc smysl. intel si ocividne mysli take ze jeho pristup je lepsi
takze ahoj, trole. doufam ze mas dost potravy, cekam rageflame
Auu. Kupodivu vim, že je těch instrukcí hafo.
Ty si ale tvrdil, že duplikovat jednotky se nevyplatí, protože je moc instrukcí a jednotky jsou nevytížený. To je prostě blbost.
Ve skutečnosti je ale (u x86) šest typů instrukcí (doufam, nepočítal jsem přesně) a každá jednotka v procesoru umí počítat libovolnou instrukci danýho typu
(viz dál). Ale zároveň umí počítat v jednu chvíli právě
jednu instrukci danýho typu (neberu v úvahu pipeline, ta na princi pu nic nemění). Navíc se některý (MMX, FP) nepoužívaj a jednotky často uměj víc typů (ALU/AGU).
Takže na tom, kolik těch instrukcí je opravdu NEZÁLEŽÍ. I když je spočítáš třeba třikrát a vyjde
Ti, že jich je 975 a půl, tak furt když máš v jádru
tři ALU jednotky, tak spočítáš najednou max tři ALU operace. I kdyby nakrásně každou z nich počítal úplně jinej kousek křemíku (což je další blbina, protože přinejmenším dekodér a datový cesty budou mít u jedný ALU stejně všechny instrukce společný).
Proto taky ALU (SSE atd..) jednotky má smysl duplikovat a dělaj to snad všechny procesorový architektury co znam. Naopak je to v podstatě jediná cesta, jak navýšit výkon procesoru v okamžiku, kdy se narazí na frekvenční strop danýho typu litografie.
"Já tomu nerozumím, já jen zastávám..."
To je právě to. Když nerozumíš, tak nezastávej, budou se Ti lidi smát.
PS: Upřesnim, aby mě zas netahali za slovo: ve skutečnosti často např. jen jedna z X jednotek umí opravdu všechny instrukce danýho typu, protože spousta instrukcí se buď vůbec nepoužívá, nebo tak zřídka, že by to bylo plejtvání.
PPS: A už vůbec jsou úsměvný argumenty o počtu instrukcí, když známá pravda je, že 90% kódu používá pouze 10% instrukcí. Instrukcí je sice hafo, ale to neznamená, že se používaj.
hezky si moje
"ja urcite nerozumim lip architekturam nez inzenyri amd a intel. ja se zastavam"
tise zamenil na
"Já tomu nerozumím, já jen zastávám..."
kazdy ctenar s IQ vetsim nez forrest gump si o verohodnosti tve argumentace jiste udela obrazek :D
opet pokus o spis zde
"Ty si ale tvrdil, že duplikovat jednotky se nevyplatí, protože je moc instrukcí a jednotky jsou nevytížený. To je prostě blbost."
nic takoveho jsem netvrdil. tvrdim, ze se to da udelat jinak, ne ze to nejde tak, jak to dela amd (a jak ty si myslis, ze tomu rozumis, i kdyz ocividne netusis)
prosim a precti si nekdy neco o tom, co pouzivas ve svych pokusech o argumenty, trochu si pletes pojmy s dojmy. treba tady o ALU
http://en.wikipedia.org/wiki/Arithmetic_logic_unit
tohle me opravdu bavi :DDDD
Nějakej argument? Nebo alespoň co jsem napsal špatně?
Ok, končim diskusi, stejně to nemá cenu. Jen připomenu, s čim jsem od začátku polemizoval
"vyznam zdvojeneho ALU k jednomu FPU/řadiči je u x86 architektury dost sporny. x86 ma dnes tak obrovskou mnozinu instrukci a registru, ze naprosto neni nutne nektere casti zdvojovat, protoze jejich vyuziti je jen obcasne"
(reakce na to, zdali má smysl mít v jádru více ALU).
a to sem úplně pominul, že FPU se už moc nepoužívá zřídka (FP se počítá pomocí SSE) a něco jako řadič
se v procesoru jaksi nenachází:
http://upload.wikimedia.org/wikipedia/commons/6/64/Intel_Nehalem_arch.svg
(micro instruction sequencer je dekodér instrukcí a ne řadič)
je fajn ze koncis, ale diskusi to prosim nenazivej, kdyz naprosto ocividne menis vyroky jinych tak, jak se ti to zrovna hodi :D
Mno ... podle wiki Intelu zabíral Hyper-Threading na křemíku tak 5% navíc. A to ten procesor neměl L3 cache a paměťový řadič.
No imho v to ale nepočítaj všechny možný zdvojení cest, kapacity deko´dérů instrukcí atd., aby měl HT smysl.
To nevím, jen jsem napsal, co jsem četl. Ověřit si to beztak nemám jak ;-). Jen tak od oka bych ale řekl, že dnes zabírá HT v procesorech asi trochu víc (čistě per jádro, a to jak v Core iX, tak třeba i v Atomu, i když tam je to těžko říci).
Stav turbo boostu u AMD je podle me danej tim, ze je to funkce pridana za pochodu. Pro poradny vysledky by se s tim muselo pocitat uz v navrhu CPU a urcite by taky pomohly mensi tranzistory. Intelu to tak krasne chodi jen diky odladenymu 32nm procesu.
Nesmysl. Turboboost krásně chodí od prvních 45nm nehalemů (i když tam byl pro jistotu konzervativní). Žádné změny krom agresivity se nedějí.
Jenze prave lepsi vyrobni proces umoznuje ty agresivitu, ktera z prijemny funkce dela dulezitou funkci. Souhlasim s tebou, ze i na 45nm to intelu chodi naprosto skvele.
Agresivní turboboost přišel už se socketem 1156(tzn je i na 45nm i7 8xx), ne až s 32nm procesory.
Holt todle je přesně oblast, kde AMD platí daň za to, že to je hodně navrhovaný jako serverový procesory. Tam se prostě nosej jiný vlastnosti, než výkon jednoho jádra (a popř. jeho zvyšování).
Navíc když s TB navrhuješ čip od začátku, tak se třeba můžeš snažit nejvíc hřející části jednoho jádra dát daleko od sebe, aby nedošlo k lokálnímu přehřívání. U už hotovýho čipu něco takovýho uděláš těžko.
A navíc na tom AMD neni o tolik hůř: 860 jde z 2.8Ghz na 3.46, 1055T je z 2.8Ghz na 3.3, tzn. výsledná frekvence je jen o 5% nižší než u Intelu, a k tomu na tudle frekvenci u AMD stačí 50% zatíženejch jader zatimco u intelu musí běžet jen jedno.
Problém je víc v prostě už X let starý dejchavičný architektuře, která nemá tak dobrej poměr výkon/takt, než v o horší implementace turboboost/core. AMD holt potřebuje bagr jako sůl.
PS: Tim nemam nic proti K8/9, obzvlášť K8 byla svýho času dosti přelomová. Jen už je tu holt prostě dlouho.
"Problém je víc v prostě už X let starý dejchavičný architektuře, která nemá tak dobrej poměr výkon/takt, než v o horší implementace turboboost/core"
turboboost/core mi rozhodne neprijde horsi, spis technologicky mnohem vyspelejsi. nevsiml jsem si ze by amd sporila energii powergatingem (a vypinanim celych casti procesoru, driv jen core, ted i un-core). pokud vim tak amd pouze podtaktovava
No tak to víš (zas :-)) špatně. I AMD vypíná části čipu:
"AMD CoolCore™ Technology - Helps users get more efficient performance by dynamically activating or turning off parts of the processor. "
byť to asi nedělá tak efektivně jako nehalem
http://www.amd.com/us/products/technologies/cool-n-quiet/Pages/cool-n-qu...
A navíc turboboost a turbocore jsou názvy konkurenčních technologií (intel/AMD), takže dost nevim, kdo proti čemu maj bejt horší (teda vim, ale spíš z toho vyplývá, žes to nevěděl ty a tak nepochopil předchozí větu), ale to je detail.
Ale jinak ano, Nehalem má myslím o něco vyspělejší správu napájení (seřadil bych to Nehalem - Phenom II - C2D), nicméně správa napájení není špatná ani u Phenomu, to co schází Phenomu ke konkurenceschopnosti oproti Nehalemu je výkon, nikoli spotřeba, ať v idle nebo v zátěži.
az na to ze se tu bavime o turbu a to tve coolcore je v amd cpu uz jaksi podstatne delsi dobu, nez turbocore. alas, s tim, ze amd pri turbu pouziva pouze podtaktovani to nema nic spolecneho. takze pokracuj v dokazovani ze modra je modra a proto i ty musis mit pravdu. celkem dobre se bavim :)
Reagovat na terrorista nemá smysl, vždy si bude stát za svým ikdyž mu napíšete milion argumentů. Znám pár takových případů, býval jsem moderátor na jednom hojně fregmentovaném fóru, avšak jsem právě neměl čas ani nervy se s individui typu terrorist apod. otravovat, a vám radím to samé :-)
za to u tebe neni na co reagovat, ne? zadne argumenty, spousty urazek :) a ocividne jsi tak rozezleny a navstekany, ze mas potrebu zaspamovat vsechny clanky na diit.cz tim samym copy+paste urazko-blabolem ;)
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.