..dvakrat nevstoupis do stejne reky ? :-)) aby si pak milej rambus technologii neopatetoval pro sebe :-)))
+1
0
-1
Je komentář přínosný?
ANDREW https://diit.cz/profil/andrew
21. 9. 2009 - 00:32https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse..dvakrat nevstoupis do stejne reky ? :-)) aby si pak milej rambus technologii neopatetoval pro sebe :-)))https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511850
+
21. 9. 2009 - 02:11https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse>Upřímně řečeno tuto snahu jsme trochu nepobrali
viz http://www.rambus.com/us/patents/innovations/detail/module_threading.htmlhttps://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511853
+
I kdyby to podporoval radic pameti, tak to zadny prinos mit nebude protoze veskera data prochazeji pres cache, ktera ma urcitou asociativitu - od prave 8B nebo 16B (sirka pametove zbernice: 64 ci 128bit v dualu) po 4KB (velikost stranky procesoru). V realu spis ty vetsi hodnoty..
Postup popisovany na tech strankach je ale udelani neceho jako "pul modulu", tj. uplne opacny postup jak dual pameti. Muze to mit vliv treba na nahodny zapis, ktery muze probihat paralelne, ale cteni je vzdy blokove - viz pomer CAS/RAS k prenesenym datum - kdo by cekal treba 16 taktu aby mohl zapsat 1B? To se prece nedela - cte se vzdy cely radek do cache pameti :)
+1
0
-1
Je komentář přínosný?
rda (neověřeno) https://diit.cz
21. 9. 2009 - 06:42https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuseI kdyby to podporoval radic pameti, tak to zadny prinos mit nebude protoze veskera data prochazeji pres cache, ktera ma urcitou asociativitu - od prave 8B nebo 16B (sirka pametove zbernice: 64 ci 128bit v dualu) po 4KB (velikost stranky procesoru). V realu spis ty vetsi hodnoty..
Postup popisovany na tech strankach je ale udelani neceho jako "pul modulu", tj. uplne opacny postup jak dual pameti. Muze to mit vliv treba na nahodny zapis, ktery muze probihat paralelne, ale cteni je vzdy blokove - viz pomer CAS/RAS k prenesenym datum - kdo by cekal treba 16 taktu aby mohl zapsat 1B? To se prece nedela - cte se vzdy cely radek do cache pameti :)https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511855
+
TomK: Pokud jsem to spravne pochopil, tak se jedna o rozdeleni soucasneho 64-bit modulu na 2 32-bitove, ktere budou mit vlastni nezavislou adresaci.
Mne se to zda zajimave a myslim si, ze budoucnost urcite v nejake forme bude vyuzivat paralelismus pro pristup k pametem. Za chvili bude mit kazde CPU vic jader nez meloun. A pametovy subsystem se za posledni roky nijak revolucne nezmenil.
+1
0
-1
Je komentář přínosný?
TomK (neověřeno) https://diit.cz
21. 9. 2009 - 08:48https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuseTomK: Pokud jsem to spravne pochopil, tak se jedna o rozdeleni soucasneho 64-bit modulu na 2 32-bitove, ktere budou mit vlastni nezavislou adresaci.
Mne se to zda zajimave a myslim si, ze budoucnost urcite v nejake forme bude vyuzivat paralelismus pro pristup k pametem. Za chvili bude mit kazde CPU vic jader nez meloun. A pametovy subsystem se za posledni roky nijak revolucne nezmenil.https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511859
+
No v podstate jde jen o vyplneni mezery kdy se ceka na prenastaveni pristupu k adresam, tj. je tam nejaka "fronta" pozadavku, ze ktery si je "vlakna" vyzvedavaji, a tak je sbernice na operaci uz "predpripravena" a muze ji rovnou provest. V praxi to pak funguje podobne jako pipelining, tj. minimalizuji se cekaci casy tim ze se dela cast operace v dobe nez ta druha se dodela. Teda jestli jsem to dobre pochopil.
+1
0
-1
Je komentář přínosný?
HejtmaMa (neověřeno) https://diit.cz
21. 9. 2009 - 10:20https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuseNo v podstate jde jen o vyplneni mezery kdy se ceka na prenastaveni pristupu k adresam, tj. je tam nejaka "fronta" pozadavku, ze ktery si je "vlakna" vyzvedavaji, a tak je sbernice na operaci uz "predpripravena" a muze ji rovnou provest. V praxi to pak funguje podobne jako pipelining, tj. minimalizuji se cekaci casy tim ze se dela cast operace v dobe nez ta druha se dodela. Teda jestli jsem to dobre pochopil.https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511867
+
paco: nechtel jsem to michat jen jsem si nebyl jistej s tim "CacheLine" size. Coz je 64B, takze ta delena pamet nepujde vyuzit s temito procesory.. a nasel jsem dalsi duvod:
Veci v pameti jsou ulozeny stylem "RAID0", tj. paralelne. K cemu nam bude pristup ke kazde druhe ctverici bajtu?
+1
0
-1
Je komentář přínosný?
rda (neověřeno) https://diit.cz
21. 9. 2009 - 20:47https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskusepaco: nechtel jsem to michat jen jsem si nebyl jistej s tim "CacheLine" size. Coz je 64B, takze ta delena pamet nepujde vyuzit s temito procesory.. a nasel jsem dalsi duvod:
Veci v pameti jsou ulozeny stylem "RAID0", tj. paralelne. K cemu nam bude pristup ke kazde druhe ctverici bajtu? https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511961
+
rda: ta delena pamet samozrejme s temito procesory vyuzit pujde, procesor si proste rekne o 64B cache line pametovemu radici, ktery se s tim nejak popere
procesor nezajima, zda data byla jiz v bufferu radice (speculative prefetching), nactena z jednoho DDR3 modulu jednokanalovym (64bit) 8n burstem, nactena dvoukanalovym (128bit v ganged mode) 4n burstem ze dvou modulu, nebo zda slo o prenos z vicevlaknoveho modulu
vicevlaknovy modul bude sice vykazovat vyssi latenci (musi provest dve po sobe nasledujici cteni ~ 5ns u DDR3@1600Mbps), ale take az o 50% vyssi propustnost (6x64B vs 4x64B za tFAW~30ns)
viz mspaint bastl http://img33.yfrog.com/i/ddr3threaded.jpg/
+1
0
-1
Je komentář přínosný?
paco https://diit.cz/profil/paco
22. 9. 2009 - 00:07https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuserda: ta delena pamet samozrejme s temito procesory vyuzit pujde, procesor si proste rekne o 64B cache line pametovemu radici, ktery se s tim nejak popere
procesor nezajima, zda data byla jiz v bufferu radice (speculative prefetching), nactena z jednoho DDR3 modulu jednokanalovym (64bit) 8n burstem, nactena dvoukanalovym (128bit v ganged mode) 4n burstem ze dvou modulu, nebo zda slo o prenos z vicevlaknoveho modulu
vicevlaknovy modul bude sice vykazovat vyssi latenci (musi provest dve po sobe nasledujici cteni ~ 5ns u DDR3@1600Mbps), ale take az o 50% vyssi propustnost (6x64B vs 4x64B za tFAW~30ns)
viz mspaint bastl http://img33.yfrog.com/i/ddr3threaded.jpg/https://diit.cz/clanek/rambus-a-kingston-spolupracuji-na-vicevlaknovych-pametovych-modulech/diskuse#comment-511975
+
..dvakrat nevstoupis do stejne reky ? :-)) aby si pak milej rambus technologii neopatetoval pro sebe :-)))
>Upřímně řečeno tuto snahu jsme trochu nepobrali
viz http://www.rambus.com/us/patents/innovations/detail/module_threading.html
I kdyby to podporoval radic pameti, tak to zadny prinos mit nebude protoze veskera data prochazeji pres cache, ktera ma urcitou asociativitu - od prave 8B nebo 16B (sirka pametove zbernice: 64 ci 128bit v dualu) po 4KB (velikost stranky procesoru). V realu spis ty vetsi hodnoty..
Postup popisovany na tech strankach je ale udelani neceho jako "pul modulu", tj. uplne opacny postup jak dual pameti. Muze to mit vliv treba na nahodny zapis, ktery muze probihat paralelne, ale cteni je vzdy blokove - viz pomer CAS/RAS k prenesenym datum - kdo by cekal treba 16 taktu aby mohl zapsat 1B? To se prece nedela - cte se vzdy cely radek do cache pameti :)
TomK: Pokud jsem to spravne pochopil, tak se jedna o rozdeleni soucasneho 64-bit modulu na 2 32-bitove, ktere budou mit vlastni nezavislou adresaci.
Mne se to zda zajimave a myslim si, ze budoucnost urcite v nejake forme bude vyuzivat paralelismus pro pristup k pametem. Za chvili bude mit kazde CPU vic jader nez meloun. A pametovy subsystem se za posledni roky nijak revolucne nezmenil.
On Kingston vazne neco vyrabi? ja myslel, ze preprodava OEM produkty jako spousta dalsich...
No v podstate jde jen o vyplneni mezery kdy se ceka na prenastaveni pristupu k adresam, tj. je tam nejaka "fronta" pozadavku, ze ktery si je "vlakna" vyzvedavaji, a tak je sbernice na operaci uz "predpripravena" a muze ji rovnou provest. V praxi to pak funguje podobne jako pipelining, tj. minimalizuji se cekaci casy tim ze se dela cast operace v dobe nez ta druha se dodela. Teda jestli jsem to dobre pochopil.
rda: prijde mi, ze michas nekolik ruznych veci dohromady
jako cache line size (64B), cache associativity (direct mapped, n-way, fully associative), virtual memory page size (4KB, 2MB, 4MB), SDRAM row size (1K), ..
paco: nechtel jsem to michat jen jsem si nebyl jistej s tim "CacheLine" size. Coz je 64B, takze ta delena pamet nepujde vyuzit s temito procesory.. a nasel jsem dalsi duvod:
Veci v pameti jsou ulozeny stylem "RAID0", tj. paralelne. K cemu nam bude pristup ke kazde druhe ctverici bajtu?
rda: ta delena pamet samozrejme s temito procesory vyuzit pujde, procesor si proste rekne o 64B cache line pametovemu radici, ktery se s tim nejak popere
procesor nezajima, zda data byla jiz v bufferu radice (speculative prefetching), nactena z jednoho DDR3 modulu jednokanalovym (64bit) 8n burstem, nactena dvoukanalovym (128bit v ganged mode) 4n burstem ze dvou modulu, nebo zda slo o prenos z vicevlaknoveho modulu
vicevlaknovy modul bude sice vykazovat vyssi latenci (musi provest dve po sobe nasledujici cteni ~ 5ns u DDR3@1600Mbps), ale take az o 50% vyssi propustnost (6x64B vs 4x64B za tFAW~30ns)
viz mspaint bastl http://img33.yfrog.com/i/ddr3threaded.jpg/
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.