"Nová L1 cache je unifikovaná (slouží pro data i textury - na rozdíl od Caymanu a Fermi), .."
fermi ma unifikovanou cache. ovsem kvuli zachovani kompatibility se starymi GPGPU aplikacemi muze fungovat take jako u GT200, pokud je to potreba
"NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications."
+1
-1
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
21. 6. 2011 - 02:32https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse"Nová L1 cache je unifikovaná (slouží pro data i textury - na rozdíl od Caymanu a Fermi), .."
fermi ma unifikovanou cache. ovsem kvuli zachovani kompatibility se starymi GPGPU aplikacemi muze fungovat take jako u GT200, pokud je to potreba
"NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications."https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588235
+
Fermi má sdílenou L1 data cache s LDS (shared memory), ale texture cache je stále samostatná (12kb na quad).
+1
-3
-1
Je komentář přínosný?
no-X https://diit.cz/autor/no-x
21. 6. 2011 - 09:13https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseFermi má sdílenou L1 data cache s LDS (shared memory), ale texture cache je stále samostatná (12kb na quad).https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588244
+
zrejme neumis cist tu citaci, kterou jsem tam vlozil. to plati i pro machinu. zamerte se hlavne na posledni vetu. 12KB mela predchozi generace. to je prave ta pointa. souckovi to jaksi uniklo, ale ani jsem necekal, ze by to priznal. bude se vykrucovat ..
+1
+1
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
21. 6. 2011 - 10:07https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskusezrejme neumis cist tu citaci, kterou jsem tam vlozil. to plati i pro machinu. zamerte se hlavne na posledni vetu. 12KB mela predchozi generace. to je prave ta pointa. souckovi to jaksi uniklo, ale ani jsem necekal, ze by to priznal. bude se vykrucovat ..https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588256
+
Nevím, o co ti jde :-) Zkusím to polopaticky. Fermi MÁ stále 12kb samostatné texture cache na quad. Fermi NEMÁ sdílenou texture cache s data cache. Fermi MÁ pouze sdílenou data cache s LDS (shared memory). Citace z AT, kterou jsi sem dal, vyznívá dost nejednoznačně. G80, GT200 i GF100 mají všechny 12kb L1 samostatné texture cache na quad. A tato L1 TC je v případě GF100 stejně nepoužitelná pro CUDA aplikace, jako tomu bylo u GT200 a G80.
+1
-1
-1
Je komentář přínosný?
no-X https://diit.cz/autor/no-x
21. 6. 2011 - 10:47https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseNevím, o co ti jde :-) Zkusím to polopaticky. Fermi MÁ stále 12kb samostatné texture cache na quad. Fermi NEMÁ sdílenou texture cache s data cache. Fermi MÁ pouze sdílenou data cache s LDS (shared memory). Citace z AT, kterou jsi sem dal, vyznívá dost nejednoznačně. G80, GT200 i GF100 mají všechny 12kb L1 samostatné texture cache na quad. A tato L1 TC je v případě GF100 stejně nepoužitelná pro CUDA aplikace, jako tomu bylo u GT200 a G80.https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588268
+
to, ze to vyzniva nejednoznacne, je ciste tvuj nazor. v tom clanku je jednoznacne napsano, ze je ted v kazde SM 64kB cache, ktera muze fungovat jako plnohodnotna L1 cache. v compatibility modu pro starsi cuda plikace muze byt cache rozdelena na tu "tvoji" sdilenou pamet a prave l1 cache. ale pokud SM nebezi v compatibility modu, funguje to presne, jak bude ta pamet fungovat v GCN. opravdu nechapu, co je na tom k nepochopeni a nejasne
+1
+1
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
21. 6. 2011 - 10:55https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseto, ze to vyzniva nejednoznacne, je ciste tvuj nazor. v tom clanku je jednoznacne napsano, ze je ted v kazde SM 64kB cache, ktera muze fungovat jako plnohodnotna L1 cache. v compatibility modu pro starsi cuda plikace muze byt cache rozdelena na tu "tvoji" sdilenou pamet a prave l1 cache. ale pokud SM nebezi v compatibility modu, funguje to presne, jak bude ta pamet fungovat v GCN. opravdu nechapu, co je na tom k nepochopeni a nejasnehttps://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588272
+
Tak ještě jednou :-) Fermi sdílí L1 DATA cache s LDS (celkem 64kb na SM). L1 TEXTURE cache je zcela samostatná, nijak s těmito 64kb nesouvisí a její kapacita je 12kb na každý quad.
+1
0
-1
Je komentář přínosný?
no-X https://diit.cz/autor/no-x
21. 6. 2011 - 11:18https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseTak ještě jednou :-) Fermi sdílí L1 DATA cache s LDS (celkem 64kb na SM). L1 TEXTURE cache je zcela samostatná, nijak s těmito 64kb nesouvisí a její kapacita je 12kb na každý quad.https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588277
+
Mohl bys napsat, o co ti jde? :-) Není mi jasné, z čeho se podle tebe vykrucuju - vše, co jsem napsal je tak, jak jsem to napsal. Spíš mi přijde, že dost dobře nevíš, o čem mluvíš. Ve 12kb cache na GT200 není žádná pointa, 12kb L1 TC na TMU quad mají všechny generace: G80, GT200 i GF100. Možná si pleteš L1 data cache s L1 texture cache, ale to v případě Nvidie jsou a byly dvě odlišné věci. Zkus si ještě jednou přečíst, co jsem ti tu napsal :-)
+1
+1
-1
Je komentář přínosný?
no-X https://diit.cz/autor/no-x
21. 6. 2011 - 11:48https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseMohl bys napsat, o co ti jde? :-) Není mi jasné, z čeho se podle tebe vykrucuju - vše, co jsem napsal je tak, jak jsem to napsal. Spíš mi přijde, že dost dobře nevíš, o čem mluvíš. Ve 12kb cache na GT200 není žádná pointa, 12kb L1 TC na TMU quad mají všechny generace: G80, GT200 i GF100. Možná si pleteš L1 data cache s L1 texture cache, ale to v případě Nvidie jsou a byly dvě odlišné věci. Zkus si ještě jednou přečíst, co jsem ti tu napsal :-)https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588291
+
nepletu. u fermi je to prave jinak. to co tvrdis ty je blabol. uz to, ze jsi oznacil text ryana smitha za nejednoznacny napovida, ze tim, co rikas si absolutne nejsi jisty. ja budu radeji verit jemu, nez tobe. zmena memory managementu na nejnizsi urovni je jednou ze zakladnich premis architektury tvorene pro GPGPU. zrejme te stve, ze amd svym konceptem GCN "uznala" principy fermi jako spravne, protoze i pres rozdilne low-level implementace jde ze strany amd o ty same principy, ktere prinesla fermi. ale ani -50 od tvych amd dronu, kteri te bezmyslenkovite nasleduji, z toho, co jsi napsal do clanku, neudela pravdu :)
+1
+1
-1
Je komentář přínosný?
terrorist https://diit.cz/profil/terrorist
21. 6. 2011 - 23:27https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskusenepletu. u fermi je to prave jinak. to co tvrdis ty je blabol. uz to, ze jsi oznacil text ryana smitha za nejednoznacny napovida, ze tim, co rikas si absolutne nejsi jisty. ja budu radeji verit jemu, nez tobe. zmena memory managementu na nejnizsi urovni je jednou ze zakladnich premis architektury tvorene pro GPGPU. zrejme te stve, ze amd svym konceptem GCN "uznala" principy fermi jako spravne, protoze i pres rozdilne low-level implementace jde ze strany amd o ty same principy, ktere prinesla fermi. ale ani -50 od tvych amd dronu, kteri te bezmyslenkovite nasleduji, z toho, co jsi napsal do clanku, neudela pravdu :)https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588353
+
Preco si ten odstavec co si uviedol na zaciatku nepridal cely? "NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications. That cache still remains intact for graphics operations." Ta posledna veta jasne hovori, ze ta 12kilova cache tam je. To ta tak strasne bavi potahovat si triko, ze sa budes ohanat neuplnim textom? Daj odkaz na text, kde je napisane, ze je zjednotena cache pre data a textury. Alebo tu prestan spamovat ak nemas ziadny argument.
+1
0
-1
Je komentář přínosný?
ASD_SK https://diit.cz/profil/asdsk
22. 6. 2011 - 09:37https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskusePreco si ten odstavec co si uviedol na zaciatku nepridal cely? "NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications. That cache still remains intact for graphics operations." Ta posledna veta jasne hovori, ze ta 12kilova cache tam je. To ta tak strasne bavi potahovat si triko, ze sa budes ohanat neuplnim textom? Daj odkaz na text, kde je napisane, ze je zjednotena cache pre data a textury. Alebo tu prestan spamovat ak nemas ziadny argument.https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588380
+
Díky, ale já už přestávám věřit, že se to snaží pochopit. Tohle je evidentní projev trola :-)
+1
+1
-1
Je komentář přínosný?
no-X https://diit.cz/autor/no-x
22. 6. 2011 - 12:45https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseDíky, ale já už přestávám věřit, že se to snaží pochopit. Tohle je evidentní projev trola :-)https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588461
+
ehm, asi je dobré být si nejdříve jistý tím co říkám, než někoho začnu opravovat, pak totiž vypadám jako idiot ;-)
+1
+2
-1
Je komentář přínosný?
MACHINA https://diit.cz/profil/machina
21. 6. 2011 - 10:00https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseehm, asi je dobré být si nejdříve jistý tím co říkám, než někoho začnu opravovat, pak totiž vypadám jako idiot ;-)https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588253
+
Už se těším - minulou "generaci" jsem přeskočil, na tuhle nejspíš přejdu (uvidíme podle recenzí výsledného produktu) - zatím to vypadá hodně zajímavě :-P
+1
-2
-1
Je komentář přínosný?
Ondar https://diit.cz/profil/ondar007
21. 6. 2011 - 10:13https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseUž se těším - minulou "generaci" jsem přeskočil, na tuhle nejspíš přejdu (uvidíme podle recenzí výsledného produktu) - zatím to vypadá hodně zajímavě :-Phttps://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588262
+
taktéž to tak vidím. nebo si počkám na bulldozer "2" a nástupce GCN, pokud teda se nebudou v té době prodávat malé krabičky připojované na cloud servery....
+1
0
-1
Je komentář přínosný?
mikeczcom https://diit.cz/profil/mikeczcom
21. 6. 2011 - 14:55https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskusetaktéž to tak vidím. nebo si počkám na bulldozer "2" a nástupce GCN, pokud teda se nebudou v té době prodávat malé krabičky připojované na cloud servery....https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588320
+
Asi ještě není známo jakého typu ta skalární jednotka bude, ale není jedna skalární jednotka oproti 4 vektorovým SIMDs v CU v nepoměru?
+1
0
-1
Je komentář přínosný?
webwalker https://diit.cz/profil/webwalker
21. 6. 2011 - 12:36https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseAsi ještě není známo jakého typu ta skalární jednotka bude, ale není jedna skalární jednotka oproti 4 vektorovým SIMDs v CU v nepoměru?https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588308
+
Essential on our road to the Holodeck. To mi roztáhlo koutky. Držím palce AMD ! :)
+1
-1
-1
Je komentář přínosný?
kyo kyo https://diit.cz/profil/kyo
21. 6. 2011 - 15:22https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuseEssential on our road to the Holodeck. To mi roztáhlo koutky. Držím palce AMD ! :)https://diit.cz/clanek/nova-architektura-gpu-od-amd-dostava-konkretnejsi-rozmer/diskuse#comment-588324
+
Opět kvalitní článek. Bravo, tleskám.
"Nová L1 cache je unifikovaná (slouží pro data i textury - na rozdíl od Caymanu a Fermi), .."
fermi ma unifikovanou cache. ovsem kvuli zachovani kompatibility se starymi GPGPU aplikacemi muze fungovat take jako u GT200, pokud je to potreba
"NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications."
Fermi má sdílenou L1 data cache s LDS (shared memory), ale texture cache je stále samostatná (12kb na quad).
zrejme neumis cist tu citaci, kterou jsem tam vlozil. to plati i pro machinu. zamerte se hlavne na posledni vetu. 12KB mela predchozi generace. to je prave ta pointa. souckovi to jaksi uniklo, ale ani jsem necekal, ze by to priznal. bude se vykrucovat ..
Nevím, o co ti jde :-) Zkusím to polopaticky. Fermi MÁ stále 12kb samostatné texture cache na quad. Fermi NEMÁ sdílenou texture cache s data cache. Fermi MÁ pouze sdílenou data cache s LDS (shared memory). Citace z AT, kterou jsi sem dal, vyznívá dost nejednoznačně. G80, GT200 i GF100 mají všechny 12kb L1 samostatné texture cache na quad. A tato L1 TC je v případě GF100 stejně nepoužitelná pro CUDA aplikace, jako tomu bylo u GT200 a G80.
to, ze to vyzniva nejednoznacne, je ciste tvuj nazor. v tom clanku je jednoznacne napsano, ze je ted v kazde SM 64kB cache, ktera muze fungovat jako plnohodnotna L1 cache. v compatibility modu pro starsi cuda plikace muze byt cache rozdelena na tu "tvoji" sdilenou pamet a prave l1 cache. ale pokud SM nebezi v compatibility modu, funguje to presne, jak bude ta pamet fungovat v GCN. opravdu nechapu, co je na tom k nepochopeni a nejasne
Tak ještě jednou :-) Fermi sdílí L1 DATA cache s LDS (celkem 64kb na SM). L1 TEXTURE cache je zcela samostatná, nijak s těmito 64kb nesouvisí a její kapacita je 12kb na každý quad.
"bude se vykrucovat .. "
Mohl bys napsat, o co ti jde? :-) Není mi jasné, z čeho se podle tebe vykrucuju - vše, co jsem napsal je tak, jak jsem to napsal. Spíš mi přijde, že dost dobře nevíš, o čem mluvíš. Ve 12kb cache na GT200 není žádná pointa, 12kb L1 TC na TMU quad mají všechny generace: G80, GT200 i GF100. Možná si pleteš L1 data cache s L1 texture cache, ale to v případě Nvidie jsou a byly dvě odlišné věci. Zkus si ještě jednou přečíst, co jsem ti tu napsal :-)
nepletu. u fermi je to prave jinak. to co tvrdis ty je blabol. uz to, ze jsi oznacil text ryana smitha za nejednoznacny napovida, ze tim, co rikas si absolutne nejsi jisty. ja budu radeji verit jemu, nez tobe. zmena memory managementu na nejnizsi urovni je jednou ze zakladnich premis architektury tvorene pro GPGPU. zrejme te stve, ze amd svym konceptem GCN "uznala" principy fermi jako spravne, protoze i pres rozdilne low-level implementace jde ze strany amd o ty same principy, ktere prinesla fermi. ale ani -50 od tvych amd dronu, kteri te bezmyslenkovite nasleduji, z toho, co jsi napsal do clanku, neudela pravdu :)
Preco si ten odstavec co si uviedol na zaciatku nepridal cely? "NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications. That cache still remains intact for graphics operations." Ta posledna veta jasne hovori, ze ta 12kilova cache tam je. To ta tak strasne bavi potahovat si triko, ze sa budes ohanat neuplnim textom? Daj odkaz na text, kde je napisane, ze je zjednotena cache pre data a textury. Alebo tu prestan spamovat ak nemas ziadny argument.
Díky, ale já už přestávám věřit, že se to snaží pochopit. Tohle je evidentní projev trola :-)
ehm, asi je dobré být si nejdříve jistý tím co říkám, než někoho začnu opravovat, pak totiž vypadám jako idiot ;-)
ditto
Už se těším - minulou "generaci" jsem přeskočil, na tuhle nejspíš přejdu (uvidíme podle recenzí výsledného produktu) - zatím to vypadá hodně zajímavě :-P
taktéž to tak vidím. nebo si počkám na bulldozer "2" a nástupce GCN, pokud teda se nebudou v té době prodávat malé krabičky připojované na cloud servery....
Asi ještě není známo jakého typu ta skalární jednotka bude, ale není jedna skalární jednotka oproti 4 vektorovým SIMDs v CU v nepoměru?
Essential on our road to the Holodeck. To mi roztáhlo koutky. Držím palce AMD ! :)
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.