1024 jadrovy "one man show" (USA): https://www.parallella.org/2016/10/05/epiphany-v-a-1024-core-64-bit-risc...
(je tam odkaz na PDF - Epiphany-V Technical Report - vyborne pocteni!)
zde je skoda ze to financovala DARPA a ten cip nebude dostupny - ono to ma hruby vykon srovnatelny s produkty velkych firem
+1
-1
-1
Je komentář přínosný?
Supr clanek :) konecne nejaka
danieel https://diit.cz/profil/danieel
26. 9. 2017 - 15:15https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseSupr clanek :) konecne nejaka Deepovina! Par tipu kam dal:
Evropsky 256 jadrovy:
http://www.kalrayinc.com/kalray/products/#processors
1024 jadrovy "one man show" (USA):
https://www.parallella.org/2016/10/05/epiphany-v-a-1024-core-64-bit-risc-processor/
(je tam odkaz na PDF - Epiphany-V Technical Report - vyborne pocteni!)
zde je skoda ze to financovala DARPA a ten cip nebude dostupny - ono to ma hruby vykon srovnatelny s produkty velkych firem
https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078344
+
Dělal jsem na 16jádrovém Epiphany a zas taková sláva to nebyla, ty jádra byly strašně omezené (hlavně operační paměť jednotlivých jader). Snad to ta 1024-jádrová verze bude mít lepší. Ale zase zajímavá zkušenost.
+1
0
-1
Je komentář přínosný?
Dělal jsem na 16jádrovém
Bonfire https://diit.cz/profil/honza-rezny
26. 9. 2017 - 23:30https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseDělal jsem na 16jádrovém Epiphany a zas taková sláva to nebyla, ty jádra byly strašně omezené (hlavně operační paměť jednotlivých jader). Snad to ta 1024-jádrová verze bude mít lepší. Ale zase zajímavá zkušenost.
https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078494
+
Díky za článek!
Dlouho jsem si říkal, že jste tam zapomněli přidat "PR článek", ale od určité chvíle začalo být zřejmé, že o nic takového nejde. Pěkné.
S těmihle procesory se běžný smrtelník může s trochou štěstí potkat u Mikrotiků, které nejsou zdaleka tak drahé jako ty karty.
Jinak to ale pro síťové aplikace není až tak ideální (vizte ispforum.cz), je tam problém s propustností na jeden stream, kde (když jsem to řešil, 2 roky zpět) jedno jádro zvládne ~500Mbit provozu, pokud použijete např. maškarádu. Jader máte sice 36, takže to vypadá jako 18Gbit, ale spíš je to při tomhle použití 36x500Mbit. Je to vlastnost toho procesoru, akorát to naráží na to, že spousta zákazníků si to neuvědomila, a považovala ho za vadný.
Taky se na tom zkoušel výkon webserveru, kde to vypadalo jako pohádka, výsledky nic moc. Ta meshová struktura propojení jader strašně zvyšuje latence vnitřních jader; pokud chce jádro např. přístup do paměti, musí signál přeskákat přes několik dalších jader, a tím se (relativně) brutálně navyšují latence. Trochu jako Epyc ;-) Vůbec doufám, že se Mellanoxu povede najít pro to využití a zákazníky, situace na poli CPU je taková... smutná. Nic moc nového a exotického se neobjevuje.
+1
0
-1
Je komentář přínosný?
S těmihle procesory se běžný
Sinuhet https://diit.cz/profil/vojtech-pszczolka
26. 9. 2017 - 16:56https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseDíky za článek!
Dlouho jsem si říkal, že jste tam zapomněli přidat "PR článek", ale od určité chvíle začalo být zřejmé, že o nic takového nejde. Pěkné.
S těmihle procesory se běžný smrtelník může s trochou štěstí potkat u Mikrotiků, které nejsou zdaleka tak drahé jako ty karty.
Jinak to ale pro síťové aplikace není až tak ideální (vizte ispforum.cz), je tam problém s propustností na jeden stream, kde (když jsem to řešil, 2 roky zpět) jedno jádro zvládne ~500Mbit provozu, pokud použijete např. maškarádu. Jader máte sice 36, takže to vypadá jako 18Gbit, ale spíš je to při tomhle použití 36x500Mbit. Je to vlastnost toho procesoru, akorát to naráží na to, že spousta zákazníků si to neuvědomila, a považovala ho za vadný.
Taky se na tom zkoušel výkon webserveru, kde to vypadalo jako pohádka, výsledky nic moc. Ta meshová struktura propojení jader strašně zvyšuje latence vnitřních jader; pokud chce jádro např. přístup do paměti, musí signál přeskákat přes několik dalších jader, a tím se (relativně) brutálně navyšují latence. Trochu jako Epyc ;-) Vůbec doufám, že se Mellanoxu povede najít pro to využití a zákazníky, situace na poli CPU je taková... smutná. Nic moc nového a exotického se neobjevuje.https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078371
+
Jsem moc rád, že vám konečně něco líbilo. Ono je dost těžké napsat článek o moderní technologii, která není svázána s konkrétní firmou, aby to nevypadalo jako reklama. Protože věděcké články z univerzit např. z http://www.guide2research.com/journals/ jsou plné vzorců a to bych sem nerad dával. On by to asi potom nikdo nečet. Bohužel reklama a fin. podpora (sponzoring) je dnes nutností. Ani Tilera nebyla schopná přežít bez peněz a zatim to s ní vypadá nahnutě, což je škoda. Nicméně si zkuste představit, že by článek na cdr vypadal nějak takhle http://robomap.4fan.cz/ , kdo by to asi čet.
+1
0
-1
Je komentář přínosný?
Jsem moc rád, že vám konečně
Jaroslav Moravec https://diit.cz/profil/jaroslav-moravec
26. 9. 2017 - 17:38https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseJsem moc rád, že vám konečně něco líbilo. Ono je dost těžké napsat článek o moderní technologii, která není svázána s konkrétní firmou, aby to nevypadalo jako reklama. Protože věděcké články z univerzit např. z http://www.guide2research.com/journals/ jsou plné vzorců a to bych sem nerad dával. On by to asi potom nikdo nečet. Bohužel reklama a fin. podpora (sponzoring) je dnes nutností. Ani Tilera nebyla schopná přežít bez peněz a zatim to s ní vypadá nahnutě, což je škoda. Nicméně si zkuste představit, že by článek na cdr vypadal nějak takhle http://robomap.4fan.cz/ , kdo by to asi čet. https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078389
+
Zaujalo me to co znam: "zpracování streamovaného videa s kodeky H.264/H.265"
Ja sam si pral co nejnamakanejsi procesor na enkodovani H264/H265, takze maximum jader, co by slo. Pak jsem se trochu ponoril do studia a zjistil jsem, ze je to blbost.Oba kodeky umi hodne dobre system predikci snimku a k tomu nutne potrebujete singlethread. Cely snimek musi zpracovavat jedno jadro. V realu muzete zpracovavat urcity pocet radku vzdy na kazdem vlakne zvlast. Ale maximum, aby to melo jakous takous kvalitu je pri 4K 16 vlaken, pak to jde do kopru. Pro 1080p jsem cetl, ze se doporucuje 8 vlaken. Tudiz je masivni multithread dost na nic.
Ano, je mi namitano, ze je mozne toho zpracovavat vic najednou, ale kdo bude zpracovavat tisic videi v jednom okamziku. Mnohem vic chci to mit rychle a kvalitne, tudiz mit procesor co ma maximalni vykon v singlethreadu a umi dejme tomu hodne dobre i 4 vlakna. Radeji nebudu zminovat jmeno firmy, co presne tyhle procaky vyrabi, protoze to zase bude minusu.
+1
0
-1
Je komentář přínosný?
Jo, souhlas, ze zajimavy
RedMaX https://diit.cz/profil/redmarx
26. 9. 2017 - 20:47https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseJo, souhlas, ze zajimavy clanek, diky.
Zaujalo me to co znam: "zpracování streamovaného videa s kodeky H.264/H.265"
Ja sam si pral co nejnamakanejsi procesor na enkodovani H264/H265, takze maximum jader, co by slo. Pak jsem se trochu ponoril do studia a zjistil jsem, ze je to blbost.Oba kodeky umi hodne dobre system predikci snimku a k tomu nutne potrebujete singlethread. Cely snimek musi zpracovavat jedno jadro. V realu muzete zpracovavat urcity pocet radku vzdy na kazdem vlakne zvlast. Ale maximum, aby to melo jakous takous kvalitu je pri 4K 16 vlaken, pak to jde do kopru. Pro 1080p jsem cetl, ze se doporucuje 8 vlaken. Tudiz je masivni multithread dost na nic.
Ano, je mi namitano, ze je mozne toho zpracovavat vic najednou, ale kdo bude zpracovavat tisic videi v jednom okamziku. Mnohem vic chci to mit rychle a kvalitne, tudiz mit procesor co ma maximalni vykon v singlethreadu a umi dejme tomu hodne dobre i 4 vlakna. Radeji nebudu zminovat jmeno firmy, co presne tyhle procaky vyrabi, protoze to zase bude minusu.https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078452
+
Predpokladam ze tve video je delsi nez key-frame interval (25-125 snimku), takze vice vlaken muze enkodovat od dalsiho klicoveho snimku dal. Ze to nejde? Pouzi lepsi implementaci kodeku nebo si to naskriptuj :)
+1
0
-1
Je komentář přínosný?
Predpokladam ze tve video je
danieel https://diit.cz/profil/danieel
26. 9. 2017 - 22:18https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskusePredpokladam ze tve video je delsi nez key-frame interval (25-125 snimku), takze vice vlaken muze enkodovat od dalsiho klicoveho snimku dal. Ze to nejde? Pouzi lepsi implementaci kodeku nebo si to naskriptuj :)https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078482
+
Je zřejmé, že to jde, a není to kdovíjak obtížné. To naskriptování bych zvládl i já, a to o tvorbě kodeků nevím nic.
+1
0
-1
Je komentář přínosný?
Je zřejmé, že to jde, a není
Sinuhet https://diit.cz/profil/vojtech-pszczolka
28. 9. 2017 - 22:37https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseJe zřejmé, že to jde, a není to kdovíjak obtížné. To naskriptování bych zvládl i já, a to o tvorbě kodeků nevím nic. https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078977
+
Napadlo mě, jestli by nešlo jednotlivým jádrům předávat celé GOPy. GOP je rozumně samostatná jednotka, kterou tvoří dohromady pár frejmů... To by se dalo rozprostřít napříč velmi mnoha jádry. Ovšem za předpokladu, že při transkódování není potřeba dělat konverzi snímkového kmitočtu s nějakou fajnovější interpolací, která má v čase klouzavý filtr a GOPy jsou jí šumák (jede nad jednotlivými snímky)... a kromě toho GOP je zřejmě termín z MPEG2. H.264+ používají složitější strukturu obrazových dat...
+1
0
-1
Je komentář přínosný?
Napadlo mě, jestli by nešlo
frr https://diit.cz/profil/frr
26. 9. 2017 - 22:19https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseNapadlo mě, jestli by nešlo jednotlivým jádrům předávat celé GOPy. GOP je rozumně samostatná jednotka, kterou tvoří dohromady pár frejmů... To by se dalo rozprostřít napříč velmi mnoha jádry. Ovšem za předpokladu, že při transkódování není potřeba dělat konverzi snímkového kmitočtu s nějakou fajnovější interpolací, která má v čase klouzavý filtr a GOPy jsou jí šumák (jede nad jednotlivými snímky)... a kromě toho GOP je zřejmě termín z MPEG2. H.264+ používají složitější strukturu obrazových dat...https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078485
+
Zkusim se na to podivat, na Doom9 mi tvrdili, ze to nijak nejde, dal jsem se nad tim nezamyslel.
+1
0
-1
Je komentář přínosný?
Zkusim se na to podivat, na
RedMaX https://diit.cz/profil/redmarx
27. 9. 2017 - 05:06https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuseZkusim se na to podivat, na Doom9 mi tvrdili, ze to nijak nejde, dal jsem se nad tim nezamyslel.https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078536
+
Pořád si to můžete rozsekat na desetiminutové části a použít třeba GNU parallel. Ty úseky nepůjdou zmenšovat donekonečna, ale zatím je tam slušná rezerva.
+1
0
-1
Je komentář přínosný?
Pořád si to můžete rozsekat
Sinuhet https://diit.cz/profil/vojtech-pszczolka
28. 9. 2017 - 22:49https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskusePořád si to můžete rozsekat na desetiminutové části a použít třeba GNU parallel. Ty úseky nepůjdou zmenšovat donekonečna, ale zatím je tam slušná rezerva.https://diit.cz/clanek/mellanox-predstavil-redukovanou-sadu-vypocetnich-karet-pro-parallel-computing/diskuse#comment-1078983
+
Supr clanek :) konecne nejaka Deepovina! Par tipu kam dal:
Evropsky 256 jadrovy:
http://www.kalrayinc.com/kalray/products/#processors
1024 jadrovy "one man show" (USA):
https://www.parallella.org/2016/10/05/epiphany-v-a-1024-core-64-bit-risc...
(je tam odkaz na PDF - Epiphany-V Technical Report - vyborne pocteni!)
zde je skoda ze to financovala DARPA a ten cip nebude dostupny - ono to ma hruby vykon srovnatelny s produkty velkych firem
Dělal jsem na 16jádrovém Epiphany a zas taková sláva to nebyla, ty jádra byly strašně omezené (hlavně operační paměť jednotlivých jader). Snad to ta 1024-jádrová verze bude mít lepší. Ale zase zajímavá zkušenost.
Díky za článek!
Dlouho jsem si říkal, že jste tam zapomněli přidat "PR článek", ale od určité chvíle začalo být zřejmé, že o nic takového nejde. Pěkné.
S těmihle procesory se běžný smrtelník může s trochou štěstí potkat u Mikrotiků, které nejsou zdaleka tak drahé jako ty karty.
Jinak to ale pro síťové aplikace není až tak ideální (vizte ispforum.cz), je tam problém s propustností na jeden stream, kde (když jsem to řešil, 2 roky zpět) jedno jádro zvládne ~500Mbit provozu, pokud použijete např. maškarádu. Jader máte sice 36, takže to vypadá jako 18Gbit, ale spíš je to při tomhle použití 36x500Mbit. Je to vlastnost toho procesoru, akorát to naráží na to, že spousta zákazníků si to neuvědomila, a považovala ho za vadný.
Taky se na tom zkoušel výkon webserveru, kde to vypadalo jako pohádka, výsledky nic moc. Ta meshová struktura propojení jader strašně zvyšuje latence vnitřních jader; pokud chce jádro např. přístup do paměti, musí signál přeskákat přes několik dalších jader, a tím se (relativně) brutálně navyšují latence. Trochu jako Epyc ;-) Vůbec doufám, že se Mellanoxu povede najít pro to využití a zákazníky, situace na poli CPU je taková... smutná. Nic moc nového a exotického se neobjevuje.
Jsem moc rád, že vám konečně něco líbilo. Ono je dost těžké napsat článek o moderní technologii, která není svázána s konkrétní firmou, aby to nevypadalo jako reklama. Protože věděcké články z univerzit např. z http://www.guide2research.com/journals/ jsou plné vzorců a to bych sem nerad dával. On by to asi potom nikdo nečet. Bohužel reklama a fin. podpora (sponzoring) je dnes nutností. Ani Tilera nebyla schopná přežít bez peněz a zatim to s ní vypadá nahnutě, což je škoda. Nicméně si zkuste představit, že by článek na cdr vypadal nějak takhle http://robomap.4fan.cz/ , kdo by to asi čet.
Jo, souhlas, ze zajimavy clanek, diky.
Zaujalo me to co znam: "zpracování streamovaného videa s kodeky H.264/H.265"
Ja sam si pral co nejnamakanejsi procesor na enkodovani H264/H265, takze maximum jader, co by slo. Pak jsem se trochu ponoril do studia a zjistil jsem, ze je to blbost.Oba kodeky umi hodne dobre system predikci snimku a k tomu nutne potrebujete singlethread. Cely snimek musi zpracovavat jedno jadro. V realu muzete zpracovavat urcity pocet radku vzdy na kazdem vlakne zvlast. Ale maximum, aby to melo jakous takous kvalitu je pri 4K 16 vlaken, pak to jde do kopru. Pro 1080p jsem cetl, ze se doporucuje 8 vlaken. Tudiz je masivni multithread dost na nic.
Ano, je mi namitano, ze je mozne toho zpracovavat vic najednou, ale kdo bude zpracovavat tisic videi v jednom okamziku. Mnohem vic chci to mit rychle a kvalitne, tudiz mit procesor co ma maximalni vykon v singlethreadu a umi dejme tomu hodne dobre i 4 vlakna. Radeji nebudu zminovat jmeno firmy, co presne tyhle procaky vyrabi, protoze to zase bude minusu.
Predpokladam ze tve video je delsi nez key-frame interval (25-125 snimku), takze vice vlaken muze enkodovat od dalsiho klicoveho snimku dal. Ze to nejde? Pouzi lepsi implementaci kodeku nebo si to naskriptuj :)
"Pouzi lepsi implementaci kodeku"
Jakou bys radil?
"si to naskriptuj"
?
Je zřejmé, že to jde, a není to kdovíjak obtížné. To naskriptování bych zvládl i já, a to o tvorbě kodeků nevím nic.
Napadlo mě, jestli by nešlo jednotlivým jádrům předávat celé GOPy. GOP je rozumně samostatná jednotka, kterou tvoří dohromady pár frejmů... To by se dalo rozprostřít napříč velmi mnoha jádry. Ovšem za předpokladu, že při transkódování není potřeba dělat konverzi snímkového kmitočtu s nějakou fajnovější interpolací, která má v čase klouzavý filtr a GOPy jsou jí šumák (jede nad jednotlivými snímky)... a kromě toho GOP je zřejmě termín z MPEG2. H.264+ používají složitější strukturu obrazových dat...
Zkusim se na to podivat, na Doom9 mi tvrdili, ze to nijak nejde, dal jsem se nad tim nezamyslel.
Pořád si to můžete rozsekat na desetiminutové části a použít třeba GNU parallel. Ty úseky nepůjdou zmenšovat donekonečna, ale zatím je tam slušná rezerva.
Pro psaní komentářů se, prosím, přihlaste nebo registrujte.