Diit.cz - Novinky a informace o hardware, software a internetu

Mellanox představil redukovanou sadu výpočetních karet pro Parallel Computing

Portfolio Mellanoxu dnes představuje rozsáhlý arzenál „technologických“ zbraní, které jsou na trhu v oblasti CloudComputing a Networkingu velmi žádané. Dnes se zaměříme především na vícejádrové procesory a karty pro masivní paralelní výpočty, které se používají při řešení úloh z oblasti BigDataComputing, MachineLearning a obecně z oblasti umělé inteligence.

Firma Mellanox vyvíjí a vyrábí vícejádrové procesory a kompletní programovatelné karty pro paralelní výpočetní techniku, Networking, Machine Learning, analýzu dat, molekulární modelování, fyzické simulace, Crypto analýzu, geofyzikální výzkum, automobilový průmysl, letecký design, finanční modelování a skladovací trhy. 

V říjnu 2004 založila trojice Inženýrů Anant Agarwal (MIT), Devesh Garg a Vijay K. Aggarwal firmu Tilera. Hlavní sídlo bylo v San Jose, California, USA. Účelem firmy byl vývoj a výroba vícejádrových procesorů. Jejich práce vycházela z dlouholetého výzkumu na MIT, částečně financovaného také agenturou DARPA, který měl za úkol vývoj síťových multiprocesorových systémů s až 512 výpočetními jádry na čipu pro oblasti MachineLearning, DataProcessing apod.

Anant Agarwal představil první výsledky již v roce 1990 na MIT v rámci projektu AleWife. Při vývoji byly použity jádra procesorů Sun Microsystems SPARC - RISC. V červenci 2014 převzala maličkou firmu Tilera firma EZChip, což byl významný producent polovodičových technologií založený v roce 1999 a v září 2015 pak firmu EZChip převzala firma Mellanox.

Je to běžný způsob, jak v dnešní době vznikají velké technologické firmy. Převzetí Tilery firmou EZChip a později firmou Mellanox přineslo samozřejmě velkou finanční podporu, ale také bohužel omezení původních velmi ambiciózních plánů na počet jader umístěných v procesoru – až 512. Vývoj se musel přizpůsobit především požadavkům trhu a možnostem přenosových systémů.

K dispozici jsou tak dnes procesory s 36 a 72 jádry. Kromě prvního 9-ti, 16-ti a 36-ti jádrového procesoru byly původně v portfoliu Tilery (rok 2011) ještě procesory nesoucí 64 a 100 jader (36-core Gx3036, 64-core GX3064, 100-core Gx3100).

Původní procesory Tilera měly mnoho dobrých vlastností. Výhodou Tilery byla především velmi nízká spotřeba. 100 jádrový procesor měl spotřebu pouze fantastických 48Wattů na 1.5GHz. Nakonec zůstalo jen u prototypu. Nevýhodou byla skutečnost, že každé jádro bylo koncipováno ve smyslu klasického „x86“, tedy jádro bez koprocesoru.

Již od počátku existovala plná softwarová podpora pro Linux a CentOS a pro jazyky C, C++, Java, PHP, Perl, Python. To se samozřejmě krajně nelíbilo velkým společnostem, jako je Intel, což je pochopitelné. Nevýhodou Tilery bylo také to, že jejich jádra byla nekompatibilní s řadou x86. Jádra byla postavena na Sun Microsystems SPARC čipech. Nebylo možné je přímo nasadit do „běžných domácích počítačů“.

Tilera byla tehdy (2008-2011) výrazně před Intelem. Měla k dispozici hotový prototyp - 100 jádrový mikroprocesor připravený pro komerční trhy. Procesor XeonPhi od Intelu vyšel až v roce 2012 a prototypy byly k dispozici v roce 2010. Tilera byla velmi průbojná a měla skvělé nápady, ale byla bohužel až příliš malá.

Aby se v reálném světě zaplatily náklady na vývoj, musela se přizpůsobit i platforma a procesory Tilera dnes běžně uvidíme ve velkých řídích systémech datových center – oblasti CloudComputing a Networking (např. routery, huby). Výrobky Tilera dnes najdeme již jen pod názvem Mellanox. Otázka je jaká bude budoucnost procesorů Tilera, protože Mellanox prozatím směřuje vývoj především do oblasti vícejádrových ARM procesorů.

Vývoj vícejádrových procesorů se samozřejmě od 90. let nijak nezastavil. Běžně je možné na trhu sehnat i procesory a 1000 jádry s obrovským výpočetním výkonem. Otázkou spíše zůstává finanční rentabilita a praktická využitelnost.

Mellanox dnes nabízí ve svém portfoliu dva typy procesorů pod označením TILE-Gx36 a TILE-Gx72 a také kompletní uživatelsky programovatelné karty nesoucí tyto procesory pro sběrnice PCIe (PCIe2.0 x8 a PCIe 3.0) a to TILEncore-Gx72, TILEncore-Gx36, TILEncore-Gx36-Q40, TILEmpower-Gx72 MP, TILEmpower-Gx36 FR, TILEmpower-Gx72 FR. Číslo za Gx udává počet jader procesoru. Menší a starší typy procesorů a karet je samozřejmě stále možné objednat. 

Procesor TILE-Gx36 je 36-ti jádrový plně 64bitový procesor běžící na frekvenci 1.2GHz a je označován jako „systém-on-chip“. Procesor je optimalizován pro použití v oblastech networking, zpracování videa, data centrech, cryptologii. Primárně je vhodný pro zapojování do sítí s propustností až 40 Gbps a pro zpracování operací packet-filtering, bandwidth management, krypto-SSL/IP bezpečnostních protokolů (IPsec, SSL, TLS, MACsec, SRTP, 3GPP), zpracování streamovaného videa s kodeky H.264/H.265 apod.

Na obrázku níže je jednak procesor a pak schéma vnitřního uspořádání jednotlivých jader. Procesor má k dispozici dva 72-bitové DDR3 řadiče a je možné připojit až 512GB paměti (ECC/nonECC). Na obrázku níže jsou dvě možná zapojení jednak (vlevo) jako tzv. FrontEnd procesor, což je klasická přídavná karta do PCIe a pak jako síťový procesor (vpravo) např. pro filtraci paketů nebo dekodování videa apod. 

Druhým procesorem v nabídce z řady Tilera je TILE-Gx72 – viz. obrázky níže. Jedná se 64bitový procesor nesoucí 72 jader a s možností připojení až osmi 10Gb Ethernet portů. Procesor je určen pro zapojování do sítí s rychlostí přenosu 80-100Gbps, filtrování paketů, bandwidth management, krypto-SSL/IP bezpečnostních protokolů (IPsec, SSL, TLS, MACsec, SRTP, 3GPP), zpracování streamovaného videa s kodeky H.264/H.265 apod. Každé jádro běží na frekvenci 1.2GHz, 32KB L1 on-chip cache a 256KB L2 on-chip cache a 18MB L3 on-chip cache určenou pro synchronizaci práce jednotlivých jader na procesoru. 

Procesor má k dispozici dva 72-bitové DDR3 řadiče a je možné připojit až 1TB paměti. Každé jádro procesoru je spojeno s okolními jádry tvz. iMESH technologie. Např. KnightsKorner od Intelu využívá kruhovou topologii. Rozdíl je také v tom, že je koncipován od základu jako množina koprocesorů.

Kromě samotných procesorů nabízí Mellanox i kompletní reprogramovatelné karty pro sběrnice PCIe 2.0 a 3.0. Jedná se o karty s označením TILEncore-Gx72, TILEncore-Gx36, TILEncore-Gx36-Q40, TILEmpower-Gx72 MP, TILEmpower-Gx36 FR, TILEmpower-Gx72 FR. Jejich cena bohužel není nijak příznivá - TILEncore-Gx72 stojí cca 16tis. USD (cca 356tis kč).

Ceny ostatních karet jsou přibližně stejné. Nejedná se tedy o vybavení, které by si mohl dovolit zakoupit běžný smrtelník. Ani na českých universitách se s nimi nesetkáme. Jen na okraj - několik karet XeonPhi je možné najít na UK MFF. Karty Mellanox jsou však bohužel mnohonásobě dražší a přitom dnes již výkonově slabší než XeonPhi. Je to dáno také počtem vyráběných karet. Jejich výkon v pozdějších letech když přišel na trh XeonPhi nebyl nijak optimalizován, a tak vedoucí pozici přebral XeonPhi a karty NVidia a AMD. Na obrázku níže je schéma uspořádání karty TILEncore-Gx72.

Je to klasická karta pro sběrnici PCIe 3.0 x8 s propustností 64Gbps. Je dodávána s kompletním vývojovým prostředím „Mella-nox’s Industry-Leading Multicore Development Environment™ (MDE)“, nese až 32GB DD3 ECC RAM. Karta má 8 konektorů pro připojení Ethernet až 80Gbps. Z toho vyplývá, že je určena především pro zapojování do rozsáhlejších struktur.

Obrázek: TILEmpower-Gx72 MP Platforma, 19” rack chassis 1RU

Další nabízené karty TILEncore-Gx36, TILEncore-Gx36-Q40, využívají samozřejmě stejné typy procesorů Gx36 a Gx72. Procesory z řady Gx je možné najít i v kompletních platformách jako je např. TILEmpower-Gx72 MP ve formě 19” rack chassis 1RU nebo TILEmpower-Gx36 FR nebo TILEmpower-Gx72 FR – obě opět 19” rack chassis 1RU. 

Obrázek: vnitřní uspořádání Obrázek: TILEmpower-Gx36 FR Platformy 

Tagy: 

Diskuse ke článku Mellanox představil redukovanou sadu výpočetních karet pro Parallel Computing

Čtvrtek, 28 Září 2017 - 22:49 | Sinuhet | Pořád si to můžete rozsekat na desetiminutové...
Čtvrtek, 28 Září 2017 - 22:37 | Sinuhet | Je zřejmé, že to jde, a není to kdovíjak obtížné...
Středa, 27 Září 2017 - 05:06 | RedMaX | Zkusim se na to podivat, na Doom9 mi tvrdili, ze...
Středa, 27 Září 2017 - 05:05 | RedMaX | "Pouzi lepsi implementaci kodeku" Jakou...
Úterý, 26 Září 2017 - 23:30 | Bonfire | Dělal jsem na 16jádrovém Epiphany a zas taková...
Úterý, 26 Září 2017 - 22:19 | frr | Napadlo mě, jestli by nešlo jednotlivým jádrům...
Úterý, 26 Září 2017 - 22:18 | danieel | Predpokladam ze tve video je delsi nez key-frame...
Úterý, 26 Září 2017 - 20:47 | RedMaX | Jo, souhlas, ze zajimavy clanek, diky. Zaujalo me...
Úterý, 26 Září 2017 - 17:38 | Jaroslav Moravec | Jsem moc rád, že vám konečně něco líbilo. Ono je...
Úterý, 26 Září 2017 - 16:56 | Sinuhet | Díky za článek! Dlouho jsem si říkal, že jste tam...

Zobrazit diskusi