2,6 bilionu tranzistorů a 1 čip na 7nm wafer: Cerebras WSE-2
Historie společnosti Cerebras se váže k ex-šéfovi společnosti SeaMicro (kterou koupilo a fakticky zabilo Readovo vedení AMD), A. Feldmanovi, který společně s S. Liem přišel na myšlenku AI-procesoru postaveného na celém křemíkovém waferu. První generaci představili v listopadu 2019 a jejími parametry zaujali média po celém světě. Čip o ploše 46 225 mm², se 400 tisíci jádry, 1,2 bilionu tranzistorů a TDP 16 tisíc wattů totiž nelze přehlédnout.
Cerebras | Nvidia | rozdíl konkur. | |||
---|---|---|---|---|---|
WSE-1 | WSE-2 | GV100 | GA100 | ||
proces | 16nm | 7nm | 12nm | 7nm | - |
plocha | 46 225 mm² | 815 mm² | 826 mm² | 57 / 56× | |
jader | 400 000 | 850 000 | 5120+256 | 6912+1280 | 78 / 123× |
int. paměť | 18 GB | 40 GB | 6 MB | 40 MB | 3k / 1k× |
paměť. prop. | 9 PB/s | 20 PB/s | 900 GB/s | 1555 GB/s | 10k / 13k× |
prop. sběrn. | 100 Pb/s | 220 Pb/s | 300 Gb/s | 600 Gb/s | 333k / 367× |
tranzistorů | 1,2 bilionu | 2,6 bilionu | 21 miliard | 54,2 miliard | 57 / 48× |
TDP | 16 kW | 23 kW | 0,3 kW | 0,4 kW | 53 / 58× |
Cerebras se chlubí 100% výtěžností, ta je však dosahována faktem, že návrh obsahuje zhruba o procento více jader, než je uváděno (redundance), a chybná jsou vypínána. Společnost ráda srovnává parametry svého produktu s výpočetním řešením od Nvidie, takže jsem obě generace (včetně rozdílů) shrnul do jedné tabulky.
Ačkoli čip o velikosti waferu může působit úctyhodně a z technologického hlediska jde skutečně o velmi zajímavý počin, po stránce implementace nejde až tak úplně o monolit. Výrobní linky mají limity co do maximální velikosti čipu, takže WSE-2 (stejně jako WSE-1) je spíše implementací většího počtu čipů na jednom nerozřezaném waferu, kdy se oproti klasickým čipům liší pouze faktem, že mezi jednotlivými sousedícími čipy je ve waferu implementováno propojení. Ve své podstatě jde jen o jiný způsob propojení čipů než využívá Intel (můstky) nebo AMD (GMI nebo interposer).
WSE sice můstky, GMI ani interposer nepotřebuje, ale zase se musí potýkat s jinými komplikacemi a to je tepelná roztažnost, která dala vývojovému týmu zabrat už u první generace. Při koncové ceně za „čip“ přes 2 miliony dolarů u první generace tudíž nejde zrovna o masové řešení.
Cerebras si sice nějaké zákazníky získala, uvádí použití ve výzkumných laboratořích, farmaceutických firmách, biotechnologickém výzkumu, armádě a ropném průmyslu, ale konkrétní známé údaje nenaznačují masovější nasazení. Lawrence Livermore má používat jeden systém (1 systém = 1 „čip“) první generace a výpočetní centrum Pittsburg má dva systémy (což vstoupilo ve známost díky tomu, že na jejich nákup dostalo grant, jehož popis je veřejně dostupný). Prozatím to vypadá, že jsou zmíněné subjekty vybaveny jedním-dvěma systémy, na kterých testují, do jaké míry jsou pro ně použitelné, výhodné, smysluplné, rentabilní…
Na jedné straně tak Cerebras nemá zakázky na superpočítače v řádu stovek milionů dolarů, jako velcí hráči v tomto segmentu (pokud je známo, tak ani zakázky na superpočítače v řádu desítek milionů dolarů) a na straně druhé - z důvodu gigantického monolitu - nemůže WSE škálovat do nižších cenových relací, takže z principu nemůže získávat menší zakázky v řádu stovek tisíc dolarů. Což je nutné zohlednit jako poměrně nezanedbatelnou strategickou nevýhodu. Pokud se společnost podaří v dlouhodobém horizontu uchytit, troufám si prorokovat, že dříve či později stejně svůj wafer „přeřízne“, aby mohla expandovat i do dalších cenových segmentů.
Cena systému CS-2 (tedy systému s jedním WSE-2) zatím nebyla zveřejněna, ale zatímco u první generace se podle zákazníka a konfigurace pohybovala kolem $2-3 milionů, uvádí výrobce, že v době dostupnosti (třetí kvartál 2021) dosáhne „několika milionů dolarů“, což je většinou médií chápáno jako částka vyšší než u původní generace (pokud by byla nižší nebo stejná, neměl by výrobce důvod k marketingovým manévrům v podobě nejasných formulací).