Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k 2,6 bilionu tranzistorů a 1 čip na 7nm wafer: Cerebras WSE-2

je to logické, že cena leze nahoru, pokud se cena waferu zdražuje, tak samozřejmě nejsou schopny těžit, z faktu, že se na wafer vejde více čipů, ale vždy pouze 1.
Pár "lidí" si to koupilo, aby si mohlo zkoušet novou hračku, ale předpokládám, že spíš čekaj, že je někdo koupí a zavřou krám.

+1
-1
-1
Je komentář přínosný?

Docela by mě zajímalo, čím to chladěj a kolik to chlazení žere. Něhledě na křehkost křemíku a složitost implementace do finálního produktu. Podle mě by je fakt vyšlo levnějš, kdyby to rozkrájeli a udělali jako sadu čipů, ale jestli spoléhají na vzdálenost mezi jednotlivými "čiplety", tak si holt ukrojili sousto jak hovado a musej se s tím taky tak popasovat, prostě no ;).

+1
+5
-1
Je komentář přínosný?

Prodávají to jako řešení včetně chlazení, na netu je obr. Bez Z. ;-)

+1
+1
-1
Je komentář přínosný?

23 kW uchladíš chladičem z Oktávky při vodním chlazení. 110 kW TDI má chladič dimenzovaný na 40% výkonu motoru takže kdyby použili chladič z Okty tak klidně můžou chladit až 44 kW. A to není velký chladič když se vleze do čumáku auta.

Mě se líbí těch 40 GB SRAM paměti. Atmely taky mají SRAM přímo v čipu, sice jen 2 kB, a je to pekelně rychlé oproti externímu čipu SRAM na SPI sběrnici, nedejbože flash EEPROM na i2C. V té integrované SRAM je podle mne budoucnost větší než v HBM.

+1
-1
-1
Je komentář přínosný?

no jo.. jenze se vyrobci cukaj, aby udelali poradnou podporu CAR (cache as ram), vetsinou to je desny hack s nastavenim cache a nejde v tom rezimu delat ani DMA..

+1
0
-1
Je komentář přínosný?

Asi se cukají kvůli představě že by Win10 mělo určovat co bude uloženo v cache, když dodnes po 20 letech neumí ani pořádně víceprocesorový scheduling. Výkonový dopad by byl příšerný

+1
0
-1
Je komentář přínosný?

Tak iste.. Pretoze vubec, ale vubec neni rozdiel v ploche, ktorou chladi chladiaca zmes motor vs. plocha, do ktorej je koncentrovanych tych 23kW na tom kremiku. Ne, vubec ne..

+1
0
-1
Je komentář přínosný?

Počítal jsem to a vyšlo mi cca 50 W/cm^2, což je obdobný tepelný tok jako běžný procesor. Nikdo ovšem nedává 462 čipů a větráků těsně vedle sebe, takže přímé chlazení vzduchem opravdu nepřipadá v úvahu.
Při měrné tepelné kapacitě vody 4,2 kJ/kg/K mi vychází, že při tepelném výkonu 23 kW (23 kJ/s) ten čip ohřeje 1 kg vody o 5,5 K za sekundu (nebo 5,5 kg vody o 1 K). Stačí mít puštěné čerpadlo a mít na druhé straně dobrý chladič a neměl by to být problém.
Pro srovnání: 23 kW je zhruba deset rychlovarných konvic. I těm trvá dost dlouho než se v nich voda začne vařit a to v principu nemají žádný chladicí okruh.

+1
0
-1
Je komentář přínosný?

Ja nevim co resite. Ta firma to chlazeni vyreseno davno ma - krome cipu totiz je knowhow te firmy jednak chlazeni a pak taky napajeni. Ono totiz kdyz mate 1V core (a to jeste nadsazuji), tak pro 24kW potrebujete 24kA :)
https://www.eetimes.com/powering-and-cooling-a-wafer-scale-die/

+1
+1
-1
Je komentář přínosný?

jen 44kw na oktavku to je nejaka malo ne, motor ma ucinnost 35-40% cca a 60 % bude teplo, pokud to ma 100kw na klikovce pri 50% ucinnosti mas 100kw na chladici, jelikoz ale spalovaci motory 50% nemaji diesely budou mit tak 40% tak to je jeste vic. Ovsem jsou tam trochu jine teplotni spady a ty jsou dulezitejsi pro stanoveni vykonu chladice. U kremiku potrebujes chladit na nizsi teploty. Evidentne to sesroubuji mezi desku a chladic, muze byt vodni, nebo tak neco uchladit to z takove plochy neni problem. Vetsi problem bude ze to bude slepa vyvojova vetev a bussiness z toho nebude.

+1
0
-1
Je komentář přínosný?

Moje chyba, máš samozřejmě pravdu. 110kW na klice je při účinnosti 30% u benzínu nějakých 366 kW. Půlka tepla uteče výfukem a půlka chladičem.

Takže chladič v Oktávce by měl zvládat uchladit 183 kW.
Tepelný spád je 105C až 50C okolí tedy nějakých 55C.
CPU mají max 100C, některé mobilní verze až 105 C, takže tady je to podobné IMHO.

Prostě malý chladič z Okty dokáže uchadit minimálně 100 kW na 70 C.

+1
0
-1
Je komentář přínosný?

slozity kremikovy cip ktery ma bezet roky spolehlive nemuze jet na 100C v pripade GPU treba proste max 60-70C, pak uz bude stoupat poruchovost a nekde nad 85-90 se velmi zvysi poruchovost. Takze to musis chladit na mnohem nizsi teplotu nez v aute. Ale i tak by ten chladic z auta dal pri mensim teplotnim spadu treba 50-80kw zalezi na take na vetraku jakej bude prestup tepla do vzduchu.

+1
0
-1
Je komentář přínosný?

Proč by nemohl jet roky na 100C. Máš nějaký zdroj krácení životnosti CPU vzhledem k teplotě? Jako volty a degradace je známá věc, ale nikdy jsem neslyšel že by mobilní čipy co jedou při vysokých teplotách nějak hromadně odcházely.

+1
0
-1
Je komentář přínosný?

Zivotnost krati sucinitel napatia a teploty. A pri teplote moze platit kludne nieco take, ze kazdych +10 stupnov skrati zivotnost na polovicu.

+1
0
-1
Je komentář přínosný?

Pri takto masakralne velkom pocte procesorovych jadier prestava byt problem vypoctovy vykon. Toho je tam proste tolko, ze ho nejde vsetok vyuzit. Brutalnym a takmer neriesitelnym problemom zacina byt distribucia programu a dat.

Praotec vsetkych masivne paralelnych strojov (a vlastne aj AI) - Thinking Machines CM1 mal v tej dobe neuveritelny pocet procesorovych jadier niekde na urovni vyssich desattisicov (x86 v tej dobe iba zacinala laskovat s 32bitmi). Aby sa to stihalo krmit datami, tak vsetky tie procesorove jadra boli jednobitove a prepojene sietou typu hyperkocka.

Kedze prechod kremik / med zere elektriku navyse a vzdialenosti zvysuju latencie (a tipujem, ze nizke latencie, resp. velka priepustnost pamatoveho systemu per core je to, co ten system robi skutocne vykonnym), tak to asi krajat nebudu / nechcu. Holt je to vhodne len na problemy, ktore skaluju paralelne naozaj dobre, co napr. proteine folding a rozne fyzikalne simulacie zvladaju.

Ja by som ako jadro problemu tohto systemu videl v tom, ze je netradicny. Asi na nom len tak nejde spustit bezny gridovy task a software sa musi prenho specificky upravovat. To stoji cas a peniaze a oplati sa len tam, kde zdrzanie vyvolane upravou software je nasledne dohnane jeho rychlejsim behom. A idealne este za zivotnost tej masiny.

+1
0
-1
Je komentář přínosný?

Na hybridní a komplexní neurální sítě není žádný systém dost rychlý. Zvlášť pro učení pro velké kvanta učících dat a mnoha dimenzích vstupního vektoru. Plus optimalizace autokonfigurovatelných sítí.

+1
0
-1
Je komentář přínosný?

To neni monolit, vzhledem k chybam vyroby by to ani neslo. Normalne je to hromada propojenych stejnych cipu. Jinde to bylo rozebirano.

+1
0
-1
Je komentář přínosný?

„To neni monolit,“ - Není pravda.
„vzhledem k chybam vyroby by to ani neslo“ - Není pravda.
„Normalne je to hromada propojenych stejnych cipu.“ - Není pravda.

+1
+3
-1
Je komentář přínosný?

- Je uvadeno, ze 12.000 jader je rezervovano pro defekty.
- Maska nemuze byt velka jak wafer - proste se sazi cip vedle cipu.
- Propojeni cipu mezi sebou se dela az nasledne.
- Jedine co odpada je rezani.

+1
0
-1
Je komentář přínosný?

A jak posuzujete co je cip a co neni? Stejnou metodou "mask stitching" se vyrabi i obrazove snimace ktere se nevejdou na jednu expozici.

Takze muj 7" snimac z 8" waferu je cip, ale tento "CPU" na 12" waferu jeden cip neni?

Nerekl bych nic, kdyby tam meli TSV a interposer, ale to nemaj. Za me tedy - je to porad jeden cip, at se vam to libi, nebo ne.

+1
0
-1
Je komentář přínosný?

Je to na "stejne desce", ale neni to ani primo propojene - mezery jsou videt i na fotkach. Stejne jako provrtana mista pro uchyceni. Jedna se o samostatne totozne cipy. Proste si nekdo spocital, ze takto to bude levnejsi i provozne vyhodnejsi nez to rozrezat a osazovat samostatne.

+1
-1
-1
Je komentář přínosný?

Je to propojene - a to tak ze dost huste. To ze to nevidite na fotkach, neznamena ze jsou to individualni cipy: Fabric bandwidth: 220 Pb/s

+1
0
-1
Je komentář přínosný?

Druhá vrstva čipu může mít vyleptány jádra posunuté o polovinu šířky takže se pak okna překrývají a tím pádem se propojí jinak normálně oddělené jádra.

CPU mívají desítky vrstev, nahoře tranzistory a dole jsou vrstvy s propojovací. Ryzen jádra jsou taky nahoře oddělená a pak dole jsou propojená s L3 cache. Stejná věc jenom se kvůli tomu nemusí posouvat spodní masky když se to všechno vleze do jednoho okna.

+1
-1
-1
Je komentář přínosný?

"- Propojeni cipu mezi sebou se dela az nasledne."

To není moc relevantní; "monolitický" v případě IO znamená, že všechny součástky jsou realizovány v témže substrátu (monos = jeden, lithos = kámen). Ono propojení tranzistorů se taky dělá "až následně" poté, co uděláte ty tranzistory, takže tady mezi tím opravdu není rozdíl.

+1
+3
-1
Je komentář přínosný?

Navíc na tom jde skvěle těžit Bitcon, už mám doma tři kousky!

+1
+3
-1
Je komentář přínosný?

3 kusky Bitcoinu? si frajer

+1
0
-1
Je komentář přínosný?

Jak říkáme my příznivci kryptoměn: Nemusí pršet, stačí když kape.

+1
+2
-1
Je komentář přínosný?

Jak říkáme my těžaři, tak každej rig z kterého teče víc než dáš za elektriku je zlatej.

Teď si vem že by se zjistilo že opravdu na tom jde výborně těžit Ethereum, v podstatě přes noc by se z pár studentů z toho start upu staly miliardáři. Dnes ani nemusíš dva roky pájet Apple v garáži u rodičů aby se z tebe stal milionář

+1
+1
-1
Je komentář přínosný?

Nezmysel..

+1
+1
-1
Je komentář přínosný?

Njn, bitcoin asi dobry, ale nevis, jak se na tom tezi etherum? Bych si jednoho toho obra koupil a vytezil vsechno etherum, cimz by poklesla cena grafik a slo by zase hrat PC hry. :-/

+1
0
-1
Je komentář přínosný?

Jen abys nedopadl jako milionář, který ukradl slunce... :)

+1
0
-1
Je komentář přínosný?

Slunce je Hitler: https://youtu.be/r-sG_6j450c

+1
0
-1
Je komentář přínosný?

No ano a platí na něj jedině Uwe Filter.

+1
0
-1
Je komentář přínosný?

Predstavujes si to tezeni jak Hurvinek valku. I kdyby si do toho sel all-in a zkoupil za sve penize tezebni vykon etherea, tak by to pri vypocetnim vykonu ty site bylo jak plivnuti do oceanu. V me realite normalne pc hry hrajem. Nenastala tu zadna apokalypsa, ktera by znicila ty stovky milionu hernich grafik co maji lidi po svete v hernich pocitacich.

+1
0
-1
Je komentář přínosný?

Taky hraju. Skyrim, Dragon Age, pak si asi zopaknu Mass Effect a treba se dostane i na opacko Zaklinace. Mrzi me, ze nemuzu hrat ty novy. Tesil jsem se na Cyberpunk, ale kupovat to nebudu, kdyz nemam grafiku.
Ve vysledku, pokud bude krize trvat delsi dobu, tak to bude mit na vyvoj her vliv obecne. Budou se snizovat rozpocty studii nezamerenych primarne na konzole nebo naopak zacnou studia konzole uprednostnovat i ty, pro ktere bylo doted primar PC.

+1
0
-1
Je komentář přínosný?

Nove hry nevyzaduji nove grafiky. Jsou delane tak aby to behalo i na 4 roky starem hw. Cyberpunk ma na 1080p minimul radeon rx 470, coz rok vydani 2016. Byl si tu u minule kryptohorecky v roce 2017, tak nechapu ze ses nepoucil a nekoupil si graifku kdyz byli bezne dostupne za normalni ceny. K tomu prechodu na konzole. Mozna si si toho nevsim ale nova generace konzoli na tom s dostupnosti taky neni kdo vi jak dobre. Z pohledu vyvojare tu zadny zasadni problem neni. Hry se vyvijeji roky. Hardware se prodava prubezne. To ze jsou nejaka obdobi, kdy je to s novym hardware horsi se na prodeji her nijak vyrazne nepodepsalo. Naopak diky covidu jsou prodeje nadprumerne.

+1
+1
-1
Je komentář přínosný?

to mas jako s innosilicon A10, A11 .. dobrej vykon dobra efektivita, ale je to ASIC, kdyz ETH udela zmeny jako ted nedavno udelalo ETC prave aby odstrihlo ASIky mas z toho zarazku do dveri, A10,A11 velmi drahe stroje takze nakonec jsi rad ze to zaplatis krom tezeni to neni pouzitelne na nic, tudiz kartova tezba je proste top. Na tomhle by asi tezit slo, ovsem otazka je energo efektivita a cena zarizeni ;) A ta to zabije. BTC by to tezit sice mohlo ale vykon by byl mizernej proti HW ASIC procesoru, tohle je programovatelny to bude mit proti ASIC radove mensi vykon a horsi efektivitu.

+1
0
-1
Je komentář přínosný?

Takze ty myslis, ze minimalne cast kryptomen vlastni skryte NVidia? Protoze jine vysvetleni, proc odstrihavat ASIC a neodstrihnout GPU NVidia tam nevidim. :-)

+1
0
-1
Je komentář přínosný?

Duvod zmeny algoritmu je, aby se odstavily z tezby asic zarizeni, asic maji vetsinou vyrazne vyssi efektivitu nez GPU a tudiz vysosavaji reward a snizuji profitovost kartove tezbe, ktera je lepe decentralizovana, ASIC vetsinou jedou z velkych farem z ciny, konkretne ethereum classic udelalo zmenu algoritmu kvuli 51% utokum na sit zrejme prave temito asic stroji z ciny a kvuli zlepseni rewardu mineru kartovym. Jestli nekte site vlastni nebo spoluvlastni nektery z vyrobcu GPU to nevim, ale pro jejich bussiness je to rozhodne super vec. Vem si ze delas nejakej bussiness a sam bys moh ovlivnovat - zvysovat poptavku, to je super ne :)

+1
0
-1
Je komentář přínosný?

Stejne neodpovidas na to, proc odstrihavat ASIC z tezby: "vysosavaji reward" - proste maji vyssi vykon, coz je pro kryptomenu dobre, "lepe decentralizovana" - to opet neni pro kryptomenu samotnou zadny problem, i tech ASIC bude nutne muset byt mnozstvi, ktere zajistuje dostatecnou decentralizaci, ze snizuji profitovost tezbe na GPU ovsem vadi pouze domacim tezarum s jednou GPU. Ve chvili, kdy obstaras pole grafik, muzes obstarat i ASIC.

Takze ve vysledku, pokud je tvuj komentar relevantni, to muze znamenat jedine - tim komu soucasna situace nejvic vyhovuje bude NVidia. Lide se mohou porvat o jejich karty a "jejich" kryptomena raketove roste.

Mozna to teda objasnuje, proc je navrh Ampere i castecne predchoziho Turingu prave takovy, jaky je. Hram oproti vyslovene hernimu navrhu RDNA2 moc neprinasi, za to pro tezare je to raj na zemi.

+1
0
-1
Je komentář přínosný?

ASIKy nemaji cryptosite rady 1. vyrazne lepsi efektivita nez kartova tezba = okradani kartovych mineru o reward - neferovost v rozdelovani odmeny 2. site potrebuji co nejlepsi decentralizaci vykonu, coz ASIC opet kazdy protoze vetsina vykonu z ASIC jde z ciny. 3. pro minera je ASIC zarizeni riskantni - vysoka cena masiny a nemoznost upgrade softwaru ani HW v pripade zmeny algoritmu viz ethereum classic. Nejen Nvidia ale i AMD z toho velmi profituji, ale i dalsi firmy jako je Xilinx kterej vyrabi FPGA procesory na kterych se take tezi. Ja osobne mam nvidi jen v pc, v rigach mam 5700xt a nejaky zbyly rigy s rx580 cekajici na upgrade az bude za co. No nvidie ted dost zaspala a vydala radu 3000 pozde kdyz uz zacala tezebni manie / vysokej kurz krypta. AMD mela uz rok na trhu 5700xt za fajn cenu bezne dostupne a na etereum vyborne karty s top pomerem/cena/vykon/spotreba dostupnost, tedy v jaro/leto 2020. Prave ze na tezbu eteru je lepsi 5700xt ktera dava 56.5 mh 95w na GPU, RDNA2 rada 6000 dava jen asi do 65 mh ale cena je silena, proste na tezeni ethash nema infinity cache vliv. Ovsem jsou i jine coiny kde tyhle karty maji 2x vyssi vykon nez 5700xt nekde jeste vic, monero, grin,ravencoin atd. Rada 6000 je ale diky ty kesi super na hry, za o dost mensi penize 6900xt podava vysoce srovnatelne vysledky jako 3090 ktera je silene draha, zere o hodne vic a jejich 24GB pameti vicemene nikdo nevyuzije a az ano uz bude notne zastarala.

+1
0
-1
Je komentář přínosný?

Ne. Nektere kryptomeny meli od zacatku nejaky cil ohledne tezeni. Nektere jsou delane tak, aby sli tezit jen na cpu. Nektere zamerne delaji vsechno pro to, aby nesli tezit na asicu. Byla za tim nejaka falesna predstava, ze to ponecha tezeni v rukou obycejnych lidi a zvysi decentralizaci. Vedena tim, ze kdyz bude asic tak budou tezit firmy. Sice cely ten system selhal a tezi se prumyslove ve velkym. Ale u nekterych men si stale autori hraji na Don Don Quijota a marne se snazi bojovat.

+1
0
-1
Je komentář přínosný?

Jiste, oni totiz potrebuji maximalni decentralizaci vykonu ne nutne co nejvyssi vykon, ten je stejne resen zvyseni obtiznosti a tim se urzuji naklady site na stejne urovni, samozrejme cim vyssi je vykon site tim je obtiznejsi vest proti ni utok 51% kde se snazi utocnik falesne overit blok se zfalsovanymi transakcemi. Neni to tak dlouho co toto probehlo na ethereu classic a zrejme ten vykon sel z asic farem z ciny a i proto doslo ze zmene algoritmu aby byly asic ze hry a zvysila se profitovost kartove - lepe decentralizovane tezby. I BTC se zacinal tezit na cpu, pak se preslo na GPU a pak na asiky ktere gpu totalne deklasuji ve vykonu i spotrebe o nekolik radu :) Ja treba mel farmu antmineru s9 z roku 2017 to melo cipy 16nm tsmc, efektivita v defaultnim nastavenie byla 98J/Th a ted nejnovejsi stroje v public marketu (mimo public maji dost mozna jeste efektivnejsi) jsou treba antminer s19e 110Th cipy 7nm tsmc, efektivita 28J/Th takze je skoro 3x efektivnejsi.. taky proto se jich na zapad dostalo minimum toto si cinani drzi doma, prodaji to svetu az budou mit sami masiny zas o generaci novejsi :) A toto je i problem BTC, protoze naprosta vetsi vykonu jde z ciny, jen tak pro srandu jsem pocital kolik zere BTC sit a vyslo me asi 4000 MW za predpokladu ze by jely jen antminer s19e, ale ono bezi spousta stare techniky takze to bude o hodne vic treba 6-8 GW. Jelikoz bloky jedou po 10 min. tak se da i spocitat kolik by stalo overeni bloku :) Etereum na tom bude o dost lip, blok co 13 sec a odmena za blok 2 ETH + poplatky z transakci. tedy asi 4500$ za blok kazdych 13 sec .. tvl. to je za 24h dost slusna raketa za provoz site :)

+1
0
-1
Je komentář přínosný?

Ok, tvemu komentari rozumim, ale furt si rikam, jestli ten jejich boj proti ASIC teda pro ty"obycejne" tezare, nemuze byt jen zasterka a nemuze zatim byt treba primo ta NVidie, ktera na "nicem" vydelava jeste mnohem vic penez nez na hracich.

+1
0
-1
Je komentář přínosný?

A tak urcite jim asic stroje uziraji kseft s kartama to ano, ale hlavni duvod je to ze jsou obvykle vyrazne vykonejsi/nizsi spotreba a je potreba udrzet ferovost a a to aby kartova tezba byla vyhodnejsi a asic kartam nekazila ekonomiku. Mam v chodu jeste 2x antminer e3 coz je asic na ethash je to strojek z roku 2018, se 4GB na cip v ty masine je 18 vypocetnich cipu a 72 GB ddr3 ram (32 ks pametovych cipu kolem toho procesoru) ethereum to samozrejme uz neumi kvuli pameti, etc take ne kvuli algoritmu, takze na tom jedu Expanse a ted 2 tyhle stroje delaji asi 10$ za den cistych proc ne .. absolutne spolehlivy strojek, takovy kompaktni rig 200mh a sikovny na domaci topeni :)

+1
0
-1
Je komentář přínosný?

Kdyby nejaky ten vliv v kryptokomunite nvidie mela a mohla nejak ovlivnovat. Tak v prvni rade by mela pripraveny vcas patricny tezebni karty. A nepredvadela by tu aktualni tragikomedii kdy se za behu snazi neco vydat a dostat k minerum a omezovat tezeni na hernich grafikach naprosto nedostatecnym a nefunkcnim omezovacem. Navic vychazim z toho, ze cela ta idea omezovani tezby na nejakem hw je o nekolik let starsi nez prvni grafika nvidie pouzitelna na tezeni. To byla GeForce GTX 750 Ti vydana v unoru 2014. Prvni pouzitelna a masove pouzivana geforce na tezeni. A prvni mena, ktera slibovala omezovani tezby na nejakem hw byl litecoin z roku 2011.

+1
0
-1
Je komentář přínosný?

tezebni karty jsou k hovnu, protoze je nejde prodat hracum, ja muzu kdykoli karty pouzit do pc. Ty tezebni ne a v dobe kdy je kurz dole se vicemene ani nedaji prodat. Nezkousel tady nekdo farmit ten chia coin, coz se netezi na grafikach ale je k tomu potreba uloziste myslim ze min je asi 100GB disku a docela to ma i profitovost, to brzo zmizi velke disky z eshopu :-D

+1
0
-1
Je komentář přínosný?

Jasne, jenze ty to mas ze sveho pohledu maleho tezare. Velkym tezarskych farmam je uplne jedno, ze to nejde prodat hracum. Ty to naprosto v klidu jedou dokud to nejak smysluplne neco generuje nebo do uplnyho umrti. Takze kdyz muzou primo od nvidie koupit tezebni karty, tak nemaj problem udelat objednavku radove za miliony $.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.