Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD učinila další krok směrem k MCM CPU / GPU

Gabriel l Loh nie je len tak niekto on je firemný odborný poradca (corporate fellow) a ted aosoba, čo má riešiť skoro neriešiteľné problémy a za niečo podobné/alebo presne toto dostal cenu ACM. A musí to byť hlava ako hrom. Jednask je druhým víťazom tej ceny z AMD po Derickovi Meyerovi - autrorom K7 a skutočnej K8 , ex -CEO AMD a asistentom šéfautora DEC Alpha AXP.
a Prvým corporate fellow u AMD bola Rich Witek, čo je totálna hlava viď. koniec príspevku. Takže to musí byť TOP človek.

AMD Engineer Gabriel Loh Named 2018 Maurice Wilkes Award Winner for Outstanding Contributions to Die-Stacked Architectures
SANTA CLARA, Calif. 6/6/2018
https://www.amd.com/en-us/press-releases/Pages/amd-engineer-gabriel-2018...

The award of $2,500 is given annually for an outstanding contribution to computer architecture made by an individual whose computer-related professional career (graduate school or full-time employment, whichever began first) started no earlier than January 1st of the year that is 20 years prior to the year of the award.*
https://www.sigarch.org/benefit/awards/acm-sigarch-maurice-wilkes-award/

Dick Sites and Dirk Meyer, Alpha architecture video, April 1992

AMD Athlon (K7), 1999 - Dirk Meyer (Dir. Engr.), Fred Weber, ...
AMD Opteron (K8), 2003 - Jim Keller and then Fred Weber

Jim Keller left and the initial K8 design was canceled
Fred Weber led the project to revise the K7 into a 64-bit core
https://people.cs.clemson.edu/~mark/architects.html

https://semiengineering.com/people/rich-witek/

DEC

StrongARM
StrongARM 110, 1996 - Rich Witek (lead), Greg Hoepnner, Ray Stephany, Jim Montanaro,
StrongARM 1100, 1997 - Rich Witek (lead microarchitect), Ray Stephany (implementation)
microVAX, 1985 (VAX subset)
Bob Supnik (CPU project manager and microcode), Dan Dobberpuhl (CPU lead engineer), Rich Witek (CPU microarchuitecture),
PRISM (Parallel Reduced Instruction Set Machine), 1989 - Dave Cutler, Dileep Bhandarkar, Rich Witek, Dave Orbits, and Wayne Cardoza
HR-32, started in 1984 - Rich Witek and Dan Dobberpuhl
microPRISM - Rich Witek (lead microarchitect)
Alpha - Dick Sites and Rich Witek
21064 (EV4), 1992 - Rich Witek (lead)

Rich Witek was appointed corporate fellow, the highest position in the company's Member of Technical Staff (MTS) program.He is the first AMD employee to hold this position
https://www.zoominfo.com/p/Rich-Witek/5320718

+1
-4
-1
Je komentář přínosný?

Môžem sa ťa spýtať, aké je tvoje povolanie ? Formu tvojich príspevkov neriešim, často krát sú veľmi chaotické, plné preklepov a množstvu citácií a odkazov nepriehľadné. Ale čo sa týka obsahu, prakticky vždy všetko podoprieš nejakým zdrojom, neraz veľmi prínosným pre niekoho, koho daná problematika zaujíma trochu viac do hĺbky. Ak nie si chodiaca encyklopédia, tak čomu sa venuješ ? Ďakujem.

+1
0
-1
Je komentář přínosný?

Asi narážate na profesionálnu deformáciu

od 1.7.2005 do 30.6.2017 som učil systémové programovanie a v rámci publikácií som musel každý prebratý výrok a zdroj doložiť citáciou... A externe ešte občas pomáham.

+1
+2
-1
Je komentář přínosný?

Vďaka. Aj som to na školstvo tipoval.

+1
0
-1
Je komentář přínosný?

Nie je za čo

Navyše to bol medzi odbor medzi odbormi

informatika= Veda o získavaní, prenose, spracovaní a UKLADANÍ informácie
Kybernetika= Veda o získavaní, prenose, spracovaní informácie ZA ÚČELOM RIADENIA

+1
0
-1
Je komentář přínosný?

chaoticke ≠ komplikovane ≠ zrozumitelne ≠ pravdive ≠ pochopitelne , aj ked rozumiem narazke :)

+1
0
-1
Je komentář přínosný?

Nedalo mi to a podíval jsem se, jak se jmenovala ta firma co kdysi vyráběla rychlejší matematické koprocesory. A jmenovala se Weitek. A Witek s Weitekem nemá nic společného :-)

+1
0
-1
Je komentář přínosný?

Tak toto je cisty dopravacky problem :) chce to naozaj kvalitneho odbornika na dopravu aby povedal ako a programatory to zrealizovali. Toto je naozaj pekny problem hlavne ak chcu zachovat co najmenej ciest.

+1
+1
-1
Je komentář přínosný?

Hadam ze uz to maji vyresene a primitivni predchuzce bez dane logiky rizeni nasadili do finalniho produktu uz pred nekolika generacemi ( pred Vegou a Polarisem) ...hadam ze brzo prijde jeden pan co bude tvrdit ze nikde o tom neni ani zminka a ze AMD nic takoveho nema a pritom koukam ze jejich reseni je univerzalnejsi nez se ocekavalo a lze libovolne kombinovat nejen CPU/GPU a pamet

+1
0
-1
Je komentář přínosný?

Takže jsme se dozvěděli, že AMD má pro MCM nějaký vtipný algoritmus "předcházení zahlcení". Trochu se nám ty sběrnice mezi procesorovými jádry posunuly směrem ke komunikačním sítím. Dobře se poslouchá, že na to hoši vymysleli nějaký "bezkolizní" mechanismus :-) Ono totiž jakékoli řešení na principu "flow control" bude trpět rychlostí šíření (roundtrip tok->flow control je omezený vzáleností a rychlostí světla) čili ideální je samozřejmě "pošli a zapomeň". Jinak mi ale vrtá hlavou, jaký je rozdíl mezi tímto a stávajícími technologiemi jako je HyperTransport, QPI nebo všelijaké kruhové topologie uvnitř pouzdra CPU... (hehehe předávání vysílacího práva.) Vždyť už na trapné staré FSB bylo třeba soudcovat, kdo má zrovna právo vysílat.
Chápu že v rámci jednoho čipu je "relativně" trivka postavit nějakou centrální "matici" a cca kdo dřív přijde ten dřív mele, vzdálenosti pro "flow control" nejsou nijak extrémní apod. A že mezi čipy to bude složitější, zejm. pokud je požadavek na variabilitu topologie.

BTW Já bych jim doporučil nastudovat CANbus arbitration ;-)

+1
0
-1
Je komentář přínosný?

CAN to má dobre, ale je tam trochu problém 2.0A, vs 2.0B...

>Chápu že v rámci jednoho čipu je ...v zdálenosti pro "flow control" nejsou nijak extrémní apod.

Práveže sú, tak si spočítajme dráhu, ktorú prejde svetlo vo vákuu za jeden cyklus 4GHz CPU., d je dráha, aby sa skratka s pre anglické scope alebo francúzske sphère neplietli so sekundou.
rýchlosť (velocity resp. vitesse) aj čas (time resp. temps) nechávam v medzi národných skratkách. Frekvencia je jednotná.

d=ct= c/f= 3*10^8m/s/(4*10^9 1/s)=3*10^8/(4*10^9)= 0,075 m =7,5 cm

a ono je rýchlosť elektrónov v medi nižšia ako rýchloosť svetla vo vákuu

"
S ohledem na známé rozměry pouzder GDDR6 čipů bylo možné změřit, že středová část BGA rozhraní odpovídá ploše 26 × 26 milimetrů, tedy 676 mm². "
https://diit.cz/clanek/prototyp-nvidia-turing-vypada-na-680mm2-cip

26 mm aka 2,6 cm je už dosť málo. Uhlopriečka by mala sqrt(2)*2,6 cm= 3,68 cm a to už môže byť veľmi veľký problém, ak to má byť a pre CPU aj GPU, tak uvažujem worst case oboch, lebo to už je posun o cca pol hodinového cyklu voči svetlu v vákuu a ešte viac voči elektrónom v medi...

titulok článku je:
"AMD učinila další krok směrem k MCM CPU / GPU"

+1
0
-1
Je komentář přínosný?

Rychlost elektronů (skutečnou)bbych do toho raději netahal nebo se v tom zamotáte... :)

+1
0
-1
Je komentář přínosný?

Jasne. Ja som chcel len rádovo orientačné čísla..

Asi som mal hovoriť o veľkosti vektora strednej rýchlosti prúdu elektrónov, aby to nevyznelo ako rýchlosť každého jedného elektrónu

+1
0
-1
Je komentář přínosný?

No cele ste to solidne zmotal.

Rychlost sireni informace ve vodici, natoz pak v integrovanem obvodu rozhodne neni to same jako rychlost svetla ve vakuu.

Matete akorat lidi spatnym pouzitim nabiflovanych poucek.

+1
0
-1
Je komentář přínosný?

Rekl bych ze celej thread je zamotanej, ale hlavne je tak trochu mimo, protoze podle toho co ctu, se nejedna o zadnej bus arbitration algoritmus, a uz vubec to neresi neco s frekvencemi a vzdalenostmi.

Hadam ze na tom interposeru si muzou udelat point2point spojeni mezi "chiplety" podle potreby, a tudiz nepotrebuji resit zadnej bus arbitration, co ale resit potrebuji je routing. Citace primo z IEEE odkazu:

“A deadlock can happen basically where you have a circle or a cycle of different messages all trying to compete for same sorts of resources causing everyone to wait for everyone else,” Loh explains.

“Each of those individual [chiplets] could be designed so that they never have deadlocks,” says Loh. “But once I put them together, there are now new paths and new routes that no individual had planned for ahead of time.”

... tohle mi prijde jako nejaky druh network routing problemu.

+1
+1
-1
Je komentář přínosný?

Ja som niekde tvrdil, že je to to isté?
Tvrdil som, že je to ešte pomalšie a teda je to horšie ako ten výpočet..

+1
+1
-1
Je komentář přínosný?

Rychlost sireni informaci a rychlost pohybu elektronu jsou hooodne rozdilne.

+1
0
-1
Je komentář přínosný?

Jasny priklad chodici encyklopedie, ktera neumi pouzit mozek.

Kdyz zacnete argumentovat(komentovat) takovyma hovadinama, tak tam tu souvislost vytvarite. A to jsem kritizoval. Vubec jste se do toho nemel poustet, protoze rychlost svetla, elektronu, atp. neni v zadnem pripade relevantni v tomhle problemu, co AMD resi.

+1
0
-1
Je komentář přínosný?

Pokud resime maximalni plochu kterou MCM chceme zabrat (a delku propojeni i mimo MCM) vs snychro a asynchro tak jo naprosto relevatni otazka ktera musi byt zahrnuta do vyvoje takoveho reseni (obzvlast kdyz chceme dosahovat vysokych frekvenci navic je velmi prvavdepodbne ze jednotlive casti mohou mit ruzne takty atd. (aspon v tom pojeti ktere planuje AMD)

+1
0
-1
Je komentář přínosný?

Ta vzdalenost je mensi, nez vzdalenost mezi klasickymi pametovymi cipy a GPU jadrem.
Je mnohem mensi, nez vzdalenost mezi RAMkou a CPU. Je desive mensi, nez vzdalenost mezi CPU a GPU (PCI-E).

A jake spojeni mimo MCM??? Jako ze by byly dva interposer-y jeden s GPU chipletama a druhy s HBM a nejaky most mezi nimi?

AMD neresi to, jak datove cesty musi byt seskladany na Interposer-u, tak aby byly vsechny stejne dlouhe. To uz davno vyresene je, je to trivialni problem, na ktere jsou pouzite automaticke knihovny pri navrhu. Nema to s rychlosti svetla a vlivu na frekvenci moc spolecneho. Frekvence na vodici urcite delky je neco jineho, nez frekvence tranzistoru v jakekoli logice. A o tu logiku tady jde.

+1
0
-1
Je komentář přínosný?

Každý logický člen do toho zanese další zpoždění. Podle mne uzrál čas vrátit se k rozšíření datových sběrnic. Pak bud možné použít "obyčejné" RAM, celé to bude levné, výkonné a při současné technologii i úsporné.

+1
0
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.