Diskuse k AMD učinila další krok směrem k MCM CPU / GPU

Peter Fodrek | 2. 7. 2018 - 09:02

Gabriel l Loh nie je len tak niekto on je firemný odborný poradca (corporate fellow) a ted aosoba, čo má riešiť skoro neriešiteľné problémy a za niečo podobné/alebo presne toto dostal cenu ACM. A musí to byť hlava ako hrom. Jednask je druhým víťazom tej ceny z AMD po Derickovi Meyerovi - autrorom K7 a skutočnej K8 , ex -CEO AMD a asistentom šéfautora DEC Alpha AXP.
a Prvým corporate fellow u AMD bola Rich Witek, čo je totálna hlava viď. koniec príspevku. Takže to musí byť TOP človek.

AMD Engineer Gabriel Loh Named 2018 Maurice Wilkes Award Winner for Outstanding Contributions to Die-Stacked Architectures
SANTA CLARA, Calif. 6/6/2018
https://www.amd.com/en-us/press-releases/Pages/amd-engineer-gabriel-2018...

The award of $2,500 is given annually for an outstanding contribution to computer architecture made by an individual whose computer-related professional career (graduate school or full-time employment, whichever began first) started no earlier than January 1st of the year that is 20 years prior to the year of the award.*
https://www.sigarch.org/benefit/awards/acm-sigarch-maurice-wilkes-award/

Dick Sites and Dirk Meyer, Alpha architecture video, April 1992

AMD Athlon (K7), 1999 - Dirk Meyer (Dir. Engr.), Fred Weber, ...
AMD Opteron (K8), 2003 - Jim Keller and then Fred Weber

Jim Keller left and the initial K8 design was canceled
Fred Weber led the project to revise the K7 into a 64-bit core
https://people.cs.clemson.edu/~mark/architects.html

https://semiengineering.com/people/rich-witek/

DEC

StrongARM
StrongARM 110, 1996 - Rich Witek (lead), Greg Hoepnner, Ray Stephany, Jim Montanaro,
StrongARM 1100, 1997 - Rich Witek (lead microarchitect), Ray Stephany (implementation)
microVAX, 1985 (VAX subset)
Bob Supnik (CPU project manager and microcode), Dan Dobberpuhl (CPU lead engineer), Rich Witek (CPU microarchuitecture),
PRISM (Parallel Reduced Instruction Set Machine), 1989 - Dave Cutler, Dileep Bhandarkar, Rich Witek, Dave Orbits, and Wayne Cardoza
HR-32, started in 1984 - Rich Witek and Dan Dobberpuhl
microPRISM - Rich Witek (lead microarchitect)
Alpha - Dick Sites and Rich Witek
21064 (EV4), 1992 - Rich Witek (lead)

Rich Witek was appointed corporate fellow, the highest position in the company's Member of Technical Staff (MTS) program.He is the first AMD employee to hold this position
https://www.zoominfo.com/p/Rich-Witek/5320718

Gabriel l Loh nie je len tak

Peter Fodrek https://diit.cz/profil/fotobanew

2. 7. 2018 - 09:02 https://diit.cz/clanek/amd-ucinila-dalsi-krok-smerem-k-mcm/diskuse Gabriel l Loh nie je len tak niekto on je firemný odborný poradca (corporate fellow) a ted aosoba, čo má riešiť skoro neriešiteľné problémy a za niečo podobné/alebo presne toto dostal cenu ACM. A musí to byť hlava ako hrom. Jednask je druhým víťazom tej ceny z AMD po Derickovi Meyerovi - autrorom K7 a skutočnej K8 , ex -CEO AMD a asistentom šéfautora DEC Alpha AXP. a Prvým corporate fellow u AMD bola Rich Witek, čo je totálna hlava viď. koniec príspevku. Takže to musí byť TOP človek. AMD Engineer Gabriel Loh Named 2018 Maurice Wilkes Award Winner for Outstanding Contributions to Die-Stacked Architectures SANTA CLARA, Calif. 6/6/2018 https://www.amd.com/en-us/press-releases/Pages/amd-engineer-gabriel-2018jun06.aspx The award of $2,500 is given annually for an outstanding contribution to computer architecture made by an individual whose computer-related professional career (graduate school or full-time employment, whichever began first) started no earlier than January 1st of the year that is 20 years prior to the year of the award.* https://www.sigarch.org/benefit/awards/acm-sigarch-maurice-wilkes-award/ Dick Sites and Dirk Meyer, Alpha architecture video, April 1992 AMD Athlon (K7), 1999 - Dirk Meyer (Dir. Engr.), Fred Weber, ... AMD Opteron (K8), 2003 - Jim Keller and then Fred Weber Jim Keller left and the initial K8 design was canceled Fred Weber led the project to revise the K7 into a 64-bit core https://people.cs.clemson.edu/~mark/architects.html https://semiengineering.com/people/rich-witek/ DEC StrongARM StrongARM 110, 1996 - Rich Witek (lead), Greg Hoepnner, Ray Stephany, Jim Montanaro, StrongARM 1100, 1997 - Rich Witek (lead microarchitect), Ray Stephany (implementation) microVAX, 1985 (VAX subset) Bob Supnik (CPU project manager and microcode), Dan Dobberpuhl (CPU lead engineer), Rich Witek (CPU microarchuitecture), PRISM (Parallel Reduced Instruction Set Machine), 1989 - Dave Cutler, Dileep Bhandarkar, Rich Witek, Dave Orbits, and Wayne Cardoza HR-32, started in 1984 - Rich Witek and Dan Dobberpuhl microPRISM - Rich Witek (lead microarchitect) Alpha - Dick Sites and Rich Witek 21064 (EV4), 1992 - Rich Witek (lead) Rich Witek was appointed corporate fellow, the highest position in the company's Member of Technical Staff (MTS) program.He is the first AMD employee to hold this position https://www.zoominfo.com/p/Rich-Witek/5320718 https://diit.cz/clanek/amd-ucinila-dalsi-krok-smerem-k-mcm/diskuse#comment-1161579 +

witchhammer | 2. 7. 2018 - 09:34

Môžem sa ťa spýtať, aké je tvoje povolanie ? Formu tvojich príspevkov neriešim, často krát sú veľmi chaotické, plné preklepov a množstvu citácií a odkazov nepriehľadné. Ale čo sa týka obsahu, prakticky vždy všetko podoprieš nejakým zdrojom, neraz veľmi prínosným pre niekoho, koho daná problematika zaujíma trochu viac do hĺbky. Ak nie si chodiaca encyklopédia, tak čomu sa venuješ ? Ďakujem.

Peter Fodrek | 2. 7. 2018 - 09:40

Asi narážate na profesionálnu deformáciu

od 1.7.2005 do 30.6.2017 som učil systémové programovanie a v rámci publikácií som musel každý prebratý výrok a zdroj doložiť citáciou... A externe ešte občas pomáham.

witchhammer | 2. 7. 2018 - 10:03

Vďaka. Aj som to na školstvo tipoval.

Peter Fodrek | 2. 7. 2018 - 11:20

Nie je za čo

Navyše to bol medzi odbor medzi odbormi

informatika= Veda o získavaní, prenose, spracovaní a UKLADANÍ informácie
Kybernetika= Veda o získavaní, prenose, spracovaní informácie ZA ÚČELOM RIADENIA

ovadisko | 2. 7. 2018 - 18:19

chaoticke ≠ komplikovane ≠ zrozumitelne ≠ pravdive ≠ pochopitelne , aj ked rozumiem narazke :)

frr | 2. 7. 2018 - 14:12

Nedalo mi to a podíval jsem se, jak se jmenovala ta firma co kdysi vyráběla rychlejší matematické koprocesory. A jmenovala se Weitek. A Witek s Weitekem nemá nic společného :-)

ica sk | 2. 7. 2018 - 13:16

Tak toto je cisty dopravacky problem :) chce to naozaj kvalitneho odbornika na dopravu aby povedal ako a programatory to zrealizovali. Toto je naozaj pekny problem hlavne ak chcu zachovat co najmenej ciest.

Tom | 2. 7. 2018 - 14:13

Hadam ze uz to maji vyresene a primitivni predchuzce bez dane logiky rizeni nasadili do finalniho produktu uz pred nekolika generacemi ( pred Vegou a Polarisem) ...hadam ze brzo prijde jeden pan co bude tvrdit ze nikde o tom neni ani zminka a ze AMD nic takoveho nema a pritom koukam ze jejich reseni je univerzalnejsi nez se ocekavalo a lze libovolne kombinovat nejen CPU/GPU a pamet

frr | 2. 7. 2018 - 14:07

Takže jsme se dozvěděli, že AMD má pro MCM nějaký vtipný algoritmus "předcházení zahlcení". Trochu se nám ty sběrnice mezi procesorovými jádry posunuly směrem ke komunikačním sítím. Dobře se poslouchá, že na to hoši vymysleli nějaký "bezkolizní" mechanismus :-) Ono totiž jakékoli řešení na principu "flow control" bude trpět rychlostí šíření (roundtrip tok->flow control je omezený vzáleností a rychlostí světla) čili ideální je samozřejmě "pošli a zapomeň". Jinak mi ale vrtá hlavou, jaký je rozdíl mezi tímto a stávajícími technologiemi jako je HyperTransport, QPI nebo všelijaké kruhové topologie uvnitř pouzdra CPU... (hehehe předávání vysílacího práva.) Vždyť už na trapné staré FSB bylo třeba soudcovat, kdo má zrovna právo vysílat.
Chápu že v rámci jednoho čipu je "relativně" trivka postavit nějakou centrální "matici" a cca kdo dřív přijde ten dřív mele, vzdálenosti pro "flow control" nejsou nijak extrémní apod. A že mezi čipy to bude složitější, zejm. pokud je požadavek na variabilitu topologie.

BTW Já bych jim doporučil nastudovat CANbus arbitration ;-)

Peter Fodrek | 2. 7. 2018 - 14:39

CAN to má dobre, ale je tam trochu problém 2.0A, vs 2.0B...

>Chápu že v rámci jednoho čipu je ...v zdálenosti pro "flow control" nejsou nijak extrémní apod.

Práveže sú, tak si spočítajme dráhu, ktorú prejde svetlo vo vákuu za jeden cyklus 4GHz CPU., d je dráha, aby sa skratka s pre anglické scope alebo francúzske sphère neplietli so sekundou.
rýchlosť (velocity resp. vitesse) aj čas (time resp. temps) nechávam v medzi národných skratkách. Frekvencia je jednotná.

d=ct= c/f= 3*10^8m/s/(4*10^9 1/s)=3*10^8/(4*10^9)= 0,075 m =7,5 cm

a ono je rýchlosť elektrónov v medi nižšia ako rýchloosť svetla vo vákuu

"
S ohledem na známé rozměry pouzder GDDR6 čipů bylo možné změřit, že středová část BGA rozhraní odpovídá ploše 26 × 26 milimetrů, tedy 676 mm². "
https://diit.cz/clanek/prototyp-nvidia-turing-vypada-na-680mm2-cip

26 mm aka 2,6 cm je už dosť málo. Uhlopriečka by mala sqrt(2)*2,6 cm= 3,68 cm a to už môže byť veľmi veľký problém, ak to má byť a pre CPU aj GPU, tak uvažujem worst case oboch, lebo to už je posun o cca pol hodinového cyklu voči svetlu v vákuu a ešte viac voči elektrónom v medi...

titulok článku je:
"AMD učinila další krok směrem k MCM CPU / GPU"

simik | 2. 7. 2018 - 16:28

Rychlost elektronů (skutečnou)bbych do toho raději netahal nebo se v tom zamotáte... :)

Peter Fodrek | 2. 7. 2018 - 16:33

Jasne. Ja som chcel len rádovo orientačné čísla..

Asi som mal hovoriť o veľkosti vektora strednej rýchlosti prúdu elektrónov, aby to nevyznelo ako rýchlosť každého jedného elektrónu

Mali | 2. 7. 2018 - 16:50

No cele ste to solidne zmotal.

Rychlost sireni informace ve vodici, natoz pak v integrovanem obvodu rozhodne neni to same jako rychlost svetla ve vakuu.

Matete akorat lidi spatnym pouzitim nabiflovanych poucek.

franzzz | 2. 7. 2018 - 17:13

Rekl bych ze celej thread je zamotanej, ale hlavne je tak trochu mimo, protoze podle toho co ctu, se nejedna o zadnej bus arbitration algoritmus, a uz vubec to neresi neco s frekvencemi a vzdalenostmi.

Hadam ze na tom interposeru si muzou udelat point2point spojeni mezi "chiplety" podle potreby, a tudiz nepotrebuji resit zadnej bus arbitration, co ale resit potrebuji je routing. Citace primo z IEEE odkazu:

“A deadlock can happen basically where you have a circle or a cycle of different messages all trying to compete for same sorts of resources causing everyone to wait for everyone else,” Loh explains.

“Each of those individual [chiplets] could be designed so that they never have deadlocks,” says Loh. “But once I put them together, there are now new paths and new routes that no individual had planned for ahead of time.”

... tohle mi prijde jako nejaky druh network routing problemu.

Peter Fodrek | 2. 7. 2018 - 18:00

Ja som niekde tvrdil, že je to to isté?
Tvrdil som, že je to ešte pomalšie a teda je to horšie ako ten výpočet..

simik | 3. 7. 2018 - 05:53

Rychlost sireni informaci a rychlost pohybu elektronu jsou hooodne rozdilne.

Mali | 4. 7. 2018 - 17:49

Jasny priklad chodici encyklopedie, ktera neumi pouzit mozek.

Kdyz zacnete argumentovat(komentovat) takovyma hovadinama, tak tam tu souvislost vytvarite. A to jsem kritizoval. Vubec jste se do toho nemel poustet, protoze rychlost svetla, elektronu, atp. neni v zadnem pripade relevantni v tomhle problemu, co AMD resi.

Tom | 5. 7. 2018 - 12:23

Pokud resime maximalni plochu kterou MCM chceme zabrat (a delku propojeni i mimo MCM) vs snychro a asynchro tak jo naprosto relevatni otazka ktera musi byt zahrnuta do vyvoje takoveho reseni (obzvlast kdyz chceme dosahovat vysokych frekvenci navic je velmi prvavdepodbne ze jednotlive casti mohou mit ruzne takty atd. (aspon v tom pojeti ktere planuje AMD)

Mali | 9. 7. 2018 - 16:53

Ta vzdalenost je mensi, nez vzdalenost mezi klasickymi pametovymi cipy a GPU jadrem.
Je mnohem mensi, nez vzdalenost mezi RAMkou a CPU. Je desive mensi, nez vzdalenost mezi CPU a GPU (PCI-E).

A jake spojeni mimo MCM??? Jako ze by byly dva interposer-y jeden s GPU chipletama a druhy s HBM a nejaky most mezi nimi?

AMD neresi to, jak datove cesty musi byt seskladany na Interposer-u, tak aby byly vsechny stejne dlouhe. To uz davno vyresene je, je to trivialni problem, na ktere jsou pouzite automaticke knihovny pri navrhu. Nema to s rychlosti svetla a vlivu na frekvenci moc spolecneho. Frekvence na vodici urcite delky je neco jineho, nez frekvence tranzistoru v jakekoli logice. A o tu logiku tady jde.

Moonalert | 2. 7. 2018 - 18:41

Každý logický člen do toho zanese další zpoždění. Podle mne uzrál čas vrátit se k rozšíření datových sběrnic. Pak bud možné použít "obyčejné" RAM, celé to bude levné, výkonné a při současné technologii i úsporné.

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.

Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k AMD učinila další krok směrem k MCM CPU / GPU

Komerční sdělení

CDR Hry

Voda nepřišla jen ze Země. Nový výzkum ukazuje její mezihvězdný původ

Fyzici našli možnou trhlinu v čase. Je extrémně malá, ale podstatná

Tři tuny zásob na oběžnou dráhu. Rusko vyslalo svou loď Progress 95

Epic rozdává zdarma hru, která potěší hráče plošinovek

Chaos přestává být nepředvídatelný. Kvantové počítače posouvají AI na nový level

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT