Nejrychlejší superpočítač světa Cray XK6 Titan ponese čipy AMD Bulldozer a Nvidia Kepler
Cray XT5 - Jaguar
V současnosti (a to od roku 2008, kdy byl nakrátko držitelem výkonnostního rekordu) využívá Oak Ridge superpočítač Cray XT5 zvaný Jaguar, který nabízí výpočetní výkon přes 2 PFLOPs. Současné plány na upgrade počítají s postupnou přestavbou stávajícího Jaguaru na Titan, takže celkové rozměry, počet kabinetů i chlazení zůstanou zachované. Současný upgrade proběhne ve dvou fázích (časem může dojít na další, ale v tuto chvíli není uzavřena ještě ani druhá fáze).
Během prvního kroku dojde k výměně bladů (či chcete-li kazet), které budou osazené nespecifikovaným počtem procesorů AMD Opteron (jádra Interlagos architektury Bulldozer) plus 960 výpočetními kartami Nvidia Tesla M2090 (čipy Fermi s 512 stream-procesory o výkonu 665 GFLOPs double-precision / 1331 GFLOPs single-precision). Vznikne tak základní verze Cray XK6, kterou výrobcepředstavil již letos na jaře. Tato fáze by měla vyjít na více než $60 milionů dolarů, které Oak Ridge vyplatí společnosti Cray ještě letos (určité zpoždění do plánů vnesl odklad procesorů AMD Bulldozer, ale Cray i přesto doufá, že vše proběhne zdárně do konce roku).
Cray XK6 - Titan
Druhá vlna upgradu nastane v roce 2012. Tesly M2090 budou doplněny novou generací výpočetních karet postavených na architektuře Nvidia Kepler. Předpokládá se osazení 18 000 karet, které by podle současného harmonogramu mělo proběhnout ve druhé polovině roku 2012.
Pokud se o superpočítače trochu zajímáte, možná se vám vybaví starší zprávy, která uváděly finální výkon 30 PFLOPs. Současné plány jsou poněkud konzervativnější a počítají s trochu nižším výkonem. Přesné číslo vám v tuto chvíli ale nejsme schopni říct, protože Cray hovoří o 10 až 20 PFLOPs, zatímco Nvidia počítá s 20 PFLOPs.
V hypotetické třetí vlně by bylo možné (v případě potřeby) rozšířit výpočetní výkon až na 50 PFLOPs.
Oak Ridge National Laboratory
Až bude Titan kompletní, měl by dosáhnout 9× vyššího výkonu, než nabízí současný Jaguar, 2× vyššího výkonu oproti současnému nejvýkonnějšímu superpočítači světa (japonský K computer) a 3× lepší energetické efektivity oproti témuž. Asi vás nepřekvapí, že celý systém poběží na Linuxu, bude využíván k výzkumu pro zdravotnictví, geologii, materiálové inženýrství, energetiku a další obory. Vývojové prostředí od Cray nabídne podporu programování v jazycích Fortran, C a C++.
Po roce 2015 nahradí Titan novější superpočítač generace OLCF-4 s plánovaným výkonem 100 až 250 PFLOPs a za další tři roky na to chce Oak Ridge dosáhnout 1 EFLOPs s generací OLCF-5 (viz prazvláštní obrázek v úvodu článku).
Možná vás při pohledu na čísla, která se týkají výkonu a počtu karet s čipy Kepler, napadlo, že by na jejich základě bylo možné spočítat výkon jednoho čipu a z toho odvodit i jeho parametry (počet stream-procesorů). Teoreticky to možné je, Nvidia dokonce uvedla, že 85% z uváděných 20 PFLOPs zastanou právě Tesly, takže proměnné zdánlivě známe. Problémem je, že výsledek nemusí být přesný, protože nebylo uvedeno, zda se do těch 85% počítají i „staré“ Tesly M2090 či zda použité čipy Kepler nebudou částečně deaktivované.
Pokud by vám ani tyto nepřesnosti nevadily (předpokládejme, že hodnota 85% se týká jen Tesel s jádry Kepler), pak vychází, že každý Kepler v sestavě by měl dosahovat výkonu 0,944 TFLOPs, tedy asi o 42% více, než Tesly M2090 s jádrem Fermi. To by odpovídalo zhruba 768 aktivním stream-procesorům. Tato hypotéza je ze zřejmých důvodů bez záruky a uvádíme ji jen jako zajímavost.