Překročení zvladatelné datové kapacity je blízko. Pomůže zapisování do DNA?
Podle expertů z IDG (společnost mj. publikující výzkumy a články založené na datech IT firem) naroste do roku 2020 počet IT profesionálů až o 30 %. Jenže objem dat, který mají na starosti, se navýší o 430 %. Internet věcí, stále nové aplikace prakticky na každou činnost, kterou si dovedeme představit, to všechno přináší další formáty, další zdroje informací, a tudíž další nároky na ty, kdo s daty disponují. Jak se s takovým náporem vypořádat?
Virtuální prostor je ohromný
Čelit tak velkým požadavkům pomůže vyšší efektivita IT profesionálů a budování datacenter nové generace využívajících tzv. hyperkonvergovanou strukturu (založenou především na virtualizaci). Ta je totiž velmi flexibilní, škálovatelná a poskytuje i snazší správu systémů, které provozujeme ve vlastní struktuře. Hyperkonvergence má být přístupem k infrastruktuře, který zkombinuje funkci serverů, úložišť a síťových funkcí. Koho to více zajímá, toho odkazuji na dva roky starý článek.
Ulehčit si stejným způsobem můžeme i v dalších případech. Týká se to virtuálních serverů, operačních systémů nebo zálohy softwaru. To spolu s obrovskými možnostmi přináší i značná nebezpečí.
Ačkoliv zabezpečení virtuálních datových center se stále zlepšuje, rizikům jdou často naproti sami majitelé informací. Ať už kvůli větší flexibilitě nebo nižším nákladům, nezacházejí mnohdy ani velké firmy s vlastními citlivými daty dostatečně opatrně. O tomto tématu (můj kolega z firmy) Štěpán podal informace v blogovém článku u nás na stránkách.
Ať se ptáte na cokoli, odpověď je rychlost
Zatratit nemůžeme ani tradiční cestu zvyšování kapacit - zrychlování procesorů, jader, pamětí nebo načítání operačních systémů. Jenomže to má pochopitelně své hranice (a znatelně nižší tempo), jimž se pravděpodobně přiblížíme dříve než při využití ostatních možností zmíněných v tomto článku.
Největší datacentrum světa nosíme v sobě
A konečně tu máme jeden ohromný, nicméně velmi netradiční prostor pro zapisování, který máme tak říkajíc po ruce. Jedná se o naši vlastní DNA. Nese informace staré i miliony let, jež se dědičně reprodukují. Microsoft ve spolupráci s americkými univerzitami pracuje na technikách zápisu a vyvolání informací z DNA. Dosud se do jedné buňky podařilo zaznamenat 35 souborů o celkové velikosti 200 MB (tohle mi vyloudí úsměv na tváří, když si vzpomenu, že já ještě pamatoval „golden age“ disketové éry). Vzhledem k celkovému množství buněk v lidském těle by tak teoreticky šlo zapsat 150 miliard terabajtů.
Jen pro představu, o jak velkých možnostech je řeč, Google spravuje informace o velikosti přibližně 10 milionů terabajtů. To je ohromné, neuvěřitelné množství. Z hlediska člověka ovšem pouhá stopadesátitisícina jeho vlastní kapacity.
Výzkum ukládání dat pomocí DNA má před sebou evidentně velkou budoucnost, ale taky ještě docela dlouhou cestu. Popravdě se musím přiznat, že pokud k nám přijdete do DataHelpu a budete chtít zachránit data z poškozené tchyně, nemáme na takový zásah zatím dostatečné vybavení.
V souvislosti s novým technikami se dnes dokonce mluví o možné zápisu 44 petabajtů dat, což je 44 000 terabajtů. V budoucnu bychom tak mohli starosti s omezenou kapacitou hodit za hlavu.
Pak ale opět vyvstane jedna záludná otázka: jak se ve všech uložených datech vyznat a orientovat, abychom u vyhledávání nestrávili věčnost? Vyhledávání takové, jaké známe dnes, může lidem za pár desítek let přijít třeba tak neefektivní jako někdejší vyhledávání informací v ohromných knihovnách, porovnávání informací a nedostatečné (nebo v případě knihoven žádné) filtrování. Hádáte správně, odpověď směřuje do oblasti umělé inteligence…