SDS - marketing nebo budoucnost?
Poslední roky se roztrhl pytel s buzzwordem "Software Defined ...", až si říkám, kdy bude SDP (jako programem řízený člověk)? Ale možná, že si jen nedávám dost pozor a už jsem jeden z nich. Tedy nic proti SD, ale jako u všeho - se znalostí věci a ne jen ze snahy být IN. Pojďme se tedy střízlivě podívat na to, co obnáší SDS a jak si stojí ve srovnání s klasicky-nudnými diskovými poli ...
Těší mě ... já jsem SDS
Hned na úvod - technologie SDS je marketingový pojem, jehož naplnění je prakticky realizováno velkým množstvím výrobců (jde tč. o velmi roztříštěný trh bez jasného leadera) různými způsoby. Společná je přitom myšlenka: „Použít pro vytvoření centrálního datového úložiště obecný hardware ev. prostředí hypervisorů, s cílem získat jiné funkční možnosti a ev. ušetřit“. To vše ve srovnání s „tradičními“ řešeními diskových polí SAN, založenými na rigidní, proprietární architektuře a hardwarových prvcích, které představují určitou technologickou past, fixující zákazníka na daného výrobce. Hlavní dva trendy jsou:
SDS (software-defined storage) v původním slova smyslu, tj. prezentace obecně dostupného diskového prostoru prostřednictvím softwarové vrstvy, díky které získává tento prostor nové vlastnosti. Dobrým příkladem (jedním z mnoha!) může být technologie HPE VSA (dříve LeftHand), která umí prezentovat libovolný diskový prostor jako iSCSI a nad takto definovanými repository realizovat služby síťové odolnosti nRAID, klonování, replikací atp.
HCA (hyper-converged architecture), která myšlenky SDS dále rozvíjí a úložiště vytváří přímo na výkonných uzlech clusteru. To tedy znamená, že jednotlivé hosty slouží pro výpočetní část (běh VM) spolu s datovým úložištěm (storage) a z celé architektury tak zcela mizí klasické rozdělení na servery a storage.
Pro úplnost – třetím principem v této oblasti je pak použití „SAN middleware“, které provádí mapování a konsolidaci různých SAN prostorů a jejich prezentaci vůči hostům, doplněnou řadou zajímavých funkcí pro DR. Typickým příkladem jsou řešení firmy FalconStor. Pokud mám informace od velkého zákazníka, který toto řešení roky provozoval, pak cituji „...rád jsem se ho zbavil pro nepředvídatelnost chování...“.
Existuje množství prezentací, predikujících velký rozvoj technologií SDS/HCA a to zejména pro nestrukturovaná data. Ostatně úložiště Facebooku jsou celkem dobrým příkladem životaschopnosti této myšlenky. I vlastní zkušenosti z posledních 10-15 let s technologií HPE LeftHand nejsou špatné – ale, a to je potřeba zdůraznit, tato technologie má své specifické „vlastnosti“.
"Není všechno zlato, když to je SDS"
Začnete-li pátrat po dialektice "SDS versus klasická disková pole", brzo narazíte na min. 3 body, které věc staví do úplného šera:
Na začátku jistě uslyšíte od obchodníka s SDS řešením argumenty, kterak je možné pro implementaci SDS využít dosavadní hardware a "jen si koupíte software, který z toho udělá SDS". Poté, co se do této myšlenky dostatečně zamilujete a budete chtít výkonové garance, dozvíte se, že v takovém případě budete potřebovat nový a pěkně "nabušený" hardware, ne ty vaše staré plečky.
Jste zvyklí na desítkami let vypiplané funkční detaily dospělých polí, jako je HPE 3PAR či EMC VNX? Tak si je sepište a začněte hledat ekvivalent u nabízeného SDS ... pár kacířských otázek, za které mě SDSáci nebudou milovat: Mohu k SDS prostoru přistupovat z různých serverů (virtuálních i fyzických) i mimo instanci /prostředí hypervisoru/ SDS? Kde může běžet backup ... protože pokud jen na SDS, bude ho to zatěžovat v produkci, jak známo! Lze provádět klonování? I mimo produkční prostředí například pro vývoj a testování? Máte na SDS záruku na zprovoznění s garancí do 4 hodin nebo jen "dobrou vůli" závadu napravit jako ostatně u každého softwaru? Umí SDS řídit vypálení disků SSD stejně dobře jako klasické pole? Pointa - na serverové disky je nižší záruka než na ty v diskových polích... Umí SDS paralelní cesty k diskům a kontrolérům? Dokonce active-active? A není to jen ALUA mechanismus, který se jako active-active jen tváří? Jaké jsou možnosti řízení QoS na diskovém prostoru? Lze na SDS definovat retenci uložení dat = archivní uložení? ... a mohu posloužit řadou dalších praktických špeků v konkrétní situaci.
"... a hrozně ušetříte", řekl obchodník. No možná ano, ale nechte si to nacenit opravdu komplet, nový hardware, software pro SDS... a ještě něco - nezapomněli jste si zkontrolovat dopady na licence třeba serverového prostředí Microsoft-u na vašem novém SDS? Pokud totiž naskáčou procesorová jádra (a jakože naskáčou), bude zvesela cinkat i pokladna Microsoftu.
Měl jsem tu čest nedávno dělat srovnávací kalkulaci klasického HPE 3PAR s nejmenovaným věhlasným SDS a sám jsem byl překvapený - ne zrovna levný 3PAR byl nakonec levnější, pokud se započítaly všechny kontexty.
Výkon až na posledním místě?
V neposlední řadě je potřeba mít jasno v tom, zda budete úložiště používat pro nestrukturovaná data (kde SDS velmi dobře plní účel) anebo na tom máte provozní strukturovaná data (databáze), nárazově děláte uzávěrky, hromadné fakturace a další běžné činnosti ve středním a větším podniku.
Klasické pole střední třídy jako 3PAR nebo VNX nebude mít problém dosahovat statisíců IOPS a když otevřete peněženku ještě víc, dostanete se přes 1MIOPS - to vše při latenci <<1 ms na all-flash polích (co taky jiného pro produkci).
A teď zkuste hledat totéž u SDS ... když se zadaří a dočtete zprávu o měření až do konce, zpravidla zjistíte, že latence prudce roste jak s velikostí bloku, tak s podílem zápisových operací. Pak pochopíte, proč v propagačních materiálech SDS je použito tak malinké písmo pod tabulkami a grafy, ve kterých je napsáno, že použili 4 kB pro 90% čtení. A pak přijde realita podnikového SQL s 64 kB a R/W=60/40 ... a ejhle, latence bude >10 ms a to je celkem peklo až pojedete uzávěrku nebo budete chtít vygenerovat sto tisíc faktur za víkend.
Co závěrem - ano, SDS je v této době hrozně fajn řešení, které ve výkonově a funkčně nenáročném prostředí udělá spousty užitku, zvláště když budete ukládat nestrukturovaná data (spisovou službu, smlouvy, fotky, videa ...), klidně i v objemu PB. Stejně tak v malé firmě můžete mít hezounké, vysoce dostupné prostředí bez rozsáhlých řešení metroclusterů. Ale jakmile chcete hoblovat databáze rozměru stovek GB až TB pro ERP, zůstaňte na zemi u dobrého kusu železa, ... min. do další generace SDS za pár let.