TIP#1475: K čemu je dobré diskové pole (RAID)? A co znamenají RAID 0, RAID 1, 5, atd?

Na Twitteru nedávno padl dotazMáte někdo radu, který RAID použít pro domácí #NAS? 1 nebo 5? Nebo je lepší jiný? Výjimečně mi ani @365tipu nějak nepomohlo v rozhodování. #QNAP“ – Honza má pravdu v tom, že tenhle základ na @365tipů chyběl. Takže je čas to napravit.

Diskové pole neboli RAID (Redundant Array of Indepdendent Discs, Vícenásobné pole nezávislých disků) je v základu to co název napovídá – několik pevných disků (HDD, dnes často ale i SSD) použitých jako jeden disk z důvodu zabezpečení dat proti selhání. Těch disků je více, protože to umožňuje aby data (i počítač/server) přežila pokud některý z disků odejde, nebo se prostě jenom část dat na disku poškodí.

TIP: Nechce se vám to číst celé a chcete vědět jaký RAID si pořídit domů? Máte-li dva disky tak RAID 1. Máte-li disků víc, tak RAID 5.

Jak hodně bezpečná data pro ztrátě/poškození jsou v podstatě určuje úroveň, číslo uvedené za RAID. Nejčastěji se s diskovými poli setkáte u serverů a síťových úložišť (NAS). A protože dnes můžete mít NAS i v domácnosti či malé firmě (Synology či QNAP například) tak je pořízení/zprovoznění RAIDu dost užitečná věc i v takovémto prostředí.

Nejjednodušší RAID umí některé operační systémy – prostě si HDD/SDD připojen přes nějaké to rozhraní (SATA například) „dáte do Raidu“ a operační systém se bude starat o správné zápisy i čtení. V pokročilejší podobě je počítač (či specializované hardware) vybavené RAID řadičem a operační systém vlastně vůbec nebude vědět, že disk na který přistupuje je v nějaké raidové konfiguraci.

RAID není zálohování, jedna z důležitých věcí – pokud máte doma například Synology NAS s dvěma disky v RAID 1 konfiguraci tak byste neměli podceňovat potřebu mít vše zálohované – pokud odejdou oba disky nebo pokud odejde samotný NAS, tak prostě o data stejně můžete přijít. Stejně jako pokud vás napadne nějaký virus/malware a přemaže vám vše co na NAS máte.

Disková pole (což bývají speciální zařízení) i některá řešení NAS navíc umožňují „hot swap“, tedy výměnu poškozeného disku bez nutnosti vypnout celé zařízení – včetně toho, že po výměně se systém postará o správné naplnění potřebnými daty tak aby zvolený RAID opět pracoval jak má.

Ideální pro RAID je použít všechny disky o stejné velikosti – pokud ale použijete různou, tak u Raidů co nabízejí ochranu prostě bude využita kapacita jednotlivých disků ve velikosti toho nejmenšího – přijdete tak o ještě více diskové kapacity.

Poslední co byste měli vědět – od RAID 1 vždy část diskové kapacity bude potřeba na „redundantnost“ informací. U nejjednoduššího RAID 1 (tj. zrcadlení) prostě vezmete (například) dva  3 TB disky a výsledný disk bude mít stále kapacitu 3 TB (nikoliv 6 TB).  Synology má na webu kalkulačku umožňující snadno zjistit jakou budete mít výslednou kapacitu pro určitou konfiguraci a zvolený typ raidu.

TIP: Čtyř-šachtový QNAP NAS TS451A. Tohle už využijete i pro menší a střední firmy (mini recenze) vám ukáže jak vypadá NAS od QNAPu co umí až čtyři disky. V tom už můžete jít dál než jen na úroveň RAID 1.

qnap-ts-231-original.jpg

QNAP TS-231 – dva disky, takže jedině RAID 1 pokud chcete zabezpečení proti selhání (jednoho) disku

Typy RAIDů

RAID 0 je jenom způsob jak na více disku ukládat/rozkládat data bez redundance a bez ochrany. Může být výhodnější s ohledem na zlepšení rychlosti (u varianty prokládání) čtení i zápisu, ale poškození některého z disku vás prostě připraví o data na tomto disku uložená. Vedle prokládání (data se střídavě zapisuji na jednotlivé disky) je zde i varianta zřetězení – data se zapisují postupně na disky podle toho jak potřeba další a další volné místo.

RAID 1 je základní možnost jak chránit data pomocí zrcadlení – v základní podobě dvojice disků obsahuje zcela shodnou kopii dat – pokud jeden vypadne, systém dál funguje a používá ten disk co ještě funguje. Varianta duplexing používá nejenom dva disky, ale také dva řadiče aby bylo možné fungovat i pokud vypadne jeden z řadičů. RAID 1 zrychluje čtení ale zpomaluje zápis (musí se zapisovat na dva disky). RAID 1 je asi nejčastější využití raidů pro domácnost. Raid 1 může samozřejmě zrcadlit jeden disk na více než jeden disk.

TIP: V Vybral jsem si Synology DS214se. Třeba se budou hodit zkušenosti (1) je řeč o jednoduchém dvou diskovém NAS. Už několik let ho používám jako domácí úložiště. Osazen je dvojicí 3 TB disků, takže RAID 1. Kdyby byl ještě více diskový, tak určitě RAID 5.

Existuje varianta označovaná jako RAID 01 – je to kombinace RAID 1 (zrcadlení) a prokládaného RAID 0 (opět pouze 50 % celkové diskové kapacity). Stejně tak existuje RAID 10 – ve skutečnosti opět spojení RAID 1 a RAID 0 – jen je využito stripování.

RAID 3 je málo používaný systém, kdy se data ukládají na více disků běžným „neraidovým“ způsobem a na jeden extra disk se ukládají paritní (OR-XOR) informace. Výpadek jednoho disků umožní získat data z ostatních, výpadek paritního disku nevadí, ale bude znamenat nutnost výměny a zdlouhavé nové naplnění paritními daty.

Paradoxně existuje i RAID 2 fungující shodně, ale využívající bitové stripování (rozkládání) dat po více discích a zabezpečení pomocí speciálního Hammingova kódu.

RAID 4 také rozkládá data po více discích (po blocích, ne po bitech) a extra paritní disk je také ukládá po blocích.

RAID 5 potřebuje alespoň tři disky. Data jsou na rozkládána a navíc existují samoopravné bloky (také rozkládané po discích), které umožňují opravit data v případě výpadku – čtení je rychlejší, zápis pomalejší (nejen že se zapisuje na víc disků, ale musí se ještě počítat samoopravný kód). Výpadek je možný pouze jednoho disku – výhodou tak trochu je i to, že kapacita je nižší pouze o jeden z disků. Máte-li 3 kusy 3 TB disků, tak dostanete 6 TB (místo celkových 9 TB). RAID 5 je druhá nejpraktičtější varianta pro domácnost i malé malé/střední firmy.

Varianta RAID 50 kombinuje RAID 5 a RAID 0 využívající prokládání a jde vlastně o několik RAID 5 polí spojených do jednoho výsledného disku

RAID 6 funguje podobně, také používá samoopravné bloky, ale využívá dva různé takové bloky a vyžaduje i větší počet disků – dokáže ale přežít když dva z nich selžou – minimum disků pro toto provedení jsou čtyři, ale moc se to nevyplatí pokud nebudete datový/souborový hosting – výsledná kapacita je totiž poloviční. Vyplatí se od šesti disků výše.

RAID 60 je opět spojení RAID 6 a RAID 0 využívající také prokládání a opět jde o několik RAID 6 polí spojených do jednoho výsledného disku.

RAID 7 je kombinace RAID 3 a RAID 4 a má přidanou vyrovnávací paměť – byla to snaha odstranit hlavní nevýhodu dvou uvedených raidů – potíže s rychlostí.

RAID 100 (někdy také RAID 10+0) je tříúrovňové pole – na nejnižší úrovni jsou RAID 1 spojené do více RAID 0 a ty nakonec ještě jednou do RAID 0. Pokud začínáte být zmatení, tak dobré obrázky na toto téma jsou v RAID hesle na Wikipedii.