Obsah

·         1 Úvod

o    1.1 Rozdiel medzi fyzickými a logickými diskami

o    1.2 Čítanie a zápis údajov

o    1.3 Čo je RAID?

o    1.4 Prečo používať RAID?

o    1.5 História

·         2 Základné koncepty používané v systémoch RAID

o    2.1 Ukladanie do vyrovnávacej pamäte

o    2.2 Zrkadlenie: Viac ako jedna kópia údajov

o    2.3 Pruhovanie: Časť údajov je na inom disku

o    2.4 Oprava chýb a poruchy

o    2.5 Hot spares: používanie väčšieho počtu diskov, ako je potrebné

o    2.6 Veľkosť prúžkov a veľkosť častí: rozloženie údajov na niekoľko diskov

o    2.7 Zostavenie disku: JBOD, spájanie alebo rozprestieranie

o    2.8 Klonovanie jednotky

o    2.9 Rôzne nastavenia

·         3 Základy: jednoduché úrovne RAID

o    3.1 Bežne používané úrovne RAID

§  3.1.1 RAID 0 "striping"

§  3.1.2 RAID 1 "zrkadlenie"

§  3.1.3 RAID 5 "striping s distribuovanou paritou"

§  3.1.4 Obrázky

o    3.2 Menej používané úrovne RAID

§  3.2.1 RAID 2

§  3.2.2 RAID 3 "striping s vyhradenou paritou"

§  3.2.3 RAID 4 "striping s vyhradenou paritou"

§  3.2.4 RAID 6

§  3.2.5 Obrázky

o    3.3 Neštandardné úrovne RAID

§  3.3.1 Dvojitá parita / diagonálna parita

§  3.3.2 RAID-DP

§  3.3.3 RAID 1.5

§  3.3.4 RAID 5E, RAID 5EE a RAID 6E

§  3.3.5 RAID 7

§  3.3.6 Intel Matrix RAID

§  3.3.7 Ovládač Linux MD RAID

§  3.3.8 RAID Z

§  3.3.9 Obrázky

·         4 Spájanie úrovní RAID

·         5 Vytvorenie diskového poľa RAID

o    5.1 Softvérový RAID

o    5.2 Hardvérový RAID

o    5.3 Hardvérovo podporovaný RAID

·         6 Rôzne pojmy súvisiace so zlyhaniami hardvéru

o    6.1 Miera zlyhania

o    6.2 Priemerný čas do straty údajov

o    6.3 Priemerný čas do obnovy

o    6.4 Neobnoviteľná bitová chybovosť

·         7 Problémy s RAID

o    7.1 Pridanie diskov neskôr

o    7.2 Súvisiace zlyhania

o    7.3 Atomicita

o    7.4 Neobnoviteľné údaje

o    7.5 Spoľahlivosť zápisu do vyrovnávacej pamäte

o    7.6 Kompatibilita zariadení

·         8 Čo RAID dokáže a čo nie

o    8.1 Čo dokáže RAID

o    8.2 Čo RAID nedokáže

·         9 Príklad

·         10 Referencie

·         11 Iné webové stránky

RAID je skratka, ktorá znamená Redundant Array of Inexpensive Disks alebo Redundant Array of Independent Disks. RAID je termín používaný v oblasti výpočtovej techniky. Pomocou RAID sa z niekoľkých pevných diskov vytvorí jeden logický disk. Dá sa to urobiť rôznymi spôsobmi. Každý zo spôsobov, ktorý spája pevné disky, má určité výhody a nevýhody v porovnaní s použitím diskov ako jednotlivých, navzájom nezávislých diskov. Hlavné dôvody, prečo sa používa RAID, sú tieto:

  • Aby k strate údajov dochádzalo menej často. To sa dosiahne vytvorením niekoľkých kópií údajov.
  • Získanie väčšieho úložného priestoru pomocou mnohých menších diskov.
  • Získanie väčšej flexibility (disky možno meniť alebo pridávať za chodu systému)
  • Rýchlejšie získavanie údajov.

Nie je možné dosiahnuť všetky tieto ciele súčasne, preto je potrebné rozhodnúť sa.

Sú tu aj zlé veci:

  • Určité možnosti môžu chrániť pred stratou údajov z dôvodu zlyhania jedného (alebo viacerých) diskov. Nechránia však pred vymazaním alebo prepísaním údajov.
  • V niektorých konfiguráciách môže RAID tolerovať zlyhanie jedného alebo viacerých diskov. Po výmene zlyhaných diskov je potrebné rekonštruovať údaje. V závislosti od konfigurácie a veľkosti diskov môže táto rekonštrukcia trvať dlho.
  • Niektoré druhy chýb znemožnia čítanie údajov

Väčšina prác o RAID je založená na článku z roku 1988.

Spoločnosti používajú systémy RAID na ukladanie svojich údajov od vzniku tejto technológie. Systémy RAID sa dajú vytvoriť rôznymi spôsobmi. Od objavenia systému RAID sa náklady na jeho vytvorenie veľmi znížili. Z tohto dôvodu majú niektoré funkcie RAID dokonca aj niektoré počítače a zariadenia, ktoré sa používajú v domácnostiach. Takéto systémy sa môžu používať napríklad na ukladanie hudby alebo filmov.

Rozdiel medzi fyzickými a logickými diskami

Fyzický disk je konkrétne hardvérové zariadenie (HDD alebo SSD). Logický disk je pre operačný systém prezentovaný ako jedna jednotka, hoci môže byť zostavený z viacerých fyzických diskov. RAID kontrolér (softvérový alebo hardvérový) abstraktne kombinuje viacero fyzických diskov a vytvára z nich logický disk s určitými vlastnosťami (kapacita, redundancia, výkon).

Čítanie a zápis údajov – základné princípy

  • Zápis: údaje sa zapíšu na jeden alebo viac diskov podľa typu RAID (prípadne sa vypočíta parita a uloží sa tiež).
  • Čítanie: môže byť paralelizované cez viac diskov (lepší výkon pri čítaní), alebo pri niektorých režimoch čítanie prebieha z jedného disku.
  • Cache: mnohé RAID riešenia používajú vyrovnávaciu pamäť (cache) na zrýchlenie zápisu, čo vyžaduje správnu ochranu (napr. batériou zálohovaná cache), aby sa predišlo strate údajov pri výpadku napájania.

Základné koncepty používané v RAID

  • Zrkadlenie (mirroring): každá časť údajov je uložená na dvoch alebo viacerých diskoch (napr. RAID 1). Zabezpečuje rýchle čítanie a vysokú odolnosť, ale efektívne využitie kapacity je 50 % pri dvoch diskoch.
  • Pruhovanie (striping): údaje sú rozdelené do pruhov a pruhy sú rozmiestnené na rôznych diskoch (napr. RAID 0, RAID 5). Zvýši sa paralelizmus a často rýchlosť I/O.
  • Parita: technika, ktorá pridáva redundantné informácie (paritné bity) potrebné na obnovu údajov v prípade zlyhania disku. Používa sa v RAID 5, RAID 6 a ďalších.
  • Hot spare: náhradný disk, ktorý je pripravený automaticky nahradiť zlyhaný disk a spustiť rekonštrukciu bez manuálneho zásahu.
  • Veľkosť prúžkov (stripe size): určuje, aké veľké kusy sú zapisované na každý disk pred presunom na ďalší disk. Má vplyv na výkon pre rôzne typy pracovných záťaží (malé náhodné zápisy vs veľké sekvenčné prenosy).
  • JBOD (Just a Bunch Of Disks): spájanie diskov bez RAID logiky – každý disk ostáva samostatný alebo sú disky spájané do väčšieho logického priestoru bez redundancie.

Bežne používané úrovne RAID (zameranie na 0, 1, 5, 6)

RAID 0 — striping

Popis: Rozdelí údaje na pruhy a rozloží ich medzi dve alebo viac jednotiek bez akejkoľvek redundancie.

  • Výhody: maximálny výkon pri čítaní/zápise, plné využitie kapacity (suma kapacít diskov).
  • Nevýhody: žiadna redundancia — zlyhanie jedného disku znamená stratu všetkých údajov.
  • Vhodné pre: dočasné dáta, cache, pracovné prostredia, kde je dôležitý výkon a zálohovanie je riešené inak.

RAID 1 — zrkadlenie

Popis: Dáta sú presne kópiované na dva (alebo viac) disky.

  • Výhody: vysoká dostupnosť (pri zlyhaní jedného disku systém pokračuje), jednoduchá obnova (jednoduché prekopírovanie z preživšieho disku).
  • Nevýhody: efektívne využitie kapacity 50 % (dva disky), vyššie náklady na diskovú kapacitu.
  • Vhodné pre: kritické systémy, operačné systémy, databázy malej/mid veľkosti, kde je potrebná vysoká odolnosť.

RAID 5 — striping s distribuovanou paritou

Popis: Kombinuje pruhovanie a paritu. Paritné bloky sú distribuované medzi disky.

  • Výhody: dobrý kompromis medzi kapacitou, výkonom a redundanciou; efektívne využitie kapacity je (N-1)/N, kde N je počet diskov.
  • Nevýhody: môže byť pomalší pri zápise (pretože musí vypočítať paritu a aktualizovať viac diskov); pri veľkých diskoch môže byť obnova po zlyhaní disku dlhá a počas nej zraniteľnejší voči ďalšiemu zlyhaniu; riziko UER (unrecoverable read error) počas rebuildu.
  • Vhodné pre: všeobecné úložné polia, kde je dôležitá rovnováha medzi cenou a odolnosťou, napr. súborové servery.

RAID 6 — dvojitá parita

Popis: Podobné RAID 5, ale používa dve nezávislé parity, čo umožňuje tolerovať zlyhanie až dvoch diskov súčasne.

  • Výhody: vyššia odolnosť pri väčších poliach diskov a pri použití veľkých diskov s vyšším rizikom chýb počas rebuildu.
  • Nevýhody: vyššie nároky na výpočtový výkon pre zápis, menej efektívne využitie kapacity ako RAID 5 (kapacita ≈ (N-2)/N).
  • Vhodné pre: veľké diskové polia, enterprise úložiská, kde je potrebná vysoká dostupnosť a kde by ďalšie zlyhanie počas obnovy bolo neprijateľné.

Menej bežné a neštandardné úrovne

Existujú aj staršie alebo špecializované úrovne (RAID 2–4, RAID-DP, RAID-Z, RAID 5E/6E, proprietárne riešenia ako RAID 7 alebo Intel Matrix RAID). Niektoré z nich majú špecifické výhody (napr. diagonálna parita), iné sú dnes zastarané kvôli zvýšeným možnostiam moderných kontrolérov a súborových systémov (napr. ZFS zameraný na integritu dát, ktorý používa RAID-Z).

Softvérový vs. hardvérový RAID

  • Softvérový RAID: realizuje sa operačným systémom (napr. Linux MD RAID). Nevýhodou môže byť väčšie zaťaženie CPU, výhodou flexibilita, nižšie náklady a jednoduchá migrácia medzi systémami.
  • Hardvérový RAID: používa dedikovaný kontrolér s vlastným procesorom a často aj batériovo zálohovanou cache. Môže ponúknuť lepší výkon pri náročných zápisoch, ale býva drahší a môže viazať pole na konkrétny kontrolér (kompatibilita problém pri výmene kontroléra).
  • Hybridné/firmware RAID: kombinácia, kde základné operácie vykonáva OS, ale kontrolér poskytuje akceleráciu alebo firmvérové funkcie.

Obnova po zlyhaní disku a riziká

Po výmene zlyhaného disku začína proces rebuildu — obnovenie chýbajúcich údajov z parity alebo zrkadlenia. Pri veľkých kapacitách diskov môže rebuild trvať desiatky hodín až dni, počas ktorých je pole zraniteľné (zvlášť RAID 5 pri ďalšom zlyhaní). Dôležité pojmy:

  • Priemerný čas do obnovy (MTTR): doba potrebná na opravu a obnovu polia.
  • Priemerný čas do straty údajov (MTTDL): štatistická mierka spoľahlivosti závislá od počtu diskov a ich pravdepodobnosti zlyhania.
  • Neobnoviteľná bitová chybovosť (UER): pravdepodobnosť, že počas čítania disk vrátí nezachránenú chybu. Pri veľkých diskoch a RAID 5 môže UER počas rebuildu spôsobiť zlyhanie obnovy.

Problémy s RAID a odporúčania

  • Pri dokupovaní alebo výmene diskov používajte čo najpodobnejšie modely a firmvér, ideálne rovnakého výrobcu a kapacity.
  • Pravidelne sledujte SMART údaje a výstrahy kontroléra.
  • Vždy majte externé zálohy — RAID nie je náhradou zálohovania (nechráni pred náhodným vymazaním, škodlivým softvérom, požiarom atď.).
  • Zvážte použitie RAID 6 alebo moderných súborových systémov (ZFS, Btrfs), ak prevádzkujete veľmi veľké polia diskov.
  • Pri kritických systémoch používajte batériovo alebo kondenzátorovo zálohovanú cache, aby ste zabezpečili integritu zápisov pri výpadku napájania.

Čo RAID dokáže a čo nie

RAID môže zvýšiť dostupnosť a výkon a pomôcť predchádzať strate údajov pri poruche disku. Nedokáže však nahradiť zálohy: neochráni pred užívateľskou chybou (vymazanie), škodlivým softvérom, poškodením súborov mimo disku ani pred katastrofickými udalosťami (požiar, krádež).

Príklad výpočtu kapacity

Ak máte 4 disky po 4 TB v RAID 5, dostupná kapacita bude približne 12 TB (4 TB × (4 − 1)). V RAID 6 by to bolo približne 8 TB (4 TB × (4 − 2)). V RAID 1 s dvoma diskami by to bolo 4 TB (kopírovanie).

Zhrnutie a odporúčania

  • Pre maximálny výkon bez redundancie: RAID 0 (len ak sú zálohy inde).
  • Pre jednoduchú a spoľahlivú ochranu pri malej kapacite: RAID 1.
  • Pre vyváženú ochranu a kapacitu: RAID 5 (s viacerými diskmí, ale zvážte riziká pri veľkých diskoch).
  • Pre vyššiu bezpečnosť pri veľkých poliach: RAID 6 alebo riešenia s dvojitou paritou / RAID-DP.
  • Nezabudnite: RAID nie je záloha — zálohujte mimo RAID poľa.

Ak potrebujete konkrétne odporúčanie pre váš prípad (počet diskov, typ záťaže, rozpočet), uveďte tieto informácie a pripravím návrh optimálnej konfigurácie.