További Infó cikkek
A legtöbb RAID rendszer rendelkezik a hibás szektorok menetközbeni javítását lehetővé tevő dinamikus szektorjavítással. A hibafelismerés és javítás terén a hardveres és szoftveres eszközök jelentősen különböznek egymástól.
Szoftveres megoldások általában csak az 1 bites hibák észrevételére alkalmas, de javításra nem képes SCSI busz védelmére hagyatkoznak. Az ilyen típusú RAID rendszerek képességei - némi többletköltség révén - ECC memória alkalmazásával bizonyos mértékig fokozhatóak.
A hardveralapú rendszerek lényegesen jobb védelemmel rendelkeznek. A legelterjedtebb hardveres RAID megoldások 4 bites hibák detektálására, és 1 bites hibák javítására képesek, ezen felül általában támogatják a működés közbeni lemezcseréket (Hot Swap) is.
Az előbbi esetben láthattuk, hogy az adatépség biztosítása a működő eszközön az adatvesztés elkerülésére vonatkozott. Hibatűrőnek akkor mondjuk a rendszert, ha az adatok elérhetőek maradnak, miközben egy vagy több eszköz meghibásodott. Ennek az elvárásnak a RAID rendszerek oly módon tesznek eleget (a RAID 0 kivételével), hogy olyan redundáns információt tartalmaznak, melyekből visszaállítható a meghibásodás során elveszett adathalmaz. Különböző alkalmazási területekhez persze akár egyazon szerveren belül is érdemes különböző szintű RAID rendszereket használni.
A RAID védelem csak az első lépés a nagyfokú hibatűrés eléréséhez vezető úton, hiszen amikor az egyik eszköz valóban meghibásodik, akkor a hibatűrő képesség jelentősen csökkenhet, vagy akár meg is szűnhet. A probléma megoldására érdemes úgynevezett gyors tartalékot (Hot Spares) alkalmazni, automatikus helyreállítási funkcióval. Ez persze csak hardveres RAID segítségével oldható meg. Az így összeállított rendszerben - a felhasználók folyamatos kiszolgálása mellett - a RAID kártya automatikusan észreveszi, és tartaléklemezekkel helyettesíti a meghibásodott meghajtókat, valamint újrakonfigurálja a RAID tömböt. Egyes kártyák lehetővé teszik különböző priorítási szintek megadását arra az esetre, ha egyszerre több merevlemez hibásodna meg. Komolyabb rendszerekben több tartalék eszköz is lehet, melyek vagy közös készletként, vagy dedikált tartalékként állnak rendelkezésre. A dedikált tartalék biztosabb és gyorsabb megoldás arra az esetre, ha egyszerre több eszköz hibásodna meg, a készlet pedig költségtakarékosabb.
A hibatűrő képességet úgy lehet fokozni, ha nem csak a merevlemezeket, hanem a működtetéséhez szükséges eszközöket is többszörözzük. Ilyen például a szerver és a merevlemezek közötti IO utak (merevlemez-vezérlők), tápegységek többszörözése, több szerver, illetve több szünetmentes tápegység alkalmazása.
A szerver-többszörözés a legkönnyebben (és a legolcsóbban) fürtözéssel (clustering) oldható meg. Ilyen megoldásnál minden szerver ugyanazt a háttértárat éri el annak érdekében, hogy bármelyik meghibásodása esetén a többi változatlanul hozzáférhessen a lemezeken tárolt adatokhoz. Ezt a megoldást támogatják a külső RAID vezérlők.
A legkritikusabb alkalmazások számára szoftveres távoli tükrözést alkalmaznak. Ennek a megoldásnak az a lényege, hogy két azonos szervert helyeznek el két külön helyen, és mind a kettő ugyanazt a feladatot végzi.