Trügerische Sicherheit: RAID-Ausfall als Horrorszenario

Defekte werden oft erst bemerkt, wenn es bereits zu spät ist, so die Datenrettungs-Spezialisten von Attingo. Dazu: Die besten Experten-Tipps. [...]

RAID-Systeme werden nahezu überall eingesetzt, wo Server oder NAS-Systeme verwendet werden – von Privatpersonen über KMUs bis hin zu großen Konzernen. Sie gelten gemeinhin als Standard für vermeintlich sichere Datenspeicherung. Im Gegensatz zu einem PC oder Laptop befinden sich in einem RAID-Verbund gleich mehrere Datenträger. Das bedeutet nicht nur eine viel größere Datenmenge, sondern auch eine erhöhte Wahrscheinlichkeit für einen Festplattenausfall. Bei Verlust der wichtigen Daten kann im Worst Case der gesamte Betrieb stillstehen – Datenbanken, E-Mails und Dateiablagen sind mit einem Schlag offline, die Betroffenen verzweifelt.

RAID ist kein Ersatz für Datensicherung

RAID-Systeme erzeugen mit Hilfe komplizierter Algorithmen gezielt redundante Informationen. Dadurch bleibt beim Ausfall einer oder mehrerer Festplatten (je nach RAID-Level) die Funktionalität gewährleistet und nach Ersetzen des defekten Datenträgers kann im Optimalfall durch ein Rebuild der ursprüngliche Zustand wiederhergestellt werden. Doch diese Redundanz darf keineswegs mit einer Datensicherung gleichgesetzt werden!

Attingo-Geschäftsführer Nicolas Ehrschwendner warnt: „Leider werden IT-Administratoren, EDV-Spezialisten und Geschäftsführer aufgrund verschiedenster Ausfallursachen oft überrascht: Das RAID-System – oft ein teures Enterprise-Storage – zeigte bis dato keine Anzeichen eines Defekts und plötzlich geht gar nichts mehr.“
Dies geschieht häufig durch den multiplen Ausfall von Festplatten oder SSDs. Meistens haben die Festplatten in den Storages den gleichen Lebenslauf: Produktion, Transport sowie Betriebsumgebungen sind für alle im RAID vorhandenen Datenträger identisch. Auf all diesen Etappen lauern potentielle Gefahren:

Gefährlicher Lebensweg einer Festplatte als Ausfallursache

  • Produktion: Defekte können bereits in der Produktion beim Hersteller auftreten. Oft stellen wir in unseren Labors fest, dass ganze Chargen von Festplatten Serienfehler aufweisen. Diese können im Bereich der Firmware (interne Software einer Festplatte) oder in der Mechanik sowie Elektronik liegen. Da in RAID-Systemen nahezu immer Festplatten derselben Charge verbaut werden, können etwaige Serienfehler innerhalb eines kurzen Zeitraums auftreten. Fällt eine Festplatte im RAID-Verbund aus, ist die Wahrscheinlichkeit des Ausfalls weiterer Datenträger somit überdurchschnittlich hoch. Gerade in der Nacht oder am Wochenende wird der erste Defekt oft nicht bemerkt – sobald dann auch der zweite Datenträger defekt wird, ist ein RAID5 bereits nicht mehr verfügbar.
  • Transport: Eine weitere Ursache für den nahezu gleichzeitigen Ausfall von mehreren Festplatten ist der Transport der Datenträger von der Fabrik über Reseller bis zum Einsatzort der Server oder RAIDs. Durch überhitzte Container, Erschütterungen oder andere Umwelteinflüsse können hier bereits Schäden entstehen, die später im Betrieb zum Ausfall führen. Auch hier gilt: Selbe Charge, identische Probleme.
  • Betriebsumgebung: Nicht zuletzt spielt auch der laufende Betrieb eine wesentliche Rolle: Erschütterungen, Überhitzung und Überspannung können die Lebenszeit der Festplatten im RAID-Verbund wesentlich verkürzen, wiederum mit der gleichen Auswirkung auf alle Datenträger.
  • Daraus folgt, dass der Ausfall eines RAID-Systems durchaus wahrscheinlicher ist, als man gemeinhin annehmen würde.

Tipps und Tricks vom Datenrettungs-Experten
Ein vermeintlicher Lösungsansatz ist es, einfach Datenträger verschiedener Hersteller in RAID-Systemen einzusetzen. Ehrschwendner sieht das jedoch skeptisch: „Dazu würde ich eher nicht raten, da dies zu Performance- und Kompatibilitätsproblemen führen kann. Die einzig sinnvolle Lösung ist – wie immer – eine externe Datensicherung anzulegen, denn auf ein RAID-System alleine darf man sich nicht verlassen. Denn wir bei Attingo wissen: RAID ist nicht sicher!“ Wie Sie sich am besten verhalten, erfahren Sie in den folgenden Expertentipps:

  • Laufende Datensicherungen auf anderen externen Systemen abspeichern und nicht auf dem RAID selbst.
  • Die Sicherungen in regelmäßigen Abständen auf deren Vollständigkeit und Funktionalität überprüfen.
  • Es empfiehlt sich konstantes Monitoring, um bereits beim Ausfall der ersten Platte eine Benachrichtigung per E-Mail oder SMS zu erhalten.
  • Vor dem Einspielen von Firmware-Updates ein vollständiges Backup anlegen und auf Integrität prüfen.
  • Wenn das RAID nun wirklich ausfällt und eine Datensicherung vorhanden ist, auf keinen Fall auf den ursprünglichen Datenträgern ein neues RAID anlegen, sondern dafür neue Festplatten verwenden. Falls das Backup lückenhaft ist, kann der Datenretter dann nämlich von den ursprünglichen Platten Daten rekonstruieren.
  • Wenn Probleme auftreten: keine Experimente! Der Schaden wird in der Regel nur größer. Besonders wenn gut gemeinte Tipps und Ratschläge aus dem Internet befolgt werden (zum Beispiel das Online-Forcen von Festplatten). Im Worst Case gehen Daten endgültig verloren oder werden unbrauchbar.
  • Vorsicht beim First-Level-Herstellersupport: In vielen Fällen haben wir feststellen müssen, dass durch Tipps oder Remote-Eingriffe des Supports der Defekt noch vergrößert wird! Aber auch wenn die Daten laut Hersteller für immer verloren wären, kann Attingo die Daten meistens noch rekonstruieren.

Zum Schluss noch eine gute Nachricht: Auch beim Ausfall mehrerer Festplatten haben die Attingo-Techniker noch Möglichkeiten, Daten von RAID-Systemen zu rekonstruieren.


Mehr Artikel

News

E-Government Benchmark Report 2024: Nutzerzentrierung bleibt der Schlüssel für Behördendienste in der EU

Grenzüberschreitende Nutzer stoßen immer noch auf zahlreiche Hindernisse, wenn sie E-Government-Dienste in Anspruch nehmen möchten. Behörden sollten daher an der Verbesserung der technologischen Infrastruktur arbeiten. Interoperabilität ist der Schlüssel zur Verbesserung dieser Dienste. Architektonische Bausteine wie die eID und eSignatur können leicht in die Behördenwebseiten integriert werden, sodass die Dienste in ganz Europa einheitlicher und unabhängig von Land und Dienstanbieter sind. […]

News

6 Voraussetzungen für den Einsatz von KI in der Produktion

Dank künstlicher Intelligenz können Industrieunternehmen effizienter und kostengünstiger produzieren, die Produktionsqualität erhöhen und Produktionsstörungen vermeiden. Um das volle Potenzial von KI auszuschöpfen, benötigen sie dafür geeignete IT-Infrastrukturen. Dell Technologies erklärt, was diese bieten müssen. […]

News

Hyperconverged Infrastructure: Wettbewerber positionieren Alternativen zu VMware

Kunden mit VMware-basierten HCI-Systemen im produktiven Einsatz haben im Grunde drei Möglichkeiten: Sie können in den sauren Apfel beißen, bei VMware bleiben und weiterhin die neuen höheren Preise zahlen, sie können zu einer anderen Appliance eines HCI-Anbieters mit einem integrierten Stack wechseln oder sie können zu einer alternativen Software-definierten Lösung wechseln. […]

News

Infineon IT-Services: Zwanzig Jahre Innovation und Exzellenz in Klagenfurt

Was 2004 mit 80 Mitarbeiter:innen in Klagenfurt angefangen hat, ist heute auf rund 460 Beschäftigte aus 31 verschiedenen Nationen gewachsen: Die Infineon Technologies IT-Services GmbH mit Hauptsitz in Klagenfurt. Sie verantwortet und betreibt weltweit alle wesentlichen IT-Funktionen im Infineon-Konzern. Heuer begeht der Klagenfurter Standort, an dem rund 300 der 460 Beschäftigten sitzen, sein 20-Jahre-Jubiläum. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*