Trügerische Sicherheit: RAID-Ausfall als Horrorszenario

Defekte werden oft erst bemerkt, wenn es bereits zu spät ist, so die Datenrettungs-Spezialisten von Attingo. Dazu: Die besten Experten-Tipps. [...]

RAID-Systeme werden nahezu überall eingesetzt, wo Server oder NAS-Systeme verwendet werden – von Privatpersonen über KMUs bis hin zu großen Konzernen. Sie gelten gemeinhin als Standard für vermeintlich sichere Datenspeicherung. Im Gegensatz zu einem PC oder Laptop befinden sich in einem RAID-Verbund gleich mehrere Datenträger. Das bedeutet nicht nur eine viel größere Datenmenge, sondern auch eine erhöhte Wahrscheinlichkeit für einen Festplattenausfall. Bei Verlust der wichtigen Daten kann im Worst Case der gesamte Betrieb stillstehen – Datenbanken, E-Mails und Dateiablagen sind mit einem Schlag offline, die Betroffenen verzweifelt.

RAID ist kein Ersatz für Datensicherung

RAID-Systeme erzeugen mit Hilfe komplizierter Algorithmen gezielt redundante Informationen. Dadurch bleibt beim Ausfall einer oder mehrerer Festplatten (je nach RAID-Level) die Funktionalität gewährleistet und nach Ersetzen des defekten Datenträgers kann im Optimalfall durch ein Rebuild der ursprüngliche Zustand wiederhergestellt werden. Doch diese Redundanz darf keineswegs mit einer Datensicherung gleichgesetzt werden!

Attingo-Geschäftsführer Nicolas Ehrschwendner warnt: „Leider werden IT-Administratoren, EDV-Spezialisten und Geschäftsführer aufgrund verschiedenster Ausfallursachen oft überrascht: Das RAID-System – oft ein teures Enterprise-Storage – zeigte bis dato keine Anzeichen eines Defekts und plötzlich geht gar nichts mehr.“
Dies geschieht häufig durch den multiplen Ausfall von Festplatten oder SSDs. Meistens haben die Festplatten in den Storages den gleichen Lebenslauf: Produktion, Transport sowie Betriebsumgebungen sind für alle im RAID vorhandenen Datenträger identisch. Auf all diesen Etappen lauern potentielle Gefahren:

Gefährlicher Lebensweg einer Festplatte als Ausfallursache

  • Produktion: Defekte können bereits in der Produktion beim Hersteller auftreten. Oft stellen wir in unseren Labors fest, dass ganze Chargen von Festplatten Serienfehler aufweisen. Diese können im Bereich der Firmware (interne Software einer Festplatte) oder in der Mechanik sowie Elektronik liegen. Da in RAID-Systemen nahezu immer Festplatten derselben Charge verbaut werden, können etwaige Serienfehler innerhalb eines kurzen Zeitraums auftreten. Fällt eine Festplatte im RAID-Verbund aus, ist die Wahrscheinlichkeit des Ausfalls weiterer Datenträger somit überdurchschnittlich hoch. Gerade in der Nacht oder am Wochenende wird der erste Defekt oft nicht bemerkt – sobald dann auch der zweite Datenträger defekt wird, ist ein RAID5 bereits nicht mehr verfügbar.
  • Transport: Eine weitere Ursache für den nahezu gleichzeitigen Ausfall von mehreren Festplatten ist der Transport der Datenträger von der Fabrik über Reseller bis zum Einsatzort der Server oder RAIDs. Durch überhitzte Container, Erschütterungen oder andere Umwelteinflüsse können hier bereits Schäden entstehen, die später im Betrieb zum Ausfall führen. Auch hier gilt: Selbe Charge, identische Probleme.
  • Betriebsumgebung: Nicht zuletzt spielt auch der laufende Betrieb eine wesentliche Rolle: Erschütterungen, Überhitzung und Überspannung können die Lebenszeit der Festplatten im RAID-Verbund wesentlich verkürzen, wiederum mit der gleichen Auswirkung auf alle Datenträger.
  • Daraus folgt, dass der Ausfall eines RAID-Systems durchaus wahrscheinlicher ist, als man gemeinhin annehmen würde.

Tipps und Tricks vom Datenrettungs-Experten
Ein vermeintlicher Lösungsansatz ist es, einfach Datenträger verschiedener Hersteller in RAID-Systemen einzusetzen. Ehrschwendner sieht das jedoch skeptisch: „Dazu würde ich eher nicht raten, da dies zu Performance- und Kompatibilitätsproblemen führen kann. Die einzig sinnvolle Lösung ist – wie immer – eine externe Datensicherung anzulegen, denn auf ein RAID-System alleine darf man sich nicht verlassen. Denn wir bei Attingo wissen: RAID ist nicht sicher!“ Wie Sie sich am besten verhalten, erfahren Sie in den folgenden Expertentipps:

  • Laufende Datensicherungen auf anderen externen Systemen abspeichern und nicht auf dem RAID selbst.
  • Die Sicherungen in regelmäßigen Abständen auf deren Vollständigkeit und Funktionalität überprüfen.
  • Es empfiehlt sich konstantes Monitoring, um bereits beim Ausfall der ersten Platte eine Benachrichtigung per E-Mail oder SMS zu erhalten.
  • Vor dem Einspielen von Firmware-Updates ein vollständiges Backup anlegen und auf Integrität prüfen.
  • Wenn das RAID nun wirklich ausfällt und eine Datensicherung vorhanden ist, auf keinen Fall auf den ursprünglichen Datenträgern ein neues RAID anlegen, sondern dafür neue Festplatten verwenden. Falls das Backup lückenhaft ist, kann der Datenretter dann nämlich von den ursprünglichen Platten Daten rekonstruieren.
  • Wenn Probleme auftreten: keine Experimente! Der Schaden wird in der Regel nur größer. Besonders wenn gut gemeinte Tipps und Ratschläge aus dem Internet befolgt werden (zum Beispiel das Online-Forcen von Festplatten). Im Worst Case gehen Daten endgültig verloren oder werden unbrauchbar.
  • Vorsicht beim First-Level-Herstellersupport: In vielen Fällen haben wir feststellen müssen, dass durch Tipps oder Remote-Eingriffe des Supports der Defekt noch vergrößert wird! Aber auch wenn die Daten laut Hersteller für immer verloren wären, kann Attingo die Daten meistens noch rekonstruieren.

Zum Schluss noch eine gute Nachricht: Auch beim Ausfall mehrerer Festplatten haben die Attingo-Techniker noch Möglichkeiten, Daten von RAID-Systemen zu rekonstruieren.


Mehr Artikel

Frauen berichten vielfach, dass ihre Schmerzen manchmal jahrelang nicht ernst genommen oder belächelt wurden. Künftig sollen Schmerzen gendersensibel in 3D visualisiert werden (c) mit KI generiert/DALL-E
News

Schmerzforschung und Gendermedizin

Im Projekt „Embodied Perceptions“ unter Leitung des AIT Center for Technology Experience wird das Thema Schmerzen ganzheitlich und gendersensibel betrachtet: Das Projektteam forscht zu Möglichkeiten, subjektives Schmerzempfinden über 3D-Avatare zu visualisieren. […]

News

KI ist das neue Lernfach für uns alle

Die Mystifizierung künstlicher Intelligenz treibt mitunter seltsame Blüten. Dabei ist sie weder der Motor einer schönen neuen Welt, noch eine apokalyptische Gefahr. Sie ist schlicht und einfach eine neue, wenn auch höchst anspruchsvolle Technologie, mit der wir alle lernen müssen, sinnvoll umzugehen. Und dafür sind wir selbst verantwortlich. […]

Case-Study

Erfolgreiche Migration auf SAP S/4HANA

Energieschub für die IT-Infrastruktur von Burgenland Energie: Der Energieversorger hat zusammen mit Tietoevry Austria die erste Phase des Umstieges auf SAP S/4HANA abgeschlossen. Das burgenländische Green-Tech-Unternehmen profitiert nun von optimierten Finanz-, Logistik- und HR-Prozessen und schafft damit die Basis für die zukünftige Entflechtung von Energiebereitstellung und Netzbetrieb. […]

FH-Hon.Prof. Ing. Dipl.-Ing. (FH) Dipl.-Ing. Dr. techn. Michael Georg Grasser, MBA MPA CMC, Leiter FA IT-Infrastruktur der Steiermärkischen Krankenanstaltengesellschaft m.b.H. (KAGes). (c) © FH CAMPUS 02
Interview

Krankenanstalten im Jahr 2030

Um sich schon heute auf die Herausforderungen in fünf Jahren vorbereiten zu können, hat die Steiermärkische Krankenanstaltengesellschaft (KAGes) die Strategie 2030 formuliert. transform! sprach mit Michael Georg Grasser, Leiter der Fachabteilung IT-Infrastruktur. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*