Trügerische Sicherheit: RAID-Ausfall als Horrorszenario

Defekte werden oft erst bemerkt, wenn es bereits zu spät ist, so die Datenrettungs-Spezialisten von Attingo. Dazu: Die besten Experten-Tipps. [...]

RAID-Systeme werden nahezu überall eingesetzt, wo Server oder NAS-Systeme verwendet werden – von Privatpersonen über KMUs bis hin zu großen Konzernen. Sie gelten gemeinhin als Standard für vermeintlich sichere Datenspeicherung. Im Gegensatz zu einem PC oder Laptop befinden sich in einem RAID-Verbund gleich mehrere Datenträger. Das bedeutet nicht nur eine viel größere Datenmenge, sondern auch eine erhöhte Wahrscheinlichkeit für einen Festplattenausfall. Bei Verlust der wichtigen Daten kann im Worst Case der gesamte Betrieb stillstehen – Datenbanken, E-Mails und Dateiablagen sind mit einem Schlag offline, die Betroffenen verzweifelt.

RAID ist kein Ersatz für Datensicherung

RAID-Systeme erzeugen mit Hilfe komplizierter Algorithmen gezielt redundante Informationen. Dadurch bleibt beim Ausfall einer oder mehrerer Festplatten (je nach RAID-Level) die Funktionalität gewährleistet und nach Ersetzen des defekten Datenträgers kann im Optimalfall durch ein Rebuild der ursprüngliche Zustand wiederhergestellt werden. Doch diese Redundanz darf keineswegs mit einer Datensicherung gleichgesetzt werden!

Attingo-Geschäftsführer Nicolas Ehrschwendner warnt: „Leider werden IT-Administratoren, EDV-Spezialisten und Geschäftsführer aufgrund verschiedenster Ausfallursachen oft überrascht: Das RAID-System – oft ein teures Enterprise-Storage – zeigte bis dato keine Anzeichen eines Defekts und plötzlich geht gar nichts mehr.“
Dies geschieht häufig durch den multiplen Ausfall von Festplatten oder SSDs. Meistens haben die Festplatten in den Storages den gleichen Lebenslauf: Produktion, Transport sowie Betriebsumgebungen sind für alle im RAID vorhandenen Datenträger identisch. Auf all diesen Etappen lauern potentielle Gefahren:

Gefährlicher Lebensweg einer Festplatte als Ausfallursache

  • Produktion: Defekte können bereits in der Produktion beim Hersteller auftreten. Oft stellen wir in unseren Labors fest, dass ganze Chargen von Festplatten Serienfehler aufweisen. Diese können im Bereich der Firmware (interne Software einer Festplatte) oder in der Mechanik sowie Elektronik liegen. Da in RAID-Systemen nahezu immer Festplatten derselben Charge verbaut werden, können etwaige Serienfehler innerhalb eines kurzen Zeitraums auftreten. Fällt eine Festplatte im RAID-Verbund aus, ist die Wahrscheinlichkeit des Ausfalls weiterer Datenträger somit überdurchschnittlich hoch. Gerade in der Nacht oder am Wochenende wird der erste Defekt oft nicht bemerkt – sobald dann auch der zweite Datenträger defekt wird, ist ein RAID5 bereits nicht mehr verfügbar.
  • Transport: Eine weitere Ursache für den nahezu gleichzeitigen Ausfall von mehreren Festplatten ist der Transport der Datenträger von der Fabrik über Reseller bis zum Einsatzort der Server oder RAIDs. Durch überhitzte Container, Erschütterungen oder andere Umwelteinflüsse können hier bereits Schäden entstehen, die später im Betrieb zum Ausfall führen. Auch hier gilt: Selbe Charge, identische Probleme.
  • Betriebsumgebung: Nicht zuletzt spielt auch der laufende Betrieb eine wesentliche Rolle: Erschütterungen, Überhitzung und Überspannung können die Lebenszeit der Festplatten im RAID-Verbund wesentlich verkürzen, wiederum mit der gleichen Auswirkung auf alle Datenträger.
  • Daraus folgt, dass der Ausfall eines RAID-Systems durchaus wahrscheinlicher ist, als man gemeinhin annehmen würde.

Tipps und Tricks vom Datenrettungs-Experten
Ein vermeintlicher Lösungsansatz ist es, einfach Datenträger verschiedener Hersteller in RAID-Systemen einzusetzen. Ehrschwendner sieht das jedoch skeptisch: „Dazu würde ich eher nicht raten, da dies zu Performance- und Kompatibilitätsproblemen führen kann. Die einzig sinnvolle Lösung ist – wie immer – eine externe Datensicherung anzulegen, denn auf ein RAID-System alleine darf man sich nicht verlassen. Denn wir bei Attingo wissen: RAID ist nicht sicher!“ Wie Sie sich am besten verhalten, erfahren Sie in den folgenden Expertentipps:

  • Laufende Datensicherungen auf anderen externen Systemen abspeichern und nicht auf dem RAID selbst.
  • Die Sicherungen in regelmäßigen Abständen auf deren Vollständigkeit und Funktionalität überprüfen.
  • Es empfiehlt sich konstantes Monitoring, um bereits beim Ausfall der ersten Platte eine Benachrichtigung per E-Mail oder SMS zu erhalten.
  • Vor dem Einspielen von Firmware-Updates ein vollständiges Backup anlegen und auf Integrität prüfen.
  • Wenn das RAID nun wirklich ausfällt und eine Datensicherung vorhanden ist, auf keinen Fall auf den ursprünglichen Datenträgern ein neues RAID anlegen, sondern dafür neue Festplatten verwenden. Falls das Backup lückenhaft ist, kann der Datenretter dann nämlich von den ursprünglichen Platten Daten rekonstruieren.
  • Wenn Probleme auftreten: keine Experimente! Der Schaden wird in der Regel nur größer. Besonders wenn gut gemeinte Tipps und Ratschläge aus dem Internet befolgt werden (zum Beispiel das Online-Forcen von Festplatten). Im Worst Case gehen Daten endgültig verloren oder werden unbrauchbar.
  • Vorsicht beim First-Level-Herstellersupport: In vielen Fällen haben wir feststellen müssen, dass durch Tipps oder Remote-Eingriffe des Supports der Defekt noch vergrößert wird! Aber auch wenn die Daten laut Hersteller für immer verloren wären, kann Attingo die Daten meistens noch rekonstruieren.

Zum Schluss noch eine gute Nachricht: Auch beim Ausfall mehrerer Festplatten haben die Attingo-Techniker noch Möglichkeiten, Daten von RAID-Systemen zu rekonstruieren.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*