Datenarchivierung: Es muß nicht immer Magnetband sein

Die langfristige Datenspeicherung kann in der Cloud, auf Festplatten und optischen Datenträgern erfolgen, hat aber jeweils ihre Nachteile. [...]

Foto: tookapic/Pixabay

Langzeitspeicherung – Archivierung – erfordert einen ganz anderen Ansatz als Sicherung und Wiederherstellung, bei denen Durchsatz und Deduplizierung im Vordergrund stehen. Bei der Archivierung geht es darum, Daten über lange Zeiträume hinweg zu speichern, ohne dass sie beschädigt werden, so dass sie bei der Wiederherstellung genau das sind, was vor 10 oder 20 Jahren gespeichert wurde.

Für die meisten Unternehmen, die eine bestimmte Größe erreichen, ist das standardisierte LTO-Magnetband die beste Wahl. Aber für diejenigen, die die Kosten nicht rechtfertigen können oder glauben, dass Magnetbänder der Vergangenheit angehören, gibt es drei praktikable Alternativen: Objektspeicher in der Cloud, Festplattenspeicher vor Ort und optische Medien.

Archivierung in der Cloud

Die Objektspeicherung ist speziell für die Langzeitspeicherung konzipiert, da die Prüfsummen, die zur Identifizierung jedes Objekts verwendet werden, auch dazu dienen, zu überprüfen, ob sich der Inhalt nicht geändert hat. Das System kann die Prüfsumme erneut ausführen und sie mit der vorherigen Prüfsumme vergleichen, die als eindeutige Kennung (unique identifier, UID) des Objekts verwendet wird.

Auf diese Weise kann die Integrität der Daten ständig überprüft werden, auch noch Jahrzehnte nach ihrer Speicherung.

Außerdem ist es kostengünstig.
AWS, Azure und Google speichern alle 100 TB Daten in Cold Storage für ca. 100 USD/Monat, so dass Sie zwei Kopien bei zwei Speicheranbietern für ca. 200 USD/Monat haben können. Wenn man davon ausgeht, dass Sie die Daten nur hochladen und nie abrufen, wäre das sehr kostengünstig. Wenn Sie die Daten jemals abrufen müssen, wird es zwar teuer, aber wahrscheinlich lohnt es sich trotzdem.

Beachten Sie, dass Sie zwei Gebühren zahlen: eine Abrufgebühr für jedes Objekt und Bandbreitengebühren pro GigaByte. Wenn Sie das Archiv vorzeitig löschen, fallen möglicherweise weitere Gebühren an, da die Preisgestaltung auf der langfristigen Speicherung der Daten beruht.

Vergewissern Sie sich demnach, dass Sie wissen, welche Kosten auf Sie zukommen, wenn Sie die Daten tatsächlich abrufen.

Festplatten vor Ort

Wenn Sie Festplatten vor Ort für Archive verwenden möchten, gibt es drei Möglichkeiten: Standard-Festplatten-Arrays, deduplizierte Zielfestplatten und Objektspeicher vor Ort.

Standard-Disk-Arrays und Netzwerkspeichersysteme sind in der Regel für Primärdaten ausgelegt und haben entsprechend höhere Kosten. Daher werden sie in den meisten Umgebungen als zu teuer für die Langzeitspeicherung angesehen.

Dedupierte Festplattensysteme können diese Kosten für Backups senken, aber Langzeitspeicherung ist etwas ganz anderes. Im Laufe der Zeit werden Sie Daten speichern, die für das Deduplizierungssystem völlig neu sind, und die Deduplizierungsquote wird sinken. Daher sind die Kosten für ein Zielplattensystem letztendlich höher als für ein Standardplattensystem, weil Sie für eine Deduplizierungsrate extra bezahlen, die Sie aufgrund der Art der Daten nicht wirklich erhalten.

Sowohl Standard- als auch deduplizierte Festplattensysteme haben außerdem das Problem, dass Daten auf Festplatten nicht länger als fünf Jahre gespeichert werden können; danach verrotten sie.

Genau wie die Objektspeicherung in der Cloud können Objektspeichersysteme vor Ort helfen, indem sie die Integrität der Daten auf jedem System ständig überprüfen und beschädigte Daten durch gute Daten ersetzen, die in einem anderen Plattensystem gespeichert sind. Allerdings sind Festplatten in der Regel immer noch teurer als die einfache Nutzung von Cold Storage in der Cloud.

Kurz gesagt: Festplatten jeglicher Art sind nicht die beste Wahl für die Archivierung.

Optische Medien

Es gibt drei Optionen für optische Medien: Standard-DVDs und Blu-Ray-Disks, DVD-Rs in Archivqualität und M-Disks.

DVD- und Blu-Ray-Discs verwenden einen organischen Film, der seine Phase ändert, wenn er von einem Laser getroffen wird. Auf DVD und Blu-Ray geschriebene Daten sollten jahrzehntelang einwandfrei sein. Die DVD-R in Archivqualität verwendet zwei reflektierende Schichten und eine besonders harte Beschichtung, um Kratzer zu vermeiden, und ist zehnmal teurer als die DVD-R.

M-Discs wurden speziell für die Langzeitlagerung entwickelt und verwenden eine anorganische Schicht, die für eine Lebensdauer von 100 Jahren ausgelegt ist. Sie sind zwar teuer, kosten aber pro Gigabyte nur etwa 25 % der Kosten einer DVD-R in Archivqualität. Die meisten modernen optischen Laufwerke können alle drei Arten von Medien beschreiben.

DVD-Discs haben eine sehr geringe Kapazität – weniger als 5 GB. Blu-ray-Discs haben eine Kapazität von 25 GB oder 50 GB bei doppelseitigen Discs. M-Discs gibt es mit 25 GB, 50 GB und 100 GB. Die Speicherung von Daten auf diesen Geräten ist im Vergleich zu Magnetbändern oder Festplatten recht langsam, da der Prozess des Phasenwechsels auf einem physikalischen Medium langsam ist.

Es ist auch wichtig, darauf hinzuweisen, dass optische Medien eine sehr niedrige unkorrigierte Bitfehlerrate (UBER) haben, einige so niedrig wie 10-8, die meisten bei 10-10. Bei SATA-Festplatten (Serial Advanced Technology Attachment) liegt die UBER bei 10-14 und bei LTO-9-Bändern bei 10-19. Das bedeutet, dass optische Medien Daten nicht so zuverlässig schreiben wie SATA-Platten oder -Bänder.

Ich habe mit Medien- und Unterhaltungsunternehmen gesprochen, die diese Medien zusätzlich zu ihren LTO-Kopien für die Langzeitspeicherung von Filmen verwenden. Sie sind der Meinung, dass die Blu-Ray-Disc in 50 Jahren leichter zu lesen sein wird als ein LTO-Band. Dafür spricht, dass das modernste Blu-Ray-Gerät die ältesten CDs und DVDs lesen kann, was bedeutet, dass es viel abwärtskompatibler ist als das typische Bandlaufwerk, das im Allgemeinen nur eine oder zwei Generationen zurück liest.

Unternehmen, die optische Speichermedien als Langzeitspeicher nutzen möchten, sollten sich mit optischen Bibliotheken befassen. Sie sind wie Bandbibliotheken, nur mit optischen Laufwerken anstelle von Bandlaufwerken, und bieten einen nahezu unbegrenzten Vorrat an Langzeitspeicher ohne allzu viele manuelle Eingriffe.

In Archiven werden Daten gespeichert, die Sie jahrzehntelang aufbewahren werden, also nehmen Sie sich die Zeit für eine gründliche Recherche. Sie sollten wissen, worauf Sie sich bei jeder Option einlassen und eine fundierte Entscheidung treffen.

*W. Curtis Preston ist ein Experte für Datensicherung, -speicherung und -wiederherstellung, der seit 1993 in diesem Bereich tätig ist. Er war Endbenutzer, Berater und Analyst und ist seit kurzem Mitglied des Teams von Druva, einem Cloud-basierten Datensicherungsunternehmen.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*