Backup vs. Archiv: Warum es wichtig ist, den Unterschied zu kennen

Daten zu sichern und sie zu archivieren, sind zwei vollkommen unterschiedliche Vorgänge. Wenn sie den Unterschied nicht kennen, kann Sie das unnötig viel Zeit, Ressourcen und im schlimmsten Fall sogar eine Menge Geld kosten. [...]

Backup vs. Archiv zwei Arten der Datensicherung zu unterschiedlichen Zwecken (c) Pixabay.com

Was ist ein Backup?

Ein Backup durchzuführen heißt, eine genaue Kopie Ihrer Daten zu erstellen, um diese im Falle eines Schadens oder eines Verlusts jederzeit wiederherstellen zu können. In der Regel werden die Originaldaten bei der Erstellung einer BackupDatei bzw. deren Sicherung nicht gelöscht.

Ein Backup wäre also beispielsweise das nächtliche Sichern all Ihrer Daten auf Ihrem Laptop oder das Hochladen all Ihrer Fotos von Ihrem Smartphone in eine Cloud, sofern das jeweilige Gerät diese Funktion unterstützt. Auch Dateiserver (unstrukturierte Daten) und Datenbanken (strukturierte Daten) werden durch ein Backup gesichert. Dabei kann sich das Backup auf die Daten, wie bei einem Database-Dumb, auf das Betriebssystem des Servers, wie bei einem Bare-Metal-Backup, oder bei einer Sicherung von VMware-/VMDK-Dateien sogar auf beides konzentrieren.

Der Zweck eines Backups ist eigentlich immer der gleiche: im Notfall die wichtigsten Daten wiederherstellen zu können. Schließlich könnte ein RAID 6-Array plötzlich einen dreifachen Datenträgerfehler aufweisen, der das Wiederherstellen der Daten unumgänglich macht. Oder es könnte jemand versehentlich (oder böswillig) eine oder mehrere VMs aus Ihrer VMware-, Hyper-V- oder AWS EC2-Konfiguration löschen, die Sie im Anschluss mehr oder weniger mühsam wiederherstellen müssen.

Sie könnten aber auch eines Morgens ins Büro kommen und feststellen, dass jede einzelne Datei Ihrer Firma durch eine Ransomware-Attacke verschlüsselt worden ist – ohne ein gutes BackupSystem hätten Sie in so einem Fall vermutlich kaum eine andere Wahl, als nachzugeben und das Lösegeld zu bezahlen. Es sei denn Sie besitzen gutes BackupSystem, das die Quelle der Ransomware ermitteln, sie stoppen und dann alle Daten wiederherstellen kann, ohne dass Sie den Hackern dabei auch nur einen einzigen Cent zahlen müssen.

Was ist ein Archiv?

Der Begriff „Archiv“ beschreibt eine Kopie von Daten, die zu Referenzzwecken erstellt worden ist. Obwohl eigentlich nicht notwendig, werden die Originaldaten nach Erstellen das Archivs oft gelöscht.

Während der Zweck eines Backups also darin besteht, etwas genauso zurückzubringen, wie es gestern noch existiert hat, kann ein Archiv gleich mehreren Zwecken dienen. Der häufigste Zweck ist es, Daten wiederauffindbar zu machen, die Sie vor langer Zeit einmal an einem bestimmten Ort abgelegt haben. Dabei kann es sich um eine einzelne Datei handeln, in der ein wichtiger Artikel bzw. Vertrag gespeichert ist, oder um eine zusammenhängende Datengruppe wie etwa die Strukturzeichnungen eines gerade eingestürzten Gebäudes oder alle CAD-Zeichnungen eines Widgets, das Ihr Unternehmen einmal verwendet hat.

Ein Archiv funktioniert genauso wie in der Realität: Es lagert Ihre Daten strukturiert und macht sie jederzeit abrufbar (c) Pixabay.com

Ein anderes Beispiel könnte ein E-Mail-Datensatz sein, mit dem sich beweisen ließe, ob ein Angestellter irgendwann einmal während seines Arbeitsverhältnisses die Erlaubnis erhielt, einer Nebenbeschäftigung nachzugehen; ein Vergehen, für das er in weiterer Folge allerdings entlassen worden ist. Die Anklage könnte dann einen Antrag auf Offenlegung aller E-Mails von vor und nach der Entlassung stellen, in denen die Wörter „Nebenjob“, „Stunden“ und der Name der Firma vorkommen, bei der der Angestellte seine Feierabendarbeit verrichtet hat.

In all diesen Fällen kann ein Archiv hilfreich sein. Ob Sie nun ein Archiv für jeden Auftrag, jedes Angebot oder jeden Vertrag anlegen, den Ihr Unternehmen jemals gestellt hat, oder ein Archiv aller E-Mails, die je von Ihrem Unternehmen gesendet oder empfangen worden sind – über ein Index lässt sich der Inhalt jeder archivierten Datei so zeitsparend abrufen wie sie platzsparend ist. Manche E-Mail-Archivsysteme sind sogar in der Lage, automatisch Mails vom E-MailServer zu löschen, die entweder bereits archiviert wurden, eine bestimmte Größe überschreiten oder mehr als X Tage lang nicht abgerufen worden sind. Das kann dazu beitragen, Ihr E-MailSystem schlank zu halten, Rechen- und Speicherressourcen einzusparen und die Sicherung Ihrer Daten durch ein Backup zu vereinfachen.

Wiederherstellen vs. Abrufen

Auch wenn der Zweck eines Archivs darin besteht, Speicherplatz auf der primären Festplatte einzusparen, sollte ein Archiv auch dazu in der Lage sein, den Inhalt einer Datei jederzeit abrufen zu können. Denn während Backup-Systeme darauf ausgelegt sind, Daten wiederherstellen zu können, machen Archive sie möglichst schnell abrufbar.

Wenn Sie etwas wiederherstellen wollen, handelt es sich dabei normalerweise um eine einzelne Datei, einen Server oder eine Datenbank; wollen Sie allerdings etwas abrufen, dann handelt es sich in der Regel um eine Sammlung verwandter Daten, die vermutlich auf demselben Server oder sogar im selben Format gespeichert worden sind. Eine Wiederherstellung wird immer zu einem einzigen Zeitpunkt durchgeführt, um beispielsweise eine Datenbank so wieder aufrufbar zu machen, wie sie zu einem bestimmten Zeitpunkt einmal existiert hat. Ein Abruf macht dagegen immer eine gewisse Zeitspanne sichtbar: zum Beispiel alle E-Mails der letzten drei Jahre.

Eine Wiederherstellung erfordert ein genaues Wissen darüber, wo sich die betreffende Datei bzw. die betreffenden Daten zum Zeitpunkt ihres Backups befunden haben, denn andernfalls werden Sie nicht dazu in der Lage sein, sie zu finden. Sie müssen also den Namen des Servers wissen, auf dem sich die Datei befand, die Datenbank oder das Verzeichnis, in dem sie abgelegt war, den Namen der Datei oder der Tabelle selbst, die Sie wiederherstellen möchten und das Datum, an dem sie zuletzt gesehen wurde, um eine Wiederherstellung durchführen zu können. Das Abrufen einer Datei benötigt dagegen keine dieser Informationen; Sie benötigen lediglich alle Dateien und Datensätze, die mit den gewünschten Parametern übereinstimmen; beispielsweise alle Dateien oder E-Mails, die in den letzten drei Jahren erstellt wurden und die eine bestimmte Phrase enthalten oder von einer bestimmten Person verfasst worden sind.

Warum ist der Unterschied wichtig?

Es gibt viele Leute, die versuchen, Ihr BackupSystem als Archivsystem zu verwenden und dadurch ihre Backups für Jahre, Jahrzehnte oder sogar für immer behalten. Wenn Sie zum ersten Mal eine Abruf-Anfrage erhalten, werden Sie feststellen, wie schwierig es ist, etwas abzurufen, das eigentlich Wiederherstellungen durchführen soll. Dadurch wird das Abrufen wesentlich länger dauern – zum Teil Monate statt Minuten – und kann sie im schlimmsten Fall sogar viele hunderttausend Euro kosten. Denn Zeit ist Geld, besonders dann, wenn Sie sich gerade mitten in einem Rechtsstreit befinden. Einer der berühmtesten Fälle, die durch das Verwechseln von Backup– und Archivsystem entschieden wurden, ist der Rechtsstreit der nordamerikanischen Großbank Morgan Stanley. Diese verlor dadurch immerhin mehrere Milliarden Dollar.

Lernen Sie aus den Fehlern der anderen: Verwenden Sie Ihre Backups nicht als Archiv. Wenn Sie etwas für einen langen Zeitraum aufbewahren wollen, nutzen Sie ein richtiges Archivsystem; auch dann, wenn es Sie zunächst mehr kostet, es wird den monetären Aufwand auf lange Sicht gesehen definitiv wert sein.

*W. Curtis Preston ist Spezialist für Backup, Storage und Recovery und Mitarbeiter bei Network World.


Mehr Artikel

Gregor Schmid, Projektcenterleiter bei Kumavision, über die Digitalisierung im Mittelstand und die Chancen durch Künstliche Intelligenz. (c) timeline/Rudi Handl
Interview

„Die Zukunft ist modular, flexibel und KI-gestützt“

Im Gespräch mit der ITWELT.at verdeutlicht Gregor Schmid, Projektcenterleiter bei Kumavision, wie sehr sich die Anforderungen an ERP-Systeme und die digitale Transformation in den letzten Jahren verändert haben und verweist dabei auf den Trend zu modularen Lösungen, die Bedeutung der Cloud und die Rolle von Künstlicher Intelligenz (KI) in der Unternehmenspraxis. […]

News

Richtlinien für sichere KI-Entwicklung

Die „Guidelines for Secure Development and Deployment of AI Systems“ von Kaspersky behandeln zentrale Aspekte der Entwicklung, Bereitstellung und des Betriebs von KI-Systemen, einschließlich Design, bewährter Sicherheitspraktiken und Integration, ohne sich auf die Entwicklung grundlegender Modelle zu fokussieren. […]

News

Datensilos blockieren Abwehrkräfte von generativer KI

Damit KI eine Rolle in der Cyberabwehr spielen kann, ist sie auf leicht zugängliche Echtzeitdaten angewiesen. Das heißt, die zunehmende Leistungsfähigkeit von GenAI kann nur dann wirksam werden, wenn die KI Zugriff auf einwandfreie, validierte, standardisierte und vor allem hochverfügbare Daten in allen Anwendungen und Systemen sowie für alle Nutzer hat. Dies setzt allerdings voraus, dass Unternehmen in der Lage sind, ihre Datensilos aufzulösen. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*