9 Mythen über BigQuery-Backups

BigQuery ist ein vollständig verwaltetes Data Warehouse von Google für Analysen im Petabyte-Bereich und kommt vielerorts zum Einsatz. Viele IT-Fachkräfte glauben, dass BigQuery automatisch eine vollständige Sicherung gewährleistet, doch das ist ein gefährlicher Irrtum. [...]

Eine moderne Data-Protection-Lösung bietet umfassende Backup-Funktionalität für BigQuery. Eine Lösung dieser Art schützt nicht nur Tabellendaten, sondern auch Metadaten, Funktionen, Routinen, Ansichten, Sicherheitsrichtlinien auf Zeilenebene und mehr. (c) stock.adobe.com/Moya

Eine Data-Protection-Lösung, die über Backups hinausgeht, und granulare Wiederherstellung, Schutz vor Ransomware und Cloud-übergreifende Sicherheit bietet, ist der richtige Ansatz für eine robuste Sicherungs- und Wiederherstellungsstrategie für BigQuery-Daten. Im Vorfeld des World Backup Days erläutert HYCU, was es damit auf sich hat und warum eine umfassende Backup-Strategie für eine BigQuery-Umgebung unerlässlich ist.

Mythos 1: Zeitreisen sind für die Datenrettung ausreichend

Die Time-Travel-Funktion von BigQuery bietet bequemen Zugriff auf historische Daten der letzten sieben Tage. Dies ist jedoch kein Ersatz für umfassende Backups. Das begrenzte Zeitfenster von Time Travel erfüllt nicht die langfristigen Aufbewahrungsanforderungen für Compliance und Audits, die oft weit über sieben Tage hinausgehen. Darüber hinaus können Datenverluste bei Datensätzen, auf die nur selten zugegriffen wird (zum Beispiel bei der Monats- oder Quartalsverarbeitung), innerhalb dieses kurzen Zeitrahmens unbemerkt bleiben.

Mythos 2: BigQuery ist vollständig redundant, daher sind Backups nicht notwendig

BigQuery bietet hohe Verfügbarkeit und Beständigkeit durch Datenreplikation in mehreren Zonen. Dies schützt zwar vor Infrastrukturausfällen, aber nicht vor allen Datenverlustszenarien. Versehentliche Löschungen, Datenbeschädigungen durch Benutzerfehler und logische Fehler können immer noch auftreten. Backups sind für die Wiederherstellung nach solchen Vorfällen von entscheidender Bedeutung, da sie die einzige Möglichkeit bieten, alle Datenverlustsituationen zu bewältigen.

Mythos 3: Daten in BigQuery sind unveränderlich, daher sind keine Backups erforderlich

BigQuery-Daten sind zwar unveränderlich (das heißt, sie können nach dem Schreiben nicht mehr geändert werden), aber das schützt nicht vor versehentlichem Löschen, Überschreiben (zum Beispiel durch Ersetzen von Tabellen) oder dem natürlichen Verfall von Datensätzen. Für diese Szenarien sind unveränderliche Backups nach wie vor unerlässlich.

Mythos 4: BigQuery kümmert sich automatisch um die Wiederherstellung im Katastrophenfall

Die regionenübergreifende Dataset-Replikation ist keine Backup-Lösung. Sie ist in erster Linie für Disaster Recovery und Geschäftskontinuität gedacht. Der Managed Disaster Recovery-Service von BigQuery ist nur für die Enterprise Plus Edition verfügbar und erfordert eine explizite Anmeldung, Einrichtung und laufende Wartung. Es handelt sich nicht um eine automatische, standardmäßige Funktion.

Mythos 5: Die Sicherung von BigQuery-Daten ist zu kostspielig, komplex und langsam

BigQuery-Backups können erstaunlich schnell sein. Es gibt Unternehmen, die bis zu 5 TB in weniger als einer Minute sichern. BigQuery bietet einen großzügigen kostenlosen Tier für die Extraktion von Daten (50 TB pro Tag), und die Verwendung von Komprimierung während des Exports kann die Speicherkosten erheblich senken. Lösungen wie HYCU vereinfachen nicht nur den Prozess, sondern machen BigQuery-Backups einfach zu verwalten und effizient.

Mythos 6: Backup ist nicht nötig, weil alle Datenbanken, die in BigQuery einfließen, gesichert sind

BigQuery ist ein Datenaggregator, was oft bedeutet, dass die Daten woanders gespeichert sind. Es ist nicht ungewöhnlich, dass Benutzer BigQuery nicht sichern, weil sie die zugrundeliegenden Datensätze sichern. Die Rekonstruktion eines BigQuery-Datensatzes aus den Quelldatenbanken ist jedoch ein komplexes und teures Unterfangen, wenn es zu einem Datenverlust kommt. Es erfordert eine erneute Analyse, ETL-Prozesse, erneutes Streaming und vieles mehr. Bei Datensätzen, die durch Streaming generiert wurden, kann die Rekonstruktion sogar unmöglich sein, was zu einem dauerhaften Datenverlust führt.

Mythos 7: Tabellen-Schnapshots sind ausreichend

Tabellen-Snapshots erfassen nur die Daten der Basistabelle. Sie lassen wichtige Elemente wie Tabellen-Metadaten, Ansichten, Funktionen, Routinen und Zugriffskontrollen aus. Außerdem befinden sich Snapshots in derselben Region wie die Basistabelle, was ihre Wirksamkeit in regionalen Disaster-Recovery-Szenarien einschränkt.

Mythos 8: Backups werden nur für Daten vor Ort benötigt

Cloud-Daten, einschließlich BigQuery-Daten, fallen unter das Modell der gemeinsamen Verantwortung. Während der Cloud-Anbieter die zugrundeliegende Infrastruktur verwaltet, sind Cloud-Kunden für den Schutz ihrer Daten verantwortlich. Bei Cloud-Diensten kann es zu Ausfällen kommen, und Benutzerfehler können zu Datenverlusten führen. Daher sind Backups in der Cloud genauso wichtig wie vor Ort.

Mythos 9: Backups sind zu zeitaufwändig und liegen nicht im Aufgabenbereich

Viele IT-Teams verwalten BigQuery nicht direkt, die Datensicherung bleibt jedoch eine wichtige Aufgabe. Moderne Backup-Lösungen wie HYCU rationalisieren den Sicherungsprozess und minimieren den Zeitaufwand. Regelmäßig geplante Backups können im Hintergrund mit minimalen Auswirkungen auf den Betrieb ausgeführt werden, und der Zugriff kann auf die zuständigen Mitarbeiter aufgeteilt werden. Das Ignorieren von Backups kann schwerwiegende Folgen haben, so dass jeder dafür verantwortlich ist, den Schutz der Daten zu gewährleisten.

Robuste Sicherungs- und Wiederherstellungsstrategie für BigQuery-Daten

Wenn Administratoren jeden dieser Mythen verstehen und angehen, haben sie eine gute Grundlage für die Entwicklung einer robusten Sicherungs- und Wiederherstellungsstrategie für BigQuery-Daten. Diese stellt sicher, dass BigQuery-Daten verfügbar sind und Unternehmen die Datenintegrität in jeder Situation aufrechterhalten können.

Eine moderne Data-Protection-Lösung bietet umfassende Backup-Funktionalität für BigQuery. Eine Lösung dieser Art schützt nicht nur Tabellendaten, sondern auch Metadaten, Funktionen, Routinen, Ansichten, Sicherheitsrichtlinien auf Zeilenebene und mehr. Neben einfachen Backups für BigQuery-Daten sind weitere Funktionen entscheidend. Hierzu zählen Ransomware-Resistenz durch atomare Backups, die Konsistenz über Backups mehrerer Datensätze durch Object Lock, regionen- und projektübergreifende Sicherung sowie Cold Line Storage-Archivierung. Durch einen solchen Funktionsumfang sind auch BigQuery-Daten für viele Szenarien angemessen geschützt.


Mehr Artikel

News

6 Grundsätze für eine KI-taugliche Datenbasis

Wer Künstliche Intelligenz nutzen will, muss über eine vertrauenswürdige Datengrundlage verfügen. Daten sind das Lebenselixier von KI-Systemen und bestimmen maßgeblich die Qualität und Zuverlässigkeit der Ergebnisse. Nur so können KI-Modelle robust, anpassungsfähig und vertrauenswürdig arbeiten. […]

News

Cybersicherheitsbudgets werden falsch priorisiert

Der ICS/OT Cybersecurity Budget Report 2025 von OPSWAT deckt erhebliche Lücken in den Cybersicherheitsbudgets sowie einen Anstieg von ICS/OT-fokussierten Angriffen auf. Ferner wird deutlich, wie durch eine unzureichende Finanzierung, falsch gesetzte Prioritäten und uneinheitliche Abwehrmaßnahmen kritische Infrastrukturen immer raffinierteren Bedrohungen ausgesetzt sind. […]

News

Nach dem Hype: Diese vier KI-Trends werden 2025 weiterhin prägen

Die vergangenen zwei Jahre haben einen regelrechten KI-Boom erlebt. Insbesondere generative Modelle (GenAI) haben sich rasant weiterentwickelt und etablieren sich zunehmend als feste Größe in den Arbeitsprozessen von Organisationen weltweit. Angesichts dieser Dynamik fragen sich nun viele Unternehmen, welche Entwicklungen das Jahr 2025 bestimmen werden und welche Potenziale sich daraus ergeben. […]

News

Generative KI als Sicherheitsrisiko

Eine neue Studie von Netskope zeigt einen 30-fachen Anstieg der Daten, die von Unternehmensanwendern im letzten Jahr an GenAI-Apps (generative KI) gesendet wurden. Dazu gehören sensible Daten wie Quellcode, regulierte Daten, Passwörter und Schlüssel sowie geistiges Eigentum. Dies erhöht das Risiko von kostspieligen Sicherheitsverletzungen, Compliance-Verstößen und Diebstahl geistigen Eigentums erheblich. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*