Inhalt
Inhaltsverzeichnis. i
Abbildungsverzeichnis. iii
Tabellenverzeichnis. iv
Formelverzeichnis. v
Abk ürzungsverzeichnis. 145
Amtliches Verzeichnis. 148
Literaturverzeichnis. 149
Inhaltsverzeichnis
1 Motivation und Aufbau der Arbeit. 1
1.1 Frage und Problemstellungen. 1
1.2 Struktur der Arbeit. 3
2 Erläuterung relevanter Begrifflichkeiten. 5
2.1 Kleine und mittelständische Unternehmen. 5
2.2 Daten, Datensicherung, Datensicherheit und Ausfallsicherung. 6
2.3 Wiederherstellungszeit, Wiederherstellungszeitpunkt. 9
2.4 Disaster Recovery. 11
2.5 Weitere grundlegende Termini. 12
3 Grundsätze und Konzeption von Datensicherungssystemen. 16
3.1 Methoden von Datensicherungssystemen. 16
3.1.1 Vollständige, inkrementelle und differenzielle Sicherungsarten. 16
3.1.2 Exakte Wiederherstellung zum Zeitpunkt des Verlustes. 20
3.1.3 Online- und Offline-Sicherung. 21
3.1.4 Verfahren zur Sicherung unterschiedlicher Datenbestands- versionen. 24
3.1.5 Verfahren zur Ergebnis- und Nachhaltigkeitskontrolle. 27
3.2 Realisierung und Implementierung von Datensicherungen. 33
3.2.1 Datenträger. 34
3.2.1.1 Wahlfreier Zugriff. 34
3.2.1.2 Sequentieller Zugriff. 38
3.2.1.3 Anforderungen an Haltbarkeit und Unempfindlichkeit. 48
3.2.2 Vorhandene Systeme am Markt. 49
i
3.2.2.1 Datensicherungssoftware. 50
3.2.2.2 Appliances. 53
3.3 Wirtschaftlichkeit von Datensicherungssystemen. 54
3.3.1 Investitionskosten von Datensicherungssystemen. 55
3.3.2 Betriebskosten von Datensicherungssystemen. 58
3.3.3 Kosten/Nutzen von Datensicherungen bei Datenverlust. 62
4 Datensicherungsappliance. 68
4.1 Anforderung an Funktion und Handhabbarkeit. 68
4.2 Empirische Entwicklung und Aufbau der Appliance. 70
4.2.1 Hardware. 70
4.2.2 Betriebssystem. 80
4.2.3 Software. 85
4.2.4 Programmatische Entwicklung. 87
4.2.5 Implementierung der Datensicherungsfunktionalität. 96
4.3 Funktionsbeschreibung der Appliance. 98
4.3.1 Allgemeine Fähigkeiten der Appliance. 98
4.3.2 Vor- und Nachteile gegenüber anderen Produkten. 100
4.4 Anwendungsszenarien. 102
4.4.1 Verwendung als NAS mittels CIFS und NFS. 106
4.4.2 Verwendung als SAN mittels iSCSI. 109
4.4.3 Client-Server-Datensicherung. 113
4.4.4 Snapshot-Sicherung. 120
4.4.5 Verwendung von Sicherungslaufwerken (magnetisch, optisch) 120
4.5 Empirische Evaluation der Appliance. 125
4.5.1 Leistungsaufnahme. 125
4.5.2 Systemauslastung und Belastungsgrenzen. 128
4.5.3 Wiederherstellung von Daten. 133
4.5.4 Robustheit und Verhalten bei unsachgemäßem Gebrauch. 135
4.6 Wirtschaftlichkeit der Appliance. 136
4.6.1 Investitionskosten der Appliance. 136
4.6.2 Betriebskosten der Appliance. 141
5 Fazit und Ausblick. 142
ii
Abbildungsverzeichnis
Abbildung 2.1: Veranschaulichung Recovery Time Objective, RTO (Quelle: Eigene
Darstellung)..................................................................................................................9 Abbildung 2.2: Veranschaulichung Recovery Point Objective, RPO (Quelle: Eigene
Darstellung)................................................................................................................10 Abbildung 2.3: Copy on Write bei Änderung eines Datenblocks, der rote Zeiger wird
zur aktuellen Referenz ............................................................................................14 Abbildung 3.1: Veranschaulichung inkrementelle Datensicherung (Quelle: Eigene
Darstellung)................................................................................................................19 Abbildung 3.2: Veranschaulichung differentielle Datensicherung (Quelle: Eigene
Darstellung)................................................................................................................20 Abbildung 3.3: Medienwechselschema Towers of Hanoi (Eigene Nachbildung aus: Wald, Egbert, Backup und Disaster Recovery, 1. Auflage, mitp-Verlag, Bonn, 2002,
S.148)........................................................................................................................27 Abbildung 3.4: Screenshot webbasierte Oberfläche Bweb ......................................29 Abbildung 3.5: Helical Scan-Verfahren - ..................................................................41 Abbildung 3.6: Ein- Ausfädeltechnik Helical Scan Laufwerk87..................................42 Abbildung 3.7: Funktionsweise Linear Scan (Quelle: Eigene Darstellung)................44 Abbildung 4.1: Obere Abdeckplatte bei Seagate Festplatten (Quelle: Eigene
Abbildung)..................................................................................................................73 Abbildung 4.2: Metallzungen des Festplattenrahmens geraten zwischen oberer
Festplattenabdeckung und Festplattengehäuse........................................................74 Abbildung 4.3: Screenshot von OpenFiler166...........................................................82 Abbildung 4.4: Screenshot von FreeNAS (Quelle: Eigene Darstellung)....................83 Abbildung 4.5: Originaldesign Webacula181.............................................................96 Abbildung 4.6: Modifiziertes Webacula-Design (Quelle: Eigene Darstellung)............96 Abbildung 4.7: Einrichtung der Festplatten (Quelle: Eigene Abbildung)...................103 Abbildung 4.8: Konfiguration des virtuellen ZFS-Gerätes (Quelle: Eigene Abbildung)
.................................................................................................................................104 Abbildung 4.9: Einstellung des ZFS-Pool-Managements (Quelle: Eigene Abbildung)
.................................................................................................................................105 Abbildung 4.10: Festlegen der ZFS-Datensätze (Quelle: Eigene Darstellung)........106 Abbildung 4.11: Grundeinstellung CIFS-Protokoll (Quelle: Eigene Abbildung)........107 Abbildung 4.12: Erweiterte Optionen CIFS-Protokoll (Quelle: Eigene Abbildung). . .107
iii
Abbildung 4.13: Erstellen einer Freigabe für das CIFS-Protokoll (Quelle: Eigene
Abbildung ) 108
Abbildung 4.14: Aktivierung des NFS-Dienstes (Quelle: Eigene Abbildung) 108
Abbildung 4.15: Freigabe des NFS-Verzeichnisses (Quelle: Eigene Abbildung) 109
Abbildung 4.16: iSCSI Basis-Einstellungen (Quelle: Eigene Abbildung) 109
Abbildung 4.17: Einrichtung iSCSI-Portal (Quelle: Eigene Abbildung) 110
Abbildung 4.18: iSCSI-Initiator Zugriffssteuerung (Quelle: Eigene Abbildung) 110
Abbildung 4.19: iSCSI-Erweiterung hinzufügen (Quelle: Eigene Abbildung) 111
Abbildung 4.20: Einstellung des iSCSI-Erweiterung-Ziels (Quelle: Eigene Abbildung)
112
Abbildung 4.21: iSCSI-Ziel hinzufügen (Quelle: Eigene Abbildung) 112
Abbildung 4.22: Einstellungen iSCSI-Ziel (Quelle: Eigene Abbildung) 113
Abbildung 4.23: Bacula-Architektur193. 114
Tabellenverzeichnis
Tabelle 3.1: Bweb Detailansicht Vergleichsauftrag. 30
Tabelle 3.2: Datensicherungsprotokoll ARCserve 11.1. 33
Tabelle 3.3: Anschaffungskosten der Datensicherungslösung. 57
Tabelle 3.4: Verteilung der Leistungsaufnahmen. 60
Tabelle 3.5: Durchschnittliche Betriebskosten pro Jahr. 62
Tabelle 4.1: Konfigurationsdatei des Bacula-Clients. 115
Tabelle 4.2: Standardauftragsdefinition in der Konfiguration des Bacula-Directors. 116
Tabelle 4.3: Auftragsdefinition in der Konfiguration des Bacula-Directors. 117
Tabelle 4.4: Auswahl der zu sichernden Dateien in der Konfiguration des Bacula-
Directors. 118
Tabelle 4.5: Definition eines Clients in der Konfiguration des Bacula-Directors. 119
Tabelle 4.6: Storage-Ressource in der Konfiguration des Bacula-Directors. 121
Tabelle 4.7: Definition für ein Bandlaufwerk in der Konfiguration des Bacula-Storage-
Dienstes. 122
Tabelle 4.8: Definition für ein Blu-ray-Laufwerk in der Konfiguration des Bacula-
Storage -Dienstes. 124
Tabelle 4.9: Ergebnisse der Übertragung einer 10 GiB großen Datei. 130
Tabelle 4.10: Übertragung von 10 GiB generierter Nullen. 131
iv
Tabelle 4.11: Übertragung von Dateien unterschiedlicher Größe.............................131 Tabelle 4.12: Wiederherstellungsoptionen der Bacula-Konsole...............................134 Tabelle 4.13: Auswahl des Clients und des Dateisatzes in der Bacula-Konsole......134 Tabelle 4.14: Bestätigungsmeldung für den Wiederherstellungsauftrag in der Bacula-
Konsole....................................................................................................................135 Tabelle 4.15: Entwickelte Appliance versus Modell LG N4B1 bei gleicher
Konfiguration............................................................................................................137 Tabelle 4.16: Anschaffungskosten der Konfiguration, wie sie für die Entwicklung
verwendet wurde......................................................................................................138 Tabelle 4.17: Anschaffungskosten der Medien.........................................................139 Tabelle 4.18: Anfallende Dienstleistungskosten für Einrichtung, Konfiguration und
Schulung..................................................................................................................140 Tabelle 4.19: Gesamtinvestitionskosten der entwickelten Appliance inklusive Einrichtung und Konfiguration der Datensicherung sowie Schulung der Mitarbeiter
.................................................................................................................................140 Tabelle 4.20: Gesamtbetriebskosten für ein Jahr.....................................................141
Formelverzeichnis
Formel 3.1: Allgemeine Berechnung der Sicherungsdauer in Stunden......................59 Formel 3.2: Spezifische Berechnung der Sicherungsdauer in Stunden.....................60 Formel 3.3: Spezifische Berechnung der durchschnittlichen Leistungsaufnahme.....61 Formel 3.4: Allgemeine Berechnungsform der Energiekosten...................................61 Formel 3.5: Spezifische Berechnung der Energiekosten pro Jahr.............................61 Formel 3.6: Allgemeine Berechnung der mittleren Kosten pro Mitarbeiter.................63 Formel 3.7: Allgemeine Berechnung der Personal- und Servicekosten.....................65 Formel 3.8: Spezifische Berechnung der Personal- und Servicekosten....................65 Formel 3.9: Allgemeine Berechnung der anteiligen Leerkosten.................................66 Formel 3.10: Spezifische Berechnung der anteiligen Leerkosten..............................66 Formel 4.1: Allgemeine Berechnung des Mittelwertes.............................................126 Formel 4.2: Allgemeine Berechnung der korrigierten Standardabweichung............126 Formel 4.3: Allgemeine Formel zur Berechnung der Leistung.................................126 Formel 4.4: Spezifische Berechnung der Leistung..................................................126 Formel 4.5: Berechnung der Fehlerfortpflanzung zweier multiplikativer Messwerte 127
v
Formel 4.6: Spezifische Berechnung der Fehlerfortpflanzung.................................127
vi
1 Motivation und Aufbau der Arbeit
Durch die neunjährige selbstständige Tätigkeit des Verfassers im Bereich der Informationstechnologie in kleinen und mittelständischen Unternehmen, sind gewisse Missstände im Bereich der Datensicherung wiederkehrend aufgefallen. Diese regten dazu an, eine Appliance zu entwickeln, welche gezielt an diesem Punkt ansetzt. In diesem Kapitel sollen die Wahl und die Hintergründe des Themas der vorliegenden Diplomarbeit motiviert werden. Es werden gegenwärtige Frage- bzw. Problemstellungen im Zusammenhang mit der Datensicherung allgemein sowie die Entwicklung einer Datensicherungsappliance im Besonderen dargelegt. Die vorliegende Arbeit behandelt das Thema Datensicherung als Mittel, Daten wiederherstellbar zu machen.
1.1 Frage und Problemstellungen
Die Datensicherung ist ein wichtiger Bestandteil der Informationstechnologie (IT), um Datenverlusten vorzubeugen. Daten sind vor Verlust zu schützen - nicht nur vor dem Hintergrund großer monetärer Verluste, sondern auch aufgrund gesetzlicher Vorgaben. 1 Je nach Branche können diese Vorgaben z.B. lediglich durch das HGB beschränkt sein oder durch weitere Gesetze, welche die Aufbewahrungspflicht ausweiten. 2 In Krankenhäusern, in denen beruflich strahlenexponierte Personen arbeiten, ist die Aufbewahrungspflicht beispielsweise auf 30 Jahre ausgeweitet. 3
Datensicherungen sind auch dann zu betreiben, wenn der Anwender mit größter Sorgfalt arbeitet. Auch bei äußerster Gewissenhaftigkeit ist ein Schutz vor höherer Gewalt, wie z.B. Feuer, Wasser, Sturmschäden und anderen Naturereignissen nicht gegeben. Ferner gilt es, die Tatsache des Einbruchs zu berücksichtigen. Wird die gesamte IT-Anlage entwendet, verschwinden somit auch die kompletten Daten.
1 Vgl. OLG Hamm, vom 01.12.2003, 13 U 133/03.
2 Vgl. §257, Abs. 5, HGB, Ausfertigung 17.12.2008.
3 Vgl. §42, Abs. 1, StrlSchV, Ausfertigung 20.07.2001.
1
Durch immer komplexer werdende Systeme steigt auch das Risiko eines Datenverlustes. Je komplexer ein System ist, desto schwieriger ist dieses auch zu kontrollieren. 4 Durch unerwartet auftretende Fehler in der Hardware können ebenfalls Datenverluste entstehen, z.B. dann, wenn in einem RAID 5-Verbund (Redundant Array of Independent Disks) zwei Festplatten gleichzeitig ausfallen. Da in einem RAID 5-Verbund nur jeweils eine Festplatte ausfallen darf, ist die Datenkonsistenz zerstört und ein Zugriff auf den Datenbestand nicht mehr möglich. 5 Ein RAID-Verbund ist ein Verbund von Festplatten, welcher durch redundante Datenhaltung als Ausfallsicherung verwendet werden kann.
Datenverfälschungen sind, neben dem Aspekt des Datenverlustes, ein weiteres Kriterium, Datensicherungen zu betreiben. Eine Datenverfälschung kann durch technische Defekte auftreten, wenn beispielsweise durch Fehler in der Anwendungssoftware Daten überschrieben oder in fälschlicher Weise verändert werden. Des Weiteren ist eine absichtliche Verfälschung in Form von Sabotage denkbar.
Nebst Soft- und Hardwaredefekten kann auch beim Menschen eine hundertprozentig fehlerfreie Arbeitsweise nicht vorausgesetzt werden. Menschliche Fehler können zumeist durch eine ordnungsgemäße Datensicherung abgewendet oder abgemildert werden.
Sowohl menschliches Versagen, als auch Hard- und Softwarefehler sowie höhere Gewalt führen zu der Notwendigkeit, eine geeignete Datensicherung in dem jeweiligen Unternehmen zu implementieren. Gerade hier liegt für kleine und mittelständische Unternehmen eine Hürde, welche diese nicht einfach zu überwinden vermögen. Zum einen fehlt es häufig an fachlich qualifiziertem Personal, um die mit der Datensicherung verbundenen Prozesse zu implementieren und zu kontrollieren, zum anderen wird die Wahrscheinlichkeit eines Datenverlustes oder einer Datenkompromittierung unterschätzt. 6
4 Vgl. BSI (Hrsg.): Elektronischer Zahlungsverkehr - Folgen fehlender oder unzureichender IT-Sicherheit, SecuMedia Verlag, Ingelheim, 1998, S. 13.
5 Vgl. Störl, Uta: Backup und Recovery in Datenbanksystemen, 1. Auflage, B.G. Teubner, 2001, S. 38.
6 Vgl. Prevezanos, Christoph: Linux im Backoffice, 1. Auflage, Data Becker, 2001, S. 627.
2
Des Öfteren fehlt dem Kleinunternehmer ebenfalls der Wissensstand darüber, welche Methoden und Geräte für sein Unternehmen eine angemessene Datensicherungslösung darstellen. Darüber hinaus ist häufig auch die Kenntnis nicht vorhanden, welche Systeme präventiv eingesetzt werden sollten, um die Wahrscheinlichkeit eines Ausfalls des Systems im Vorfeld zu minimieren.
Ein weiteres, häufig beobachtetes Szenario ist, dass der Wechsel des Mediums nicht vollzogen wird und somit ein oder mehrere Tage hintereinander keine Sicherung erfolgt. Dies wäre beispielsweise der Fall, wenn sich die verantwortliche Person im Urlaub befindet oder aufgrund von Krankheit nicht anwesend ist. 7
Aus den vorgenannten Gründen stellt sich die Frage, ob die sich derzeit am Markt befindenden Systeme für kleine und mittelständische Unternehmen ausreichend sind oder ob diese durch Modifikationen und Extensionen weiter optimiert werden können.
1.2 Struktur der Arbeit
Die Arbeit ist insgesamt in fünf Kapitel untergliedert. In Kapitel 2 werden zunächst grundlegende Begrifflichkeiten erläutert und in ihrer Bedeutung von existierenden Auffassungen abgegrenzt. In Kapitel 3 wird eine Abhandlung über Datensicherungstechniken und -methoden, wie sie heute im Allgemeinen existieren, durchgeführt.
Aus den Betrachtungen in Kapitel 3 folgt in Kapitel 4 die Darstellung der Entwicklung einer Datensicherungsappliance, indem zunächst in Kapitel 4.1 die Anforderungen an das System aufgestellt werden. Kapitel 4.2 beschreibt den Aufbau der Appliance im Detail. Insbesondere werden hier die Wahl der Hardware-Komponenten, der Software, des Betriebssystems und dessen Konfiguration beschrieben. Darauf folgend werden in Kapitel 4.3 die grundlegende Funktionsweise sowie die Möglichkeiten und Grenzen der Datensicherungsappliance beschrieben. Im Anschluss folgt eine Gegenüberstellung der neu entwickelten Appliance mit anderen, sich derzeit am Markt befindenden Produkten.
7 Quelle: Beobachtung des Verfassers im eigenen Kundenstamm.
3
In Kapitel 4.4 werden Anwendungsszenarien und Einsatzmöglichkeiten der Appliance aufgezeigt. Kapitel 4.5 beschäftigt sich mit den für den Betrieb der Appliance relevanten Fakten wie Energieverbrauch, Bedienung und Wirkungsgrade in der Praxis. Abschließend wird in Kapitel 4.6 die Wirtschaftlichkeit der Appliance betrachtet - hierzu zählen Anschaffungs- und Betriebskosten (Energiekosten, Instandhaltung etc.). Zum Schluss wird in Kapitel 5 ein Ausblick über weitere Entwicklungen und Funktionsausbau der Datensicherungsappliance gegeben.
4
2 Erläuterung relevanter Begrifflichkeiten
In diesem Kapitel werden grundlegende Begriffe erklärt, Begriffe mit nicht einheitlichen Definitionen auf den Gültigkeitsbereich der Arbeit eingegrenzt sowie Begriffe mit mehrfacher Bedeutung voneinander abgegrenzt.
2.1 Kleine und mittelständische Unternehmen
Im Unterschied zu anders lautenden Definitionen, z.B. die der Europäischen Kommission, werden in dieser Arbeit kleine und mittelständische Unternehmen als solche bezeichnet, wenn diese nicht mehr als 50 Bildschirmarbeitsplätze aufweisen. 8 Die Abgrenzung wird in dieser Art und Weise durchgeführt, da der Verfasser die Auffassung vertritt, dass Unternehmen, die eine hohe Anzahl an Arbeitsplätzen insgesamt bereitstellen, nicht zwangsläufig die gleiche Anzahl an
Bildschirmarbeitsplätzen betreiben. Strukturell gleichen sie somit seitens der IT eher einem kleinen Unternehmen.
Eine solche Diskrepanz zwischen Gesamt- und Bildschirmarbeitsplätzen kann zum einen daher kommen, dass ein Unternehmen im Vielschichtverfahren arbeitet und dadurch ein Arbeitsplatz mehrfach genutzt wird. Zum anderen ist nicht notwendigerweise ein Arbeitsplatz an den Einsatz eines Rechnersystems gebunden, d.h. Arbeitsplätze können autark, nicht rechnergestützt betrieben werden.
Als Beispiel sei hier die Firma TWP Lage GmbH angeführt, welche mit einem derzeitigen Mitarbeiterstab von 120 Personen insgesamt, lediglich 40 Bildschirmarbeitsplätze (inkl. Notebooks) betreibt. 9 Dies ist in erster Linie darin begründet, dass der Betrieb im Dreischichtverfahren arbeitet, die Produktion dieses Betriebes weitestgehend autark ohne IT-Unterstützung aufgestellt ist und nur in der Verwaltung Rechnersysteme eingesetzt werden.
8 Vgl. Europäische Kommission (Hrsg.): COMMISSION RECOMMENDATION of 6 May 2003 concerning the definition of micro, small and medium-sized enterprises, http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:124:0036:0041:en:PDF (09.10.2009), L124/39.
9 Befragung von Herrn Jaschke, TWP Lage GmbH, Abteilung EDV am 13.07.2009.
5
2.2 Daten, Datensicherung, Datensicherheit und Ausfallsicherung
Daten, Datensicherung, Datensicherheit und Ausfallsicherung sind in der Literatur nicht eindeutig abgegrenzt, weshalb diese Begriffe in den für diese Arbeit notwendigen Kontext gesetzt werden.
Daten
Laut DIN 44300 Nr. 19 sind Daten: „... Gebilde aus Zeichen oder kontinuierliche Funktionen, die aufgrund bekannter oder unterstellter Abmachungen Informationen darstellen, vorrangig zum Zweck der Verarbeitung und als deren Ergebnis.“ 10 In dieser Arbeit wird sich hingegen bei dem Begriff Daten auf den Bestandteil der elektronischen Speicherung und Verarbeitung von Daten beschränkt. Die in nichtelektronischer Art gespeicherten Daten, wie z.B. in Form von Papier, finden keine Betrachtung.
Datensicherung
Datensicherung wird allgemein als die Sicherung von Daten vor Verlust, unbeabsichtigter Löschung und Verfälschung verstanden. 11 Dies bedeutet, dass Daten so gespeichert werden müssen, dass sie bei versehentlicher oder absichtlicher Löschung, Verfälschung und Beschädigung in einem unveränderten Zustand zum Zeitpunkt der Sicherung wiederhergestellt werden können. 12 In der Literatur werden weitere Maßnahmen zum Schutz der Daten vor Manipulation und Löschung beschrieben. 13 Die vorliegende Arbeit wird sich jedoch in ihrer Abhandlung auf die hier aufgeführte Definition beschränken.
10 Vgl. Deutsche Industrie Norm (DIN), 44300, Nr. 19.
11 Vgl. Witt, Bernhard C.: IT-Sicherheit kompakt und verständlich - Eine Praxisorientierte Einführung, Vieweg+Teubner Verlag, 2006, S. 134.
12 Vgl. Bauknecht, Kurt; Karagiannis, Dimitris; Teufel, Stephanie, et. al.: Sicherheit in Informationssystemen: Proceedings der Fachtagung SIS'96, Wien, 1996, S. 253.
13 Vgl. Eckert, Claudia: IT-Sicherheit, Verfahren - Konzepte - Protokolle, Oldenburg, 2008, S. 5.
6
Datensicherheit
Im Unterschied zur Datensicherung beinhaltet der Begriff Datensicherheit oder engl. security alle Maßnahmen, die zum Schutz der Daten gegen unbefugten Zugriff getroffen werden. 14 In der Informationstechnologie sind dies u.a. Maßnahmen zur Sicherung des Betriebssystems, der Anwendersoftware und den Daten vor unautorisiertem Zugriff. 15 Zur besseren Abgrenzung Datensicherung versus Datensicherheit sei dies anhand eines Beispiels dargelegt.
Die Sicherung eines Systems gegen unbefugten Zugriff durch das Absichern der Systeme mit Passwörtern, das Einspielen von Sicherheitsupdates und regelmäßigen Sicherheitsprüfungen fällt in den Definitionsbereich der Datensicherheit. Das Sichern der Daten gegen Verlust durch regelmäßiges Speichern auf verschiedene Medien sowie das Anfertigen von Sicherheitskopien fällt in den Bereich der Datensicherung.
Ausfallsicherung
Die Ausfallsicherung bezeichnet Maßnahmen, welche dazu dienen, den fortwährenden Betrieb einer Anlage oder Software sicherzustellen. In der Informationstechnologie wird dies u.a. durch redundant ausgelegte Bauteile erreicht, die als besonders kritisch bzw. anfällig für die Aufrechterhaltung des Betriebs eines Informationssystems angesehen werden (Netzteil, Festplatten). In der Literatur wird als Synonym für die Ausfallsicherung auch Funktionssicherheit oder englisch safety eingesetzt. 16
Generell kann also eine Ausfallsicherung eine Datensicherung nicht ersetzen, da sie im Gegensatz zur Datensicherung nur für die Aufrechterhaltung des Betriebs sorgt und nicht vor z.B. der versehentlichen Löschung einer Datei durch einen Mitarbeiter schützt. 17 Die Ausfallsicherung ist jedoch stützender Bestandteil der Datensicherung, da sie sich ebenfalls positiv auf den Erhalt der Daten auswirkt.
14 Vgl. Kappes, Martin: Netzwerk- und Datensicherheit: Eine praktische Einführung, 1. Auflage, Vieweg+Teubner Verlag, 2007, S. 2.
15 Vgl. Eckert, Claudia: IT-Sicherheit, Verfahren - Konzepte - Protokolle, Oldenburg, 2008, S. 5.
16 Vgl. Eckert, Claudia: IT-Sicherheit, Verfahren - Konzepte - Protokolle, Oldenburg, 2008, S. 4.
17 Vgl. Störl, Uta: Backup und Recovery in Datenbanksystemen, 1. Auflage, B.G. Teubner, 2001, S. 39.
7
Ferner können zur Ausfallsicherung sogenannte USV-Systeme (Unterbrechungsfreie Stromversorgung) betrieben werden. USV-Systeme halten die Anlage für einen definierten Zeitraum in einem betriebsfähigen Zustand, falls die Stromzufuhr unterbrochen wird. Im Softwarebereich wird eine Redundanz z.B. durch Replizierung der Daten auf andere Hostsysteme erreicht. 18
Archivierung
Im Kontext der Datensicherung wird auch häufig der Begriff Archivierung verwendet. Die Datensicherung ist allerdings nicht mit der Archivierung gleichzusetzen. Unter Datensicherung versteht man die Sicherung der Daten des produktiven Einsatzes. Die Archivierung entspricht der Speicherung von Daten, welche nicht mehr verändert bzw. nicht mehr benötigt werden. Die aufgrund von Vorgaben aufbewahrt werden müssen sowie Daten, auf welche nur sehr selten zurückgegriffen wird. 19
Der Begriff Archivierung soll anhand eines Beispiels näher verdeutlicht werden.
Ein Unternehmen, das technische Geräte herstellt, speichert seine Handbücher zu den produzierten Artikeln in Form von PDF-Dokumenten (Portable Document Format) ab. In diesem Fall würden die Handbücher zu aktuell hergestellten und sich in der Entwicklung befindenden Produkten in das Gebiet der Datensicherung fallen. Handbücher zu nicht mehr produzierten und abgekündigten Produkten, die nicht mehr weiter bearbeitet werden, fallen in das Gebiet der Archivierung, da ein Zugriff hierauf nur selten erforderlich sein wird.
18 Vgl. Störl, Uta: Backup und Recovery in Datenbanksystemen, 1. Auflage, B.G. Teubner, 2001, S. 40.
19 Vgl. Kampffmeyer, Ulrich (Autor); Wind, Martin (Hrsg.); Krüger, Detlef (Hrsg.): Handbuch IT in der Verwaltung (Teil III), Springer Berlin Heidelberg, 2006, S. 459.
8
2.3 Wiederherstellungszeit, Wiederherstellungszeitpunkt
Wiederherstellungszeit
Die Wiederherstellungszeit, englisch Recovery Time Objective (RTO), misst die Zeit, die benötigt wird, um ein System wieder in einen operativen Zustand zu versetzen. Neben der Zeit, die der Prozess benötigt, um die Daten vom Sicherungsmedium wieder zurück auf das Originalsystem zu transferieren, schließt dies auch sämtliche Maßnahmen ein, die mit diesem Vorgang in Verbindung stehen. Zeiten für die Analyse, die Beschaffung von Ersatzteilen, die Neuinstallation des Betriebssystems, die Dauer der Rücksicherung sowie die Entscheidung, dass eine Rücksicherung durchgeführt wird, werden ebenfalls mit in die RTO gerechnet. 20
Abbildung 2.1 veranschaulicht den Begriff der RTO.
20 Vgl. Storage Networking Industry Association (Hrsg.): SNIA 2009 Dictionary, http://www.snia.org/education/dictionary/r/#recovery_time_objective (29.09.2009).
9
Wiederherstellungszeitpunkt
Der Wiederherstellungszeitpunkt, englisch Recovery Point Objective (RPO), bezeichnet den Zeitpunkt, zu welchem die Daten wiederhergestellt werden können. Ausgangsbasis ist der Zeitpunkt, an dem eine Wiederherstellung erforderlich wird bis zu dem Zeitpunkt, an welchem die Daten das letzte Mal gesichert wurden. Gewertet wird hierbei die maximale Zeit, welche an Veränderungen seit der letzten Sicherung verloren gehen darf. 21
Dies soll an einem Beispiel verdeutlicht werden.
Ein Unternehmen führt täglich um 23:00 Uhr eine Datensicherung durch. Am darauf folgenden Tag wird die Datenbank um 17:00 Uhr durch einen Hardwaredefekt zerstört. In diesem Fall wäre die RPO 18 Stunden, würde mit der Datenbank dreischichtig gearbeitet. Arbeitet das Unternehmen nachts nicht mit der Datenbank, sondern beginnt morgens um 08:00 Uhr, wäre die RPO 9 Stunden.
Abbildung 2.2 stellt den geschilderten Sachverhalt grafisch dar.
21 Vgl. Storage Networking Industry Association (Hrsg.): SNIA 2009 Dictionary, http://www.snia.org/education/dictionary/r/#recovery_point_objective (29.09.2009).
10
2.4 Disaster Recovery
Charlotte J. Hiatt definiert das Disaster in ihrem Buch „A primer for disaster recovery planning in an IT environment“ folgendermaßen:
„A disaster is an occurrence that disrupts the functioning of the organization resulting in loss of data, loss of personnel, loss of business or loss of time.“ 22
Sie bezeichnet somit das Disaster als eine Katastrophe, welche weit über die Informationstechnologie hinausgeht. In dieser Arbeit beschränkt sich die Wiederherstellung aus einem Disaster, also das Disaster Recovery, auf den Komplettausfall des IT-Systems inklusive seiner Daten, sodass eine Wiederherstellung sämtlicher Daten aus der Datensicherung erforderlich wird.
Dieser Umstand wird in der Literatur auch als Bare Metal Recovery bezeichnet, da die Ausgangsbasis eine leere oder komplett zu überschreibende Festplatte ist. 23 Ein solcher Zustand kann dann auftreten, wenn z.B. durch einen Blitzeinschlag oder Brand das gesamte IT-System zerstört worden ist. Es gibt mehrere Möglichkeiten, wie im Falle eines Disasters verfahren werden kann. Eine Möglichkeit ist die Anfertigung eines Festplatten-Images, welches durch Booten eines Drittsystems erstellt wird und die Grundinstallation des Betriebssystems beinhaltet. Das Image kann dann mittels einer bootfähigen CD-ROM auf die zunächst leere Festplatte übertragen werden. Fährt das System in seinen Grundbestandteilen wieder hoch, können dann mittels der installierten Datensicherungssoftware die aktuellen Datenbestände wieder eingespielt werden. 24
22 Hiatt, Charlotte J.: A primer for disaster recovery planning in an IT environment, Idea Group Inc. (IGI), 2000, S. 3.
23 Vgl. Curtis W., Preston: Unix backup & recovery, O'Reilly, 1999, S. 282.
24 Vgl. Violka, Karsten: Schnappschuss-Sicherung, c't Heft 20 Jahrgang 2008, Heise Zeitschriften Verlag GmbH & Co. KG, S. 152 - 159.
11
Ein weiteres Verfahren bieten Hewlett Packard-Bandlaufwerke, welche den OBDR-Modus (One Button Disaster Recovery) unterstützen. Wird der OBDR-Taster am Laufwerk betätigt, schaltet das Bandlaufwerk in einen CD-ROM Emulations-Modus, sodass vom Band gebootet werden kann und die Daten zurückgesichert werden können. Dies setzt allerdings voraus, dass die Datensicherungssoftware zuvor ein wiederherstellungsfähiges Image des Betriebssystems auf das Band geschrieben hat. Anzumerken ist, dass seitens des Datensicherungssoftware-Herstellers eine Unterstützung für OBDR gegeben sein muss, damit diese Option funktioniert. 25
Hersteller, die nicht bereits im Standard die Funktion ermöglichen auch geöffnete Dateien zu sichern, bieten meist eine kostenpflichtige Zusatzoption an, die dieses beinhaltet. 26 Essentiell wichtig ist für Windows-Betriebssysteme, dass eine konsistente Sicherung der Registrierungsdatenbank sowie geöffneter oder exklusiv gesperrter Systemdateien durchgeführt wurden, da ansonsten ein Start nach der Wiederherstellung des Systems nicht möglich ist. 27
2.5 Weitere grundlegende Termini
CIFS
CIFS steht für Common Internet File System und bezeichnet ein Protokoll, welches zur Übertragung und zum Zugriff auf Dateien vorwiegend in Microsoft Windows-Netzwerken verwendet wird. CIFS benutzt dabei zur Kommunikation das TCP/IP-Protokoll (Transmission Control Protocol/Internet Protocol). Bei CIFS handelt es sich um einen offenen Standard, sodass beliebige Systeme das Protokoll implementieren können.
25 Vgl. Hewlett-Packard Development Company, L.P. (Hrsg.): StorageWorks One Button Disaster Recovery (OBDR) Questions and answers, Version vom 14. März 2006, ftp://ftp.compaq.com/pub/ products/storageworks/OBDR/OBDR_FAQs.pdf (09.07.2009).
26 Beispielhaft: Disaster Recovery Option des Produktes ARCServe Backup von Computer Associates.
27 Vgl. Cougias, Dorian J.; Heiberger, E.L.; Koop, Karsten: The backup book: disaster recovery from desktop to data center, 3. Auflage, Network Frontiers, 2003, S. 88. Vgl. Violka, Karsten: Schattenkopieren, c't Heft 09 Jahrgang 2009, Heise Zeitschriften Verlag GmbH & Co. KG, S. 180 - 181.
12
Teilweise wird für CIFS auch der Begriff SMB (Server Message Block) verwendet. 28 Eine Reihe der derzeitig am Markt vorhandenen NAS-Systeme stellen mittels des CIFS-Protokolls Dateien für Windows PCs im Netzwerk zur Verfügung. 29
NFS
Das Network File System ist ein Netzwerkdateisystem, das häufig auf Unixbasierenden Systemen zur Anwendung kommt, um Daten zentral auf einem Netzwerkserver zu speichern. Vorteil von NFS ist, dass für den Anwender kein Unterschied erkennbar ist, ob das Verzeichnis sich im Netzwerk oder lokal auf seinem Rechner befindet. 30
NAS
NAS steht für Network Attached Storage und bezeichnet ein Gerät, welches über Dateiprotokolle wie NFS und CIFS Speicherplatz im Netzwerk zur Verfügung stellt. NAS-Systeme sind vorwiegend über Ethernet angeschlossen und Bestandteil des LANs (Local Area Network). 31
SAN
Ein SAN (Storage Area Network) bezeichnet ein dediziertes Netzwerk, welches Speichergeräte (wie z.B. Festplatten oder Bandgeräte) zusammenfasst und als logische Einheit zur Verfügung stellt. Mehrere Speichersysteme können beispielsweise zusammengefasst werden und dem an das SAN angeschlossenen System als eine einzige große Festplatte dargestellt werden. Üblicherweise werden zum Zugriff Fibre-Channel oder iSCSI über Ethernet verwendet. Ein grundsätzlicher Unterschied zu NAS-Systemen ist, dass der Zugriff auf den Speicher blockbasiert und nicht über ein Dateiprotokoll wie NFS oder CIFS erfolgt. 32
28 Vgl. Traeger, Dirk H.; Volk, Andreas: LAN: Praxis lokaler Netze, 4. Ausgabe, Vieweg+Teubner Verlag, 2002, S. 165 - 166.
29 Beispielsweise: Promise NS4300N, Buffalo TeraStation TS-TGL Serie, Thecus 4100, QNAP TS409.
30 Vgl. Stern, Hal: Verwaltung von Unix Netzwerken mit NFS und NIS, 1. Auflage, O'Reilly, 1995, S. 97.
31 Vgl. Sollbach, Wolfgang; Thome, Günter: Information Lifecycle Management: Prozessimplementierung, 4. Ausgabe, Springer, 2008, S. 150 - 151.
32 Vgl. Sollbach, Wolfgang; Thome, Günter: Information Lifecycle Management: Prozessimplementierung, 4. Ausgabe, Springer, 2008, S. 154 - 156.
13
Snapshots
Als Snapshots werden in der Informationstechnologie im Kontext von Datenspeicherung Verfahren genannt, die ein konsistentes Abbild eines Dateisystems zu einem bestimmten Zeitpunkt erzeugen. 33 Dies geschieht z.B. durch die Verwendung der Copy on Write-Methode. Bei einem Schreibvorgang werden hierbei keine Daten gelöscht oder überschrieben, sondern die sich ändernden Blöcke werden an einen anderen Ort im Dateisystem geschrieben. Ein Zeiger wird dann an der ursprünglichen Stelle auf den geschriebenen Block gesetzt.
Soll nun ein vorheriger Zustand wiederhergestellt werden, ist es lediglich erforderlich, dass der Zeiger auf die vorherige Stelle gesetzt wird. Durch dieses Verfahren ist es möglich, auch große Dateisysteme in kurzer Zeit in einen vorherigen Zustand zu überführen. 34 Das ZFS-Dateisystem (Zettabyte File System) ist beispielsweise solch ein Dateisystem, welches diese Funktionalität implementiert.
Die Abbildung 2.3 illustriert den Vorgang der Änderung eines Datenblocks.
33 Vgl. Troppens, Ulf; Erkens, Rainer; Müller, Wolfgang: Speichernetze, 2. Auflage, dpunkt.verlag, 2008, S. 141.
34 Vgl. Bonwick, Jeff; Moore, Bill; Sun Microsystems, Inc. (Hrsg.): ZFS - The Last Word In Filesystems,
http://www.opensolaris.org/os/community/zfs/docs/zfs_last.pdf (09.07.2009), S. 9 - 11.
14
ISCSI
ISCSI (Internet Small Computer System Interface) ist ein IP-basiertes Protokoll, das SCSI Befehle über ein Netzwerk (meistens Ethernet) überträgt. Somit ersetzt das Netzwerk als Übertragungsmedium das SCSI Kabel, welches die Festplatte mit dem SCSI Controller verbindet. 35 Der entfernte Server im Netz wird dadurch zum SCSI Controller des Clients. Vorteil dieser Technologie ist, dass es für die Anwendungssoftware unwesentlich ist, ob sich die Festplatte lokal im Rechner oder auf einem entfernten System befindet. Eine mittels ISCSI eingebundene Festplatte bzw. Partition ist aus Anwendersicht nicht von einer lokal installierten Platte zu unterscheiden. Dies bringt viele Vorteile mit sich. Da das SCSI Protokoll schon lange existiert, brauchen höhere Softwareschichten nicht neu konzipiert oder angepasst zu werden. 36
35 Vgl. Troppens, Ulf; Erkens, Rainer; Müller, Wolfgang: Speichernetze, 2. Auflage, dpunkt.verlag, 2008, S. 114.
36 Vgl. ebd., S. 68.
15
3 Grundsätze und Konzeption von
Datensicherungssystemen
In diesem Kapitel werden die allgemeinen Grundsätze von
Datensicherungssystemen und deren Konzeption erörtert. Grundvoraussetzung eines Datensicherungssystems ist die Funktionsfähigkeit! Ein nicht funktionierendes Datensicherungssystem ist wertlos, da es seinem primären Einsatzzweck, Daten des operativen Geschäfts zu sichern und im Falle einer Störung diese wiederherzustellen, nicht gerecht wird. 37
3.1 Methoden von Datensicherungssystemen
Zur Gewährleistung der Grundsätze von Datensicherungssystemen existieren in der Praxis verschiedene Methoden und Ansätze, um das gewünschte Ergebnis unter verschiedenen Gesichtspunkten zu erzielen. Diese werden in den folgenden Unterkapiteln vorgestellt.
3.1.1 Vollständige, inkrementelle und differenzielle Sicherungsarten
Vollsicherung und Wiederherstellung
Die Vollsicherung stellt die am einfachsten zu handhabende Sicherungsart dar. Bei jeder Sicherung werden immer alle Daten gesichert. Für die Wiederherstellung wird jeweils immer nur der aktuelle Datenträger (Datenträgersatz) benötigt.
Vorteile:
Die Vollsicherung zeichnet sich durch eine einfache Handhabung aus, da sich das Verfahren jeden Tag gleicht und nicht wie bei anderen Sicherungsarten in bestimmten Intervallen eine andere Methode angewandt werden muss. Die Wiederherstellung bei der Vollsicherung ist ebenfalls einfacher als bei anderen Verfahren, da zur Wiederherstellung jeweils immer nur der aktuelle Datenträger bzw. Datenträgersatz benötigt wird.
37 Vgl. Kampffmeyer, Ulrich (Autor); Wind, Martin (Hrsg.); Krüger, Detlef (Hrsg.): Handbuch IT in der Verwaltung (Teil III), Springer Berlin Heidelberg, 2006, S. 459.
16
Es bestehen somit keine Abhängigkeiten zu früheren Sicherungen. Daraus ergibt sich ebenfalls eine einfache Verwaltung der Datenträger, da jeden Tag immer die gleiche Anzahl an Datenträger benötigt wird.
Nachteile:
Den Vorteilen stehen auch einige Nachteile gegenüber. Dadurch, dass jedes Mal der komplette Datenbestand gesichert wird, kann der Zeitaufwand, der zum Abschluss der Sicherung benötigt wird, bei großen Datenmengen sehr hoch werden.
Des Weiteren muss sichergestellt sein, dass für die vorhandenen Daten ausreichend Datenträger zur Verfügung stehen. Da jedes Mal der Gesamtdatenbestand gesichert wird, kann die Anzahl der benötigten Datenträger umfangreich werden. Es kann zudem erforderlich sein, auf andere Speichertechnologien zu wechseln, um den Gesamtdatenbestand zu sichern. Ist der Datenbestand zu groß für einen einzelnen Datenträger, muss dieser während der Sicherung durch einen Roboter oder Mitarbeiter gewechselt werden. Steht beides nicht zur Verfügung, kann die Sicherung nicht vollständig abgeschlossen werden. Ein Roboter kostet derzeit ca. 2.500 EUR und birgt somit weitere Kosten. 38 Der Wechsel des Speichermediums ist ebenfalls mit nicht unerheblichen Kosten verbunden. Werden beispielsweise aus
Kapazitätsgründen neue Medien angeschafft, muss in den meisten Fällen ebenfalls in ein neues Bandlaufwerk investiert werden, um von der erhöhten Kapazität zu profitieren.
Zudem können Datenträger mit höherer Kapazität deutlich teurer sein als die bisher verwendeten Medien. Ein Datenträger der Generation LTO4 kostet rund doppelt soviel wie ein Datenträger der Generation LTO2 und LTO3. 39
38 Vgl. Hewlett-Packard GmbH (Hrsg.): Tape Autoloaders auf einen Blick, http://h10010.www1.hp.com/wwpc/de/de/sm/WF25a/12169-304612-82176-82176-82176-3319912.html (05.07.2009).
39 Vgl. Preisvergleich Internet Services AG (Hrsg.): LTO-Medien Preise, http://geizhals.at/deutschland/?
cat=zip&sort=p&bpmax=&asuch=LTO&v=e&pixonoff=on&filter=+Liste+aktualisieren+&bl1_id=100 &xf= (05.07.2009).
17
Inkrementelle Sicherung und Wiederherstellung
Die inkrementelle Sicherung ist ein zuwachsorientiertes Verfahren. Dieses Verfahren bezeichnet eine Vorgehensweise, bei der jeweils immer nur die Änderungen seit der letzten Sicherung gespeichert werden. Zu Beginn einer Reihe von inkrementellen Sicherungen steht immer eine Vollsicherung.
Bildlich kann dies in Form einer Treppe beschrieben werden. Am Anfang der Treppe befindet sich die Basis (in diesem Fall die Vollsicherung) und die schrittweisen Änderungen entsprechen jeweils eine Stufe dieser Treppe.
Sollen nun Daten eines bestimmten Zeitpunktes zurückgesichert werden, ist es erforderlich, die Treppe Stufe für Stufe herab zu schreiten, bis der gewünschte Sicherungszeitpunkt erreicht ist.
Vorteile:
Reicht bei großen Datenmengen das Zeitfenster oder die Anzahl der benötigten Datenträger nicht für eine tägliche Vollsicherung aus, könnte durch das Verfahren der inkrementellen Sicherung dennoch eine tägliche Sicherung durchgeführt werden.
Eine Vollsicherung kann so z.B. einmal wöchentlich über das Wochenende erfolgen, da am Wochenende das Zeitfenster zum Abschluss der Sicherung größer ist. Die anschließenden inkrementellen Änderungen werden dann während des Verlaufs der Woche gesichert.
Nachteile:
Der Nachteil dieser Sicherungsart ist, dass jeweils immer alle Medien bis zum gewünschten Wiederherstellungszeitpunkt verfügbar, lesbar und mit den korrekten Daten versehen sein müssen, da sonst eine Wiederherstellung nicht möglich ist. Wird am Freitag einer jeden Woche jeweils immer eine Vollsicherung durchgeführt und an den Arbeitstagen eine inkrementelle Sicherung, werden sämtliche Datenträger bis zum vergangenen Montag benötigt, wenn eine Datei dieses Tages zurückgesichert werden soll.
18
Fehlt ein Datenträger oder wurde versehentlich eine Sicherung auf einen falschen Datenträger durchgeführt, beispielsweise die Sicherung vom Donnerstag auf den Datenträger vom Dienstag, ist die Datei nicht wiederherstellbar. 40 Eine Veranschaulichung ist in Abbildung 3.1 dargestellt.
Differenzielle Sicherung und Wiederherstellung
Bei der differenziellen Sicherung werden jeweils immer die Unterschiede im Hinblick auf die letzte Vollsicherung gespeichert.
Vorteile:
Zur Wiederherstellung werden immer nur der aktuelle differenzielle Datenträger und der Datenträger der letzten Vollsicherung benötigt. Daher besteht nur eine Abhängigkeit zum Datenträger der Vollsicherung im Gegensatz zur inkrementellen Sicherung. Bei der inkrementellen Sicherung besteht eine Abhängigkeit zu jedem Datenträger bis zur letzten Vollsicherung.
40 Vgl. Microsoft Corp. (Hrsg.): KB136621, Knowledgebase, Revision 1.1 vom 15. November 2006, http://support.microsoft.com/?scid=kb%3Ben-us%3B136621&x=21&y=16 (05.07.2009).
19
Nachteile:
Die Datenmenge der einzelnen differenziellen Sicherungen bis zur nächsten Vollsicherung ist nicht konstant und wächst stetig an. Die Differenzen - basierend zur letzten Vollsicherung - werden ebenfalls größer, je mehr mit den Daten gearbeitet wurde. Die Zeit und ggf. die Anzahl der Datenträger, welche zur Sicherung benötigt werden, steigt mit jeder Sicherung an. Diese Annahme gilt unter der Voraussetzung, dass die Daten geändert wurden. Gibt es hingegen keine Änderung der Daten, bleibt auch die Differenz zur Vollsicherung konstant. Abbildung 3.2 veranschaulicht dies.
3.1.2 Exakte Wiederherstellung zum Zeitpunkt des Verlustes
Ausgehend von den in Kapitel 3.1.1 vorgestellten Verfahren, inkrementelle und differentielle Sicherungen, ergibt sich folgende Problematik: Daten, welche zwischen den einzelnen Sicherungen gelöscht wurden, werden bei einer Wiederherstellung ebenfalls restauriert. Dieses Phänomen wird dann deutlich, wenn z.B. aufgrund eines Dateisystemfehlers der komplette Inhalt einer Partition wiederhergestellt werden muss.
20
In den seltensten Fällen möchte man ebenfalls die Dateien wiederhergestellt wissen, welche bewusst gelöscht worden sind. Das Aussortieren alter Dateien bedeutet zusätzlichen Aufwand und führt zu Unübersichtlichkeit. Eine
Datensicherungssoftware, welche hierfür eine Abhilfe geschaffen hat, ist Bacula. Der Vorteil der exakten Wiederherstellung wird sich allerdings durch eine höhere Prozessor- und Speicherauslastung des Systems erkauft. Dies ist darin begründet, dass die Listen der gelöschten Dateien im Speicher vorgehalten werden müssen und bei jeder Wiederherstellung einer Datei überprüft werden muss, ob diese Datei bereits vor der Sicherung gelöscht wurde. 41
3.1.3 Online- und Offline-Sicherung
Online-Sicherung
Mit dem Begriff Online-Sicherung ist hier nicht gemeint, dass Sicherungen über das Internet auf andere Orte übertragen werden, sondern vielmehr Online-Sicherung als technische Implementierung. Online-Sicherungen kommen im Zusammenhang mit DBMS (Datenbank Management Systemen) zum Einsatz. Die Online-Sicherung wird in der Literatur auch als Hot-Backup bezeichnet. 42 Sie stellt eine Möglichkeit dar, Inhalte im laufenden Betrieb zu sichern. Dies bedeutet, dass eine konsistente Sicherung erfolgen kann, obwohl der Anwender mit der Datenbank arbeitet. Das Arbeiten mit der Datenbank kann allerdings für die Dauer der Sicherung eingeschränkt sein.
Online-Sicherungen sind in jenen Fällen sinnvoll, bei denen eine Datenbank rund um die Uhr in Betrieb ist (z.B. Online-Shop). Damit Online-Sicherungen funktionieren können, muss eine Unterstützung seitens des Datenbanksystems gegeben sein. Um eine Online-Sicherung und Wiederherstellung zu ermöglichen, gibt es mehrere Verfahren, welche unter dem Begriff ARIES (Algorithms for Recovery and Isolation Exploiting Semantics) zusammengefasst sind. Diese sind u.a. von C. Mohan in seinem Paper „Repeating History Beyond ARIES“ aufgeführt.
41 Vgl. Sibbald, Kern: Bacula Concepts and Overview Guide, Version 3.0.2 vom 01. Juli 2009, http:// bacula.org/manuals/en/concepts/concepts.pdf (12.07.2009), S. 13.
42 Vgl. Yeung, Albert K. W.; Hall, G. Brent: Spatial Database Systems: Design, Implementation and Project Management, Springer, 2007, S. 37.
21
Das ARIES-Prinzip ist in seiner Konzeption nicht nur auf Datenbanken beschränkt, sondern kann dabei auch für andere Einsatzbereiche wie z.B. Dateisysteme verwendet werden. Dieses ist in der Praxis auch der Fall. 43 Zu erwähnen ist, dass für die Möglichkeit der Online-Sicherung eine derartige Funktion in der Anwendungssoftware bzw. in dem Datenbankmanagementsystem implementiert sein muss. Ein gebräuchlicher Ansatz für die Online-Sicherung ist das WAL-Verfahren (Write Ahead Log). Bei diesem Verfahren werden, bevor Änderungen in die Datenbank geschrieben werden, diese zuerst in eine Protokolldatei übertragen. 44
Konkret soll dies am Beispiel des Datenbankmanagementsystems PostgreSQL verdeutlicht werden. Änderungen, welche während der Sicherung der Datenbank geschehen, werden im Anschluss an die Sicherung zusammen mit der Protokoll-Datei gespeichert. Die Protokolldatei enthält die Änderungen von Beginn bis Ende der Sicherung. Dafür wird dem Datenbanksystem vor Beginn der Sicherung mitgeteilt, dass eine Sicherung stattfindet. Der Zeitpunkt, zu welchem die Sicherung beendet wurde, wird abschließend dem Datenbanksystem ebenfalls berichtet. Nach Beendigung der Sicherung stellt das PostgreSQL-System die Protokolldatei bis zum Endzeitpunkt der Sicherung für die sofortige Speicherung zur Verfügung. Wird diese Datei zusammen mit der eigentlichen Sicherung der Datenbank gespeichert, können die Daten konsistent bis zur Beendigung der Sicherung wiederhergestellt werden. 45
Nach Abschluss der Gesamtsicherung bietet die Online-Sicherung in der Datenbanktechnik den Vorteil, dass die meist kleineren Transaktionsprotokolldateien später separat gesichert werden können. Mittels der Transaktionsprotokolldatei kann die Datenbank auch zu einem späteren Zeitpunkt als die ursprüngliche Vollsicherung wiederhergestellt werden (Point-in-Time Recovery).
43 Vgl.
Mohan, C.:
Repeating History Beyond ARIES, Proceedings of 25th International Conference on Very Large Databases, 1999.
44 Vgl. Saake, Gunter; Heuer, Andreas; Sattler, Kai-Uwe: Datenbanken: Implementierungstechniken, 2. Auflage, mitp-Verlag, Bonn, 2005, S. 618 - 621.
45 Vgl. PostgreSQL Global Development Group (Hrsg.): PostgreSQL 8.4 Handbuch, http://www.postgresql.org/files/documentation/pdf/8.4/postgresql-8.4.0-A4.pdf (22.07.2009), S. 466.
22
Das Transaktionsprotokoll zeichnet sämtliche Änderungen an der Datenbank auf. Aus diesem Grunde ist es möglich, nach Einspielen einer Sicherung sämtliche danach durchgeführten Änderungen bis zur letzten in der Datei aufgezeichneten Transaktion wieder in die Datenbank einzubringen. 46
Offline-Sicherung
Theoretisch könnte davon ausgegangen werden, dass die Offline-Sicherung das Gegenteil der Online-Sicherung darstellt. Dies erfordert allerdings eine etwas differenziertere Betrachtung. Bei der Offline-Sicherung, in der Literatur auch als Cold-Backup bezeichnet, ist das System entweder nicht im Betriebszustand oder es ist nur ein lesender Zugriff für den Anwender möglich. 47 Obwohl der Begriff Offline-Sicherung verwendet wird, ist potentiell ein Arbeiten mit dem System möglich.
Wird eine Offline-Sicherung von einem Betriebssystem erstellt, kann logischerweise nicht mit dem System gearbeitet werden. Das Betriebssystem ist nicht hochgefahren, wenn eine Backup-Software von CD zwecks Sicherung des Systems gestartet wurde. Diese Art der Sicherung wird allgemein auch als Image bezeichnet, da ein Eins-zu-eins-Abbild der gesamten Festplatte erstellt wird. Es gibt eine Vielzahl an Softwarelösungen für die Erstellung eines Betriebssystem-Images, wie z.B. Acronis oder True Image. 48 Das Durchführen einer Offline-Sicherung eines kompletten Rechners kann dann erforderlich sein, wenn nicht sichergestellt werden kann, dass andernfalls eine konsistente Sicherung möglich ist. Mit der Sicherung eines kompletten Rechners im laufenden Betrieb haben derzeit auch aktuelle Software-Produkte immernoch ihre Schwierigkeiten. Eine Offline-Sicherung ist im Zweifelsfall einer anderen Lösung vorzuziehen. 49
46 Vgl. Störl, Uta: Backup und Recovery in Datenbanksystemen, 1. Auflage, B.G. Teubner, 2001, S. 128 - 134.
47 Vgl. Störl, Uta: Backup und Recovery in Datenbanksystemen, 1. Auflage, B.G. Teubner, 2001, S. 27 (Als Abgrenzung zum Online Backup).
Vgl. Yeung, Albert K. W.; Hall, G. Brent: Spatial Database Systems: Design, Implementation and Project Management, Springer, 2007, S. 37.
48 Vgl. Acronis Germany GmbH (Hrsg.): Acronis True Image Home 2009 Handbuch, http://de1.download.acronis.com/sl/UmmskeNob81lxkDCe9XKdQ0u(cw9ofWmVd7vxbnezp0/p/pd f/UG_ATIH2009_DE.pdf (11.07.2009), S. 112.
49 Vgl. Violka, Karsten: Schnappschuss-Sicherung, c't Heft 20 Jahrgang 2008, Heise Zeitschriften Verlag GmbH & Co. KG, 2008, S. 152 - 159
23
3.1.4 Verfahren zur Sicherung unterschiedlicher Datenbestands-versionen
In diesem Kapitel sollen derzeit gängige Verfahren zur Sicherung von unterschiedlichen Datenbestandsversionen dargestellt werden.
Unter Versionen werden im Folgenden Datenbestände in der Form verstanden, wie sie zum jeweiligen Zeitpunkt der Sicherung vorhanden waren. Dies ist beispielsweise der Inhalt eines Word Dokumentes zum Zeitpunkt der Sicherung. Verschiedene Versionen von Datenbeständen können dann sinnvoll sein, wenn ein Fehler erst später bemerkt wird als zu dem Zeitpunkt, an dem er entstanden ist. Das Aufbewahren mehrerer Versionen hilft für den Fall, dass eine Datei gelöscht wird und dies erst später, z.B. nach Rückkehr des zuständigen Mitarbeiters aus seinem Urlaub, bemerkt wird. Angenommen, ein Mitarbeiter löscht vor Antritt seines Jahresurlaubs aus Unachtsamkeit eine wichtige Kundenkartei und bemerkt dies erst nach seiner Rückkehr, nützt es wenig, wenn das Medium, auf dem die Daten gesichert werden, jeden Tag überschrieben wird.
Grandfather, Father, Son
Das GFS-Prinzip (Grandfather Father Son) ist ein gebräuchliches und einfaches Verfahren zur Sicherung unterschiedlicher Datenbestandsversionen. Dabei spiegeln die drei Begriffe Grandfather, Father und Son die Generationen der Daten wieder, also die Dauer bis zur Wiederverwendung. Ausgehend hiervon gibt es Medien für die tägliche, wöchentliche und monatliche Sicherung.
Die täglichen Medien reflektieren in diesem Modell den Sohn, da sie das kleinste Intervall bis zur Wiederverwendung aufweisen. Analog hierzu werden die wöchentlichen Sicherungen als Vater und die monatlichen Sicherungen als Großvater abgebildet. Es ist dabei unerheblich, ob die monatlichen Sicherungen zu Anfang oder zum Ende eines Monats durchgeführt werden. 50
50 Vgl. Wald, Egbert: Backup und Disaster Recovery, 1. Auflage, mitp-Verlag, Bonn, 2002, S.146. Vgl. Fritchman Thompson, Barbara: PC hardware in a nutshell, 3. Auflage, O'Reilly, 2003, S. 309.
24
Insgesamt wird somit eine Medienzahl von 21 Stück erreicht: Vier tägliche Medien, fünf wöchentliche Medien (es gibt Monate mit fünf Freitagen) sowie zwölf monatliche Medien.
Der Verfasser bevorzugt bei seinen Kunden jedoch eine leicht abgewandelte Form der GFS-Rotation. Hierbei werden tägliche Sicherungen von Montag bis Donnerstag durchgeführt, freitags werden wöchentliche Sicherungen vollzogen und am letzten Freitag eines jeden Monats erfolgt die monatliche Sicherung. Diese Variante hat sich unter anderem deshalb bewährt, da die meisten Unternehmen aus dem Kundenstamm des Verfassers lediglich von Montag bis Freitag arbeiten. Somit wird vermieden, dass eine Monatssicherung nicht durchgeführt wird, wenn das Monatsende auf einen Sonntag fällt.
Es empfiehlt sich jedoch, auch für den Jahresabschluss ein Medium bereitzuhalten, um das abgelaufene Geschäftsjahr in Gänze zu sichern.
Nachteilig wirkt sich allgemein bei der GFS-Rotation hingegen aus, dass durch die unterschiedlichen Sicherungsintervalle die Medien ungleichmäßig abgenutzt werden. Folglich müssen die Medien aufgrund von Verschleiß unterschiedlich häufig ausgewechselt werden. 51
Towers of Hanoi
Ein weiteres, jedoch komplizierteres Verfahren stellen die Towers of Hanoi dar, welche angelehnt an das gleich lautende Spiel ihre Bezeichnung erhalten haben. 52 Bei den Towers of Hanoi wird auf unterschiedlichen Mediensätzen jeweils in festen Abständen mit unterschiedlich großen Intervallen gesichert. Dazu muss zu Beginn bekannt sein, wie viele Mediensätze verwendet werden sollen, um die unterschiedlichen Intervalle zwischen den einzelnen Mediensätzen zu ermitteln.
51 Vgl. Fritchman Thompson, Barbara: PC hardware in a nutshell, 3. Auflage, O'Reilly, 2003, S. 309.
52 Vgl. Byron S., Gottfried: Schaum's outline of theory and problems of programming with C, 2. Auflage, McGraw-Hill Professional, 1996, S. 196.
25
Ausgehend von fünf Mediensätzen, welche mit den Buchstaben A - E gekennzeichnet sind, startet A am Tag eins, B an Tag zwei, C an Tag vier, D an Tag acht und E an Tag 16. Danach wird die Abfolge periodisch, sodass auf A alle zwei, auf B alle vier, auf C alle acht, auf D alle 16 und auf E alle 32 Tage gesichert wird. Die Mediensätze D und E werden im Wechsel eingesetzt, da es andernfalls zu Überschneidungen käme.
Durch Hinzunahme eines weiteren Mediensatzes kann der Zeitraum, bis zu dem Daten zurückgesichert werden können, verdoppelt werden. An den Tagen, an denen sich die Mediensätze D und aufwärts überschneiden, werden diese abwechselnd beschrieben. 53
Aus der vorangegangenen Beschreibung folgt, dass bereits mit wenigen Mediensätzen eine Sicherungsstrategie umgesetzt werden kann. Überwiegen die Kriterien für die Investitionskosten der Medien gegenüber einer garantiert langfristigen Rücksicherbarkeit, wie sie beim Grandfather, Father, Son-Prinzip gegeben ist, kann der Einsatz des Verfahrens Towers of Hanoi sinnvoll sein. Nachteilig wirkt sich bei dieser Methode der hohe Verschleiß der A-Mediensätze aus, da diese sehr häufig verwendet werden. Das Verfahren ist in Abbildung 3.3 dargestellt.
53 Vgl. Wald, Egbert: Backup und Disaster Recovery, 1. Auflage, mitp-Verlag, Bonn, 2002, S.147 - 148.
26
Arbeit zitieren:
Carsten Menke, 2009, Entwicklung einer Datensicherungsappliance für kleine und mittelständische Unternehmen, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Konzeptionen zur Datensicherung, insbesondere mit RAID und für ununter...
Informatik - Wirtschaftsinformatik
Hausarbeit (Hauptseminar), 30 Seiten
Datensicherheit und Datenschutz als immer größer werdende Herausforder...
Seminararbeit, 22 Seiten
Formatvorlage (Microsoft Word) für eine Diplomarbeit, Masterarbeit, Ha...
Für MS Word 2003 - Update 2010
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Formatvorlage (OpenOffice) für eine Diplomarbeit, Masterarbeit, Hausar...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 35 Seiten
Formatvorlage / Vorlage zur Erstellung einer Diplomarbeit, Bachelorarb...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 15 Seiten
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Für MS Word 2007 - dotx
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 25 Seiten
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wisse...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 20 Seiten
Erstellen einer schriftlichen Hausarbeit
Vorlagen, Muster, Formulare, Infobroschüren
Hausarbeit, 14 Seiten
Grundtechniken wissenschaftlichen Arbeitens
Bibliografieren - Reden - Schr...
Vorlagen, Muster, Formulare, Infobroschüren
Skript, 46 Seiten
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - ...
Vorlagen, Muster, Formulare, Infobroschüren
Ausarbeitung, 39 Seiten
Informatik - Angewandte Informatik: neuer Titel erschienen: Entwicklung einer Datensicherungsappliance für kleine und mittelständische Unternehmen
Carsten Menke hat einen neuen Text hochgeladen
Arbeits- und Gesundheitsschutz in klein- und mittelständischen Unterne...
Praktische Umsetzung rechtlich...
Mathias Bauer, Alois Engeldinger
Internationalisierung der Absatzmärkte für kleine und mittelständische...
Erfolgsfaktoren für KMU
Phillipp Kruse
Liquiditätsmanagement für mittelständische Unternehmen
Wie Sie Liquiditätsenge vermei...
Christoph Graf von Bernstorff
Profitables After-Sales-Business für kleine und mittelständische Unter...
Kunden binden und lukrative Na...
Hans Fischer
Unternehmenskooperation für kleine und mittelständische Unternehmen
Lösungen für die Praxis
Stephan Killich, Holger Luczak
Die Freude am Unternehmertum in kleinen und mittleren Unternehmen
Ergebnisse einer Quer- und Län...
Christina Stadler
0 Kommentare