Im Universitätsklinikum X steigen die Datenspeicheranforderungen sehr schnell. Die neuen Daten sind dateibasiert und unstrukturiert. Dieses rasante Datenwachstum belastet die begrenzten IT-Ressourcen und steigert die Managementkomplexität. Des Weiteren muss abgewogen werden, wie sich die Kosten für die Speicherung von Archivdaten mit einem schnellen Zugriff in Einklang bringen lassen. Um sich diesen Herausforderungen zu stellen, setzt das Universitätsklinikum zukünftig auf eine Scale-out-Data-Lake1 Lösung von Dell, die EMC Isilon.
Die EMC Isilon ist eine einfach zu bedienende, hochgradig skalierbare und effiziente Data-Lake-Platform. Darüber hinaus bildet sie eine ideale Hardware-Grundlage für die Multiprotokollaufnahme von Daten. Das ist eine wichtige Funktion in Big Data-Umgebungen, in denen Daten schnell und zuverlässig über verschiedene Protokolle aufgenommen werden müssen, die dem Workload, der die Daten erzeugt, am nächsten kommen.
Im Rahmen des Projektes soll ein Konzept für die Snapshots erarbeitet werden. Dabei kommt es darauf an, dass die Daten redundant und an verschiedenen Standorten gespeichert werden. Das Anlegen, Speichern und Löschen von Snapshots sollen dabei Inhalte des Konzeptes sein. Die Prüfung des Konzepts wird dabei vom IT-Leiter übernommen. Am Ende werden die Server-Administratoren, mit den nötigen Rechten ausgestattet, die Installation vornehmen. Nach Abschluss des Projektes soll es möglich sein, sekundenschnell zu einem früheren Datenstand (Snapshot) zu gelangen. Aktuell ist dies nur mit einem hohen Zeitaufwand möglich.
Inhaltsverzeichnis
1. Projektdefinition
1.1 Projektumfeld
1.2 Ist-Analyse
1.3 Soll-Konzept
1.4 Projektphasen
2. Planung
2.1 Replikation über SyncIQ
2.2 SnapshotIQ
2.3 SnapshotIQ Zeitintervall-Konzept
3. Durchführung
3.1 Konfiguration des SyncIQ
3.2 Konfiguration des SnapshotIQ
3.5 Test
4. Projektergebnis und Fazit
Zielsetzung & Themen
Das primäre Ziel dieses Projekts ist die Konzeption und Implementierung einer effizienten Snapshot-Lösung auf Basis von Dell EMC Isilon-Systemen, um die Datenverfügbarkeit zu erhöhen und eine schnelle Wiederherstellung bei Datenverlust zu gewährleisten.
- Implementierung von EMC Isilon für ein Scale-out-Data-Lake-Szenario
- Konfiguration von SyncIQ für eine redundante, standortübergreifende Datenreplikation
- Erarbeitung eines SnapshotIQ-Zeitintervall-Konzepts zur Optimierung von Recovery Point Objectives
- Praktische Durchführung der Systemkonfiguration und erfolgreiche Validierung der Wiederherstellungsprozesse
Auszug aus dem Buch
2.2 SnapshotIQ
Was ist ein Snapshot und warum braucht man ihn?
Ein Snapshot ist ein Point-In-Time-Picture² eines Verzeichnisses. Snapshots sorgen für eine deutliche Verbesserung der Häufigkeit und Zuverlässigkeit von Backups, weil sie einen minimalen Performance Overhead verursachen und sicher auf einem Produktionscluster erstellt werden können.
Warum braucht man einen Snapshot?
Ein Snapshot ermöglicht die schnelle Wiederherstellung einer verlorengegangen oder beschädigten Datei.
Was ist SnapshotIQ?
Das Feature SnapshotIQ ist eine einfache, skalierbare und flexible Option, mit der man eine Snapshot-Datensicherung der Enterprise-Klasse aktivieren kann. Mit SnapshotIQ kann man mit geringen Auswirkungen häufige Backups von Dateien durchführen.
Wie funktioniert Snapshot IQ?
SnapshotIQ überwindet die Einschränkungen herkömmlicher Ansätze durch eine zuverlässige Verteilung einer hoch skalierbaren Anzahl von Snapshots über mehrere, hochverfügbare Isilon-Scale-Out-Store-Nodes³. Das Ergebnis ist eine bemerkenswert einfache, hoch skalierbare und effiziente Daten-Backup- und -Recovery-Funktion, die es ermöglicht, die anspruchsvollen Anforderungen an die Datenverfügbarkeit zu erfüllen.
Sobald ein Basis-Snapshot eingerichtet ist, werden nur Änderungen an Blöcken einer Datei in Updates der aktuellen Snapshot-Version wiedergegeben. Damit ist eine höchst effiziente Snapshot-Speicherauslastung möglich. Da Snapshots ein wesentlicher Bestandteil des OneFS-Dateisystems sind, ist darüber hinaus keine Vorabzuweisung von dediziertem, für Snapshots reserviertem Speicherplatz, erforderlich.
Zusammenfassung der Kapitel
1. Projektdefinition: Einleitung in das IT-Projektumfeld bei einem Universitätsklinikum sowie Analyse der Herausforderungen durch wachsendes, unstrukturiertes Datenvolumen.
2. Planung: Erarbeitung der Strategien zur Datenreplikation mittels SyncIQ und Entwicklung eines Snapshot-Konzepts zur Sicherstellung der Datenwiederherstellung.
3. Durchführung: Detaillierte Beschreibung der praktischen Einrichtung und Konfiguration von SyncIQ-Richtlinien sowie SnapshotIQ-Zeitplänen im OneFS-Betriebssystem.
4. Projektergebnis und Fazit: Zusammenfassende Bewertung der erreichten Ziele, der erfolgreichen Implementierung und Ausblick auf zukünftige Optimierungsmöglichkeiten der Infrastruktur.
Schlüsselwörter
EMC Isilon, SnapshotIQ, SyncIQ, OneFS, Data Lake, Datensicherung, Wiederherstellung, Recovery Point Objective, Datenreplikation, Storage-Infrastruktur, Scale-out, IT-Service, Hochverfügbarkeit, Datenspeicher, Krankenhaus-IT
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit beschäftigt sich mit der Implementierung einer hochverfügbaren Storage-Infrastruktur auf Basis von EMC Isilon zur Bewältigung steigender Datenanforderungen.
Was sind die zentralen Themenfelder?
Die zentralen Felder sind die automatisierte Datenreplikation und das effiziente Management von Snapshots für eine schnelle Datenwiederherstellung.
Was ist das primäre Ziel des Projekts?
Das Ziel ist die Sicherstellung der Datenverfügbarkeit und der Schutz vor Datenverlust durch ein standortübergreifendes Snapshot-Konzept.
Welche wissenschaftliche Methode wurde verwendet?
Es wurde eine projektbezogene Methodik angewandt, die von der Ist-Analyse über ein Soll-Konzept bis hin zur praktischen Durchführung und abschließenden Testphase reicht.
Was wird im Hauptteil behandelt?
Der Hauptteil erläutert die technischen Konfigurationsschritte von SyncIQ und SnapshotIQ innerhalb der OneFS-Oberfläche.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit lässt sich maßgeblich durch Begriffe wie EMC Isilon, Data Lake, SnapshotIQ, SyncIQ und Datenverfügbarkeit charakterisieren.
Warum wurde für die Replikation "Synchronize" als Action gewählt?
Der Modus "Synchronize" wurde gewählt, um eine exakte Kopie des Quellclusters beizubehalten, bei der gelöschte Quelldateien auch im Zielverzeichnis entfernt werden.
Wie unterscheidet sich der gewählte erste Zeitintervall-Vorschlag vom zweiten?
Der erste Vorschlag reduziert die Anzahl der Snapshots auf 35 pro System, was eine einfachere Verwaltung bei hoher Effizienz für das Krankenhaus-Umfeld ermöglicht.
Was ist bei einem Totalausfall eines Clusters laut Dokumentation möglich?
Durch die asynchrone Replikation via SyncIQ kann der laufende Betrieb aufrechterhalten werden, auch wenn ein Isilon-Cluster ausfällt.
- Arbeit zitieren
- Anonym (Autor:in), 2018, EMC Isilon als Grundlage für einen Scale-out-Data-Lake mit sofortiger Snapshot-Wiederherstellungen nach Bedarf, München, GRIN Verlag, https://www.grin.com/document/510926