Hiermit erkläre ich, dass ich die vorliegende Arbeit mit dem Thema
„Konzeptionelle Überlegungen zu Information Lifecycle Management“
selbstständig und ohne Benutzung anderer als der angegebenen Quellen und Hilfsmittel angefertigt habe.
Alle Stellen, die wörtlich oder sinngemäß aus veröffentlichten und nicht veröffentlichten Schriften entnommen wurden sind als solche kenntlich gemacht.
Die Arbeit ist in gleicher oder ähnlicher Form oder auszugsweise im Rahmen einer anderen Prüfung noch nicht vorgelegt worden.
Efringen-Kirchen, den 20.08.2004
Der Textteil der vorliegenden Arbeit - beginnend mit der Einleitung bis ausschließlich
Quellenverzeichnis - umfasst 12 716 Wörter.
Kurzfassung
In den letzten Jahren mussten sich IT-Verantwortliche immer weniger über mangelnde Rechenleistung ihrer Infrastruktur Gedanken machen - jedoch immer mehr über einen Mangel an Speicherplatz. Dies wird hervorgerufen durch ein immenses Datenwachstum, welches sich zum einen aus immer neuen betriebswirtschaftlich notwendigen Applikationen (z.B. CRM, Data Warehouse) ergibt, und welches durch neue gesetzliche Bestimmungen zur Datenhaltung und Datenarchivierung zusätzlich noch verstärkt wird. Auch durch den zunehmenden Kostendruck sind deshalb neue Lösungen gefragt, die die Speicherhersteller in Form von ILM liefern.
Dieses erinnert stark an das traditionelle Hierarchical Storage Management (HSM), bei dem Informationen über die Zugriffshäufigkeiten und das Alter von Daten gesammelt werden und diese dann gemäß diesen Informationen, und damit gemäß ihrer Wichtigkeit, auf hochverfügbarem oder aber auf billigerem Speicher abgelegt werden. Das Neue an ILM ist jedoch, dass sich dies nicht auf einen Großrechner beschränkt, sondern dass dieses Konzept auf die komplette Speicher-Infrastruktur, im Idealfall in einem SAN, angewandt wird. Außerdem spielen bei der Klassifikation der Daten noch weitere Aspekte eine Rolle, z.B. die Unterstützung von Geschäftsprozessen.
Das Thema ILM ist noch so jung, dass noch längst nicht alle Teilaspekte dieser großen ILM-Vision technisch realisiert und verfügbar sind. Diese Arbeit gibt einen Überblick über ILM, sowohl was die bereits eingesetzten Aspekte betrifft, als auch jene Aspekte, die sich noch in der Entwicklung befinden. Des Weiteren wird ein Teilaspekt im Rahmen einer betrieblichen Problemstellung genauer betrachtet. Bei der Hoffmann-La Roche AG gibt es einen Einsparungsbedarf im Bereich Windows-Fileservices. Hierzu wurde die Software „File Lifecycle Manager“ von Nuview hinsichtlich Technik und Kosten/Nutzen evaluiert.
In dieser Arbeit wird gezeigt, dass ILM einen interessanten Ansatz darstellt, der die Speicherwelt zwar nicht revolutioniert, der jedoch für jeden IT-Verantwortlichen mindestens eine Überlegung wert ist.
Inhaltsverzeichnis
Ehrenw örtliche Erklärung. 2
Kurzfassung. 3
Abk ürzungsverzeichnis 7
Abbildungsverzeichnis 9
Tabellenverzeichnis. 10
Anlagenverzeichnis. 11
1 Einleitung 12
1.1 Motivation 12
1.2 Problemstellung und -abgrenzung 13
1.3 Ziel der Arbeit 13
1.4 Vorgehen 14
2 Grundlagen. 15
2.1 Der Produktlebenszyklus 15
2.1.1 Vorbemerkung 15
2.1.2 Die vier Phasen des Produktlebenszyklus. 15
2.1.3 Einflussfaktoren 18
2.1.4 Product Lifecycle Management (PLM) 20
2.1.5 Kritik am Produktlebenszyklus-Konzept. 20
2.2 Technische Grundlagen. 21
2.2.1 Speichermedien 21
2.2.2 Speichertechnologien 22
2.2.2.1 Direct Attached Storage (DAS) 22
2.2.2.2 Network Attached Storage (NAS) 23
2.2.2.3 Storage Area Network (SAN) 24
2.2.3 Arten von Daten 25
3 Problemanalyse 26
3.1 Datenwachstum. 26
3.2 Administration 26
3.3 Gesetzliche Regelungen 27
3.4 Kosten 27
3.5 Upgrade-Strategien 28
3.6 Zusammenfassung. 28
4 Information Lifecycle Management 29
4.1 Überblick: Der Lebenszyklus von Informationen 29
4.2 Das IL-MKonzept 29
4.2.1 Systems Managed Storage. 29
4.2.2 Das Neue an ILM 29
4.2.2.1 Lebenszyklen 29
4.2.2.2 Bezug zu Geschäftsprozessen 30
4.2.2.3 Speichernetzwerke. 31
Konzeptionelle Überlegungen zu Information Lifecycle Management 4
4.2.3 Klassifikation der Daten 31
4.2.4 Storage-Management 31
4.2.5 Begriffe. 32
4.2.6 Kann man ILM kaufen? 32
4.3 Notwendige Schritte für ILM. 33
4.3.1 Notwendige Infrastruktur. 33
4.3.2 Der Weg zu unternehmensweitem ILM. 33
4.4 Strategie zur Einführung von ILM 34
4.5 Bereits verfügbare Lösungen. 35
4.6 Noch zu lösende Probleme 36
4.7 Zusammenfassung. 36
5 Vorbereitung der Evaluation 37
5.1 Vorbemerkung 37
5.2 Projektplan. 37
5.3 Analyse der Umgebung und Bedarfsermittlung. 38
5.3.1 NAS-Cluster 38
5.3.2 Redundanz und Ausfallsicherheit 39
5.3.3 Platzaufteilung 40
5.3.4 Distributed File System (DFS) 41
5.3.5 Backup und Snapshots 41
5.3.6 Bedarfsermittlung. 43
5.4 Auswahl geeigneter Lösungen 43
5.4.1 Marktüberblick 43
5.4.2 Fazit 45
5.5 Implementierung 45
6 Evaluation File Lifecycle Management 46
6.1 Überblick über die Vorgehensweise 46
6.2 Funktionsweise 46
6.3 Übersicht über die Konfigurationsparameter 49
6.3.1 Allgemeine Einstellungen 49
6.3.2 Active-Storage-Konfiguration 49
6.3.3 Regeln und Policies 49
6.4 Erarbeiten einer „optimalen“ Konfiguration 50
6.4.1 Vorbemerkung 50
6.4.2 Anzahl der Speicher-Ebenen 50
6.4.3 Klassifikation der Dateien 51
6.4.3.1 Nach betrieblicher Relevanz 51
6.4.3.2 Nach Alter. 51
6.4.3.3 Beispiel einer Analyse 53
6.4.3.4 Zusammenfassung. 54
6.5 Auswirkungen auf die Datensicherheit 54
6.6 Auswirkungen auf die Kosten 55
6.6.1 Vorbemerkung 55
6.6.2 Migration von 50 der Daten 55
6.6.3 Migration von 70 der Daten 57
6.6.4 Business Continuity 58
6.6.5 Zusammenfassung 58
Konzeptionelle Überlegungen zu Information Lifecycle Management 5
6.7 Ergebnis und Fazit 59
7 Zusammenfassung und Ausblick 60
Quellenverzeichnis. 62
Stichwortverzeichnis. 66
Anhang 68
Konzeptionelle Überlegungen zu Information Lifecycle Management 6
Abkürzungsverzeichnis
API Advanced Programming Interface
CAD Computer Aided Design
CIFS Common Internet File System
CRM Customer Relationship Management
DAS Direct Attached Storage
DFS Distributed File System
DLM Data Lifecycle Management
ERP Enterprise Resource Planning
FLM File Lifecycle Management
GDPdU Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen
HSM Hierarchical Storage Management
IDE Integrated Drive Electronics
IDM Intelligent Data Management
ILM Information Lifecycle Management
ILMI Information Lifecycle Management Initiative
IP Internet Protocol
iSCSI Internet SCSI
MAC Media Access Control
NAS Network Attached Storage
NFS Network File System
RAID Redundant Array of Independent (Inexpensive) Disks
RAM Random Access Memory
ROI Return on Investment
SAN Storage Area Network
SCSI Small Computer System Interface
SMS Systems Managed Storage
SNIA Storage Network Industry Association
SRM Storage Resource Management
UNC Universal Naming Convention
XML eXtensible Markup Language
Abbildungsverzeichnis
Abb. 1: Produktlebenszyklus
Abb. 2: Technologiezyklen innerhalb eines Nachfragezyklus
Abb. 3: Speicherhierarchie.
Abb. 4: Direct Attached Storage (DAS)
Abb. 5: Network Attached Storage (NAS)
Abb. 6: Storage Area Network (SAN)
Abb. 7: Der Lebenszyklus von Daten
Abb. 8: Speicherklassen im Lebenszyklus.
Abb. 9: Storage-Management im Informations-Lebenszyklus
Abb. 10: Networked Tiered Storage.
Abb. 11: Anwendungsspezifisches ILM
Abb. 12: Unternehmensweites ILM.
Abb. 13: Projektplan
Abb. 14: NAS-Cluster Architektur
Abb. 15: Volume-Aufteilung eines Cluster-Knotens.
Abb. 16: Snapshot
Abb. 17: Änderung nach Snapshot.
Abb. 18: FL-MArchitektur.
Abb. 19: Ablauf FL-MProzess
Abb. 20: Alter der Dateien.
Abb. 21: Übersicht Struktur der Dateien
Abb. 22: Entwicklung des Platzbedarfs (FLM 50 )
Abb. 23: Entwicklung des Platzbedarfs (FLM 70 )
Konzeptionelle Überlegungen zu Information Lifecycle Management
Tabellenverzeichnis
Seite
Tab. 1: Phasen des Produktlebenszyklus ..................................................................... 18
Tab. 2: Time since written > 20 d .................................................................................. 52
Tab. 3: Time since read > 20 d ..................................................................................... 52
Tab. 4: Entwicklung des Platzbedarfs (FLM 50 %) ....................................................... 56
Tab. 5: Entwicklung des Platzbedarfs (FLM 70%) ........................................................ 57
Tab. 6: Übersicht Kosten............................................................................................... 58
Anlagenverzeichnis
Seite
Anlage 1: Daten - Informationen ................................................................................. 69
Anlage 2: Topologie NAS-Cluster................................................................................. 70
Anlage 3: Installation Nuview FLM............................................................................... 72
Anlage 4: Screenshots Nuview FLM ............................................................................ 73
Anlage 5: Wachstum des Speicherbedarfs .................................................................. 75
Anlage 6: Preisentwicklung von Festplatten ................................................................ 76
1 Einleitung
1.1 Motivation
„640 Kilobyte ought to be enough for anybody.“ Bill Gates, 1981.
Bei diesem Zitat ging es zwar um Arbeits- und nicht um Massenspeicher, dennoch zeigt es sehr deutlich, wie sich in 20 Jahren nicht nur die Technologie selbst geändert hat, sondern auch die Ansprüche, die wir an sie stellen. So können wir heute in der Zeit der Terabytes über ein solches Zitat nur noch lachen. Laut einer Studie 1 der University of California in Berkeley sind allein im Jahr 2002 ca. 5 Exabyte 2 an neuen Daten generiert worden. Dies entspricht bei 6,3 Milliarden Menschen auf der Erde ca. 800 Megabyte pro Person. Wohlgemerkt, dies sind nur die neu entstandenen Daten.
Dieses Datenwachstum findet insbesondere auch innerhalb der Unternehmen statt. Im Zeitalter des E-Business haben sich zahlreiche neue Applikationen entwickelt. Neben ERP-Systemen gibt es heute zunehmend auch Data-Warehouse-Systeme, Customer Relationship Management oder Supply Chain Management, um nur die wichtigsten zu nennen. Diese Applikationen zeichnen sich nicht nur durch ihre Lebensnotwendigkeit für die Unternehmen aus, sondern in ihrer Bedeutung für diese Arbeit insbesondere auch dadurch, dass sie einen enormen Bedarf an Speicherressourcen haben, der zudem auch immer weiter ansteigt. Die IT-Abteilung eines durchschnittlichen Unternehmens hat pro Jahr einen Bedarf an neuem Speicher von 50-70 % des bestehenden Speichervolumens 3 . Alte Daten können nicht einfach gelöscht werden, da es mittlerweile zahlreiche gesetzliche Bestimmungen gibt, zu deren Erfüllung umfangreiche Archive angelegt werden müssen und Daten jederzeit verfügbar sein müssen.
Bei fortdauerndem Speicherwachstum gilt es jedoch auch zu bedenken, dass die mit der Zeit gewachsene Landschaft an Speichersystemen in einem Unternehmen zunehmend komplexer wird. Die Systeme müssen auch wartbar und verwaltbar bleiben, und man benötigt insbesondere auch Administratoren, die den Überblick über die zunehmende Komplexität bewahren können, was jedoch ab einem bestimmten Maß kaum noch möglich ist.
Dem gegenüber steht der wachsende Kostendruck auf den IT-Abteilungen. Nach dem E-Business-Hype Ende der 90er-Jahre, fragte man sich in den letzten Jahren in wirtschaftlich
1 vgl. [Berk03]
2 1 Exabyte entspricht 1000 Petabyte bzw. 1 Million Terabyte
3 vgl. [Hori03]
schwierigeren Zeiten als Erstes, wo IT-Kosten eingespart werden könnten. Dies passt allerdings nicht zu der oben geschilderten Problematik. Wenn immer größere Anforderungen in immer kleinere Budgets gezwängt werden, bekommt man früher oder später ein Problem. Daraus lässt sich leicht erkennen, dass hier viel Raum für neue Ideen und Konzepte ist, mit denen man allen Anforderungen und Rahmenbedingungen gerecht werden kann. Die Speicher-Hersteller haben reagiert und hier ein neues Schlagwort generiert, welches momentan in aller Munde ist: Information Lifecycle Management (ILM). Auch wenn man natürlich stets bedenken muss, dass auch Firmen wie EMC 4 oder HP 5 letztlich nur ihre Produkte verkaufen wollen, so scheint hinter ILM doch mehr zu stecken, als nur eine Marketing-Kreation. Es mag zwar keine Revolution der Storage-Technologie bedeuten, dennoch sollte in jedem größeren Unternehmen ein Blick darauf geworfen werden.
1.2 Problemstellung und -abgrenzung
Das in dieser Arbeit behandelte Problem ergibt sich aus dem fortdauernden, stetigen Informationswachstum, das zunehmend mehr Speicher notwendig macht, bei gleichzeitig zunehmendem Kostendruck auf die Informatik. Selbst wenn man genug Geld hätte, um unbegrenzt Speicher kaufen zu können, hätte man das Problem, dass der Aufwand für die Verwaltung dieses Speichers ebenfalls sprunghaft ansteigt. Es ist mit den zur Verfügung stehenden Mitteln also mittelfristig kaum noch möglich, genügend Speicherplatz zur Verfügung zu stellen. Aus diesem Grund sind die Speicher-Hersteller auf ILM gekommen, welches all diese Probleme lösen soll. Um dies möglich zu machen, sind allerdings einige Voraussetzungen nötig, ohne die ILM nicht funktionieren kann.
Neben diesem allgemeinen Teil soll auch eine konkrete betriebliche Problemstellung behandelt werden: Bei der Hoffmann-La Roche AG soll ILM zunächst im Bereich Fileservices evaluiert und gegebenenfalls auch eingeführt werden.
Genau wie ILM versucht jedoch auch diese Arbeit nicht, die Ursachen der Probleme, also in erster Linie das immense Informationswachstum, zu lösen, dies wird als gegeben und nicht beeinflussbar hingenommen. Es soll vielmehr ein Ansatzpunkt gefunden werden, um mit den Auswirkungen besser umgehen zu können. Diese Arbeit kann auch kein detaillierter, umfassender Leitfaden zur Einführung von ILM sein, jeden Teilaspekt genau zu betrachten würde den vorgegebenen Rahmen bei weitem sprengen.
1.3 Ziel der Arbeit
Ziel dieser Arbeit ist es, einen Überblick über das Konzept „Information Lifecycle Management“ und die dahinter stehende Philosophie zu geben, sowie Teilaspekte zu beleuchten, die durch ILM berührt werden. Daneben soll jedoch auch ein Teilaspekt, „File Lifecycle Management“ (FLM) am Beispiel der Hoffmann-La Roche AG, genauer betrachtet werden. Dies dient insbesondere dazu, zu prüfen, ob ILM, angesichts dessen was es derzeit leisten kann, bereits genug gereift ist, um einen konkreten Nutzen bieten zu können.
4 www.emc.com
5 www.hp.com
1.4 Vorgehen
Zunächst soll im folgenden Kapitel dargestellt werden, woher das Konzept eines „Lifecycles“ eigentlich stammt, bzw. wo dies überall bereits Anwendung findet. Dies ist notwendig, um die Übertragung des Konzeptes auf Informationen verstehen zu können. Außerdem sollen an dieser Stelle auch die bestehenden technischen Grundlagen zur Speicherung von Informationen erläutert werden.
Im darauf folgenden Kapitel soll dann eine umfassende Problemanalyse vorgenommen werden und die einzelnen Problemkreise bei der Speicherung von Informationen dargestellt werden, um dann anschließend auf das Konzept, welches hinter „Information Lifecycle Management“ steckt, als mögliche Lösung zu kommen.
Im Anschluss daran soll konkreter auf die betriebliche Problemstellung eingegangen werden. Hier steht der Bedarf an einer reinen File-Lifecycle-Management-Lösung im Vordergrund. Eine solche soll sowohl technisch als auch hinsichtlich des Kosten- und Nutzen-Aspektes evaluiert werden.
2 Grundlagen
2.1 Der Produktlebenszyklus
2.1.1 Vorbemerkung
Lebenszyklen kennt man ursprünglich aus der Biologie. Jede Pflanze, aber auch jedes Tier sowie der Mensch durchlebt einen Lebenszyklus, in vereinfachter Form charakterisiert durch eine Wachstumsphase, eine Reifephase (Adultphase) und schließlich eine Phase des Rückgangs. Doch nicht erst in der Informationstechnologie, sondern vor allem in der Betriebswirtschaftslehre macht man sich dieses Konzept schon seit längerer Zeit zunutze, in dem man beispielsweise auch Produkten oder Märkten einen Lebenszyklus zuspricht. An Hand spezieller Eigenschaften der verschiedenen Phasen leitet man darauf abgestimmte Strategien und Handlungskonsequenzen ab. Sucht man im Internet nach „Lifecycle Management“, so stellt man schnell fest, dass es offensichtlich sogar „in“ ist, allem und jedem einen Lebenszyklus zu verpassen. So findet man Dinge wie Customer Lifecycle Management, Service Lifecycle Management, Asset Lifecycle Management, Quote & Order Lifecycle Management oder gar Portal Lifecycle Management. Dies mögen teilweise bloße Marketing-Sprach-Spielereien sein, bei denen sich „Lifecycle“ in erster Linie gut anhören soll. Die bewährten Ansätze sollen im Folgenden aber genauer unter die Lupe genommen werden.
2.1.2 Die vier Phasen des Produktlebenszyklus
Allgemein wird der Lebenszyklus eines Produktes in vier Phasen unterteilt. Die Unterscheidung der Phasen erfolgt dabei im Wesentlichen an Hand der durch das Produkt generierten Umsätze. Die einzelnen Phasen sind dabei folgendermaßen charakterisiert 6 :
6 vgl. [Netm04]
Arbeit zitieren:
Thomas Sturm, 2004, Konzeptionelle Überlegungen zu Information Lifecycle Management, München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Systemanalytische Methoden zur Auswahl von Standardsoftware
Medien / Kommunikation - Medienökonomie, -management
Seminararbeit, 26 Seiten
Usability und Design - Gegenüberstellung zweier Ansätze der Webseiteng...
Informationswissenschaften, Informationsmanagement
Diplomarbeit, 133 Seiten
Thomas Sturm's Text Konzeptionelle Überlegungen zu Information Lifecycle Management ist nun auf dem Buchmarkt erhältlich
Thomas Sturm hat den Text Konzeptionelle Überlegungen zu Information Lifecycle Management veröffentlicht
Thomas Sturm hat einen neuen Text hochgeladen
Information Lifecycle Support: Wisdom, Knowledge, Information an Data ...
John Higgins, Brian Johnson
Data Lifecycles: Managing Data for Strategic Advantage
Roger Reid, Gareth Fraser-King, W. David Schwaderer
0 Kommentare