Grin logo
de en es fr
Shop
GRIN Website
Texte veröffentlichen, Rundum-Service genießen
Zur Shop-Startseite › Informatik - Technische Informatik

Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern

Titel: Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern

Bachelorarbeit , 2006 , 83 Seiten , Note: 1

Autor:in: Ace Crngarov (Autor:in)

Informatik - Technische Informatik
Leseprobe & Details   Blick ins Buch
Zusammenfassung Leseprobe Details

Zur Ein- und Ausgabe großer Datenmengen auf Parallelrechnern und Cluster-Systemen werden spezielle Dateisysteme eingesetzt, die den parallelen Zugriff von mehreren Rechnern gleichzeitig effizient unterstützen. Beispiele für solche Cluster-Dateisysteme sind
Parallel Virtual File System (PVFS / PVFS2), Oracle Cluster File System (OCFS2), Red Hat Global File System (GFS), IBM General Parallel File System (GPFS) und Lustre.

Diese Arbeit evaluiert die oben genannten Produkte hinsichtlich ihrer Effizienz und praktischen Einsetzbarkeit in einer Parallelrechnerumgebung. Zu Beginn werden die verschiedenen Cluster-Dateisysteme vorgestellt, der Schwerpunkt liegt hier auf frei verfügbaren Dateisystemen. Weiter legt diese Arbeit geeignete Effizienzkriterien und Strategien zur Beurteilung
solcher Dateisysteme fest. Zu den Kriterien zählen neben einer hohen Transferrate auch eine geringe Latenzzeit bei Zugriffen auf kleine Dateien. Ein Benchmark-Programm setzt die festgelegten Kriterien und die Strategie um. Dazu wird ein neues Benchmark-Programm entwickelt, da kein verfügbares Programm alle festgelegten Kriterien untersuchen kann.

Die vorgestellte Auswahl an Cluster-Dateisystemen wird mit dem entwickelten Benchmark-Programm untersucht. Diese Arbeit präsentiert und vergleicht die gewonnenen Ergebnisse. Abschließend werden die resultierenden Leistungsdaten analysiert und darauf aufbauend Empfehlungen gegeben.

Leseprobe


Inhaltsverzeichnis

1 Einleitung

1.1 Ziel und Motivation dieser Arbeit

1.2 Vorgehensweise

1.3 Abgrenzung

2 Dateisysteme für Parallelrechner-Cluster

2.1 Begriffsdefinitionen und Bedeutung

2.1.1 Cluster

2.1.2 Cluster-Dateisystem

2.1.3 Datei-intensive Anwendungen

2.2 Architekturen von Cluster-Dateisystemen

2.2.1 Shared Storage

2.2.2 Intelligente Server

2.3 Technische Übersicht

2.3.1 Parallel Virtual File System 2

2.3.2 Lustre

2.3.3 Oracle Cluster File System 2

2.3.4 General Parallel File System

2.3.5 Global File System

2.3.6 Weitere Cluster-Dateisysteme

2.3.7 Techniken zur Optimierung von Zugriffen

3 Kriterien zur Beurteilung von Cluster-Dateisystemen

3.1 Zugriffsmuster wissenschaftlicher Anwendungen

3.2 Festlegung der zu untersuchenden Leistungsdaten

3.3 Erhebung der festgelegten Leistungsdaten in Form von Testszenarien

3.3.1 Sequentieller Zugriff, gemeinsame Datei

3.3.2 Sequentieller Zugriff, unterschiedliche Dateien

3.3.3 Schrittweiser Zugriff

3.3.4 Metadaten

3.3.5 Pufferfähigkeit

3.3.6 Systemauslastung

4 Umsetzung der konzipierten Szenarien und Testvorbereitung

4.1 Benchmark-Programm zur Umsetzung der Szenarien

4.1.1 Anforderungen an ein Benchmark-Programm

4.1.2 Auswahl eines Benchmark-Programms

4.1.3 Entwicklung und Umsetzung eines Benchmark-Programms

4.2 Testvorbereitung

4.2.1 Testumgebung

4.2.2 Gruppierung der Rechner

4.2.3 Installation und Konfiguration

5 Ergebnisse der Testdurchführung

5.1 Testergebnisse der Szenarien

5.1.1 Sequentieller Zugriff, gemeinsame Datei

5.1.2 Sequentieller Zugriff, unterschiedliche Dateien

5.1.3 Schrittweiser Zugriff

5.1.4 Metadaten

5.1.5 Pufferfähigkeit

5.1.6 Systemauslastung

5.2 Diskussion der Ergebnisse

5.2.1 Sequentieller Zugriff, gemeinsame Datei

5.2.2 Sequentieller Zugriff, unterschiedliche Dateien

5.2.3 Schrittweiser Zugriff

5.2.4 Metadaten

5.2.5 Pufferfähigkeit

6 Fazit der Untersuchung und Handlungsempfehlungen

Zielsetzung & Themen der Arbeit

Die Arbeit hat zum Ziel, verschiedene Cluster-Dateisysteme hinsichtlich ihrer Effizienz und praktischen Einsetzbarkeit in einer Parallelrechnerumgebung systematisch zu evaluieren, wobei der Fokus auf frei verfügbaren Produkten in einer Umgebung ohne gemeinsamen Festplattenspeicher liegt.

  • Systematische Untersuchung von Cluster-Dateisystemen (PVFS2, Lustre, GPFS, GFS).
  • Entwicklung eines unabhängigen Benchmark-Programms zur Leistungsanalyse.
  • Erhebung und Vergleich von Leistungsdaten wie Transferrate, Latenz und Metadaten-Effizienz.
  • Analyse der Systemauslastung auf I/O-Servern und Client-Rechnern.
  • Ableitung von Handlungsempfehlungen für den produktiven Einsatz der untersuchten Dateisysteme.

Auszug aus dem Buch

1.1 Ziel und Motivation dieser Arbeit

Das Ziel dieser Arbeit ist die systematische Untersuchung von verschiedenen Cluster-Dateisystemen hinsichtlich ihrer Effizienz und der praktischen Einsetzbarkeit in einer Parallelrechnerumgebung. Diese Arbeit evaluiert unterschiedliche Produkte aus dem Bereich der Cluster-Dateisysteme und vergleicht sie anhand von festgelegten Kriterien. Der Fokus liegt dabei auf Produkten, die in einer Umgebung ohne gemeinsamen Festplattenspeicher (engl. shared storage [Gro03]) funktionieren. Systematische Untersuchungen in der Form existieren dazu bislang nicht. In [Cop05] und [Mau05] finden sich zwei Studien zu Cluster-Dateisystemen, die einen Leistungsvergleich zwischen unterschiedlichen Systemen anstellen. Dies geschieht jedoch in beiden Fällen auf Grundlage einer Umgebung mit Zugriff auf einen gemeinsamen Festplattenspeicher.

Einige Hersteller von Cluster-Dateisystemen haben selber Benchmarks mit ihren eigenen Produkten durchgeführt und teilweise mit anderen Cluster-Dateisystemen verglichen ([CLUb], [IBMb]). So stellt es sich in den Ergebnissen der Hersteller dar, dass das Produkt aus dem eigenen Haus am besten abschneidet. Um einen unabhängigen Vergleich durchzuführen, sollten alle Produkte jedoch auf der selben Hardware und unter dem selben Betriebssystem getestet werden.

Zusammenfassung der Kapitel

1 Einleitung: Beschreibt die zunehmende Diskrepanz zwischen Rechen- und Festplattengeschwindigkeit sowie das Ziel der Arbeit, Cluster-Dateisysteme unabhängig zu evaluieren.

2 Dateisysteme für Parallelrechner-Cluster: Definiert grundlegende Begriffe und Architekturen wie Shared Storage und intelligente Server, inklusive einer technischen Übersicht der untersuchten Systeme.

3 Kriterien zur Beurteilung von Cluster-Dateisystemen: Leitet aus wissenschaftlichen Anwendungsprofilen relevante Leistungskriterien ab und konzipiert spezifische Testszenarien.

4 Umsetzung der konzipierten Szenarien und Testvorbereitung: Beschreibt die Entwicklung eines eigenen Benchmark-Programms sowie die Testumgebung, Konfiguration und Gruppierung der Rechner.

5 Ergebnisse der Testdurchführung: Präsentiert detaillierte Messwerte für alle Szenarien und analysiert die Systemauslastung sowie die Ergebnisse der Diskussion.

6 Fazit der Untersuchung und Handlungsempfehlungen: Fasst die Ergebnisse zusammen und gibt konkrete Empfehlungen für den Einsatz der Dateisysteme basierend auf den Testergebnissen.

Schlüsselwörter

Cluster-Dateisysteme, Parallelrechner, HPC, Benchmark, PVFS2, Lustre, GPFS, GFS, I/O-Performance, Skalierbarkeit, Metadaten, Pufferfähigkeit, Systemauslastung, Transferrate, Parallelrechnerumgebung

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit befasst sich mit der Evaluierung verschiedener Cluster-Dateisysteme hinsichtlich ihrer Effizienz und Einsetzbarkeit auf Parallelrechner-Clustern, insbesondere in Umgebungen ohne gemeinsamen Festplattenspeicher.

Was sind die zentralen Themenfelder?

Zu den Schwerpunkten zählen die Architektur von Cluster-Dateisystemen, die Analyse von Zugriffsmustern wissenschaftlicher Anwendungen und die performante Umsetzung paralleler Ein- und Ausgabevorgänge.

Was ist das primäre Ziel der Forschungsarbeit?

Das Hauptziel ist ein unabhängiger, objektiver Vergleich der Effizienz verschiedener Cluster-Dateisysteme, da bisherige Studien häufig auf unterschiedlichen Hardware- oder Betriebssystem-Grundlagen basierten oder proprietäre Benchmark-Ergebnisse der Hersteller nutzten.

Welche wissenschaftliche Methode wird verwendet?

Es wurde ein eigenes, in C entwickeltes Benchmark-Programm erstellt, das POSIX-konforme parallele I/O-Tests durchführt und dabei verschiedene Last-Szenarien und Hardware-Konfigurationen simuliert.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die theoretische Einführung in Dateisystemarchitekturen, die Definition von Leistungskriterien, die detaillierte Beschreibung der Testumgebung und die umfassende Auswertung der Messergebnisse.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Fachbegriffe sind Cluster-Dateisysteme, Parallelrechner, I/O-Performance, Benchmark, Skalierbarkeit sowie spezifische Dateisysteme wie PVFS2, Lustre, GPFS und GFS.

Warum wurde ein eigenes Benchmark-Programm entwickelt?

Vorhandene Tools wie "ior" unterstützten nicht alle geforderten Szenarien, wie etwa den schrittweisen Zugriff oder die exklusive Dateierstellung pro Knoten, weshalb eine Neuentwicklung zur Gewährleistung der Vergleichbarkeit notwendig war.

Wie unterscheidet sich GPFS in seiner Eignung von den anderen Systemen?

GPFS zeigt sehr gute Schreibraten, ist aber für Leseoperationen mit vielen Clients weniger effizient und erfordert einen höheren administrativen Aufwand sowie Lizenzgebühren.

Ende der Leseprobe aus 83 Seiten  - nach oben

Details

Titel
Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern
Hochschule
Fachhochschule Bonn-Rhein-Sieg
Note
1
Autor
Ace Crngarov (Autor:in)
Erscheinungsjahr
2006
Seiten
83
Katalognummer
V186219
ISBN (eBook)
9783869438450
ISBN (Buch)
9783867469371
Sprache
Deutsch
Schlagworte
evaluierung cluster-dateisystemen einsatz parallelrechnern
Produktsicherheit
GRIN Publishing GmbH
Arbeit zitieren
Ace Crngarov (Autor:in), 2006, Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern, München, GRIN Verlag, https://www.grin.com/document/186219
Blick ins Buch
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.
Leseprobe aus  83  Seiten
Grin logo
  • Grin.com
  • Versand
  • Kontakt
  • Datenschutz
  • AGB
  • Impressum