Grin logo
de en es fr
Boutique
GRIN Website
Publier des textes, profitez du service complet
Aller à la page d’accueil de la boutique › Informatique - L'informatique technique

Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern

Titre: Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern

Thèse de Bachelor , 2006 , 83 Pages , Note: 1

Autor:in: Ace Crngarov (Auteur)

Informatique - L'informatique technique
Extrait & Résumé des informations   Lire l'ebook
Résumé Extrait Résumé des informations

Zur Ein- und Ausgabe großer Datenmengen auf Parallelrechnern und Cluster-Systemen werden spezielle Dateisysteme eingesetzt, die den parallelen Zugriff von mehreren Rechnern gleichzeitig effizient unterstützen. Beispiele für solche Cluster-Dateisysteme sind
Parallel Virtual File System (PVFS / PVFS2), Oracle Cluster File System (OCFS2), Red Hat Global File System (GFS), IBM General Parallel File System (GPFS) und Lustre.

Diese Arbeit evaluiert die oben genannten Produkte hinsichtlich ihrer Effizienz und praktischen Einsetzbarkeit in einer Parallelrechnerumgebung. Zu Beginn werden die verschiedenen Cluster-Dateisysteme vorgestellt, der Schwerpunkt liegt hier auf frei verfügbaren Dateisystemen. Weiter legt diese Arbeit geeignete Effizienzkriterien und Strategien zur Beurteilung
solcher Dateisysteme fest. Zu den Kriterien zählen neben einer hohen Transferrate auch eine geringe Latenzzeit bei Zugriffen auf kleine Dateien. Ein Benchmark-Programm setzt die festgelegten Kriterien und die Strategie um. Dazu wird ein neues Benchmark-Programm entwickelt, da kein verfügbares Programm alle festgelegten Kriterien untersuchen kann.

Die vorgestellte Auswahl an Cluster-Dateisystemen wird mit dem entwickelten Benchmark-Programm untersucht. Diese Arbeit präsentiert und vergleicht die gewonnenen Ergebnisse. Abschließend werden die resultierenden Leistungsdaten analysiert und darauf aufbauend Empfehlungen gegeben.

Extrait


Inhaltsverzeichnis

1 Einleitung

1.1 Ziel und Motivation dieser Arbeit

1.2 Vorgehensweise

1.3 Abgrenzung

2 Dateisysteme für Parallelrechner-Cluster

2.1 Begriffsdefinitionen und Bedeutung

2.1.1 Cluster

2.1.2 Cluster-Dateisystem

2.1.3 Datei-intensive Anwendungen

2.2 Architekturen von Cluster-Dateisystemen

2.2.1 Shared Storage

2.2.2 Intelligente Server

2.3 Technische Übersicht

2.3.1 Parallel Virtual File System 2

2.3.2 Lustre

2.3.3 Oracle Cluster File System 2

2.3.4 General Parallel File System

2.3.5 Global File System

2.3.6 Weitere Cluster-Dateisysteme

2.3.7 Techniken zur Optimierung von Zugriffen

3 Kriterien zur Beurteilung von Cluster-Dateisystemen

3.1 Zugriffsmuster wissenschaftlicher Anwendungen

3.2 Festlegung der zu untersuchenden Leistungsdaten

3.3 Erhebung der festgelegten Leistungsdaten in Form von Testszenarien

3.3.1 Sequentieller Zugriff, gemeinsame Datei

3.3.2 Sequentieller Zugriff, unterschiedliche Dateien

3.3.3 Schrittweiser Zugriff

3.3.4 Metadaten

3.3.5 Pufferfähigkeit

3.3.6 Systemauslastung

4 Umsetzung der konzipierten Szenarien und Testvorbereitung

4.1 Benchmark-Programm zur Umsetzung der Szenarien

4.1.1 Anforderungen an ein Benchmark-Programm

4.1.2 Auswahl eines Benchmark-Programms

4.1.3 Entwicklung und Umsetzung eines Benchmark-Programms

4.2 Testvorbereitung

4.2.1 Testumgebung

4.2.2 Gruppierung der Rechner

4.2.3 Installation und Konfiguration

5 Ergebnisse der Testdurchführung

5.1 Testergebnisse der Szenarien

5.1.1 Sequentieller Zugriff, gemeinsame Datei

5.1.2 Sequentieller Zugriff, unterschiedliche Dateien

5.1.3 Schrittweiser Zugriff

5.1.4 Metadaten

5.1.5 Pufferfähigkeit

5.1.6 Systemauslastung

5.2 Diskussion der Ergebnisse

5.2.1 Sequentieller Zugriff, gemeinsame Datei

5.2.2 Sequentieller Zugriff, unterschiedliche Dateien

5.2.3 Schrittweiser Zugriff

5.2.4 Metadaten

5.2.5 Pufferfähigkeit

6 Fazit der Untersuchung und Handlungsempfehlungen

Zielsetzung & Themen der Arbeit

Die Arbeit hat zum Ziel, verschiedene Cluster-Dateisysteme hinsichtlich ihrer Effizienz und praktischen Einsetzbarkeit in einer Parallelrechnerumgebung systematisch zu evaluieren, wobei der Fokus auf frei verfügbaren Produkten in einer Umgebung ohne gemeinsamen Festplattenspeicher liegt.

  • Systematische Untersuchung von Cluster-Dateisystemen (PVFS2, Lustre, GPFS, GFS).
  • Entwicklung eines unabhängigen Benchmark-Programms zur Leistungsanalyse.
  • Erhebung und Vergleich von Leistungsdaten wie Transferrate, Latenz und Metadaten-Effizienz.
  • Analyse der Systemauslastung auf I/O-Servern und Client-Rechnern.
  • Ableitung von Handlungsempfehlungen für den produktiven Einsatz der untersuchten Dateisysteme.

Auszug aus dem Buch

1.1 Ziel und Motivation dieser Arbeit

Das Ziel dieser Arbeit ist die systematische Untersuchung von verschiedenen Cluster-Dateisystemen hinsichtlich ihrer Effizienz und der praktischen Einsetzbarkeit in einer Parallelrechnerumgebung. Diese Arbeit evaluiert unterschiedliche Produkte aus dem Bereich der Cluster-Dateisysteme und vergleicht sie anhand von festgelegten Kriterien. Der Fokus liegt dabei auf Produkten, die in einer Umgebung ohne gemeinsamen Festplattenspeicher (engl. shared storage [Gro03]) funktionieren. Systematische Untersuchungen in der Form existieren dazu bislang nicht. In [Cop05] und [Mau05] finden sich zwei Studien zu Cluster-Dateisystemen, die einen Leistungsvergleich zwischen unterschiedlichen Systemen anstellen. Dies geschieht jedoch in beiden Fällen auf Grundlage einer Umgebung mit Zugriff auf einen gemeinsamen Festplattenspeicher.

Einige Hersteller von Cluster-Dateisystemen haben selber Benchmarks mit ihren eigenen Produkten durchgeführt und teilweise mit anderen Cluster-Dateisystemen verglichen ([CLUb], [IBMb]). So stellt es sich in den Ergebnissen der Hersteller dar, dass das Produkt aus dem eigenen Haus am besten abschneidet. Um einen unabhängigen Vergleich durchzuführen, sollten alle Produkte jedoch auf der selben Hardware und unter dem selben Betriebssystem getestet werden.

Zusammenfassung der Kapitel

1 Einleitung: Beschreibt die zunehmende Diskrepanz zwischen Rechen- und Festplattengeschwindigkeit sowie das Ziel der Arbeit, Cluster-Dateisysteme unabhängig zu evaluieren.

2 Dateisysteme für Parallelrechner-Cluster: Definiert grundlegende Begriffe und Architekturen wie Shared Storage und intelligente Server, inklusive einer technischen Übersicht der untersuchten Systeme.

3 Kriterien zur Beurteilung von Cluster-Dateisystemen: Leitet aus wissenschaftlichen Anwendungsprofilen relevante Leistungskriterien ab und konzipiert spezifische Testszenarien.

4 Umsetzung der konzipierten Szenarien und Testvorbereitung: Beschreibt die Entwicklung eines eigenen Benchmark-Programms sowie die Testumgebung, Konfiguration und Gruppierung der Rechner.

5 Ergebnisse der Testdurchführung: Präsentiert detaillierte Messwerte für alle Szenarien und analysiert die Systemauslastung sowie die Ergebnisse der Diskussion.

6 Fazit der Untersuchung und Handlungsempfehlungen: Fasst die Ergebnisse zusammen und gibt konkrete Empfehlungen für den Einsatz der Dateisysteme basierend auf den Testergebnissen.

Schlüsselwörter

Cluster-Dateisysteme, Parallelrechner, HPC, Benchmark, PVFS2, Lustre, GPFS, GFS, I/O-Performance, Skalierbarkeit, Metadaten, Pufferfähigkeit, Systemauslastung, Transferrate, Parallelrechnerumgebung

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit befasst sich mit der Evaluierung verschiedener Cluster-Dateisysteme hinsichtlich ihrer Effizienz und Einsetzbarkeit auf Parallelrechner-Clustern, insbesondere in Umgebungen ohne gemeinsamen Festplattenspeicher.

Was sind die zentralen Themenfelder?

Zu den Schwerpunkten zählen die Architektur von Cluster-Dateisystemen, die Analyse von Zugriffsmustern wissenschaftlicher Anwendungen und die performante Umsetzung paralleler Ein- und Ausgabevorgänge.

Was ist das primäre Ziel der Forschungsarbeit?

Das Hauptziel ist ein unabhängiger, objektiver Vergleich der Effizienz verschiedener Cluster-Dateisysteme, da bisherige Studien häufig auf unterschiedlichen Hardware- oder Betriebssystem-Grundlagen basierten oder proprietäre Benchmark-Ergebnisse der Hersteller nutzten.

Welche wissenschaftliche Methode wird verwendet?

Es wurde ein eigenes, in C entwickeltes Benchmark-Programm erstellt, das POSIX-konforme parallele I/O-Tests durchführt und dabei verschiedene Last-Szenarien und Hardware-Konfigurationen simuliert.

Was wird im Hauptteil behandelt?

Der Hauptteil gliedert sich in die theoretische Einführung in Dateisystemarchitekturen, die Definition von Leistungskriterien, die detaillierte Beschreibung der Testumgebung und die umfassende Auswertung der Messergebnisse.

Welche Schlüsselwörter charakterisieren die Arbeit?

Wichtige Fachbegriffe sind Cluster-Dateisysteme, Parallelrechner, I/O-Performance, Benchmark, Skalierbarkeit sowie spezifische Dateisysteme wie PVFS2, Lustre, GPFS und GFS.

Warum wurde ein eigenes Benchmark-Programm entwickelt?

Vorhandene Tools wie "ior" unterstützten nicht alle geforderten Szenarien, wie etwa den schrittweisen Zugriff oder die exklusive Dateierstellung pro Knoten, weshalb eine Neuentwicklung zur Gewährleistung der Vergleichbarkeit notwendig war.

Wie unterscheidet sich GPFS in seiner Eignung von den anderen Systemen?

GPFS zeigt sehr gute Schreibraten, ist aber für Leseoperationen mit vielen Clients weniger effizient und erfordert einen höheren administrativen Aufwand sowie Lizenzgebühren.

Fin de l'extrait de 83 pages  - haut de page

Résumé des informations

Titre
Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern
Université
Fachhochschule Bonn-Rhein-Sieg
Note
1
Auteur
Ace Crngarov (Auteur)
Année de publication
2006
Pages
83
N° de catalogue
V186219
ISBN (ebook)
9783869438450
ISBN (Livre)
9783867469371
Langue
allemand
mots-clé
evaluierung cluster-dateisystemen einsatz parallelrechnern
Sécurité des produits
GRIN Publishing GmbH
Citation du texte
Ace Crngarov (Auteur), 2006, Evaluierung von Cluster-Dateisystemen für den Einsatz auf Parallelrechnern, Munich, GRIN Verlag, https://www.grin.com/document/186219
Lire l'ebook
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
  • Si vous voyez ce message, l'image n'a pas pu être chargée et affichée.
Extrait de  83  pages
Grin logo
  • Grin.com
  • Expédition
  • Contact
  • Prot. des données
  • CGV
  • Imprint