Grin logo
de en es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Applied

Entwicklung eines Suchalgorithmus für das Information Retrieval

Title: Entwicklung eines Suchalgorithmus für das Information Retrieval

Term Paper (Advanced seminar) , 2005 , 30 Pages , Grade: 1.0

Autor:in: Dipl. Wirt.-Inf. (FH), Dipl. Kfm. (FH), BBA Andreas Schutt (Author)

Computer Science - Applied
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

Diese Arbeit beschäftigt sich mit dem Thema der Algorithmen für die Anwendung in der Informatik, im Speziellen mit Suchalgorithmen für Textvergleiche im Rahmen des Information Retrieval.
Durch die rasante Entwicklung und Verbreitung der Informationstechnologie, vor allem im Bereich der Massenspeicher und der weltweit geschaffenen Kommunikationsinfrastruktur des Internets, ist die Menge an direkt oder indirekt zugänglichem Wissen überproportional gestiegen. Um von der stetig wachsenden Anzahl an verfügbaren Informationen in den Wissensdatenbanken zu profitieren, besteht die Notwendigkeit die verfügbaren Datenbestände in geeigneter Form verwalten und die gewünschten Informationen kontextbezogen schnell wieder finden zu können. Daher müssen die Datenbestände systematisch und schnell durchsucht werden, wofür unterschiedliche Algorithmen zum Einsatz kommen.
Um den Leser zuerst in die Thematik einzuführen, wird vorab das Gebiet der Algorithmen im Allgemeinen aufgearbeitet. Im Rahmen des folgenden Kapitels sollen daher die grundlegenden Kenntnisse und Methoden vermittelt und so eine gemeinsame Wissensbasis für das Verständnis der Implementierung des zu entwickelnden Suchalgorithmus zur Bestimmung der Affinität von Texten geschaffen werden.
Anschließend werden einige Ansätze von für das Information Retrieval geeignete Suchalgorithmen diskutiert und letztlich die Implementierung eines zu entwickelnden Suchalgorithmus-Prototypen auf Basis der Programmiersprache JAVA vorgestellt.

Excerpt


Inhaltsverzeichnis

1 Einleitung

2 Einführung in Algorithmen

2.1 Algorithmus-Definition

2.2 Algorithmenanalyse

2.3 Klassifikation von Algorithmen

2.4 Optimieren von Algorithmen

2.5 Beispiele für die Optimierung von Algorithmen

2.5.1 Algorithmen-Optimierung auf semantischer Ebene

2.5.2 Algorithmen-Optimierung auf struktureller Ebene

3 Implementationen von Algorithmen

3.1 Sortieralgorithmen

3.1.1 Der Sortieralgorithmus Quicksort

3.1.2 Implementierung des Quicksort-Algorithmus

3.2 Schedulingalgorithmen

3.2.1 Der Round-Robin-Algorithmus (Prioritätsstufenbasiert)

3.2.2 Implementierung des prioritätenbasierten Round-Robin-Algorithmus

3.3 Suchalgorithmen

3.3.1 Der Suchalgorithmus nach Boyer-Moore

3.3.2 Implementierung des Boyer-Moore-Algorithmus

4 Suchalgorithmen für das Information Retrieval

4.1 Indexbasierte Suche vs. Online-Suche

4.2 Methoden von Suchalgorithmen für die Volltextsuche beim Information Retrieval

4.2.1 Methode des zu entwickelnden Suchalgorithmus für die Volltextsuche beim Information Retrieval

4.2.2 Implementierung des zu entwickelnden Suchalgorithmus für die Volltextsuche beim Information Retrieval

Zielsetzung & Themen

Die Arbeit verfolgt das Ziel, grundlegende Algorithmen für die Informatik aufzuarbeiten und einen spezifischen Suchalgorithmus für das Information Retrieval zu entwickeln, der die inhaltliche Affinität von Texten bestimmt. Die zentrale Forschungsfrage liegt in der effizienten und systematischen Durchsuchung von Datenbeständen zur Identifikation relevanter Informationen.

  • Grundlagen der Algorithmenanalyse und Klassifikation
  • Optimierungsansätze für Algorithmen auf semantischer und struktureller Ebene
  • Implementierung und Funktionsweise gängiger Algorithmen (Sortieren, Scheduling, Suchen)
  • Methoden für das Information Retrieval und die Volltextsuche
  • Entwicklung eines maßgeschneiderten Suchalgorithmus mittels Polygrammen

Auszug aus dem Buch

3.1.1 Der Sortieralgorithmus Quicksort

„The basic idea of the following method is … that the original sorting problem is reduced [again and again] to two simpler problems [subfiles or partitions of the original file]“, die dann alle mit derselben Methode sortiert werden.

Quicksort wählt dazu ein Datenelement, das sog. Pivotelement, nach einem bestimmten Verfahren aus der zu sortierenden Liste an Datenelementen aus und vertauscht es mit dem letzten Element der Datenmenge. Dort wird das Pivotelement sozusagen „festgeschrieben“ und dient nur noch Vergleichszwecken. Anschließend wird die Datenliste in zwei Teile partitioniert, wobei die untere Partition alle Elemente kleiner und die obere Partition alle Datenelemente gleich oder größer dem Pivotelement erhält.

Dazu wird zunächst ein Element in der unteren Partition gesucht, welches größer/gleich dem Pivotelement ist. Entsprechend wird in der oberen Partition ein Element gesucht, welches kleiner als das Pivotelement ist. Wurden zwei Elemente gefunden, werden diese dann miteinander vertauscht und somit in die jeweils andere Partition geschrieben. Dieser Vorgang wird fortgesetzt, bis sich die untere und obere Suche treffen.

Nun wird das Pivotelement zwischen den beiden Partitionen eingefügt, indem es mit dem ersten Datenelement der oberen Partition vertauscht wird. Dadurch wird erreicht, dass nun das Pivotelement an der richtigen Position in dem Datenbestand steht – d.h. alle kleineren Datenelemente befinden sich nun in der einen und alle größerer Elemente in der anderen Partition.

Die noch unsortierten Partitionen werden über denselben Algorithmus in noch kleinere Partitionen zerlegt, bis nur noch ein Element in einer jeden Partition vorhanden ist.

Zusammenfassung der Kapitel

1 Einleitung: Die Seminararbeit motiviert das Thema Suchalgorithmen durch die wachsende Datenmenge im Internet und skizziert die wissenschaftliche Auseinandersetzung mit der Algorithmenentwicklung.

2 Einführung in Algorithmen: Dieses Kapitel definiert Algorithmen, erläutert die Kriterien der Komplexitätsanalyse und stellt verschiedene Optimierungsmöglichkeiten anhand konkreter Code-Beispiele vor.

3 Implementationen von Algorithmen: Hier werden beispielhaft Sortier-, Scheduling- und Suchalgorithmen mit Fokus auf deren Java-Implementierung und Funktionsweise detailliert dargestellt.

4 Suchalgorithmen für das Information Retrieval: Dieses Kapitel transferiert das Wissen über allgemeine Algorithmen auf die speziellen Anforderungen des Information Retrieval und führt die Entwicklung eines eigenen Volltext-Suchalgorithmus ein.

Schlüsselwörter

Algorithmen, Information Retrieval, Suchalgorithmus, Volltextsuche, Quicksort, Boyer-Moore, Scheduling, Java, Komplexitätsanalyse, Optimierung, Datenbestand, Polygramme, Softwareentwicklung, Performanz, Programmierung

Häufig gestellte Fragen

Worum geht es in dieser Arbeit grundsätzlich?

Die Arbeit behandelt die Grundlagen und die praktische Anwendung von Algorithmen in der Informatik, mit einem besonderen Fokus auf die Entwicklung effizienter Suchverfahren für das Information Retrieval.

Was sind die zentralen Themenfelder?

Zentrale Themen sind die algorithmische Analyse und Klassifikation, Techniken zur Performance-Optimierung, klassische Sortier- und Scheduling-Algorithmen sowie Methoden zur Volltextsuche.

Was ist das primäre Ziel oder die Forschungsfrage?

Das Ziel ist die Erarbeitung einer Wissensbasis für Algorithmen und die Entwicklung eines spezifischen Suchalgorithmus, der die Affinität von Texten bestimmt.

Welche wissenschaftliche Methode wird verwendet?

Es werden theoretische Ansätze aus der Informatik-Fachliteratur mit praktischen Java-Implementierungen kombiniert, um algorithmische Effizienz messbar zu machen.

Was wird im Hauptteil behandelt?

Im Hauptteil werden neben den theoretischen Grundlagen zu Algorithmen (Definition, Komplexität) konkrete Implementierungsbeispiele wie Quicksort, Round-Robin und Boyer-Moore analysiert.

Welche Schlüsselwörter charakterisieren die Arbeit?

Die Arbeit ist primär durch Begriffe wie Algorithmen, Information Retrieval, Suchalgorithmus, Volltextsuche, Performanz und Java-Implementierung charakterisiert.

Wie funktioniert der vorgestellte Boyer-Moore-Algorithmus?

Der Boyer-Moore-Algorithmus beschleunigt das Pattern-Matching, indem er das Suchmuster von hinten nach vorne vergleicht und bei Nicht-Übereinstimmung basierend auf dem Suchtext oder dem Muster gezielt Suchpositionen überspringt.

Was zeichnet den in der Arbeit entwickelten Suchalgorithmus aus?

Der entwickelte Algorithmus nutzt das Zerlegen von Schlüsselwörtern in Polygramme (Buchstaben-Tupel) und ermöglicht eine sprachenunabhängige Suche ohne vorherige Indizierung des Datenbestandes.

Excerpt out of 30 pages  - scroll top

Details

Title
Entwicklung eines Suchalgorithmus für das Information Retrieval
College
University of Applied Sciences Essen
Grade
1.0
Author
Dipl. Wirt.-Inf. (FH), Dipl. Kfm. (FH), BBA Andreas Schutt (Author)
Publication Year
2005
Pages
30
Catalog Number
V85243
ISBN (eBook)
9783638003131
ISBN (Book)
9783638911214
Language
German
Tags
Entwicklung Suchalgorithmus Information Retrieval java stemming stemmer programmierung optimierung algorithmus
Product Safety
GRIN Publishing GmbH
Quote paper
Dipl. Wirt.-Inf. (FH), Dipl. Kfm. (FH), BBA Andreas Schutt (Author), 2005, Entwicklung eines Suchalgorithmus für das Information Retrieval, Munich, GRIN Verlag, https://www.grin.com/document/85243
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  30  pages
Grin logo
  • Grin.com
  • Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint