Please wait
Please install the Adobe Flash Player if no e-book is displayed.
Scholary Paper (Seminar), 2006, 25 Pages
Author: Gabriele Wilke-Müller
Subject: Information Management
Details
Institution/College: University of Constance (FB Informatik und Informationswissenschaften)
Tags: Evaluierungsverfahren, Summarizing, Methoden, Ergebnisse, Seminar, Summarizing
Year: 2006
Pages: 25
Grade: 1,7
Bibliography: ~ 16 Entries
Language: German
ISBN (E-book): 978-3-638-57754-0
File size: 230 KB
Other users also were interested in the following titles:
Excerpt (computer-generated)
Universität Konstanz, FB Informatik und
Seminar Summarizing
SS 2006
Evaluierungsverfahren für automatisches Summarizing -
Methoden, Ergebnisse, mögliche Übertragung auf K3
von: Gabriele Wilke-Müller
Inhaltsverzeichnis
Zusammenfassung 4
1 Einleitung 5
2 Abstracts und Extracts 6
3 Multidocument Summarizing 7
4 Evaluation 8
5 Evaluationsverfahren 9
5.1 Intrinsische Evaluationsverfahren 9
5.1.1 Qualitätsevaluation 9
5.1.2 Vergleich zu einer Referenz- (Ideal) Zusammenfassung 10
5.1.3 Fidelity to source comparision 10
5.1.4 Component level tests 11
5.2 Extrinsische Evaluationsmethoden 11
5.2.1 Relevanzbeurteilung 12
5.2.2 Reading comprehension 13
5.2.3 Presentation Strategies Evaluation 13
5.2.4 Mature system evaluation 14
5.3 Evaluation von Multidocument Summarizing 14
5.4 Evaluation von automatischen Zusammenfassungen von Konferenzen 14
5.4.1 Maximal Marginal Relevance (MMR) 15
5.4.2 Latent Semantic Analysis 15
5.4.3 Feature-based Klassifizierung 15
6. Evaluationsmetriken 16
6.1 Co-selection Metriken 16
6.1.1 Precision and Recall 16
6.1.2 Kappa 17
6.1.3 Relative Utility 17
6.2 Content-basierende Ähnlichkeitsmaße 17
6.3 Relevanz-Korrelation 17
7 Summarizing in K3 19
7.1 Summarizing-Leistungen der Studierenden 20
7.2 Summarizing Möglichkeiten aus K3 20
7.3 Evaluationsmöglichkeiten für K3 21
8 Schlussbetrachtung 23
Quellenverzeichnis 24
Zusammenfassung
Die Informationsüberflutung im 21. Jahrhundert macht ein automatisches Summarizing unentbehrlich. Da in elektronischen Foren die Diskurse häufig sehr komplex und umfänglich sind, ist auch für dieses Einsatzgebiet Summarizing wichtig, um einen schnellen Überblick zu erhalten. Hierfür kommt vor allem das Multidocument Summarizing in Betracht. Um die Effizienz einer Summarizing Methode zu erkennen, ist es wichtig diese zu evaluieren. Aktuelle Evaluationsmethoden für das Summarizing sollen hier dargestellt werden. Im Anschluss wird darauf eingegangen, inwiefern diese auf K3 zu übertragen sind.
1 Einleitung
Der Bedarf an Summarizing steigt stetig. Immer mehr Informationen sollen in immer kürzerer Zeit erfasst werden. Das Ziel vom automatischen Summarizing ist es, aus einer Informationsquelle den wichtigsten content herauszuziehen und diesen dem Benutzer auf verständliche Weise zu präsentieren. [vgl. Mani01a] So können Personen, die keine Zeit haben alle einschlägigen Wissensobjekte vollständig durchzulesen, sich einen Überblick über ein Wissensgebiet verschaffen. [vgl. Kuhlen] Auch für Suchmaschinen sind Zusammenfassungen eine wesentliche Erleichterung, da nur noch die Zusammenfassungen durchsucht werden müssen, um die relevanten Objekte zu finden. [vgl. Kupiec et al.]
Von den meisten wissenschaftlichen Arbeiten gibt es, i.d.R. vom Autor selbst geschriebene Zusammenfassungen, sogenannte Abstracts. Aber nicht nur im wissenschaftlichen Bereich, sondern auch in anderen Bereichen wird immer mehr Wissen produziert und führt somit zu immer höheren Informationsmengen. Unzählige Diskussionsforen und die Darstellung von Wissen in jeder Art in unzähligen Website hat zu einer Explosion von Wissensobjekten geführt. [vgl. Kuhlen] Dies führt zwangsläufig zu einem Orientierungsproblem. Um diesem entgegen zukommen wird verstärkt Summarizing eingesetzt. Doch ist es auch entscheidend die Effizienz von Summarizing Methoden zu testen. Hierfür stehen eine Reihe von Evaluationsmethoden zur Verfügung, die in der Seminararbeit vorgestellt werden. Im Anschluss wird darauf eingegangen, welche der vorgestellten Methoden für ein Summarizing von K3 Diskussionsbeiträgen in Betracht kommen.
2 Abstracts und Extracts
Es werden zwei Arten von Summarizing unterschieden, die Abstracts und die Extracts. Bei Extracts handelt es sich um Zusammenfassungen, die eine Anzahl von Worten und Sätzen wörtlich aus dem Orginaltext übernehmen. Wogegen bei Abstracts Zusammenfassungen anhand des aus dem Text gezogenen contents geschrieben werden. [vgl. Hovy05]
Abstracts werden häufig von professionellen Abstractern verfasst. Doch der steigende Bedarf an Summarizing macht die Bedeutung des automatischen Summarizing immer deutlicher. Für die Entwicklung von automatischen Summarizing werden häufig die Arbeitsmethoden der professionellen Summarizer beobachtet und nachempfunden. [vgl. Mani01a] Viele Verfahren basieren auf dem Luhn-Algorithmus (Luhn 1958), der Sätze mit signifikant hohem Vorkommen signifikanter Wörter extrahiert. [Kuhlen]
Es gibt indikative und informative Abstracts. Indikativen Abstracts, dienen i.d.R. als Orientierung, informative Abstracts sollen zusammenfassend über die wesentlichen Inhalte, Methoden und Ergebnisse informieren. Nach herrschender Meinung sollen Abstracts keine Wertungen beinhalten, sondern nur das widergeben, was im Originaltext vorhanden ist. Das sogenannte slanted Abstract oder auch adaptives Abstract ist auf eine eng definierte Zielgruppe oder sogar nur auf eine einzige Person zugeschnitten.
In der Regel handelt es sich um Textform. Aber Abstracts können auch als grafische Visualisierung und als strukturierte Positionsreferate entwickelt werden. Werden mehrere Texte zusammengefasst, spricht man von Multidocument Summaries. [vgl. Kuhlen]
3 Multidocument Summarizing
[...]
Comments
No comments yet
Other users also were interested in the following titles:
Formatvorlage / Vorlage für eine Diplomarbeit - Formatvorlage / Vorlage für eine Hausarbeit für Microsoft Word
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 6,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit - Formatvorlage / Vorlage für eine Hausarbeit für OpenOffice.org
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 9,99 EUR
Formatvorlage zur Erstellung einer Diplomarbeit / Vorlage zur Erstellung einer Hausarbeit
Author: Marco FeindlerPresentations, Models, Tutorials, Instructions, 2005 Download as PDF-file for 6,99 EUR
Formatvorlage / Vorlage für eine Diplomarbeit / Hausarbeit
Author: GRIN VerlagPresentations, Models, Tutorials, Instructions, 2008 Download as PDF-file for 6,99 EUR
Anleitung zum Erstellen schriftlicher Arbeiten: Der Aufbau einer wissenschaftlichen Arbeit
Author: Zoran ZivkovicPresentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR
Erstellen einer schriftlichen Hausarbeit
Author: Claudia NickelPresentations, Models, Tutorials, Instructions, 2006 Download as PDF-file for 4,99 EUR
Grundtechniken wissenschaftlichen Arbeitens
Author: Maik PhilippPresentations, Models, Tutorials, Instructions, 2004 Download as PDF-file for 5,99 EUR
Ratgeber zur Erstellung wissenschaftlicher Arbeiten. Diplomarbeiten - Hausarbeiten - Seminararbeiten
Author: Mark RichterPresentations, Models, Tutorials, Instructions, 2008
This text can be quoted and accessed from this url: