Grin logo
en de es fr
Shop
GRIN Website
Publish your texts - enjoy our full service for authors
Go to shop › Computer Science - Miscellaneous

Named Entity Recognition - Techniques and Evaluation

Title: Named Entity Recognition - Techniques and Evaluation

Seminar Paper , 2011 , 22 Pages , Grade: 1,7

Autor:in: Dominic Scheurer (Author)

Computer Science - Miscellaneous
Excerpt & Details   Look inside the ebook
Summary Excerpt Details

The automatic Named Entity Recognition and Classification (NERC) is an important sub task of the information extraction of texts, whose fundamental properties are the choice of the considered feature
space, the applied learning techniques as well as the evaluation of existing systems. The goal of this work is to discuss these aspects, to compare existing approaches to NERC and to classifiy those regarding
their potential.
----------
Die maschinelle Erkennung von Eigennamen - Named Entity Recognition and Classification (NERC) -ist ein wichtiges Teilfeld der Informationsextrahierung aus Texten, dessen wesentliche Bestandteile die Wahl des betrachteten Eigenschaftenraumes, die eingesetzten Lerntechniken sowie die anschließende Evaluation bestehender Systeme sind. Diese Studienarbeit hat zum Ziel, diese Aspekte zu erörtern sowie existierende Herangehensweisen zur Eigennamenerkennung gegeneinander abzuwägen und hinsichtlich ihres Potentials zu bewerten.

Excerpt


Inhaltsverzeichnis

  • Introduction
    • Scope of this Work
    • Applications of NERC
    • Type, Domain and Language Factors
  • NERC Evaluation
    • Ways of Evaluation
      • MUC Evaluations
      • Exact-match Evaluations
    • Evaluation Metrics
  • Features for NERC
    • List lookup features
    • Document and corpus features
    • Short Example
  • Overview of NERC Systems
    • Supervised Learners
      • Baseline Approach
      • Maximum Entropy Approach
    • Semi-Supervised Learners
    • Unsupervised Learners
      • Augmenting Ontologies
      • Generating Gazetteers and Resolving Ambiguity

Zielsetzung und Themenschwerpunkte

Diese Studienarbeit befasst sich mit der maschinellen Erkennung von Eigennamen (Named Entity Recognition and Classification, NERC), einem wichtigen Teilbereich der Informationsextrahierung aus Texten. Die Arbeit untersucht die Auswahl des Merkmalsraums, die eingesetzten Lerntechniken und die Evaluation bestehender Systeme. Das Ziel ist es, diese Aspekte zu diskutieren, bestehende Ansätze zur Eigennamenerkennung zu vergleichen und hinsichtlich ihres Potentials zu bewerten.

  • Automatische Erkennung von Eigennamen (NERC) in Texten
  • Evaluierung von NERC-Systemen
  • Merkmale für die Eigennamenerkennung
  • Überblick über verschiedene NERC-Systeme: Überwachte, semi-überwachte und unüberwachte Lernverfahren
  • Vorteile und Nachteile bestehender NERC-Systeme und -techniken

Zusammenfassung der Kapitel

  • Kapitel 1: Einführung - Die Arbeit konzentriert sich auf die maschinellen Lernverfahren für NERC, darunter überwachte, semi-überwachte und unüberwachte Klassifikatoren. Die Auswahl der Merkmale für die Kodierung von Eingabedokumenten und die Evaluierung von NERC-Systemen werden ebenfalls behandelt.
  • Kapitel 2: NERC-Evaluierung - Verschiedene Evaluierungsansätze werden vorgestellt, darunter MUC-Evaluierungen und exakte Übereinstimmungen. Außerdem werden die wichtigsten Metriken für die Evaluierung von NERC-Systemen erläutert.
  • Kapitel 3: Merkmale für NERC - Die Verwendung von Listen-Suchfunktionen, Dokumenten- und Korpusmerkmalen sowie ein kurzes Beispiel für die Merkmalsextraktion werden diskutiert.
  • Kapitel 4: Überblick über NERC-Systeme - Die Arbeit behandelt verschiedene Ansätze für NERC-Systeme, darunter überwachte Lernverfahren (z.B. Baseline- und Maximum-Entropy-Ansatz), semi-überwachte Lernverfahren und unüberwachte Lernverfahren (z.B. Erweiterung von Ontologien und Generierung von Gazetteers).

Schlüsselwörter

Named Entity Recognition, Named Entity Classification, Informationsextrahierung, maschinelles Lernen, überwachte Lernverfahren, semi-überwachte Lernverfahren, unüberwachte Lernverfahren, Merkmale, Evaluation, MUC-Evaluierung, exakte Übereinstimmung, Metriken.

Excerpt out of 22 pages  - scroll top

Details

Title
Named Entity Recognition - Techniques and Evaluation
College
Technical University of Darmstadt  (Fachbereich Informatik)
Course
Text Analytics
Grade
1,7
Author
Dominic Scheurer (Author)
Publication Year
2011
Pages
22
Catalog Number
V190582
ISBN (eBook)
9783656149439
Language
German
Tags
Eigennamen Natural Language Processing
Product Safety
GRIN Publishing GmbH
Quote paper
Dominic Scheurer (Author), 2011, Named Entity Recognition - Techniques and Evaluation, Munich, GRIN Verlag, https://www.grin.com/document/190582
Look inside the ebook
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
  • Depending on your browser, you might see this message in place of the failed image.
Excerpt from  22  pages
Grin logo
  • Grin.com
  • Payment & Shipping
  • Contact
  • Privacy
  • Terms
  • Imprint