Automatische Metadatengenerierung für Lernobjekte

E-Book Cover: ()
Flash Player und JavaScript werden für eine verbesserte Ansicht des Dokuments benötigt. Bitte installieren Sie den Flash Player und aktivieren Sie Javascript.

Install Flash Player

Details

Titel: Automatische Metadatengenerierung für Lernobjekte
Untertitel : Experimenteller Werkzeugvergleich und Kategorisierung von Metadatentypen
Autor: Dipl.-Wirtsch.-Inf. Matthias Bauer
Fach: Informatik - Wirtschaftsinformatik
Institution/Hochschule: Martin-Luther-Universität Halle-Wittenberg
Kategorie: Diplomarbeit
Jahr: 2007
Seiten: 143
Note: 1,7
Literaturverzeichnis: ~ 122  Einträge
Sprache: Deutsch
Dateigröße: 736 KB
Archivnummer: V83137
ISBN (E-Book): 978-3-638-85959-2
ISBN (Buch): 978-3-638-85591-4

Zusammenfassung / Abstract

E-Learning gewinnt in der universitären Ausbildung sowie in der außeruniversitären Aus- und Weiterbildung zunehmend an Bedeutung und hat sich als Lehr- und Lernform fest etabliert. Die Vorteile liegen vor allem in der Selbstbestimmung von Lernort, Lernzeit und Lerntempo. Für die Verwaltung und den Austausch digitaler Lernmaterialien, so genannter Lernobjekte (LO), sind aussagekräftige Metadaten erforderlich. Für viele Autoren von LO gestaltet sich die Metadatengenerierung jedoch als zu schwierig und zeitaufwändig. Darüber hinaus profitieren Autoren nur in geringem Maß von der Beschreibung ihrer LO durch Metadaten und sind daher häufig nicht bereit den zusätzlichen Aufwand zu erbringen. Der Einsatz professioneller Metadatenautoren zur Generierung von Metadaten für LO ist hingegen sehr kostenintensiv. Vor dem geschilderten Hintergrund wird in dieser Arbeit die automatische Metadatengenerierung als Alternative zur manuellen Metadatengenerierung betrachtet. Dazu werden zunächst fundamentale Begriffe wie Lernobjekt, Metadaten und Metadatengenerierung erläutert, technische Systeme im E-Learning voneinander abgegrenzt sowie die zur Beschreibung von Lernobjekten relevanten Datenelemente vorgestellt. Darüber hinaus werden ausgewählte Informationsquellen der automatischen Metadatengenerierung vorgestellt. Anschließend werden die in der Literatur anzufindenden ressourcenbasierten und kontextbasierten Methoden und Ansätze der automatischen Metadatengenerierung beschrieben und diskutiert und deren Eignung für die Generierung der Metadatentypen des LOM-Standards verifiziert. Durch einen experimentellen Werkzeugvergleich wird ferner die praktische Anwendbarkeit der Methoden stellvertretend am Beispiel ausgewählter Keyphrase-Extraction-Tools analysiert.

Textauszug (computergeneriert)

Martin-Luther-Universität Halle-Wittenberg
Wirtschaftswissenschaftliche Fakultät
Institut für Wirtschaftsinformatik und OR

Diplomarbeit
zur Erlangung des Grades
eines Diplom-Wirtschaftsinformatikers

Automatische Metadatengenerierung für Lernobjekte
experimenteller Werkzeugvergleich und Kategorisierung von
Metadatentypen

vorgelegt von: Matthias Bauer

Lehrstuhl für Wirtschaftsinformatik,
Betriebliches Informationsmanagement

 

Inhaltsverzeichnis

Anhangsverzeichnis ... V
Abbildungsverzeichni ... VI
Tabellenverzeichnis ... VI
Abkürzungsverzeichni ... VII

1 Einleitung ... 1

2 Grundlagen und Definitionen ... 3

2.1 E-Learning ... 3

2.2 Lernobjekte ... 4
2.2.1 Allgemeines ... 4
2.2.2 Aufbau von Lernobjekten ... 5
2.2.3 Lebenszyklus von Lernobjekten ... 7

2.3 Überblick und Abgrenzung technischer Systeme im E-Learning ... 8
2.3.1 Autorenwerkzeuge ... 8
2.3.2 Learning-Management-Systeme ... 8
2.3.3 Content-Management-Systeme ... 9
2.3.4 Learning-Content-Management-Systeme ... 10

2.4 Metadaten ... 11
2.4.1 Allgemeines ... 11
2.4.2 Charakteristiken von Metadaten ... 11

2.5 Metadatengenerierung ... 13
2.5.1 Allgemeines ... 13
2.5.2 Manuelle Metadatengenerierung ... 14
2.5.3 Automatische Metadatengenerierung ... 16

2.6 Zusammenfassung ... 16

3 Metadaten zur Beschreibung von Lernobjekten ... 19

3.1 Metadatenstandards und -spezifikationen für Lernobjekte ... 19

3.2 Kategorien und Datenelemente des LOM-Standards ... 22
3.2.1 General ... 23
3.2.2 Life Cycle ... 23
3.2.3 Meta-Metadata ... 24
3.2.4 Technical ... 24
3.2.5 Educational ... 25
3.2.6 Right ... 26
3.2.7 Relation ... 26
3.2.8 Annotation ... 27
3.2.9 Classification ... 27

3.3 Charakteristiken des LOM-Standards ... 28

3.4 Application Profiles ... 29

3.5 Anforderungen an Metadaten für Lernobjekte ... 30

3.6 Zusammenfassung ... 32

4 Quellen der automatischen Metadatengenerierung für Lernobjekte ... 34

4.1 Das Lernobjekt selbst ... 34
4.1.1 Inhalt des Lernobjekts ... 35
4.1.2 Interne Metadaten des Lernobjekts ... 35
4.1.3 Struktur des Lernobjekt ... 38

4.2 Der Kontext des Lernobjekts ... 38
4.2.1 Administration des LCMSs ... 38
4.2.2 Nutzerprofile ... 39
4.2.3 Feedback der Nutzer ... 40
4.2.4 Logdateien ... 40
4.2.5 Metadaten anderer Lernobjekte ... 41
4.2.6 Externe Quellen ... 41

4.3 Zusammenfassung ... 41

5 Ressourcenbasierte Methoden der automatischen Metadatengenerierung ... 43

5.1 Metadata-Harvesting ... 43
5.1.1 Allgemeines ... 44
5.1.2 Metadaten durch Metadata-Harvesting ... 45
5.1.3 Einschränkungen und Probleme ... 46

5.2 Metadata-Extraction ... 47
5.2.1 Allgemeines ... 47
5.2.2 Metadaten durch Metadata-Extraction ... 49
5.2.3 Einschränkungen und Probleme ... 54

5.3 Classification ... 56
5.3.1 Allgemeines ... 56
5.3.2 Metadaten durch Classification ... 57
5.3.3 Einschränkungen und Probleme ... 63

5.4 Metadata-Propagation ... 64
5.4.1 Allgemeines ... 64
5.4.2 Metadaten durch Metadata-Propagation ... 65
5.4.3 Einschränkungen und Probleme ... 68

5.5 Zusammenfassung ... 69

6 Kontextbasierte Methoden der automatischen Metadatengenerierung ... 70

6.1 Auslesen interner Informationsquellen ... 70
6.1.1 Allgemeines ... 70
6.1.2 Metadaten durch Auslesen interner Informationsquellen ... 71
6.1.3 Einschränkungen und Probleme ... 74

6.2 Auslesen externer Informationsquellen ... 74
6.2.1 Allgemeines ... 75
6.2.2 Metadaten durch Auslesen externer Quellen ... 75
6.2.3 Einschränkungen und Probleme ... 76

6.3 Verwendung von Templates und Regeln ... 76
6.3.1 Allgemeines ... 76
6.3.2 Metadaten durch die Verwendung von Templates und Regeln ... 77
6.3.3 Einschränkungen und Probleme ... 79

6.4 Zusammenfassung ... 80

7 Konfliktbewältigung ... 81

7.1 Konflikte zwischen verschiedenen Methoden ... 81

7.2 Experimenteller Vergleich von Keyphrase-Extraction-Tools ... 84
7.2.1 Testkandidaten ... 85
7.2.2 Methodenbeschreibung ... 85
7.2.3 Ergebnisse ... 87
7.2.4 Analyse und Schlussfolgerung ... 89

7.3 Strategien zur Konfliktbewältigung ... 90

7.4 Zusammenfassung ... 92

8 Schlussbetrachtung ... 94

Literaturverzeichnis ... 96

Anhang ... IX


1 Einleitung

E-Learning gewinnt in der universitären Ausbildung sowie in der außeruniversitären Aus- und Weiterbildung zunehmend an Bedeutung (vgl. Hörmann, 2006, S.3) und hat sich als Lehr- und Lernform fest etabliert (vgl. Niegemann et al., 2004, S.17). Die Vorteile liegen vor allem in der Selbstbestimmung von Lernort, Lernzeit und Lerntempo. Darüber hinaus lässt sich durch die Integration multimedialer Elemente die Interaktivität zwischen Lerner und Lernmedium erhöhen. Die Erstellung hochwertiger digitaler Lernmaterialien ist jedoch mit hohen Kosten verbunden. Aus diesem Grund wird eine Wiederverwendung bestehender Lernmaterialien angestrebt (vgl. Hörmann, 2006, S.3).

Das Prinzip der Wiederverwendung findet sich im Konzept der Lernobjekte (LO) wieder (vgl. Knolmayer, 2004, S.222). Dabei handelt es sich um digitale Lernmaterialien, welche einmal erstellt und anschließend in verschiedenen Kontexten wieder verwendet werden können (vgl. Polsani, 2003, S.1). Die Verwaltung und Bereitstellung der LO erfolgt unter anderem durch Lernplattformen wie Learning Content Management Systeme (LCMS) oder Learning Management Systeme (LMS), wobei mittelgroße LMS gewöhnlich Zehntausende LO beinhalten. Für den Austausch von LO zwischen verschiedenen Systemen und das Wiederfinden von LO innerhalb großer Datenbestände sind Metadaten erforderlich (vgl. Ochoa et al., 2005, S.1).

Die Metadaten eines LOs beschreiben normalerweise seine Beziehungen zu anderen LO, seinen Inhalt, seinen Lebenszyklus, seine technischen Eigenschaften und seine mögliche Verwendung (vgl. Motelet et al., 2006, S.3). Metadaten können die Suche und das Wiederfinden von LO innerhalb eines technischen Systems signifikant verbessern, indem sie dabei helfen, relevante von irrelevanten LO zu unterscheiden (vgl. Greenberg et al., 2006, S.3). Dennoch sind technische Systeme, welche intensiven Gebrauch von Metadaten machen, nicht weit verbreitet. Eines der hauptsächlichen Hindernisse stellt dabei der hohe Zeit- und Arbeitsaufwand dar, welcher zur Erstellung der Metadaten erforderlich ist. Zur vollständigen Beschreibung aller Komponenten eines dreistündigen Kurses kann es beispielsweise notwendig sein, zwischen 1.000 und 5.000 separate Metadatenwerte festzulegen (vgl. Hatala/Forth, 2003, S.1). Eine mögliche Lösung dieses Problems besteht in der automatischen Generierung der Metadaten für LO.

Vor dem beschriebenen Hintergrund soll das Ziel dieser Arbeit sein, die Möglichkeiten der automatischen Metadatengenerierung zur Beschreibung von LO aufzuzeigen. Dazu sollen die jeweiligen Methoden und Ansätze der automatischen Metadatengenerierung beschrieben sowie deren Einschränkungen und Probleme dargelegt werden. Zudem soll geprüft werden, welche Metadaten durch welche Methode generiert werden können. Durch einen experimentellen Werkzeugvergleich soll ferner die praktische Anwendbarkeit der Methoden stellvertretend am Beispiel ausgewählter Keyphrase- Extraction-Tools überprüft werden.

Die vorliegende Arbeit gliedert sich in 8 Kapitel. Im Anschluss an die Einleitung führt Kapitel 2 zunächst in die Thematik ein. Dazu werden fundamentale Begriffe wie Lernobjekt, Metadaten und Metadatengenerierung erläutert sowie technische Systeme im E-Learning vorgestellt und voneinander abgegrenzt. Kapitel 3 stellt die zur Beschreibung von Lernobjekten relevanten Datenelemente vor. Des Weiteren werden Anforderungen an Metadaten beschrieben, welche im Rahmen der automatischen Metadatengenerierung zu berücksichtigen sind. Kapitel 4 beschreibt ausgewählte und für die automatische Metadatengenerierung relevante Informationsquellen. Darauf aufbauend werden in Kapitel 5 die ressourcenbasierten und in Kapitel 6 die kontextbasierten Methoden der automatischen Metadatengenerierung betrachtet. Neben einer Beschreibung des Prinzips der jeweiligen Methode wird erläutert, welche Metadaten durch die Methode generiert werden können. Zudem werden den Methoden die relevanten Informationsquellen zugeordnet sowie Abhängigkeiten, Einschränkungen und Probleme im Hinblick auf ihren Einsatz ermittelt. Kapitel 7 zeigt potentielle Konflikte zwischen den vorgestellten Methoden auf und erläutert Strategien zur Konfliktbewältigung. Im Rahmen dessen wurde ein experimenteller Werkzeugvergleich durchgeführt, welcher die qualitativen Unterschiede verschiedener Ansätze aufzeigen soll. In Kapitel 8 werden die gewonnenen Erkenntnisse zusammengefasst.


2 Grundlagen und Definitionen

Dieses Kapitel soll zunächst in die Thematik einführen. Es werden fundamentale Begriffe wie Lernobjekt, Metadaten und Metadatengenerierung erläutert, technische Systeme im E-Learning vorgestellt und voneinander abgegrenzt und die für das weitere Verständnis notwendigen Zusammenhänge beschrieben.


2.1 E-Learning

Die Abkürzung „E-Learning“ („electronic learning“) gehört zu den E-Begriffen (engl. „e-terms“) und steht für „elektronisch unterstütztes Lernen“ (vgl. Bendel, 2003, S.15). Der Begriff existiert seit Ende der neunziger Jahre, das Themengebiet jedoch schon deutlich länger (vgl. Maier et al., 2005, S.291). Bereits 1984 wurden die ersten Computer-Based Trainings (CBT) entwickelt, welche Lerninhalte in elektronischer Form anboten. Sie wurden ab 1999 mehr und mehr durch Web-Based Trainings (WBT) abgelöst, welche die Lerninhalte über das Internet zur Verfügung stellen. Durch die Erweiterung um Möglichkeiten der synchronen und asynchronen Kommunikation, wie E-Mail, Chat, Foren oder Newsletter, entstanden schließlich Lernplattformen (vgl. Hessen-IT, 2007). Gleichzeitig entwickelte sich eine enorme Begriffsvielfalt für das Lernen über das Internet: Distance Learning, Online Learning, Web-based Learning, Web-based Instruction, Internet-based Learning, Distributed Learning, Advanced Distributed Learning u.v.m. (vgl. Khan, 2005, S.3).

[...]

Kommentare

Kommentar hinzufügen

Dieser Text kann über folgende URL aufgerufen und zitiert werden:

http://www.grin.com/e-book/83137/