meiner Mutter
Danksagung
Die primäre Danksagung geht an den Betreuer meiner Arbeit, Herrn PD Dr. Wolfgang Schindler, für dessen kompetente Beratung aber auch äußerst liebenswürdige Unterstützung. Er stand in jeder Phase der Entstehung dieser Dissertation als Ansprechpartner in fachlichen, methodischen aber auch terminlichen Nöten zur Verfügung. Herzlicher Dank gebührt auch meinem Zweitkorrektor, Herrn Prof. Hans Altmann. Späte Dankesworte gehen an meine ersten Lehrer der Linguistik, Herrn Dr. Hubert Gindele sowie Herrn Prof. Elmar Seebold. Ohne deren begeisternde Lehre wäre meine Leidenschaft für die Sprachwissenschaft wohl nie in dieser Form geweckt worden.
Intellektuelle Arbeit braucht materielle Grundlagen. Der Autor konnte das Promotionsstudium durch Programmiertätigkeit und technische Beratung für die Firma Internet-Queen finanzieren. Aufgrund der Doppelbelastung von Forschung und Arbeit kam es gelegentlich zu terminlichen Schwierigkeiten, die seitens der Firma in äußerst kulanter Weise hingenommen wurden. Dies ist in der Wirtschaft nicht selbstverständlich, daher möchte ich mich an dieser Stelle hierfür nochmals bedanken.
Für viele linguistische und informationswissenschaftliche Fachgespräche und praktische Hilfen zur Thematik der Dissertation möchte ich mich ausdrücklich bei Frank Sanders bedanken. Für das Layout gab Gunter Mehler zahlreiche wichtige Hilfestellungen, für die Durchführung der Umfrage Kathi Schuler. Beim Korrekturlesen der Arbeit standen Bianca und Claire hilfreich zur Seite. Für die von ihnen erbrachten zeitlichen und nervlichen Opfer nochmals ein großes Dankeschön. Für sämtliche Fehler und Versäumnisse bleiben natürlich alleine ich selbst und MS Word verantwortlich.
Intellektuelle Arbeit braucht auch emotionale Grundlagen. Für das Ertragen sämtlicher Höhen und Tiefen, die das Verfassen eines so umfangreichen Werkes mit sich bringt, danke ich besonders Claire sowie meiner Familie.
Abstract
This doctoral thesis suggests a text-linguistic approach dealing with linked electronic texts, so called HYPERTEXTS. After explaining the concept and philosophy of the hypertext-idea and elaborating on a pragmatic definition of WWW-hypertexts (Part A of the thesis), a linguistic framework, the Textlinguistisches Analysemodell für Hypertexte (TAH), is proposed (Part B). TAH provides a pragmatic-functional, top-down model to analyze CONTEXT, FUNCTION and STRUCTURE of complete hypertexts and the hypertext-components NODE and LINK. Main aim of TAH is to strictly separate the different aspects of each hypertext- and linguistic level - without isolating them.
The theoretical approach of TAH is used for a case study (Part C). Therefore a corpus of WWW-hypertexts, mainly informative and instructive ones, is examined with TAH-methods. Aim of this study is on the one hand to provide some sort of evidence for the plausibility of TAH and is on the other hand linked with a specific question of research: It deals with possibilities provided by linguistics to enhance hypertext-links with logically, semantically and/or rhetorically typed information. The conclusion of the study is to distinguish exactly between semantics of a deepstructure-knowledge-presentation, semantic and rhetoric relations of the surface, i.e. the hypertext the user can see, and the layout or traversal behavior respectively of the user interface, i.e. the browser-software. Part C mainly deals with problems of typed links on the surface of hypertexts.
Keywords: text, hypertext, text linguistics, HTML, WWW, typed links
Typographische Konventionen
- Fachtermini in Kapitälchen KOHÄRENZ ist die ...
- Objektsprache kursiv der Eigenname Peter
- Objektsprachliche Termini in Kapitälchen der Terminus KOHÄRENZ
- Texte des Corpus’ in Großbuchstaben SELF
- Zitate in doppelten Anführungszeichen „Hiermit ist gemeint [...]“
- Indirektes in einfachen Anführungszeichen der sogenannte ‚Erfolg‘
- Hyper-Links in Zitaten unterstrichen „mehr dazu hier“
- Link-Ziele in Zitaten kursiv „Etymologie: Theorie der“
- Hervorhebungen im Fließtext unterstrichen die Definition von Text
- Knotengrenzen in Zitaten als Längsstrich „... hier ... | Dazu ist ...“
Zitierkonventionen
- Zitate aus gedruckter Sekundärliteratur werden wie gewöhnlich durch ein Kürzel, bestehend aus Autorenname und Jahr, sowie der Seitenzahl wiedergegeben. Beispiel: Brinker 2001 S. 112
- Zitate aus elektronischer Sekundärliteratur werden durch das Kürzel des gesamten Hypertextes, den Dateinamen des Knotens sowie die Abschnittsüberschrift der fraglichen Textstelle wiedergegeben. Beispiel: Münz 1997b [tcai.htm] Abschnitt Verweistexte
- Hypertext-Knoten des Corpus’ werden durch das Corpuskürzel, den Dateinamen des Knotens sowie die Abschnittsüberschrift der fraglichen Textstelle zitiert. Beispiel: GRAMMIS [grammis_sys.ansicht] Abschnitt Konnektoren
Rechtschreibkonventionen
- Die Arbeit hält sich an die alten Rechtschreibregeln.
- Sämtliche Komposita, die eine informationswissenschaftliche Komponente enthalten, sind mit Bindestrich geschrieben (z.B.: Ziel-Knoten, WWW- Hypertext).
Abkürzungen
Für diese Arbeit geprägte Abkürzung:
- TAH: TEXTLINGUISTISCHES ANALYSEMODELL FÜR HYPERTEXTE
Wichtige allgemeine Abkürzungen (Erläuterungen im Glossar):
- CSS: CASCADING STYLE-SHEETS
- DC: DUBLIN CORE
- HTML: HYPERTEXT MARKUP LANGUAGE
- RDF: RESOURCE DESCRIPTION FRAMEWORK
- RET: RELATION ELEMENT THEORY
- RST: RHETORICAL STRUCTURE THEORY
- TM: TOPIC MAP
- XML: EXTENSIBLE MARKUP LANGUAGE
Die Abkürzungen der Corpus-Hypertexte sind in Kapitel 2.3 aufgelistet.
vii
Kompaktes Inhaltsverzeichnis
Prolog : Eine Bestandsaufnahme 1
1 Ausgangslage 1
2 Angaben zum Corpus 6
3 Angaben zur Literaturlage. 10
Teil A: Hypertext als Untersuchungsgegenstand. 13
4 Hypertext: Ein historischer Abriß. 14
5 Text, E-Text, Hypertext und Hypertext-Netz. 20
6 Komponenten eines Hypertextes 23
7 Zusammenfassung: Hypertexte im WWW. 43
Teil B: Ein Textlinguistisches Analysemodell für Hypertexte (TAH) 44
8 Textdefinitionen. 45
9 Textualitätskriterien. 52
10 Dimensionen einer textlinguistischen Analyse 72
11 Paratextuelle Elemente 80
12 Makrostruktur und Makrostrukturanalyse. 84
13 Referenzstruktur und referentielle Bewegung 90
14 Zusammenfassung: Das Analysemodell TAH 98
Teil C: Fallbeispiel - Typisierte Links 106
15 Technische Voraussetzungen: Links im WWW. 108
16 Vokabularien typisierter Links. 134
17 Analyse des Corpus' mit Hilfe von TAH. 172
Epilog : Einsatzmöglichkeiten des TAH. 224
Anhang: Literatur und Verzeichnisse 226
A Glossar. 227
B Fragebogen der Pilotstudie 232
C Corpusverzeichnis 233
D Literaturverzeichnis 234
viii
Komplettes Inhaltsverzeichnis
Prolog : Eine Bestandsaufnahme 1
1 Ausgangslage 1
1.1 Textlinguistische Motivation. 1
1.2 Problemstellung. 2
1.3 Vorgehensweise 3
1.4 Einschränkungen. 4
1.5 Zielgruppe 5
2 Angaben zum Corpus 6
2.1 WWW als technische Plattform. 6
2.2 Informationstexte als primäre Textsorte 6
2.3 Die Texte des Corpus’ 8
3 Angaben zur Literaturlage. 10
3.1 Literatur zu Hypertext 10
3.2 Literatur zur Textlinguistik 12
3.3 Literatur zu Textlinguistik und Hypertext. 12
Teil A: Hypertext als Untersuchungsgegenstand. 13
4 Hypertext: Ein historischer Abriß. 14
4.1 Die Pioniere: Bush, Nelson und Engelbart. 14
4.2 Der Durchbruch: Berners-Lee und das WWW 17
5 Text, E-Text, Hypertext und Hypertext-Netz. 20
5.1 Abgrenzung Text vs. Teiltext, Hypertext vs. Knoten. 20
5.2 Abgrenzung E-Text, Hypertext und Hypertext-Netz. 21
6 Komponenten eines Hypertextes 23
6.1 Allgemein. 23
6.2 Komponente I: Knoten. 23
6.2.1 Struktur 24
6.2.2 Inhalt und Größe. 25
6.2.3 Darstellungsform. 26
6.2.4 Knoten-Typen. 26
6.3 Komponente II: Links 27
6.3.1 Allgemeine Eigenschaften. 28
6.3.2 Formale Unterscheidungsmöglichkeiten. 29
6.3.3 Inhaltliche Unterscheidungsmöglichkeiten. 30
6.3.4 Unterscheidung nach dem Travesierungsverhalten. 32
6.3.5 Kritik der Link-Typologie. 32
6.4 Navigations- und Orientierungskomponenten. 33
6.4.1 Textsequenzierung, Navigation und Browsing. 33
6.4.2 Orientierungsprobleme und kognitive Mehrbelastung. 34
6.4.3 Traditionelle Orientierungshilfen 36
ix
6.4.4 Verzeichnisse 37
6.4.5 Metainformationen. 37
6.4.6 Typographische Auszeichnungen. 38
6.4.7 Hypertext-spezifische Orientierungs- und Navigationshilfen. 38
6.4.8 Browser-Software. 38
6.4.9 Backtracking, Historie, Bookmarks. 40
6.4.10 Graphische Übersichten. 41
6.4.11 Anfrage- bzw. Suchmechanismen: Information Retrieval. 41
6.4.12 Guided Tours. 42
7 Zusammenfassung: Hypertexte im WWW. 43
Teil B: Ein Textlinguistisches Analysemodell für Hypertexte (TAH) 44
8 Textde finitionen. 45
8.1 Text als vorwissenschaftliche Größe. 45
8.2 Text: Produkt und Produktion. 45
8.3 Die Entwicklung des Terminus’ Text 46
8.4 Exkurs: Einheiten zwischen Text und Satz. 50
9 Textualitätskriterien. 52
9.1 Kohäsion. 53
9.2 Kohärenz 56
9.2.1 Kohärenz im Hypertext 58
9.2.2 Exkurs: Kohärenzerzeugung durch Schemata. 58
9.3 Intentionalität 63
9.4 Akzeptabilität. 64
9.5 Informativität. 66
9.6 Situationalität 67
9.7 Intertextualität 67
9.8 Zusammenfassung. 69
10 Dimensionen einer textlinguistischen Analyse 72
10.1 Allgemein. 72
10.2 Kontextuelle Bedingungen. 72
10.2.1 Kommunikationsform. 73
10.2.2 Handlungsbereich. 74
10.3 Textfunktion. 75
10.4 Textstruktur 76
10.5 Textsorte. 77
11 Paratextuelle Elemente 80
11.1 Traditionelle paratextuelle Elemente von Texten. 80
11.2 Paratextuelle Elemente von Hypertexten. 81
12 Makrostruktur und Makrostrukturanalyse. 84
12.1 Allgemeines: Textthema und Makrostruktur 84
12.2 Exemplarische Makrostrukturanalyse eines Hypertextes 86
x
13 Referenzstruktur und referentielle Bewegung 90
13.1 Referenzbeziehungen in Texten. 90
13.2 Modell der referentiellen Bewegung 91
13.3 Referentielle Bewegung in Hypertexten. 92
13.4 Die Rolle der Quaestio 96
14 Zusammenfassung: Das Analysemodell TAH 98
14.1 Ausrichtung und Vorteile des Analysemodells. 98
14.2 Einschränkungen. 99
14.3 Überblicksdarstellung von TAH 101
14.4 Anmerkungen zu den Untersuchungsebenen. 103
14.4.1 Anmerkungen zur Ebene Hypertext. 103
14.4.2 Anmerkungen zu den Ebenen Knoten, Absatz und Satz 103
14.4.3 Anmerkungen zur Ebene Link. 104
Teil C: Fallbeispiel - Typisierte Links 106
15 Technische Voraussetzungen: Links im WWW. 108
15.1 Datenhaltung, Zwischenschicht und Oberflächenstruktur 108
15.1.1 Von HTML zum Semantic Web. 108
15.1.2 Die Ebenen einer Link-Typisierung. 109
15.1.3 Die Oberflächenstruktur als Problembereich der Untersuchung. 113
15.2 Linking in HTML und XML. 115
15.2.1 HTML als SGML-Anwendung. 115
15.2.2 HTML als XML-Anwendung 122
15.2.3 Das Hyperlink-Modell von XML: Xlink 125
15.2.4 Implementierung typisierter Links im Corpus’ 127
15.2.5 Mögliche zukünftige Implementierungen. 129
16 Vokabularien typisierter Links. 134
16.1 Problemstellung. 134
16.2 Linguistische Ansätze 135
16.2.1 Relation Element Theory. 135
16.2.2 Rhetorical Structure Theory. 141
16.3 Hypertext-spezifische Ansätze 149
16.3.1 Allgemeine Anmerkungen und kleine Pilotstudie 150
16.3.2 Typisierte Links in älteren Hypertext-Systemen. 153
16.3.3 Typisierte Links in HTML 156
16.4 Zusammenfassung: Geeignete Vokabularien. 170
17 Analyse des Corpus' mit Hilfe von TAH. 172
17.1 Vorbemerkung zur Analyse 172
17.2 Allgemeine, exemplarische Analyse des Corpus’ 173
17.2.1 Kontextuelle Aspekte 173
17.2.2 Kommunikativ-funktionale Aspekte. 175
17.2.3 Konventionelle Aspekte 177
17.2.4 Strukturelle und paratextuelle Aspekte 178
xi
17.2.5 Intertextuelle Aspekte 185
17.3 Analyse der Typisierten Links 189
17.3.1 Analyse der proprietären Codierung von SELF 189
17.3.2 Analyse der proprietären Codierung von SELF8. 198
17.3.3 Analyse der proprietären Codierung von GRAMMIS 201
17.3.4 Analyse der proprietären Codie rung von SPORT1. 205
17.3.5 Versuch einer RST-Codierung des Corpus’ 210
17.3.6 Versuch einer Codierung des Corpus’ mit Hilfe des Dublin Core. 212
17.3.7 Versuch einer Codierung des Corpus’ mit Hilfe des rel-Attributs. 213
17.4 Zusammenfassung: Auswertung der Ergebnisse. 214
17.4.1 Aussagen zur Methode. 214
17.4.2 Aussagen zu inhaltlichen Fragestellungen bzgl. der Ebene Link. 216
Epilog : Einsatzmöglichkeiten des TAH. 224
Anhang: Literatur und Verzeichnisse 226
A Glossar. 227
B Fragebogen der Pilotstudie 232
C Corpusverzeichnis 233
D Literaturverzeichnis 234
xii
Abbildungsverzeichnis
1 Knotenstruktur. 24
2 Intra-, inter- und extra-hypertextuelle Links 29
3 Link-Klassifizierung nach Lokalität vs. Globalität. 30
4 Oberfläche einer Browser-Software. 39
5 Link-Struktur eines einfachen Hypertextes 87
6 MODELL DER REFERENTIELLEN BEWEGUNG. 92
7 Ebenen der Typisierung. 110
8 Typisierung durch Mißbrauch des title-Attributs. 127
9 Link-Typisierung durch Piktogramme 128
10 TOPIC MAPS - TOPICS UND OCCURRENCES. 131
11 TOPIC MAPS - TOPIC ASSOCIATIONS. 132
12 Einfach Textanalyse mit RST 147
13 SELF tcab.htm Abschnitt SGML-gerechten Dokumenttyp angeben 164
14 Windows-Ordnerstruktur als Metapher für die Knoten-Hierarchie in SELF8. 179
15 Pull-Down-Menü Quickbar als hypertext-interne Navigationshilfe von SELF8. 182
16 Pull-Down-Menü Übersicht als hypertext-interne Navigationshilfe von GRAMMIS 184
17 Navigationsleisten und Suchfunktion in W3C. 185
18 Untypisierte Links in W3C /Math/ Abschnitt Highlights. 186
19 Extra-hypertextueller Link in SELF tgba.htm Abschnitt WWW-Server für MS 187
20 SELF8 cgiperl/intro/webserverpc.htm Abschnitt Geeignete Produkte. 187
21 Platzhalter-Knoten in Sport1 dynamisch erzeugter Knoten 188
22 SELF tdbc.htm Abschnitt Schnellformatierung im Text 190
23 SELF tdca.htm Abschnitt Textschatten (text-shadow) 195
24 SELF8 editorial hinweise.htm Abschnitt Neu in Version 8.0 198
25 SELF8 css formate direkt.htm Abschnitt Formatdefinitionen. 200
26 SELF8 css formate anzeige styleattr.htm Abschnitt Die Seite 200
27 GRAMMIS grammis sys.ansicht Abschnitt Konnektoren ( Auswahl Konnektoren) 201
28 Piktogramme in SPORT1 dynamisch erzeugter Knoten 206
29 Mouse-Over-Text in Sport1 dynamisch erzeugter Knoten 208
30 RST-typisierter Knoten SELF tdca.htm Abschnitt Textschatten (text-shadow) 211
31 Style-Sheets der Link-Typenklassen 222
xiii
Tabellenverzeichnis
1 Hypertexte des Corpus’ 9
2 Makrostrukturanalyse von Knoten Buchvorstellung. 87
3 Makrostrukturanalyse von Knoten Seebold. 88
4 Referentielle Bewegung in einem Hypertext 93
5 Das TEXTLINGUISTISCHE ANALYSEMODELL FÜR HYPERTEXTE (TAH) - Ebene Hypertext. 101
6 Das TEXTLINGUISTISCHE ANALYSEMODELL FÜR HYPERTEXTE (TAH) - Ebene Knoten. 101
7 Das TEXTLINGUISTISCHE ANALYSEMODELL FÜR HYPERTEXTE (TAH) - Ebene Link 102
8 RET-Familie 1: ELEMENTS OF INTENSIONAL FORCE. 136
9 RET- Familie 2: DIMENSIONAL ELEMENTS. 136
10 RET-Familie 3: ELEMENTS OF AGREEMENT 137
11 RET-Familie 4: PROPOSITIONAL ELEMENTS. 137
12 RET-Familie 5: ELEMENTS OF PART -WHOLE INCLUSION 137
13 Komplexe RET-Familie 1: CONTRAST 137
14 Komplexe RET-Familie 2: SIMILARS. 138
15 Komplexe RET-Familie 3: CLASS INCLUSION. 138
16 Komplexe RET-Familie 3: CASE RELATION. 138
17 Komplexe RET-Familie 5: PART -WHOLE. 138
18 Presentational Relations der RST. 143
19 Subject Matter Relations der RST. 143
20 Multinuclear Relations der RST. 143
21 Relation Evidence als Beispiel einer PRESENTATIONAL RELATION der RST. 144
22 Relation Condition als Beispiel einer SUBJECT MATTER RELATION der RST. 144
23 Relation Contrast als Beispiel einer MULTINUCLEAR RELATION der RST 145
24 Ergebnis der Pilotstudie. 151
25 Heuristische Typensammlung der Pilotstudie 152
26 Link-Typen nach Duncan. 154
27 Link-Typen des AUTHOR’S ARGUMENTATION ASSISTANT (AAA) 155
28 Relationen der rel- und ref-Attribute. 158
29 Relationen des DUBLIN CORE 160
30 Piktogramme zur Link-Typisierung in SELF. 163
31 Zusätzliche Piktogramme zur Link-Typisierung in SELF8. 166
32 QBullets - Navigationssymbole 167
33 QBullets - Multimediale Symbole 167
34 QBullets - Semantische Symbole 167
35 QBullets - Netzwerkspezifische Symbole. 168
36 QBullets - Vermischte Symbole 168
37 Funktion der Piktogramme in SPORT1. 207
38 Vorschlag einer Link-Typologie 221
39 Mediale Modifizierer. 221
40 Modifizierer des Browser-Verhaltens. 222
41 Glossar 231
Prolog: Eine Bestandsaufnahme 1
Prolog: Eine Bestandsaufnahme
1 Ausgangslage
Die technische Entwicklung der Informationstechnologien schreitet mit großer Geschwindigkeit voran. Während Begriffe wie INTERNET, HTML und WWW vor fünf Jahren höchstens einigen Interessierten bekannt waren, wird heute damit geworben, daß vom Enkel bis zur Oma die gesamte Familie ‚drin‘ ist - im weltweiten Datennetz. Während gesellschaftliche und wissenschaftliche Auswirkungen dieser Änderungen noch nicht mal im Ansatz aufgearbeitet worden sind, hat auf technischer Seite bereits die zweite ‚Internet-Revolution‘ begonnen: die der Um-wandlung des heutigen darstellungsorientierten WWW in ein Netzwerk von Bedeutungen, in ein SEMANTIC WEB. Eines bleibt jedoch unverändert: Das WWW wird nach wie vor aus verknüpften elektronischen Texten bestehen - aus sogenannten HYPERTEXTEN.
Den sich immer schneller entwickelnden Technologien muß fachwissenschaftliche Grundlagenforschung entgegen bzw. zur Seite gestellt werden. Die vorliegende Arbeit ist ein technisch orientierter Beitrag zur textlinguistischen Grundlagen-forschung. Ihr Ziel ist zu zeigen, daß mit aktuellen textlinguistischen Möglichkeiten durchaus fruchtbare Untersuchungen von Hypertexten möglich sind.
1.1 Textlinguistische Motivation
Eine Frage drängt sich freilich gleich zu Beginn auf: Ist die Textlinguistik denn überhaupt für Hypertexte zuständig? Hierauf sei mit einem Bonmot aus der textlinguistischen Hypertext-Forschung geantwortet:
„Wenn sich nicht herausstellen sollte, daß HT [= Hypertext] im selben Umfang Texte sind
wie Walfische Fische, dann gilt: Die Linguistik beschäftigt sich unter anderem mit Texten. HT
sind Texte. Also beschäftigt sich die Linguistik mit HT.“ (Freisler 1994 S. 5)
Ob nun wirklich dort ‚Text drin ist, wo Text drauf steht‘, wird erst die genauere Betrachtung des Untersuchungsgegenstandes zeigen. Nichts scheint jedoch auf den ersten Blick näher zu liegen, als daß sich die für Texte zuständige linguistische Teildisziplin der TEXTLINGUSTIK dieser elektronischen Gebilde annimmt. Problematisch ist hierbei nur, daß die Textlinguistik noch immer um die Definition der Größe TEXT ringt. Zugegebenermaßen liegen hier die Verhältnisse deutlich unklarer als etwa bei der linguistischen Größe SATZ. Allerdings arbeiten
Prolog: Eine Bestandsaufnahme 2
auch Syntaktiker nicht mit einer allgemein anerkannten Festlegung letzterer Größe, sondern mit unterschiedlichen, der jeweiligen Fragestellung angepaßten, theoretisch determinierten Satzdefinitionen - und dies mit beachtlichen Erfolgen. In der vorliegenden Arbeit wird ein KOMMUNIKATIV-FUNKTIONALER TEXTBEGRIFF vorgestellt, der sich für praktische Untersuchungen von Hypertexten eignet. Auf (durchaus existierende) theoretische Unzulänglichkeiten bzw. Gegenentwürfe wird hierbei stets hingewiesen.
Bis jetzt wurden hauptsächlich Untersuchungen zu einzelnen Aspekten der TEXTUALITÄT von Hypertexten (meist kontrastiv zu herkömmlichen Texten) durchgeführt. Im Vordergrund standen primär Probleme von KOHÄSION und KOHÄRENZ. Die vorliegende Arbeit möchte hingegen einen textlinguistischen Orientierungsrahmen für sich anschließende, breiter angelegte praktische textwissenschaftliche (siehe unten) Untersuchungen von Hypertexten liefern. Hypertexte werden hierfür in mehrere Ebenen unterteilt und auf verschiedene Aspekte hin untersucht. Ein solcher Beschreibungsapparat wird in dieser Arbeit als TAH - als TEXTLINGUISTISCHES ANALYSEMODELL FÜR HYPERTEXTE - eingeführt und exemplarisch auf dessen Anwendbarkeit hin geprüft.
1.2 Problemstellung
Als Untersuchungsgegenstand werden, wie gesagt, keine gedruckten Texte oder Diskurse der gesprochenen Sprache verwendet, sondern Hypertexte. Die Besonderheit dieser Texte ist neben ihrer elektronischen Realisierung eine tendenziell ‚nicht-lineare‘ Anordnung der Information in Teiltexte, sogenannte KNOTEN, die miteinander über Verweise, sogenannte LINKS, verbunden sind. Bei der Lektüre entscheidet der Leser in der Regel relativ frei über die Reihenfolge der zu rezipierenden Knoten. Relativ deshalb, weil der Autor mit dem Setzen von Links natürlich die Zahl der NAVIGATIONSMÖGLICHKEITEN 1 während der Lektüre begrenzt: Je mehr Links innerhalb eines Knotens existieren, um so mehr mögliche LESEPFADE kann der Leser bei der Lektüre einschlagen.
Eine allgemein akzeptierte Definition des Phänomens HYPERTEXT steht noch aus, was wiederum nur verständlich ist, da Hypertexte ja selbst (jedenfalls zum größten Teil) aus der noch nicht exakt festgelegten linguistischen Größe TEXT bestehen. Ebenso wie bei der Diskussion des Textbegriffes werden für den Terminus
1 Dieser Vorgang der Textsequenzierung innerhalb eines Hypertextes durch den Leser wird oft mit
Navigieren in einem Hypertext paraphrasiert.
Prolog: Eine Bestandsaufnahme 3
HYPERTEXT unterschiedliche Ansätze der Sekundärliteratur kritisch vorgestellt. An dieser Stelle sollte jedoch klar sein, daß nicht auf alle offenen Fragen der HYPERTEXT -THEORIE eingegangen werden kann. Es wird sich jedoch zeigen, daß für die Struktur von Hypertexten eine relativ gut verwendbare und technisch saubere Arbeitsdefinition zu finden ist. 1 Auch die für Teil C dieser Arbeit relevanteste Komponente des Hypertextes, der LINK, ist zwar intuitiv gut faßbar, theoretisch jedoch nicht ganz einfach festzulegen. Aber auch hier läßt sich eine Definition erarbeiten, die ausreichend für die vorliegende Untersuchung ist.
1.3 Vorgehensweise
Der Untersuchungsgegenstand HYPERTEXT wird im Hauptteil A ausführlich eingeführt, das textlinguistische Instrumentarium in Teil B erarbeitet. Als Kernstück der Arbeit wird am Ende des Hauptteils B ein TEXTLINGUISTISCHES ANALYSEMODELL FÜR HYPERTEXTE (TAH) vorgeschlagen, das im folgenden Fallbeispiel des Hauptteils C zur Untersuchung der folgenden Problematik exemplarisch verwendet wird: Jeder Link stellt den Leser eines Hypertextes vor die Entscheidung, ob er im aktuellen Knoten weiterlesen oder aber dem Link folgend zu dessen ZIEL-KNOTEN 2 wechseln will. Dies kann unter Umständen zu einer kognitiven Mehrbelastung des Lesers führen und ihm die Orientierung in komplexeren Hypertexten erschweren. 3 Eine Verbesserung der Situation wäre eventuell dadurch zu erreichen, daß man dem Leser, bevor dieser einen Link tatsächlich verfolgt, signalisiert, um was für eine Art von Knoten es sich beim Ziel des Links handelt; also etwa, ob dort ein Beispiel für den beschriebenen Sachverhalt des Ausgangs-Knotens zu finden ist, eine Gegenposition zu vorher Gesagtem o.ä. Auch Aussagen zum Medium des Ziel-Knotens sind denkbar, etwa ob es sich um einen textuellen Knoten oder ein Film- bzw. Tondokument handelt. Der Fachausdruck für solche Links mit Signalfunktion ist TYPISIERTER LINK. Typisierte Links werden im Rahmen des Fallbeispieles mit Hilfe von TAH untersucht: Dort wird gefragt, welche Verknüpfungsmöglichkeiten rhetorischer, semantischer und/oder logischer Natur prinzipiell zwischen Textteilen existieren und ob, bzw. wie, diese zu klassifizieren sind. Herangezogen werden hierfür linguistische und informationswissenschaftliche Typologien sowie die proprietären Typisierungsansätze der Corpus-Hypertexte.
1 Dies freilich auf Grundlage des Textbegriffes, der in dieser Arbeit verwendet wird und auf dessen
theoretische Unvollständigkeiten bereits hingewiesen wurde.
2 Die Corpus-Hypertexte haben keine Links, die über mehr als einen Zielknoten verfügen. Mit
neuen Technologien ist dies jedoch denk- und machbar, mehr dazu auch in Kapitel 15.2.3.
3 Siehe hierzu Kapitel 6.4.2.
Prolog: Eine Bestandsaufnahme 4
1.4 Einschränkungen
Vorliegende Untersuchung ist, wie gesagt, eine genuin textlinguistische. Dies scheint auf den ersten Blick insofern problematisch, als daß sich seit längerem eine tendenziell interdisziplinäre Textwissenschaft 1 auszubilden versucht, die neben der Linguistik auch Disziplinen wie Psychologie, Neurobiologie, Soziologie und weitere Teilbereiche integriert. Diese Herangehensweise erhält durch das sich in (bestimmten) sprachwissenschaftlichen Kreisen immer mehr durchsetzende Selbstverständnis der Linguistik als Teildisziplin einer allgemeinen Kognitionswissenschaft 2 vermehrt Rückendeckung. Auch der Untersuchungsgegenstand HYPERTEXT ist natürlich für die unterschiedlichsten Disziplinen relevant, wie die Veröffentlichungsflut aus BWL, Soziologie, Philosophie, Literaturtheorie u.ä. zu diesem Thema zeigt (siehe Kapitel 3).
Meiner Ansicht nach hängt ein interdisziplinäres Projekt bei allen möglichen Synergieeffekten jedoch stark vom Input der Einzeldisziplinen ab. Die Textlinguistik als relativ neue sprachwissenschaftliche Teildisziplin kann im Moment noch nicht die Ergebnisse liefern, die linguistische Grundlage für eine fächerübergreifende Untersuchung von kognitiver TEXTVERARBEITUNG oder gar HYPER- TEXT -VERARBEITUNGsein könnte. Auf die Integration des deskriptiven Analysemodells in ein umfassendes kognitives Modell wurde daher bewußt verzichtet, TAH soll als rein textlinguistischer Beitrag zur Beschreibung hypertextueller Funktionen und Strukturen gesehen werden. 3 Insofern versucht die vorliegende Untersuchung auch, einen (bescheidenen) Teil der noch ausstehenden ‚Hausaufgaben‘ aus dem Bereich der Textlinguistik zu erledigen. Die Ergebnisse könnten dann ihrerseits Input für empirische Untersuchungen und angewandte Forschung sein, etwa für die Implementierung einer semantisch angereicherten Hypertext-Oberfläche (siehe Kapitel 15.1.3) unter Benutzung neuer Texttechnologien wie XLINK, XML-TOPIC-MAP und weiterer XML-DERIVATE.
1 Vgl. hierzu etwa Kapitel 1 von van Dijk 1980a, Strohner 1990 sowie Friederici 1999.
2 Vgl. hierzu etwa Rickheit u. Strohner 1993, Sucharowski 1996 sowie Pörings u. Schmitz 1999.
3 Auf eine mögliche, voraussichtlich unproblematische Einbettung des deskriptiven TAH in ein
größeres kognitives Erklärungsmodell der Hypertext-Verarbeitung wird im Kapitel Ausblick dieser
Arbeit hingewiesen.
Prolog: Eine Bestandsaufnahme 5
1.5 Zielgruppe
Die Arbeit wendet sich explizit an ein linguistisches Fachpublikum mit gewissen interdisziplinären Neigungen sowie einem besonderen Interesse an moderner Texttechnologie. Allgemeine linguistische Fachbegriffe werden daher ohne gesonderte Vorstellung verwendet. Textlinguistische Termini werden hingegen ausführlich eingeführt und kritisch besprochen. Für das Verständnis ist eine gewisse Vertrautheit mit dem Internet sowie die Kenntnis informationswissenschaftlicher Grundbegriffe hilfreich - aber nicht unabdingbar. Die für die Arbeit relevanten technischen Konzepte, Implementierungen und Spezifikationen werden von Grund auf eingeführt. Hierbei wird, soweit dies die Komplexität der Materie ermöglicht, ‚behutsam‘ vorgegangen - ohne jedoch übermäßig stark zu vereinfachen. Der technisch interessierte Leser wird hauptsächlich in den Fußnoten auf Einschränkungen, Problembereiche und weiterführende Literatur aus der Informatik verwiesen. Die wichtigsten technischen Begriffe sind darüber hinaus in einem Glossar aufgeführt.
Die Arbeit dürfte durchaus auch für Informatiker interessant sein, die gewillt sind, sich mit sprachwissenschaftlichen Fragestellungen auseinanderzusetzen. In terminologischen Nöten sei auf die allgemeinen linguistischen Nachschlagewerke aus Kapitel 3.2 verwiesen.
Leser, die mit den Konzepten von Hypertext und den Implementierungen von Markup-Sprachen bereits vertraut sind, können die ausführlichen informations- wissenschaftlichen Einführungen des Kapitels 15 getrost ‚querlesen‘.
Prolog: Eine Bestandsaufnahme 6
2 Angaben zum Corpus
Nachdem die allgemeine Ausrichtung der Untersuchung im letzten Kapitel erläutert wurde, sollen nun die Präferenzen genannt werden, die für die Auswahl der Hypertexte des Corpus’ von Bedeutung waren.
2.1 WWW als technische Plattform
Bei der Auswahl des Corpus’ müssen gewisse Festlegungen gemacht werden, um die Vergleichbarkeit der Corpus-Hypertexte zu gewährleisten: Zuerst sollte man sich auf eine mediale Realisierung, eine technische Plattform der zu untersuchenden Hypertexte einigen. Zahlreiche Softwaresysteme stehen nämlich zur Implementierung eines Hypertextes zur Verfügung (vgl. Schnupp 1992 S. 97 f.). Als derzeit mit Abstand bedeutendste elektronische Realisierung darf das WORLD WIDE WEB (WWW) gelten. 1 Alle anderen Hypertext-Systeme führen heute mehr oder weniger ein Nischendasein. 2 Aus diesem Grund wird sich die Arbeit ausschließlich mit im WWW präsenten und in der Sprache HTML 3 geschriebenen Hypertexten beschäftigen. Nur bei relevanten Besonderheiten anderer Systeme wird auf diese Implementierungen kurz eingegangen.
2.2 Informationstexte als primäre Textsorte
Die zweite Einschränkung betrifft die TEXTSORTEN 4 , die es zu untersuchen gilt. Im WWW sind verschiedene Textsorten zu finden, HYPERTEXT selbst hingegen ist nicht als eine Textsorte zu interpretieren (siehe Kapitel 10.5)! Zweifelsohne werfen die verschiedenen, hypertextuell realisierten Textsorten jeweils spezifische textlinguistische Fragestellungen auf. Zu denken ist hier auch an die unter dem Begriff HYPERFICTION bekanntgewordene, elektronisch realisierte Belletristik, die versucht, im neuen Medium einen ästhetischen Mehrwert zu erlangen.
Für die vorliegende Untersuchung werden jedoch hauptsächlich Informations- und Instruktionstexte herangezogen, die sich mit Informationstechnologien oder
1 Die Entwicklung des Word Wide Web und des Internet wird in Kapitel 4.2 zusammenfassend
beschrieben.
2 Drei Gründe lassen sich nennen, wieso Hypertext-Realisierungen überwiegend im WWW
stattfinden: Die Hypertexte können mit der im Hinblick auf das Betriebssystem unabhängigen
Hypertext-Beschreibungssprache HTML auf einer nahezu beliebigen Rechnerarchitektur
implementiert werden. Die erstellten Hypertexte werden in das weltweite Computernetz INTERNET
eingespielt, das noch immer mit einem exponentiellen Wachstum der Benutzerzahlen aufwarten
kann. Die zur Ansicht von WWW-Hypertexten notwendige Browser-Software wird von den meisten
Firmen aus Marketinggründen verschenkt (vgl. auch: Münz 1997a [htxt212.htm]).
3 Eine kurze Einführung in HTML gibt das Kapitel 15.2.
4 Sämtliche textlinguistischen Begriffe werden ausführlich in Teil B eingeführt.
Prolog: Eine Bestandsaufnahme 7
linguistischen Fragestellungen beschäftigen. Diese Einschränkung hat mehrere Ursachen methodischer, praktischer und persönlicher Natur: Zum einen ist die Spezialisierung auf diese Textsorte durch den beruflichen Werdegang des Autors zu erklären, der sich über mehrere Jahre hinweg mit dem Verfassen von Anleitungen und Lernmedien für Software sowie mit Programmierung beschäftigt hat. Schon aus diesem Grund lag es nahe, vorhandenes Expertenwissen für eine spezielle Textsorte in eine textlinguistische Untersuchung einfließen zu lassen. Andererseits wurden gerade Informations- und Instruktionstexte von Anfang an massiv als Hypertexte realisiert und machen auch heute (noch) die Mehrheit der Hypertexte im WWW aus. 1 Auch lautet eine Hypothese des Autors, daß solche Textsorten tendenziell geeigneter für eine semanto-pragmatische Typisierung der Links sind, da sie vermutlich vermehrt über standardisierte inhaltliche Verknüpfungen zwischen Textteilen (bzw. Knoten) verfügen. Ein Beispiel aus dem Hypertext SELF des Corpus’ kann dies veranschaulichen: 2
„Spaltenabstand (column-gap)
Anzeigebeispiel: So sieht's aus
Sie können bestimmen, wie groß der Abstand zwischen den einzelnen Spalten sein soll. Bei
mehr als zwei Spalten gilt diese Angabe für alle Spaltenabstände.
Beispiel (Style-Sheet-Definition für HTML-Tag im Text):
Erläuterung:
Mit column-gap: können Sie den Spaltenabstand bestimmen. Erlaubt ist eine numerische
Angabe.“
(SELF [tdci.htm] Abschnitt: Spaltenabstand (column-gap))
Die obige Erklärung gliedert sich in mehrere Teile:
- Eine Einleitung, die anreißt, um was es überhaupt geht ( Sie können bestimmen, wie ...)
- Ein Beispiel, welches einen exemplarischen Quellcode zeigt, sowie ein Anzeigebeispiel, welches die Auswirkungen des eben genannten Quellcodes auf dem Bildschirm illustriert. Das Anzeigebeispiel ist in einen separaten Knoten ausgelagert und kann per Klick auf den LINK So sieht’s aus aufgerufen werden.
- Eine abschließende Erläuterung mit weiterführenden Informationen.
1 In Kapitel 4.2 wird über die Motivationen zur Gründung des WWW zu lesen sein, daß diese
primär darin bestand, das „problem of information access“ zu lösen (vgl. Berners-Lee 1989).
2 Die Unterstreichungen symbolisieren Links (siehe hierzu auch den Abschnitt Typographische
Konventionen dieser Arbeit).
Prolog: Eine Bestandsaufnahme 8
Schon nach einem kurzen Blick auf lediglich ein Beispiel kann vermutet werden, daß Teile von Informationstexten aus der Technischen Dokumentation wiederum aus bestimmten Teiltexten bestehen, die sich einer Typisierung nicht von vornherein verschließen dürften. Im obigen Fall könnte man etwa die ad hoc gebildeten LINK-Etiketten Visualisierung (im obigen Beispiel: So sieht’s aus) oder Zusatzinfo (im obigen Beispiel: numerische Angabe) einführen. Ob diese ersten Vermutungen Bestand haben, wird sich jedoch erst nach umfangreicheren theoretischen und praktischen Untersuchungen feststellen lassen.
2.3 Die Texte des Corpus’
Wichtigster Hypertext des Corpus’ ist zweifelsohne der Titel SelfHTML. Die Energie des Verstehens: HTML-Dateien selbst erstellen von Stefan Münz, der unter dem Kürzel SELF verwendet wird. Besonders geeignet ist dieser Text auch aufgrund seiner hohen Link-Dichte im Fließtext. SELF wurde im Jahr 1998 unter der Adresse http://www.teamone.de/selfhtml/ online gestellt. Kurz vor Abgabe der vorliegenden Untersuchung ist jedoch eine Neuauflage unter der Adresse http://selfhtml.teamone.de/ ins WWW gestellt worden. Die alte Adresse ist nun nicht mehr gültig. Durch die Neuauflage bot sich die Chance, die beiden Versionen vergleichend zu untersuchen. Dies ist besonders interessant, da sich die in SELF benutzten typisierten LINKS zum Teil geändert haben. Aus diesen Gründen ist sowohl die alte als auch die neue Auflage in das Corpus aufgenommen. Die Neuauflage wird im Rahmen der vorliegenden Arbeit mit SELF8 abgekürzt, da diese mit der Versionsnummer 8.0 versehen wurde. Die alte Version befindet sich seit kurzem wieder auf dem neuen Server des SelfHTML-Teams, und zwar im Archiv unter http://selfaktuell.teamone.de/archiv/doku/7.0/. So bleibt die Überprüfbarkeit der Analyse der alten Version gewährleistet.
Ein weiterer Text kommt aus der wissenschaftlichen Fachkommunikation: Das Grammatik-Informationssystem GRAMMIS, welches unter diesem Kürzel verwendet wird. GRAMMIS ist insofern interessant, als daß dieses Projekt in zweifacher Weise TYPISIERTE LINKS verwendet: Zum einen sind die LINKS durch farbige Markierungen bestimmten Bereichen zugeordnet. Zum anderen wird diese Zuordnung zum Teil durch MOUSE-OVER-TEXTE 1 unterstützt.
1 Darunter versteht man Texte, die auf dem Bildschirm erscheinen, sobald der Mauszeiger auf
einen Link bewegt wird.
Prolog: Eine Bestandsaufnahme 9
Ein Hypertext, der thematisch aus dem Rahmen fällt, ist das Sportportal der Sport 1 GmbH, das unter dem Kürzel SPORT1 verwendet wird. Dieser Hypertext lohnt aufgrund seiner zahlreichen PIKTOGRAMME 1 , die für die unterschiedlichen LINK-Typen verwendet werden, einer genaueren Betrachtung. Außerdem stellt SPORT1 eine im WWW im häufiger anzutreffende Sorte von Hypertexten dar, die durch eine geschickte Verquickung von Informations- und Werbetexten gekennzeichnet ist. Hier können zum Teil sehr interessante Unterschiede bzgl. Funktion und Struktur einzelner Knoten im Vergleich zu den restlichen, rein informativen Hypertexten des Corpus’ herausgearbeitet werden.
Ebenfalls als Primärtext dient die Informationsseite des W3C. Der besondere Reiz dieses Hypertextes resultiert nicht nur aus der Tatsache, daß das W3C die Standards im Internet festlegt und verwaltet - und damit als die maßgebende Informationsseite zur Internet-Technologie gesehen werden muß -, sondern auch aus der Herausforderung für die W3C-Verantwortlichen, im Rahmen der sich schnell ändernden Technologien, unterschiedliche Versionen von technischen Spezifikationen - und damit von Hypertext-Knoten - zu verwalten und, im Idealfall, diese zeitlichen Relationen dem Leser auch zu visualisieren.
Folgende Tabelle stellt die Corpus-Hypertexte nochmals übersichtlich zusammen:
Tabelle 1: Hypertexte des Corpus’
1 PIKTOGRAMME sind kleine, ikonenhafte Bilder, die zur Visualisierung von Link-Typen benutzt
werden können. Sie werden in Kapitel 15.2.4 vorgestellt.
Prolog: Eine Bestandsaufnahme 10
3 Angaben zur Literaturlage
Im folgenden wird ein kurzer Überblick über die Literaturlage in den Bereichen HYPERTEXT und TEXTLINGUISTIK gegeben.
3.1 Literatur zu Hypertext
Die Arbeiten zum Thema HYPERTEXT sind zahlenmäßig kaum noch zu bewältigen, daher beschränkt sich die Vorstellung auf einige ‚Meilensteine‘ aus unterschiedlichen Disziplinen.
Historische Primärtexte, durch deren Lektüre sich die Entwicklung des Hypertext-Gedankens nacherleben läßt, sind Bush 1945, Engelbart 1963, Engelbart u. English 1968, Nelson 1974, ACM Hypertext 1987 und 1989 sowie Berners-Lee 1989. Auf die Bedeutung dieser Texte wird in Kapitel 4 genauer eingegangen. Einen Überblick über die Forschung bis 1990 gibt die kommentierte Bibliographie in Atkinson u. Knee 1990. Die historische Entwicklung beschreiben
Berk u. Devlin 1991. Einen geschichtlichen Abriß, der das WWW einschließt, gibt Lennon (Lennon 1997).
Grob kann folgende Gliederung der vorhandenen Literatur vorgeschlagen werden:
(1) Die meisten Untersuchungen zum Thema stammen aus dem Gebiet der Informatik. Als deutschsprachiges Standardwerk gilt Kuhlen 1991. Kuhlen beschäftigt sich neben Fragestellungen der Informationswissenschaften auch am Rande mit textlinguistischen Problemen wie der KOHÄRENZ von Teiltexten. Schnupp 1992 befaßt sich dagegen besonders ausführlich mit der technischen Implementierung von Hypertexten. In weiteren Titeln der Informatik geht es hauptsächlich um die Verbindung der Hypertext-Idee mit Konzepten der KÜNSTLICHEN INTELLIGENZ, der WISSENSREPRÄSENTATION sowie des INFORMATION RETRIEVAL. 1 (2) Ferner existieren zahlreiche Arbeiten aus der Psychologie, die kognitionswissenschaftliche und pädagogische Fragen an die neue Technologie stellen. Hierbei soll hauptsächlich ein möglicher Mehrwert hypertextueller Lernmedien kritisch untersucht werden. Ansel Suter dokumentiert den Versuch, Kenntnisse der englischen Sprachwissenschaft mittels eines Hypertextes zu vermitteln (Ansel Suter 1995). Heike Gerdes faßt den Forschungsstand psychologisch-pädagogischer Disziplinen zusammen, zitiert die Ergebnisse der wichtigsten Fallstudien und kommt aufgrund eigener Experimente zu einer kritischen Einschätzung des
1 z.B.: Sarre1991, Brown 1991, Cordes u. Streitz 1992, Neubert 1994, Agosti 1996, Haake 1997
und Riggert 1998
Prolog: Eine Bestandsaufnahme 11
sogenannten KOGNITIVEN MEHRWERTS von Hypertexten (Gerdes 1997). Mit allgemeinen, erziehungswissenschaftlich relevanten Fragen des Informationsproblems in elektronischen Datennetze n aller Art beschäftigt sich Astleitner (Astleitner 1997). 1 Eine weitere psychologische Untersuchung ist Unz 2000, die mit empirischen Methoden Hypertexte und gedruckte Texte kontrastiv bzgl. Informationssuche und Navigation untersucht. Die aktuellste Studie zum Thema dürfte Bromme 2002 sein, die allerdings vor Redaktionsschluß nicht mehr gesichtet werden konnte.
(3) Auch die Literatur- und Texttheorie hat sich des Themas mit Begierde angenommen. Offen ist hierbei vor allem das veränderte Verhältnis Autor-Leser, da jeder Benutzer eines Hypertextes einen eigenen Lesepfad durch das Werk wählen kann. HYPERTEXT wird hier als neue Kulturtechnik verstanden und als solche analysiert. Bolter untersucht die Auswirkungen des Computers als „writing space“ und geht dabei besonders auf die nicht-lineare Repräsentationsform von Wissen in Hypermedien ein (Bolter 1991). Landow untersucht den Bezug zwischen hypertextuellen Schreibarten und der Kritischen Theorie (Landow 1992 u. 1994), während Gaggi 1997 eine Dezentralisierung des Subjekts durch diebzw. innerhalb der - neuen Medien sieht und gleichzeitig Nelsons’ Vision eines „alle Texte umfassenden Hypertextes“ neu belebt. 2 Eine poststrukturalistische Herangehensweise an den ‚Hypertext-Raum‘ verfolgt Wenz 2001a. Wenz 2001 hingegen unternimmt eine erste Pilotuntersuchung zur unterschiedlichen Akzeptanz von gedrucktem Text, textuellem Hypertext sowie multimedialem Hypertext.
(4) Technische Artikel zu sogenannten MARKUP-SPRACHEN wie HTML und XML, mit denen Hypertexte implementiert werden können, finden sich in großer Anzahl im Internet. Die maßgeblichen Spezifikationen stehen hierbei auf den Seiten des Internet Konsortiums W3C ( http://www.w3c.org). Dort sind auch die programmatischen Artikel zum sogenannten SEMANTIC WEB - eine Art semantische Tiefenstruktur für das heutige World Wide Web - zu finden. (5) So gut wie alle Abhandlungen über Hypertexte gehen in unterschiedlicher Intensität auch auf das Problem der typisierten Links ein. Die These ist meistens, daß typisierte Links einen Mehrwert brächten, ein passendes allgemeines Vokabularium zur Typisierung aber noch nicht existiert.
1 Weitere psychologisch bzw. erziehungswissenschaftlich motivierte Arbeiten sind Ambron u.
Hooper 1988, Marchionini u. Shneiderman 1988, Jonassen 1990, Nix u. Spiro 1990, Retterer 1991,
Fickert 1992, Hammwöhner 1993, McKnight 1993, Tergan 1993 u. 1995, Hasebrook 1994 u. 1995,
Meyerhoff 1994, Glowalla 1995, Rada 1995 sowie Rouet 1996.
2 Weitere Titel aus der Literaturtheorie sind: Doland 1988, Bolter 1989, Moulthrop 1991, Andersen
1992, Idensen1993 und Ramm 1994.
Prolog: Eine Bestandsaufnahme 12
3.2 Literatur zur Textlinguistik
Als allgemeine linguistische Nachschlagewerke dienen Bußmann 1990 und Glück 2000. Eine erste Annäherung sowie einen Einblick in die Geschichte der Textlinguistik bringt der Sammelband Textlinguistik (Dressler 1978). Grundlegende textlinguistische Gesamtdarstellung für diese Arbeit ist Brinker 2001. Neben weiteren spezifischen Darstellungen zur TEXTUALITÄT
(de Beaugrande u. Dressler 1981), REFERENZSTRUKTUREN (Vater 1994) und
THEMENENTFALTUNG (van Dijk 1980 a u. b) sind am Rande auch Spezialuntersuchungen interessant, die das Vorkommen von Texten in technischen Distributionen untersuchen (Ott 1996 und Labarta Postigo 1997).
3.3 Literatur zu Textlinguistik und Hypertext
Die textlinguistische Beschäftigung mit Hypertexten ist vergleichsweise jung. Die Zahl der einschlägigen Literatur ist noch überschaubar, steigt seit den letzten Jahren aber sprunghaft an. Die Beiträge sind oftmals texttheoretischer Natur. Sie arbeiten allgemeine Unterschiede und Ähnlichkeiten von traditionellen Texten und Hypertexten heraus und lassen sich unter die oben genannten Arbeiten zur Literaturtheorie subsumieren. Andere Untersuchungen greifen die erarbeiteten Unterschiede auf und machen sie zur Grundlage für Konversionen zwischen Texten und Hypertexten. Besonders wird hierbei auf Aspekte der Kohärenzplanung eingegangen (Campel 1995, Lobin 1999 und Storrer 1999).
Mit den Besonderheiten von Sprache im Internet sowie den Eigenschaften schriftlicher Texte in multimedialen Kontexten beschäftigt sich Schmitz (Schmitz 1995, 1996 u. 1997). Angelika Storrer hat eine rege Publikationstätigkeit zur hypertext-spezifischen Textlinguistik entwickelt (Storrer1999, 2000, 2001a, 2001b und 2001c; Ferner befindet sich ihre Habilitationsschrift zum selben Thema derzeit in Druck.). Interessante Sammelbände sind außerdem Weingarten 1997a, Runkehl u.a. 1998, Holly u. Biere 1998 und besonders Lobin 1999a. Darüber hinaus befaßt sich Nummer 63 der Zeitschrift Osnabrücker Beiträge zur Sprachtheorie (Obst) mit der Thematik Hypermedien und Wissenskonstruktion und versammelt hierfür einige interessante Aufsätze - z.B. Rapp u. Zumbach 2001.
Teil A: Hypertext als Untersuchungsgegenstand 13
Teil A: Hypertext als Untersuchungsgegenstand
Teil A führt ausführlich in den Untersuchungsgegenstand HYPERTEXT ein.
Hierbei werden zuerst historische Entwicklungslinien und mediale Realisierungen gezeigt. Besonderes Augenmerk gilt hierbei der Geschichte des WWW, als dem für heutige Hypertexte wichtigsten Mediums (Kapitel 4).
Anschließend erfolgt in Kapitel 5 eine differenzierte Betrachtung und Klassifizierung ‚hypertext-verdächtiger‘ Phänomene im WWW. Bei einer kontrastiven Betrachtung von traditionellen Texten und Hypertexten wird sich herausstellen, daß nicht jeder elektronische Text im WWW unbedingt ein Hypertext ist - auch wenn häufig vom WWW als dem größten Hypertext der Welt gesprochen wird.
Im letzten großen Abschnitt von Teil A, Kapitel 6, werden dann die einzelnen Komponenten von Hypertexten vorgestellt. Fokus liegt hierbei auf der Definition aktueller WWW-Hypertexte, die sich zum Teil deutlich von Vertretern anderer Hypertext-Systeme unterscheiden. Wichtig ist in diesem Zusammenhang auch die Beschreibung der zur Betrachtung von WWW-Hypertexten nötigen Software, dem sogenannten BROWSER.
Abschließend folgt nochmals eine kurze Zusammenfassung der wichtigsten Designprinzipien, Eigenschaften und medialen Bedingungen heutiger Hypertexte im WWW, bevor zur Einführung der für Hypertexte relevanten textlinguistischen Begriffe und Methoden in Teil B übergeleitet wird.
Teil A: Hypertext als Untersuchungsgegenstand 14
4 Hypertext: Ein historischer Abriß
Dieses Kapitel zeichnet die Geschichte des Hypertextes von den ersten theoretischen Konstrukten bis hin zum Durchbruch im Rahmen des World Wide Web und des Internet nach.
4.1 Die Pioniere: Bush, Nelson und Engelbart
Nach allgemeiner Meinung begründete Vannevar Bush mit seinem 1945 veröffentlichten Artikel As we may think (Bush 1945) 1 seine Position als „Vater des Hypertext-Konzepts “(Gerdes 1997 S. 1 [Auszeichnung im Original]). Bush entwirft hier ein futuristisches System namens Memex, mit dem Information in der Form gespeichert werden kann, wie es heute auch für Hypertexte üblich ist:
„Consider a future device for individual use, which is a sort of mechanized private file and
library. It needs a name, and, to coin one at random, "memex" will do. A memex is a device
in which an individual stores all his books, records, and communications, and which is
mechanized so that it may be consulted with exceeding speed and flexibility. It is an
enlarged intimate supplement to his memory. [...]
Thereafter, at any time, when one of these items is in view, the other can be instantly
recalled merely by tapping a button below the corresponding code space. Moreover, when
numerous items have been thus joined together to form a trail, they can be reviewed in turn,
rapidly or slowly, by deflecting a lever like that used for turning the pages of a book. It is
exactly as though the physical items had been gathered together from widely separated
sources and bound together to form a new book. It is more than this, for any item can be
joined into numerous trails.“ (Bush 1945 S. 107f.)
Die Idee der Memex ist also, daß atomare Informationseinheiten separat gespeichert werden. Da diese zumeist für mehrere Kontexte relevant sind, können sie stets in neuen Kombinationen zusammengefügt werden. Den dadurch entstehenden Lesepfad bezeichnet Bush als „new book“.
Der Begriff Hypertext als solcher ist auf eine Prägung von Theodor Nelson aus dem Jahr 1965 zurückzuführen. 2 In dem Artikel Professor Nelson Talk Analyzes P.R.I.D.E. der Zeitung Vassar College Miscellany News vom 3. Februar 1965, wird der Vorschlag für ein neues Informationssystem beschrieben:
1 Die Bedeutung dieses Grundsatzartikels arbeiteten Nyce u. Kahn 1991 heraus.
2 vgl. Kuhlen 1991 S. 38, Nielsen 1990 S. 33 u. Hasebrook 1995 S. 169; Nelson selbst bestätigt,
daß die Begriffe Hypertext und Hypermedia von ihm stammen (vgl. hierzu auch den offiziellen
Newsletter von Nelson im Internet unter der Adresse http://www.picosof.com/993[momentan
offline!]);
Teil A: Hypertext als Untersuchungsgegenstand 15
„[...] he [Nelson] reminded the audience of the problems of organizing material into a
coherent piece of writing. As a new organization method Mr. Nelson has invented the PRIDE
(Personalized Retrieval Indexing and Documentary Evolution) system.“ (Wedeles 1965)
Nelson wies auf mögliche Probleme hin, die sich bei der Linearisierung von Informationsmaterial zu einem einzigen „coherent piece of writing“ ergeben. Sein System P.R.I.D.E versucht, diese Probleme zu lösen:
„ In this system passages of material would be translated into machine language and filed in
the machine in any sequence. With the proper instructions the machine would print out any
sequence the writer wished to try, freeing him from the necessity of keeping the ideas in his
head.“ (Wedeles 1965)
Nelson glaubte, diese Form der Informationsrepräsentation entspräche eher der menschlichen Form des Denkens als die der rein linearen Variante. In diesem Zusammenhang prägte er das Wort hyper-text:
„Mr. Nelson pointed out that we often do not think in linear sequences but rather in ‘swirls’
and in footnotes. He introduced the concept of the hyper-text, which would be a more
flexible, more generalized, non-linear presentation of material on a particular subject.“ (Wedeles 1965)
Der Schöpfer des Wortes hyper-text nahm also an, menschliches Denken verlaufe nicht in linearen Sequenzen, sondern sei vielmehr mit „swirls“ oder „footnotes“ zu vergleichen. Hypertext ist für Nelson eine nicht-lineare, verallgemeinerte und flexiblere Weise, Wissen über ein bestimmtes Thema zu repräsentieren.
Als zukünftiges Einsatzgebiet von Hypertexten gibt Nelson folgendes an:
„For example, it is possible that basic texts on a subject could be interindexed, so that the
necessity and difficulty of tracing footnotes and rare sources would be eliminated.“ (Wedeles 1965)
Zusammenfassend kann also festgehalten werden, daß HYPERTEXT im Sinne des Wortschöpfers eine nicht-lineare Form der Wissensrepräsentation zu einem bestimmten Thema ist. Aufgrund dieser nicht-linearen Form (und mittels geeigneter Implementierung) kann je nach Bedarf eine bestimmte Sequenz des gespeicherten Informationsmaterials abgerufen werden. Eine wichtige Beobachtung ist, daß die Linearisierung der Information erst im Moment des Lesens vollzogen wird: Aus einer bestimmten Menge von Informationseinheiten wird also eine Teilmenge (die eventuell auch identisch mit der ursprünglichen Menge
Teil A: Hypertext als Untersuchungsgegenstand 16
sein kann) mittels Verweisen verbunden. Dadurch entwickelt der Leser den Text zum Teil selbst. Wortwahl, Aufteilung der Gesamtinformation in kleinere Einheiten, sowie das Setzen der Verweise bleibt Aufgabe des Autors. Das Aneinanderfügen dieser Informationspakete erfolgt dann durch einen, im Wortsinn kreativen Akt des Lesens. Verschiedenes Kombinieren der Informationseinheiten führt somit für den Leser zu unterschiedlichen Texten. Diese Lesepfade bleiben aber freilich immer eine Teilmenge des vom Autor zusammengestellten Gesamtfundus’. Insofern wird auch beim Hypertext das Konzept Autor nicht aufgegeben!
Auch die heutige (de facto vorhandene) Beschränkung von Hypertexten auf das elektronische Medium wird bereits in dieser ersten Definition vorweggenommen. 1
Auffällig ist ferner, daß sich diese erste Definition nicht zwangsläufig auf eine textuelle Form von Information beruft, sondern vielmehr von „material“ aller Art spricht. Hier kommt eine frühe multimediale Auffassung von HYPERTEXT zum Ausdruck:
„Programs can include words, pictures, printing, or strings of words.“
(Wedeles 1965)
Dies nimmt in gewisser Hinsicht den sich heute vollziehenden Wandel von HYPERTEXT zu HYPERMEDIA voraus.
Nelson politisierte später mit der Arbeit Dream Machines: new freedoms through computer screens - A minority Report (Nelson 1974) die Hypertext-Idee:
„Nelson vertrat (und vertritt) die Auffassung, daß alle Informationsquellen in einer demo-
kratischen Informationsgesellschaft frei zugänglich sein sollten. Er meinte, daß ein freier Zu-
gang dann am besten gesichert sei, wenn alle Dokumente in einer Art gigantischem
Hypertext miteinander verknüpft seien.“ (Hasebrook 1995 S. 169)
Die erste elektronische Realisierung des Hypertext-Konzeptes gelang Douglas C. Engelbart, deren Grundlagen er in seinen Publikationen beschreibt (Engelbart 1963, Engelbart u. English 1968). Allerdings wurden diese Implementierungen fast ausschließlich von Spezialisten benutzt.
1 Dies bezeugt ebenfalls eine Stelle aus Nelson 1967. Hier definiert der Autor HYPERTEXT als
Sammelbegriff für „[...] any text, which cannot be printed [...] on a conventional page" (Nelson
1967, S. 195). Dieser Sammelbegriff schließt aber Printmedien, welche über ‚hypertextuelle‘ Struk-
turen verfügen (etwa Enzyklopädien) explizit nicht mit ein.
Teil A: Hypertext als Untersuchungsgegenstand 17
4.2 Der Durchbruch: Berners-Lee und das WWW
Der Hypertext-Idee zum Durchbruch verholfen hat erst Tim Berners-Lee mit der Erfindung des WORLD WIDE WEB (WWW). Berners-Lee begann 1980 seine Arbeit am wissenschaftlichen Zentrum CERN in Genf. Hier schrieb er für den Eigenbedarf sein erstes Programm zur Informationsspeicherung unter Verwendung von assoziativen Verweisen. Er nannte die Software Enquire, unter Bezugnahme auf einen "verstaubten Ratgeber aus viktorianischer Zeit" mit dem Titel "Enquire Within upon Everything". Dieses Buch bildete so etwas wie "das Tor zu einer Welt der Information, in der von der Fleckenentfernung bis zur Geldanlage alle möglichen Fragen beantwortet wurden." (Berners-Lee 1999a S. 11) Die Software selbst wurde niemals veröffentlicht, bildet aber so etwas wie die konzeptionelle Grundlage für die Entwicklung des World Wide Web.
1989 schlug er ein globales Hypertext-Projekt vor (Berners-Lee 1989). Das Wissen der Leute sollte mittels eines Netzes aus Hypertext-Dokumenten kombiniert werden. Aufgrund der Systemunabhängigkeit entschied sich Berners-Lee für die INTERNETPROTOKOLLE TCP/IP (siehe unten) als technische Grundlage für den Austausch von Hypertext-Dokumenten. Auf dieser TCP/IP-Basis entwickelte er 1990 das HYPERTEXT TRANSFER PROTOCOL (HTTP). Auch schrieb er den ersten WWW-Server 1 , httpd, und den ersten BROWSER 2 , WorldWideWeb, den er später in Nexus umbenannte. 3 Die Webtechnologie machte er am CERN und im Sommer 1991 im Internet verfügbar. 4 Das WWW verhalf dem Internet sowie der Hypertext-Idee auf breiter Front zum Durchbruch, da es intuitiv und ohne Expertenwissen zu benutzen war. In der Presse wird heute oftmals das Internet mit dem WWW-Hypertext gleichgesetzt. Dies ist jedoch nicht korrekt, was ein kurzer Blick auf die Geschichte des Internet zeigen soll:
"The Web is an abstract (imaginary) space of information. On the Net, you find computers --
on the Web, you find document, sounds, videos,.... information. On the Net, the connections
are cables between computers; on the Web, connections are hypertext links. The Web exists
because of programs which communicate between computers on the Net. The Web could
1 Der Begriff SERVER ist im Glossar erläutert.
2 Ein BROWSER ist ein Programm zum Lesen von Hypertexten im WWW. En détail wird diese
Software in Kapitel 6.4.8 vorgestellt.
3 Nähere Details stehen im Internet unter http://www.w3.org/People/Berners-
Lee/WorldWideWeb.html
4 Interessant ist, daß es sich bei dem ersten Programm sowohl um einen Browser als auch um
einen Editor handelte. Mit Hilfe des Editors sollte jedermann ermöglicht werden, zu bestehenden
Dokumenten Bemerkungen hinzuzufügen bzw. von bestehenden Dokumenten aus selbständig
zusätzliche Links einzubauen. Hierbei handelt es sich um eine Kernforderung von Berners-Lee, die
jedoch in dieser Form nicht erfüllt wurde. Die späteren Entwicklungen konzentrierten sich
ausschließlich auf die Navigationsfunktionen. Mögliche Gründe für die Vernachlässigung der
Editierfunktion werden bei Berners-Lee 1999a S. 111f. genannt.
Teil A: Hypertext als Untersuchungsgegenstand 18
not be without the Net. The Web made the Net useful because people are really interested in
information (not to mention knowledge and wisdom!) and don't really want to have know
about computers and cables [...]" (Berners-Lee FAQ Abschnitt General Questions, 1998)
Das Internet selbst ist deutlich älter als das WWW. 1 Seine Ursprünge hat es im militärischen Bereich: Im amerikanischen Verteidigungsministerium dachte man in den 60‘er Jahren verstärkt über Möglichkeiten nach, wie militärische Daten selbst vor atomaren Angriffen zu sichern seien. Möglich war dies nur durch ein Datennetz, bei dem die Daten auf mehreren, weit voneinander entfernten Rechnern lagerten. Wurden Daten modifiziert, sollten diese vom veränderten Rechner an alle angeschlossenen Rechner weitergegeben werden. Ein wichtiger Punkt hierbei war, daß jeder Rechner über mehrere Wege mit allen anderen kommunizieren konnte. Im Notfall konnten so Ausfälle von einzelnen Maschinen oder Verbindungskabeln durch Umleitungen überbrückt werden. Die ersten Rechner wurden 1969 im sogenannten ARPA-NET ( ADVANCED RESEARCH PROJECTS AGENCY) 2 zusammengeschlossen.
In einem zweiten Schritt erhielten Forschungseinrichtungen der USA Zugang zum ARPA-NET. Für die Wissenschaftler stand nun weniger das Synchronisieren von Daten als vielmehr die schnelle Kommunikation mit Kollegen sowie der unkomplizierte Datenaustausch im Vordergrund. Vor dem Hintergrund der heterogenen EDV-Architekturen der Institute entstand die Notwendigkeit der Entwicklung eines gemeinsamen ÜBERTRAGUNSPROTOKOLLS für Daten: diese Rolle übernahm das TRANSMISSION CONTROL PROTOCOL (TCP) in Zusammenarbeit mit dem INTERNET PROTOCOL (IP). Die Kombination TCP/IP ist noch heute das ‚Rückrat‘ des gesamten Datenverkehrs im Internet. Erst durch dieses Protokoll wurden die getrennten heterogenen Universitäts- und Institutsnetze zu einem ‚Netz der Netze‘.
TCP/IP arbeitet wie folgt: Wenn heutzutage mittels eines Browsers eine HTML-Datei 3 im WWW aufgerufen wird, wird diese Datei bei der Übertragung via Internet
1 Die Geschichte des Internet wird hier nur kurz angerissen. Für weitere Informationen gibt es sehr
gute Ressourcen in ausreichender Anzahl im WWW. Ein Ausgangspunkt hierfür ist die Kategorie
Internet/History/].
see.think . The History of the Net. [ http://members.magnet.at/dmayr/history.htm]. Ausführlich über
den Entwicklungsstand im Jahre 1994, also kurz vor dem weltweiten Durchbruch des WWW,
informiert die Seite Entering the Web: A Guide to Cyberspace von Kevin Hughes
[http://sunsite.sut.ac.jp/coll/guide.61.html/guide.toc.html]. Besonders zu erwähnen sind auch die
umfangreichen Archive des W3C [ http://www.w3.org/History/], die die verschiedenen
Entwicklungsphasen des Internet und besonders die des WWW nachvollziehbar machen.
2 Dieses Netz existiert noch heute und hat unter http://www.arpa.mil eine Schnittstelle zum WWW.
3 In das Konzept der HYPERTEXT MARKUP LANGUAGE (HTML) wird in Kapitel 15.2 eingeführt.
Teil A: Hypertext als Untersuchungsgegenstand 19
in kleine Pakete zerstückelt. An jedes Paket ‚heftet‘ das IP einen Adreßaufkleber, auf dem der Empfänger des Datenpakets steht 1 , also der Computer, auf dem der Browser läuft, mit welchem die fragliche Datei angefordert wurde. Als zusätzliche Information gibt IP an, um das wievielte Paket innerhalb der jeweiligen Sendung es sich handelt. Den korrekten Eingang der Datenpakte beim Empfänger erledigt TCP. Sind alle Pakete eingetroffen, beginnt der Browser mit der Darstellung der Datei.
TCP/IP ist wie gesagt ein universelles Protokoll und wäre prinzipiell zur weltweiten Datenübertragung ausreichend. Die Kommunikation wurde jedoch bald in dem Maß durch die Komplexität der Bedienung erschwert, als daß immer mehr Menschen Daten austauschen wollten, die selbst keine Experten der Informationstechnologie waren. Aus diesem Grund wurden ‚höhere‘ PROTOKOLLE entwickelt, die sich TCP/IP bedienten aber wesentlich einfacher zu benutzen waren. Beispiele hierfür sind FTP, TELNET und EMAIL. Dem Internet zum eigentlichen Durchbruch verholfen hat jedoch, wie oben bereits angesprochen, das HYPERTEXT TRANSFER PROTOCOL ( HTTP) von Berners-Lee. 2 HTTP ist das INTERNET-PROTOKOLL zur Übermittlung von Hypertext-Dateien, die mittels der Sprache HTML kodiert sind. Dieses Zusammenspiel von HTTP und HTML wird als WWW bezeichnet - eine Anwendung also, die sich der technischen Infrastruktur des eigentlichen Internet bedient. Das WWW hat sich - neben Email - zur populärsten Anwendung des Internet entwickelt.
Um den Ausführungen der Untersuchung folgen zu können, ist eine tiefere Einsicht in das Zusammenspiel der oben eingeführten geschichteten Protokolle nicht notwendig. Vielmehr sollte in diesem Kapitel nur kurz der technische Hintergrund angedeutet werden, der zum Austausch von HTML-Seiten notwendig ist. Philosophie, Struktur und Anwendung von HTML selbst sind jedoch zum großen Teil Gegenstand dieser Arbeit und werden in Kapitel 15 besprochen.
1 Dazu gibt es ein Adressierungsschema - die sogenannten IP-Adressen. Eine typische IP-
Adresse sieht in Dezimalschreibweise beispielsweise etwa so aus: 127.174.211.5 - vier höchstens
dreistellige Zahlen, getrennt durch Punkte. Im Rahmen dieser Arbeit ist kein weiteres Verständnis
der IP-Adressierung bzw. der Namensauflösung mittels sogenannter DOMAIN NAME SERVER
notwendig. Für den geneigten Leser sei jedoch auf die TCP/IP Resources List
[http://www.private.org.il/tcpip_rl.html]
[http://www.dns.net/dnsrd/] verwiesen.
2 Ein ausgezeichneter
[http://www.pms.informatik.uni-muenchen.de/lehre/seminar/html-metamorphosen/00ss/
ausarbeitungen/HTTP/]. Sämtliche relevanten Spezifikationen des W3C werden hier verständlich
erläutert. Die Spezifikationen selbst finden sich unter http://www.w3.org/Protocols/.
Teil A: Hypertext als Untersuchungsgegenstand 20
Text, E-Text, Hypertext und Hypertext-Netz 1 5
Im letzten Kapitel wurden die historischen Voraussetzungen geschildert, die letztendlich zu den WWW-Hypertexten unserer Tage geführt haben. Im vorliegenden Kapitel sowie dem nächsten geht es darum, diese heutigen Hypertexte genauer zu bestimmen. Zunächst soll eine extensionale Festlegung der elektronischen Gebilde im WWW geschehen, bevor im nächsten Kapitel dann eine mehr intensionale Definition der WWW-Hypertexte versucht wird.
5.1 Abgrenzung Text vs. Teiltext, Hypertext vs. Knoten
Bei gedruckten belletristischen Werken oder Fachbüchern fällt es noch verhältnismäßig leicht, die Dimension eines Textes aufgrund klarer Begrenzungen festzustellen: Der Roman 1984 von George Orwell ist als TEXT aufzufassen. 2 Er verfügt über eine einheitliche TEXTFUNKTION sowie durchgängige KOHÄRENZ. 3 Schwieriger hingegen ist die Situation beim Betrachten einer Tageszeitung. Ähnlich wie bei einem gedruckten Roman sendet auch die Beschaffenheit einer Zeitung als physische Entität klare Begrenzungssignale aus. Allerdings bereitet es Schwierigkeiten, eine einheitliche Textfunktion einer Tageszeitung zu erkennen. Zwar kann man in der Regel bei seriösen Zeitungen von einer Überzahl INFORMATIVER Texte ausgehen, die jedoch flankiert werden von Texten mit APPELLFUNKTION (Kommentar, Werbung) und KONTAKTFUNKTION (Öffentliche Glückwünsche, Beileidsbekundungen). Zwischen den einzelnen textuellen Phänomenen bestehen in der Regel relativ selten Kohärenzbeziehungen: Die Großzahl der Nachrichten steht isoliert im Gesamtkontext der Zeitung. Lediglich die entscheidenden Themen der Ausgabe werden durch mehrere Nachrichten und Kommentare abgedeckt, die miteinander durch Referenzen, wie etwa siehe auch etc., verbunden sind.
Die Teiltexte einer Zeitung verfügen mit einer eigenständigen Textfunktion über das wichtigste TEXTUALITÄTSKRITERIUM, ich fasse sie daher als vollwertige, eigenständige Texte auf, die lediglich zum Teil lose - via Referenzen - in den Gesamtkontext einer medialen Realisierung namens Zeitung eingebettet sind.
1 In diesem und dem nächsten Kapitel müssen bereits einige textlinguistische Termini wie
KOHÄSION oder KOHÄRENZ verwendet werden, die explizit erst im Teil B eingeführt werden. Vorab
zum besseren Verständnis sei erwähnt: Unter KOHÄSION versteht man den durch grammatische
Mittel hergestellten Textzusammenhang. Der Begriff der KOHÄRENZ hingegen bezeichnet den
semantischen Zusammenhalt des Textes.
2 Der eigentliche Text wird flankiert von PARATEXTUELLEN Elementen, auf die in Kapitel 11 näher
eingegangen wird.
3 In Kapitel 9 wird sich zeigen, daß KOHÄRENZ das wichtigste Kriterium für die Bestimmung der
TEXTUALITÄT sind.
Teil A: Hypertext als Untersuchungsgegenstand 21
Wie verhält es sich nun mit Hypertexten? Sind die Knoten hier, vergleichbar mit den Teiltexten einer Zeitung, ebenfalls als eigenständige Texte zu sehen? Eventuell ist es hilfreich, zur Beantwortung dieser Frage zuerst das Medium zu betrachten, in dem die Hypertexte des Corpus’ realisiert sind: das WWW. Es ist davon auszugehen, daß so gut wie alle Hypertexte (und auch die einzelnen Knoten von Hypertexten) durch hinreichend geduldige Navigation von einem beliebigen Startpunkt im WWW aus untereinander erreichbar sind. 1 Handelt es sich daher beim WWW um einen einzigen Text?
Ein Argument für diese Vermutung ist zwar die weltweite Vernetzung einzelner WWW-Hypertexte mittels Links, die als explizite KOHÄSIVE MITTEL gelten dürfen. Allerdings mußte festgestellt werden, daß eine gemeinsame Kohärenz, eine gemeinsame KOMMUNIKATIVE FUNKTION sowie ein einheitliches THEMA für das WWW als Ganzes nicht festzustellen sind. Da aber strukturelle Aspekte wie Kohäsion nie alleinstehend relevant sind, sondern lediglich das Fundament für funktional-kommunikative Aspekte des Textes darstellen, sind Phänomene wie Kohärenz oder Textfunktion als wichtigere Kriterien für die Texthaftigkeit eines Gebildes anzusehen. Hinsichtlich dieser funktional-kommunikativen Kriterien ist das WWW, wie erwähnt, in seiner Gesamtheit aber kein singulärer Text. Verläßt man nun die Makro-Perspektive des WWW und zieht die Mikro-Perspektive eines einzelnen Knotens - etwa des Textes SELF - heran, so läßt sich wie folgt argumentieren: Jedem Knoten von SELF kann durchaus ein eigenes Textthema sowie einen Textfunktion zugestanden werden. Diese sind jedoch nur Teilthemen und Teiltextfunktionen von SELF selbst. Dies unterscheidet einen Hypertext wie SELF von Tageszeitungen, macht ihn jedoch vergleichbar mit gedruckten technischen Dokumentationen.
5.2 Abgrenzung E-Text, Hypertext und Hypertext-Netz
Im letzten Abschnitt wurde festgestellt, daß das WWW nach kommunikativfunktionalen Kriterien beurteilt keinen singulären Text darstellt. Die einzelnen Hypertexte im WWW können, nach erster Betrachtung, wohl als Texte aufgefaßt werden, die sich aus Teiltexten - den Knoten - zusammensetzen. Eine nahe- 1 Diesgilt vor allem, wenn man die Ergebnisseiten von SUCHMASCHINEN im WWW ebenfalls als -
dynamisch generierte - Hypertexte betrachtet. Die Behauptung gilt jedoch nicht für sogenannte
HYPERTEXT-INSELN, die bewußt keine Anbindung an solche Knoten haben, die öffentlich zugänglich
sind. Technisch möglich ist das durch die Arbeitsweise der Suchmaschinen: Diese navigieren Link
für Link durch das WWW und bauen einen Index der besuchten Seiten auf. Existiert www-weit kein
einziger LINK zur Hypertext-Insel, ist diese auch nicht zu indexieren. Zu denken ist hier etwa an
Bewerbungsunterlagen, deren Adresse nur der jeweilige potentielle Arbeitgeber vom Bewerber
erhält. Solche Hypertexte setzen jedoch lediglich auf der Technik des WWW auf, gehören aber
nicht zum eigentlichen WWW-HYPERTEXT-NETZ (siehe unten).
Teil A: Hypertext als Untersuchungsgegenstand 22
liegende Frage ist nun, ob denn sämtliche im WWW auftretenden Texte auch automatisch Hypertexte sind.
Zur Beantwortung dieser Frage muß eine Grobgliederung der im WWW vertretenen Phänomene erstellt werden. Laut Storrer 1999 läßt sich das WWW als HYPERTEXT -NETZ interpretieren, in dem sowohl Hypertexte als auch sogenannte E-TEXTE 1 zu finden sind:
„Ein Hypertextnetz verknüpft mehrere Hypertexte und E-Texte sowie Paratexte zu Hyper-
texten und E-Texten durch Links. Das WWW kann in diesem Sinne als weltumspannendes
Hypertextnetz angesehen werden, das [aus] einer wachsenden Anzahl von Teilnetzen
besteht, deren Aufbau und Inhalte sich in steter Veränderung befinden und in ihrer Gesamt-
2 heit von niemandem mehr überblickt werden.“ (Storrer 1999 S. 38)
Die beiden möglichen Komponenten von Hypertext-Netzen, Hypertexte und E-Texte, unterscheidet die Autorin wie folgt:
„Ein Hypertext ist ein von einem Hypertextsystem verwalteter nicht-linear organisierter Text
mit einer erkennbaren Textfunktion und einer thematischen Gesamtvorstellung, die als über-
geordnete Einordnungsinstanz fungiert. [...] Ein Hypertext kann für sich allein stehen und
z.B. auf CD-ROM publiziert sein; typischerweise wird er jedoch als Teilnetz in ein größeres
Hypertextnetz eingebunden. Hypertexte sind typischerweise keine abgeschlossenen Texte;
sie haben ‚offene Enden‘ [...]
Als E-Texte bezeichne ich Texte, die als linear organisierte Texte in ein Hypertextnetz ein-
gebunden sind. [...] E-Texte müssen auf nachvollziehbare Art und Weise in das über-
greifende Hypertextnetz eingebunden werden, ansonsten ergeben sich im Hinblick auf die
Kohärenzbildung jedoch keine wesentlichen Unterschiede gegenüber dem linear
organisierten Printtext.“ (Storrer 1999 S. 38 f.)
Wer textuelle Gebilde für das WWW verfaßt, erstellt damit also nicht automatisch Hypertexte sondern eventuell traditionelle, lineare, lediglich elektronisch realisierte Texte - E-Texte eben. Vor- und Nachteile solcher E-Texte gaben und geben Stoff für zahlreiche Untersuchungen 3 , die vorliegende Arbeit beschäftigt sich jedoch ausschließlich mit Hypertexten - der obigen Definition folgend. Die Komponenten solcher Hypertexte wurden bereits oben kurz angesprochen und werden nun im folgenden Kapitel 6 ausführlich eingeführt.
1 Der Begriff E-TEXT wurde laut Storrer zuerst von Zimmer in dessen Digitaler Bibliothek geprägt
(Online im WWW unter http://www.zeit.de/digbib/index1.html).
2 Der Begriff PARATEXT wird von Storrer nicht näher erläutert. Es kann aber wohl davon
ausgegangen werden, daß hiermit in etwa die paratextuellen Phänomene gemeint sind, welche
auch in Kapitel 11 dieser Arbeit beschrieben werden.
3 Als Vorteile sind der schnelle Zugriff, die Möglichkeit der Volltextsuche, das kostengünstige und
verlagsunabhängige Publizieren sowie die schnelle Wiederverwendbarkeit der Texte zu werten.
Außerdem muß sich der Leser bei der Lektüre von E-Texten nicht auf hypertext-spezifische
Eigenschaften einlassen. Als Nachteil dürfte sich das unkomfortable Lesen längerer Texte am
Bildschirm herausstellen. Storrer 2001b geht genauer auf diese Punkte ein.
Teil A: Hypertext als Untersuchungsgegenstand 23
Komponenten eines Hypertextes 1 6
Nachdem zuletzt die Extension des Untersuchungsgegenstandes konkretisiert wurde, geht es in diesem Kapitel nun um die einzelnen Komponenten - also um die intensionale Bedeutung - von Hypertexten.
6.1 Allgemein
Manche Komponenten eines Hypertextes sind mit den Bestandteilen traditioneller Texte zu vergleichen oder gar mit diesen identisch. So stellen die sogenannten KNOTEN den eigentlichen ‚Textkörper‘ zur Verfügung. Ferner haben viele Hypertexte Orientierungsmittel, die auch in normalen Texten vorkommen. Hierbei ist etwa an Inhaltsverzeichnisse oder Indices zu denken. Andere Komponenten hingegen - elektronisch direkt ausführbare Verweise, sogenannte LINKS, und bestimmte NAVIGATIONSKOMPONENTEN - finden sich nicht in Printmedien und können daher als hypertext-spezifisch angesehen werden.
6.2 Komponente I: Knoten
Die Information eines Hypertextes ist in viele disjunkte Einheiten aufgeteilt. Diese Knoten als „grundlegende, atomare Informationseinheiten“ 2 (vgl. Gerdes 1997 S. 12f. u. Kuhlen 1991 S. 79f.) sollen im folgenden hinsichtlich Größe, Inhalt, Kohärenz 3 , Funktionalität sowie weiterer Eigenschaften näher charakterisiert werden.
1 Dieses Kapitel ist eine überarbeitete und erweiterte Version des Abschnitts 2.2 meiner
unveröffentlichten Magisterarbeit. Die Arbeit ist über das Internet als PDF-Datei zu beziehen
[http://www.huberoliver.de/Magister.pdf].
2 „Knoten sind [...] nicht immer atomar.“ (Schnupp 1992 S. 58) In manchen Hypertext-Systemen ist
es möglich, Knoten in einen anderen Knoten einzubauen, und/oder die Information ein und
desselben Knotens in einer zusammengefaßten sowie einer ausführlichen Version, die vom Leser
bei Bedarf mittels eines Software-Mechanismus’ aktiviert werden kann, darzustellen. In diesem Fall
spricht man von STRETCHTEXTEN (vgl. Schnupp 1992 S. 40; Ansel Suter S. 19 f.). Mit XLINK, dem
LINKING-Mechanismus von XML, sind solche Stretchtexte ebenfalls möglich (siehe Kapitel 15.2.3).
Eine Unterscheidung bzgl. dieses TRAVESIERUNGSVERHALTENS unternimmt Kapitel 6.3.4.
3 Die Definitionen textlinguistischer Termini finden Sie in den Kapiteln von Teil B.
Teil A: Hypertext als Untersuchungsgegenstand 24
6.2.1 Struktur
Der Knoten Buchvorstellung der untenstehenden Abbildung läßt sich in drei Komponenten einteilen: KNOTEN-NAME, KNOTEN-INHALT und LINKS. 1
Abbildung 1: Knotenstruktur
In der Regel verfügt jeder Knoten über eine eindeutige Etikettierung. Durch diesen Knoten-Namen ist der Knoten im Netzwerk identifizierbar und kann indexiert werden 2 .
Informative Einheiten stellen die Inhalte des Knotens. Die Einheiten können dabei prinzipiell multimedial sein. Im obigen Beispiel ist der Knoten lediglich mit Fließtext und Links (siehe unten) gefüllt.
Durch solche direkt durch Mausklick ausführbare Links kann der Leser vom aktuellen Knoten zu einem anderen navigieren: In obiger Abbildung stellen die markierten Wörter Etymologie und Seebold sogenannte LINK-ANKER - bzw. LINK-TEXTE bei rein textueller Realisierung - dar, die auf Knoten (oder Teile von Knoten) verweisen, welche in irgendeiner Form ‚mehr Information‘ zu den besagten Begriffen bereithalten.
1 Kuhlen definiert neben den genannten drei Komponenten noch zwei weitere: einen
BEGRIFFSORIENTIERTEN REFERENZTEIL (Schlüsselwörter) sowie einen ZUSAMMENFASSENDEN
REFERENZTEIL (Kurzinhalt). Allerdings sind diese Komponenten in erster Linie für das INFORMATION
RETRIEVAL in größeren Hypertexten und somit für informationswissenschaftliche Disziplinen in-
teressant. (vgl. Kuhlen 1991 S. 79 f. u. 97).
2 Die Etikettierung wird bei Horn „labeling principle“ genannt: Der Knoteninhalt soll sich für den
Leser möglichst einfach durch den Knotennamen erschließen lassen (Horn 1989 S. 86 f. ).
Teil A: Hypertext als Untersuchungsgegenstand 25
6.2.2 Inhalt und Größe
Lassen sich die formalen Aspekte eines Knotens noch relativ eindeutig festlegen, so sind Fragen nach dessen Inhalt und Größe schwerer zu beantworten. Der Inhalt eines Knotens läßt sich laut Kuhlen „weder in intensionaler noch in extensionaler Sicht [...] exakt definieren“ (Kuhlen 1991 S. 79). Nach Bolter sind es „topics“, die mittels entsprechender „connections“ miteinander verbunden sind. Inhalt dieser „topics“ können entweder „paragraphs, sentences, individual words, or indeed digitized graphics“ sein (Bolter 1991 S. 24).
Hierbei stellt sich freilich die Frage nach der richtigen Fragmentierung des Textes durch den Autor, also die Frage nach dem Wieviel an Füllung pro Knoten. Von manchen Autoren werden hierfür sehr konkrete Lösungen vorgeschlagen; man solle den einzelnen Knoten „short“ gestalten, nicht länger als etwa „hundred lines“ (Shneiderman u.a. 1991 S. 147). Andere greifen auf Ergebnisse der Erforschung der Kapazität des Kurzzeitgedächtnisses zurück, die besagen, der Mensch könne maximal sieben kognitive Einheiten (CHUNKS) auf einmal kurzfristig im Gedächtnis speichern. Horn folgert daraus, daß ein Knoten nicht mehr als sieben Sätze enthalten solle (sogenanntes „chunking principle“; Horn 1989 S. 86f.; vgl. auch Gerdes 1997 S. 13 sowie Kuhlen 1991 S. 87).
Gerdes bezeichnet die „Festlegung des Knoten-Inhalts“ (und somit auch der Knoten-Größe) als „ungelöstes Problem der Hypertext-Technologie“. Nach ihr bestehen die Knoten - abhängig vom spezifischen Hypertext-System - „nur aus einer einzigen Idee, bzw. Proposition, oder auch aus umfangreichen Textdateien“ (Gerdes 1997 S. 12). Das „relevance principle“ von Horn besagt ähnliches, nämlich, daß ein Knoten nur die zentrale Aussage einer einzigen Idee beinhalten darf. Weitere, periphere Aussagen zur selben Idee sollten, durch Links verbunden, in anderen Knoten abgelegt werden.
Wichtig ist an dieser Stelle festzuhalten, daß ein Knoten sowohl eine einzige Proposition als auch eine kohärente Kette mehrerer Propositionen enthalten kann. Der einzelne Knoten hat also potentiell die Möglichkeit, einen Text mit mehreren Kapiteln zu enthalten. In Kapitel 5 wurde festgestellt, daß solche traditionellen, elektronischen Texte, die in einem einzigen Knoten abgelegt sind, als E-TEXTE bezeichnet werden und nicht in den Bereich einer textlinguistischen Untersuchung fallen, die speziell auf Hypertexte ausgerichtet ist.
Teil A: Hypertext als Untersuchungsgegenstand 26
6.2.3 Darstellungsform
In der Forschung gibt es eine Kontroverse, ob das SCROLLEN ( Hoch- oder Herunterfahren) von Text verboten sein sollte oder nicht. 1 Die Befürworter dieses SCROLLING tendieren dazu, einem Knoten keinen bestimmten, bildschirmbedingten Umfang aufzuzwingen. Sie verstehen Hypertexte als elektronische Bücher. Die Knoten werden dabei mit Textabschnitten bzw. Kapiteln von variabler, den Gegebenheiten angepaßter Länge, verglichen. 2 Die Gegner des Scrolling hingegen sehen Hypertexte als Karteikartensysteme. Grundelement ist dabei die Karteikarte mit unveränderbarer Größe: Der Knoteninhalt sollte daher der Bildschirmgröße angepaßt werden. 3
Ein Blick auf Hypertexte im WWW läßt erkennen, daß sich weitgehend Realisierungen durchgesetzt haben, die einem Knoten keine Längenbeschränkung auferlegen. Allerdings gibt es auch hier eine Gegenbewegung: mittels sogenannter FRAMES 4 wird häufig eine ‚scroll-freie Zone‘ innerhalb eines Knotens angestrebt.
6.2.4 Knoten-Typen
Knoten können mindestens nach folgenden Kriterien unterschieden werden:
(1) Inhalt - Text vs. Multimedia
(2) Funktion - Inhaltlicher Knoten vs. Strukturknoten vs. Navigationsknoten (3) Komplexität - atomar vs. zusammengesetzt
ad (1): Für diese Untersuchung sind primär textuelle Knoten relevant. Dies bedeutet jedoch nicht, daß in den Hypertexten des Corpus’ keine Grafiken o.ä. vorkommen. In vorliegender Arbeit steht aber nicht das exakte Herausarbeiten der Struktur von in Hypertexten auftretenden nichtsprachlichen semiotischen Systemen im Vordergrund. Vielmehr geht es um die funktionale Gesamtwirkung von Knoten im Rahmen der jeweiligen Lesepfade.
1 Den aktuellen Stand der Diskussion um diese Designalternativen - besonders aus
lernpsychologischer Sichtweise - beschreibt Gerdes 1997 S. 15 f.
2 Meiner Meinung nach ist aber eher eine Analogie von SCROLLING zum Lesen einer Papyrusrolle
anzusetzen, da Kapitel in Büchern oft über mehrere Seiten gehen. Aufgrund des dadurch nötigen
Umblätterns ist die Buchmetapher für zu scrollende Knoten nur bedingt aussagefähig.
3 Der Umfang des Knotens müßte allerdings relational definiert werden. Aufgrund sehr
unterschiedlichen Bildschirmgrößen und Auflösungen könnte die Karteikartenmetapher ansonsten
nicht aufrechterhalten werden.
4 Frames unterteilen die Bildschirmanzeige in mehrere Bereiche. Jeder dieser Bereiche kann
eigene Inhalte haben. Oftmals sind einige der Frame-Bereiche an die Bildschirmgröße angepaßt,
wodurch ein Scrolling nicht mehr nötig ist.
Arbeit zitieren:
Oliver Huber, 2002, Hyper-Text-Linguistik (TAH: Ein Textlinguistisches Analysemodell für Hypertexte; Theoretisch und praktisch exemplifiziert am Problemfeld der typisierten Links von Hypertexten im World Wide Web), München, GRIN Verlag GmbH
Dieser Text kann über folgende URL aufgerufen und zitiert werden:
Einbetten
DOI
Auf dem Weg von der Zivilmacht zur Militärmacht? - Die Europäische Uni...
Politik - Internationale Politik - Thema: Europäische Union
Vordiplomarbeit, 36 Seiten
Onlinewerbung im Intermediavergleich mit klassischen Werbeträgern
Medien / Kommunikation - Multimedia, Internet, neue Technologien
Diplomarbeit, 73 Seiten
Die Schweiz und Deutschland im föderativen Vergleich
Politik - Politische Systeme - Allgemeines und Vergleiche
Hausarbeit (Hauptseminar), 27 Seiten
Die (neo-)pluralistische Theorie Ernst Fraenkels: Konzeption und Kriti...
Politik - Politische Theorie und Ideengeschichte
Referat (Ausarbeitung), 15 Seiten
Föderalismusreform in Deutschland und der Schweiz - ein Vergleich
Politik - Politische Systeme - Allgemeines und Vergleiche
Hausarbeit (Hauptseminar), 36 Seiten
Legitimation und Anspruch einer Gesundheitsberichterstattung: Gesundhe...
Hausarbeit, 33 Seiten
Betrachtung von Kontinuität und Wandel der deutschen Außenpolitik im W...
Politik - Internationale Politik - Thema: Deutsche Außenpolitik
Seminararbeit, 27 Seiten
Die politische Rede: "Regierungserklärung" im Landtag und Bu...
Rhetorik / Phonetik / Sprechwissenschaft
Hausarbeit (Hauptseminar), 39 Seiten
Kuhn, Lakatos, Feyerabend - Die Abkehr von Popper (?)
Philosophie - Theoretische (Erkenntnis, Wissenschaft, Logik, Sprache)
Seminararbeit, 17 Seiten
Deutschland als europäische Macht
Politik - Internationale Politik - Thema: Europäische Union
Hausarbeit, 17 Seiten
Personalentwicklungs-Bedarfsanalyse in einem Dienstleistungsunternehme...
BWL - Personal und Organisation
Diplomarbeit, 163 Seiten
Oliver Huber hat den Text Hyper-Text-Linguistik (TAH: Ein Textlinguistisches Analysemodell für Hypertexte; Theoretisch und praktisch exemplifiziert am Problemfeld der typisierten Links von Hypertexten im World Wide Web) veröffentlicht
Oliver Huber hat einen neuen Text hochgeladen
The World Wide Web and Databases
Third International Workshop W...
Gottfried Vossen, Dan Suciu
Internet y la World Wide Web Guia Visual = Internet and WWW Simplified
Ruth Maran, Maran Graphics Development Group
WWW Security: How to Build a Secure World Wide Web Connection
Robert S. MacGregor, Andreas Siegert, Ibm Books
0 Kommentare