Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie


Diplomarbeit, 2004

134 Seiten, Note: 1,0


Leseprobe

INHALTSVERZEICHNIS

ABBILDUNGSVERZEICHNIS

TABELLENVERZEICHNIS

1. EINLEITUNG
1.1. Die Welt des Internets und Computers
1.2. Quantitative Untersuchungen der Textkorpora
1.3. Verwendete Textkorpora

2. COMPUTERUNTERSTÜTZTE KORPUSANALYSE MIT DER SELBSTERSTELLTEN WEBAPPLIKATION
2.1. Funktionalitäten der Applikation:
2.2. Funktionsweise der Applikation
2.2.1. Text vorbereiten
2.2.2. Das Einfügen des vorbereiteten Textes
2.2.3. Die Textuntersuchungsoption auswählen
2.2.4. Text bearbeiten
2.3. Das Resultat der Textuntersuchung

3. PHONETIK UND PHONOLOGIE
3.1. Begriffe
3.2. Entstehung von Lauten
3.3. Phonemeinteilung nach akustischen Merkmalen
3.3.1. Vokalische Phoneme
3.3.2. Konsonantische Phoneme
3.3.3. Kompakte Phoneme
3.3.4. Diffuse Phoneme
3.3.5. Gravide Phoneme
3.3.6. Akute Phoneme
3.3.7. Nasale Phoneme
3.3.8. Kontinuierliche und unterbrochene Phoneme
3.3.9. Stimmhafte und stimmlose Konsonanten
3.3.10. Gleitlaute (Stridente)
3.3.11. Gespannte Phoneme
3.4. Einteilung der Phoneme nach artikulatorischen Merkmalen
3.4.1. Vokale
3.4.2. Konsonanten

4. PHONEMHÄUFIGKEIT
4.1. Phonemhäufigkeit im Gesamtkorpus
4.2. Phonemhäufigkeit in den literarischen Texten
4.3. Phonemhäufigkeit in journalistischen Texten
4.4. Phonemhäufigkeit in den Interviewtranskripten
4.5. Phonemhäufigkeit in den Sachtexten

5. WORTLÄNGE
5.1. Wortlänge im Gesamtkorpus
5.2. Wortlänge in den literarischen Korpora
5.3. Wortlänge in den journalistischen Texten
5.4. Wortlänge in den Interviewtranskripten
5.5. Wortlänge in den Sachtexten

6. SATZLÄNGE
6.1. Satzlänge in den literarischen Texten
6.2. Satzlänge in den journalistischen Texten
6.3. Satzlänge in den Interviewtranskripten
6.4. Satzlänge aller Korpora im Überblick

7. ZUSAMMENFASSUNG
7.1. Phonemhäufigkeit
7.2. Wortlänge
7.3. Satzlänge

8. SAŽETAK
8.1. Frekventnost fonema
8.2. Dužina riječi
8.3. Dužina rečenice

9. LITERATURVERZEICHNIS
9.1. Literatur aus dem Internet

ABBILDUNGSVERZEICHNIS

Abbildung in dieser Leseprobe nicht enthalten

TABELLENVERZEICHNIS

Abbildung in dieser Leseprobe nicht enthalten

1. EINLEITUNG

1.1. Die Welt des Internets und Computers

In der heutigen Welt des Internets und Computers begegnen wir uns fast jeden Tag mit neuen Ideen und neuen Möglichkeiten, die uns diese Zeit bietet. Noch gestern wäre diese Arbeit nicht möglich zu schreiben - vielleicht nicht in diesem Ausmaß.

Die anthropologischen Untersuchungen und viele andere die sich mit dem Menschen als einem weisen Wesen auseinander gesetzt haben, beweisen uns, dass wir heute ohne unsere Sprache als Kommunikationsmittel sicherlich nicht das wären, was wir heutzutage sind.

Wie schon vorher erwähnt, bieten uns die neuesten Technologien viele Möglichkeiten zur Forschung verschiedenster Phänomene, die unser Leben bestimmen. Diese Arbeit nutzt sie um manche Geheimnisse des Phänomens der menschlichen Sprache aufzuklären.

1.2. Quantitative Untersuchungen der Textkorpora

Quantitative Untersuchungen quantifizieren ein beliebiges Textkorpus einer Sprache nach verschiedenen Aspekten. Solche Analysen erfassen einzelne Merkmale von Texten, in dem sie Korpusstellen nach bestimmten Eigenschaften in Kategorien klassifiziert und die daraus resultierenden Ergebnisse darstellt.

Die Häufigkeiten in den einzelnen Kategorien bringen uns Erkenntnis über den bestimmten Merkmalen der untersuchten Textkorpora.

1.3. Verwendete Textkorpora

Bei der Selektion der Textkorpora, an denen die quantitativen Textanalysen durchgeführt wurden, war es besonders wichtig dass sie sich voneinander in ihrer Größe nicht viel unterscheiden. Bis auf den Roman von Andrić „Die Brücke über die Drina“, der in seinem vollen Umfang bearbeitet wurde, entsprechen alle anderen Textkorpora der Zeichenanzahl von Selimovićs „Der Derwisch und der Tod“.

Quantitative Untersuchungen wurden an folgenden Korpora durchgeführt:

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Verwendete Korpora

Danach wurden sie nach der Textsorte und dem JAT Reflex klassifiziert und nach ihren Texteigenschaften analysiert:

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Klassifikation der verwendeten Korpora

2. COMPUTERUNTERSTÜTZTE KORPUSANALYSE MIT DER SELBSTERSTELLTEN WEBAPPLIKATION

2.1. Funktionalitäten der Applikation:

- Häufigkeit der Zeichen, angeordnet nach Frequenz
- Verteilung der Wortlänge, ausgedrückt in Buchstaben
- Verteilung der Satzlängen, ausgedrückt in Wörtern und Buchstaben

Die Eingabemaske der Applikation sieht folgendermaßen aus:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung in dieser Leseprobe nicht enthalten

2.2. Funktionsweise der Applikation

Um eine computerunterstützte Untersuchung mit der Korpuslinguistik - Webapplikation vorzunehmen, sollten Sie die vier unten angeführten Schritte befolgen:

2.2.1. Text vorbereiten

Das tun Sie etwa so. Sie finden einen Text im Internet, markieren ihn und durch die Tastenkombination strg_C bringen den Text in die Zwischenablage. Derselbe Vorgang gilt auch bei den Texten aus den anderen Applikation z.B. Textverarbeitungssoftware (Word, Word Perfect, Lotus Notes.. . )

( In diesem Beispiel wird folgender Text verwendet : IvoAndrić, „Pismo iz 1920“)[1]

2.2.2. Das Einfügen des vorbereiteten Textes

Nachdem Sie den ersten Schritt gemacht haben, rufen Sie das Korpuslingustik – Webapplikation auf, die unter der Webadresse: http://plivac.net/linguistik zu finden ist. Bevor Sie irgendetwas tun, wählen Sie zuerst die richtige Codierung aus! Das tun Sie so, in dem Sie einfach auf eine der zwei Optionen klicken.

Abbildung in dieser Leseprobe nicht enthalten

Danach fahren Sie mit der Maus in das große Textfeld hinein und durch die Tastenkombination Shift- Einfg holen den Text aus der Zwischenablage heraus. Zur genaueren Textanalyse ist es ratsam die Textüberschriften zu entfernen.

Die Anzeige sollte dann etwa so aussehen:

Abbildung in dieser Leseprobe nicht enthalten

2.2.3. Die Textuntersuchungsoption auswählen

Bevor Sie aber zum letzten Schritt kommen, sollten Sie nur noch die gewünschte Textuntersuchungsoption wählen!

Abbildung in dieser Leseprobe nicht enthalten

2.2.4. Text bearbeiten

Und am Schluss klicken Sie einfach auf den Button "Text bearbeiten".

Abbildung in dieser Leseprobe nicht enthalten

Nach einer kurzen Bearbeitungszeit werden die Ergebnisse der Untersuchung angezeigt.

2.3. Das Resultat der Textuntersuchung

Bei dieser Auswahl

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 4: Verteilung der Satzlängen, ausgedrückt in Wörtern und Buchstaben als Beispiel

[...]


[1] ANDRIĆ Ivo: Zadužbina Ive Andrića, Iz Andrićeve riznice.Online im Internet: WWW: http://www.ivoandric.org.yu/html/body_andriceva_riznica_ii.html#Pismoiz1920 (04-06-21)

Ende der Leseprobe aus 134 Seiten

Details

Titel
Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie
Hochschule
Universität Wien  (Institut für Slawistik)
Note
1,0
Autor
Jahr
2004
Seiten
134
Katalognummer
V272858
ISBN (eBook)
9783656644712
ISBN (Buch)
9783656644750
Dateigröße
2562 KB
Sprache
Deutsch
Schlagworte
bosnisch, kroatisch, serbisch, Computerlingustik, Korpuslinguistik, quantitative Untersuchungen, Korpus, Textanalyse, slawische Sprachen, serbokroatisch
Arbeit zitieren
Ernest Plivac (Autor), 2004, Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie, München, GRIN Verlag, https://www.grin.com/document/272858

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Quantitative Untersuchungen zu den bosnischen, kroatischen und serbischen Texten mit Hilfe der Computerlinguistik und der Texttechnologie



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden