Der Textcorpus Frantext


Seminararbeit, 2004

9 Seiten, Note: 1,7


Leseprobe

Gliederung:

1. Einleitung

2. Die umfangreichen Möglichkeiten der Recherche innerhalb Frantext

3. Zu der hinter Frantext stehenden Institution

4. Die Möglichkeiten der Inanspruchnahme

5. Diverse mit Hilfe von Frantext erstellter wissenschaftliche Arbeiten

6. Fazit

7. Literaturnachweis

1. Einleitung

Frantext ist ein ca. 114.700.000 Wörter umfassendes Textcorpus, das sich ausschließlich aus geschriebenen Texten der französischen Sprache zusammensetzt. Darin enthalten sind 3.737 (Stand 01/01/04) schriftliche Textarbeiten, in denen an die 400.000 verschiedenen Worte vorkommen. Mündliche Texte, also auf Datenträger aufgenommene Texte (private und offizielle Unterhaltungen aller Art, Dialoge und Monologe aus Fernsehsendungen und Radioberichterstattungen jeglicher Art, etc) wurden für dieses Textcorpus nicht in eine schriftliche Form transkribiert, gehen also in keiner Art in das Textcorpus ein.

Es werden sowohl Texte der Belletristik (Romane, Gedichte, Theaterstücke), sie nehmen 80% des Corpora ein, als auch Sach- bzw. Fachtexte (Naturwissenschaften, literarische Kritiken, Geschichte, Wirtschaft, Religion, journalistische Texte etc.) und Korrespondenzen (Briefwechsel berühmter Persönlichkeiten) zur Forschung bzw. Recherche im Internet bereitgestellt. Frantext ist die umfangreichste Sammlung an zentralen, für die französische Literatur äußerst wichtigen Texten, in französischer Sprache mit sehr differenzierten Recherchemöglichkeiten. Die Texte, die in Frantext genutzt werden können stammen aus dem Zeitraum 1500-Heute. Schwerpunktmäßig berücksichtigt werden aber nur sämtliche Gattungen der gehobenen, belaborierten Literatur. Beiträge aus Zeitschriften, Zeitungen, Comics, „Pfennigromanen“ oder Kinderbücher etc werden nicht in dieses Online-Corpus aufgenommen.

Aus den jüngst in das Corpus aufgenommenen literarischen Werken lässt sich schließen, dass auch in Zukunft ausschließlich Texte der gehobenen Literatur in die Sammlung aufgenommen werden. (Quelle: http://www.atilf.fr/atilf/produits/ frantext_nouveautes.htm).

Recherchen anhand älterer Texte können beinahe ausschließlich mit diesem Online-Corpus betrieben werden, da Frantext diese als einziges Online-Corpus in einer solchen Vollständigkeit zur Textrecherche bereitstellt. Zwar bieten auch andere, meist öffentliche Institutionen mehr oder minder umfassende Textcorpora an, doch erreicht deren zur Verfügung stehender Bestand jeweils bei weitem nicht die Möglichkeiten von Frantext. Zu benennen sind dabei zum einen die Internetbibliothek ABU (Bibliothèque Universelle; http://abu.cnam.fr) mit ihren ungefähr 300 nach Autoren bzw. alphabetisch sortierten literarischen Texten (Mittelalter bis zum 19. Jahrhundert). Zum anderen der Corpus Bibliopolis (http://www.bibliopolis.fr/html/bdl/html/fs_bdl.htm), der neben einzelnen klassischen Texten auch triviale Texte, die Frantext nicht innehat, bereitstellt. Zuletzt Gallica (http://gallica.bnf.fr/classique), ein mit ca. 1000 Texten ebenfalls relativ umfassendes Internettextcorpus, welches über sämtliche Textgattungen (Mittelalter bis heute) beinahe jedem Niveaus verfügt. Alle drei bieten neben den Textausschnitten mit den Suchergebnissen auch die jeweiligen Volltexte an.

Besonders hervorzuheben sei noch das Corpus Base des Lexiques du Moyen Français

(BLMF; http://www.atilf.fr/blmf), dass im Begriff ist, in Frantext integriert zu werden. BLMF stellt Texte aller Art, also neben Belletristik und Wissenschaftstexten auch Urkunden, Rechtssprüche etc des Zeitraumes 1330-1500 zur Recherche zur Verfügung. Beachtenswert ist auch, dass die Texte zu 72% in Altfranzösisch verfasst sind und darüber hinaus diverse alte Dialekte in den Textcorpus mit aufgenommen wurden. Das Corpus des BLMF komplettiert somit quasi das Angebot an älteren Texten in Frantext.

Abschließend sei zu diesen Corpora angemerkt, dass sie im Gegensatz zu Frantext (siehe Punkt Vier) durchweg kostenlos (Bibliopolis nur für den ersten Monat) zu nutzen sind. Wirklich zeitgemäße, dem momentanen französischen Zeitgeist entsprechende Literatur, ist weiterhin nicht in Frantext vorhanden, auch die Bereitstellung mündlicher Corpora ist nicht geplant, jedoch bieten dies zum Teil die anderen kurz vorgestellten Corpora an. Trotz alledem ist Frantext die für linguistische Forschungen dienende umfangreichste Textsammlung französischsprachiger Texte im Internet und Grundlage vieler wissenschaftlicher Arbeiten jedem Niveaus.

2.Die umfangreichen Möglichkeiten der Recherche innerhalb Frantext:

Frantext ist in 2 Bereiche untergliedert, zum einen in den catalogue non catégorisé, zum anderen in den catalogue catágorisé. Beide Bereiche ähneln sich stark in ihrer Funktion, sind jedoch von der Bedienung her identisch.

a) der catalogue non catégorisé (3737 Texte)

Man bekommt nach der Suchbegriffeingabe die einzelnen zutreffenden Textpassagen angezeigt, darüber hinaus die Anzahl der gefundenen „Treffer“ und deren Lage innerhalb des Textes in der Reihenfolge (chronologisch, nach Autoren, alphabetisch etc geordnet) angezeigt, die man vorher ausgewählt hat. Auf Wunsch wird allerdings nicht nur die Anzahl der einzelnen Worte dargestellt, sondern das Ergebnis wird noch in die jeweilige Anzahl der verschieden Wortformen (Infinitive, Konjugative etc) unterteilt.

[...]

Ende der Leseprobe aus 9 Seiten

Details

Titel
Der Textcorpus Frantext
Hochschule
Christian-Albrechts-Universität Kiel  (Romanisches Seminar)
Veranstaltung
Unterseminar
Note
1,7
Autor
Jahr
2004
Seiten
9
Katalognummer
V36021
ISBN (eBook)
9783638357746
ISBN (Buch)
9783640258963
Dateigröße
453 KB
Sprache
Deutsch
Schlagworte
Textcorpus, Frantext, Unterseminar, Linguistik, Französisch, Sprachwissenschaft, elektronisch, Corpus
Arbeit zitieren
Bastian Naumann (Autor), 2004, Der Textcorpus Frantext, München, GRIN Verlag, https://www.grin.com/document/36021

Kommentare

  • Noch keine Kommentare.
Im eBook lesen
Titel: Der Textcorpus Frantext



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden