L’objectif de notre étude est de proposer des dictionnaires électroniques dans lesquels sont recensés des noms en rapport direct avec les humains. La spécificité de ce travail lexicographique est son principe d’organisation qui est de nature syntactico-sémantique à la différence des dictionnaires traditionnels qui s’appuient exclusivement sur la sémantique et qui listent les mots sans en représenter de façon explicite et formalisée l’environnement syntaxique.

Excerpt

Table des matières

1. Introduction

2. Cadre théorique

2. 1. Le lexique-grammaire.

2.2. Traits syntactico-sémantiques et classes d'objets

2.2.1. Qu'entend-on par traits syntactico-sémantiques?

2.2.2. Les traits syntactico-sémantiques et la polysémie

2.2.3. Le trait humain

2.2.4. Les classes d'objets spécifiques du trait humain

2.3. Les concepts de «classes d’objets» et de «classes de prédicats».

3. Dictionnaires électroniques des «humains»

3.1. Le système de dictionnaires électroniques

3.2. Format des dictionnaires électroniques

3.3. Le module des humains

4. Description des classes d'humains

4.1. Classes appartenant à d’autres traits

4.1.1. Documents écrits ou oraux (doct; écr; propos)

4.1.2. Mouvements littéraires: the

4.1.3. Locatifs par métonymie(lcult; lhab; lscol; lspect; ltr; locm)

4.1.4. Les humains locatifs

4.1.5. Noms prédicatifs divers (npra; nprd; nprp)

4.2. Humains collectifs et humains non-collectifs

4.3. Religion et armée

4.3.1. Religion

4.3.1.1. Relig

4.3.1.2. Adeptes

4.3.1.3. Relig,fon

4.3.2. Militaires

4.3.2.1. Distinction entre et

4.3.2.2. Spécificités de la classe

4.4. Êtres mythiques: <êtrerelig > et

4.4.1. Personnages

4.4.2. Êtres relig.

4.5. Caractéristiques, qualités, défauts, maladies spécifiques aux humains.

4.5.1. Qualités (quaphy; quamor; quapsy)

4.5.2. Défauts (défphy; défmor; défpsy)

4.5.3. Maladies (malphy; malpsy)

4.5.4. Caractéristiques (caractphy; caractmor; caractpsy)

4.6. Statuts et tendances

4.6.1. Statuts (titre; rang; statut)

4.6.1.1. Titre

4.6.1.2. Rang

4.6.1.3. Statut

4.6.2. Tendances (mouv; partis)

4.6.2.1. Politique ()

4.6.2.2. Partisans ()

4.7. Activités

4.7.1. Activité professionnelle (spé,pro; pro)

4.7.2.Loisirs pouvant être également des professions (ins; sportif; artiste)

4.7.2.1. Instrumentistes

4.7.2.2. Artistes

4.7.3. Activités diverses (fon)

4.8. Vie, relations sociales et origines

4.8.1. Vie (âge)

4.8.2. Relations sociales (ape; rel)

4.8.2.1. Appellatifs humains ()

4.8.2.2. Relationnels ()

4.9. Résiduel

5. Les grammaires locales

5.1. Une sous-classe d’artistes : <écrivains>

5.1.1. Prédicats nominaux humains

5.1.2. Les arguments associés aux <écrivains>

5.1.3. Les noms prédicatifs non-humains appropriés à la classe des <écrivains>

5.1.4. Les adjectifs appropriés à la classe des <écrivains>

5.2. Une sous-classe de sportifs :

5.2.1. Les humains prédicatifs du domaine du

5.2.2. Les verbes prédicatifs du domaine du

5.2.3. Les noms prédicatifs non-humains du domaine du

5.2.4. Les arguments élémentaires du domaine du

5.2.5. Les adjectifs prédicatifs humains du domaine du

6. Conclusions

7. Bibliographie

Objectifs et thèmes de recherche

L'étude vise à proposer une formalisation lexicographique rigoureuse de termes liés au concept d'« humain » pour le traitement automatique des langues. En s'appuyant sur les principes du lexique-grammaire, le travail explore comment l'organisation syntaxique et sémantique permet de résoudre des problèmes de polysémie et d'améliorer la précision des systèmes de traduction.

Application des principes du lexique-grammaire à la description des noms humains.
Développement de classes d'objets spécifiques pour une modélisation précise du comportement syntaxique.
Analyse détaillée de cinquante-neuf classes reliées au trait « humain » (professions, statuts, relations sociales, etc.).
Mise en œuvre de grammaires locales pour des sous-domaines ciblés comme l'écriture et le football.
Conception de dictionnaires électroniques pour l'analyse et la génération en langue naturelle.

Auszug aus dem Buch

2. 1. Le lexique-grammaire

Les descriptions linguistiques traditionnelles conçoivent de façon générale les mots comme des unités élémentaires de forme et de sens. Ce sont ces mêmes unités élémentaires qui composent les différentes entrées des dictionnaires traditionnels (dictionnaires-papier) que nous connaissons et utilisons tous. Implicitement, cette pratique laisse apparaître une distinction entre le domaine de la syntaxe, auquel se rattacheraient les phrases en tant qu'associations structurées de mots, et celui du lexique, dont font partie les mots. Nous ne remettons pas en cause l’efficacité de cette théorie pour toute autre application, notamment lorsque celle-ci est destinée à un lecteur humain capable de comprendre et d’interpréter des données. C’est le cas des dictionnaires-papier courants ou encore de nombreuses grammaires ou supports didactiques.

Cependant, cette pratique lexicographique est peu efficace si l’on veut mener à bien une description cohérente et exhaustive de la langue et elle est pour cette même raison insuffisante et peu opérationnelle pour une utilisation informatique telle que nous la concevons. En effet, pour rendre compte de certains phénomènes, de régularités, nous pensons qu'il est nécessaire de traiter à la fois la syntaxe et le lexique: c'est la perspective méthodologique du lexique-grammaire (Gross, M. 1975).

C’est en effet dans le cadre théorique du lexique-grammaire que s’inscrit cette étude. Précisons que les cadres syntaxiques théoriques sont proches de ceux de la grammaire générative transformationnelle tels qu’ils apparaissent notamment dans les travaux de ses fondateurs, Harris et Chomsky, et que le cadre méthodologique est celui défini par Maurice Gross (1975).

Résumé des chapitres

1. Introduction: Ce chapitre présente les objectifs de l'étude, notamment la création de dictionnaires électroniques fondés sur une organisation syntactico-sémantique pour améliorer le traitement automatique des langues.

2. Cadre théorique: Le chapitre détaille la méthodologie du lexique-grammaire, en insistant sur la distinction entre prédicats et arguments, ainsi que sur l'importance de la phrase simple comme unité d'analyse.

3. Dictionnaires électroniques des «humains»: Ce chapitre explique le système de dictionnaires électroniques en tant qu'outil indispensable pour la traduction automatique, en détaillant les champs de données nécessaires pour une description exhaustive.

4. Description des classes d'humains: Cette partie centrale analyse les cinquante-neuf classes reliées au trait humain, en justifiant leur création par des critères sémantiques, syntaxiques et morphologiques.

5. Les grammaires locales: Ce chapitre illustre l'application concrète des concepts développés à travers deux sous-classes spécifiques : les <écrivains> et le domaine du .

6. Conclusions: La conclusion souligne l'importance des outils linguistiques formels pour le développement de logiciels d'analyse, de synthèse et de traduction automatique.

7. Bibliographie: Une liste complète des sources théoriques et des travaux lexicographiques cités.

Mots-clés

Traitement automatique des langues (TAL), lexique-grammaire, dictionnaires électroniques, classes d'objets, prédicats, arguments, trait humain, syntaxe, sémantique, grammaire locale, polysémie, description lexicographique, sous-domaines, traduction automatique, modélisation linguistique.

Foire aux questions

Quel est l'objectif fondamental de ce travail de recherche ?

L'objectif principal est de proposer des dictionnaires électroniques recensant les noms liés aux humains, organisés selon un principe syntactico-sémantique rigoureux, afin de pallier les insuffisances des dictionnaires traditionnels dans le cadre du traitement automatique des langues.

Quels sont les principaux domaines thématiques abordés ?

La recherche couvre une vaste gamme de catégories humaines, incluant notamment les professions, les statuts sociaux, les relations de parenté, les caractéristiques physiques et morales, la religion, l'armée, ainsi que des domaines spécialisés comme l'écriture et le sport (football).

Quelle est la recherche principale ou la question centrale ?

La question centrale est de déterminer comment une description formelle et exhaustive des propriétés syntaxiques et sémantiques des unités lexicales peut permettre à un ordinateur de comprendre et de générer correctement des énoncés, en particulier pour lever les ambiguïtés liées à la polysémie.

Quelle méthode scientifique est employée dans cette étude ?

L'étude repose sur la méthodologie du lexique-grammaire, initiée par Maurice Gross. Elle consiste à analyser les mots au sein de phrases simples et à établir des classes d'objets définies par les opérateurs (verbes, adjectifs) qui les sélectionnent comme arguments.

Quels aspects sont traités dans la partie principale (le cœur du sujet) ?

Le corps de l'ouvrage se concentre sur la description détaillée de cinquante-neuf classes d'humains. Il s'agit de justifier leur existence par des critères distributionnels et transformationnels, tout en soulignant la nécessité de spécifications sémantiques précises (domaines et sous-domaines).

Quels sont les mots-clés qui caractérisent le mieux cette recherche ?

Les termes essentiels sont le lexique-grammaire, les classes d'objets, le traitement automatique des langues (TAL), le trait « humain » et la notion d'emploi, qui est au cœur de la distinction des lemmes dans les dictionnaires électroniques.

Pourquoi la distinction entre « humain » et « non-humain » est-elle parfois difficile ?

L'auteur note que certains phénomènes linguistiques, comme la métonymie ou des emplois métaphoriques dans des contextes fictionnels ou poétiques, peuvent brouiller les pistes. Pour cette raison, l'étude insiste sur la nécessité d'une analyse fine des contraintes syntaxiques plutôt que de se fier uniquement à des définitions sémantiques générales.

Quel rôle jouent les « verbes supports » dans cette recherche ?

Les verbes supports sont cruciaux pour définir et distinguer les différentes classes d'objets. Ils permettent de caractériser précisément le comportement syntaxique d'une classe (par exemple, différencier un footballeur d'un médecin) là où un verbe support général comme « être » serait trop imprécis.

Comment le dictionnaire électronique traite-t-il le problème de la polysémie ?

Le système procède par un dédoublement systématique des formes polysémiques. Chaque lemme dans le dictionnaire doit correspondre à un et un seul emploi, défini par un domaine d'arguments spécifique, garantissant ainsi une précision maximale pour la traduction.

Quelle conclusion l'auteure tire-t-elle de l'application au football ?

L'analyse du domaine du football démontre que la construction de grammaires locales est indispensable. En identifiant les opérateurs spécifiques à ce sport, il devient possible de désambiguïser des termes polyvalents et d'assurer une traduction fidèle en langue cible.

Excerpt out of 112 pages - scroll top

Details

Title: Dictionnaire bilingue de classes sémantiques de noms humains. Une étude appliquée au traitement automatique des langues naturelles
Author: Sandrine Fuentes (Author)
Publication Year: 2018
Pages: 112
Catalog Number: V463425
ISBN (eBook): 9783668905573
ISBN (Book): 9783668905580
Language: French
Tags: dictionnaire
Product Safety: GRIN Publishing GmbH

Quote paper: Sandrine Fuentes (Author), 2018, Dictionnaire bilingue de classes sémantiques de noms humains. Une étude appliquée au traitement automatique des langues naturelles, Munich, GRIN Verlag, https://www.grin.com/document/463425

Dictionnaire bilingue de classes sémantiques de noms humains. Une étude appliquée au traitement automatique des langues naturelles