Il presente lavoro intende ad unire al livello interdisciplinare la metodologia statistica e linguistica a scopo di disambiguare la semantica delle co-occorrenze delle forme ambigue estratti da un Corpus lirico dei testi provenzali medievali. Per effettuare tale analisi sono stati applicati i metodi di semiometria che rappresentano un approccio indispensabile per poter mettere al confronto i dati statistici ottenuti dopo l’estrazione, con i risultati dello studio strettamente linguistico.
La semiometria offre la possibilità di misurare i dati applicando le conoscenze di statistica e matematica ed usa approcci simili all’analisi psicometrica e biometrica. Nello stesso tempo è molto impiegata nelle ricerche su marketing e in Text Mining.
Inhaltsverzeichnis (Indice)
- Introduzione
- Estrazione di dati linguistici di tre autori-trovieri dal corpus lemmatizzato
- Metodi d'estrazione delle co-occorrenze e classifica dei dati
- Il lemma faire come punto di riferimento più Sostantivo, Verbo, Aggettivo a destra e a sinistra
- Tipi di co-occorrenze
- classifica per l'analisi di statistica descrittiva
- Co-occorrenze (tre forme) - immediata vicinanza con il lemma faire
- Co-occorrenze (due forme) - immediata vicinanza con il lemma faire
- Co-occorrenze a distanza a 2 e 3 a (+)destra e a (-)sinistra
- Tipi di co-occorrenze - classifica per l'analisi di statistica inferenziale
- Co-occorrenze (tre forme) - a distanza massima 3 posizioni a (+)destra e a (-)sinistra
- Co-occorrenze delle forme uniche
- Co-occorrenze delle stesse forme
- Co-occorrenze di due forme del lemma faire nello stesso verso
- L'analisi statistica
- L'analisi fattoriale - coefficiente di correlazione di Pearson
- L'analisi delle componenti principali
- La matrice di correlazione dei lemmi amor, cor, vers, bon
- La rappresentazione del lemma faire come punto 0 sul grafico a dispersione
- La rappresentazione di (+)destra e (-)sinistra come positivo e negativo
- L'analisi semantica
- La disambiguazione semantica delle forme cor, cors
- L'algoritmo per la disambiguazione semantica di cor, cors
- La Self-Organizing Map (SOM) di Kohonen applicata alle collocazioni amor, cor, vers, bon
- Obiettivi da raggiungere
Zielsetzung und Themenschwerpunkte (Obiettivi e temi chiave)
Questo lavoro mira a unire a livello interdisciplinare la metodologia statistica e linguistica allo scopo di disambiguare la semantica delle co-occorrenze delle forme ambigue estratte da un Corpus lirico dei testi provenzali medievali.
- Applicazione di metodi di semiometria per analizzare dati linguistici.
- Utilizzo di statistica descrittiva e inferenziale per esaminare le co-occorrenze.
- Disambiguazione semantica di forme ambigue.
- Applicazione della Self-Organizing Map (SOM) di Kohonen per l'analisi dei dati.
- Studio delle collocazioni e della loro relazione con il lemma "faire" nei testi trobadorici.
Zusammenfassung der Kapitel (Sommario dei capitoli)
- L'introduzione presenta l'obiettivo del lavoro, che è quello di combinare la statistica e la linguistica per analizzare la semantica delle co-occorrenze in testi lirici provenzali medievali.
- Il secondo capitolo descrive l'estrazione dei dati linguistici da un corpus lemmatizzato di testi trobadorici, concentrandosi su tre autori specifici: Bernart de Ventadorn, Giraut de Borneil e Raimbaut d'Aurenga.
- Il terzo capitolo presenta i metodi utilizzati per l'estrazione delle co-occorrenze e la classificazione dei dati, che includono la creazione di una base di dati per ogni autore e la rappresentazione dei risultati su grafici.
- Il quarto capitolo si concentra sul lemma "faire" come punto di riferimento per l'analisi delle collocazioni e spiega come vengono distinte le collocazioni dalle libere locuzioni.
- Il quinto capitolo descrive la classificazione delle co-occorrenze per l'analisi di statistica descrittiva, con esempi di come le co-occorrenze vengono codificate e classificate in base alla posizione dei Sostantivi, Verbi e Aggettivi rispetto al lemma "faire".
- Il sesto capitolo introduce la classificazione delle co-occorrenze per l'analisi di statistica inferenziale, definendo diversi tipi di co-occorrenze in base alla distanza e alla forma dei lemmi.
- Il settimo capitolo analizza l'approccio statistico, descrivendo l'analisi fattoriale, il coefficiente di correlazione di Pearson e l'analisi dei componenti principali.
- L'ottavo capitolo esplora l'analisi semantica, concentrandosi sulla disambiguazione semantica delle forme "cor" e "cors" e presentando un algoritmo per questo processo.
- Il nono capitolo discute l'applicazione della Self-Organizing Map (SOM) di Kohonen alle collocazioni "amor", "cor", "vers" e "bon".
Schlüsselwörter (Parole chiave)
Semiometria, analisi statistica, analisi linguistica, co-occorrenze, ambiguità semantica, disambiguazione, collocazioni, lemma, faire, trovieri, lirica provenzale, corpus lemmatizzato, Self-Organizing Map (SOM) di Kohonen, analisi fattoriale, coefficiente di correlazione di Pearson.
- Quote paper
- Marina Balybina (Author), 2015, L’Analisi semiometrica della lirica trobadorica, Munich, GRIN Verlag, https://www.grin.com/document/310082