Lexicografía bilingüe e córpora: Elaboración do Dicionario CLUVI español-galego a partir dun corpus textual da revista Consumer


Master's Thesis, 2009

124 Pages, Grade: 10


Excerpt

ÍNDICE:

I. TÍTULO: Lexicografía bilingüe e córpora: elaboración do Dicionario CLUVI espa ñ ol-galego a partir dun corpus textual da Revista Consumer

II. INTRODUCIÓN

III. METODOLOXÍA
1. Descrición do Corpus CLUVI
1.1. Delimitación e definición do traballo
1.2. Descrición do Corpus CONSUMER
2. Características do Dicionario CLUVI español-galego
2.1. Estrutura do dicionario
2.2. Lematización das entradas
a) Selección dos lemas
b) Codificación dos lemas
2.3. Observacións gramaticais e tradutolóxicas
2.4. Información contextual

IV. DICIONARIO (RESULTADO)

V. CONCLUSIÓNS

BIBLIOGRAFÍA

I. INTRODUCIÓN

Esta primeira achega do dicionario bilingüe español-galego baseado no Corpus CONSUMER incluído no Corpus Lingüístico da Universidade de Vigo (CLUVI) que presentamos como Traballo de Investigación Tutelado nace como unha aposta máis das levadas a cabo polo Seminario de Lingüística Informática para cubrir un oco no mundo dos recursos lingüísticos informatizados no que o galego aínda ten escasa importancia e/ou vixencia.

É, como se indica anteriormente, unha primeira achega, susceptible de ser mellorada e ampliada, que estará dispoñible en rede e cuxos obxectivos son os seguintes:

1. Elaborar un dicionario baseado en corpus significa, primeiramente, rachar coa metodoloxía habitual en lexicografía: copiar duns dicionarios a outros de xeración en xeración. Deste xeito, as vantaxes que nos proporciona un dicionario baseado en corpus son:

1.1. Proporciona exemplos/traducións de textos reais.
1.2. Non comete/copia os erros doutros dicionarios.
1.3. Achéganos información dos lemas en contextos reais.

2. Contribuíránormalización da lingua galega. Debidoáfalta de material lingüístico en galego e debido ao pouco coñecemento que temos da nosa propia lingua e ao mal uso que ás veces facemos dela por contaminación lingüística do español, considero esta unha ferramenta importante de caraácorrecta utilización da lingua galega nos ámbitos cotiás da vida, dado que as entradas que se recollen son, na súa maioría, de uso cotiá e non especializadas (aínda que si contén algún termo).
3. Dunha banda, debidoámiña formación no ámbito da tradución, o que se pretende é servir de axuda, principalmente, aos tradutores e tradutoras. Dispoñendo dun dicionario bilingüe en rede que, ademais, proporciona exemplos e, as máis das veces, varias posibilidades de tradución inseridas en contextos reaiséunha ferramenta de grande utilidade para os profesionais da tradución.
4. Por outra banda, e máis en xeral, este dicionario pretende resolver as dúbidas que calquera galegofalante ten acerca de certas palabras que, por influencia do castelán, como destaquei antes, descoñece da nosa propia lingua.

O traballo comeza cunha descrición do Corpus CLUVI, que contén o Corpus CONSUMER do que tiro os exemplos e as traducións dos lemas. A continuación, fálase da macro e microestrutura do dicionario en si e da metodoloxía empregadaáhora de escoller os lemas, da súa codificación, etc.

Finalmente, obtemos un resultado queéunha primeira achega do Dicionario CLUVI espa ñ olgalego baseado no Corpus CONSUMER cun total de 451 entradas que estará dispoñible en rede e suxeito a modificacións e suxestións.

II. METODOLOXÍA

1. Descrición do Corpus CLUVI

Neste proxecto de investigación empregouse como fonte base o Corpus CLUVI (Corpus Linguístico da Universidade de Vigo), un conxunto de córpora textuais de rexistros especializados de lingua galega contemporánea, accesibles para consulta na web desde setembro de 2003 no enderezo http://sli.uvigo.es/CLUVI.

Cunha extensión actual total superior aos 22 millóns de palabras, o CLUVI está formado por oito córpora paralelos principais pertencentes a cinco rexistros especializados (do ámbito xurídico-administrativo, do literario, do turismo, da informática e de divulgación científica) e a sete combinacións lingüísticas diferentes (5 bilingües: galego-español, inglés-galego, francés-galego, euskara-español e portugués-inglés e 2 tetralingües: inglés-galego-francés- español e español-galego-catalán-euskara). Estes oito córpora, con datos actuais sobre a súa extensión, son os seguintes:

- Corpus xurídico LEGA galego-español (6.582.415 palabras)
- Corpus UNESCO inglés-galego-francés-español de divulgación científica (3.724.620 palabras)
- Corpus LOGALIZA de localización de software inglés-galego (2.427.130 palabras)
- Corpus literario TECTRA inglés-galego (1.476.020 palabras)
- Corpus literario FEGA francés-galego (1.648.272 palabras)
- Corpus CONSUMER español-galego-catalán-euskara de información sobre consumo (5.586.431 palabras)
- Corpus xurídico LEGE-BI euskara-español (2.384.053 palabras)
- Corpus TURIGAL de turismo portugués-inglés (1.285.764 palabras)

O CLUVI inclúe tamén outros cinco córpora paralelos en distintas fases de elaboración:

- Corpus EGAL de economía galego-español (718.642 palabras)
- Corpus literario TECTRA inglés-portugués (875.595 palabras)
- Corpus literario TECTRA inglés-español (122.251 palabras)
- Corpus literario DEGA alemán-galego (76.364 palabras)
- Corpus VEIGA de subtitulación de películas inglés-galego (240.183 palabras)
- Corpus PALOP de literatura poscolonial portugués-español (566.590 palabras)

Neste corpus, o CLUVI, de forma xeral, a cada unidade do texto orixinal correspóndelle outra unidade do texto traducido. Hai, non obstante, excepcións: as chamadas asimetrías da tradución, que constitúen a principal dificultade para o aliñamento e, en consecuencia, tamén para o tratamento automático da extracción léxica bilingüe a partir do corpus paralelo. As asimetrías de tradución pódense definir como correspondencias non biunívocas e alteracións na orde das unidades de tradución.

A unidade básica de segmentación para o aliñamento dos bitextos do Corpus CLUVIéa frase ortográfica do texto orixinal. Se o habitualéque as correspondencias entre orixinal e tradución sexan biunívocas (1:1),édicir, que a unha frase do orixinal lle corresponde unha frase da tradución, danse tamén casos nos que unha frase do orixinal non se traduce (1:0), ou nos que a unha frase do orixinal lle corresponde na tradución media frase (1:1/2) ou dúas frases (1:2), ou mesmo nos que unha frase da tradución non se corresponde con ningunha frase do orixinal (0:1). Alén diso, a tradución implica ás veces desprazamentos de frases enteiras, ou movementos de fragmentos de frases do orixinal a outras frases na tradución.

No caso do Corpus CONSUMER só empregamos o par de linguas español-galego, e ese tipo de desprazamentos de frases ou a non total correspondencia entre unha frase no español e a 4 traducida en galego apenas se dá debidoáproximidade das linguas coas que se traballa.

O sistema de codificación do CLUVI utiliza unha versión adaptada dalgunhas das etiquetas que forman parte da especificación TMX para representar as correspondencias que non son 1:1 e os reordenamentos codificados no corpus paralelo. Os aspectos tradutolóxicos codificados no Corpus CLUVI pódense agrupar en tres categorías -omisións, adicións e reordenamentos-.

O aliñamento dos textos paralelos almacénase no CLUVI no formato TMX (Translation Memory Exchange), o estándar para a codificación en XML de memorias de tradución independentemente da aplicación utilizada. Nas próximas páxinas, amosarei as características xerais deste formato estándar e mais as solucións adoptadas no Corpus CLUVI para a codificación en TMX das equivalencias de tradución cando a correspondencia entre orixinal e tradución nonédirecta por mor da omisión, adición ou reordenamento de frases na tradución.

1.1. Delimitación e definición do traballo

Antes de elaborar o material lexicográfico, o dicionario propiamente dito, deberemos delimitar unha serie de cuestións que nos axudarán a definir e dirixir o traballo que imos presentar:

i) o tema do traballo
ii) os destinatarios do mesmo
iii) a función
iv) extensión do proxecto

En canto ao tema do traballo, tiñamos claro que cumpría material informatizado que traballara co par de linguas español-galego e con textos e exemplos reais dado que non existe material deste tipo en rede.

Para traballar con textos reais dispoñiamos do Corpus CLUVI e de todos os Corpus que o compoñen e que citamos anteriormente (p. 3-4), entre os cales se atopa o CONSUMER, que empregamos para a elaboración deste dicionari]o e sobre o que afondaremos nas seguintes páxinas.

Escollendo o Corpus CONSUMER para a extracción dos lemas estabamos asumindo a elaboración dun dicionario español-galego de linguaxe común, non especializado, posto que os textos cos que iamos traballar estaban extraídos da revista Consumer Eroski (http://revista.consumer.es/) que trata temas de saúde, de actualidade, ciencia popular e consumo dirixida a un público de nivel cultural medio.

Non obstante, a linguaxe común era o nivel da lingua co que queriamos traballar, posto que moitas veces as eivas que temos nalgunha destas linguas tan próximas refírenseálinguaxe coloquial,ácomunicación cotiá.

No tocante aos destinatarios do traballo, en primeira instancia pensamos nos profesionais da tradución, ámbito no que me inclúo, e mesmo nos estudantes da Licenciatura de Tradución e Interpretación da Universidade de Vigo. Había un baleiro na lexicografía galega que cumpría encher cun dicionario tan útil malia a proximidade das linguas de traballo, e de aí precisamente o problema.

A función que se pretende cumpriréprincipalmente a de normalización da lingua galega, avanzando un chanzo no camiño da normalización de linguas minorizadas ao fornecer léxico que, por contaminación lingüística, está en desuso ou que ás veces se descoñece.

Finalmente, tendo ben delimitados os recursos cos que imos traballar e a quen imos dirixir o noso proxecto, estimamos que o tempo necesario para a realización dunha primeira achega dun dicionario xeral bilingüe baseado en corpuséduns 8 meses, obtendo como resultado unha obra con 451 entradas e as súas correspondentes traducións.

1.2. Descrición do Corpus CONSUMER

O Corpus Consumer español-galego-catalán-euskara de información sobre consumo inclúe 1.036 artigos da revista Consumer Eroski (http://revista.consumer.es/) publicados entre 1998 e 2005.

Este Corpus conta na actualidade con 5.586.431 palabras; cun total de 89.780 unidades de tradución: 1.768.998 palabras no español, 1.248.520 palabras no galego, 1.368.600 palabras no catalán e 1.200.313 palabras en euskara.

2. Características do Dicionario CLUVI espa ñ ol-galego

Este dicionario bilingüe español-galego que presentamos (dispoñible no enderezo http://sli.uvigo.es/CLEG/)éun proxecto que se insire no marco de investigación en lexicografía baseada en córpora Seminario de Lingüística Informática (http://sli.uvigo.es).

Este grupo xa presentou a 2ª edición do Dicionario CLUVI inglés-galego (2008), un traballo ambicioso e moi importante no marco da normalización e emprego da lingua galega e, por suposto, na licenciatura de Tradución e Interpretación da rama inglés-galego, cuxos alumnos, ata o de agora, non contaban con material bilingüe en rede que se adaptaseásúa combinación lingüística e, moito menos, con traducións e exemplos tirados de textos reais.

O Dicionario CLUVI inglés-galego (Gómez Guinovart et al., 2008)éun dicionario baseado na colección de textos ingleses traducidos ao galego que forma parte do Corpus CLUVI (Gómez Guinovart, 2003) e que constitúe o primeiro dicionario baseado en córpora da lexicografía galega.

Desde o ano 2005, está dispoñible na web, no enderezo http://sli.uvigo.es/dicionario. A primeira edición do dicionario, na súa versión 1.5 (2006) alcanzaba as 6.677 entradas e 10.807 traducións. A segunda edición, dispoñible desde setembro de 2008, incorpora ao dicionario un maior número de entradas e equivalencias tiradas do Corpus CLUVI (20.000 entradas con 30.000 traducións e 60.000 exemplos), ao tempo que amplía os datos lexicográficos contidos nos artigos con información sobre americanismos e variantes ortográficas e con notas de interese gramatical, tradutolóxico e normativo.

O Dicionario CLUVI espa ñ ol-galego http://sli.uvigo.es/CLEG/ na súa primeira versión contén 451 entradas e 864 traducións. Con respectoásúa estrutura tomouse como referencia a do Dicionario CLUVI inglés-galego, xa que daba información bastante completa sobre os lemas e sobre as traducións. Aínda así, decidimos facer algúns cambios ou melloras con respecto a esa obra, que carecía de información sobre a flexión de xénero tanto no lema como na tradución e tampouco indicaba a categoría gramatical do que daremos en chamar e explicaremos máis adiante como plurilex (aquelas combinacións lingüísticas de máis dunha palabra (1+n) que adoitamos denominar refráns, locucións, etc.). Respectamos, e pareceunos moi axeitado, seguir empregando as notas gramaticais e as de tradución (que verten información sobre o lema ou sobre o equivalente ou equivalentes na outra lingua respectivamente) e, en xeral, mantemos a mesma etiquetaxe e seguimos as mesmas pautas de elaboración.

2.1. Estrutura do dicionario

Unha vez rematada a fase de selección dos lemas e de construción da macroestrutura, continuamos co proceso de edición do dicionario traballando sobre a microestrutura,édicir, a estrutura interna das entradas.

Para empezar, e como comentamos anteriormente, elaboramos unha serie de “modelos” ou “fichas” para cubrir atendendo os distintos casos cos que nos podiamos atopar:

a) Modelo para entrada simple (1 lema: 1 tradución)
b) Modelo para entradas pertencentes a dúas ou máis categorías gramaticais
c) Modelo para unha entrada con varias traducións
d) Modelo coa flexión de xénero tanto no lema como na tradución
e) Modelo con plurilex e cambio de categoría (cando hai plurilex, hai cambio de categoría gramatical)
f) Modelo con nota gramatical e nota de tradución

O Dicionario CLUVI espa ñ ol-galego http://sli.uvigo.es/CLEG/ editouse integramente en formato XML, respectando unhas normas de codificación sinxelas definidas na súa DTD (definición do tipo de documento), queéa seguinte:

Abbildung in dieser Leseprobe nicht enthalten

Esta DTD interprétase do seguinte xeito: un elemento de tipo dicionario está formado por un conxunto de entradas; cada entrada inclúe ademais do lema, a posibilidade de reflectir a flexión de xénero dos lemas e un conxunto de informacións tradutolóxicas agrupadas en función das posibles categorías gramaticais do lema. Cada un destes conxuntos (denominados super_cat na DTD) pode conter unha ou máis acepcións, así como unha nota gramatical. A información agrupada en cada acepción inclúe a tradución en galego, un exemplo de uso documentado no corpus e, opcionalmente, a expresión plurilexemática (fraseolóxica) da que forma parte o lema na acepción, a flexión da tradución (se a tiver) e unha nota de tradución. Por último, cada exemplo consta dun fragmento textual do Corpus CONSUMER en español, a súa tradución ao galego e a referencia da obra (fonte) na que se documenta o exemplo.

Deste xeito, cada entrada do dicionario pode incluír cada unha das etiquetas e casos concretos citados na páxina 9, codificándoa como se mostra a continuación mediante este exemplo:

Abbildung in dieser Leseprobe nicht enthalten

As entradas, codificadas en XML, son convertidas ao formato de impresión do dicionario mediante unha folla de estilo XSL. Así, o exemplo anterior da entrada de un correspóndese coa seguinte presentación impresa:

Abbildung in dieser Leseprobe nicht enthalten

2.1.1. Información das etiquetas

Á hora de elaborar o dicionario debemos establecer previamente a información que se vai incluír nas etiquetas. Así, resultaba especialmente claro que na etiqueta do <lema> iría a palabra en castelán, así como en <traducion> o seu correspondente en galego. A novidade con respecto doutro material deste tipoéo emprego das etiquetas da flexión de xénero para o lema e para a tradución (<flex> e <flex_tr> respectivamente) cando se tratase de substantivos, determinantes ou adxectivos non comúns,édicir, que teñen distinta forma para o masculino e para o feminino. Os casos cos que nos atopamos foron de flexión no morfema de xénero, mais tamén existe flexión no lexema (aínda que non se reflicte neste traballo).

FLEXIÓN NO MORFEMA DE XÉNERO:

Abbildung in dieser Leseprobe nicht enthalten

Nalgunhas entradas cumpría engadir información acerca do lema ou acerca da tradución, polo que demos en empregar as notas gramaticais (<nota_gr>) para recoller indicacións ou advertencias de uso sobre o lema, e as notas de tradución (<nota_tr>) para engadir información e advertencias sobre o equivalente en galego e sobre o que afondaremos nas próximas páxinas.

Ademais, todos os exemplos están sacados dunha fonte (<fonte>) composta por un código alfanumérico, a través do cal podemos acceder a un contexto máis amplo dos exemplos.

Polo que respecta ao contido das entradas cabe destacar, por último, a sección de fraseoloxía. Empregamos a etiqueta <plurilex> para engadir calquera refrán ou locución de máis dunha palabra que teña como núcleo o lema desa entrada proporcionando información sobre os usos fraseolóxicos do lema (outra das novidades con respecto ao Dicionario CLUVI inglés-galego, por exemplo).

Abbildung in dieser Leseprobe nicht enthalten

2.2. Lematización das entradas

A continuación, trataremos os criterios que seguimos para a selección dos lemas e como se codifican unha vez escollidos, as abreviaturas que empregamos para as categorías gramaticais, etc.

a) Selección dos lemas

A extracción de léxico que serviu de baseáxeración do Dicionario CLUVI espa ñ ol-galego realizouse, concretamente, a partir do Corpus CONSUMER. O criterio que se seguiu para a selección dos lemas foi a frecuencia de uso de cada palabra nese Corpus e a extracción fíxose empregando un programa informático. Isto permitiunos ordenar o léxico por frecuencia para, a posteriori, facilitar a tarefa de elaboración do dicionario.

Desbotamos, dunha parte, incluír os topónimos e antropónimos no noso dicionario, posto que non existían diferenzas entre as linguas con respecto a este grupo de palabras nos exemplos tirados do Corpus CONSUMER.

Por outra parte, como o noso dicionario inclúe expresións plurilexemáticas, tiñamos que buscar unha forma de atopar aquelas combinacións de 1+n-gramas máis frecuentes que,ásúa vez, aparecesen frecuentemente combinadas. É dicir, que un grupo de palabras (1+n) aparecese frecuentemente combinado para saber que se podía tratar dunha locución e que esa locución fose frecuente ao longo do Corpus. Para isto, empregamos O Tiratermos http://sli.uvigo.es/tiratermos/ , unha ferramenta de extracción de información terminolóxica do Corpus Técnico do Galego e do Corpus CLUVI que nos permitía buscar patróns bilingües dentro do Corpus CONSUMER empregando o programa de aliñamento léxico NATools (Simões e Almeida, 2003). Este programa calcula o índice de correlación entre as coaparicións dos elementos léxicos nas oracións bilingües aliñadas e ofrece como saída da extracción un dicionario probabilístico español-galego consistente nunha lista bilingüe de todas as palabras distintas que aparecen nos textos en español do corpus, cada unha delas acompañada da súa frecuencia absoluta no corpus e de ata oito palabras en galego consideradas polo aliñador como traducións máis probables. A partir da lista que nos ofrecía, xeramos unha folla de Excel e traballamos coas locucións de 1+n-gramas máis frecuentes a partir dela. Deste xeito, evitabamos consultar os dicionarios en papel ou os dicionarios comúns informatizados e calcar as súas propostas. Deixariamos de empregar entón o corpus como base e cometeriamos precisamente o erro dos dicionarios: copiárense duns a outros.

Porén, como todo traballo de investigación vai evolucionando e cambiando a medida que se vai avanzando na investigación, o criterio para a selección dos lemas tamén foi mudando. Con respecto ás expresións plurilexemáticas das que falabamos nas páxinas anteriores, antes de botar man do Tiratermos, baseábame no meu coñecemento da lingua para escoller e buscar as locucións. Evidentemente, non era unha metodoloxía moi rigorosa e, sobre todo, quedaba escasaáhora de mostrar todas as solucións plurilexemáticas posibles co lema en cuestión como núcleo.

Xa por último, tamén contabamos cun ficheiro que incluía os n-gramas (de 1 a 4) da parte español do Corpus CONSUMER e que cumpría revisar para aproveitar as secuencias máis frecuentes e incluílas no traballo. Mais, por falta de tempo, esta parte non a puidemos levar a cabo aínda que traballaremos sobre ela, de seguro, nunha ampliación e mellora próxima do dicionario.

b) Codificación dos lemas

Unha vez rematada a fase de selección dos lemas no corpus cumpría establecer unha serie de normas con respecto ás abreviaturas que iamos empregar para clasificar gramaticalmente os lemas. Así, establecemos desde unha listaxe para as categorías gramaticais en galego, ata a orde que normalmente se segueáhora de lematizar as expresións plurilexemáticas. Deste

xeito, conviñemos que a orde para lematizar os plurilex sería a seguinte:

1º nome
2º verbo
3º adxectivo
4º adverbio

Quere dicir isto que se unha locución está formada, por exemplo, por unha preposición, un verbo e un substantivo, clasificarémola na entrada cuxo lema sexa o substantivo que contén esa unidade plurilexemática.

Ás veces atopámonos con locucións ou frases feitas cuxo núcleo non era a entrada que estabamos a lematizar, e tivemos que crear entradas ad hoc para posteriormente poder engadir esa expresión plurilexemática, malia que ese lema non estivese entre os máis frecuentes da nosa lista de frecuencias dos n-gramas (n=1). É o exemplo de “sin embargo”, cuxo núcleoéo substantivo embargo (pouco frecuente no corpus) mais a construción plurilexemáticaémoi habitual en español e, aparte, moi empregada en galego e con cambios respecto ao seu uso despois da normativa de 2003 que coidamos cumpría sinalar. Foi por isto polo que sacrificamos, en casos coma este, o principio da frecuencia no corpus polo do uso na linguaxe común habitual. E velaquí ilustramos ese exemplo:

Abbildung in dieser Leseprobe nicht enthalten

No tocante ás categorías gramaticais establecemos, como se dixo anteriormente, unha listaxe coas abreviaturas que empregariamos ao longo da elaboración do Dicionario CLUVI espa ñ ol- galego para evitar incoherencias ao respecto dado que o traballo se ía desenvolver durante un período longo de tempo e así non dariamos en utilizar abreviacións diferentes cada vez que avanzásemos no traballo.

Polo tanto, as abreviaturas que demos en utilizar foron as seguintes:

Abbildung in dieser Leseprobe nicht enthalten

Abreviaturas para as expresións plurilexemáticas

Abbildung in dieser Leseprobe nicht enthalten

Abreviaturas para o xénero e lemas con flexión

Abbildung in dieser Leseprobe nicht enthalten

2.3. Observacións gramaticais e tradutolóxicas

O Dicionario CLUVI espa ñ ol-galego ofrece, mediante o uso das notas, información acerca do lema ou acerca da tradución, polo que demos en empregar as notas gramaticais (<nota_gr>) para recoller indicacións ou advertencias de uso sobre o lema, e as notas de tradución (<nota_tr>) para engadir información e advertencias sobre o equivalente en galego. As notas gramaticais verten información sobre todo ortográfica e de uso sobre o lema en 22 español.

Mediante o uso das notas de tradución achégase información ortográfica, morfolóxica e de uso sobre as traducións galegas dos lemas. Infórmase, por exemplo, dos cambios ortográficos da última reforma normativa do ano 2003. Era especialmente necesario engadir notas de tradución debido ao corpus co que traballamos, posto queéanterioránormativa do 2003 e, por iso, había que indicar os cambios que isto supoñíaáhora de lematizar as entradas. Deste xeito, estariamos a recoller no exemplo unha palabra distintaáque se dá como tradución (caso de produto/producto, espacio/espazo, etc.) e por este motivo debiamos engadir unha nota aclaratoria especificando que se trata da mesma palabra, pero unha posterior e outra anterioránormativa do 2003 da lingua galega. Cómpre ter en conta que moitos dos textos do Corpus CLUVI dos que se tiran os exemplos son anteriores a esta reforma, polo que as advertencias son sempre oportunas:

Abbildung in dieser Leseprobe nicht enthalten

Tamén consideramos de grande axuda incluír advertencias sobre erros de lingua habituais, como algúns castelanismos moi estendidos que se manifestan, sobre todo, no xénero dalgunhas palabras:

Abbildung in dieser Leseprobe nicht enthalten

2.4. Información contextual

Unha das principais características deste dicionarioéa contextualización dos lemas. Todas as palabras están inseridas nun contexto que abarcaría, nun principio, unha oración completa (de punto a punto); contexto que se pode ampliar, se así se quixer, pinchando no código alfanumérico que se especifica na etiqueta <fonte> ou no propio corpus. Despois de facer a busca no Corpus CONSUMER do lema en cuestión, as posibilidades de tradución que presenta son variadas, moitas veces repetidas, outras nin sequera corresponde o exemplo en galego co español e outras, nin sequera existe corpus equivalente en galego (debido, probablemente, a un problema de aliñación). Polo tanto, as accións que cómpre levar a cabo son 3:

1. Descartar, primeiramente, todo aquel exemplo en español que non teña exemplo equivalente en galego.
2. Descartar aqueles exemplos en galego que non se corresponden co corpus español.
3. Escoller un exemplo de tradución dos múltiples que proporciona o corpus.

Á hora de elixir os exemplos que puideran ser válidos optamos, dunha banda, por escoller aquel que mellor e máis claramente reflectía o significado do lema e da tradución dentro da oración. Así, descartamos frases sen verbo, frases moi curtas ou frases excesivamente longas. Ocorreu, nalgún caso, que non se puideron exemplificar todas as posibilidades de tradución por falta de exemplos no corpus, polo que, directamente, houbo que excluír algunhas solucións.

IV. DICIONARIO CLUVI ESPAÑOL-GALEGO Dispoñible en http://sli.uvigo.es/CLEG/

acceso - s. m.

acceso - También la formación del demandante condiciona y encauza el acceso al trabajo: un título

universitario no garantiza eléxito, excepto en caso de licenciaturas relacionadas con las nuevas tecnologías, en pleno auge hoy. Tamén a formación do demandante condiciona e encamiña o accesoótraballo: un título universitario non garante o éxito, agás no caso de licenciaturas relacionadas coas novas tecnoloxías, en auxe hoxe en día. [CM1 (5580)]

acción - s. f.

acción - Pueden provocar efectos secundarios como alergias o dependencia, y su acción se centra

solamente en la zona de la coronilla o mitad posterior de la cabeza, y al dejar de utilizarlo, el pelo que se ha conseguido mantener con este producto se caeráen un corto plazo de tiempo. Poden provocar efectos secundarios como alerxias ou dependencia, e a súa acción céntrase soamente na zona do cocote ou metade posterior da cabeza, e,ódeixar de utilizalo, o pelo que se conseguiu manter con este producto caerá nun curto prazo de tempo. [CM1 (9587)]

aceite - s. m.

aceite - La cantidad de grasa y calorías que contiene un guiso o estofado depende de la cantidad de aceite que se emplee y de los ingredientes que los compongan. A cantidade de graxa e de calorías que contén un guiso ou estufado depende da cantidade de aceite que se empregue e dos ingredientes que o compoñan. [CM1 (14033)]

- loc. n.

- ácido, ácida adx.

ácido, ácida - Por otra parte, el pH informa del carácterácido o alcalino de un agua, que puede estar influido por el CO2 disuelto, la cantidad de carbonatos y bicarbonatos que contenga, etc. Por outra parte, o pH informa do carácter ácido ou alcalino dunha auga, que pode estar influído polo CO2 disolto, a cantidade de carbonatos e bicarbonatos que conteña, etc. [CM1 (19401)]

- ácido bórico ácido bórico - Los análisis han revelado que ninguno de los siete fabricantes empleaácido bórico en estos langostinos. As análises revelaron que ningún dos sete fabricantes emprega ácido bórico nestes lagostinos. [CM1 (19913)]

- ácido graso ácido graxo - Losácidos grasos saturados son más abundantes en las grasas vegetales que en los aceites. Os ácidos graxos saturados son máis abundantes nas graxas vexetais ca nos aceites. [CM1 (18781)]

- ácido linolénico ácido linolénico - El de soja contiene muchoácido linolénico , otra grasa insaturada. O de soia contén moito ácido linolénico, outra graxa insaturada. [CM1 (20396)]

- ácido sórbico ácido sórbico - Como conservante, recurren al sorbato potásico, medido en forma deácido sórbico . Como conservante, recorrenósorbato potásico, medido en forma de ácido sórbico. [CM1 (20376)]

- ácido trans ácido trans - El resto evidenciaron un contenido inferior al 1% deácidos trans . O resto evidenciaron un contido inferioró1% de ácidos trans. [CM1 (20402)]

actividad - s. f.

actividade - Respecto al despliegue de un programa de educación ambiental y a la información pedagógica que se ofrece al usuario y a las actividades y exhibiciones que se llevan a cabo, la tercera parte suspenden. Respectoódespregue dun programa de educación ambiental eáinformación pedagóxica que se ofreceóusuario e ás actividades e exhibicións que se levan a cabo, a terceira parte suspenden. [CM1 (4104)]

acudir - v.

acudir - Desayune fuerte antes de acudir al parque, de esta manera el estómago estarábien asentado en el momento de disfrutar de las atracciones más agitadas. Almorce ben antes de acudiróparque, deste xeito o estómago estará ben asentado no momento de gozar das atraccións máis axitadas. [CM1 (5889)]

acuerdo s. m.

acordo Son centros privados que mantienen acuerdos con la Administración para que los dineros

p ú blicos subvencionen una gran parte de sus costes operativos. Son centros privados que manteñen acordos coa Administración para que o diñeiro público subvencione unha boa parte do seu custo operativo. [CM1 (5450)]

loc. adv.

de acuerdo de acordo Es importante saber que en caso de no estar de acuerdo con el centro

asignado, sólo se dispondráde tres días para presentar una reclamación. É importante saber que no caso de non estar de acordo co centro asignado, só se disporá de tres días para presentar unha reclamación. [CM1 (5559)]

consonte a Utilice los termostatos programables que hay en el mercado, y que permiten preseleccionar el programa de funcionamiento de la calefacción, de acuerdo con la ocupación de la vivienda y las preferencias de los usuarios. Utilice os termóstatos programables que hai no mercado, e que permiten preselecciona-lo programa de funcionamento da calefacción consonteáocupación da vivenda e ás preferencias dos usuarios. [CM4 (13279)]

además adv.

ademais Además , en el 80% de los establecimientos no se preguntóal nuevo cliente si tenía

antecedentes familiares de cáncer de piel, que desaconsejaría la exposición a rayos UVA. Ademais, no 80% dos establecementos non se lle preguntouónovo cliente se tiña antecedentes familiares de cancro de pel, o que desaconsellaría a exposición ós raios UVA. [CM1 (10987)]

agua s. f.

auga Debe indicar la superficie construida y la superficie ú til, y también incluir las redes de suministro (electricidad, agua, gas, calefacción). Debe indica-la superficie construída e a superficie útil, e tamén incluílas redes de subministración (electricidade, auga, gas, calefacción). [CM1 (3710)]

ahora adv.

agora Hace unos a ñ os una tasa de natalidad alta era signo de atraso, pero ahora ocurre lo contrario en los países desarrollados. Hai uns anos unha taxa de natalidade alta era signo de atraso, pero agora ocorre o contrario nos países desenvolvidos. [CM2 (9719)]

loc. conx.

ahora bien agora ben Ahora bien, los due ñ os de perros que habitan en grandes ciudades les

facilitan sobras de comida en sólo un 27% de los casos, mientras que en los pueblos esta proporción alcanza el 64%. Agora ben, os donos de cans que habitan en grandes cidades facilítanlles sobras de comida en só un 27% dos casos, mentres que nas pequenas localidades esta proporción alcanza o 64%. [CM1 (4438)]

loc. adv.

ahora mismo agora mesmo Ahora mismo tres tecnologías compiten en el mercado del DVD regrabable. Agora mesmo tres tecnoloxías compiten no mercado do DVD regravable. [CM4 (9609)]

por ahora ata o momento Por el momento no ha habido resolución alguna al respecto por parte del Tribunal Supremo, lo que quiere decir que, por ahora, las entidades que no tienen sentencias en contra no están obligadas a suprimir el antiguo redondeo alza. Polo de agora non houbo resolución ningunhaórespecto por parte do Tribunal Supremo, o que quere dicir que, ata o momento, as entidades que non teñen sentencias en contra non están obrigadas a suprimi-lo antigo redondeoáalza. [CM4 (21005)]

polo de agora Por ahora, el debate científico se centra sobre todo en el impacto medioambiental del

[...]

Excerpt out of 124 pages

Details

Title
Lexicografía bilingüe e córpora: Elaboración do Dicionario CLUVI español-galego a partir dun corpus textual da revista Consumer
College
University of Vigo
Course
Programa de doutoramento Tradución e Paratradución (T&P)
Grade
10
Author
Year
2009
Pages
124
Catalog Number
V171878
ISBN (eBook)
9783640917822
ISBN (Book)
9783640917747
File size
1357 KB
Language
Portugues
Tags
lexicografía, elaboración, dicionario, cluvi, consumer
Quote paper
Diploma de Estudos Avanzados Iolanda Mato Creo (Author), 2009, Lexicografía bilingüe e córpora: Elaboración do Dicionario CLUVI español-galego a partir dun corpus textual da revista Consumer, Munich, GRIN Verlag, https://www.grin.com/document/171878

Comments

  • No comments yet.
Read the ebook
Title: Lexicografía bilingüe e córpora: Elaboración do Dicionario CLUVI español-galego a partir dun corpus textual da revista ConsumerUpload papers

Your term paper / thesis:

- Publication as eBook and book
- High royalties for the sales
- Completely free - with ISBN
- It only takes five minutes
- Every paper finds readers

Publish now - it's free