Universidad Complutense de Madrid
E-Prints Complutense

Corpus annotation of causal relations and their signals in English and Spanish
Corpus anotación de las relaciones causales y sus señales en Inglés y Español

Impacto

Descargas

Último año



Albaladejo Pay, Beatriz (2016) Corpus annotation of causal relations and their signals in English and Spanish. [Trabajo Fin de Máster]

[img]
Vista previa
PDF
2MB

URL Oficial: https://www.ucm.es/ma-elnaic


URLTipo de URL
http://www.ucm.es/filologia_inglesa_iInstitución


Resumen

El estudio de las relaciones causales y su expresión lingüística ha sido comúnmente estudiado desde diferentes perspectivas en los años recientes. Sin embargo, pocos estudios han intentado combinar diferentes enfoques para establecer el significado de estas relaciones, y han investigado de manera contrastiva las señales usadas para expresarlas. Este trabajo de fin de master es un proyecto para avanzar el conocimiento en este área mediante la investigación de: a) la posibilidad de caracterizar las relaciones causales en diferentes tipos, usando características que combinan un enfoque funcional y cognitivo; b) los tipos de relaciones causales preferidas en los textos expositivos en inglés y sus traducciones al español; c) las expresiones lingüísticas preferidas para expresar dichas relaciones causales en los textos originales en inglés y sus traducciones al español.
La metodología usada en esta investigación se basa en la anotación manual de un corpus bilingüe compuesto de un total de 37 textos expositivos (incluyendo los textos originales en inglés y sus traducciones al español) extraídos del corpus MULTINOT, un corpus de alta calidad, con registros diversificados y multifuncional bilingüe inglésespañol, actualmente compilado y anotado multidimensionalmente por los miembros del grupo de investigación FUNCAP con el proyecto MULTINOT (véase Lavid et al.2015)
El estudio se llevó a cabo en cuatro pasos principales: primero, un esquema de anotación para las relaciones causales en inglés y español fue diseñado constando de tres sistemas interrelacionados y sus correspondientes características; tras ello, se compiló un inventario de señales para las relaciones causales en inglés y español, y una categorización en diferentes tipos; seguidamente, el esquema de anotación fue implementado en la herramienta UAM Corpus Tool y el conjunto de textos bilingües fue anotado por el autor de este estudio; finalmente, los datos extraídos de la anotación fueron analizados estadísticamente para comprobar las posibles diferencias entre los textos originales en inglés y sus traducciones al español respecto a la selección del tipo de relación de causa y sus señales.
El análisis estadístico de los datos anotados sugiere que los tipos de relaciones de causa preferidos en los textos originales en inglés y son los tipos de contenido y no volitivos, que el orden de aparición de estos tipos de señales preferido es la segunda posición, y las señales más recurrentes usadas para expresar dichas relaciones son las conjunciones, seguidas de los sintagmas verbales. El análisis de las traducciones al español revela un alto grado de similitud con los datos de los textos originales en inglés, lo que sugiere que en las traducciones al español se conservan las preferencias de los textos originales en la mayoría de los casos y que estas elecciones pueden considerarse un indicativo de los textos expositivos en inglés. Proyectos futuros se centraran en el análisis de los textos originales en español para comprobar si las tendencias observadas en los textos originales en inglés y sus traducciones al español son también validas en textos originales en español, y en la especificación de patrones que puede ayudar al análisis automático de estas relaciones

Resumen (otros idiomas)

The study of causal relations and their linguistic expression has been widely studied from different perspectives in recent years. However, few studies have attempted to combine different approaches to the meaning of these relations, and investigated the signals used to express them in a contrastive manner. This Master's thesis is an attempt at advancing knowledge in this area by investigating: a) the possibility to characterize causal relations into different types, using features which combine functional and cognitive approaches; b) the preferred types of causal relations used in original English expository texts and their translations into Spanish; c) the preferred linguistic signals used to express those causal relations in original English texts and their translations into Spanish. The methodology used for this investigation is based on the manual corpus annotation of a bilingual dataset consisting of a total of thirty-six expository texts (including English original texts and their corresponding translations into Spanish), extracted from the non-fiction part of the MULTINOT corpus, a high-quality, registerdiversified and multifunctional bilingual English-Spanish corpus, currently compiled and multidimensionally-annotated by members of the FUNCAP Research Group within the MULTINOT project (see Lavid et al., 2015). The study was carried out in four major steps: first, an annotation scheme for causal relations in English and Spanish was designed consisting of three interrelated systems and their associated features; second, an inventory of signals for causal relations in English and Spanish, and a categorisation into different types was compiled; third, the annotation scheme was implemented in the UAM Corpus Tool and the bilingual sample was annotated by the author of this study; fourth, the annotated data was statistically analysed to check possible differences between the original English texts and their Spanish translations in the selection of causal relation types and their signals. The statistical analysis of the annotated data suggests that the preferred types of causal relations in the English original texts are „non-volitional‟ and „content‟ type, that the preferred order of occurrence is second-position, and the most frequent signal used are „conjunctions‟, followed by the use of lexical phrases. The analysis of the Spanish translations reveals a high degree of similarity with the English original data, which suggests that the Spanish translations preserve the choices made in the original texts in most of the cases, and that these choices can be considered as indicative of expository texts in the original English texts. Future work will focus on the analysis of original Spanish texts to check whether the observed tendencies in the original English texts and their translations into Spanish are also valid for original Spanish texts, and on the specification of patterns which may help in the automatic analysis of these relations

Tipo de documento:Trabajo Fin de Máster
Directores (o tutores):
NombreEmail del director (o tutor)
Lavid López, Julia
Palabras clave:Relaciones causales, Señales, Anotación de corpus, Inglés, Español
Palabras clave (otros idiomas):Causal relations, Signals, Corpus annotation, English, Spanish
Materias:Humanidades > Filología > Lingüística
Humanidades > Filología > Filología inglesa
Título del Máster:MA in English Linguistics: New Applications and International Communication
Código ID:38607
Depositado:01 Aug 2016 09:48
Última Modificación:22 Aug 2016 11:03

Descargas en el último año

Sólo personal del repositorio: página de control del artículo