Análisis de la contribución de los fonemas a la predicción de la valencia emocional en tweets en español e inglés
Date
2020Authors
Bernal Rojas, Gabriel AlejandroDirectors
Alvarado Valencia, Jorge AndrésPublisher
Pontificia Universidad Javeriana
Faculty
Facultad de Ingeniería
Facultad de Ciencias Económicas y Administrativas
Program
Maestría en Analítica para la Inteligencia de Negocios
Obtained title
Magíster en Analítica para la Inteligencia de Negocios
Type
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaShare this record
Citación
Metadata
Show full item record
PDF documents
Resumen
Aunque tradicionalmente se ha asumido que el sonido de las palabras y su significado se relacionan de forma arbitraria, distintos hallazgos empíricos respaldan la hipótesis de que las unidades fonológicas básicas del lenguaje guardan una relación sistemática con aspectos semánticos, incluyendo la connotación afectiva y actitudinal de las palabras (Adelman, Estes, & Cossu, 2018; Aryani, Conrad, Schmidtke, & Jacobs, 2018; Dingemanse, Blasi, Lupyan, Christiansen, & Monaghan, 2015; Monaghan, Shillcock, Christiansen, & Kirby, 2014; Schmidtke, Conrad, & Jacobs, 2014). A partir de estas premisas, se buscó identificar si las unidades fonológicas del español y el inglés contribuyen a la predicción de la valencia emocional en un corpus de tweets. Para esto, se entrenó un conjunto de modelos de regresión lineal múltiple, cuyo desempeño fue evaluado a partir de la correlación y los indicadores de error calculados partir de las valencias predichas y las observadas en los datasets de prueba proporcionados por el concurso SemEval-2018 (Mohammad, Bravo-Márquez, Salameh, & Kiritchenko, 2018). Se encontró que la adición de los recursos fonológicos a un conjunto de predictores léxicos (Bag of Words de los Tweets, normalizada con el método TF-IDF) tiene un efecto reducido pero consistente sobre las métricas globales de ajuste, y en ambos idiomas permite discriminar con mayor precisión las valencias observadas cercanas a los valores medios, así como las valencias inferiores asociadas a contenidos afectivos negativos.
Keywords
Arbitrariedad del signo lingüísticoSimbolismo de los sonidos
Fonemas
Procesamiento del lenguaje natural
Análisis de sentimiento
Keywords
Arbitrariness of linguistic signSound symbolism
Phonemes
Natural language processing
Sentiment analysis
Themes
Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicasLenguaje natural (Informática)
Simbolismo
Google Analytics Statistics