The role of user polarity novelty on sarcasm detection

Date
2018Authors
Vargas Cruz, Jaime AndrésDirectors
Alvarado Valencia, Jorge AndrésPublisher
Pontificia Universidad Javeriana
Faculty
Facultad de Ingeniería
Facultad de Ciencias Económicas y Administrativas
Program
Maestría en Analítica para la Inteligencia de Negocios
Obtained title
Magíster en Analítica para la Inteligencia de Negocios
Type
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaShare this record
Citación
Metadata
Show full item record
PDF documents
Resumen
El propósito principal de esta investigación fue proponer un método innovador para la detección de sarcasmo, basado en la historia de la polaridad del usuario y técnicas de detección de anomalías. Se trabajó con información de Twitter y se definió una entidad principal para el caso de estudio, respecto a la cual se analizaron los casos de sarcasmo. Adicional a esto, se propuso hacer uso de entidades relacionadas a la entidad principal, con lo que fue posible obtener información histórica, incluso cuando la entidad principal no había sido mencionada previamente.
Posteriormente, se compararon diferentes técnicas para la detección de anomalías, lo cual permitió identificar la más adecuada. Durante este mismo proceso, se propuso una modificación a los datos de entrenamiento que permitió mejorar la calidad del algoritmo.
Finalmente se concluye que el uso de técnicas de detección de anomalías en los sentimientos históricos expresados por el usuario, permite una mejor detección del sarcasmo, que otros métodos que excluyan esta información o que usen aproximaciones más sencillas para trabajar con la información histórica. Otra conclusión importante fue que las metodologías basadas en analizar las características del texto, identifican casos diferentes a los casos identificados por medio de la polaridad histórica, por lo que ambos son enfoques complementarios, permitiendo abordar el problema de una manera más completa.
Abstract
The main objective of this work is to propose an innovative method for sarcasm detection, based on the historical polarity of the user and using anomaly detection techniques. The research used information from twitter and a main entity was chosen for the case study, to delimitate which cases of sarcasm were analyzed. Also, other entities related to the main entity were used in an innovative way, which allowed to obtain historical information. even when the main entity had not been previously mentioned.
Subsequently, different techniques for anomalies detection were compared, which allowed to identify the most appropriate one. During this same process. a modification was proposed to the training data that allowed improving the quality of the algorithm.
Finally, it is concluded that the use of anomalies detection techniques in the historical feelings expressed by the user, allows for a better detection of sarcasm than other methods that exclude this information or that use simpler approaches to work with this historical information. Another important conclusion was that methodologies based on analyzing the characteristics of the text and methodologies based on the historical polarity, detect different cases of sarcasm, so both are complementary approaches and allows to address the problem in a more complete way.
Themes
Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicasIronía
Programación neurolingüística
Google Analytics Statistics