Clasificación, extracción y generación de recursos lingüísticos en el dominio bancario en redes sociales digitales
Date
2021-12-03Publisher
Pontificia Universidad Javeriana
Faculty
Facultad de Ingeniería
Facultad de Ciencias Económicas y Administrativas
Program
Maestría en Analítica para la Inteligencia de Negocios
Obtained title
Magíster en Analítica para la Inteligencia de Negocios
Type
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaShare this record
Citación
Metadata
Show full item record
PDF documents
English Title
Extraction and generation of linguistic resources in the banking domain in digital social networksResumen
De acuerdo con el informe trimestral "Digital 2021 october global statshot report", el volumen de usuarios activos en internet en Colombia es del 68% de la población y el 76.4% son usuarios activos en redes sociales, bajo este contexto, las redes sociales han pasado de medio de información a medio de comunicación masivo, sin embargo, el crecimiento exponencial de la presencia tanto de usuarios como de las marcas en redes sociales, ha llevado a la necesidad del uso de la tecnología y los avances en la ciencia computacional, para extraer, recopilar y clasificar altos volúmenes de información relativa a la comunicación entre usuarios y marcas en el contexto digital.La revisión literaria ha mostrado importantes avances en investigaciones relacionadas con el análisis de datos semiestructurados y no estructurados, particularmente provenientes de redes sociales digitales, sin embargo, en Colombia no se encontraron investigaciones relacionadas, por lo tanto, se propone la implementación de esta prueba de concepto, que permitió clasificar los temas de conversación más frecuentes en el dominio bancario en la red social Twitter.La investigación se desarrolló bajo el marco ontológico, ya que a través de este podemos determinar las relaciones semánticas entre los conceptos del dominio financiero. El método de investigación utilizado es CRISP-DM.
Abstract
According to the quarterly report "Digital 2021 october global statshot report", the volume of active users on the internet in Colombia is 68% of the population and 76.4% are active users on social networks, in this context, social networks have gone from from being an information medium to a mass communication medium [2], however, the exponential growth of the presence of both users and brands in social networks has led to the need to use of technology and advances in computer science, to extract, collect and classify high volumes of information related to communication between users and brands in the digital context.The literary review has shown important advances in research related to the analysis of semi-structured and unstructured data, particularly from digital social networks, however, in Colombia there is no related research, therefore, the implementation of this proof of concept, which made it possible to classify the most frequent conversation topics in the banking domain on the social network Twitter.The research was developed under the ontological framework, since through this we can determine the semantic relationships between the concepts of the financial domain.
Keywords
Redes sociales digitalesProcesamiento del lenguaje natural
Clasificación de temas
Aprendizaje de máquina
Ontología
Keywords
Digital social networksNatural language processing
Topic Classification
Machine learning
Ontology
Themes
Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicasAprendizaje de máquinas
Lenguaje natural (Informática)
Ontología
Redes sociales en línea
Google Analytics Statistics