Clasificación, extracción y generación de recursos lingüísticos en el dominio bancario en redes sociales digitales
Datum
2021-12-03Herausgeber
Pontificia Universidad Javeriana
Fakultät
Facultad de Ingeniería
Facultad de Ciencias Económicas y Administrativas
Programm
Maestría en Analítica para la Inteligencia de Negocios
Erhaltener Titel
Magíster en Analítica para la Inteligencia de Negocios
Typ
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaTeile diesen Datensatz
Citación
Metadata
Zur Langanzeige
PDF-Dokumente
Englischer Titel
Extraction and generation of linguistic resources in the banking domain in digital social networksZusammenfassung
De acuerdo con el informe trimestral "Digital 2021 october global statshot report", el volumen de usuarios activos en internet en Colombia es del 68% de la población y el 76.4% son usuarios activos en redes sociales, bajo este contexto, las redes sociales han pasado de medio de información a medio de comunicación masivo, sin embargo, el crecimiento exponencial de la presencia tanto de usuarios como de las marcas en redes sociales, ha llevado a la necesidad del uso de la tecnología y los avances en la ciencia computacional, para extraer, recopilar y clasificar altos volúmenes de información relativa a la comunicación entre usuarios y marcas en el contexto digital.La revisión literaria ha mostrado importantes avances en investigaciones relacionadas con el análisis de datos semiestructurados y no estructurados, particularmente provenientes de redes sociales digitales, sin embargo, en Colombia no se encontraron investigaciones relacionadas, por lo tanto, se propone la implementación de esta prueba de concepto, que permitió clasificar los temas de conversación más frecuentes en el dominio bancario en la red social Twitter.La investigación se desarrolló bajo el marco ontológico, ya que a través de este podemos determinar las relaciones semánticas entre los conceptos del dominio financiero. El método de investigación utilizado es CRISP-DM.
Abstrakt
According to the quarterly report "Digital 2021 october global statshot report", the volume of active users on the internet in Colombia is 68% of the population and 76.4% are active users on social networks, in this context, social networks have gone from from being an information medium to a mass communication medium [2], however, the exponential growth of the presence of both users and brands in social networks has led to the need to use of technology and advances in computer science, to extract, collect and classify high volumes of information related to communication between users and brands in the digital context.The literary review has shown important advances in research related to the analysis of semi-structured and unstructured data, particularly from digital social networks, however, in Colombia there is no related research, therefore, the implementation of this proof of concept, which made it possible to classify the most frequent conversation topics in the banking domain on the social network Twitter.The research was developed under the ontological framework, since through this we can determine the semantic relationships between the concepts of the financial domain.
Schlüsselwörter
Redes sociales digitalesProcesamiento del lenguaje natural
Clasificación de temas
Aprendizaje de máquina
Ontología
Keywords
Digital social networksNatural language processing
Topic Classification
Machine learning
Ontology
Themen
Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicasAprendizaje de máquinas
Lenguaje natural (Informática)
Ontología
Redes sociales en línea
Google Analytics Statistics