Modelos de atención aplicados a clasificación de textos narrativos
Ver / Descargar
Fecha
2021Autor(es)
Moreno Rodriguez, Angela SofiaYate Vega, Karol Valentina
Mendez Hernandez, Gustavo Andres
Kevin Stid, Pelaez Nimisica
Director(es)
Gonzalez Rivera, Rafael AndresEvaluador(es)
González Rivera, Rafael AndrésPuertas Del Castillo, Edwin Alexander
Moreno Barbosa, Andrés Dario
Publicador
Pontificia Universidad Javeriana
Facultad
Facultad de Ingeniería
Programa
Ingeniería de Sistemas
Título obtenido
Ingeniero (a) de Sistemas
Tipo
Tesis/Trabajo de grado - Monografía - Pregrado
Compartir este registro
Citación
Documentos PDF
Título en inglés
Attention models applied to the classification of narrative textsResumen
Con este proyecto se busca solucionar problemas de negocio asociados al análisis de textos en el contexto de la industria audiovisual. Para ello se utilizaron técnicas del estado del arte en NLP (Natural Language Processing) como las arquitecturas transformers, con el fin de clasificar textos según sus temas y según sus arcos narrativos Vonnegut. Adicionalmente, se propuso un modelo de lenguaje general basado en una combinación de las técnicas propuestas por la arquitectura ALBERT y las tareas de entrenamiento propuestas por ELECTRA. Los resultados de aplicación de estos modelos demuestran alta precisión en análisis de sentimiento y clasificación por géneros, aunque la cantidad y naturaleza de los datos para entrenamiento no permiten predicciones adecuadas de arcos narrativos.
Abstract
This project sought to solve business problems associated with text analysis. For this state of the art techniques in NLP(Natural Language Processing) were used, such as transformer architectures in order to classify texts in accordance to their themes and their Vonnegut arcs. Adicionaly in this project we proposed a general language model architecture based on a combination of the techniques proposed by the ALBERT architecture and the training tasks proposed by ELECTRA. The results of the application of these models showed the high precision in the sentiment analysis and the theme classification, although the quantity and the nature of the data used in the pre-training do not allow adequate predictions for the narrative arcs.
Palabras clave
Inteligencia artificialModelos de atención
Modelos pre entrenados
Arquitectura de transformadores
Clasificación de textos por género
Clasificación de textos por arcos de Vonnegut
Clasificación de textos por sentimiento
Clasificación de textos por categorías BISAC
Redes neuronales
Aprendizaje profundo
Toknizadores
Bert
Albert
Electra
Alectra
Textos narrativos
Portugués
Procesamiento del lenguaje natural
Aprendizaje de máquina
Keywords
Artificial intelligenceAttention models
Pre trained models
Transformer architecture
Classification of texts by genre
Classification of texts by Vonnegut arcs
Classification of texts by sentiment
Classification of texts by BISAC categories
Neural networks
Deep learning
Tokenizers
Bert
Albert
Electra
Alectra
Narrative texts
Portuguese
Natural language processing
Machine learning
Temas
Ingeniería de sistemas - Tesis y disertaciones académicasInteligencia artificial
Análisis de datos
Aprendizaje de máquinas
Redes neuronales (Computadores)
Estadísticas Google Analytics
Colecciones
- Ingeniería de Sistemas [273]
Excepto si se señala otra cosa, la licencia del registro se describe como Atribución-NoComercial-SinDerivadas 4.0 Internacional
Registros relacionados
Mostrando registros relacionados por Título, autor o materia.
-
Generación de índices de relevancia para bases de datos relacionales con contenido de texto narrativo
Acosta Gaona, Andrés Felipe (Pontificia Universidad Javeriana, Facultad de Ingeniería, Ingeniería de Sistemas, 2012) -
Frecuencia de malformaciones congénitas: evaluación y pronóstico de 52.744 nacimientos en tres ciudades colombianas
Zarante, Ignacio; Franco, Liliana; Lopez, Catalina; Fernández, Nicolás (2009-08-26)Introducción. El Instituto de Genética Humana, de la Pontificia Universidad Javeriana, desarrolla un programa de vigilancia de malformaciones congénitas con metodologías modificadas del Estudio Colaborativo Latinoamericano ...