Logotipo del repositorio
 

Prueba de concepto para la extracción de recursos bibliográficos desde los catálogos de asignaturas de la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana

dc.contributor.advisorNova Arévalo, Néstor Armandospa
dc.contributor.authorDaza Moreno, Andres Felipespa
dc.contributor.authorLopez Usa, Cristian Leandrospa
dc.contributor.evaluatorPájaro Hernández, Juan Pablospa
dc.contributor.evaluatorGarcía Diaz, Cesar Enriquespa
dc.date.accessioned2024-05-17T12:55:55Z
dc.date.available2024-05-17T12:55:55Z
dc.date.created2023-11-15spa
dc.description.abstractLa bibliotecología se enfrenta constantemente a la tarea dispendiosa de clasificar y organizar manualmente las referencias bibliográficas de tal manera que puedan realizar análisis cualitativos y cuantitativos ya sea para determinar la vigencia de las fuentes, la cantidad de libros o la disponibilidad de algún recurso. Los avances computacionales y el desarrollo de diferentes modelos de Procesamiento de Lenguaje Natural (NLP) permiten la automatización de estas tareas de manera ágil y eficiente. En este trabajo se realiza una revisión de modelos de Reconocimiento de Entidades Nombradas (NER) a través de la metodología CRISP-DM, que permitan identificar los metadatos de referencias bibliográficas académicas con el objetivo de brindar una herramienta que automatice procesos manuales en la Biblioteca Alfonso Borrero Cabal S.J y en la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana. La evaluación de los modelos muestra resultados alentadores con el modelo Bidirectional Encoder Representations from Transformers (BERT) en la extracción de metadatos en recursos bibliográficos, con lo cual se recomienda su implementación.spa
dc.description.abstractenglishLibrarianship is constantly faced with the hard task of manually classifying and organizing bibliographic references in such a way that qualitative and quantitative analyzes can be carried out, either to determine the age of the sources, the number of books or the availability of some resource. Computational advances and the development of different Natural Language Processing (NLP) models allow the automation of these tasks in an agile and efficient way. In this work, a review of Named Entity Recognition (NER) models is carried out through the CRISP-DM methodology, which allows identifying the metadata of academic bibliographic references with the objective of providing a tool that automates manual processes in the Biblioteca Alfonso Borrero Cabal S.J and at the Faculty of Communication and Language of the Pontificia Universidad Javeriana. The evaluation of the models shows encouraging results with the Bidirectional Encoder Representations from Transformers (BERT) model in the extraction of metadata in bibliographic resources, which is why its implementation is recommended.spa
dc.description.degreelevelMaestría
dc.description.degreenameMagíster en Analítica para la Inteligencia de Negocios
dc.formatPDF
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Pontificia Universidad Javeriana
dc.identifier.reponamereponame:Repositorio Institucional - Pontificia Universidad Javeriana
dc.identifier.repourlrepourl:https://repository.javeriana.edu.co
dc.identifier.urihttp://hdl.handle.net/10554/67393
dc.language.isospa
dc.publisherPontificia Universidad Javeriana
dc.publisher.facultyFacultad de Ingeniería
dc.publisher.programMaestría en Analítica para la Inteligencia de Negocios
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarinfo:eu-repo/semantics/openAccess
dc.rights.licenceAtribución-NoComercial-SinDerivadas 4.0 Internacional
dc.rights.localDe acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, "Los derechos morales sobre el trabajo son propiedad de los autores", los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia.
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectBibliotecologia
dc.subjectMetadatos
dc.subjectRecursos Bibliograficos
dc.subjectReconocimiento de Entidades Nombradas
dc.subjectBidirectional Encoder Representations from Transformers
dc.subjectProcesamiento de Lenguaje Natural
dc.subject.armarcMaestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicas
dc.subject.armarcCitas bibliográficasspa
dc.subject.armarcAprendizaje automático (Inteligencia artificial)spa
dc.subject.armarcClasificaciónspa
dc.subject.keywordLibrarianship
dc.subject.keywordMetadata
dc.subject.keywordBibliographic Resources
dc.subject.keywordNamed Entity Recognition
dc.subject.keywordBidirectional Encoder Representations from Transformers
dc.subject.keywordNatural Language Processing
dc.titlePrueba de concepto para la extracción de recursos bibliográficos desde los catálogos de asignaturas de la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javerianaspa
dc.title.englishProof of concept for the extraction of bibliographic resources from course catalogs of the Faculty of Communication and Language, Pontificia Universidad Javerianaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.hasversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.localTesis/Trabajo de grado - Monografía - Maestría

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
attachment_1_Proyecto-Syllabus.pdf
Tamaño:
893.78 KB
Formato:
Adobe Portable Document Format
Descripción:
Documento