Prueba de concepto para la extracción de recursos bibliográficos desde los catálogos de asignaturas de la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana
dc.contributor.advisor | Nova Arévalo, Néstor Armando | spa |
dc.contributor.author | Daza Moreno, Andres Felipe | spa |
dc.contributor.author | Lopez Usa, Cristian Leandro | spa |
dc.contributor.evaluator | Pájaro Hernández, Juan Pablo | spa |
dc.contributor.evaluator | García Diaz, Cesar Enrique | spa |
dc.date.accessioned | 2024-05-17T12:55:55Z | |
dc.date.available | 2024-05-17T12:55:55Z | |
dc.date.created | 2023-11-15 | spa |
dc.description.abstract | La bibliotecología se enfrenta constantemente a la tarea dispendiosa de clasificar y organizar manualmente las referencias bibliográficas de tal manera que puedan realizar análisis cualitativos y cuantitativos ya sea para determinar la vigencia de las fuentes, la cantidad de libros o la disponibilidad de algún recurso. Los avances computacionales y el desarrollo de diferentes modelos de Procesamiento de Lenguaje Natural (NLP) permiten la automatización de estas tareas de manera ágil y eficiente. En este trabajo se realiza una revisión de modelos de Reconocimiento de Entidades Nombradas (NER) a través de la metodología CRISP-DM, que permitan identificar los metadatos de referencias bibliográficas académicas con el objetivo de brindar una herramienta que automatice procesos manuales en la Biblioteca Alfonso Borrero Cabal S.J y en la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana. La evaluación de los modelos muestra resultados alentadores con el modelo Bidirectional Encoder Representations from Transformers (BERT) en la extracción de metadatos en recursos bibliográficos, con lo cual se recomienda su implementación. | spa |
dc.description.abstractenglish | Librarianship is constantly faced with the hard task of manually classifying and organizing bibliographic references in such a way that qualitative and quantitative analyzes can be carried out, either to determine the age of the sources, the number of books or the availability of some resource. Computational advances and the development of different Natural Language Processing (NLP) models allow the automation of these tasks in an agile and efficient way. In this work, a review of Named Entity Recognition (NER) models is carried out through the CRISP-DM methodology, which allows identifying the metadata of academic bibliographic references with the objective of providing a tool that automates manual processes in the Biblioteca Alfonso Borrero Cabal S.J and at the Faculty of Communication and Language of the Pontificia Universidad Javeriana. The evaluation of the models shows encouraging results with the Bidirectional Encoder Representations from Transformers (BERT) model in the extraction of metadata in bibliographic resources, which is why its implementation is recommended. | spa |
dc.description.degreelevel | Maestría | |
dc.description.degreename | Magíster en Analítica para la Inteligencia de Negocios | |
dc.format | ||
dc.format.mimetype | application/pdf | |
dc.identifier.instname | instname:Pontificia Universidad Javeriana | |
dc.identifier.reponame | reponame:Repositorio Institucional - Pontificia Universidad Javeriana | |
dc.identifier.repourl | repourl:https://repository.javeriana.edu.co | |
dc.identifier.uri | http://hdl.handle.net/10554/67393 | |
dc.language.iso | spa | |
dc.publisher | Pontificia Universidad Javeriana | |
dc.publisher.faculty | Facultad de Ingeniería | |
dc.publisher.program | Maestría en Analítica para la Inteligencia de Negocios | |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | info:eu-repo/semantics/openAccess | |
dc.rights.licence | Atribución-NoComercial-SinDerivadas 4.0 Internacional | |
dc.rights.local | De acuerdo con la naturaleza del uso concedido, la presente licencia parcial se otorga a título gratuito por el máximo tiempo legal colombiano, con el propósito de que en dicho lapso mi (nuestra) obra sea explotada en las condiciones aquí estipuladas y para los fines indicados, respetando siempre la titularidad de los derechos patrimoniales y morales correspondientes, de acuerdo con los usos honrados, de manera proporcional y justificada a la finalidad perseguida, sin ánimo de lucro ni de comercialización. De manera complementaria, garantizo (garantizamos) en mi (nuestra) calidad de estudiante (s) y por ende autor (es) exclusivo (s), que la Tesis o Trabajo de Grado en cuestión, es producto de mi (nuestra) plena autoría, de mi (nuestro) esfuerzo personal intelectual, como consecuencia de mi (nuestra) creación original particular y, por tanto, soy (somos) el (los) único (s) titular (es) de la misma. Además, aseguro (aseguramos) que no contiene citas, ni transcripciones de otras obras protegidas, por fuera de los límites autorizados por la ley, según los usos honrados, y en proporción a los fines previstos; ni tampoco contempla declaraciones difamatorias contra terceros; respetando el derecho a la imagen, intimidad, buen nombre y demás derechos constitucionales. Adicionalmente, manifiesto (manifestamos) que no se incluyeron expresiones contrarias al orden público ni a las buenas costumbres. En consecuencia, la responsabilidad directa en la elaboración, presentación, investigación y, en general, contenidos de la Tesis o Trabajo de Grado es de mí (nuestro) competencia exclusiva, eximiendo de toda responsabilidad a la Pontifica Universidad Javeriana por tales aspectos. Sin perjuicio de los usos y atribuciones otorgadas en virtud de este documento, continuaré (continuaremos) conservando los correspondientes derechos patrimoniales sin modificación o restricción alguna, puesto que, de acuerdo con la legislación colombiana aplicable, el presente es un acuerdo jurídico que en ningún caso conlleva la enajenación de los derechos patrimoniales derivados del régimen del Derecho de Autor. De conformidad con lo establecido en el artículo 30 de la Ley 23 de 1982 y el artículo 11 de la Decisión Andina 351 de 1993, "Los derechos morales sobre el trabajo son propiedad de los autores", los cuales son irrenunciables, imprescriptibles, inembargables e inalienables. En consecuencia, la Pontificia Universidad Javeriana está en la obligación de RESPETARLOS Y HACERLOS RESPETAR, para lo cual tomará las medidas correspondientes para garantizar su observancia. | |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.subject | Bibliotecologia | |
dc.subject | Metadatos | |
dc.subject | Recursos Bibliograficos | |
dc.subject | Reconocimiento de Entidades Nombradas | |
dc.subject | Bidirectional Encoder Representations from Transformers | |
dc.subject | Procesamiento de Lenguaje Natural | |
dc.subject.armarc | Maestría en analítica para la inteligencia de negocios - Tesis y disertaciones académicas | |
dc.subject.armarc | Citas bibliográficas | spa |
dc.subject.armarc | Aprendizaje automático (Inteligencia artificial) | spa |
dc.subject.armarc | Clasificación | spa |
dc.subject.keyword | Librarianship | |
dc.subject.keyword | Metadata | |
dc.subject.keyword | Bibliographic Resources | |
dc.subject.keyword | Named Entity Recognition | |
dc.subject.keyword | Bidirectional Encoder Representations from Transformers | |
dc.subject.keyword | Natural Language Processing | |
dc.title | Prueba de concepto para la extracción de recursos bibliográficos desde los catálogos de asignaturas de la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana | spa |
dc.title.english | Proof of concept for the extraction of bibliographic resources from course catalogs of the Faculty of Communication and Language, Pontificia Universidad Javeriana | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
dc.type.driver | info:eu-repo/semantics/masterThesis | |
dc.type.hasversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
dc.type.local | Tesis/Trabajo de grado - Monografía - Maestría |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- attachment_1_Proyecto-Syllabus.pdf
- Tamaño:
- 893.78 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
- Documento