Optimización de estrategias de búsquedas científicas médicas utilizando técnicas de inteligencia artificial

Date
2021-12-10Authors
Nieto González, Daniel MauricioDirectors
Bustacara Medina, Cesar JulioPublisher
Pontificia Universidad Javeriana
Faculty
Facultad de Ingeniería
Program
Maestría en Ingeniería de Sistemas y Computación
Obtained title
Magíster en Ingeniería de Sistemas y Computación
Type
Tesis/Trabajo de grado - Monografía - Maestría
COAR
Tesis de maestríaShare this record
Citación
Metadata
Show full item record
PDF documents
English Title
Scientific search strategies optimization using artificial intelligence techniquesResumen
Este
proyecto diseñó e implementó un prototipo de software funcional, capaz de
optimizar el proceso y los resultados de las estrategias de búsqueda y la
selección de artículos, al elaborar una revisión sistemática médica. La
aplicación utilizó inteligencia artificial para apoyar la toma de decisiones en
las fases más críticas del proceso. Se logró sugerir qué artículos incluir o
excluir, utilizando un modelo Naive Bayes que logró clasificar con un 79,66% de
precisión, y un AUC de 91,13% los manuscritos con base en clasificaciones previa
realizadas por el usuario. Se utilizó para la extracción de información un
algoritmo TF-IDF regularizado con L2, y procesamiento de lenguaje natural
incluyendo stemming. Se logró también sugerir qué palabras clave incluir o
excluir con el algoritmo TD-IDF. Al comparar los resultados con las métricas de
otras herramientas, los AUC y precisiones fueron buenos. Queda pendiente
explorar más a fondo WSS@95. Para el diseño arquitectónico se identificaron los
RNF y RF, también se utilizaron las metodologías ADD y ATAM, elaborando vistas
4+1, lo cual permitió diseñar e implementar una arquitectura cliente-servidor
con un servidor en capas, en donde el módulo de inteligencia artificial se
desplegó como servidor backend en una de las 4 aplicaciones construidas. Se
incluyeron las mejores prácticas de seguridad tales como encriptación,
whitelisting y uso de tokens JWT. La arquitectura construida utilizó servicios
de la infraestructura de la nube de AWS, tales como DynamoDB, S3 Buckets y RDS
Postrgres, que junto con el diseño RESTful de las aplicaciones permiten una
alta escalabilidad.
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;
mso-font-charset:0;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:-536870145 1107305727 0 0 415 0;}p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-unhide:no;
mso-style-qformat:yes;
mso-style-parent:"";
margin:0cm;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman",serif;
mso-fareast-font-family:"Times New Roman";}.MsoChpDefault
{mso-style-type:export-only;
mso-default-props:yes;
font-size:11.0pt;
mso-ansi-font-size:11.0pt;
mso-bidi-font-size:11.0pt;
mso-fareast-language:ES-CO;}.MsoPapDefault
{mso-style-type:export-only;
mso-pagination:none;}div.WordSection1
{page:WordSection1;}
Abstract
This project designed and
implemented a functional software prototype, capable of optimizing the process
and results of search strategies and the selection of articles when preparing a
medical systematic review. The application used artificial intelligence for decision-making
support in the most critical phases of the process. It was possible to suggest
which articles to include or exclude, using a Naive Bayes model that managed to
classify the manuscripts with 79.66% precision, and an AUC of 91.13% based on
previous classifications made by the user. A TF-IDF algorithm regularized with
L2, and natural language processing including stemming, was used for
information extraction. It was also possible to suggest which keywords to
include or exclude with the TD-IDF algorithm. When comparing the results with
the metrics of other tools, the AUC and accuracies were good. For the
architectural design, the RNF and RF were identified, the ADD and ATAM
methodologies were also used, developing 4 + 1 views, which allowed the design
and implementation of a client-server architecture with a layered server, where
the artificial intelligence module it was deployed as a backend server in one
of the 4 applications built. The best security practices such as encryption,
whitelisting and use of JWT tokens were included. The architecture built used
services of the AWS Cloud infrastructure such as DynamoDB, S3 Buckets and RDS
Postgres which altogether to the RESTful design of the applications permitted a
high scalability.
@font-face
{font-family:"Cambria Math";
panose-1:2 4 5 3 5 4 6 3 2 4;
mso-font-charset:0;
mso-generic-font-family:roman;
mso-font-pitch:variable;
mso-font-signature:-536870145 1107305727 0 0 415 0;}p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-unhide:no;
mso-style-qformat:yes;
mso-style-parent:"";
margin:0cm;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman",serif;
mso-fareast-font-family:"Times New Roman";}.MsoChpDefault
{mso-style-type:export-only;
mso-default-props:yes;
font-size:11.0pt;
mso-ansi-font-size:11.0pt;
mso-bidi-font-size:11.0pt;
mso-fareast-language:ES-CO;}.MsoPapDefault
{mso-style-type:export-only;
mso-pagination:none;}div.WordSection1
{page:WordSection1;}
Keywords
Inteligencia ArtificialArquitectura de software
Revisiones Sistemáticas
Extracción de características
Procesamiento de Lenguaje Natural
Keywords
Artificial IntelligenceSoftware Architecture
Systematic Reviews
Information Retrieval
Natural Language Processing
Themes
Maestría en ingeniería de sistemas - Tesis y disertaciones académicasInteligencia artificial
Arquitectura de software
Lenguaje natural (Informática)
Google Analytics Statistics