Maestría en Analítica para la Inteligencia de Negocios
URI permanente para esta colección
Examinar
Envíos recientes
Mostrando 1 - 40 de 44
Ítem Validación del modelo Retain para el análisis de registros médicos electrónicos en el cuidado de la salud(Pontificia Universidad Javeriana) Cardona Ramírez, Ernesto; Aya Perlaza, Juan Manuel; Herrera Fuentes, Laura Nathalia; Pajaro Hernandez, Juan Pablo; Garcia Diaz, Cesar Enrique; Pajaro Hernandez, Juan PabloEn las últimas décadas, el campo de la medicina ha presenciado un crecimiento tremendo en la colección y disponibilidad de registros electrónicos de salud (EHR, por sus siglas en inglés). Estos repositorios digitales integrales de información del paciente ofrecen valiosas perspectivas sobre la historia médica, diagnósticos, tratamientos y resultados. Sin embargo, utilizar de manera efectiva esta gran cantidad de datos para mejorar la atención al paciente y optimizar la toma de decisiones clínicas plantea importantes desafíos. Para abordar las complejidades del análisis de datos de EHR, las técnicas de aprendizaje automático han surgido como herramientas poderosas. Entre los enfoques diversos, las redes neuronales recurrentes (RNN, por sus siglas en inglés) han ganado prominencia debido a su capacidad para capturar dependencias secuenciales y manejar datos temporales de manera efectiva. Un modelo en particular basado en RNN que ha generado atención en los últimos años es el modelo Retain (REverse Time AttentIoN). Retain introduce un mecanismo de atención a las RNN, permitiendo al modelo enfocarse en las distintas visitas y características relevantes dentro de los EHR. En este artículo, nuestro objetivo es implementar un modelo para el apoyo de toma de decisiones del personal médico en el diagnóstico de múltiples enfermedades teniendo en cuenta Retain. Para esto se considera tres factores cruciales: métricas de desempeño, interpretabilidad y escalabilidad. Al evaluar estos aspectos, pretendemos arrojar luz sobre las fortalezas y limitaciones de cada enfoque que usemos, lo que finalmente guiará a los investigadores y profesionales para seleccionar un modelo adecuado para sus tareas de análisis de EHRÍtem Prueba de concepto para la extracción de recursos bibliográficos desde los catálogos de asignaturas de la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana(Pontificia Universidad Javeriana) Daza Moreno, Andres Felipe; Lopez Usa, Cristian Leandro; Nova Arévalo, Néstor Armando; Pájaro Hernández, Juan Pablo; García Diaz, Cesar EnriqueLa bibliotecología se enfrenta constantemente a la tarea dispendiosa de clasificar y organizar manualmente las referencias bibliográficas de tal manera que puedan realizar análisis cualitativos y cuantitativos ya sea para determinar la vigencia de las fuentes, la cantidad de libros o la disponibilidad de algún recurso. Los avances computacionales y el desarrollo de diferentes modelos de Procesamiento de Lenguaje Natural (NLP) permiten la automatización de estas tareas de manera ágil y eficiente. En este trabajo se realiza una revisión de modelos de Reconocimiento de Entidades Nombradas (NER) a través de la metodología CRISP-DM, que permitan identificar los metadatos de referencias bibliográficas académicas con el objetivo de brindar una herramienta que automatice procesos manuales en la Biblioteca Alfonso Borrero Cabal S.J y en la Facultad de Comunicación y Lenguaje de la Pontificia Universidad Javeriana. La evaluación de los modelos muestra resultados alentadores con el modelo Bidirectional Encoder Representations from Transformers (BERT) en la extracción de metadatos en recursos bibliográficos, con lo cual se recomienda su implementación.Ítem Proyecto de NLP para la Identificación de Noticias Falsas Acerca de COVID-19(Pontificia Universidad Javeriana) Rincon Pineros, Brayan David; Arquez Abdala, Miguel; Restrepo Alvarez, Leonardo; Jimenez Prieto, Giovanni; Nova Arevalo, Nestor Armando; Pajaro Hernandez, Juan Pablo; García Diaz, Cesar EnriqueEl programa de Ciencia de la Información, Bibliotecología y Archivística (CIBAR) de la Pontificia Universidad Javeriana está actualizando sus líneas disciplinarias, incluyendo la clasificación de información. Ante el creciente volumen de datos, se busca desarrollar sistemas que faciliten la clasificación de manera semiautomática o automática, reduciendo costos y consumo de recursos. Un caso de uso es la clasificación automática de noticias falsas sobre COVID-19. El aumento de estas noticias y la dificultad para el público en general de discernir su veracidad, hacen necesaria la implementación de un sistema que clasifique y etiquete las noticias antes de su difusión. Este sistema empleará técnicas de procesamiento de lenguaje natural y aprendizaje automático para realizar la clasificación de manera autónoma. El proyecto incluye el desarrollo de una herramienta que evalúa la veracidad de las noticias mediante criterios analíticos, permitiendo a los usuarios identificar señales de noticias potencialmente falsas. Adicionalmente, se utilizará Web Scraping para extraer información complementaria que permita un análisis cualitativo y descriptivo. Este proyecto tiene un gran valor social, pues busca combatir la desinformación en torno al COVID-19, y pedagógico, acercando a la comunidad educativa de la Universidad a temas analíticos y de programación, y familiarizando a estudiantes y docentes con herramientas analíticas para adaptarse a las demandas del entorno laboral.Ítem Prueba de concepto para la re-identificación de vehículos de una estación de servicio en Colombia(Pontificia Universidad Javeriana) Olaya Cansino, Sergio Armando; Chicaiza Rojas, Luis Carlos; Rojas Salcedo, Lina Marcela; Pajaro Hernández, Juan Pablo; Mora López, Juan PabloEste trabajo tuvo como objetivo mejorar la implementación de un modelo de re-identificación de vehículos con las imágenes tomadas en una estación de servicio de combustible. Para ello se capturaron los caracteres de la matricula junto con las características físicas del vehículo, alcanzando una mayor precisión. Este documento parte con el entendimiento del negocio de la empresa Inversiones Gutiérrez García, los criterios de evaluación y el objetivo de la minería de datos, luego se realiza la exploración y preparación de los datos, la identificación de datos faltantes y su respectivo perfilamiento. Finalmente, se presentan los resultados de ejecución de los modelos Two Stream y Three Stream. Para el entrenamiento del modelo se usaron 20 mil imágenes tomadas en una Estación de Servicio y los mejores resultados se obtuvieron con el modelo Three Stream el cual alcanzó un Accuracy del 95.9% y Recall de 98.4%.Ítem Modelo para la predicción de interacciones recibidas en un centro de atención telefónico(Pontificia Universidad Javeriana) Benavides Suarez, Aura Maria; Alonso Ospina, Juan Pablo; Lopez Moreno, Daniel Felipe; Ortiz Leon, Juan Camilo; Rendon Gamboa, Jairo Andres; Bolivar Atuesta, Stevenson; Rendón Gamboa, Jairo Andrés; Bolivar Atuesta, StevensonMillenium BPO es una compañía colombiana de tecnología y servicios con más de 20 años de experiencia en el sector de Contact Center y BPO, que busca estar a la vanguardia en la automatización de procesos mediante inteligencia artificial, con lo cual facilita el desarrollo de diferentes organizaciones apoyando componentes importantes de la transformación digital, como lo es el contacto con el cliente. Generalmente, una de las problemáticas características de las empresas del sector BPO es la rotación de personal, esta hace referencia a la cantidad de trabajadores que abandonan la compañía, produciendo una serie de costos adicionales, como por ejemplo el entrenamiento, capacitación y formación de la planta activa, ya que, se asigna tiempo de los trabajadores para estas actividades dada la cantidad de horas que deben dedicarse a la enseñanza de los procesos. Los altos índices de rotación de personal son factores que determinan el alcance de los objetivos de las compañías de modo tal que las áreas de Operaciones y Gestión Humana realizan un trabajo continuo parea reclutar personal con periodos de tiempo cada vez más cortos, de tal forma que contar con un sobredimensionamiento no sólo refiere al costo de la mano de obra adicional sino todos los procesos implicados para tener el recurso disponible. El sobredimensionamiento en los agentes implica mayores costos y por ende menor utilidad y perdida en el costo de oportunidad de poder usar a estos agentes en otro canal, por ejemplo. Cuando el efecto es opuesto y se genera un subdimensión de recursos, el problema está asociado al incumplimiento con el contrato a los clientes por el servicio pactado, lo que terminaría afectando la relación comercial con el cliente.Por lo anterior, el objetivo planteado en el siguiente proyecto busca mejorar el indicador de rentabilidad basado en la relación de nómina sobre facturación (Nomina/Facturación) de la campaña, partiendo de un pronóstico semanal de llamadas que ingresarán, de forma que se pueda hacer una asignación de recursos de personal óptima y eficiente. Este análisis estará enfocado en los agentes de las campañas del sector financiero, los cuales tienen asignados el 10% de la operación de la firma.Ítem Modelo de clasificación de peticiones, quejas, reclamos y sugerencias en el sector financiero(Pontificia Universidad Javeriana) Garcia Amador, Luis Omar; Chacón González, Jaime Enrique; Molina Castro, Rubén Darío; Pájaro Hernandez, Juan Pablo; Mora López, Juan PabloLas redes sociales han sido uno de los acontecimientos de mayor importancia e impacto en la historia reciente, estas han evolucionado desde un intercambio electrónico directo de información, hasta convertirse en un lugar de reuniones virtuales, plataformas de negocios y herramientas de marketing esencial del siglo XXI. Esta tendencia ha incrementado el uso de las redes sociales como canal de comunicación de opiniones y comentarios de los clientes sobre productos y servicios de las empresas, por lo tanto, existe una oportunidad enorme en el aprovechamiento de esta cercanía con el usuario y entender sobre qué están hablando los usuarios. Es así como se propone el desarrollo de un modelo que permita clasificar los comentarios de los usuarios dependiendo del contenido lingüístico del mismo. El desarrollo del presente proyecto se realiza un enfoque en el análisis de comentarios de la red social Twitter en el sector financiero colombiano el cuál será abarcado partir de la metodología CRISP-DM.Ítem Prueba de concepto – psicolinguística – modelos de segmentación para identificar tendencias o patrones indicadores de depresión en redes sociales(Pontificia Universidad Javeriana) Mendoza Molina, Andrés Eduardo; Enciso Agudelo, Jorge Eduardo; Mora López, Juan Pablo; Pájaro Hernández, Juan Pablo; Moreno Sandoval, Luis GabrielUna buena salud mental es uno de los principales motivos por el cual las personas pueden interactuar con otras personas de una forma que se pueda crear una relación y como se toman las decisiones. Asimismo, en los últimos años esta ha sido uno de los principales motivos por los cuales las personas se enferman física y mentalmente, los factores que afectan a este estado mental son muchos como lo son la política, el medio ambiente, la religión, la educación, etc. Por lo que no se puede atribuir solo ha un factor en específico, este trabajo busca identificar factores clave que indiquen potenciales eventos de depresión de individuos haciendo un análisis de las publicaciones en sus redes sociales haciendo uso de técnicas de procesamiento de lengiaje natural, análisis de sentimiento, análisis de emociones y clustering.Ítem Detección cáncer de seno en estadios tempranos para mujeres menores de 50 años(Pontificia Universidad Javeriana) Moncada Castro, Laura Catalina; Murcia Falla, Laura Katherine; García Rincón, Kevin Eduardo; Pájaro Henández, Juan Pablo; Mora López, Juan Pablo; Pájaro Hernández, Juan Pablo; Mora López, Juan PabloA través de los años, se ha identificado un incremento en la detección tardía por sintomatología de cáncer de mama en mujeres menores de 50 años, las cuales no son cubiertas por la normatividad que regula este tema en Colombia. La EPS Salud total, entendiendo la problemática, se ha planteado el objetivo principal de aumentar la detección de casos en estadificación temprana del cáncer en este segmento poblacional, esto consiste en detectar más mujeres con la enfermedad, quienes con el tratamiento oportuno y adecuado obtendrán mejores resultados. En este sentido, este trabajo propone la construcción de un modelo que permita la clasificación de mujeres menores de 50 años, que presentan mayor predisposición de padecer cáncer de mama o de no presentarlo, de acuerdo con la información de su historia clínica. Esta información contiene variables de texto diligenciadas por los médicos tratantes, así como variables numéricas y categóricas obtenidas durante la consulta.Ítem Modelo de predicción de usuarios y asignación de flota del sistema de transporte masivo de Bogotá (Transmilenio S.A) para usuarios que se movilizan hacia el Portal El Dorado(Pontificia Universidad Javeriana) Ocampo Hernández, Manuela; Moreno Sánchez, Marco Antonio; Blandón Lombana, Lina Marcela; Pulido Moreno, Luis Manuel; Pulido Moreno, Luis Manuel; Arevalo Galindo, Emilio JoseDe acuerdo con el estudio “Commute patterns by SITP, Transmilenio & Funicular in Bogotá, Colombia” realizado por Moovit insights el tiempo promedio que las personas gastan en Bogotá viajando en transporte público en un día laborable, es de 64 minutos, este mismo estudio nos dice además que el 41% de las personas viajan en transporte público por más de 2 horas, esto crea una mala percepción en la ciudadanía ya que siente que el sistema de transporte de la ciudad no presta el servicio adecuado para las necesidades de sus usuarios, y aunque esta problemática se presenta en todas las zonas de la ciudad y para cualquier medio público de transporte, esta percepción se acrecienta para el sistema de Transmilenio en portales y troncales de alta densidad poblacional. Una de estas troncales de gran importancia y en la que se enfoca el presente trabajo es la troncal de la Calle 26, su portal es punto de alimentación y de llegada de usuarios de las localidades de Fontibón y Engativá, además en sus cercanías se encuentran: el hotel Aloft Bogotá Airport, hotel Movich Buró 26, hotel Habiltel, la sede principal de Carvajal S.A., los laboratorios GlaxoSmithKline, el almacén Hipercentro Corona Dorado, oficinas de visados para las embajadas de Australia y Estados Unidos, el centro empresarial Connecta y uno de los aeropuertos más grandes de Latinoamérica: El Aeropuerto el Dorado, convirtiendo al portal en un punto clave del sistema de Transmilenio. Con base en lo anterior, el objetivo del presente trabajo es disminuir los tiempos de permanencia dentro del sistema de Transmilenio de las rutas que operan hacia el portal el Dorado, buscando entender si factores externos como la lluvia afectan sus tiempos de operación. Como metodología se usaron series de tiempo para generar un pronóstico del número de usuarios que ingresan a cada estación que tiene conexión con el portal el Dorado y se evaluaron los indicadores RMSE, MAE, MASE para seleccionar el mejor pronóstico, con estos resultados a través de simulación de agentes contando con 3 agentes: buses, personas y estaciones, se crearon varios escenarios de cómo podría operar el sistema para disminuir los tiempos de permanencia y optimizar los costos de la flota logrando entregar recomendaciones para disminuir los tiempos de permanencia en Transmilenio en un 30%.Ítem Construcción de un modelo analítico para la estimación de las reservas de siniestros para la empresa Alfa Seguros(Pontificia Universidad Javeriana) Malaver Moreno, Julián Alexander; Vergara Núñez, Jesús FernandoEn convenio con la Pontificia Universidad Javeriana (PUJ), la compañía Alfa Seguros una de las aseguradoras más grandes del país en participación del mercado colombiano, y a través de sus Vicepresidencias de Seguridad Social (área interesada), de Estrategia y Analítica (área transversal) plantean la necesidad de construir una serie de modelos analíticos descriptivos y predictivos con el fin de entender el comportamiento de los siniestros cubiertos bajo la póliza de seguro previsional de Porvenir. Se ha observado que ha habido un crecimiento sustancial de los mismos en los últimos años, resultando en menores márgenes para la compañía dado el elevado costo que los siniestros y las reservas representan para la compañía. Como parte de las condiciones del convenio, dos estudiantes de la maestría en Analítica para Inteligencia de Negocios estarán al frente del desarrollo de este proyecto, quienes son autores del presente documento, atendiendo a las necesidades de negocio de la empresa cliente. Alfa Seguros quiere explorar alternativas con las cuales logre mantener los márgenes de rentabilidad en este portafolio de servicios.Ítem Reconocimiento de imágenes de alimentos compartidos en redes sociales Caoba-Nutresa(Pontificia Universidad Javeriana) Leal Verdugo, Libardo Andres; Losada Bello, Sergio Armando; Moreno Sandoval, Luis Gabriel; Pajaro Hernandez, Juan Pablo; Mora Lopez, Juan PabloLas redes sociales se comportan como comunidades virtuales donde las personas por medio de un usuario intercambian información y datos en diversas formas, por videos, textos, imágenes o una combinación de estos, creando redes de conexión entre los usuarios con pensamientos en común o diversos independientemente del tema de interés. En este comportamiento social convergen grandes volúmenes de datos por diferentes medios de interacción, páginas web, redes sociales o blogs de opinión. Todo este flujo de opiniones puede convertirse en información estratégica de cara a encontrar solución a un problema de negocio específico. La idea de este proyecto es desarrollar una solución estratégica de detección de los alimentos publicados en redes sociales por medio de fotografías e imágenes compartidas por los usuarios.Ítem Clasificación, extracción y generación de recursos lingüísticos en el dominio bancario en redes sociales digitales(Pontificia Universidad Javeriana) Martínez Sánchez, César Alexander; Díaz Prieto, Edinson Javier; Pajaro Hernandez, Juan Pablo; Mora Correa, Juan PabloDe acuerdo con el informe trimestral "Digital 2021 october global statshot report", el volumen de usuarios activos en internet en Colombia es del 68% de la población y el 76.4% son usuarios activos en redes sociales, bajo este contexto, las redes sociales han pasado de medio de información a medio de comunicación masivo, sin embargo, el crecimiento exponencial de la presencia tanto de usuarios como de las marcas en redes sociales, ha llevado a la necesidad del uso de la tecnología y los avances en la ciencia computacional, para extraer, recopilar y clasificar altos volúmenes de información relativa a la comunicación entre usuarios y marcas en el contexto digital.La revisión literaria ha mostrado importantes avances en investigaciones relacionadas con el análisis de datos semiestructurados y no estructurados, particularmente provenientes de redes sociales digitales, sin embargo, en Colombia no se encontraron investigaciones relacionadas, por lo tanto, se propone la implementación de esta prueba de concepto, que permitió clasificar los temas de conversación más frecuentes en el dominio bancario en la red social Twitter.La investigación se desarrolló bajo el marco ontológico, ya que a través de este podemos determinar las relaciones semánticas entre los conceptos del dominio financiero. El método de investigación utilizado es CRISP-DM.Ítem Probabilidad de que un protegido pueda desarrollar diabetes mellitus tipo II(Pontificia Universidad Javeriana) Rodríguez Garzón, José Andrés; Rojas Salcedo, Lina Marcela; Pajaro Hernandez, Juan Pablo; Mora Lopez, Juan Pablo; Pajaro Hernandez, Juan Pablo; Mora Lopez, Juan PabloLa diabetes mellitus, enfermedad crónica producida cuando el páncreas no genera suficiente insulina (Hormona encargada de regular la concentración de glucosa en la sangre) o cuando el organismo no es capaz de utilizar de manera eficiente la insulina que produce; ocasionando daños importantes en algunos órganos del cuerpo humano con especial énfasis en el sistema nervioso y/o vasos sanguíneos cuando no es controlada de manera adecuada.De acuerdo con datos publicados por la organización mundial de la salud, durante el año 2014 aproximadamente el 8.5% de las personas mayores de 8 años padecían de esta enfermedad y en 2019 causo alrededor de 1.5 millones de muertes en el mundo. (Organización Mundial de la Salud, 2021), mientras que, en Colombia de acuerdo con el ministerio de salud, 3 de cada 100 colombianos tienen diabetes. (Ministerio de Salud y Protección Social, 2020).Es por ello que en el desarrollo de este documento se buscara a través de la metodología Crisp-dm, la experimentación y utilización de técnicas de machine learning que permitan realizar el entrenamiento de algoritmos e identificación de la probabilidad de que una persona pueda padecer de diabetes mellitus tipo 2, con el objetivo de que esta información pueda servir de apoyo al personal médico a la toma de decisiones que permitan profundizar o no en el diagnóstico de la enfermedad de acuerdo con sus resultados.Ítem Factores incidentes en la recurrencia de clientes con servicios de aseguramiento FTTH de Colvatel(Pontificia Universidad Javeriana) Acero Ramírez, Gustavo Ernesto; Peñaranda Albarracín, Laura Vanessa; Pulido Moreno, Luis Manuel; Rendón Gamboa, Jairo Andrés; Bolivar Atuesta, StevensonColvatel es una empresa que brinda soluciones de tecnologías de información y comunicación. Una de las líneas de negocio toma en cuenta el segmento de aseguramiento que, abarca la atención de fallas en el servicio FTTH (Fiber to the home – Fibra hasta la casa). Si se reporta una falla y no es resuelta vía telefónica, se procede a realizar una visita de agendamiento para resolverlo. Estas citas se suben al servidor de ETB y el área encargada las distribuye entre 5 proveedores, entre los que se encuentra Colvatel. El eje del proyecto se centra en la mejora de la experiencia de los clientes de ETB y Colvatel, que se ve reflejada en el indicador de recurrencia, por medio de modelos de agrupación y clasificación. Los resultados mostraron que los mejores desempeños en el diagnóstico se obtuvieron con un modelo de red SOM y una regresión logística, que permite inferir los factores principales que inciden en la recurrencia en el servicio FTTH. Los modelos implementados en un escenario alternativo mostraron resultados importantes en la reducción de la recurrencia en la muestra seleccionada. Hacia adelante, una posible mejora a las metodologías implementadas en el presente trabajo correspondería a tener un mayor horizonte de tiempo de los datos, con el fin de contar con una mayor claridad de los factores que pueden causar recurrencia a lo largo del tiempo y el impacto tanto en indicadores de experiencia del cliente como monetarios.Ítem Davivienda zonas de influencia(Pontificia Universidad Javeriana) Sarmiento Ruiz, Guillermo Andrés; Ronderos Alvarez, Cristina Eugenia; Bolivar Atuesta, Stevenson; Rendón Gamboa, Jairo AndrésA consecuencia de los avances tecnológicos cada vez más son lo servicios que las entidades bancarias dejaron de prestar desde las sucursales físicas para ser migrados a las plataformas digitales, con el fin de facilitar la experiencia de los clientes y disminuir los costos fijos que se deben asumir por tener una oficina en funcionamiento.Posterior a la pandemia, el Banco Davivienda ha estado realizando una importante cantidad de inversiones para fortalecer sus canales digitales a su vez que la cantidad de personas que han dejado de asistir presencialmente a las oficinas viene en constante aumento. Por lo anterior el principal objetivo que tiene el proyecto es poder identificar, a través de técnicas de analítica de datos, qué oficinas y/o cajeros son susceptibles a ser cerrados por su baja afluencia con el fin de poder disminuir los costos fijos de la compañía y de esta manera aumentar la rentabilidad del negocio manteniendo un adecuado nivel de servicio al cliente.El análisis se realizará a través de información existente acerca de las transacciones de retiros realizados en los últimos 2 meses por parte de los clientes del banco y su ubicación geográfica con lo cual se obtendrá la información de afluencia en las distintas zonas geográficas de la ciudad de Bogotá lo cual será el factor decisivo para la toma de decisiones por parte del banco.Ítem Identificación de variables relevantes en el desempeño de los estudiantes en la prueba Saber pro(Pontificia Universidad Javeriana) Diaz Reyes, Laura Liseht; Cujabante Villamil, Julian Francisco; Ruge Mena, Eduardo Andres; Mora Lopez, Juan Pablo; Pajaro Hernandez, Juan PabloGarantizar el cumplimiento de la labor que ejerce la Fundación Universitaria del Área Andina frente a la formación de sus estudiantes requiere la evaluación y monitoreo de las actividades que actualmente llevan a cabo dentro del ciclo académico, por lo que surge la necesidad de buscar alternativas que permitan evaluar el desempeño de sus alumnos, compararlo con el resto del sector y determinar factores de éxito en los que la institución pueda optimizar o diseñar nuevas acciones para promover la mejora continua de su rol formador. El presente estudio busca de manera especifica determinar los elementos que influyen en los resultados que obtienen los alumnos en las pruebas de estado Saber Pro y medir el impacto de la estrategia de capacitación implementada por la institución, y de esta forma brindar a la misma una alternativa para reconocer fortalezas y oportunidades de mejora en su proceso de formación.Ítem Vipo Group(Pontificia Universidad Javeriana) Jaramillo Bermúdez, Laura Catalina; Castellanos Villate, Diana Alejandra; Rendón Gamboa, Jairo Andres; Bolivar Atuesta, Stevenson; Bolivar Atuesta, StevensonMetodología de calibración para la compañía vipo Group con la utilización de técnicas analíticas generando un sistema de recomendación de tallas y visualización de indicadores mediante un tablero de control.Ítem Clasificación de árboles de problemas para la formulación de proyectos sociales(Pontificia Universidad Javeriana) Prada Quintero, Andrea; Diaz Pardo, Juan Pablo; Pajaro Hernandez, Juan Pablo; Mora Lopez, Juan Pablo; Mora López, Juan Pablo; Pajaro Hernandez, Juan PabloEl proyecto tiene como objetivo desarrollar una prueba de concepto para realizar la validación de árboles de problemas formulados bajo la Metodología del Marco Lógico a través de técnicas basadas en el Procesamiento de Lenguaje Natural. Esta tarea es relevante dentro del marco del diseño de políticas públicas, pues el proceso de validación es difícil y costoso, dados los elementos transdisciplinarios y sistémicos que involucran a profesionales de múltiples disciplinas, así como intereses particulares. Para lograr este objetivo, se utilizó un repositorio de árboles de problemas correspondiente a proyectos de inversión reales y aprobados por el Departamento Nacional de Planeación, los cuales estaban etiquetados como causa, problema, efecto u otro. A partir de este conjunto de datos, se realizó un proceso de minería de datos con el fin de realizar las siguientes tareas: clasificación de oraciones (causa, problema, efecto u otra), reconocimiento de entidades nombradas y similitud semántica (problema - causa/efecto). Como principal hallazgo la prueba de concepto arroja la pertinencia de modelos de lenguaje basados en transformadores en español (BETO) para las tareas de clasificación de oraciones y similitud semántica. Mientras que para el reconocimiento de entidades nombradas se recomienda el uso de un modelo sobre ajustado FLERT. Finalmente, se realizó un modelo de aceptación tecnológica junto a un panel de expertos, con el fin de corroborar la idoneidad de la solución analítica propuesta para la formulación de proyectos sociales.Ítem Modelo para la predicción de cancelación de tarjetas de crédito y retención de clientes de alto valor(Pontificia Universidad Javeriana) Hernandez Motta, Juan Sebastian; Bolivar Atuesta, Stevenson; Rendon Gamboa, Jairo Andres; Bolivar Atuesta, Stevenson; Rendon Gamboa, Jairo Andres; Bolivar Atuesta, Stevenson; Rendon Gamboa, Jairo AndresEl presente proyecto, realizado en el marco de trabajo del programa de la Maestría en analítica para la inteligencia de negocios, propone una base analítica para el diseño de la estrategia del Grupo Davivienda para aumentar la retención de clientes que consumen el producto tarjetas de crédito, enfocada a aquellos clientes considerados de alto valor, garantizando la asignación adecuada de recursos del banco.Este proyecto contempla la segmentación y perfilamiento de de clientes del banco, haciendo uso de k-means clustering y rfm segmentation. De igual forma incluye el uso de un modelo de predicción de cancelación de tarjetas de crédito basado en random Forest classification, entrenado sobre una base de datos proporcionada por el banco compuesta por datos demográficos, financieros y de consumo de clientes entre noviembre 2018 y diciembre 2020.La evaluación del modelo desarrollado identifica cinco perfiles de clientes, y propone un modelo de predicción de cancelaciones con AUC en validación de 0,75. Adicionalmente se identifican las variables mas relevantes, se sugieren los posibles motivos de cancelación y la estrategia de retención con mayor posibilidad de éxito.Ítem Un sistema de recomendación especializado en la industria de la moda(Pontificia Universidad Javeriana) Quintero Osorio, Sebastián; Ríos Cabra, Miguel Omar; Roa Patiño, Ernesto Stiven; Martínez Marín, Juan Sebastián; Pulido Moreno, Luis Manuel; Bolívar Atuesta, Stevenson; Rendón Gamboa, Jairo Andrés; Pulido Moreno, Luis ManuelEl presente trabajo de grado plantea un acercamiento a los diferentes sistemas de recomendación desde una mirada de la industria de la moda. Se pretende abordar los sistemas de recomendación de una manera personalizada, que busca ajustarse a las necesidades de los clientes, basados en sus perfiles. Se aborda un objetivo de negocio desde la perspectiva de VIPO Group, una compañía especializada en sistemas de recomendación para la industria de la moda, en donde a partir del mercado actual y de las necesidades de VIPO en su posición de la industria, se propone el problema de negocio que se relaciona directamente con la manera como la empresa debe garantizar una propuesta de valor diferencial en el mercado, que le genere a sus clientes un impacto positivo sobre las ventas. Finalmente, el objetivo de este proyecto es complementar uno de los servicios de VIPO, incluyendo variables asociadas al perfil de compra del cliente que permita aumentar el nivel de personalización de las recomendaciones.Ítem Identificación de Factores que mayormente inciden en la proliferación de cianobacterias en el embalse Porce II(Pontificia Universidad Javeriana) Rodríguez Sierra, Gustavo; Muñoz Sanabria, Mónica Patricia; Pájaro Hernández, Juan Pablo; Gotthard Real, Alexander; Pájaro Hernández, Juan Pablo; Gotthard Real, AlexanderA nivel mundial el florecimiento de cianobacterias es una problemática que amenaza de manera preocupante los diferentes ecosistemas acuáticos, en Colombia, más específicamente en el nordeste del departamento de Antioquia existen varios embalses en operación a cargo de la Empresa de Servicios Públicos de Medellín y en al menos el 60% de estos se han presentado proliferación de cianobacterias representando un riesgo potencial en la comunidad y el entorno.El desarrollo de este proyecto se centrará en la identificación de los factores que mayormente inciden en el florecimiento de cianobacterias en el agua de la represa Porce II de acuerdo a los niveles de Ficocianina, adicionalmente predecir los niveles de concentración de la Ficocianina en un periodo determinado para definir 3 clases de riesgo: bajo, medio y alto y de esta manera lograr intervenciones en la comunidad en periodos de alerta disminuyendo la exposición a riesgos biológicos al estar en contacto con el agua del embalse.Para abordar los anteriores retos se definición como variable objetivo la concentración de niveles de Ficociniana, las mediciones de esta variable se realizan al interior del embalse cada hora por equipos especializados en controlar las floraciones de cianobacterias en cuerpos de agua de fabricación holandesa, la medición es registrada en rango oscila ug/L (microgramos por litro) y su rango oscila entre 0 y 200 ug/L.Dando respuesta a las dos preguntas de negocio planteadas de emplearon los siguientes enfoques:Series de tiempo: al implementar series de tiempo predecimos la concentración de los niveles de Ficocianina en un horizonte inmediato, a partir de la predicción de los niveles de concentración se identifican 3 niveles de riesgo a los cuales se exponen los usuarios del embalse, sirviendo como sistema de alerta temprana asegurando la intervención en la comunidad.Clasificación y Regresión: al implementar técnicas de Machine Learning de regresión y clasificación se desarrollaron diferentes modelos en un diseño de experimentos, de los mejores modelos resultantes se extrajeron las variables que mayor impactan en la concentración de Ficocianina empleando técnicas de permutación de importancia y Shap Values.De esta manera se da respuesta a los interrogantes planteados por el cliente llevando a feliz término el proyecto, se dejan planteadas las bases para continuar desarrollando modelos más prolijos que permitan realizar predicciones en tiempo real en su fase de implementación, además de servir como soporte para la toma de decisiones en el sistema de alerta temprana diseñado por EPM.Ítem Análisis de causas por fallas en los sistemas de Transporte Galán - Chimita y Sebastopol – Yumbo que afectan el volumen de transporte(Pontificia Universidad Javeriana) Guarin Prada, Nicolas; De Antonio Rincon, Daniel; Zuluaga Rodriguez, Sebastian; Pulido Moreno, Luis Manuel; Arevalo Galindo, Emanuel JoséA traves de diferentes modelos analíticos como Regresión lineal y Random Forests, se realizó un estudio que pretendía explicar las causas principales por las cuales se ve afectado el transporte de diferentes productos (hidrocarburos) a traves de los sistemas especificos de estudio que son: Galan-Chimita y Sebastopol-Yumbo. El proyecto se desarrollo para la empresa Cenit Transporte y Logística de Hidrocarburos S.A.S, la cual es la filial de transporte de Ecopetrol.Para el trabajo se planteó como objetivo de negocio identificar las principales causas que afectan el bombeo de las líneas Galán-Bucaramanga, Sebastopol-Medellín, Medellín-Cartago y Cartago-Yumbo, como insumo en Cenit, para la definición de limites técnicos y de estrategias de soporte en la operación y el mantenimiento, buscando soportar las decisiones para incrementar la capacidad de transporte, reflejándose en la optimización de los activos.Para esto, se propuso el diseño de un modelo a partir del origen y las causas de fallos en los sistemas, para pronosticar el volumen transportado en barriles e identificar la importancia de las variables en explicar la varianza de la cantidad de barriles transportados día.Ítem Elaboración escalas de demanda de cuidado para el distrito capital(Pontificia Universidad Javeriana) Alonso Pava, Juan Camilo; Rozo Arias, Katherine; Ortega Tapasco, Carlos Arturo; Pajaro Hernandez, Juan Pablo; Pajaro Hernandez, Juan PabloEl desarrollo de este trabajo se implementa desde la necesidad de identificar las demandas de cuidado en la ciudad de Bogotá D.C. Por parte de la Secretaria Distrital de la Mujer se busca establecer una escala mediante el uso del tiempo en actividades de cuidado de los habitantes, para cuantificar la demanda de cuidado en la ciudad de Bogotá D.C, y posteriormente se logre la elaboración de las escalas de demanda de cuidado a nivel local. Este trabajo está basado en la metodología CRISP-DM, por medio de la cual se emplearon técnicas analíticas para la preparación de datos, que permitan el descubrimiento de patrones y relaciones, así como planteamiento de análisis descriptivos e identificación de variables importantes en la demanda de cuidados. Se profundizó en los resultados de la escala de demanda de cuidados y sus componentes (cuidado directo, cuidado pasivo y cuidado personal), los cuales permiten profundizar en las necesidades de cuidado y prestación de este, según cinco grupos etarios en los que fueron clasificadas las personas que contestaron la Encuesta Nacional de Uso del Tiempo (ENUT) 2016–2017, específicamente para la ciudad de Bogotá D.C.Ítem Detección de anomalías en texto a partir de modelos de lenguaje natural(Pontificia Universidad Javeriana) Herrera Cancelado, Catalina; Alvarado Valencia, Jorge Andrés; Beltrán Cortés, Ana María; García Díaz, Juan CarlosLa rápida evolución de los modelos de lenguaje natural y la posibilidad de utilizarlos como predictores de palabras y oraciones dentro de su contexto los convierten en herramientas útiles para detectar la presencia de anomalías en términos dentro de un documento. Este estudio propone utilizar BERT como modelo generativo para tareas de detección de anomalías, analizando los tipos de anomalías identificadas tanto en un corpus con lenguaje “estándar” como en uno con errores gramaticales para encontrar las capacidades y limitaciones de la metodología propuesta, así como caracterizar los tipos de anomalías encontradas. La evaluación de 5 modelos no supervisados mostró las particularidades de BERT en el manejo de puntuación, nombres propios y fragmentos de palabras resultando estas en scores particularmente altos, y la complejidad de detectar errores a partir de anomalías dada la estructura secuencial y parafraseada del lenguaje. Finalmente, los resultados de la evaluación en el corpus de aprendizaje REALEC abren la posibilidad de utilizar técnicas de detección de anomalías en conjunto con variables adicionales como base para tareas de corrección de errores gramaticales.Ítem Modelo para mejorar la tasa de resolución de agentes virtuales en una empresa del sector de BPO(Pontificia Universidad Javeriana) Ballén Martínez, Jhon Henry; Llorente Castiblanco, Paula Alejandra; Cely Vásquez, Julián Felipe; Bolivar, Stevenson; Rendón, Jairo; Rendón, Jairo; Bolivar, StevensonLas empresas del sector BPO son intensivas en mano de obra, por lo tanto aquellas que implementan tecnologías de inteligencia artificial tienen una ventaja competitiva, al reducir sus costos y mejorar los niveles de satisfacción de los clientes. La compañía analizada, se encarga de la ejecución de procesos tercerizados, principalmente relacionados con atención al cliente en canales presencial, telefónico y chat, para distintos sectores como financiero y servicios públicos. Para aumentar la eficiencia, la compañía ha implementado agentes virtuales, que se basan en inteligencia artificial para dar respuesta a las comunicaciones entrantes de los clientes. No obstante, se evidenció la necesidad de aumentar la tasa de resolución de solicitudes por parte de dichos agentes virtuales. En este documento se expone un proyecto de analítica, desarrollado con metodología CRISP-DM, cuyo resultado serviría para modificar el diseño de los agentes virtuales. La solución final propuesta se basa en la predicción de la intención del usuario, mediante algoritmos de random forest y redes neuronales profundas, analizando datos estructurados relacionados con el cliente y el negocio. La propuesta consiste en implementar dicha predicción de forma previa a la atención del agente virtual. De implementarse, representaría una mejora de 42,6% en la tasa de resolución de los agentes virtuales (al pasar de 7,88% a 11,24%), lo cual implicaría un aumento de 0,67% en el índice de rentabilidad de la compañía, equivalente a más de COP $430 millones al año.Ítem Prueba de concepto para generación móvil(Pontificia Universidad Javeriana) Hincapié Martínez, Juan Manuel; Montoya Garzón, Giovanni Alexander; Ochoa Blanco, Gustavo Adolfo; Moreno Chanchay, Juan Mauricio; Pájaro Hernández, Juan Pablo; Gotthard Real, AlexanderEl proyecto presenta la prueba de concepto para la compañía Generación Móvil. El principal objetivo de negocio es apoyar en la toma de decisiones en cuanto a la programación de las rutas de los promotores de las ZER (zonas de estacionamiento regulado) de manera que se reduzcan los costos operativos y las pérdidas debido a tiquetes no pagos. Este objetivo se abordó mediante modelos analíticos de series de tiempo, regresiones lineales, regresiones logísticas y segmentación. Las series de tiempo se utilizaron para predecir ingresos y salidas de vehículos de las ZER. Las regresiones lineales se utilizaron para desarrollar modelos de estimación de cuántos minutos un vehículo va a estar estacionado. Las regresiones logísticas y segmentación se desarrollaron para la categorización de clientes en cuanto al comportamiento de pago, es decir, probabilidad de que el tiquete fuera pago o no pago. En el documento se presenta la exploración y limpieza de datos, el modelamiento y evaluación de cada uno de los modelos, con sus respectivos resultados. Durante todo el proyecto se siguió la metodología CRISP-DM como marco de referencia para el desarrollo de proyectos de analítica de datos.Ítem Evaluación de competencias de los programas de la Facultad de Ingeniería de la Pontificia Universidad Javeriana frente a las solicitadas en el mercado laboral, por medio de procesamiento de lenguaje natural(Pontificia Universidad Javeriana) Espinosa León, Óscar Giovanni; Rodriguéz Olivo, Santiago; Solano Avella, Diego Ricardo; Pájaro Hernández, Juán Pablo; Gotthard Real, AlexanderExtracción de competencias laborales de ofertas de empleo a través de Web Scapring y comparación frente a las ofrecidas por la Universidad Javeriana en sus programas de pregrado de la facultad de ingeniería, utilizando herramientas de procesamiento de lenguaja natural tales como Reconocimiento de Entidades y modelos de clasificación para identificar tokens con mayor importancia, además de métricas de similitud semántica para la comparación entre las competencias identificadas en las ofertas laborales y las del perfil del egresado de la universidad.Ítem Evaluación de imágenes de microscopía usando algoritmos de Machine Learning para detección de células individuales y colonias de bacterias en raíces(Pontificia Universidad Javeriana) Chaves Tequia, Luis Miguel; Posada Uribe, Luisa Fernanda; Florez Valencia, Leonardo; Parra Rodriguez, Carlos Alberto; Beltran Cortes, Ana MariaLa capacidad de los microorganismos para colonizar diferentes tipos de superficies e interactuar química y biológicamente con el medio que colonizan ha sido objeto de estudio por años. Un ejemplo de ello es la gran cantidad de proyectos y publicaciones sobre el efecto de las colonizaciones en la salud humana, en la bioprotección de superficies rocosas en estructuras de interés cultural, en biopesticidas, en la degradación de plásticos en ecosistemas marinos y en la biofertilización y bioestimulación de plantas. Técnicas como FISH (Fluorescent in situ hybridization) ó CARD-FISH (catalyzed-reporter deposition- FISH), y la posterior microscopía de fluorescencia o confocal, conforman una sinergia de métodos disponibles para detectar y monitorear la presencia de microorganismos de interés en diferentes ambientes, como es el caso de las raíces de las plantas. Este estudio utiliza una colección de imágenes obtenida del proyecto doctoral “Promoción de crecimiento vegetal de Bacillus subtilis EA-CB0575, colonización rizosférica y potencial genómico y bioquímico”, en el cual se evaluó la colonización de la cepa Bacillus subtilis EA-CB0575, un promotor de crecimiento vegetal en cultivos de interés económico. La finalidad de esta colección de imágenes era evaluar la presencia del microorganismo enunciado en las raíces de las especies vegetales evaluadas (banano, Musa AAA var. Williams y tomate, Lycospersicum esculentum var. Chonto) y monitorear a Bacillus subtilis por medio del uso de una o varias sondas de fluorescencia; generando imágenes donde las células de interés, fluoresciendo debido al proceso realizado, se contrastan de forma notoria con el fondo negro o de baja fluorescencia. Esta investigación se dividió en dos fases; la primera consistió en el diseño de un algoritmo, ejecutado por el equipo de trabajo. Este algoritmo resultante se denominó MSA, y tiene como finalidad segmentar imágenes con las características de fluorescencia ya mencionadas. La segunda fase consistió en la segmentación de las imágenes por parte de los algoritmos supervisados RATS, RATS L, Detección de bordes, LOCAL, Isodata, y el entrenamiento no supervisado para la definición de parámetros del algoritmo Canny, algunos de ellos implementados en software ya existente y disponible para análisis de imágenes de microscopía como DAIME e Image J. El algoritmo que obtiene la menor diferencia entre el conteo de células por parte del experto y la segmentación de las regiones de interés fue el algoritmo de detección de bordes Canny con un valor RMSE de 67,8.Por otra parte, bajo la métrica del error MAE y la medida de exactitud el algoritmo que utiliza un valor de umbral global RATS obtiene el mejor desempeño, la precisión más alta la obtiene el algoritmo Canny (84%), y la sensibilidad más alta (43%) la obtiene el algoritmo Detección de bordes. El desempeño del algoritmo MSA fue positivo, ya que en todas las medidas definidas estuvo por encima del promedio, el mejor desempeño lo obtuvo en la medida de precisión (71,4%). Durante el desarrollo de esta investigación se evidenció la subjetividad y el sesgo que existe en el análisis de las imágenes, ya que para el mismo experto es difícil replicar los resultados en el conteo de células hechos con anterioridad. Por esta razón, la metodología aquí planteada es una alternativa para eliminar la subjetividad y convertir el análisis de imágenes de microscopía de en un proceso que permita reproducibilidad de los resultados.Ítem Muysca : sistema de enriquecimiento del perfil de una persona en el marco de un campus inteligente(Pontificia Universidad Javeriana) Arias Delgado, Viky Julieta; González Guerrero, Enrique; Montero Posada, Anabel; Otero Caicedo, Ricardo FernandoMuysca desarrolla mecanismos de extracción de características basados en la ubicación y los datos transaccionales para permitir el enriquecimiento del perfil de las personas. Al realizar un análisis del estado del arte, caracterizamos diferentes servicios clave en el marco de un campus inteligente. Realizamos implementaciones de algunos componentes de la arquitectura de referencia: Quysqua Smart- UJ. Muysca se diseñó utilizando el Ciclo de Diseño Básico de Ingeniería para el caso de referencia, asociado a los servicios: asistencia a clase, actividades frecuentes y preferencias y gustos temáticos.Ítem Dauruxu : detección de emociones de personas y sus actividades para el apoyo en la evaluación de factores de riesgo psicosocial(Pontificia Universidad Javeriana) Rodríguez Barbosa, Ronald Fernando; González Guerrero, Enrique; Rueda Olarte, Andrea Del Pilar; García Díaz, Juan CarlosLa evaluación de riesgos psicosociales ha desempeñado un papel dominante para garantizar el bienestar y la salud de las personas. No obstante, mecanismos como entrevistas y cuestionarios son susceptibles de obtener resultados sesgados debido a la falta de datos que no se pueden adquirir durante las evaluaciones. Este trabajo propone una arquitectura para identificar actividades y emociones implícitas en los cuestionarios actuales y que tienen el potencial de ser detectadas por cámaras. Mediante visión por computadora, se extraen características de los fotogramas de video los cuales son empleados como predictores para tareas de clasificación. La cuantificación de indicadores basada en la detección de actividades y emociones brindará datos adicionales para respaldar las evaluaciones de riesgo psicosocial.Ítem Modelo para identificar los vuelos afectados por retrasos o cancelaciones en el aeropuerto El Dorado de Bogotá, Colombia(Pontificia Universidad Javeriana) Ramírez Quiroga, William Alfonso; Chavarro Cely, Camilo Andrés; Arias Maury, Carlos Alberto; Pulido Moreno, Luis ManuelEste trabajo está basado en el análisis de factores climáticos y operacionales de las aerolíneas con operación en Colombia. El factor operacional contiene el detalle de los vuelos que tienen lugar en los aeropuertos del país con variables como origen, destino, número de vuelo, aerolínea, fecha y hora programada, fecha y hora de remolque, estado del vuelo (adelantado, cumplido, retrasado y cancelado), cantidad de pasajeros, cantidad de carga, distancia y tiempo de vuelo entre otras. Por el gran peso e importancia que tiene el Aeropuerto El Dorado de Bogotá, el análisis y modelo resultado de este trabajo se centró en la operación y factores climáticos que tienen incidencia en este terminal aéreo. Por medio de técnicas como regresión logística, redes neuronales y XGboosting se logró predecir en la base de datos de pruebas cerca del 70% de los vuelos afectados por cancelaciones o retrasos en el aeropuerto de la capital colombiana.Ítem Modelo analítico para Adacop(Pontificia Universidad Javeriana) Martínez Marín, Oswaldo; Pulido Moreno, Luis Manuel; Sierra Múnera, AlejandroUno de los objetivos estratégicos de CAOBA es impulsar la gestión del conocimiento en analítica. Parte fundamental de la gestión del conocimiento es su efectiva trasferencia, esta se ve fortalecido en el trabajo conjunto entre CAOBA y el Observatorio fiscal de la Pontificia Universidad Javeriana; identificando que herramientas analíticas (modelos) pueden apoyar la trasparecía en la contratación pública del estado colombiano aportando a todos los actores involucrados (ciudadanos, entidades públicas, entro otros) un mayor entendimiento del proceso de contratación estatal, robusteciendo la actual plataforma ADACOP. Este trabajo plantea la manera de poder identificar características de las entidades del estado que me permitan establecer un nivel de riesgo de caer en demoras en la contratación o sobrecostos, esto se logra integrando la información publica del estado en temas de trasparencia de las entidades y la información disponible de la contratación pública y las metodologías estadísticas y de machine learning.Ítem Análisis de la contribución de los fonemas a la predicción de la valencia emocional en tweets en español e inglés(Pontificia Universidad Javeriana) Bernal Rojas, Gabriel Alejandro; Alvarado Valencia, Jorge AndrésAunque tradicionalmente se ha asumido que el sonido de las palabras y su significado se relacionan de forma arbitraria, distintos hallazgos empíricos respaldan la hipótesis de que las unidades fonológicas básicas del lenguaje guardan una relación sistemática con aspectos semánticos, incluyendo la connotación afectiva y actitudinal de las palabras (Adelman, Estes, & Cossu, 2018; Aryani, Conrad, Schmidtke, & Jacobs, 2018; Dingemanse, Blasi, Lupyan, Christiansen, & Monaghan, 2015; Monaghan, Shillcock, Christiansen, & Kirby, 2014; Schmidtke, Conrad, & Jacobs, 2014). A partir de estas premisas, se buscó identificar si las unidades fonológicas del español y el inglés contribuyen a la predicción de la valencia emocional en un corpus de tweets. Para esto, se entrenó un conjunto de modelos de regresión lineal múltiple, cuyo desempeño fue evaluado a partir de la correlación y los indicadores de error calculados partir de las valencias predichas y las observadas en los datasets de prueba proporcionados por el concurso SemEval-2018 (Mohammad, Bravo-Márquez, Salameh, & Kiritchenko, 2018). Se encontró que la adición de los recursos fonológicos a un conjunto de predictores léxicos (Bag of Words de los Tweets, normalizada con el método TF-IDF) tiene un efecto reducido pero consistente sobre las métricas globales de ajuste, y en ambos idiomas permite discriminar con mayor precisión las valencias observadas cercanas a los valores medios, así como las valencias inferiores asociadas a contenidos afectivos negativos.Ítem Análisis de las variables relacionadas con la caída de matriculados en la educación superior(Pontificia Universidad Javeriana) Davison Galvis, John Patrick; Montealegre Franco, Diego Camilo; Molina Arcos, William Andrés; Pajaro Hernandez, Juan PabloDesde el 2017, la cantidad de nuevos matriculados en las Instituciones de educación superior a nivel pregrado en Colombia han venido disminuyendo, lo cual representa un problema para la sostenibilidad de las universidades a largo plazo. A través del presente trabajo, pretendemos evidenciar cuales son las carreras más representativas de las universidades que han recibido más estudiantes en este contexto, y poder generar hipótesis respecto a las características comunes que guardan aquellas carreras con cambios significativos en el número de matriculados, con el fin de comparar esta información con los programas ofrecidos por la PUJ, y que de esta forma la PUJ* pueda mejorar la propuesta de valor de ciertos programas para lograr una mayor atracción de nuevos estudiantes, y así mitigar en el corto plazo el impacto de la macro-tendencia de disminución de estudiantes en Colombia.Ítem Análisis etiquetado de textos para predicción de la polaridad, enfoque semi supervisado y etiquetado automático(Pontificia Universidad Javeriana) Luque Sánchez, María Alejandra; Córtes Díaz, Luis Felipe; Pajaro Hernandez, Juan PabloEl objetivo de este trabajo fue explorar dos enfoques relacionados con el análisis de textos y su procesamiento o etiquetado para lograr predecir la polaridad asociada. Estos dos enfoques: etiquetado semi supervisado y etiquetado basado en transfer learning. El aprendizaje semi supervisado, en un contexto de procesamiento de datos se entiende como la forma en que un algoritmo en su entrenamiento utiliza una cantidad de data etiquetada manualmente para pronosticar otra cantidad sin etiqueta. El enfoque de transfer learning hace referencia a utilizar el conocimiento y desarrollo detrás de una librería que de manera automática genera el etiquetado del texto sin ninguna interacción manual, la librería utilizar para este ejercicio fue senticnet. El desarrollo de este trabajo de grado busca enriquecer el pronóstico de una polaridad a través de ambos enfoques, permitiendo iterar y sensibilizar parámetros relevantes dentro de cada uno.Ítem Trabajo de grado aplicado en estudiantes inscritos y matriculados a la Pontificia Universidad Javeriana(Pontificia Universidad Javeriana) Arango Pérez, Diego Fernando; Salazar Betancourth, Erika Johana; Quiroga Sarmiento, Karen; Bolivar Atuesta, Stevenson; Rendón Gamboa, Jairo AndrésEl problema de inscribirse y posteriormente matricularse en las universidades en los diferentes programas ofrecidos en los últimos años ha tenido una tendencia decreciente. Lo anterior ha llevado a las universidades a buscar diferentes alternativas para mitigar estos efectos en sus ingresos y estrategias futuras. Para este trabajo, el análisis se centró en la ciudad de Bogotá, en la Universidad Javeriana, la cual, en 2017 encontró una caída significativa en el nivel de personas inscrita. A través de variables de información interna y externa se buscó explicar el comportamiento de esta tendencia.Ítem Análisis de los errores en el picking y verificación de unidades sueltas en el centro de distribución de comercial Nutresa Bogotá(Pontificia Universidad Javeriana) Tovar Campo, Santiago Alejandro; Millán Martínez, Diego RafaelPara el centro de distribución de Comercial Nutresa, el proceso de preparación de pedidos tiene dos conceptos fundamentales: eficiencia y efectividad. La eficiencia se refiere a la velocidad con la que realizan el alistamiento de los pedidos, mientras que la efectividad corresponde a la exactitud con que se alista la mercancía que se había solicitado. La promesa de servicio al cliente consiste en entregarle los productos solicitados, en el plazo pactado y en las cantidades acordadas. Cuando existen errores en el proceso de alistamiento de mercancía que no son solucionados antes del envío al cliente, se corre el riesgo de perder ventas y generar molestias. Actualmente, Comercial Nutresa presenta errores constantes en las ordenes despachadas, a pesar de realizar una verificación del 100% de los alistamientos, solo logra identificar el 40% de los casos con novedades en las cantidades alistadas. Con el objetivo de disminuir la cantidad de errores y optimizar recursos en el proceso alistamiento, se propone una lista de recomendaciones y buenas prácticas, acompañadas de un modelo de aprendizaje automático capaz de reconocer alistamientos con alta probabilidad de ser defectuosos. La propuesta logra reducir un 70% la cantidad de alistamientos a verificar, logrando identificar el 60% de los errores. En términos de negocio, esto representa ahorros operativos cercanos a 320 millones de pesos colombianos anuales.Ítem Detección de anomalías en el consumo de energía eléctrica industrial(Pontificia Universidad Javeriana) Aparicio Wallis, Andrés Felipe; Serna Polania, Julio César; Camargo Ramirez, Jhon Jaime; Rendón Gamboa, Jairo Andrés; Bolívar Atuesta, StevensonConsultoría para el diseño de una solución analítica que le permita a la compañía Primestone generar ingresos adicionales por medio del licenciamiento de la misma y ahorrar costos operativos a sus clientes. Esta solución tiene como objetivo optimizar los tiempos de análisis y validación de información de telemedidas usadas para la detección de consumos anómalos, implementando técnicas de aprendizaje de máquina y minería de datos para evitar su validación manual y prevenir errores en la interpretación de los datos de consumo. Lo cual puede ocasionar verificaciones en campo de medidores e infraestructura eléctrica del usuario cuando en algunos casos esta verificación no es necesaria.Ítem ADACOP - Analytics(Pontificia Universidad Javeriana) Calambás Marín, Daniel Alejandro; Mendoza Mendoza, Jaime Andrés; Pacheco Mejía, Angélica; Ruiz Rodríguez, Leidy Andrea; González Rivera, Rafael AndrésEl presente proyecto, realizado de la mano con el Centro de Excelencia y Apropiación en Big Data y Data Analytics(CAOBA), se focaliza en el desarrollo de una arquitectura de Big Data que soporte la extracción, almacenamiento, procesamiento y exploración analítica sobre los datos abiertos del gobierno colombiano, inicialmente relacionados con la contratación estatal, con el finde mejorarlos procesos de transparencia y brindar una mayor cercanía hacia el ciudadano, ya que se debe trabajar en la consistencia, estandarización de los datos y en particular en las propiedades que generen valor y aporten a la toma de decisiones. Este documento describe la implementación de la arquitectura, el prototipo resultante y provee los resultados de las pruebas TAM (technology acceptance model) de aceptación a usuarios interesados.Ítem Construcción de un modelo analítico para la predicción de cancelaciones de servicios en el segmento corporativo en La empresa Smart Taxi(Pontificia Universidad Javeriana) Torres Silva, Julián Octavio; Almendrales Pabón, Álvaro José; Bolívar Atuesta, Stevenson; Rendón Gamboa, Jairo AndrésDebido a la apertura y mayor accesibilidad a las TIC se ha incrementado el uso de plataformas digitales para la prestación de servicios de transporte, lo que ha generado expansión en el mercado y una mayor competencia. Como consecuencia de esto los clientes y el mercado cada vez exigen una mejor calidad de servicio, llevando a las empresas a generar estrategias que permitan retener y atraer nuevos clientes, a través de una mejor reputación en el mercado con altos estándares de indicadores de servicio, productividad, costos, entre otros. El presente trabajo busca abordar el problema de las cancelaciones por parte de los taxistas en el segmento corporativo logrando identificar variables asociadas a una cancelación, con el fin de generar un modelo de predicción que permita tomar decisiones oportunas para controlar los niveles de cancelaciones. Finalmente el propósito es lograr generar estrategias que posicionen a la compañía en el segmento B2B, generando mejor reputación y apalancando ventajas competitivas