Logotipo del repositorio
 

Ciencia de Datos

URI permanente para esta colección

Examinar

Envíos recientes

Mostrando 1 - 4 de 4
  • Ítem
    Una aplicación de los modelos de clasificación en datos desbalanceados
    Molano De Oro, Jose; Acosta Avena, Lina Maria; Cataño Salazar, Duvan Humberto
    Esta aplicación analiza y compara el desempeño de los modelos de clasificación regresión logística, Random Forest y XGBoost en un conjunto de datos desbalanceado utilizando las técnicas de sobremuestreo SMOTE y ADASYN. El objetivo es predecir la suscripción de clientes a depósitos a plazos, utilizando datos reales para evaluar el impacto de estas técnicas en el rendimiento de los modelos de clasificación. Los resultados indican que, si bien SMOTE y ADASYN mejoran significativamente la sensibilidad, permitiendo una mejor identificación de la clase minoritaria, estas mejoras se logran a expensas de una reducción en la especificidad y la precisión, generando un aumento en los falsos positivos. Además, las mejoras en el F1-Score son marginales y no se observan cambios significativos en el AUC, lo que sugiere que el impacto global de las técnicas de sobremuestreo en la capacidad discriminativa de los modelos es limitado. En general, los modelos de ensamble como Random Forest y XGBoost muestran un rendimiento superior en comparación con la regresión logística, destacándose como opciones más efectivas en escenarios de datos desbalanceados, aunque con limitaciones en su rendimiento global.
  • Ítem
    Identificación y análisis de patrones del parroquialismo en múltiples idiomas
    Chavarro Diaz, Victoria Sofia; Alvarado Valencia, Jorge Andres; Moreno Sandoval, Luis Gabriel; 00020453347; 00020453347
    Este proyecto aborda el estudio del parroquialismo lingüístico, entendido como la tendencia de los hablantes a priorizar referencias geográficas culturalmente cercanas. Se analizaron 14 idiomas representativos de diversas regiones del mundo, con el objetivo de ofrecer una comparación global de este fenómeno. Mediante técnicas de procesamiento de lenguaje natural y word embeddings multilingües, se desarrollaron dos índices complementarios: uno basado en la frecuencia relativa de menciones locales frente a externas, útil para explorar sus causas y asociaciones; y otro que mide la desviación respecto a un escenario ideal de cobertura geográfica proporcional a la población mundial, facilitando la visualización de desequilibrios territoriales. Juntos, estos índices proporcionan una medida robusta y versátil del fenómeno. Estas métricas permitieron no solo identificar variaciones en el grado de parroquialismo entre idiomas, sino también vincular esos niveles con factores estructurales como desigualdad, confianza social, migración y apertura cultural. Además, se generaron mapas comparativos y cartogramas que ilustran de manera accesible las diferencias de importancia territorial en el discurso multilingüe. Los resultados permiten comprender mejor el fenómeno del parroquialismo lingüístico y explorar qué factores influyen en su aparición y magnitud. Este análisis ofrece así una base sólida para futuras investigaciones sobre sesgos geográficos y dinámicas culturales en el uso global del lenguaje.
  • Ítem
    Visión artificial para patologías oculares
    Ordonez Saavedra, Daniel; Rueda Olarte, Andrea Del Pilar; Moreno Barbosa, Andres Dario; Parra Rodriguez, Carlos Alberto; 00020475219; 00020475219
    En este trabajo se propone un método para la detección de retinopatías en imágenes de fondo de ojo, basado en el uso de algoritmos de segmentación semántica que permiten identificar y delimitar las lesiones asociadas a diversas patologías oculares. El enfoque se centra en el desarrollo de un modelo multiescala robusto, capaz de simular una evaluación diagnóstica fundamentada en el uso de parámetros médicos. La integración de técnicas de inteligencia artificial y procesamiento de imágenes médicas resultan en una arquitectura compuesta capaz de analizar imágenes en diferentes resoluciones.
  • Ítem
    Desarrollo de un algoritmo de visión por computador para el análisis biomecánico del saque de piso en arqueros de fútbol
    Salamanca Barrera, Laura Sofía; Ramos Maldonado, Laura Juliana; Martinez Bernal, Oscar Danilo; Florez Valencia, Leonardo; 00020478229; 00020478229
    Este trabajo presenta el desarrollo de un algoritmo basado en visión por computadora para el análisis biomecánico del saque de piso del arquero en fútbol, sin el uso de marcadores físicos. La propuesta busca brindar una herramienta precisa, accesible y no invasiva para contextos académicos y deportivos, permitiendo el estudio técnico del gesto sin alterar el movimiento natural del deportista. Se diseñó un protocolo de captura con tres cámaras ubicadas en posiciones estratégicas (lateral derecha, lateral izquierda y posterior), cuyos videos fueron sincronizados para obtener un análisis multivista. Mediante técnicas de estimación de pose, el algoritmo detecta puntos clave en el cuerpo del arquero, extrayendo variables biomecánicas como los ángulos de cadera, rodilla, tobillo y tronco durante la ejecución del gesto. El algoritmo incorpora un sistema de detección y corrección de errores, junto con una interfaz que permite visualizar el movimiento y los ángulos articulares. Estos ángulos son clasificados dentro de rangos previamente establecidos, los cuales categorizan el gesto técnico como bueno, regular o malo, facilitando así una retroalimentación clara y objetiva para el análisis biomecánico. Para evaluar la precisión del sistema, se realizó una comparación con el software Kinovea, utilizando análisis estadísticos como la prueba t sobre las diferencias de ángulos, coeficientes de correlación de Pearson, gráficos de dispersión y la prueba no paramétrica de los signos. Los resultados evidenciaron una alta concordancia entre ambos métodos, lo que respalda la validez y fiabilidad del algoritmo propuesto.