Tesis de doctorado:
Herramientas de minería de datos para estudios longitudinales con aplicaciones biomédicas

Fecha

2024-02

Título de la revista

ISSN de la revista

Título del volumen

Editor

Resumen

En esta tesis se describen dos desarrollos para estudios longitudinales con aplicaciones biomédicas. Estos desarrollos utilizan herramientas matemáticas muy distintas, por lo tanto, parece difícil ubicar ambos trabajos dentro de un mismo marco. Sin embargo, ambos trabajos tienen su fundamento en la interpretación de los coecientes estadísticos y la evolución temporal de los datos, explotando las características de los datos longitudinales. El primer desarrollo consiste de una aplicación algorítmica a una base longitudinal de pacientes diabéticos en la que se analiza secuencialmente la expresión de algunos genes estratégicos. Considerando esta base, se logró agrupar en 3 grupos a los pacientes por la variación en su expresión genética, presentando uno de los grupos características clínicas distintas a los grupos restantes. Además, en nuestro trabajo se desarrollaron algoritmos que permiten obtener nuevas características a partir de bases de datos donde las herramientas usuales de detección de patrones no son recomendables. Este descubrimiento es relevante ya que las características de los grupos no estuvieron involucradas en el agrupamiento de pacientes y por lo tanto, presenta una potencial asociación de la cual no se tenía información. Además, nuestra propuesta incluye un nuevo enfoque sobre el problema que permite evaluar muchos algoritmos de clustering y comparar sus resultados. Considerando estas nuevas alternativas, hemos logrado encontrar una forma de agrupar observaciones que, en las bases de datos seleccionadas, arroja mejores resultados que otros métodos preestablecidos. El segundo desarrollo, es el de un algoritmo de detección de trayectorias atípicas para bases con alta variabilidad en las respuestas individuales, pero que siguen una cierta estructura que se puede describir a través de un modelo estadístico que se adapta a dicha variabilidad. A partir de este modelo se detectan de forma simultánea diversas características de los individuos con evoluciones temporales que no acompañan dicho modelo estadístico. En nuestros experimentos y simulaciones, hemos obtenido mejores resultados de detección que otros algoritmos establecidos.

Descripción

Palabras clave

BIOMEDICINA, MINERÍA DE DATOS, DATOS LONGITUDINALES, MODELOS MIXTOS

Citación

Colecciones