Ciencia de Datos

URI permanente para esta colección

Examinar

Envíos recientes

Mostrando 1 - 20 de 64
  • Trabajo final de especialización
    Portal de publicidad inmobiliaria centrado en el usuario
    (2022-11) Miró, Mariano Diego; Gómez, Leticia Irene
    Este trabajo tiene como objetivo "presentar una prueba de concepto de un portal inmobiliario, que recopile e integre información contextual de los barrios de la ciudad (lugares de interés, estadísticas de robo y delincuencia, etc.) para combinarla con la información de los inmuebles ofrecidos, presentándole al usuario un tablero de información integrada que lo ayude a tomar una decisión sobre la compra o alquiler de un inmueble."
  • Trabajo final de especialización
    Inteligencia artificial y aprendizaje automático para prevención de ataques DDoS en dispositivos IoT
    (2022-10) Echazú, Juan Rodrigo; Ramele, Rodrigo
    "Los dispositivos IoT son cada vez más comunes en nuestro día a día, y la implementación de redes 5G hará que esta tecnología crezca aún más. Cuantos más dispositivos haya conectados a la red más dependeremos de estos y más se nos complicará la vida cuando estos sistemas no estén disponibles. Por ejemplo, dispositivos con sensores que transmiten el estado de producción de una fábrica y según esos datos se realiza una acción determinada no puede dejar de funcionar porque se arruinará toda la cadena de producción o, aún más importante, dispositivos médicos que rastrean signos vitales y alertan al personal de salud sobre cualquier cambio importante deben estar disponibles las veinticuatro horas del día porque la vida de un paciente depende de ello. Es por esto, que este trabajo analiza técnicas de inteligencia artificial utilizadas para la prevención de ataques informáticos DDoS (Distributed Denial-of-Service) en dispositivos IoT que atentan contra la disponibilidad de los datos."
  • Trabajo final de especialización
    Detección del grado de satisfacción del empleado en la organización
    (2022-06) Bordón, Maximiliano; Gómez, Leticia Irene
    "Esta obra fue realizada con la intención de desarrollar un prototipo que detecte y clasifique opiniones procedentes de la fuerza de trabajo a partir de revisiones (reviews), con el objeto de permitirle al área de recursos humanos obtener un grado de satisfacción del trabajador y aplicar medidas que logren fidelizar al empleado de una manera efectiva. Cabe destacar que la solución propuesta se encontrará adaptada a las necesidades particulares de la empresa en donde se relevó la problemática."
  • Trabajo final de especialización
    Utilización de redes neuronales recurrentes en la predicción de tendencias del mercado de harina de soja
    (2022) Alonso, Juan Ignacio; Riccillo, Marcela
    "La volatilidad de los precios internacionales de la Harina de Soja impacta de manera significativa la economía de distintas industrias, gobiernos y, finalmente, la población. Los modelos Auto Regresivos de Media Móvil (ARIMA) constituyen una de las herramientas de análisis de series de tiempo más utilizadas. Sin embargo, el advenimiento de nuevas tecnologías de análisis y procesamiento de datos difundieron nuevas técnicas aplicables al estudio de series de tiempo, siendo Las Redes Neuronales Recurrentes del tipo LSTM una de ellas. En el presente estudio se compara la performance relativa de modelos ARIMA y RNR LSTM en la predicción de tendencias de precios de Harina de Soja."
  • Trabajo final de especialización
    Modelo de pronóstico como soporte para el mantenimiento predictivo en filtros de aire de una turbina de gas
    (2022) Carrizo, Javier Jorge Andrés; Gómez, Leticia Irene
    El presente trabajo tiene como objetivo "diseñar e implementar un modelo de forecasting que permita predecir la calidad del aire que ingresa a la turbina de gas con la anticipación suficiente para poder actuar ante desvíos que afecten el funcionamiento de la turbina."
  • Trabajo final de especialización
    Modelo de categorización inteligente de productos publicados en la plataforma de un e-commerce
    (2022) González Rodríguez, Rubén Darío; Pampliega, Juan Martín
    El presente trabajo tiene como objetivo "desarrollar e implementar un modelo predictivo basado en NLP y aprendizaje de máquina para la categorización de productos ofrecidos en la plataforma del e-commerce."
  • Trabajo final de especialización
    Optimización de modelos predictivos para Series de Tiempo Jerárquicas (HTS)
    (2021-10-21) Woodley, Patricio Alex; Riccillo, Marcela
    "Las series de tiempo jerárquicas (HTS) son un subconjunto de series de tiempo que están contenidas dentro de una estructura o jerarquía. Esta estructura puede estar dada por características propias del producto/servicio, como su categoría, departamento, etc., o por una división geográfica, como por ejemplo ciudad, estado o país. Las técnicas clásicas como ARIMA o ETS no son óptimas para este tipo de conjunto de series, ya que la estructura puede aportar información valiosa que pasaría inadvertida o al menos no tan fácilmente identificable si modelamos las series de tiempo por separado. Debido a esto, se comparó el desempeño de Redes Neuronales LSTM, las cuales son ampliamente utilizadas para series de tiempo, y de técnicas específicas para series de tiempo jerárquicas como Bottom-Up y Reconciliación Óptima para predecir las ventas de departamentos dentro de tiendas de Walmart en EE.UU. Se analizaron en detalle 70 series de tiempo a nivel tienda-departamento y se demostró la eficacia de estas."
  • Trabajo final de especialización
    Entrenamiento de un modelo de IA para el procesamiento de imágenes todo cielo y clasificación de nubes
    (2022) Loyber, Pablo José; Lorenzatto, Pablo Andrés
    "En este trabajo se va a explorar la factibilidad de la clasificación automática de nubes observadas con una cámara cenital “todo cielo” mediante técnicas de computer visión y el entrenamiento de una red neuronal con un set de imágenes obtenidas con dichas cámaras. Para ello, el principal desafío fue el armado de un conjunto de datos coherente para el entrenamiento de la red, esto es, conjunto de imágenes clasificadas de acuerdo a clases predefinidas."
  • Trabajo final de especialización
    Detección automática de anomalías en logs: una revisión visual del estado del arte
    (2022-10-05) Aboitiz, Txomin Martin; Aizemberg, Diego Ariel
    "Con el objetivo de elaborar una revisión visual del estado del arte de la detección automática de anomalías en logs, se recopilaron 20 trabajos (publicados entre 2009 y 2021) centrados en dicha línea de investigación. 17 de ellos son trabajos experimentales y 3 son revisiones. Los trabajos fueron procesados para extraer información descriptiva asociada a la publicación y el contenido. Se prestó particular atención a las categorías de aprendizaje y los modelos de aprendizaje automático entrenados en los trabajos para detectar anomalías. También se prestó atención a la interacción entre los trabajos, a través de las citas. Con la información extraída, se construyó una base de datos de 3 tablas describiendo los autores, los trabajos y sus interacciones. Con los datos, se construyó un notebook de visualizaciones en ObservableHQ. Estas son útiles para obtener una idea inicial de los países del mundo más involucrados en esta investigación, los trabajos más influyentes y los modelos de aprendizaje más utilizados. Dado que el tamaño muestral de trabajos utilizados aquí es pequeño, no se plantea que las tendencias observadas por las visualizaciones sean representativas de las tendencias reales. Sin embargo, con un mayor tamaño muestral, esta revisión visual podría ser útil para resumir información importante sobre el estado del arte de este tema, de manera que un lector no especializado pueda identificar rápidamente trabajos de interés para sus requerimientos específicos."
  • Trabajo final de especialización
    Clasificación de clientes por umbral superior de ingresos
    (2022-06) Aguilera, Sebastián; Gómez, Leticia Irene
    "El presente trabajo tiene por objetivo proveer de nuevas herramientas al análisis de datos en el proceso de toma de decisiones concerniente a la banca comercial minorista. La propuesta está relacionada con la realización de un análisis que contenga el resultante de distintos modelos predictivos aplicados un set de datos provistos por la entidad, y una etiqueta generada por (la variable a regresar)."
  • Trabajo final de especialización
    Segmentación de mercado: agroquímicos
    (2022-07) Domínguez, Juan Manuel; Rossi, Mario
    "El presente TFI tiene como objetivo presentar los elementos de una solución formal de segmentación que permita a La Empresa establecer la cantidad óptima de segmentos de clientes y, al mismo tiempo, identificar objetivamente similitudes entre clientes de acuerdo con un conjunto de características relevantes para el negocio. Para ello, se trabajó en definir y crear un dataset de clientes con atributos y registros definidos y en desarrollar un modelo de segmentación de clientes apoyado por algoritmos de ML."
  • Trabajo final de especialización
    Detección de actividad pesquera utilizando datos AIS con LightGBM
    (2022-07-22) Marcovecchio, Nicolás Agustín; Gambini, Juliana
    "El sistema AIS (Automatic Identification System) sirve para evitar colisiones a partir de que un buque transmite su posición a los demás. En la actualidad todavía hay buques pesqueros que no apagan sus sistemas al hacer pesca ilegal, y al ser un equipo el cual se configura manualmente muchos buques no se identifican como pesqueros o clonan la identificación de otro buque (Global Fishing Watch, Spoofing: One Identity Shared by Multiple Vessels, 2016). La actividad pesquera puede proporcionar a las autoridades, los investigadores y a los políticos información para tener una imagen más completa de la pesca y a la sostenibilidad de los recursos marinos. Lo que se busca en este trabajo es mejorar el estado actual para detectar esta actividad. Se utilizara el novedoso conjunto de datos, ya que muchos trabajos anteriores se los ve limitado en este aspecto, publicado por Global Fishing Watch (GFW) en el 2020. Este trabajo incluye el tratamiento para remover los datos faltantes y atípicos, resolver la granularidad temporal (los datos AIS en la realidad no se captan a intervalos constantes), la generación de un vector de características y el entrenamiento de un modelo óptimo de clasificación utilizando el método lightgbm (Microsoft Corporation, 2022) para comparar con lo alcanzado actualmente por GFW en (Kroodsma et al., 2018."
  • Trabajo final de especialización
    Modelos de regresión para la predicción de la probabilidad de colisión entre dos cuerpos orbitando alrededor de la Tierra en una trayectoria de encuentro
    (2022) Wenger, Esteban Federico; Riccillo, Marcela
    "El número de satélites y chatarra espacial orbitando alrededor de la Tierra ha crecido en las últimas décadas. La chatarra espacial además de ser un tipo de contaminación ambiental, es también un inconveniente para las empresas operadoras de satélites. La industria conocida como New Space también ha crecido en los últimos años. Los satélites de estas empresas realizan órbitas que eventualmente tienen eventos de conjunción o de encuentro con otros cuerpos, ya sean otros satélites o chatarra espacial. Por este motivo, existe un Ente de Monitoreo que se encarga de emitir reportes conocidos como Conjunction Data Messages (CDM) que le avisa a las empresas operadoras de satélites cuando uno de sus satélites se encuentra dentro de una trayectoria de colisión con otro objecto. Para evaluar un evento de conjunción es fundamental la probabilidad de colisión y la mínima distancia a la que se encontrarán los cuerpos en el momento conocido como TCA (time of closest approach). En este Trabajo de Investigación se propone aplicar Técnicas de Machine Learning para predecir una de estas variables, la cual es fundamental a la hora de tomar la decisión de si el riesgo de un evento de encuentro amerita realizar una maniobra o no. Este Trabajo encara el problema planteando un Modelo Lineal y luego se avanza con Modelos No Lineales de Árboles de Decisión. Se aplican técnicas de Modelos de Ensemble de Boosting con dos algoritmos AdaBoost y Light Gradient Boosting Machines. Para entrenar estos Modelos se aplica un ETL que resulta interesante para los reportes CDM en formato estándar y es extensible a otros Modelos que se deseen aplicar. Los resultados obtenidos permiten obtener conclusiones que son contundentes en cuanto a la utilización de Técnicas de Machine Learning para aportar valor a los datos, en este caso CDM, y para la evaluación de este tipo eventos de conjunción."
  • Trabajo final de especialización
    Desarrollo del sistema de recomendación para una empresa de e-commerce
    (2021-12) Vicente, Eduardo Ignacio; Pampliega, Juan Martín
    El presente trabajo tiene como objetivo "desarrollar un modelo de segmentación de clientes que, combinado con un modelo predictivo, permita detectar los productos que es más probable que quieran adquirir a futuro y así poder personalizar la oferta."
  • Trabajo final de especialización
    Violencia doméstica en Argentina: un modelo de evaluación de riesgos aplicando técnicas de machine learning
    (2022-03) Clur, Marina; Soliani, Valeria
    "En el presente trabajo se analizan las características de las personas que sufren episodios de violencia doméstica o de género en base a las denuncias realizadas entre el 2017 y 2020 en Argentina. El principal objetivo consistió en desarrollar un modelo predictivo que permita definir de forma sistemática el nivel de riesgo al que están expuestas las personas que denuncian dichos episodios utilizando los datos que son relevados al momento de la denuncia y el nivel de riesgo evaluado por los profesionales del organismo que toma dichas denuncias. Actualmente no existe en Argentina una técnica sistemática para la valoración del riesgo o grado de peligro en el que se encuentran las personas que sufren violencia doméstica al momento de realizar la denuncia."
  • Trabajo final de especialización
    Inventario vial georreferenciado
    (2020) Arequipa, Patricia Noemí; Aizemberg, Diego Ariel
    El presente trabajo tiene como objetivo general "generar un algoritmo práctico que permita vincular y ajustar lo mejor posible los puntos de inventario a puntos georreferenciados, obteniendo así las coordenadas geográficas de cada punto que describe a las rutas, esto permitirá mapear el inventario vial y compartir el mismo de manera oficial."
  • Trabajo final de especialización
    Detección de fraudes en seguros de automóviles utilizando algoritmos de machine learning
    (2020) Fabbiano, Pablo Miguel; Denicolay, Gustavo
    "Pese a que el Fraude en Seguros se presenta en todos los ramos de la industria, se acota el presente trabajo al ramo Automotores. La información utilizada para modelar la solución y verificar los resultados del presente trabajo, es provista por una Compañía actual del Mercado Asegurador local que exige confidencialidad y anonimato. Los datos se mantendrán de forma no pública, siendo los mismos o cualquier inferencia que pudiera hacerse de ellos, estrictamente confidenciales. El trabajo está orientado a brindar una solución de bajo costo, pudiendo de esta forma ser la solución implementada por Aseguradoras pequeñas y medianas con bajos presupuestos. El prototipo se diseñará para ser ejecutado en equipos configurados al menos con 32 gigabytes de RAM, procesador I7, disco de 1 terabyte, similar a los existentes en estas Aseguradoras, es decir equipos estándar de bajo costo."
  • Trabajo final de especialización
    Predicción de probabilidad de robos de bicicletas del sistema público de la Ciudad de Buenos Aires
    (2022-02) Montero, Jazmín; Gómez, Leticia Irene
    "El presente estudio busca entrenar un modelo que permita predecir el grado de probabilidad de que una bicicleta termine siendo robada, dadas las condiciones iniciales del viaje."
  • Trabajo final de especialización
    Análisis de características de escucha de canciones para un usuario en una plataforma de streaming de música mediante métodos de aprendizaje automático no supervisado
    (2021-11) Seguí, Francisco; Gómez, Leticia Irene
    "El presente trabajo tiene por objetivo proveerle a un usuario una clasificación de las canciones que escucha, de acuerdo a sus características musicales, aplicando métodos de aprendizaje automático no supervisado a plataformas de streaming de música."
  • Trabajo final de especialización
    Técnicas de aprendizaje profundo para el pronóstico de la producción de petróleo: aplicación a pozos perforados en yacimientos no-convencionales
    (2021-12) Ortega Arrieta, Alexis Enrique; Soliani, Valeria
    "El presente trabajo busca desarrollar una metodología basada en datos para pronosticar la producción mensual promedio de petróleo de pozos horizontales perforados y completados en el yacimiento no-convencional Vaca Muerta en Argentina. Se busca también modelar el efecto de varios parámetros de yacimiento y completamiento en la producción de pozos de petróleo y gas mediante la aplicación de una metodología probabilística. Para lo anterior, se propone el uso de una arquitectura novedosa denominada “Temporal Fusion Transformers” que, mediante el análisis de la compleja interacción entre covariables estáticas y covariables temporales, permite pronosticar múltiples pasos de tiempo futuros."