Ciencia de Datos
Permanent URI for this collection
Browse
Browsing Ciencia de Datos by Subject "APRENDIZAJE AUTOMATICO"
Now showing 1 - 20 of 23
Results Per Page
Sort Options
trabajo final de especialización.listelement.badge Análisis de características de escucha de canciones para un usuario en una plataforma de streaming de música mediante métodos de aprendizaje automático no supervisado(2021-11) Seguí, Francisco; Gómez, Leticia Irene"El presente trabajo tiene por objetivo proveerle a un usuario una clasificación de las canciones que escucha, de acuerdo a sus características musicales, aplicando métodos de aprendizaje automático no supervisado a plataformas de streaming de música."trabajo final de especialización.listelement.badge Análisis de sentimientos: aplicación sobre textos en redes sociales(2019) Pedro, Diego Leonardo; Soliani, Valeria"Obtener tendencias de opinión pública sobre un producto de una empresa, mediante la implementación de técnicas de análisis de sentimientos sobre mensajes de clientes en redes sociales."trabajo final de especialización.listelement.badge Analysis and benchmarking for gravitational waves spectrogram’s classification by usage of machine learning techniques(2020-09-06) Martínez, Ezequiel H.; Ramele, Rodrigo"Gravitatonal waves, the seed of the 2015 Nobel’s prize are the cause of several complex celestial phenomena that is non-observable for the naked eye. Their identification, classification and study is s(ll a handmade work which is s(ll nascent. There has been several approaches to produce novel tools to aid the scientists behind the discovery of these deep space events. One of the most thrilling examples has been the usage of artificial intelligence classification to aid in the preiden identification of certain signals. We took one of these tools, Gravity Spy, and study its base paper, trying to reproduce some of their classification results using the very same base dataset. This research aims to compare the results obtained from the original paper, with a binary classification approach and several different algorithms taken from the knowledge base of machine learning and deep learning, alike. We confirmed the original paper results and obtained a new approach for the same solution. In this study we trained several models that could be used for further development of an eventual alternative engines for gravita(onal waves signal’s classification or any other sort of signal heavily influenced by noise and analysed by spectrograms."trabajo final de especialización.listelement.badge Calidad de datos y aprendizaje automático: detección de errores semánticos en datos estructurados con esquema desconocido(2021-11) Lentini, Alejandro Daniel; Soliani, Valeria"El presente trabajo tiene como objetivo general evaluar si técnicas del aprendizaje automático provenientes del área del procesamiento natural del lenguaje pueden tener aplicación práctica en la detección semiautomática de errores semánticos en datos estructurados multivariados con calidad y esquema de datos desconocidos, ofreciendo lineamientos para el desarrollo de herramientas que asistan a los usuarios en estas tareas."trabajo final de especialización.listelement.badge Categorización y análisis de la frecuencia cardíaca de un individuo con inteligencia artificial(2020) Goldman, Jorge Carlos; Riccillo, Marcela"Este estudio presenta un enfoque novedoso en la aplicación de técnicas de aprendizaje automático para la clasificación de enfermedades del músculo cardíaco. Una detección temprana de arritmias aumenta considerablemente la posibilidad de corrección y sobrevida de los pacientes mediante medicación adecuada indicada por un profesional de la salud. En el siguiente trabajo se evaluarán diversos algoritmos de aprendizaje automático con técnicas de selección de variables, a fin de lograr una clasificación, con cierto grado de exactitud, de diversas enfermedades del músculo cardíaco, basándonos en las mediciones obtenidas mediante dispositivos electrónicos. Los resultados experimentales mostraron que a través del algoritmo de Random Forest, se logra la clasificación de una persona enferma de una sana con casi 94% de exactitud, con selección de las variables más significativas mediante el algoritmo de RFE."trabajo final de especialización.listelement.badge Clasificación automática de imágenes de góndolas de supermercados(2020-06-16) Simone, Franco; Gambini, Juliana"El presente trabajo de investigación pretende crear un algoritmo de aprendizaje automático que permita realizar la clasificación automática de las imágenes de las góndolas de productos de los supermercados tomadas por los repositores de la compañía, identificando cuales góndolas fueron confeccionadas de acuerdo al planograma previamente establecido por el equipo de Trade Marketing y cuáles no."trabajo final de especialización.listelement.badge Clasificación de expresiones faciales en imágenes(2020-09-09) Markous, Pablo; Gambini, Juliana"El trabajo busca encontrar un método automático de clasificación para la expresión que representa el rostro en una imagen. Partiendo de un conjunto de imágenes que se asume que ya están correctamente clasificadas, para entrenar un modelo que pueda predecir cualquier imagen no clasificada. Se busca también poder medir la precisión obtenida en la clasificación. Para esto se subdivide en dos partes el conjunto de imágenes iniciales y se reserva una de las partes para que el modelo prediga el estado anímico de la persona que se encuentra en la foto. Finalmente se compara ese valor con el real y se estima un valor de precisión. Finalmente, se implementa el modelo en un ejemplo que clasifique imágenes en tiempo real."trabajo final de especialización.listelement.badge Desarrollo del modelo de Customer Lifetime Value (CLTV) para industria bancaria con técnicas de Machine Learning(2021) Martins, Nicolás Horacio; Pampliega, Juan Martín"Una gran cantidad de organizaciones de tamaño medio en adelante poseen sistemas de información que les permiten conocer la rentabilidad por cliente, o un valor aproximado de la misma. Algunas de ellas han avanzado, según la rama de la industria, en el desarrollo de modelos predictivos y de segmentación más profundos para entender la principalidad o participación de sus productos en la cartera de sus clientes (share of wallet)1, el nivel de lealtad y el grado de satisfacción de sus clientes. Otras, inclusive, han intentado calcular o predecir los ingresos futuros por cliente con mayor o menor nivel de sistematización. El foco de este trabajo se centra en el estudio y desarrollo de modelos para abordar esta última etapa analítica de la firma, conocida como valor del ciclo de vida de un cliente, customer lifetime value o CLTV (Borle et al 2008) en la industria financiera."trabajo final de especialización.listelement.badge Detección automática de anomalías en logs: una revisión visual del estado del arte(2022-10-05) Aboitiz, Txomin Martin; Aizemberg, Diego Ariel"Con el objetivo de elaborar una revisión visual del estado del arte de la detección automática de anomalías en logs, se recopilaron 20 trabajos (publicados entre 2009 y 2021) centrados en dicha línea de investigación. 17 de ellos son trabajos experimentales y 3 son revisiones. Los trabajos fueron procesados para extraer información descriptiva asociada a la publicación y el contenido. Se prestó particular atención a las categorías de aprendizaje y los modelos de aprendizaje automático entrenados en los trabajos para detectar anomalías. También se prestó atención a la interacción entre los trabajos, a través de las citas. Con la información extraída, se construyó una base de datos de 3 tablas describiendo los autores, los trabajos y sus interacciones. Con los datos, se construyó un notebook de visualizaciones en ObservableHQ. Estas son útiles para obtener una idea inicial de los países del mundo más involucrados en esta investigación, los trabajos más influyentes y los modelos de aprendizaje más utilizados. Dado que el tamaño muestral de trabajos utilizados aquí es pequeño, no se plantea que las tendencias observadas por las visualizaciones sean representativas de las tendencias reales. Sin embargo, con un mayor tamaño muestral, esta revisión visual podría ser útil para resumir información importante sobre el estado del arte de este tema, de manera que un lector no especializado pueda identificar rápidamente trabajos de interés para sus requerimientos específicos."trabajo final de especialización.listelement.badge Detección de actividad pesquera utilizando datos AIS con LightGBM(2022-07-22) Marcovecchio, Nicolás Agustín; Gambini, Juliana"El sistema AIS (Automatic Identification System) sirve para evitar colisiones a partir de que un buque transmite su posición a los demás. En la actualidad todavía hay buques pesqueros que no apagan sus sistemas al hacer pesca ilegal, y al ser un equipo el cual se configura manualmente muchos buques no se identifican como pesqueros o clonan la identificación de otro buque (Global Fishing Watch, Spoofing: One Identity Shared by Multiple Vessels, 2016). La actividad pesquera puede proporcionar a las autoridades, los investigadores y a los políticos información para tener una imagen más completa de la pesca y a la sostenibilidad de los recursos marinos. Lo que se busca en este trabajo es mejorar el estado actual para detectar esta actividad. Se utilizara el novedoso conjunto de datos, ya que muchos trabajos anteriores se los ve limitado en este aspecto, publicado por Global Fishing Watch (GFW) en el 2020. Este trabajo incluye el tratamiento para remover los datos faltantes y atípicos, resolver la granularidad temporal (los datos AIS en la realidad no se captan a intervalos constantes), la generación de un vector de características y el entrenamiento de un modelo óptimo de clasificación utilizando el método lightgbm (Microsoft Corporation, 2022) para comparar con lo alcanzado actualmente por GFW en (Kroodsma et al., 2018."trabajo final de especialización.listelement.badge Detección de fraudes en seguros de automóviles utilizando algoritmos de machine learning(2020) Fabbiano, Pablo Miguel; Denicolay, Gustavo"Pese a que el Fraude en Seguros se presenta en todos los ramos de la industria, se acota el presente trabajo al ramo Automotores. La información utilizada para modelar la solución y verificar los resultados del presente trabajo, es provista por una Compañía actual del Mercado Asegurador local que exige confidencialidad y anonimato. Los datos se mantendrán de forma no pública, siendo los mismos o cualquier inferencia que pudiera hacerse de ellos, estrictamente confidenciales. El trabajo está orientado a brindar una solución de bajo costo, pudiendo de esta forma ser la solución implementada por Aseguradoras pequeñas y medianas con bajos presupuestos. El prototipo se diseñará para ser ejecutado en equipos configurados al menos con 32 gigabytes de RAM, procesador I7, disco de 1 terabyte, similar a los existentes en estas Aseguradoras, es decir equipos estándar de bajo costo."trabajo final de especialización.listelement.badge Detección de operaciones durante la perforación de un pozo(2021-01) Lissauer, Cristian Federico; Gómez, Leticia Irene"Desarrollar una solución de software basada en ciencia de dato que permita sistematizar las actividades de las operaciones diarias en tiempo real que se realizan durante la perforación de un pozo de petróleo y gas."trabajo final de especialización.listelement.badge Engagement performance en campañas de marketing(2021) Montero, Nicolás Ezequiel; Arjones, Gustavo"El siguiente trabajo de investigación se aplica sobre el área de Marketing de una empresa que se dedica a la venta de servicios y productos informáticos. Esta área se encarga de generar campañas de Marketing, utilizando diferentes canales, para poder captar la mayor cantidad de clientes que se interesen en adquirir los productos o servicios promocionados. Los directivos de la empresa analizaron la performance de las diferentes campañas en los diferentes canales y detectaron que ciertas campañas no tenían el resultado esperado, con porcentajes muy bajos o nulos referentes al engagement de los clientes (midiéndose a través de dos métricas específicas: “Responses Creating Leads” y “Converted Leads From Lead Creating Responses”). Se busca analizar la performance actual de las campañas de marketing, entender las variables que entran en juego a la hora de obtener los resultados de engagement y abordando el problema a través del desarrollo de algoritmos de Machine Learning poder predecir si un cliente va a interesarse por los productos y servicios de la empresa. De esa manera se podrán obtener mejores resultados para las dos variables de engagement y por consecuencia generar más ganancias en la aplicación de cada campaña de Marketing. Esos algoritmos se van a validar y probar, verificando su nivel de efectividad para finalmente escoger aquel que sea el más certero."trabajo final de especialización.listelement.badge Estimación de la probabilidad de default metodologías alternativas(2020-07-03) Sangiácomo, Máximo; Gambini, Juliana; Mon, Alicia"Mejorar la capacidad de evaluación de deudores para las entidades financieras es importante por varias razones. Primero, permite reducir el riesgo de crédito y con ello mejorar la solvencia de los bancos que a su vez impacta la estabilidad financiera del sistema. Segundo, en la medida que puedan incorporarse nuevas dimensiones de análisis permitirá la evaluación de sectores no atendidos aumentando la inclusión financiera. Tercero, permite emparejar oportunidades para los bancos."trabajo final de especialización.listelement.badge Inteligencia artificial y aprendizaje automático para prevención de ataques DDoS en dispositivos IoT(2022-10) Echazú, Juan Rodrigo; Ramele, Rodrigo"Los dispositivos IoT son cada vez más comunes en nuestro día a día, y la implementación de redes 5G hará que esta tecnología crezca aún más. Cuantos más dispositivos haya conectados a la red más dependeremos de estos y más se nos complicará la vida cuando estos sistemas no estén disponibles. Por ejemplo, dispositivos con sensores que transmiten el estado de producción de una fábrica y según esos datos se realiza una acción determinada no puede dejar de funcionar porque se arruinará toda la cadena de producción o, aún más importante, dispositivos médicos que rastrean signos vitales y alertan al personal de salud sobre cualquier cambio importante deben estar disponibles las veinticuatro horas del día porque la vida de un paciente depende de ello. Es por esto, que este trabajo analiza técnicas de inteligencia artificial utilizadas para la prevención de ataques informáticos DDoS (Distributed Denial-of-Service) en dispositivos IoT que atentan contra la disponibilidad de los datos."trabajo final de especialización.listelement.badge Modelo de diagnóstico por imágenes de estudios endoscópicos capsulares(2019) Pando, Lucas Emiliano; Gambini, Juliana"En este trabajo se suscita una solución o modificación en el proceso del análisis de los estudios endoscópicos capsulares. Hoy en día el diagnóstico a través del estudio es realizado por un especialista que debe observar las imágenes o grabaciones obtenidas del estudio. Dicha tarea es extensa y monótona."trabajo final de especialización.listelement.badge Modelo predictivo de cancelación de donaciones en organizaciones sin fines de lucro: el caso de DonarOnline.org(2019) Aran, María Inés; Vaisman, Alejandro Ariel"La ciencia de datos y el big data se han desarrollado principalmente en el sector privado, donde se han implementado técnicas estadísticas y de machine learning que han permitido el aumento de los beneficios económicos y una mayor eficiencia en el uso de recursos en las empresas. El sector social en Argentina, conformado por organizaciones sin fines de lucro, puede beneficiarse con la aplicación de las nuevas tecnologías vinculadas a los datos de manera tal que también les permitan mejorar sus procesos internos y generar mayor impacto. En este sentido resulta relevante explorar la aplicaci´on de modelos de machine learning a problemáticas del sector social. Donaronline.org es una sociedad de la sociedad civil (OSC) de Argentina que presta servicio a otras OSC ayud´andolas a gestionar el cobro de donaciones en línea con tarjeta de crédito o débito. La recopilación sistemática de datos referidos a las donaciones recibidas y de las OSC beneficiarias permiten entrenar un modelo de machine learning para predecir la cancelación de donaciones. Un modelo que prediga la cancelación de donaciones permite a las organizaciones sin fines de lucro identificar a los donantes a los que dirigir campañas de retención de donaciones. Por otro lado, da visibilidad respecto de los aspectos que una organización sin fines de lucro debe tener en cuenta para disminuir el riesgo de perder donaciones."trabajo final de especialización.listelement.badge Modelos de regresión para la predicción de la probabilidad de colisión entre dos cuerpos orbitando alrededor de la Tierra en una trayectoria de encuentro(2022) Wenger, Esteban Federico; Riccillo, Marcela"El número de satélites y chatarra espacial orbitando alrededor de la Tierra ha crecido en las últimas décadas. La chatarra espacial además de ser un tipo de contaminación ambiental, es también un inconveniente para las empresas operadoras de satélites. La industria conocida como New Space también ha crecido en los últimos años. Los satélites de estas empresas realizan órbitas que eventualmente tienen eventos de conjunción o de encuentro con otros cuerpos, ya sean otros satélites o chatarra espacial. Por este motivo, existe un Ente de Monitoreo que se encarga de emitir reportes conocidos como Conjunction Data Messages (CDM) que le avisa a las empresas operadoras de satélites cuando uno de sus satélites se encuentra dentro de una trayectoria de colisión con otro objecto. Para evaluar un evento de conjunción es fundamental la probabilidad de colisión y la mínima distancia a la que se encontrarán los cuerpos en el momento conocido como TCA (time of closest approach). En este Trabajo de Investigación se propone aplicar Técnicas de Machine Learning para predecir una de estas variables, la cual es fundamental a la hora de tomar la decisión de si el riesgo de un evento de encuentro amerita realizar una maniobra o no. Este Trabajo encara el problema planteando un Modelo Lineal y luego se avanza con Modelos No Lineales de Árboles de Decisión. Se aplican técnicas de Modelos de Ensemble de Boosting con dos algoritmos AdaBoost y Light Gradient Boosting Machines. Para entrenar estos Modelos se aplica un ETL que resulta interesante para los reportes CDM en formato estándar y es extensible a otros Modelos que se deseen aplicar. Los resultados obtenidos permiten obtener conclusiones que son contundentes en cuanto a la utilización de Técnicas de Machine Learning para aportar valor a los datos, en este caso CDM, y para la evaluación de este tipo eventos de conjunción."trabajo final de especialización.listelement.badge Optimización de modelos predictivos para Series de Tiempo Jerárquicas (HTS)(2021-10-21) Woodley, Patricio Alex; Riccillo, Marcela"Las series de tiempo jerárquicas (HTS) son un subconjunto de series de tiempo que están contenidas dentro de una estructura o jerarquía. Esta estructura puede estar dada por características propias del producto/servicio, como su categoría, departamento, etc., o por una división geográfica, como por ejemplo ciudad, estado o país. Las técnicas clásicas como ARIMA o ETS no son óptimas para este tipo de conjunto de series, ya que la estructura puede aportar información valiosa que pasaría inadvertida o al menos no tan fácilmente identificable si modelamos las series de tiempo por separado. Debido a esto, se comparó el desempeño de Redes Neuronales LSTM, las cuales son ampliamente utilizadas para series de tiempo, y de técnicas específicas para series de tiempo jerárquicas como Bottom-Up y Reconciliación Óptima para predecir las ventas de departamentos dentro de tiendas de Walmart en EE.UU. Se analizaron en detalle 70 series de tiempo a nivel tienda-departamento y se demostró la eficacia de estas."trabajo final de especialización.listelement.badge Predictive Accuracy of Machine Learning Algorithms in Recommender Systems(2019) Dumón, Marcos; Gómez, Leticia IreneThis work presents a systematic literature review on the application of Machine Learning algorithms in the development of effective movie recommender systems. With the increasing popularity of movie recommender systems in the entertainment industry, selecting appropriate algorithms has become crucial for delivering personalized and accurate recommendations to users. Through an extensive literature search and rigorous methodology, this work identifies and analyzes commonly used Machine Learning algorithms for movie recommendation. The accuracy and performance of these algorithms are evaluated using established evaluation methods and metrics on movie datasets of different sizes. The evaluation takes into account factors such as prediction accuracy, scalability, and robustness. The comparative analysis provides valuable insights into the effectiveness of various Machine Learning algorithms in the context of movie recommendation. The findings contribute to the understanding of algorithmic performance, enabling researchers and practitioners to make informed decisions when developing movie recommender systems. Additionally, the work explores the impact of different hyperparameters and optimization techniques on algorithm performance. The results of this work aim to improve the quality of movie recommendations and enhance user satisfaction. By providing guidelines and recommendations for algorithm selection and optimization, this work contributes to the advancement of movie recommender systems and the overall movie-watching experience.