Ciencia de Datos
Permanent URI for this collection
Browse
Browsing Ciencia de Datos by Title
Now showing 1 - 20 of 64
Results Per Page
Sort Options
trabajo final de especialización.listelement.badge Análisis de características de escucha de canciones para un usuario en una plataforma de streaming de música mediante métodos de aprendizaje automático no supervisado(2021-11) Seguí, Francisco; Gómez, Leticia Irene"El presente trabajo tiene por objetivo proveerle a un usuario una clasificación de las canciones que escucha, de acuerdo a sus características musicales, aplicando métodos de aprendizaje automático no supervisado a plataformas de streaming de música."trabajo final de especialización.listelement.badge Análisis de la utilización de taxis en la ciudad de Buenos Aires(2019) Pugliese, Franco; Aizemberg, Diego Ariel"Con el proyecto Uber Movement las ciudades del mundo pueden obtener información necesaria que les permita identificar puntos neurálgicos donde adaptar sus infraestructuras con objetivo de llevar a cabo una optimización del flujo de tráfico. En la Ciudad de Buenos Aires, la aplicación BA Taxi brinda similar plataforma a la de Uber. El Gobierno entrega el dataset a usuarios finales, se procede a realizar inicialmente un análisis descriptivo y se generan nuevas variables a partir de las otorgadas. Finalmente se analiza la existencia de combinación de variables tal que se prediga viajes de mala calidad, es decir, viajes en donde no se presente una correlación directa entre tiempo insumido y distancia recorrida. Luego de la clara detección de ciertos patrones clave para la identificación de viajes malos, se considerará la investigación como piedra angular para futuros estudios incluyendo nuevos conjuntos de datos cómo ser: meteorología, obras viales o protestas."trabajo final de especialización.listelement.badge Análisis de sentimientos: aplicación sobre textos en redes sociales(2019) Pedro, Diego Leonardo; Soliani, Valeria"Obtener tendencias de opinión pública sobre un producto de una empresa, mediante la implementación de técnicas de análisis de sentimientos sobre mensajes de clientes en redes sociales."trabajo final de especialización.listelement.badge Análisis de series de tiempo: pronóstico de demanda de uso de aeropuertos en Argentina al 2022(2018) López Sáez, José Ignacio; Gambini, Juliana"En la mayoría de los negocios, se desea ser capaz de estimar la demanda futura de un producto o servicio dado. El análisis sobre series temporales permite utilizar la información histórica para ofrecer un número aproximado de dicho valor, dentro de un rango de probabilidades determinado. Este estudio surge a partir de la necesidad que tiene el Ministerio de Transporte de la Nación de conocer el número de pasajeros que utilizarán cada aeropuerto del país en el futuro para poder asignar de una manera más eficiente los recursos disponibles y orientar inversiones. En este estudio se han evaluado en total 4 modelos de proyección de series de tiempo: suavizamiento exponencial (Holt-Winters), ARIMA, Prophet (desarrollado por Facebook) y redes neuronales (procedimientos de aprendizaje automático o machine learning), para las cuales se probaron tres implementaciones distintas en R. Se obtiene así el resultado de proyección de pasajeros domésticos e internacionales para cada una de estas seis implementaciones y para todos los aeropuertos de la Argentina para un horizonte de 5 años (60 meses a partir del último disponible), entregando también el error de ajuste de cada uno de los modelos."trabajo final de especialización.listelement.badge Análisis del impacto del tipo y ubicación de los locales comerciales de un centro o corredor comercial abierto en la probabilidad de vacancia de los mismos, mediante herramientas de visualización, análisis de información geoespacial y algoritmos de aprendizaje supervisado(2020-05-27) Sanguinetti, Diego; Aizemberg, Diego Ariel"Desarrollar una herramienta que permita visualizar distintos segmentos o grupos de locales entre los que conforman un centro o corredor comercial abierto de la ciudad según el nivel de riesgo de vacancia de los mismos, a partir del entendimiento de distintas variables que caractericen a los locales y puedan afectar su vacancia, mejorando/facilitando así las decisiones de compra y venta de locales comerciales por parte de los inversores."trabajo final de especialización.listelement.badge Análisis del sistema Ecobici en la Ciudad de Buenos Aires(2018) Calvo, Mario Daniel; Aizemberg, Diego Ariel"Los sistemas públicos de bicicletas se han extendido en todas las grandes ciudades el mundo. Buenos Aires ha desarrollado uno y en este estudio buscamos entender cuáles podrían ser los factores espaciales y ambientales, y el perfil de los usuarios qué expliquen el uso del sistema. Para ello se utilizaron datos provistos por el gobierno de CABA, respecto de los viajes realizados, y datos del clima. Se aplicaron métodos de minería de datos tales como: regresiones para identificar relaciones entra las variables y Kmeans, para clasificar datos. Los hallazgos más importantes fueron el efecto de la temperatura sobre el uso del sistema, y la identificación del grupo etario que más viajes realiza. La diferencia significativa entre el uso de los días de semana y los fines de semana, y su correspondencia con la hora del día. Estos hallazgos permitieron inferir que el uso en los días de semana se debe al traslado hacia el trabajo y/o centros de estudio. En tanto que el uso en los fines de semana se orienta a un uso recreativo."trabajo final de especialización.listelement.badge Analysis and benchmarking for gravitational waves spectrogram’s classification by usage of machine learning techniques(2020-09-06) Martínez, Ezequiel H.; Ramele, Rodrigo"Gravitatonal waves, the seed of the 2015 Nobel’s prize are the cause of several complex celestial phenomena that is non-observable for the naked eye. Their identification, classification and study is s(ll a handmade work which is s(ll nascent. There has been several approaches to produce novel tools to aid the scientists behind the discovery of these deep space events. One of the most thrilling examples has been the usage of artificial intelligence classification to aid in the preiden identification of certain signals. We took one of these tools, Gravity Spy, and study its base paper, trying to reproduce some of their classification results using the very same base dataset. This research aims to compare the results obtained from the original paper, with a binary classification approach and several different algorithms taken from the knowledge base of machine learning and deep learning, alike. We confirmed the original paper results and obtained a new approach for the same solution. In this study we trained several models that could be used for further development of an eventual alternative engines for gravita(onal waves signal’s classification or any other sort of signal heavily influenced by noise and analysed by spectrograms."trabajo final de especialización.listelement.badge Aplicación de aprendizaje supervisado para clasificación de tiempos no productivos de perforación & workover(2019) Arca, Fabio Andrés; Soliani, Valeria"La información de la base de datos de perforación & workover describe la actividad operativa que se realiza en los eventos de perforar, completar, reparar y mantener los pozos de gas y petróleo. Durante el desarrollo de las actividades descriptas previamente los Tiempos No Productivos de las operaciones son clasificadas en seis clases predefinidas. Con posterioridad, al leer las descripciones que acompañan a la clasificación realizada, se presentan dudas sobre su correcta asignación. En este trabajo se utilizan técnicas de aprendizaje supervisado para clasificar los Tiempos No productivos, determinando aquellos casos en los cuales existen diferencias con la clasificación originalmente asignada. Los no coincidentes deben ser enviados para su revisión con la finalidad de mejorar la calidad de información con la cual se toman decisiones. En una primera aproximación se implementa un algoritmo clasificador base y, para mejorar los resultados obtenidos, se genera un clasificador de múltiples algoritmos incorporado otros campos de información existente. Como resultado se obtiene una precisión general del 86%. En particular las precisiones obtenidas para las clases son del 98%, 90%, 88%, 83%, 75% y 74%."trabajo final de especialización.listelement.badge Aplicación de procesamiento de lenguaje natural en el marketing(2018) Pablo, Demián; Gambini, Juliana; Ramele, Rodrigo"Con este proyecto se busca avanzar en el análisis de técnicas publicitarias, superando las métricas “cotidianas”, y logrando de esta manera obtener nuevos datos que nutran a la agencia de publicidad en cuestión de nuevos insights (no alcanzados hasta el momento) que decanten en una ventaja competitiva respecto al resto de los participantes de la industria."trabajo final de especialización.listelement.badge Aplicación de técnicas de minería en el proceso de cobranza(2019) Comunello de Sá, Fellippe; Gómez, Leticia Irene"La cobranza es un importante servicio prestado por las empresas que maneja a los clientes morosos. Es un proceso estratégico y clave para generar valor a un rango de clientes y el camino inicial para alguna posible recuperación judicial. Cobranzas es un área dentro de una organización cuyo objetivo es convertir posibles pérdidas en posibles ingresos, utilizando el contacto como herramienta para avisar o revisar la “necesidad” de cumplimento de su obligación o deuda. En el proceso de gestión existen varias formas y tácticas para alcanzar el contacto con el cliente, tales como: cartas, llamadas telefónicas, mensajes al celular o presencial. El método más difundido y donde se presenta una mejor respuesta es vía telefónica, donde un cobrador, pudiendo ser un empleado/a de la empresa o un tercer agente, habla con el cliente intentando dar soporte y medios para la cancelación de la deuda. Junto con esa interacción se toman notas del contacto para posibles interacciones futuras. Las grandes empresas, usando bancos como base principal de referencia, necesitan de grandes áreas de cobranza para atender un variado público de clientes. Cuentan con un proceso bastante interactivo para llegar al cliente, siendo soportados por sistemas de llamadas automáticas para una mayor performance. Esos sistemas son esenciales, ya que el volumen de llamadas necesarias para intentar entrar en contacto con todos los clientes de la cartera es muy alto y sería imposible hacerlo manualmente. Cobranzas es un módulo esencial para mantener la integridad del ciclo del negocio/Crédito, siendo el puente para el mantenimiento de clientes existentes y futuros."trabajo final de especialización.listelement.badge Calidad de datos y aprendizaje automático: detección de errores semánticos en datos estructurados con esquema desconocido(2021-11) Lentini, Alejandro Daniel; Soliani, Valeria"El presente trabajo tiene como objetivo general evaluar si técnicas del aprendizaje automático provenientes del área del procesamiento natural del lenguaje pueden tener aplicación práctica en la detección semiautomática de errores semánticos en datos estructurados multivariados con calidad y esquema de datos desconocidos, ofreciendo lineamientos para el desarrollo de herramientas que asistan a los usuarios en estas tareas."trabajo final de especialización.listelement.badge Categorización y análisis de la frecuencia cardíaca de un individuo con inteligencia artificial(2020) Goldman, Jorge Carlos; Riccillo, Marcela"Este estudio presenta un enfoque novedoso en la aplicación de técnicas de aprendizaje automático para la clasificación de enfermedades del músculo cardíaco. Una detección temprana de arritmias aumenta considerablemente la posibilidad de corrección y sobrevida de los pacientes mediante medicación adecuada indicada por un profesional de la salud. En el siguiente trabajo se evaluarán diversos algoritmos de aprendizaje automático con técnicas de selección de variables, a fin de lograr una clasificación, con cierto grado de exactitud, de diversas enfermedades del músculo cardíaco, basándonos en las mediciones obtenidas mediante dispositivos electrónicos. Los resultados experimentales mostraron que a través del algoritmo de Random Forest, se logra la clasificación de una persona enferma de una sana con casi 94% de exactitud, con selección de las variables más significativas mediante el algoritmo de RFE."trabajo final de especialización.listelement.badge Clasificación automática de imágenes de góndolas de supermercados(2020-06-16) Simone, Franco; Gambini, Juliana"El presente trabajo de investigación pretende crear un algoritmo de aprendizaje automático que permita realizar la clasificación automática de las imágenes de las góndolas de productos de los supermercados tomadas por los repositores de la compañía, identificando cuales góndolas fueron confeccionadas de acuerdo al planograma previamente establecido por el equipo de Trade Marketing y cuáles no."trabajo final de especialización.listelement.badge Clasificación de clientes por umbral superior de ingresos(2022-06) Aguilera, Sebastián; Gómez, Leticia Irene"El presente trabajo tiene por objetivo proveer de nuevas herramientas al análisis de datos en el proceso de toma de decisiones concerniente a la banca comercial minorista. La propuesta está relacionada con la realización de un análisis que contenga el resultante de distintos modelos predictivos aplicados un set de datos provistos por la entidad, y una etiqueta generada por (la variable a regresar)."trabajo final de especialización.listelement.badge Clasificación de expresiones faciales en imágenes(2020-09-09) Markous, Pablo; Gambini, Juliana"El trabajo busca encontrar un método automático de clasificación para la expresión que representa el rostro en una imagen. Partiendo de un conjunto de imágenes que se asume que ya están correctamente clasificadas, para entrenar un modelo que pueda predecir cualquier imagen no clasificada. Se busca también poder medir la precisión obtenida en la clasificación. Para esto se subdivide en dos partes el conjunto de imágenes iniciales y se reserva una de las partes para que el modelo prediga el estado anímico de la persona que se encuentra en la foto. Finalmente se compara ese valor con el real y se estima un valor de precisión. Finalmente, se implementa el modelo en un ejemplo que clasifique imágenes en tiempo real."trabajo final de especialización.listelement.badge Comercialización interna de granos(2020-08-19) Gianatiempo, Juan Pablo; Aizemberg, Diego Ariel"Cada año, en la Argentina circulan aproximadamente 120 millones de toneladas de granos. No obstante, pese a la preponderancia del sector dentro de la economía argentina, existe un desconocimiento del comportamiento de la comercialización interna de los granos. Si bien existen numerosos supuestos y teorías, aún no se han realizado estudios que incorporen los nuevos datos disponibles del sector. El presente trabajo tiene como objetivo dar una solución superadora y moderna mediante la generación de una herramienta que permita visualizar y analizar el comportamiento histórico de la comercialización interna de granos desde inicios del 2015 hasta el último día del 2019."trabajo final de especialización.listelement.badge Comparación de modelos para el análisis de sentimiento: utilizando redes neuronales LSTM y Word Embeddings pre-entrenados(2021) Poch, Gonzalo Julián; Riccillo, Marcela"En el presente trabajo se estudia la aplicación de la técnica de análisis de sentimiento sobre un conjunto de datos extraído de la red social Twitter, donde los usuarios realizan publicaciones de textos cortos, generalmente sobre temáticas actuales en tiempo real."trabajo final de especialización.listelement.badge ¿De qué se habla cuando se habla de cerveza?(2019) Zenone, Pedro Octavio; Arjones, Gustavo"La necesidad de generación e impacto de contenido personalizado es un requerimiento en auge que las marcas comienzan a exigir a las agencias de marketing. Esto quiere decir que cada persona contactable será impactada con un mensaje personalizado con el cual se sienta identificada. Existen diversas formas de generar audiencias que permitan segmentar a los usuarios en función de sus gustos o hábitos, pero estas dependen de la concepción de los datos: clicks en un sitio, items comprados o comentarios en redes sociales. Para este caso de estudio se analizarán los comentarios de las redes sociales con palabras vinculadas directamente a la cerveza, ya que el cliente en cuestión es una cervecera. Con el fin de entender cuáles son los tópicos más relevantes se realizará una escucha en Twitter e Instagram, obteniendo comentarios, posteos y retweets relativos a la temática. Debido al volumen generado resulta inviable la lectura del contenido por personas, por eso aplicaremos técnicas de clustering que entiendan el lenguaje natural (NLU), agrupando de forma automática las palabras en conceptos."trabajo final de especialización.listelement.badge Desarrollo del modelo de Customer Lifetime Value (CLTV) para industria bancaria con técnicas de Machine Learning(2021) Martins, Nicolás Horacio; Pampliega, Juan Martín"Una gran cantidad de organizaciones de tamaño medio en adelante poseen sistemas de información que les permiten conocer la rentabilidad por cliente, o un valor aproximado de la misma. Algunas de ellas han avanzado, según la rama de la industria, en el desarrollo de modelos predictivos y de segmentación más profundos para entender la principalidad o participación de sus productos en la cartera de sus clientes (share of wallet)1, el nivel de lealtad y el grado de satisfacción de sus clientes. Otras, inclusive, han intentado calcular o predecir los ingresos futuros por cliente con mayor o menor nivel de sistematización. El foco de este trabajo se centra en el estudio y desarrollo de modelos para abordar esta última etapa analítica de la firma, conocida como valor del ciclo de vida de un cliente, customer lifetime value o CLTV (Borle et al 2008) en la industria financiera."trabajo final de especialización.listelement.badge Desarrollo del sistema de recomendación para una empresa de e-commerce(2021-12) Vicente, Eduardo Ignacio; Pampliega, Juan MartínEl presente trabajo tiene como objetivo "desarrollar un modelo de segmentación de clientes que, combinado con un modelo predictivo, permita detectar los productos que es más probable que quieran adquirir a futuro y así poder personalizar la oferta."