Ciencia de Datos
Permanent URI for this collection
Browse
Browsing Ciencia de Datos by Issue Date
Now showing 1 - 20 of 64
Results Per Page
Sort Options
trabajo final de especialización.listelement.badge Detección de tópicos: utilizando el modelo LDA(2018) Hammoe, Luciano; Arjones, Gustavo"El objetivo de este trabajo es lograr una herramienta que permita procesar grandes volúmenes de comentarios sobre una compañía en la red social Twitter y permita realizar lo que se llama “Topic Detection”, es decir, detectar cuáles son los temas o tópicos sobre lo que más se habla acerca de una compañía. Esto permite a dicha compañía entender de una manera simple qué concepto tienen los usuarios de la red social (sean o no clientes de la marca) sobre si misma, y sobre los productos / servicios de sus marcas. En función de estos tópicos, la empresa podrá adoptar estrategias de acuerdo a los objetivos que se quieran lograr."trabajo final de especialización.listelement.badge Aplicación de procesamiento de lenguaje natural en el marketing(2018) Pablo, Demián; Gambini, Juliana; Ramele, Rodrigo"Con este proyecto se busca avanzar en el análisis de técnicas publicitarias, superando las métricas “cotidianas”, y logrando de esta manera obtener nuevos datos que nutran a la agencia de publicidad en cuestión de nuevos insights (no alcanzados hasta el momento) que decanten en una ventaja competitiva respecto al resto de los participantes de la industria."trabajo final de especialización.listelement.badge Análisis de series de tiempo: pronóstico de demanda de uso de aeropuertos en Argentina al 2022(2018) López Sáez, José Ignacio; Gambini, Juliana"En la mayoría de los negocios, se desea ser capaz de estimar la demanda futura de un producto o servicio dado. El análisis sobre series temporales permite utilizar la información histórica para ofrecer un número aproximado de dicho valor, dentro de un rango de probabilidades determinado. Este estudio surge a partir de la necesidad que tiene el Ministerio de Transporte de la Nación de conocer el número de pasajeros que utilizarán cada aeropuerto del país en el futuro para poder asignar de una manera más eficiente los recursos disponibles y orientar inversiones. En este estudio se han evaluado en total 4 modelos de proyección de series de tiempo: suavizamiento exponencial (Holt-Winters), ARIMA, Prophet (desarrollado por Facebook) y redes neuronales (procedimientos de aprendizaje automático o machine learning), para las cuales se probaron tres implementaciones distintas en R. Se obtiene así el resultado de proyección de pasajeros domésticos e internacionales para cada una de estas seis implementaciones y para todos los aeropuertos de la Argentina para un horizonte de 5 años (60 meses a partir del último disponible), entregando también el error de ajuste de cada uno de los modelos."trabajo final de especialización.listelement.badge Análisis del sistema Ecobici en la Ciudad de Buenos Aires(2018) Calvo, Mario Daniel; Aizemberg, Diego Ariel"Los sistemas públicos de bicicletas se han extendido en todas las grandes ciudades el mundo. Buenos Aires ha desarrollado uno y en este estudio buscamos entender cuáles podrían ser los factores espaciales y ambientales, y el perfil de los usuarios qué expliquen el uso del sistema. Para ello se utilizaron datos provistos por el gobierno de CABA, respecto de los viajes realizados, y datos del clima. Se aplicaron métodos de minería de datos tales como: regresiones para identificar relaciones entra las variables y Kmeans, para clasificar datos. Los hallazgos más importantes fueron el efecto de la temperatura sobre el uso del sistema, y la identificación del grupo etario que más viajes realiza. La diferencia significativa entre el uso de los días de semana y los fines de semana, y su correspondencia con la hora del día. Estos hallazgos permitieron inferir que el uso en los días de semana se debe al traslado hacia el trabajo y/o centros de estudio. En tanto que el uso en los fines de semana se orienta a un uso recreativo."trabajo final de especialización.listelement.badge Utilización de redes neuronales convoluciones para la detección de tipos de imágenes(2018-09) Cicero, Ignacio Ezequiel; Parpaglione, María Cristinatrabajo final de especialización.listelement.badge Análisis de sentimientos: aplicación sobre textos en redes sociales(2019) Pedro, Diego Leonardo; Soliani, Valeria"Obtener tendencias de opinión pública sobre un producto de una empresa, mediante la implementación de técnicas de análisis de sentimientos sobre mensajes de clientes en redes sociales."trabajo final de especialización.listelement.badge Modelo predictivo de cancelación de donaciones en organizaciones sin fines de lucro: el caso de DonarOnline.org(2019) Aran, María Inés; Vaisman, Alejandro Ariel"La ciencia de datos y el big data se han desarrollado principalmente en el sector privado, donde se han implementado técnicas estadísticas y de machine learning que han permitido el aumento de los beneficios económicos y una mayor eficiencia en el uso de recursos en las empresas. El sector social en Argentina, conformado por organizaciones sin fines de lucro, puede beneficiarse con la aplicación de las nuevas tecnologías vinculadas a los datos de manera tal que también les permitan mejorar sus procesos internos y generar mayor impacto. En este sentido resulta relevante explorar la aplicaci´on de modelos de machine learning a problemáticas del sector social. Donaronline.org es una sociedad de la sociedad civil (OSC) de Argentina que presta servicio a otras OSC ayud´andolas a gestionar el cobro de donaciones en línea con tarjeta de crédito o débito. La recopilación sistemática de datos referidos a las donaciones recibidas y de las OSC beneficiarias permiten entrenar un modelo de machine learning para predecir la cancelación de donaciones. Un modelo que prediga la cancelación de donaciones permite a las organizaciones sin fines de lucro identificar a los donantes a los que dirigir campañas de retención de donaciones. Por otro lado, da visibilidad respecto de los aspectos que una organización sin fines de lucro debe tener en cuenta para disminuir el riesgo de perder donaciones."trabajo final de especialización.listelement.badge Modelo predictivo para disminución de la tasa de portabilidades numérica a través de redes sociales(2019) Hernández, Santiago Andrés; Riccillo, Marcela"El presente trabajo permite predecir los comentarios de los usuarios más propensos a realizar la portabilidad numérica en empresas de telefonía móvil. Para ello se utilizó como fuente de datos los Tuits de Movistar Argentina y con ellos se creó un modelo de predicción de SVM, con lo cual se obtuvo un accuracy del 0.7965 para la primera variable y del 0.8021 para la segunda variable. En el mismo podremos identificar cual es la disconformidad de aquellos usuarios que tiene intención de cambiar de compañía. Esta información nos permitirá segmentar las campañas de retención de los clientes y poder cubrir las necesidades del mismo sin que lleguen a tomar esa decisión."trabajo final de especialización.listelement.badge Predictive Accuracy of Machine Learning Algorithms in Recommender Systems(2019) Dumón, Marcos; Gómez, Leticia IreneThis work presents a systematic literature review on the application of Machine Learning algorithms in the development of effective movie recommender systems. With the increasing popularity of movie recommender systems in the entertainment industry, selecting appropriate algorithms has become crucial for delivering personalized and accurate recommendations to users. Through an extensive literature search and rigorous methodology, this work identifies and analyzes commonly used Machine Learning algorithms for movie recommendation. The accuracy and performance of these algorithms are evaluated using established evaluation methods and metrics on movie datasets of different sizes. The evaluation takes into account factors such as prediction accuracy, scalability, and robustness. The comparative analysis provides valuable insights into the effectiveness of various Machine Learning algorithms in the context of movie recommendation. The findings contribute to the understanding of algorithmic performance, enabling researchers and practitioners to make informed decisions when developing movie recommender systems. Additionally, the work explores the impact of different hyperparameters and optimization techniques on algorithm performance. The results of this work aim to improve the quality of movie recommendations and enhance user satisfaction. By providing guidelines and recommendations for algorithm selection and optimization, this work contributes to the advancement of movie recommender systems and the overall movie-watching experience.trabajo final de especialización.listelement.badge Uso de modelado predictivo y tecnologías de Internet de las cosas (IoT) en la enseñanza y aprendizaje del Hockey sobre césped(2019) Boaglio, Marcos; Gambini, Juliana"En este trabajo se propone aplicar el uso de la tecnología al hockey sobre césped para sentar las bases para una mejor y más fácil educación y entrenamiento del deporte. En el camino se propone contribuir a la creación de un conjunto de datos de determinados gestos técnicos que luego serán usados para crear modelos que los describan."trabajo final de especialización.listelement.badge Aplicación de aprendizaje supervisado para clasificación de tiempos no productivos de perforación & workover(2019) Arca, Fabio Andrés; Soliani, Valeria"La información de la base de datos de perforación & workover describe la actividad operativa que se realiza en los eventos de perforar, completar, reparar y mantener los pozos de gas y petróleo. Durante el desarrollo de las actividades descriptas previamente los Tiempos No Productivos de las operaciones son clasificadas en seis clases predefinidas. Con posterioridad, al leer las descripciones que acompañan a la clasificación realizada, se presentan dudas sobre su correcta asignación. En este trabajo se utilizan técnicas de aprendizaje supervisado para clasificar los Tiempos No productivos, determinando aquellos casos en los cuales existen diferencias con la clasificación originalmente asignada. Los no coincidentes deben ser enviados para su revisión con la finalidad de mejorar la calidad de información con la cual se toman decisiones. En una primera aproximación se implementa un algoritmo clasificador base y, para mejorar los resultados obtenidos, se genera un clasificador de múltiples algoritmos incorporado otros campos de información existente. Como resultado se obtiene una precisión general del 86%. En particular las precisiones obtenidas para las clases son del 98%, 90%, 88%, 83%, 75% y 74%."trabajo final de especialización.listelement.badge Aplicación de técnicas de minería en el proceso de cobranza(2019) Comunello de Sá, Fellippe; Gómez, Leticia Irene"La cobranza es un importante servicio prestado por las empresas que maneja a los clientes morosos. Es un proceso estratégico y clave para generar valor a un rango de clientes y el camino inicial para alguna posible recuperación judicial. Cobranzas es un área dentro de una organización cuyo objetivo es convertir posibles pérdidas en posibles ingresos, utilizando el contacto como herramienta para avisar o revisar la “necesidad” de cumplimento de su obligación o deuda. En el proceso de gestión existen varias formas y tácticas para alcanzar el contacto con el cliente, tales como: cartas, llamadas telefónicas, mensajes al celular o presencial. El método más difundido y donde se presenta una mejor respuesta es vía telefónica, donde un cobrador, pudiendo ser un empleado/a de la empresa o un tercer agente, habla con el cliente intentando dar soporte y medios para la cancelación de la deuda. Junto con esa interacción se toman notas del contacto para posibles interacciones futuras. Las grandes empresas, usando bancos como base principal de referencia, necesitan de grandes áreas de cobranza para atender un variado público de clientes. Cuentan con un proceso bastante interactivo para llegar al cliente, siendo soportados por sistemas de llamadas automáticas para una mayor performance. Esos sistemas son esenciales, ya que el volumen de llamadas necesarias para intentar entrar en contacto con todos los clientes de la cartera es muy alto y sería imposible hacerlo manualmente. Cobranzas es un módulo esencial para mantener la integridad del ciclo del negocio/Crédito, siendo el puente para el mantenimiento de clientes existentes y futuros."trabajo final de especialización.listelement.badge Predicción de pacientes con enfermedades reumáticas en México(2019) Roberts, Karen Natalí; Peláez, Ingris; Ramele, Rodrigo"(...) el propósito del presente estudio es caracterizar a los individuos con enfermedades reumáticas y poder predecir de manera automática si un individuo está en presencia de enfermedades músculo-esqueléticas a partir del llenado del formulario para la detección temprana y remitirle al especialista para el tratamiento, de esta manera se puede prevenir discapacidad secundaria a estas enfermedades."trabajo final de especialización.listelement.badge ¿De qué se habla cuando se habla de cerveza?(2019) Zenone, Pedro Octavio; Arjones, Gustavo"La necesidad de generación e impacto de contenido personalizado es un requerimiento en auge que las marcas comienzan a exigir a las agencias de marketing. Esto quiere decir que cada persona contactable será impactada con un mensaje personalizado con el cual se sienta identificada. Existen diversas formas de generar audiencias que permitan segmentar a los usuarios en función de sus gustos o hábitos, pero estas dependen de la concepción de los datos: clicks en un sitio, items comprados o comentarios en redes sociales. Para este caso de estudio se analizarán los comentarios de las redes sociales con palabras vinculadas directamente a la cerveza, ya que el cliente en cuestión es una cervecera. Con el fin de entender cuáles son los tópicos más relevantes se realizará una escucha en Twitter e Instagram, obteniendo comentarios, posteos y retweets relativos a la temática. Debido al volumen generado resulta inviable la lectura del contenido por personas, por eso aplicaremos técnicas de clustering que entiendan el lenguaje natural (NLU), agrupando de forma automática las palabras en conceptos."trabajo final de especialización.listelement.badge Análisis de la utilización de taxis en la ciudad de Buenos Aires(2019) Pugliese, Franco; Aizemberg, Diego Ariel"Con el proyecto Uber Movement las ciudades del mundo pueden obtener información necesaria que les permita identificar puntos neurálgicos donde adaptar sus infraestructuras con objetivo de llevar a cabo una optimización del flujo de tráfico. En la Ciudad de Buenos Aires, la aplicación BA Taxi brinda similar plataforma a la de Uber. El Gobierno entrega el dataset a usuarios finales, se procede a realizar inicialmente un análisis descriptivo y se generan nuevas variables a partir de las otorgadas. Finalmente se analiza la existencia de combinación de variables tal que se prediga viajes de mala calidad, es decir, viajes en donde no se presente una correlación directa entre tiempo insumido y distancia recorrida. Luego de la clara detección de ciertos patrones clave para la identificación de viajes malos, se considerará la investigación como piedra angular para futuros estudios incluyendo nuevos conjuntos de datos cómo ser: meteorología, obras viales o protestas."trabajo final de especialización.listelement.badge Modelo de diagnóstico por imágenes de estudios endoscópicos capsulares(2019) Pando, Lucas Emiliano; Gambini, Juliana"En este trabajo se suscita una solución o modificación en el proceso del análisis de los estudios endoscópicos capsulares. Hoy en día el diagnóstico a través del estudio es realizado por un especialista que debe observar las imágenes o grabaciones obtenidas del estudio. Dicha tarea es extensa y monótona."trabajo final de especialización.listelement.badge Propensión a adquirir plazos fijos en un banco tradicional(2019) Sprio, Agustina Beatriz; Denicolay, Gustavo"El producto plazo fijo es un depósito que los bancos o instituciones financieras ofrecen con una tasa de interés previamente acordada, la cual va a ser cobrada por cliente junto con el dinero involucrado en el depósito en un determinado período de tiempo. Cada entidad bancaria conoce diversa información acerca de sus clientes, alguna relacionada a características inherentes a él como en dónde vive, qué medios de contacto posee y a qué se dedica. Además, conoce la relacionada a sus transacciones, a sus operaciones en el sistema financiero, a productos asociados, a sus reclamos realizados, entre otras. Toda esta información compone la historia de los clientes, la cual será analizada tanto en clientes que aún no poseen el producto plazo fijo, como en los que ya lo adquirieron para aprender de su comportamiento y predecir la propensión que poseen a adquirir el producto."trabajo final de especialización.listelement.badge Panel para la gestión ambiental de tanques aéreos de almacenamiento de hidrocarburos y sus derivados(2019-05-07) García, Fernando; Aizemberg, Diego Ariel"(...) se propone la utilización de herramientas de visualización de información para desarrollar un sistema de gestión ambiental para el control de pérdidas de tanques aéreos de almacenamiento de hidrocarburos y sus derivados. Con la finalidad de cumplir con los requerimientos legales de la Resolución 785/2005 y ofrecer una herramienta para continuar con el cuidado del medio ambiente y la salud de la población."trabajo final de especialización.listelement.badge Estimación de tiempos de espera en peajes(2019-08-16) Ailán, Julián; Gambini, Juliana"En el presente trabajo práctico final se aborda el estudio del estado del tránsito en autopistas concesionadas a Autopistas Urbanas Sociedad Anónima (AUSA),en la Ciudad Autónoma de Buenos Aires haciendo énfasis en el caudal vehicular que transita a través de los peajes ubicados en estas autopistas."trabajo final de especialización.listelement.badge Inventario vial georreferenciado(2020) Arequipa, Patricia Noemí; Aizemberg, Diego ArielEl presente trabajo tiene como objetivo general "generar un algoritmo práctico que permita vincular y ajustar lo mejor posible los puntos de inventario a puntos georreferenciados, obteniendo así las coordenadas geográficas de cada punto que describe a las rutas, esto permitirá mapear el inventario vial y compartir el mismo de manera oficial."