proyecto final de grado.page.titleprefix
Interpolación de Frames de Video

dc.contributor.advisorPerez Sammartino, Francisco
dc.contributor.authorCastagnino, Salvador
dc.contributor.authorBirsa, Nicolás
dc.contributor.authorYe Li, Valentín
dc.date.accessioned2025-05-22T14:04:49Z
dc.date.available2025-05-22T14:04:49Z
dc.date.issued2025-04
dc.description.abstractEn los ultimos años, la demanda por experiencias de visualización en alta calidad ha incrementado significativamente, impulsando la adopción de resoluciones 4K y tasas de reproducción superiores a 60Hz. Sin embargo, la obtención de videos nativos con estas características es costosa en términos computacionales y de hardware, lo que limita su disponibilidad en dispositivos con recursos restringidos, como cámaras IoT o sistemas embebidos. Para abordar esta problemática, en este trabajo se propone una arquitectura hıbrida para interpolación de fotogramas ( ́ Video Frame Interpolation, VFI) que permite aumentar la tasa de cuadros por segundo de manera eficiente. Actualmente, los modelos existentes no suelen ser de propósito general, ya que están diseñados para priorizar la velocidad de inferencia, como las redes neuronales convolucionales (CNN), o maximizar la calidad del video interpolado, como los modelos basados en Transformers. En este contexto, se plantea una solución que combina RIFE, un modelo basado en CNN optimizado para el cálculo rápido del flujo óptico, y EMA-VFI, un modelo basado en Transformers que captura dependencias de largo alcance en las secuencias de video. La arquitectura incorpora un modulo de decisión dinámico que selecciona el modelo más adecuado en función de las características del contenido, optimizando el balance entre calidad visual y tiempo de procesamiento. Los experimentos realizados evalúan el desempeño del modelo propuesto mediante métricas estándar como PSNR, SSIM, LPIPS y FloLPIPS, evidenciando que la combinación adaptativa de CNN y Transformers permite alcanzar un equilibrio entre velocidad y calidad en la interpolación de fotogramas. Esto sugiere que la arquitectura presentada es una alternativa viable para mejorar la tasa de cuadros por segundo en aplicaciones como compresión de video, restauración y generación de contenido de alta fluidez visual.
dc.identifier.urihttps://ri.itba.edu.ar/handle/123456789/4958
dc.language.isoes
dc.subjectINTERPOLACIÓN DE VIDEO
dc.subjectREDES NEURONALES CONVULCIONALES
dc.subjectTRANSFORMES
dc.titleInterpolación de Frames de Video
dc.typeProyecto final de Grado
dspace.entity.typeProyecto final de Grado
itba.description.filiationFil: Castagnino, Salvador. Instituto Tecnológico de Buenos Aires, Argentina.
itba.description.filiationFil: Birsa, Nicolás. Instituto Tecnológico de Buenos Aires, Argentina.
itba.description.filiationFil: Ye Li, Valentín. Instituto Tecnológico de Buenos Aires, Argentina.
itba.infoadministradorCRC
itba.infoclasificacionPública
itba.infocustodioDirector CRC
itba.infodisponibilidadDisponibilidad-N1
itba.infointegridadIntegridad-N1
itba.infoperdidaTipo 2-PBA1
itba.infopropietarioRectorado
itba.inforesponsableRectorado
itba.infoutilidadTipo 6-USa6

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
INFORME_FINAL (1).pdf
Size:
22.06 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: