Aprendizaje por refuerzo con opciones y función de refuerzo universal

Bruno Cilla, Diego; Heimann, Matías; Scaglioni, Giuliano

proyecto final de grado.page.titleprefix
Aprendizaje por refuerzo con opciones y función de refuerzo universal

Files

Proyecto_Final_Bruno.pdf (955.54 KB)

Date

2020-12

Authors

Bruno Cilla, Diego

Heimann, Matías

Scaglioni, Giuliano

Abstract

"El objetivo de los algoritmos de aprendizaje por refuerzo es maximizar las recompensas acumuladas a lo largo del tiempo para hallar un comportamiento objetivo. De esta forma, para aprender distintos comportamientos, la variable a cambiar sería la función de refuerzo dada para ese problema. El objetivo de este trabajo es explorar una alternativa en la cual se puedan adquirir distintos comportamientos, manteniendo siempre la misma función de refuerzo, siendo que la variable sea los distintos entornos en los que se realiza el aprendizaje."

Keywords

APRENDIZAJE POR REFUERZO, APRENDIZAJE AUTOMATICO, ALGORITMOS

URI

http://ri.itba.edu.ar/handle/123456789/3385

Collections

Proyectos finales (grado)

Full item page

proyecto final de grado.page.titleprefix
Aprendizaje por refuerzo con opciones y función de refuerzo universal

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

proyecto final de grado.page.titleprefix Aprendizaje por refuerzo con opciones y función de refuerzo universal

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

proyecto final de grado.page.titleprefix
Aprendizaje por refuerzo con opciones y función de refuerzo universal