Statistics for Aprendizaje por refuerzo con opciones y función de refuerzo universal