• Transfer learning for actor-critic methods in Lipschitz Markov decision processes 

      Vacca Manrique, Daniel Felipe (Pontificia Universidad Javeriana, Facultad de Ingeniería, Ingeniería de Sistemas, 2017)
      Aprendizaje por Refuerzo es un paradigma para diseñar agentes artificiales cuando el conocimiento viene exclusivamente de interacción con un ambiente. Dificultades surgen cuando los espacios de estados y acciones son ...