Artículos con etiqueta «mdp»
Reinforcement Learning (Aprendizaje por refuerzo): Q-Learning (parte 3)
Ya hemos visto en posts anteriores qué es al aprendizaje por refuerzo y como podemos modelar los problemas de este tipo con un MDP. Ahora veremos varias técnicas para calcular la función valor de cada estado y, con esta información, mejorar la política.