k-arm-Bandits问题可说是强化学习最简单的任务了,因为他只涉及了1个state下的action选取。通过本章可以对强化学习的目标,评估方法和训练方法有一个初步的认识。
Chapter01 Introduction
Posted on
希望能以更新博客的方式激励一下自己,目前是准备读一下强化学习的入门书《Reinforcement Learning Introduction》,然后做一下读书笔记。下面是绪论(Introduction)的内容。
Hello World
Posted on
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.