无名图书的logo
无名图书
  • 最近更新
  • 文学
  • 社会文化
  • 历史
  • 经济
  • 理工科
  • 政治
  • 健康
  • 自然科学
  • 计算机
  • 设计
  • 美食旅行
  • 思想
  • 生物
  • 建筑
  • 绘本
  • 天文
  • Easy RL:强化学习教程

    王琦, 杨毅远, 江季

    评分 8.5分

    强化学习作为机器学习及人工智能领域的一种重要方法,在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。 本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容,在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q 学习等传统强化学习算法,以及策略梯度、近端策略优化、深度Q 网络、