强化学习标签下的电子书

边做边学深度强化学习：PyTorch程序设计实践

[日] 小川雄太郎（Yutaro ogawa）

评分 7.0分

揭秘深度强化学习

彭伟

评分 4.0分

深度强化学习（Deep Reinforcement Learning，DRL）是深度学习算法和强化学习算法的巧妙结合，它是一种新兴的通用人工智能算法技术，也是机器学习的前沿技术，DRL 算法潜力无限，AlphaGo 是目前该算法*成功的使用案例。DRL 算法以马尔科夫决策过程为基础，是在深度学习强大的非线性函数的拟合能力下构成的一种增强算法。深度强化学习算法主要包括基于动态规划（DP）的算法以及基

强化学习/智能科学与技术丛书

Marco Wiering, Martijn van Otterlo

评分 4.3分

本书共有19章，分为六大部分，详细介绍了强化学习中各领域的基本理论和新进展，内容包括：MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的小二乘法、迁移学习、贝叶斯强化学习、、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观察MDP、博弈论和多学习器强化学习等内容，并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用，后提出未来发

GAN：实战生成对抗网络

评分 4.7分

《GAN：实战生成对抗网络》介绍深度学习领域一个十分活跃的分支——生成对抗网络（GAN）。《GAN：实战生成对抗网络》中覆盖了深度学习的基础、对抗网络背后的原理以及构建方式等内容。同时《GAN：实战生成对抗网络》还介绍了多个真实世界中使用对抗网络构建智能应用的案例并提供了具体的代码以及部署方法，旨在帮助读者能够在真正的生产环境中使用生成对抗网络。《GAN：实战生成对抗网络》适合数据科学家、算法工

第一本无人驾驶技术书

刘少山, 唐洁, 吴双, 李力耘

评分 6.5分

无人驾驶是一个复杂的系统，涉及的技术点种类多且跨度大，入门者常常不知从何入手。《第一本无人驾驶技术书》首先宏观地呈现了无人驾驶的整体技术架构，概述了无人驾驶中涉及的各个技术点。在读者对无人驾驶技术有了宏观认识后，《第一本无人驾驶技术书》深入浅出地讲解了无人驾驶定位导航、感知、决策与控制等算法，深度学习在无人驾驶中的应用，无人驾驶系统软件和硬件平台，无人驾驶安全及无人驾驶云平台等多个主要技术点。《第

Easy RL：强化学习教程

王琦, 杨毅远, 江季

评分 8.5分

强化学习作为机器学习及人工智能领域的一种重要方法，在游戏、自动驾驶、机器人路线规划等领域得到了广泛的应用。本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容，在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q 学习等传统强化学习算法，以及策略梯度、近端策略优化、深度Q 网络、