内容简介

本书内容系统全面,覆盖面广,既有理论阐述、公式推导,又有丰富的典型案例,理论联系实际。书中全面系统地描述了强化学习的起源、背景和分类,各类强化学习算法的原理、实现方式以及各算法间的关系,为读者构建了一个完整的强化学习知识体系;同时包含丰富的经典案例,如各类迷宫寻宝、飞翔小鸟、扑克牌、小车爬山、倒立摆、钟摆、多臂赌博机、五子棋、AlphaGo、AlphaGo Zero、AlphaZero等,通过给出它们对应的详细案例说明和代码描述,让读者深度理解各类强化学习算法的精髓。书中案例生动形象,描述深入浅出,代码简洁易懂,注释详细。

本书可作为高等院校人工智能、计算机、自动化、电子信息等相关专业的本科生或研究生教材,也可供对强化学习感兴趣的研究人员和工程技术人员阅读参考。