THE TRANSLATOR'S WORDS
译者序

众所周知,强化学习在新一代人工智能的发展过程中发挥了关键作用,AlphaGo(会玩围棋的智能体)、OpenAI Five(会玩《Dota 2》的智能体)、AlphaStar(会玩《星际争霸》的智能体)等引起社会关注的技术和产品中都采用了强化学习核心算法,并结合深度学习,将此前不可能完成的任务以一种半“暴力”美学的方式完美解决。

本书是一本实用性很强的强化学习书籍。目前市面上讲解强化学习的书籍大多从原理和算法角度介绍,而忽视了工程应用落地的具体案例。越来越多的人工智能落地产品(如谷歌推出的家庭机器人、传统工业供应链优化以及OpenAI对话机器人ChatGPT)极其依赖强化学习算法,企业和个人开发者对强化学习技术和平台的掌握与应用在今后的发展中变得越来越关键。

学习强化学习应从理论入手,以解决实际问题为目标,最终实现算法的应用。本书基于深度学习框架TensorFlow和分布式强化学习框架Ray实现一系列常用的深度强化学习算法。作者借助在第三部分中已经实现的算法解决第四部分的应用问题,比如,第14章使用第10章的两种课程表学习方法训练KUKA机器人完成物体抓取工作。

本书强调实际应用,提供一种现实示例以及对应的代码教程,引导读者一步一步实现算法并查看结果。另外,本书还针对新兴的强化学习技术,提出现有的问题和未来的发展方向。

如果你有明确的学习目标,可以选择性阅读,这不影响整体的阅读体验。但正如本书最后所说:“只有通过实践才能真正学到东西。”通过实践来深入学习算法是学习任何人工智能技术的正确途径,希望读者朋友尽可能地动手实践强化学习,相信你们一定能够真正掌握这门具有长远前景的技术。