- Python强化学习:算法、核心技术与行业应用
- (美)埃内斯·比尔金
- 131字
- 2024-04-15 11:57:25
第一部分 强化学习基础
本部分涵盖强化学习的必要背景,包括定义、数学基础以及强化学习解决方案方法论的概述,为你的后续学习奠定基础。
本部分包含以下章节:
❑ 第1章 强化学习简介
❑ 第2章 多臂老虎机
❑ 第3章 上下文多臂老虎机
❑ 第4章 马尔可夫决策过程的制定
❑ 第5章 求解强化学习问题
本部分涵盖强化学习的必要背景,包括定义、数学基础以及强化学习解决方案方法论的概述,为你的后续学习奠定基础。
本部分包含以下章节:
❑ 第1章 强化学习简介
❑ 第2章 多臂老虎机
❑ 第3章 上下文多臂老虎机
❑ 第4章 马尔可夫决策过程的制定
❑ 第5章 求解强化学习问题