强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    本书深入浅出地讲解AIGC基础知识与实际应用。全书共8章,包括认识AIGC、AIGC的使用方式、AIGC助力高效办公、AIGC助力学习成长、AIGC丰富生活、AIGC造就绘画大师、AIGC成就编程小能手、AIGC的发展与展望。本书结合案例讲解,将理论与实践相结合、实用性强,可帮助学生及时巩固知识,提升操作能力。全书内容丰富、图文并茂、重点突出、通俗易懂,可作为本科院校和职业院校相关专业的教材,也可
    黄源 张莉主编计算机12.8万字
  • 会员
    本书根据李宏毅老师“机器学习”公开课中与深度学习相关的内容编写而成,介绍了卷积神经网络、Transformer、生成模型、自监督学习(包括BERT和GPT)等深度学习常见算法,并讲解了对抗攻击、领域自适应、强化学习、元学习、终身学习、网络压缩等深度学习相关的进阶算法.在理论严谨的基础上,本书保留了公开课中大量生动有趣的例子,帮助读者从生活化的角度理解深度学习的概念、建模过程和核心算法细节.
    王琦 杨毅远 江季编著计算机19.5万字
  • 会员
    这是一个“算法世界”:建立在数据之上的算法指导社会的运行、决定我们能在网上看到什么;它更是自动驾驶、智能管家、未来医疗以至智慧城市的基石。如果我们不了解算法如何使用数据,就无法知道人工智能将如何改变我们的生活。通过采访谷歌和剑桥分析公司的数据专家、亲自模拟高科技巨头的算法模型,萨普特带我们直击智能产品背后的秘密、思考数字科技给社会带来的风险。我们对科技和互联网的日益依赖,使数据研究者能够收集与我们
    (瑞典)大卫·萨普特计算机14.8万字
  • 会员
    本书是一本全面介绍人工智能概念和新发展、新兴技术、产业应用和安全伦理思考的通识类图书,分为认知篇、前沿篇、行业篇、思考篇四部分,从人工智能的发展历程、模型等基础知识讲起,通过智能机器人、自动驾驶、大模型、AI生成等热门应用让读者对人工智能技术有直观的认识和理解,并从多个领域对人工智能存在问题进行了深度分析。本书内容既有人工智能技术的深度,也有行业应用的广度,对人工智能技术进行全面剖析。本书适合对人
    张大斌 田恒义 许桂秋主编计算机10.2万字
  • 会员
    这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领
    刘聪 沈盛宇 李特丽 杜振东计算机11.2万字
  • 会员
    本书深入探讨了AI(人工智能)如何革新软件开发领域,从AI辅助编程的演变、优势与挑战到具体的工具与技术实现,为开发者打开了一个全新的世界。全书共10章,第1章介绍了编程的历史演变和生成式AI的崛起;第2章深入技术细节,解释了AI辅助编程工具的主要功能和工作原理;第3章讨论了提示工程的重要性,以及如何与AI工具进行有效沟通;第4章和第5章通过GitHubCopilot和其他AI编程工具的案例,展示
    (美)汤姆·陶利计算机11万字
  • 本书作为文心一言的学习指南,全面、细致地介绍了文心一言PC端和App的各项功能和使用方法,力求通过简洁明了的语言和图文并茂的形式,让读者快速掌握文心一言的各项功能。全书共8章,首先简单介绍了人工智能发展的几个阶段及文心一言的相关研发背景;随后介绍了文心一言的基础页面及功能等内容,以及文心一言在学习、工作、生活娱乐方面的应用及相关案例;接着介绍了文心一言的插件,以及文心一言App的功能和使用技巧;最
    麓山AI研习社编著计算机10.7万字
  • 会员
    本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神
    瞿炜 李力 杨洁计算机14.8万字
  • 会员
    本书面向初学者介绍智能计算的相关概念、典型应用,采用研究性学习方法和P-MASE模型,按照引入问题、寻找方法、问题分析、问题求解、效果评价的模式,讲授智能计算编程、数据获取和预处理、数据可视化、预测数据的值、分类问题、聚类分析、神经网络、智能图像识别、时间序列数据的处理等知识,并给出了两个综合案例。本书深入浅出、案例丰富、可操作性强,适合作为高校智能计算相关课程的入门教材,也适合相关技术人员学习参
    李敏 赵宏 李兴娟主编计算机10.1万字