强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

同类热门书

最新上架

  • 会员
    本书讲解如何利用AI工具来高效制作和设计PPT,全书共分为8章,前面7章分别介绍了PPT不同制作内容的相关知识和技巧,包括软件操作层面、设计思维层面、素材应用层面的内容,第8章模拟了两个真实工作场景下的PPT使用需求,逐步讲解设计的关键环节,旨在帮助读者解决工作中的实际问题。
    凤凰高新教育编著计算机601字
  • 会员
    本书是一本面向产品经理的实用新书,分12章探讨如何用ChatGPT提升产品管理工作的效率和质量。第1章介绍了人工智能对产品管理的影响;第2章介绍用ChatGPT提高文档写作效率;第3章介绍用ChatGPT进行竞品和市场分析;第4章介绍用ChatGPT优化需求管理;第5章介绍用ChatGPT分析产品数据;第6章介绍用ChatGPT改进用户体验;第7章介绍用ChatGPT设计产品原型;第8章介绍用Ch
    关东升计算机11.5万字
  • 会员
    本书具体包含以下内容:首先,探讨ChatGPT对法律界的冲击,以及律师等从业者的不同反应,进一步分析AI技术对行业的影响和发展趋势。接着,简要介绍ChatGPT的技术原理及应用场景。随后,详细讨论如何将AI力量融入律师职业路径,构建专业律师成长的新飞轮。接下来,分别讨论如何将ChatGPT(GPTs)应用于渠道与案源、检索与研究、案件分析,以及法律文书撰写与合同审核,实现部分日常事务自动化执行。之
    轩珍珍 徐伟浩计算机10.6万字
  • 会员
    本书共分为8章,分别讲解了常见的人工智能以及人工智能影响下的广告流量变现、商业合作变现、直播变现、私域变现和IP变现等。此外,还对未来的人工智能与新媒体变现做了趋势分析。
    刘丙润计算机10.5万字
  • 会员
    本书着重阐述了深度学习时代的计算机视觉算法的工作原理,首先对深度学习与计算机视觉基础进行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测算法、图像分割算法、人体姿态估计算法、行人重识别与目标跟踪算法、人脸识别算法以及图像超分辨率重建方法进行了介绍。本书系统讲解了在日常生活和工作中常见的几项计算机视觉任务,并着重介绍了在当今深度学习时代,这些计算机视觉任务是如何工作的,可使读者快
    徐从安 李健伟 董云龙 孙超等计算机9.9万字
  • 会员
    本书主要介绍了人工智能的基础知识和实用技术。本书共8章,包括“人工智能:开启智慧新时代”“Python:人工智能开发语言”“线性回归:预测未来趋势”“分门别类:帮你‘分而治之’”“物以类聚:发现新簇群”“个性化推荐:主动满足你的需求”“语音识别:让机器对你言听计从”“人脸识别:机器也认识你”。本书以培养学生人工智能素养、人工智能思维和人工智能基本应用能力为设计理念,在内容的选取和安排上符合学生的学
    宋楚平 陈正东主编计算机12.9万字
  • 会员
    这是一本全方位讲解如何利用AI工具为HR赋能的著作,是AI时代HR提升职场竞争力的实战指南。作者基于深厚的HR管理经验和AI实战经验,通过科学的方法、高效的提示词、丰富的案例、清晰的步骤,细致地讲解了如何利用AI工具提高工作效率、优化管理流程、提升人才管理水平。从AIGC的基础知识到AI工具的使用,从AI在人力资源全生命周期所有场景中的应用到使用AI的风险防控,本书全面系统地讲解了HR需要掌握的全
    田政 谷燕燕 唐琨计算机20.6万字
  • 会员
    本书分为3个部分:第1章和第2章是人工智能的数学基础,主要介绍了机器学习的概念、Python开发环境的搭建、机器学习bibei的数学知识,以及线性代数和概率论的相关知识;第3~12章主要介绍了回归模型、分类模型、聚类模型、半监督模型的建立和相关算法的理论,以及如何使用sklearn具体实现相关算法模型的搭建;第13章介绍了Spark机器学习,笔者认为对于机器学习,不能只限于Python中的skle
    刘润森计算机0字
  • 会员
    本书共八章,从高校资源配置的教育、科研、社会、经济规律视角,以建设卓越世界一流大学为导向,对高校科学仪器设备配置中的问题进行研究。
    王士国 翟宇 虞振飞 方良华计算机17.5万字

同类书籍最近更新

  • 会员
    神经网络与深度学习是人工智能研究的重要领域,是机器学习的重要组成部分。人工智能是研究理解和模拟人类智能、智能行为及其规律的科学。本书紧紧围绕神经网络和深度学习的基础知识体系进行系统的梳理,力求从基础理论、经典模型和前沿应用展开论述,便于读者能够较为全面地掌握深度学习的相关知识。全书共16章。第1章是绪论,简要介绍人工智能、机器学习、神经网络与深度学习的基本概念及相互关系,并对神经网络的发展历程和产
    赵眸光编著人工智能20万字
  • 会员
    本书全面介绍可解释人工智能的基础知识、理论方法和行业应用。全书分为三部分,共11章。第一部分为第1章,揭示基于数据驱动的人工智能系统决策机制,提出一种基于人机沟通交互场景的可解释人工智能范式。第二部分为第2~5章,介绍各种可解释人工智能技术方法,包括贝叶斯方法、基于因果启发的稳定学习和反事实推理、基于与或图模型的人机协作解释、对深度神经网络的解释。第三部分为第6~10章,分别介绍可解释人工智能在生
    杨强等人工智能20.4万字
  • 会员
    本书全景式地描述了互联网前沿技术——区块链,分别从区块链的起源、区块链在全球各个国家的发展现状、区块链的四大核心技术、基于区块链底层技术的数字货币发展现状等角度进行描述。另外,为了更好地理解区块链,本书讲述了区块链在数字货币领域、金融领域、物联网领域、大数据领域、医疗领域、教育领域、公证领域等七个领域的应用。区块链是一场技术革命。在不久的将来,我们会看到区块链与传统行业的直接较量。而且这是一场不
    吴为人工智能14.5万字
  • 会员
    本书英文版出版至今已近20年,但关于大脑究竟如何工作的问题至今仍无答案,而符号主义(认为大脑是类似于计算机的加工符号的机器)与联结主义(认为大脑是并行运转的大型神经网络)之间的争论也从未停息。本书分析了联结主义模型和符号加工模型在计算方面的优势和劣势,关注不同联结主义模型之间的差异以及特定模型与符号加工的特定假设之间的关系,并围绕多层感知器展开讨论。书中的观点在今天依然频繁成为学术讨论的焦点,并为
    (美)加里·F.马库斯人工智能12.3万字
  • 会员
    本书以有趣的案例和深入浅出的语言,直击AI的底层运行逻辑与核心原理,勾勒人工智能的全貌,以便读者掌握AI技术要点,打通AI的各种技术壁垒,厘清不易察觉的“认知错误”,从而更好地认识正在运转的神秘AI世界。本书共9章,逻辑上分为三部分。第1~3章是人工智能的基础理论,通过生动、有趣的讲解,让读者知道支撑AI的基础学科如何起作用:如何基于统计学和概率论找到应对不确定性的有效方法与解题思路如何基于数据
    徐晟人工智能20.8万字