会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
更新时间:2024-04-25 18:20:57 最新章节:封底
书籍简介
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
程戈
同类热门书
最新上架
- 会员本书对Python在职场办公领域的应用进行了系统梳理与介绍。全书共12章,第1~6章主要围绕与Python办公自动化相关的基础知识展开;第7~12章包括走进ChatGPT,文件操作自动化,Word、PPT办公自动化,Excel办公自动化,PDF文档操作自动化和邮件发送,数据分析与可视化等内容。本书提供了丰富的案例,并配有相关资源,以增强读者的实战能力。本书内容易学易懂,适合追求高效工作、对办公自动计算机11.9万字
- 会员内容简介这既是一本引导读者如何使用ChatGPT低门槛、高效率学习Python数据分析与挖掘方法的著作,又是一本指导读者如何使用ChatGPT精准、高效地进行Python数据分析与挖掘实操的著作。从读者对象的角度看,本书既大大降低了没有编程经验的读者学习Python数据分析的门槛,又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧,帮助他们快速转型为具备AI能力的数据分析师。从核心计算机16.9万字
- 会员本书是一本全面介绍人工智能概念和新发展、新兴技术、产业应用和安全伦理思考的通识类图书,分为认知篇、前沿篇、行业篇、思考篇四部分,从人工智能的发展历程、模型等基础知识讲起,通过智能机器人、自动驾驶、大模型、AI生成等热门应用让读者对人工智能技术有直观的认识和理解,并从多个领域对人工智能存在问题进行了深度分析。本书内容既有人工智能技术的深度,也有行业应用的广度,对人工智能技术进行全面剖析。本书适合对人计算机10.2万字
- 会员机器人开发是一项复杂的系统工程,ROS2为智能机器人开发提供了强有力的支持,极大地提高了机器人软件开发效率。本书首先对ROS2的基础概念、通信机制、常用库和工具进行介绍,带领读者入门ROS2机器人开发;接着引导读者完成移动机器人的建模和仿真、建图和导航、自定义控制器和规划器等一系列实践;然后在真机实战环节,通过制作一个基于ROS2的真实机器人,帮助读者打通仿真与真机之间的壁垒;最后,本书深计算机13.6万字
- 会员AI大模型正成为数字经济时代的新质生产力,它将对经济社会的各行各业产生重大影响。本书详细介绍了AI大模型在各个领域的无限潜力和广阔前景。从精准农业的种植建议到智能制造的质量控制和精益生产,从医疗诊断的精准高效到文化传媒的智能化创新,从旅游业的个性化服务到教育领域的智能化辅助,从零售业的创新应用到交通运输业的智能化变革,AI大模型正在深度融入并引领各领域和行业的数字化转型。本书不仅提供全面的行业洞察计算机16.6万字
- 会员本书旨在采用一种符合读者认知角度且能提升其学习效率的方式来讲解深度学习背后的基础知识。本书总计9章,深入浅出地介绍了深度学习的理论与算法基础,从理论到实战全方位展开。前三章旨在帮助读者快速入门,介绍了必要的数学概念和必备工具的用法。后六章沿着深度学习的发展脉络,从最简单的多层感知机开始,讲解了深度神经网络的基本原理、常见挑战、优化算法,以及三大典型模型(基础卷积神经网络、基础循环神经网络和注意力神计算机14.8万字