
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
更新时间:2024-04-25 18:20:57 最新章节:封底
书籍简介
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
程戈
同类热门书
最新上架
- 会员本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。计算机10.7万字
- 会员本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。计算机8.6万字
- 会员本书从写作与ChatGPT的基础知识讲起,结合创作者的实际写作经历与写作教学经历,介绍了用ChatGPT写作的基础技巧、进阶写作的方法、不同文体的写作方法、写作变现的秘诀,让读者理解写作技巧与变现思路。计算机14.7万字
- 会员本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技计算机5.5万字
- 会员本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大计算机12.3万字
- 会员青少年人工智能编程水平测试涵盖从数学逻辑到计算思维、从拖曳程序模块到程序编写、从数学建模到算法设计等多学科知识,能够对学生的多学科知识综合运用能力做出评价;能够通过设计的具体解决方案,对学生的计算思维、创造性思维等能力做出评价;在具体的解决方案中,能够通过设计算法模型和实现算法,对学生掌握和运用编程的能力做出评价。本书将生活中的一些案例和程序算法相结合,深入浅出地为学生讲解不同进制之间的转换、函数计算机3.9万字