基础篇

■ 第1章 大语言模型的基础知识

■ 第2章 大语言模型应用架构

■ 第3章 大语言模型应用的工作模式

大语言模型是自然语言处理的一个重要分支。近几年来,随着Transformer架构和自注意力机制的引入,大语言模型得到了广泛应用,尤其在生成式人工智能领域取得了长足的发展。直接学习如何操作大语言模型虽然可以让读者掌握一些技能,但读者常常知其然而不知其所以然,一旦应用场景稍有变化,就会产生困惑。而掌握一定的大语言模型基础知识,可以为操作和应用开发进行重要的铺垫,帮助读者在操作大模型和开发应用时,更深入地理解执行步骤或源代码的原理。

本篇分为3章,讲解大语言模型的基础知识、应用架构、应用工作模式。

❍ 第1章介绍大语言模型的发展历程、基本原理、应用开发技术和常用训练方法,重点讲解了Transformer架构和自注意力机制。

❍ 第2章介绍大语言模型应用涉及的软硬件在整体架构中的作用,为后续部署和开发奠定基础。

❍ 第3章介绍应用开发中服务端的工作模式和流程,前端与后端的交互方法,以及客户端开发常用的技术。