- AI经济学
- 中金研究院 中金公司研究部
- 3字
- 2024-12-16 17:02:17
宏观篇
第一章 迈向通用时代的人工智能
人工智能是模拟智能的系统,当前尤指计算机系统。人类模拟智能的想法由来已久,但直到电子技术取得进展,这一领域才得以真正发展。AI发展并非坦途,历经几轮兴衰,通用性缺失一直是痛点。如今,以谷歌团队提出的Transformer架构为代表的深度学习算法的成功,标志着AI迈入了通用模型时代,开始跨越不同智能场景模拟间的藩篱,归纳真实世界规律的能力取得了里程碑式的突破。在高性能算力和高质量数据的支撑下,AI还展现出规模定律特征,智能水平不断提升。
本轮AI具备了应用普遍、催生创新、可改进的通用目的技术特征,并体现出广泛的融合潜力。其应用潜力和商业前景已得到初步验证,AI或已跨过S曲线的第一拐点,进入“研发—应用”循环迭代的加速期。在智能成本下降的推动下,产业与AI的融合浪潮已经袭来。而这一浪潮将在生产端提升生产效率的同时改变劳动结构,在消费端催生新智能产品需求的同时影响社会形态,进而对世界格局产生重要影响。
那么谁将引领这一场浪潮?在AI跨过S曲线第一拐点的背景下,哪个国家在“研发—应用”的循环迭代中胜出,哪个国家就有望成为本轮AI融合浪潮的引领者。AI在研发端的优势取决于智能硬件的性能与规模、高质量数据获取能力、优秀人才的储备以及良好的创投环境,这往往带来一定的先发优势;而AI在应用融合端的优势则更依赖多元的市场和鼓励融合创新的政策环境。
为评估各国在本轮AI“研发—应用”的迭代强度,我们构建了研发层的“技术活跃度”以及应用层的“市场友好度”,两者合并后得出可以反映“研发—应用”迭代能力的“AI发展指数”。总体而言,美国与中国的AI发展指数最高,美中是国际上引领本轮智能融合浪潮的前两名国家。美国在技术活跃度上具有较大优势,而中国在市场友好度上略胜一筹。德、日、英居于第二梯队,与中美差距较大;印度由于市场友好度较高,紧随第二梯队之后。割裂的全球市场可能会阻碍AI的价值实现并抑制创新,这或许会促使部分国家在未来的智能融合浪潮中深化合作。[1]
一、AI进入通用模型时代
(一)人工智能是模拟智能的系统
人工智能(artificial intelligence,AI)指的是模拟智能的系统,在当今的语境中更多指的是计算机系统或与之相关的机器系统。人工智能是一个既古老又年轻的概念。言其古老,是因为“模拟智能”的思想源远流长,在古希腊、古罗马传说中就出现过能完成特定任务或行为的类人智慧体。[2]谈及年轻,则是因为“artificial intelligence”这一名词直到1956年才在麦卡锡、明斯基和香农等人工智能先驱组织的达特茅斯会议上被正式提出。此后AI研究者发展出了多种基于逻辑规则、概率推理等的模拟智能的方法。其中,机器学习是人工智能的一个重要领域,它通过让计算机系统从数据中学习和发现规律,[3]做出预测或决策,而不需要明确的编程指令。根据训练过程中是否使用标记数据或进行反馈,机器学习可分为监督学习、无监督学习和强化学习。近年来,AI取得的许多关键成果,包括大语言模型,则来自机器学习的一个子领域——深度学习。深度学习使用多层神经网络来模拟生物脑的功能,[4]从而使计算机系统能够进行复杂的数据处理和模式识别等活动。当前,深度学习在图像识别、语音识别、自然语言处理和自动驾驶等领域都取得了丰硕的成果。图1.1是对前述人工智能不同方法间关系的一个简单梳理。
图1.1 人工智能方法划分
资料来源:Prince S J D.“Understanding Deep Learning.”2023;中金研究院。
既然是模拟智能,那就不得不提及人类要模拟的智能究竟是什么。因为涉及多个学科和不同视角,直接给智能下定义是一件异常困难的工作,对其内核含义的探讨甚至也远超本章的内容范畴。如果只是简单诠释,那么智能就是一个多层次、复杂多维的概念,涵盖了认知能力、学习能力、推理能力、问题解决能力以及其他与信息处理和理解相关的功能,这些功能是为了让智能体在现实世界各种变化的场景中进行活动、实现目标。[5]上述的阐释依然复杂,但我们如果从智能体“要做什么”去思考,就可以直观地理解智能究竟是什么。唯物主义者相信真实的世界中存在着客观的规律或者法则,并将其称为真理,他们认为世界真理决定着世间万物的运动方式以及相互间的联系。[6]从这个角度讲,智能体要做的工作就是根据万事万物的运动以及相联系的信息,反推“世界真理”。智能体反推出来的规律和法则与世界真理越接近,那么它的智能水平就越高。比如,为什么我们会觉得牛顿和爱因斯坦的智能水平高,就是因为他们根据各类世界信息反推出的万有引力、三大运动定律以及相对论,比其他人更加接近世界真理。
如果说智能体的工作是通过联结万事万物的信息,从中寻找规律来反推世界真理,那么收集和处理信息的类型数量,就会决定其智能水平的高低。比如说某智能体在处理世界信息时存在限制,只能处理真实世界局部的信息,那么它就会像柏拉图洞穴寓言[7]中被困于洞穴的人一样,虽然他们看到的是真实世界在墙壁上的投影,但他们却误以为这些影子就是世界本身;他们可以总结出影子的运行规律,但这只是对世界真理的片面认知。当用这些规律来应对真实问题时,往往会出现偏误。
为了更深入地理解这一点,我们可以设想一个智能体A,它只能处理某个特定领域的信息,例如天气数据。虽然智能体A可以通过分析天气数据,准确预测短期天气变化,但如果在一个决策中遇到涉及其他领域的问题,如社会经济发展、生态环境变化等,它就会因为处理信息的局限性而无法给出准确的判断。相反,如果另一个智能体B能够处理多种类型的信息,包括自然科学、人文社会、技术发展等各个方面的信息,它就更有可能从复杂的、跨领域的数据中发现更深层次的规律,推导出更接近世界真理的结论。这种多维度的信息处理能力,使得智能体B在面对复杂问题时,能够综合考虑多种因素,给出更加全面、准确的解决方案。
可以说,智能体的信息收集和处理能力的广度与深度,直接决定了其智能水平的高低。仅能处理局部信息的智能体,就像柏拉图洞穴寓言中的囚徒一样,难以突破对世界真相的片面认知;而能够整合多种信息的智能体,才有可能接近世界真理,做出更为准确的判断和决策。理解这一点,对于我们理解今天人工智能的发展具有重要意义。
出于便利,人们有时也会为了区分不同场景下的应用需求,对人类所具有的智能进行分类。有人根据个体能力表现差异,把智能分为语言智能、逻辑数理智能、空间智能、运动智能、音乐智能、人际交往智能、内省智能和自然辨识智能;[8]也有人从方法论角度,把智能分为分析智能、创造智能、实践智能三类;[9]还有人从认知心理学角度把智能分为理解能力、记忆能力、推理能力、计划能力四类。[10]总的来说,人们对智能进行分类时有不同的逻辑依据,包括认知功能、应用领域、内容和形式、先天和后天因素、个体差异、任务环境需求等,呈现出百花齐放的状态。不过从反推世界真理的角度来讲,这些不同类型的智能对应着处理不同的信息类型,而人脑这一生物器官具备系统处理这些信息类型的能力。[11]
那么智能能否被模拟呢?在对智能来源的认知上,至少存在三种比较有代表性但又差异明显的看法,不过从文献发表的趋势来看,现代学者越来越认同智能是一种可被模拟的客观能力。第一种看法认为智能是超自然力的授予,是人类与超自然力相联的标志,[12]这与古希腊神话中智慧体由神打造类似。[13]以阿奎那等神学家为代表,持这种看法的人认为人类无法也不应对智能进行模拟。第二种看法认为智能是人类特有的心理机制,依赖超脱物质世界的理念世界中的记忆,或者人类独有的一些先天结构。以柏拉图、笛卡儿、乔姆斯基等哲学家为代表,他们认为智能源于精神本质的心灵,[14]或者天赋决定的心智系统,[15]物质机制或许无法完整模拟人类智能。第三种看法认为智能来源于生物器官,比如大脑,而大脑产生智能的过程可以通过科学研究得到解释和复制。神经科学的奠基人卡哈尔认为大脑的基本工作单元是神经元,[16]神经元通过突触传递电信号和化学信号,突触的可塑性(即突触连接的变化)是学习和记忆的基础。诺贝尔生理学或医学奖得主坎德尔也认为智能可以通过神经科学的方法进行研究和解释。[17]这三种看法各有支持者。不过,从每年发表的与“智能”相关的新增文献所属学科占比可以看出,现代的学者越来越倾向于将智能纳入生物医学、计算机科学等基于物质客观规律的研究范畴中进行研究和讨论(见图1.2)。
图1.2 智能相关研究学科分布变化
注:该图统计时合并了部分学科,其中“社会科学”不包含经济学、心理学;*表示统计时间截至2024年4月。
资料来源:OpenAlex,中金研究院。
(二)智能模拟曲折前行——通用性不足是短板
在人工智能发展的文献中,我们经常可以看到类似图1.3的记录着AI发展重要事件的示意图。这些事件虽然对于AI研究者来说已经耳熟能详,但理解过去几十年AI的发展路径,对于认知当前AI里程碑式的突破具有重要意义。我们在前文讨论过,一个智能体可以处理多少不同类型信息决定着该智能体的智能水平。过去较长一段时间,由于AI模型的泛化和通用性较差,其在处理不同类型信息方面一直存在着隐性的壁垒,具体表现为虽然其在特定领域可以体现出某种智能,但跨场景的智能移植能力却很弱。
图1.3 人工智能发展经历起伏
注:图中纵轴用投资&研究=f(期望,成果)来表示。
资料来源:Bognar M Z.“Prospects of AI in Architecture: Symbolism, Connectionism, Actionism.”2022;Francesconi E.“The Winter, the Summer and the Summer Dream of Artificial Intelligence in Law.”2022;中金研究院。
从20世纪开始,模拟人类智能这一目标驱动着AI研究者们前赴后继、曲折前进,过程中有过热潮也出现过寒冬,波折历史背后暗含着一条模拟生物脑(联结主义)—模拟逻辑(符号主义)—小场景模拟(行为主义)—联结主义复兴的演进主线。19世纪末期,人类发现了神经系统中结构与功能的基本单位——神经元[18],经历几十年的探索和发展,人们对神经元的连接方式、作用机制等有了一定的认识。[19]恰逢这一时期电子学取得突破性进展,计算机也随之诞生,构建一个电子的“神经网络”来模拟神经元活动,成为当时人类模拟智能最直接的方式,这就是“联结主义”。当时最具代表性的是感知器,[20]它是一个单层神经网络,能完成简单的图像分类任务,比如区分三角形和圆形,掀起了第一波人工神经网络的热潮。可惜单层神经网络很快就遇到挫折。首先,20世纪60年代的算力发展程度非常有限,当时算力最强的计算机是IBM 7090,内存和处理速度甚至远比不上现在的普通笔记本电脑,只能处理很小规模的数据,无法为人类设想中的神经网络算法运行提供支撑。其次,单层神经网络能执行的任务非常有限,与人类想象中的“人工智能”差距甚远,当时也没有发展出建立多层神经网络的有效算法,更无从谈起算法是否通用。尤其是1969年,AI领域知名科学家马文·明斯基等发表《感知器》[21],对单层神经网络算法的局限性进行了证明和批评。最后,大众对于人工智能的热情冷却下来,神经网络领域的学术研究近乎停滞,引发了AI发展的第一次寒冬。
利用电子设备模拟生物脑的联结主义遭遇挫折,但科学家们仍在尝试另一条路径,那就是抛弃大脑的生物属性,直接通过模拟逻辑来实现“智能”,这就是符号主义。符号主义者认为,智能可以理解为按照逻辑规则来操作的符号运算。[22]如果把知识提炼成规则,再把规则转化为计算机符号,将这些符号输入计算机,就可以让计算机掌握人类的逻辑,从而表现出“智能”,其中最为典型的代表就是专家系统。如世界上第一个专家系统DENDRAL,[23]它可以根据输入的化学分子式信息来分析判断有机化合物的分子结构。在符号主义盛行阶段,各类型的专家系统陆续推出。然而,符号主义的发展很快也遇到了阻碍。首先,从理论层面来说,专家系统很容易就会面临规模爆炸的问题,[24]比如旅行商难题,给定多个城市和每两个城市之间的距离,求解途经每个城市一次后返回出发城市的最短路径,随着城市个数的增加,遍历所有情况来寻找最短路径的计算复杂度急速上升,计算机系统需要耗费大量时间来求解,甚至理论上需要几十年或几百年才能解出答案。其次,专家系统里面所有的规则都需要预先输到系统中。一方面,把现实生活中的问题和解决方案拆解为“如果符合某条件,那么推出某结论”的规则,工作量巨大;另一方面,当遇到新的场景时,如果没有提前输入的规则,系统就可能无法运作。的确有人尝试过输入所有规则,构建一个“无所不能”的专家系统,如1984年美国微电子与计算机技术公司的Cyc项目,[25]到21世纪初该项目停止前已累积百万数量级的概念和规则,[26]但“无所不能”的目标却依然遥不可及。随着这些缺陷逐渐暴露,人们发现专家系统能完成的任务在广度和深度上是有限的,到了20世纪80年代末公众对人工智能的热情再次消退,这让AI的发展遭遇了第二次寒冬。
虽然经历了两次严重挫折,但人工智能的研究并未停下脚步,如果符号主义处理复杂场景时遇到规模爆炸的问题,那是不是可以先把AI的应用限制在简单的小场景中?于是AI开发者们“退而求其次”,将AI的研发与应用聚焦在单一场景中,以此来优化AI处理某些具体任务的表现,这就是行为主义的思路。在这种思路指导下,一系列机器人项目应运而生,如1990年成立的iRobot公司推出的用于太空探索的六足机器人Genghis、水下扫雷机器人Ariel和后来的家用扫地机器人等。行为主义回避但并未解决AI智能迁移能力弱的问题,比如扫地机器人的算法很难用来处理翻译或者图像识别的问题。针对不同的场景任务,行为主义还是需要重新预先编程并设计新系统来完成特定的任务,无法发挥规模效应,这也限制了AI的发展和应用。
小场景尝试让AI发展经历了一段过渡期,智能探索几经曲折后,随着算法和算力的进步,联结主义再次站在了AI舞台的中央。虽然早期联结主义陷入低谷后神经网络研究遇冷,但学者们没有完全放弃对该领域的研究,陆续研发出可用于联想记忆的Hopfield网络、[27]解决多层神经网络计算问题的反向传播算法、[28]前馈的卷积神经网络(CNNs/ConvNets)[29]等。而杰弗里·辛顿于2006年提出了深度学习的概念,[30]进一步推动了联结主义的发展。深度学习在机器学习的基础上引入了模拟人脑的多层神经网络,用更强大的计算能力让机器从大规模数据中提取特征,神经网络层数越多,机器对输入特征的抽象程度越高,对输入信息的理解也越准确,更接近于人脑对信息的认知方式。此后,深度学习在计算机视觉、自然语言处理等领域都有较好表现,如深度学习模型在ImageNet图像分类挑战赛中将错误率降低了近一半,击败传统模型[31]等,深度学习成为重要探索领域。不过当时发展出的AI仍是适用于特定领域的,如打败围棋世界冠军的AlphaGo无法将下棋的优越表现迁移到其他领域。
前几轮AI的发展存在一个相似但常被忽略的问题,那就是系统通用性的缺失,智能模拟系统的设计往往只针对特定智能类型,很难实现跨领域智能迁移,更不要说同步利用不同类型的信息对世界真理进行更好的归纳与总结。如前所述,人类智能可以分为不同类型,比如语言智能、逻辑数理智能、音乐智能等。传统模拟智能的思路就是针对不同类型的智能设计不同的模拟系统,让AI掌握解决特定智能问题的能力。这导致不同智能的AI模拟之间存在藩篱,AI无法像人脑一样对不同类型的信息进行通用性处理,阻碍了AI实现不同领域间规律的类比和迁移,限制了AI对现实世界的理解范围。或许因为没有意识到这一隐性的问题,通用模型一直都没有成为AI研究的重点。如果有一种通用模型,能让AI在同一框架下对不同类型的信息进行处理,更全面地总结万事万物背后运行的规律,那么AI就有可能更逼近世界真理,迎来智能模拟水平的提高。
(三)新架构“意外”突破,AI迈入通用模型时代
不同于前几轮AI热潮,本轮AI发展在处理不同类型信息的通用模型方面取得了重要的突破。2017年,谷歌团队提出了Transformer,[32]本意只是解决当时机器翻译存在的长句信息丢失、计算效率低等问题,但在随后的应用中人们越来越发现其具有跨越智能模拟藩篱的能力。Transformer是一种深度学习架构,基于多头自注意力机制,处理信息与人脑类似,能忽略次要细节、专注于关键信息,可以捕捉序列中长间隔词语间的关系,从而尽可能识别序列中的信息。同时,多头自注意力机制还能形成多个子语义空间,使模型能够同时关注输入序列中的多个不同位置,捕获更丰富的上下文信息。此外,Transformer的多个注意力头可以并行计算,不需要等待前面的单词计算完成,可以更高效地处理大规模序列数据。这些特点让Transformer展现出了强大的长序列数据处理能力,它可以很好地完成机器翻译任务。虽然一开始人们主要使用Transformer来处理文本数据,但很快研究人员就发现,很多类型的数据都可以转换为Transformer可处理的数据模式,这让Transformer表现出了通用模型的潜力。
Transformer一般通过“词元(token,也称‘记号’)化”处理数据,它将数据转换为可以被机器处理的标准化的序列数据,语言、动作、影像等各种符号化或者非符号化的数据都可以“词元化”。如文本数据本身就是以序列形式存在的,视频可以看作时空维度上的多个图像序列。在处理不同类型数据时,Transformer可以将文本数据转换为词元,将图像转换为曲面片(patch),将机器人的动作控制转化为机器人词汇[33](robot vocabulary)等,触觉[34]和味觉[35]等数据的处理也在探索中。此前,对不同类型数据信息的处理是由不同模型进行的,这导致了智能模拟的分割,如从文本数据中总结规律可以学习到语言智能,从音频数据可以学习到音乐智能,从数学中的几何定理、证明等数学数据可以学习到逻辑数理智能等[36],而由于Transformer这一算法架构可以用相对一致的思路处理各种类型的数据,所以其将这些智能的模拟统一到了一个架构之下,并最终推动数字智能[37]和具身智能[38]的快速发展(见图1.4)。
图1.4 Transformer对不同智能模拟间藩篱的打破
资料来源:中金研究院。
通用模型的出现打破了多类型信息处理的壁垒,这是AI发展里程碑式的突破。对于单一数据而言,Transformer具备了总结这些数据中蕴含着的高维度规律的能力。以文本数据为例,语言作为人类交流的工具,是人类思维的外化表现,因此语言文本中蕴含了人类已经发现的、总结好的那部分规律。Transformer将输入的文字序列转化为词元,对应生成向量,映射到向量空间中。向量的位置、向量之间的距离,对应表达出原始文本中的含义和联系,所以Transformer生成的其实是一个富含人类逻辑规律的向量空间。以“意大利的首都是罗马,西班牙的首都是马德里”这句话为例,某个国家的首都是哪里,这是人类总结出来的规律,这条规律在向量空间中表示为国家和首都之间相对稳定的方向和距离关系,“老鹰会飞,猎豹会跑”这类句子亦是如此。当基于Transformer的大语言模型处理足够多的文本数据时,它就能挖掘到数据之间存在的这种较为稳定的联系,表面上是从概率角度推断出了句子里一个词元后可能出现的词元,实际上则是总结出了这种稳定联系所代表的规律,且运用规律进行了预测。Transformer通用地处理多种类型数据信息,可以在更高维度上总结多类型数据所蕴含的规律,并对这些规律进行总结。如果说语言文本中蕴含的规律是人类思维的结晶,那么图片、视频、动作等数据中蕴含的信息则反映了世界真理在其他物理世界的投影。如大量熟透的苹果从树上落地的视频,包含了物体在空间运动、重力等物理现象和规律,如果在此基础上再增加苹果落地的音频、对苹果和地面的触感进行的文字描述等,并将这些不同类型的数据放到通用模型中进行处理,从多种类型信息中总结规律,模型就能更全面地理解这一现实世界中的现象,对它的认识也逐渐逼近现实世界的真实情况。而这种通过寻找不同类型信息间的共同结构,从而发现世界中不同事物联系的方法,一定程度上也是创造力的来源。[39]如果说特定类型信息是从单一角度去反映真实世界,[40]那么通用模型处理多类型信息,就可以更全面地反映出真实世界,以此反推出来的规律与“世界真理”可能就会更接近。虽然AI通用模型的最终形态有可能基于其他更先进的架构,但可以说Transformer最先叩开了AI迈入通用模型时代的大门。
(四)规模定律:提升智能水平最好的答案?
如果说通用模型让AI打破了处理不同类型信息的壁垒,拓展了人工智能的泛化和通用能力,那么给定AI处理信息类型,我们又该如何提升其智能水平呢?
历史上出现过不同的尝试,但规模定律似乎成了潜在的最佳答案。提高AI智能水平的一种思路是基于人类知识进行算法构建,这种思路往往假设智能体可用的计算资源相对固定,旨在提高对有限计算资源的利用效率,充分利用人类在特定领域的知识来设计算法,节省算力成本。另一种思路则是研究随着算力的增加能持续提高性能的通用算法,发挥大规模算力的作用。[41]短期来看,第一种思路似乎能快速起效,但长期来看,第二种思路能令算法在算力增长中受益,可行性更高。原因在于摩尔定律驱动算力不断发展,芯片性能指数倍增,随着算力扩展,能利用大规模算力的通用算法性能逐渐提升,而那些无法进行扩展的特定算法则难以在算力资源的提升中受益,性能表现水平很容易被超越,当时设计的算法也就容易过时。而近10年来算力和数据规模的增长更加证明了第二种思路的优势。据英伟达(NVIDIA)测算,过去10年GPU(图形处理单元)处理能力增长了1 000倍,增长速度超越了摩尔定律[42],它将持续提高性能,互联网的普及也使大量的数字化信息得以积累,为AI提供了算力和数据支撑。许多人开始相信扩大规模,即运用更多的算力、更多的数据来训练更大的模型,或许是提升AI智能水平“最好的方案”,尤以当前活跃在大模型相关企业前线的部分科学家为代表。也许是受到这一思路启发,人工智能研究公司OpenAI于2020年发现,随着模型训练过程中累积的算力、参与训练的数据量、参数量的增大,模型性能将平稳、可预测地提升,即模型的效果更好。[43]在后续研究中,还发现规模定律适用于多种模态[44]、具体的下游任务[45]等。当大模型扩张到一定程度的时候,还会出现“涌现”[46]现象,涌现是指模型突破某个规模后性能显著提升,表现出小模型不具备的能力。尽管人们当前对于模型涌现能力的评价指标有技术争议,[47]不过争议多存在于数学方法层面对涌现现象的度量,并没有否定模型会在规模增大时突然增加性能这一现象。对于通用模型而言,其如果呈现出规模定律特征,便意味着继续扩展规模会带来智能水平的提升,其对规律的刻画也能更接近世界真理的“本来面貌”。
不过,作为经验定律,规模定律并非毫无争议,扩大规模是不是提升智能水平“最好的方案”仍然有待探索。一方面,现在已经出现了潜在高质量数据的短缺问题,有估测认为,全球高质量文本数据在2026年前可能出现供不应求,[48]能否有支持规模持续扩展的数据量是未知数,不过运用合成数据、待收集的其他类型数据可能是一个解决思路;另一方面,规模定律下扩展规模对模型精度的线性提升是否存在边界,也是当今学术界和业界暂时无法解答的问题。而且,规模定律中还存在边际收益递减的问题,当模型要素规模比较小时,扩展规模带来的收益明显,而随着规模越来越大,改进模型的效果可能不那么明显。更进一步地,有观点认为,规模定律与人类大脑运用少量样本、快速发现规律的方式背道而驰;[49]还有观点认为,过度强调规模可能会忽视知识、推理本身的重要性[50],等等。激烈的讨论可能代表着沿着规模定律提高AI性能的路径仍有改进空间,规模定律是推动AI提升性能的路径,但也可能存在其他路径。
规模定律是基于技术层面的讨论,但也隐含着经济层面的规模要求,大国享有规模优势。规模定律意味着AI大模型的研发需要大量资源投入,大国可以发挥规模优势。算力驱动模型基于大量高质量数据进行规律总结,参数和数据的大幅增长,使本轮AI通用模型在训练阶段需要执行更大的矩阵运算,这意味着大量的GPU投入。为了满足更新模型、增加功能产生的算力需求,AI大模型持续转向性能更好、含有更多芯片的大型计算集群。此外,持续优化算法架构、研究合成数据、采集新类型的多模态数据、大模型训练的工程调优等都需要充足的人才投入。大国凭借规模优势可以使多个主体分摊模型训练高昂的固定成本,拥有更多的人才储备,从而可以更快突破AI性能阈值,达到更好的效果。
总结来看,在当前通用模型突破与算力和数据的支撑下,AI更加接近世界真理,从虚拟世界走向真实世界,未来的AI也将对人类生产生活产生深刻影响。当前AI找到了展现出通用模型潜力的架构,以及规模定律所蕴含的提高模型智能水平的方式,随着大量多模态、高质量的数据被收集和清洗出来,用通用模型训练,可以深入挖掘出越来越多的规律,并可利用跨模态的数据完成对真实世界各个维度的刻画,从而逼近世界真理。如此发展之下,数字智能和具身智能系统结合,在越来越融入人类社会的同时,将影响人类的生活习惯、思维方式甚至认知。我们认为,一场智能浪潮正在酝酿,AI也将更加深刻、更加显著地对人类社会产生变革性的影响。
二、“研发—应用”加速循环,智能融合浪潮已来
从市场预期和企业盈利来看,当前AI技术发展或已跨过S曲线的第一拐点,“研发—应用”的循环迭代正在加速,在规模定律和新摩尔定律的支撑以及市场竞争的激励下,智能成本持续下降,AI与产业的智能融合浪潮已经袭来。
(一)通用模型赋予AI更强融合潜力
进入通用模型时代,AI呈现出成长为一项通用目的技术的趋势。历史上,包括蒸汽机、电力和IT(信息技术)在内的通用目的技术在广泛融合产业的过程中表现出三个特征:[51]一是应用具有普遍性,使用范围并非局限于单个产品或行业;二是催生次级创新,为各行业相对成熟的现有技术提供新的活力;三是技术上持续改进,随着成本下降或性能提升适用于越来越多的场景。从三个特征来看,通用模型时代的AI与产业融合的能力较之前可能更强。
应用范围方面,智能模拟的通用性使本轮AI技术具有更高的产业兼容性,将提升AI的渗透度。本轮AI能够理解指令并自主学习,倾向于对人而非特定机器的替代。各行业几乎都有人的参与,需要完成的任务都与人的智能相关,这使本轮AI技术相较其他技术具有更高的兼容性。随着AI模拟智能场景的扩张,AI与人可以完成任务的重叠度增加,且AI逐步覆盖对认知能力要求更高的复杂任务集。[52]生成式AI在各行业均出现了加速部署趋势。[53]百度文心一言大语言模型由于具备信息处理和解决问题的通用智能,对外发布一周内就有互联网、传媒、金融、汽车、医疗、教育、房地产等多个领域的数百家企业宣布加入生态,[54]体现出AI行业应用的普遍性。对比来看,电力和IT的采用是分部门、有次序进行的,率先采用电力的部门是此前严重依赖蒸汽动力的印刷业、电机业和交通业,而木材、食品制造等部门的电气化进程则滞后了近20年才开始;[55]而此次AI技术提供的通用智能在一开始就被众多行业积极采用,各行业开始采用的时间差距并没有那么大,因此整体上AI对经济社会的影响也可能更深远。
创新催生方面,本轮AI正在推动次级创新的发生,甚至在研发端开启了科学研究的新范式。就像蒸汽机和电力等通用目的技术的嵌入推动了各类机械制造工艺的创新,AI技术也与各行业相对成熟的现有技术结合,产生了自动驾驶汽车、医疗影像分析系统和个性化推荐商业软件等次级创新。不仅如此,与电力和IT促进创新时人类处于操控和主导地位不同,AI还可以直接参与研发端的科学发现过程,以相对更高的自主性和创造性与人类进行更深入的协作,通过改进搜寻和推理过程来赋能科学研究的各个阶段,从而完善大尺度、高精度、高成本的研究范式,[56]加速各个领域的创新。澳大利亚学术研究机构CSIRO称,截至2023年,超过99%的研究领域曾发表涉及AI的学术论文;《自然》杂志发现,各学科发表论文中与AI相关的比例加速提升,2023年在标题或摘要中提及AI或AI相关关键词的论文占比为8%,而10年前仅为2%。[57]
技术改进方面,在通用模型的推动下,本轮AI跨越了智能藩篱,能力不断提升。当前的AI在语义分析、数理逻辑、编程等方面的测试得分逐步提升;[58]通过允许更大的上下文窗口和集成外部搜索引擎等方式,AI打破了数据时间、容量和内容的限制,从而越来越精准地理解用户意图,进一步提高了通用智能水平。不仅如此,从GPT-4到GPT-4o,AI模型还通过将输入和输出数据的形式拓展至文本以外的图像、音频、视频等模态,贴近人类感知世界的方式,多路交叉验证,全面理解高维现实世界,显著提高了能力。[59]AI正在跨过越来越多应用场景的智能门槛,从最初的基础翻译和预设问答,到更复杂的程序编码、实验操作、金融分析,再到更开放的艺术设计、影视创作,产业适用性随着技术改进不断提升。
从应用范围、创新催生和技术改进角度看,当前的AI具有成为通用目的技术的特征。不过值得注意的是,通用目的技术是一个后验的概念,各行各业的采用、次级创新的催生、技术的迭代改进都需要时间的沉淀和检验。技术路径的不确定性,市场的理解和接受程度,配套的基础设施和知识库,等等,这些都会影响一项技术能否扩散、需要花多长时间完成扩散。那么,本轮AI技术发展到了什么阶段,又将带来多大程度的社会经济影响呢?
(二)跨过S曲线第一拐点,智能融合蓄势待发
技术发展通常要经历三个阶段,生命周期遵循“S曲线”(见图1.5)。S曲线刻画了技术的累计采用率——在初始阶段扩散较为缓慢,随后进入加速期,最终放缓并达到饱和。从经济学角度看,扩散速度的变化主要受到创新成本和收益的影响。在早期阶段,新技术本身由于尚不成熟而面临着很多未知因素,需要投入大量的研发费用进行试错,并配套开发专门的材料、工艺和基础设施,创新成本非常高昂;而消费者可能尚不了解新技术的价值,或不愿为之支付高价,导致需求较低、收益有限。此时,技术与产业的融合往往处于入不敷出的“烧钱”状态,由于缺乏相对确定的盈利能力和应用前景,也难以吸引充足的资金、人才等外部资源,技术发展和市场扩散速度较慢。随着技术改进和市场磨合,实现同等性能的技术应用成本大幅下降,同时市场需求逐步增长,技术与产业的融合最终将越过创新的盈亏平衡点,开始盈利。自此,盈利的再投资,叠加外部资源在识别出潜在机会后的进入,将加速技术改进和市场扩张,这又将进一步增加盈利并吸引新进入者,从而实现“研发更先进的技术—获取市场利润—支撑进一步研发”正向循环下的持续迭代。最后,当大多数市场用户采用了该技术,且技术逐渐成熟时,盈利模式由抢占新市场转为存量竞争、盈利增速放缓,同时由于技术改进的边际成本增加,技术进步的速度将开始减缓,技术扩散速度将再次变慢。
图1.5 “研发—应用”正向循环下技术迭代和循环的S曲线
资料来源:中金研究院。
基于上述分析,判断一项新技术行至S曲线何处,主要在于其是否具有较为确定的市场需求(即盈利预期),或产业研发者是否已经开始盈利以及潜在进入者是否大量投入资源。基于以下几个理由,我们判断本轮AI技术已经跨过S曲线的第一拐点。
首先,本轮AI技术已经出现较为确定的市场需求。从专利授权的角度来看,AI商业落地场景正不断扩张(见图1.6),如医疗保健业的疾病诊疗和新药开发,金融业的欺诈检测和辅助投资,制造业的人形机器人协助搬运,零售业的个性化推荐和库存管理,交通运输业的自动驾驶,等等。同时,一些商业化的项目已经具备了成规模的用户群体。以OpenAI的ChatGPT为例,其全球用户数在产品推出5天内破百万,不到3个月破亿。[60]
图1.6 全球AI发展趋势
资料来源:Our World in Data,Stanford University,中金研究院。
其次,AI相关企业的盈利能力显著提升,吸引潜在进入者入局加码。仍以OpenAI为例,其盈利已从2022年的2亿美元提升至2023年的20亿美元。[61]广泛的盈利场景正在吸引越来越多厂商将产品与AI融合,微软在2024年5月宣布将AI助手Copilot全面融入Windows操作系统,并与合作伙伴戴尔、惠普、联想和三星等合作推出一系列搭载高性能AI处理器的PC(个人计算机)设备。[62]据IDC(国际数据公司)预计,全球AI PC出货量将从2024年的近5 000万台增长至2027年的1.67亿台,届时可能占到所有PC出货量的近60%。[63]AI领域自2021年起出现了私人投资额和新成立公司数的明显提升(见图1.6),其中生成式AI领域2023年吸引了252亿美元的私人投资,接近2022年的9倍。[64]而激烈的市场竞争,将不断推动企业进行“任务驱动”的快速技术迭代,使S曲线呈现出陡峭的上行趋势。
最后,市场对AI技术进步仍然充满信心。无论是通用模型的进步,还是规模定律仍未遇到瓶颈,都让产业研发者们对AI能力的提升和商业化落地充满期待。已经实现商业化落地的AI,比如生成式AI或者人形机器人不会再走回头路,这是AI实现与产业融合的基本盘,研发与应用的循环迭代已经形成。此外,依据算力新摩尔定律,可用的计算资源将随时间推移递增,每隔数年(有学者测算为5~10年[65])将出现一个数量级的改进。而人类对未来AI能力提升的预期,将进一步推动AI与产业融合的资源投入,加速研发与应用的循环迭代。
跨过S曲线的第一拐点预示着“研发—应用”正向循环的开启,我们将迎来产业与AI快速融合的阶段。至于本轮AI技术何时迎来第二拐点,目前还较难判断,可能尚有较长一段时间。从通用目的技术扩散的历史经验来看,若以“获取电力服务”和“拥有个人计算机”的累计家庭比例来衡量电力和IT的采用情况,则在通用目的技术出现的第35年前后,需求端采用率约达到70%时,技术越过S曲线第二拐点。[66]然而,如果遇到高质量数据、能源短缺等瓶颈,AI技术发展速度或将受到拖累,甚至提前跨过第二拐点,进入平缓期。
(三)智能成本下降是核心,对经济与社会影响深远
AI新变革的核心是智能成本的快速下降。从智能类别来看,无论是数字智能还是具身智能,AI模拟智能的成本都在快速下降(见图1.7)。AI目前在一些自然辨识、数理逻辑和语言智能任务中已达到人类平均表现且智能成本已下降至低于人类劳动者。例如,一名平面设计师创建一个动漫角色大约需要一小时,其时薪超过100美元,而人工智能完成相同的任务只需要0.01美分和1秒。[67]从部署AI以获得智能的成本拆分来看,性能要求决定的训练成本、任务量决定的执行成本、配置和维护要求的工程师成本三个部分都在随时间推移快速下降。[68]训练成本主要取决于算力成本和数据成本,在给定性能要求即参数量和数据量确定的条件下,据中金公司研究部估测,硬件、软件、算法和计算架构的进步将共同推动单位计算成本持续下降超过99%,[69]收集或合成数据的成本在长期也将随着数据的开放与共享以及数字技术的进步而下降。以前沿的AI基础模型为例,GPT-3水平的生成式模型的训练成本从2020年的460万美元下降至2022年的45万美元,年降幅约为70%。[70]给定任务量的条件下,执行成本未来也将进一步随着算力成本下降而不断下降,如OpenAI对GPT-3和GPT-4的API(应用程序接口)推理定价正在加速下降;[71]又如人形机器人的成本也从2023年的每台5万~25万美元(低端版本至最先进版本)下降近40%至2024年的3万~15万美元,[72]马斯克还表示特斯拉Optimus人形机器人的最终成本将降至2万~2.5万美元。[73]工程师成本是公司雇用工程师配置和维护AI产品所支付的工资。随着大模型厂商针对客户需求推出轻量级、低延迟的版本(如Gemini 1.5 Flash)并侧重改善不同任务或语言下的模型性能,基础模型的场景贴合度提升,垂类模型的接入和微调仅需要小型工程师团队,这有助于降低工程师成本。相较人类接受教育和技能培训的学习训练过程,AI的迁移成本(即边际智能成本)非常低,在进行少量微调即可复用模型的相似场景间迁移的成本甚至趋近于0。而这都意味着,在研发与应用的循环迭代期间,智能成本的下降可能是最重要的特征。
图1.7 2019—2024年AI模拟智能的成本走势
注:2024年中国协作机器人均价为预测值,OpenAI每100万个词元输出成本参考2021年GPT-3、2022年GPT-3 Davinci和2023年GPT3.5-Turbo定价。
资料来源:高工机器人产业研究所,OpenAI API Pricing,Dibia(2023),中金研究院。
智能成本的快速下降可能给社会、经济和文化带来深远影响。从生产端看,智能成本的下降将人类从常规智能任务中部分解放出来,人类与AI的再分工有助于缓解劳动力不足或增速放缓的限制。正如此前自动化机器人对常规体力劳动者的取代,我们认为理论上本轮模拟通用智能的AI或在成本降至人类劳动者以下后发生类似的取代。目前AI智能水平尚未全面达到人类水平,这种取代可能不是完全的,主要限于部分重复性和规则化的智能任务。关于AI与人类劳动者分工的最终界限,目前尚有较大争议,以斯坦福大学教授李飞飞为代表的一派认为[74],人类将随着AI技术的演进动态更新和精进能力,并借助AI跃迁到更高的智能水平,其间可能由于AI发展速度快于人类技能调整速度而出现结构性失业,但最终人类将适应AI技术并用其赋能,从而持续提高劳动生产率。也有以OpenAI联合创始人山姆·阿尔特曼(Sam Altman)为代表的另一派认为[75],AI模拟的通用智能将在一些部门超过并几乎完全取代人类劳动者,进而导致经济表现出“鲍莫尔病”,即人类越来越多地集中于AI相对不擅长且效率相对较低的部门,最终AI全面达到人类智能水平时,人类或将不再需要工作。无论是何种结局,作为一项通用目的技术,AI都具有推动经济增长和调整就业结构的巨大潜力。从消费端看,智能成本的下降将激发新的智能需求,进而带来深远的社会经济影响。IT革命时期信息传播成本和计算成本快速降低,涌现出电子商务、社交媒体、流媒体服务等大量数字内容分发和计算需求。类似地,在AI技术的演进过程中,已有的智能需求将随之调整,如精准推荐和定制的个性化需求相对标准化需求可能提升,同时出现各类意想不到的新智能需求,如人类与虚拟数字人的情感互动等。除了经济角度的需求扩张和结构调整,AI技术进步还将产生复杂的社会影响,比如虚拟数字人可能缓解人类孤独、抑郁等心理问题并满足其情感需求,但也可能成为滋生诈骗活动的温床,人机伦理问题也可能变得更加尖锐。[76]
总的来讲,AI推动的智能融合浪潮具备了重新定义国际竞争格局的潜力。电力革命之前,英国作为“日不落帝国”曾享受国际领导者带来的政治经济溢价,但随着电力革命在美国的扩散,英国被美国赶超,这些溢价也逐渐消失。技术变革为各国打开新的竞争窗口——领先者希望在技术变革中维持领先地位,后发者希望通过技术变革得以追赶领先者,技术变革是各国竞争的重要阵地。本轮AI变革也是如此。那么,各国的AI发展格局如何,谁又会引领这一轮智能融合浪潮?
三、谁将引领这场智能融合浪潮?
(一)“研发—应用”迭代是基础
从历史经验来看,在通用目的技术越过S曲线第一拐点后,哪个国家可以引领新一轮技术与产业融合浪潮,主要取决于谁会在新技术的“研发—应用”循环迭代中胜出。英国就是通过撬动研发与应用两端并使之相互促进从而引领第一次工业革命的。蒸汽机的发明和改良是具有基础性、颠覆性的创新,之所以发生在英国,与其当时作为世界大国的积淀密不可分。首先,英国有17世纪欧洲科学革命带来的理论基础,如牛顿等人的力学理论成为后来工程技术发展的基石。其次,英国本土早期的技术积累也相当丰厚,在第一次工业革命前夕,英国在采矿、冶金、机械制造等领域也已积累了丰富的技术和工艺,如,亨利·科特发明的“搅拌”和“碾压”法,使炼铁功效提高数十倍,为蒸汽机的大规模生产提供了材料基础,此外,18世纪英国机床的发明也使得复杂机械设备的制造成为可能。最后,英国的人才积累也不容小觑,当时的英国有大量像詹姆斯·瓦特这样具备实践经验和创新精神的工匠或工程师,瓦特正是在纽科门蒸汽机的基础上做了改进,通过增加冷凝器和改进气缸,显著提高了蒸汽机的效率。这一系列的优势保障了英国在技术革新浪潮初期取得研发端的领先地位。而英国最终引领第一次工业革命,还离不开其应用端发展对创新形成的整体支撑。在技术越过第一拐点后,英国存在着充足的应用空间,乔治·斯蒂芬孙在蒸汽机技术的基础上发明了在铁轨上运行的蒸汽机车,大大提高了英国陆路运输效率,而铁路的建设和普及,再叠加蒸汽机在运输、制造业等多领域带来的革命性变化,进一步推动了工业化和城市化的进程,又在此基础上激发了新一轮的初级创新,各行业生产力的快速提升真正意义上使英国以“世界工厂”的身份成为第一次工业革命的引领者。
研发与应用的最早发生有可能不是在一个国家,在第二次工业革命中,美国则通过引用技术和应用成果反哺实现了超越。电力的初级创新最早集中发生在19世纪的欧洲,尤其是德国和英国。英国科学家戴维在1809年发明了最早的电光源之一电弧灯;法拉第在1831年发明的电磁感应装置,是现代发电机的前身。然而,产生大规模影响的次级创新却发生在美国,托马斯·爱迪生和尼古拉·特斯拉在电灯、电力传输和电动机等方面的发明奠定了现代电力系统的基础,进一步推动电力技术跨过第一拐点。欧洲的电力技术通过人才交流、技术转移和跨国公司的全球布局,迅速传入美国。美国拥有广阔的疆域和大量的人口,这为电力技术的应用和扩展提供了广阔的市场,加上美国当时的经济快速增长,资本迅速积累,大量资金得以投到电力基础设施的建设中,这些基础设施的完善反过来又促进了电力技术的进一步发展和应用。美国在原有技术的基础上,加速进行大规模的工业应用和改进,例如,爱迪生和特斯拉发明的电力设备与系统被广泛应用于城市电网建设、家庭电器等多个领域,显著提升了技术的实际应用价值,推动了电气化进程,使得美国制造业和服务业的效率显著提升,工业产值在20世纪初迅速超越欧洲各国,成为全球最大的工业国家。
电子信息领域也存在“研发—应用”迭代、二者互促引发技术革命引领者变位的生动案例。始于20世纪50年代的半导体产业发展至今,研发制造领域的引领者几乎群集于美国,由此支撑的各项应用创新,如智能手机、电子商务、移动支付也大都肇始于欧美。然而,中国基于次前沿和成熟技术,在应用层后来居上,孕育了抖音、微信、拼多多等囊括社交网络、生活服务、电子商务、共享业务等的许多具有全球影响力的互联网巨头。自2008年以来,中国电子商务持续快速增长,交易额占全球的比例从不到1%发展到10年后的40%以上,超过法国、德国、日本、英国和美国的总和。[77]中国的移动支付在采用率和交易额方面也由于支付宝等的广泛使用完成赶超,居于世界领先地位。大市场还带来多梯度、多层次结构的消费群体和消费场景,又反哺新一轮的初级创新,从而强化了“研发—应用”推动的循环迭代。
那么本轮AI与产业融合的浪潮中,研发端与应用端的循环迭代究竟取决于哪些因素呢?
(二)算力、数据、人才、金融推动研发端创新
算力、数据和算法是当前AI研发端的三个要素,三个要素相互联系、相互影响,共同决定了AI技术进步的水平,而金融支持对撬动市场力量以支持技术跃迁也同样关键。与其他技术有所不同,AI领域的知识具有更广的多样性和更高的复杂性,且其知识库正处在一个持续快速扩张的状态中,既包括与“科学创新”相关的理论知识,如数据科学、算法理论、统计学等专业基础知识,又包括与“经验创新”相关的实践知识,这在调整参数、模型训练过程中十分重要。[78]与便于传播的理论知识相比,偏重“工匠”经验的实践类“知识库”较难获取、分解和转移,后来者想要完全依靠自身研发对这些知识进行吸收存在较大困难。此外,由于知识本身还具有规模报酬递增特征,即随着知识积累的增加,知识的生产效率不断提高,由此带来的经济效益会不断增加,[79]在硬件基础、数据、人才和金融支持等方面有长期积累的先发者因此会筑起较高的优势壁垒。[80]
算力在AI时代承担着重要角色,但其提升依赖高性能芯片的发展,核心技术壁垒较高。进入深度学习时代后,AI算力提升的曲线相较以前更加陡峭。2010年前,训练AI的计算量每21.6个月翻一番;2010年以来,在最大的AI模型训练中所使用的计算量大约在6个月内翻倍,2010—2023年已增长了3.5亿倍。为了获得AI性能的整体提升,需要持续投入大量的硬件GPU。而在芯片领域,首先,芯片制造是复杂的系统工程,在设计、制造、封装测试等环节中,该领域的传统领先者积累了大量知识,形成了技术壁垒;其次,美国GPU领先全球,后发国家受到一定程度的制约,追赶存在一定难度。根据IDC测算,2023年中国智能算力规模达到414.1EFLOPS(每秒1018次浮点运算),同比增长59.3%。但从国际比较来看,2024年中国全国智能算力规模或低于互联网公司Meta所拥有的英伟达高性能计算芯片H100算力。
数据是AI研发层的“养料”和“教材”,同时数据也是AI性能和表现的“检验器”。在AI研发竞争中,除了数据规模外,数据质量的重要性也日益凸显。高质量数据集对于优化AI模型表现十分重要,不过,有关数据质量高低的定义是动态的,随着AI发展,其能力不断增强,决定了其对所需数据“养料”的要求也在不断变化。在大语言模型时代,AI已经呈现出初步的文本理解潜力,Sora(OpenAI研发的一款文本生成视频大模型)的突破不仅呈现出AI多模态交互的能力,也展现出其能理解世界的迹象,这意味着当前AI的发展目标已不仅仅是对人类“思维”的模拟,而且是全面地实现人类与现实世界的交互。古纳塞克等人提出,在大语言模型中,高质量的预训练数据应当类似人类的“教科书”,这要求数据库具备数据储量充足、多样性高、精准度高、清晰明了等特征。[81]随着AI训练数据上升到图像和视频维度,高质量数据或更偏重由机器直接捕获的未经人类创作的图像、视频等形式,数据的维度也越发多元,触觉、味觉、嗅觉等数据将进入AI训练数据集,人类或将更少参与数据的获取过程或记录和传输的中介过程。在研发端对更高质量、更多维度、更大体量数据的需求激增的情形下,大国凭借规模优势将较为自然地形成先发优势,为未来AI发展所必需的数据挖掘提供更坚实的基础。但大体量数据只是产生高质量数据的一个条件,数据的收集、清洗、标注、验证和合成等步骤对优质数据的形成也十分关键,而在这些技术过程中所积累的知识往往不易传播,它们最易在掌握前沿技术的大国形成聚集,从而强化AI研发层面的优势。[82]
算法是AI研发的核心,高技术人才是保障算法突破的关键,而人才聚集效应巩固了先发国家的优势,加大了后发国家追赶难度。随着技术的发展,AI需要解决的任务变得更加复杂,传统算法难以满足医疗、金融、交通等广泛场景的不同需求,数据量的大幅增长也对提高信息处理的准确性和效率、减少计算资源浪费提出了更高的要求,这亟须算法的突破性创新。算法发展需要具备专业知识和创新能力的高技术人才,他们可以为算法的发展提供新思路、新方法,是推动算法突破的主体力量。然而人才数量未必能充分转化为突破性创新产出,人才质量尤为重要。2010—2020年中国发表AI领域论文的科研人员数量全球领先,超出美国近20万人,[83]但在本轮AI发展较为关键的研究领域却落后于美国。由于知识库的复杂性和人才培养的长期性,传统技术大国往往具备技术累积优势。一项新的算法提出后,相关理论知识易于传播,可以在全球范围内流动,但前沿算法人才会产生显著的集聚效应。人才聚集之后,他们可以更容易地分享实践知识、技能和研究成果,促进知识溢出和跨领域整合,加速算法的发展和优化,提高研发效率,这进一步巩固了技术引领地的人才优势,同时激励其继续培养和吸引创新人才,为算法突破提供持续动力。据2023年统计数据,世界顶尖AI人才聚集的科研中心多数在美国,在全球排名前25的AI研究机构中,美国有15个,中国有6个。[84]此外,分析当前全球最具影响力的基础模型(如OpenAI的GPT-4o,谷歌的Gemini 1.5 Pro,Meta的Llama 3,美国AI公司Anthropic的Claude 3等)所属组织的核心技术人才网络,可以发现,当前AI研发的顶尖人才仍主要聚集于北美,亚洲、欧洲等地的算法创新人才在不同程度上属于北美人才集群的延伸。如果AI技术长期保持较短的技术周期,维持快速迭代,那么未来AI前沿研发人才或将仍然主要分布在少数技术规模大国,研发层面的优势将主要被它们掌握。
市场激励下的金融支持,对于AI研发并转化为现实生产力而言同样不可或缺。首先,在当前大模型快速发展阶段,硬件采购、软件开发、数据收集存储等都需要大量资金支持,金融资本能为AI研发的基础设施建设和维护提供保障。其次,以风险投资为代表的金融力量在支持AI初创和成熟企业的技术突破方面起到直接而关键的作用。许多AI领域的创新都由初创公司推动,而这些公司通常需要外部资本来帮其启动和扩展业务,如人工智能公司DeepMind被谷歌收购前主要依靠多轮风投才得以专注于突破性深度学习的研究,OpenAI在2019年改制后也是基于微软和风投机构的资金支持才开发出GPT-3等模型的。此外,风投等金融力量在AI芯片领域的投入也十分显著,英伟达得益于资本市场的支撑,才能持续研发高性能GPU。另外,充足的资金支持还能让企业和研究机构为研发团队提供有竞争力的薪酬和福利,以留住顶尖AI人才。
(三)市场规模、政策环境支撑应用端融合
AI应用的发展并不必需最前沿的技术,较为成熟的技术不确定性较低,技术轨迹也更容易预测,即使是后发者也可以较为容易地抓住“机会之窗”,通过技术转移、自研等方式获取相关技术知识。同时,由于非前沿技术的应用难度低,只要能够适应和抓住外部市场需求和制度政策变化带来的机会,减少试错成本,就能在应用端取得优势。[85]大规模市场与健康的政策环境是AI技术越过S曲线第一拐点后,在应用端的两大重要推力。
一方面,多元细分的大市场可以降低AI应用的门槛。从市场层面看,商业市场潜力大的行业更能够发挥市场规模优势。大国的市场需求多样性较强,创新场景丰富,更易匹配成熟技术的各种应用场景,这为AI技术应用带来更大的扩散空间,能更广泛地刺激AI次级创新的产生。对于暂处落后地位的大国,其总体市场和细分市场规模均足够大,可进一步摊薄次级创新的成本,支撑AI应用实现商业利润,利润又反哺应用技术的进一步创新,研发、应用形成正向循环,其有望快速缩小与领先国家的差距。
另一方面,支持性的政策环境则为AI次级创新的持续发展提供动力。在AI应用发展过程中,政策环境涵盖了有政府引导和参与的治理监管整体方向、技术及伦理标准制定、人才培养体系、知识产权及隐私保护措施和国际合作政策等诸多方面。稳健、灵活、包容的政策措施能激发应用创新活力,为企业和研究机构创造可预期的市场环境。良好的法律和政策框架可以帮助企业在开发和应用AI技术时遵守法规,避免法律纠纷和用户信任问题,从而较为顺畅地实现广泛商业化,如欧盟2024年通过《人工智能法案》,[86]为规范AI技术的使用、确保技术发展与道德规范相符提供了较为明确的依据,其基于风险程度对AI进行分类,要求高风险AI系统的开发者提供详细的技术和合规评估文件,以确保系统的透明度和问责性。但鉴于该法案对高风险AI及数据使用、隐私保护提出严格要求,也在一定程度上带来了增加技术开发应用的成本和时间、影响AI技术创新速度和市场竞争力的风险。
综上,本轮AI浪潮的竞争格局尚在形成过程中,对于谁将占据引领者地位,我们还需要综合考量各国在研发端和应用端的发展势头,前者主要依赖算力、数据、人才和金融支持的整体水平,后者则倚重市场规模和政策环境的支持效果,二者相互促进,才能持续推动AI创新,从而提升整体经济动能。为此,我们专门构建了AI发展指数,以评估各国在本轮技术浪潮中的智能融合潜力和相对地位。
四、度量智能融合浪潮强弱——AI发展指数
如本章第二部分所述,达到S曲线的第一拐点后,研发端的技术改进和应用端的市场扩散将相互促进,加速创新发展。为了刻画本轮AI浪潮中各国的发展潜力,我们从研发和应用两个层面来衡量一个国家AI技术越过S曲线第一拐点后在经济中引领智能融合浪潮的能力,并将其命名为“AI发展指数”。该指数旨在刻画AI通过“研发—应用”正向循环发展的速度:研发层面的“技术活跃度”越高,AI可实现的功能和可结合的应用场景就越多,从而在市场竞争中越能快速地吸引和积累庞大的用户群体,增加潜在的应用市场规模;应用层面的“市场友好度”越高,市场对AI的需求就越大,进而可通过体验反馈和盈利反哺加快技术进步和扩散。AI发展指数为我们理解未来AI发展的影响因素,以及我国在国际竞争中的地位和优劣势提供了思路。
(一)研发与应用并重,构建AI发展指数
AI发展指数从研发和应用两个层面出发(见图1.8)。基于本章第三部分的分析,我们构建了研发层面的“技术活跃度”指标,从算力、算法、数据和金融四个方面衡量一国AI技术相对于国际前沿的水平,以及应用层面的“市场友好度”指标,从暴露规模、扩散程度和政策环境三个方面衡量一国应用AI技术的潜力和成本。研发和应用相互促进,因而将二者标准化后进行几何平均可得到“AI发展指数”,该指数反映AI在越过S曲线第一拐点后通过“研发—应用”正向循环发展的速度。
图1.8 AI发展指数的构建框架
“技术活跃度”刻画了各国AI研发端在算力、算法、数据和金融四个方面的禀赋情况(见表1.1)。算力方面,新一代AI系统依赖高性能计算,[87]同时,依据规模定律,AI训练对算力的需求快速提升,主要依赖数据中心和云端网络集中部署大规模算力,以获得稳定性和可扩展的灵活性。[88]算法方面,顶尖AI人才是前沿AI算法的本源,将无形的AI算法知识转化为落地产品的能力至关重要。数据方面,已有的和待收集的多模态、高质量数据共同构成了训练AI的数据禀赋,同时获取、使用和流通这些数据的制度环境也是重要的影响因素。金融方面,算力、人才和数据都需要大量资金的支持,高度不确定性和高投资门槛下,前沿AI技术的研发和落地尤其离不开商业性风投的支持,其为AI技术的持续突破提供动力。[89]特别地,算法和数据维度区分考虑了AI模拟的两类人类智能:一类是不借助物理实体即可完成的智能操作,如处理信息、规划推理等,训练这类智能所用的数据基本已存在,如文本、图像、音视频等;另一类是需要借助物理实体来完成的,涉及真实物理空间中的位置移动、灵活操作等,所需的数据主要包括人类与环境互动时的动作行为数据等,大多数处于起步阶段,需要有意去合成、生成和收集。
表1.1 “技术活跃度”指标
资料来源:中金研究院。
AI应用层面的市场友好度指标,主要由AI产业的暴露规模、扩散程度和政策环境三个方面组成。首先,“暴露规模”可由根据不同行业中可以使用AI进行替代或赋能的场景比例和国家产值的行业结构计算出来的一国理论上暴露于AI技术的GDP比例,再乘以按该国购买力平价计算的GDP得到。其次,“扩散程度”主要通过度量各国AI暴露产值的行业份额方差,来衡量AI应用的外部规模经济效应,理论上技术应用场景越多、越分散,其带来的外部规模经济效应越大。最后,“政策环境”包括一国的AI战略、监管质量、网络安全、伦理准则等,它们都有可能影响AI技术的应用成本,所以我们在此也将它们纳入市场友好度的考量范围。[90]
(二)AI发展指数一览
通过就20个全球经济体量靠前的国家计算AI发展指数,我们发现,当前美国、中国位于第一梯队,它们各自占据研发、应用相对领先优势的全球AI竞争格局初露端倪(见图1.9)。若将美国各指标标准化为1,则中国的AI发展指数为0.76,居全球第二,高于第二梯队的德国(0.32)、日本(0.31)和英国(0.31)。研发层面,中国技术活跃度(0.50)相较前沿的美国仍有差距,但与第二梯队的英国(0.16)、德国(0.15)和日本(0.14)相比展现出明显的优势;应用层面,中国的市场友好度(1.16)处于领先地位,主要受益于庞大的市场规模和均衡的产业分布。在决定AI研发和应用水平的要素禀赋方面,不同国家有相对擅长的方向。与中国类似的在应用层面具有比较优势的国家包括印度、俄罗斯、巴西等,与美国类似的在研发层面具有比较优势的国家包括英国、韩国、瑞士等。
图1.9 AI发展指数测算结果
资料来源:IMF,世界银行,中金研究院。
(三)各国优势与面临的挑战
在此次智能融合浪潮引发的国际竞争中,中国整体上具有一定的技术优势和发挥规模效应的空间,有助于在AI技术达到S曲线第一拐点后通过更强的“研发—应用”正向循环推进AI发展。那么,从拆分细项来看,我国在哪些影响AI发展的方面面临限制,在哪些方面具备值得进一步发扬的优势呢?
从研发端来看,高性能算力和数据可得性成为中国AI技术赶超的主要挑战(见图1.10a)。在算力维度,中国的高性能算力受到美国出口限制影响,目前自研芯片提供的算力性能高于美国设置的限制标准,但在国际上处于相对落后的状态;[91]美国智能芯片迭代速度快,采取优先用最高算力性能的GB200芯片满足国内需求、延迟面向全球供应的措施,并向他国供给次优算力性能的H100、A100芯片,从而有效拉开了和其他国家的算力性能差距。中国的规模算力部署,包括云计算和数据中心服务器等软硬件的市场规模,位居全球第二,虽然与美国还有差距,但相较其他国家表现出明显的规模优势,能够提供部分AI训练和推理所需的大规模算力。在算法维度,中国整体表现显著优于第二梯队的德国、英国、法国,尤其是AI算法的前沿知识创新能力与美国相差不大,但算法集成与开发落地产品的能力或相对欠缺,截至2023年,中国的AI创业公司数量不到美国的三分之一。[92]在数据维度,中国具有规模庞大的数据生产者,历史上已经积累了相对丰富的数据,对于AI所需的自动驾驶、人形机器人等领域的待收集数据,也具备一定的挖掘或合成能力。但中国在数据可得性方面仍有改善空间,数据的开放程度、治理框架和基建网络等在一定程度上可能落后于欧美发达国家。在金融维度,据OECD(经济合作与发展组织)统计,2022—2023年,美、中AI风投项目数量的全球份额分别保持在30%和20%,金额占比则分别保持在50%和20%左右,这与两国经济体量相对值有较大差别。考虑到逆全球化趋势加剧,美国限制本土私募基金和风险资金对关键领域的海外科技公司进行投资,可能进一步拉开各国在AI研发方面获得金融支持的差距。我们认为,未来中国在金融方面支持科技的主要发力者可能转向国内金融投资机构,所以我国直接融资体系亟待完善。
从应用端来看,中国的AI暴露规模居于世界首位,在具身智能的应用领域具有尤为广阔的市场,且行业扩散程度更为均匀,可能带来更显著的外部规模经济效应。我们估计,2023年中国按购买力平价计算的AI暴露规模约为16.5万亿美元,处在第二位的美国约为11.6万亿美元,其中,两国的数字智能暴露规模均约为5万亿美元,主要差距体现在中国的具身智能暴露规模明显大于美国(见图1.10b)。从结构上看,中国产值更多地分布在具身智能暴露程度较高的那些行业,包括农林牧渔、交通运输、采矿、建筑和制造业等,而美国产值则更多地分布在数字智能暴露程度较高的房地产、科学研究与技术服务、信息传输、计算机服务等行业。基于各国AI暴露产值中各行业份额方差,中国的行业扩散程度相对更均匀,有助于放大外部规模经济效应,促进协同转型和基础设施共享。政策环境与AI应用的关系较为复杂,出于隐私和人权等考虑对AI进行严格监管有助于防范潜在风险,也可能限制应用落地。中、美、日及欧洲等地目前都充分重视且提出了人工智能发展战略,并积极关注数据保护。同时,不同地区因为文化价值观和社会经济需求的差异,对AI的监管程度也有差异。如欧盟通过《人工智能法案》,在监管质量和可靠性方面获得进展,但对AI训练数据透明度等方面的要求也引发了企业对因泄露商业机密而影响市场竞争的担忧,[93]美国相对注重国家安全和伦理问题,而中国对AI技术持相对开放的态度,或有助于推动应用快速落地。
图1.10 中国AI在研发端和应用端与他国对比
注:a.各分项为各国相对于美国的水平(美国=1);b.AI暴露规模由各行业的AI暴露程度与各行业产值占比加权求和,再乘以该国2023年按购买力平价计算的GDP获得,行业的AI暴露程度参考本书第三章“元任务”相关内容。
资料来源:iFinD,OECD,中金研究院。
割裂的全球市场可能会阻碍AI的价值实现并抑制创新,这或许会促使部分地区在未来的智能融合浪潮中深化合作。基于现实经济开放的视角,当前美国正在积极与欧洲和日本等地开展人工智能的广泛合作,包括晶圆厂和数据中心的跨国布局、AI学术研究的合作交流、AI初创企业的跨国投资等。这些举措可能加速第二梯队的国家对中国的技术追赶,从AI发展指数看,表现为美国的合作国在研发端快速逼近最前沿水平。以日本为例,如果美国在未来将新研制的高性能和先进超算供给日本使用,派遣顶尖人才指导,向日本传授AI技术,并共享已有的高质量和多模态数据、数据收集和合成的方法等,那么日本在AI发展指数上或将快速缩小与中国的差距。此时,中国经济的规模优势变得至关重要,它能够帮助中国在AI研发相对落后的情况下,依靠应用端的市场扩散维持一定的竞争力。
五、思考与启示
(一)通用模型或将带来AI认知真实世界规律的突破
本轮AI发展最重要的意义在于,以Transformer为代表的深度学习算法的成功,标志着AI在通用模型层面取得了重要进展,这让AI理解真实世界规律的能力获得了里程碑式的突破。人工智能是模拟智能的系统,而智能是对世界真理的总结和认知能力,人类智能通过处理世界上不同维度的、各种类型的信息去反推真理。出现通用模型前,AI无法对各种类型的信息进行通用处理,总结规律的视角不全面,从而无法深入认识世界,影响自身性能提高,模拟更高水平的智能需要通用模型。Transformer出现之初并非所谓的通用模型,但由于各种类型的数据都可以看作序列并用Transformer处理,所以其在更高维度上建构了多类型数据所蕴含的规律空间,并对这些规律进行总结,从而将各种类型的智能模拟统一在一个架构中,因此,其被“意外”地发现了通用性潜力。从这一角度出发,通用模型对AI发展具有重要意义。Transformer打开了AI通往通用模型时代的大门,但最终的答案也未必一定是Transformer,更优秀的通用算法架构将为AI发展带来助力。在通用模型中,AI对各类型数据信息进行通用处理,对各领域总结出来的规律进行迁移、交叉运用,更全面地刻画现实世界中的规律,对世界真理的认识或将逐渐逼近真实情况。同时,AI对真实世界的理解离不开真实世界信息的输入,这也为未来AI的数据和算力建设指明了方向,直接采集于真实世界的多模态数据建设方兴未艾,其与人形机器人、高精度传感器等的结合也将成为AI领域重点攻关方向,数据的丰富以及规模定律也都意味着更大的、性能更高的算力资源需求。
(二)智能成本下降将结构性冲击劳动力市场,教育培训和劳动保障是关键
智能成本作为AI新变革的核心,其快速下降可能引发AI和人类劳动者的再分工,进而对劳动力技能需求产生影响,在技术转型的过程中需要关注技术进步对劳动者的冲击。AI对劳动力市场的影响主要表现在两个方面。一是对于AI应用成本高于人类或表现不及人类的智能任务,其对应的人类劳动需求将相对提升。如近年来AI高暴露的岗位对具有社交(沟通、团队合作、谈判、演讲)和管理(员工监督、指导、领导)等AI互补型技能的人才需求逐步提高,而对提供基础电脑(包括编程)和行政文书等相关技能的人才需求有所下降。[94]二是随着AI应用的普及,市场对与开发维护AI系统、使用AI应用程序相关的人才的需求也将进一步提高。忽视技能转型要求,可能加剧技能不匹配导致的就业不充分,以及关键人才紧缺导致的各行业发展速度放缓。为此,公共政策可以在培训教育和劳动保障方面发挥重要作用。教育培训方面,容易被AI取代的劳动力是公共政策提供教育培训的重点对象,我国可以参考美欧通过牵头企业、社区与教育机构共同开发符合岗位需求的AI及其互补技能培训并建立认证计划,来加速人才技能转型;对于AI开发和应用等较难通过雇主培训获得的技能,政府可考虑向职业学校等专业机构拨款,以设置AI课程、雇用教师并为接受AI方面教育的学生提供补贴等。劳动保障方面,AI发展速度可能快于人类技能调整速度,进而引发结构性失业,对此劳动力保障政策应朝着鼓励人才流动和灵活就业的方向调整,如延长给付失业救济金的时间以支持失业人员完成AI技术及相关技能的学习,为因AI失业的劳动者提供经济和求职援助,减少就业的异地限制,等等。
(三)政策端着力构建良好的公私合作框架,打通AI“研发—应用”循环互促渠道
AI技术具有明确的非连续性创新特征,所谓非连续性技术创新是指采用与主流技术截然不同的技术路线,旨在实现产品性能的数量级改进或成本的数量级降低,其具有强颠覆性和弱预见性两个特征。强颠覆性意味着,该技术发展可以快速削弱传统国家或企业长期积累的技术优势,改变市场主体的力量对比;弱预见性是指技术路径具有不确定性,人们难以事先精准预测最终将成功的技术路径。两个特征均导致发展非连续性技术创新是各国摆脱发展限制的客观需要和占优策略。[95]AI正是具备强颠覆性与弱预见性的非连续性创新技术。在这一前提下,一方面,初级创新的领先者地位随时有可能由于新技术路径的突破而发生动摇,因此,即使当前追赶面临挑战,有机会跟随前沿的大国仍不可松懈对研发端的持续投入和大力支持;另一方面,为相对降低AI技术弱预见性带来的不确定性,有条件的大国若在技术相对成熟的应用端广泛探索、提前布局将有可能实现后发先至。而要实现研发和应用两方面的互促共进,离不开政策端发力,构建良好的公私合作框架,激发公私研究机构和企业的创新活力,为技术成果的应用和推广提供支持,从而打通初级创新与次级创新相互迭代的进路。值得参考的是,2023年美国国家科学基金会与其他联邦机构和高等学校合作,宣布成立7个新的AI研究所并提供战略性联邦投资,推动AI在科学和工业界的应用加速。[96]另外,还可借鉴欧盟《人工智能白皮书》中提出的构建“生态系统”的思路,适当增加对AI研发的公共投资,成立“AI研发公私网络”,[97]促进学术界和产业界紧密融合,吸引更多私营部门参与,鼓励初创公司在相对有保障的环境中测试新技术、新产品,并提供后续市场接口,促进其商业化。
(四)“研发弱,应用优”,需要放大市场需求对技术供给的反馈促进作用
根据AI发展指数,我国研发相对落后、应用较为领先的格局表明,撬动市场需求对技术供给的反馈促进作用可能成为我国研发追赶的重要发力方向。算力方面,AI研发需要平衡用户使用感受的改善和模型智能水平的突破,应用端的用户规模、使用习惯和智能需求等能够指导研发端算力性能和规模的部署。对于不同类型的算力要求,通过建设算力基础设施加强算力资源的统筹规划和调度,同时鼓励相关企业和科研机构协同开展算力芯片、架构、系统等关键技术的攻关。算法方面,协调AI开发者社区定期举办各类场景的创新大赛,鼓励AI解决方案提供商积极对接企业需求与技术供给,从而帮助研究和开发人员积累实战经验,并基于现实用例不断探索算法优化的可能。数据方面,为应用场景相关或用户画像相似的企业搭建公共数据平台,借助匿名或加密技术,在安全合规的前提下,推动生产和使用过程中的数据及其处理技术的共享。这将通过流程标准化和规模效应降低获取、清洗和分析数据的成本,帮助解决研发端数据规模不足、可得性差的问题,还可能利用数据之间的潜在关联进一步优化模型表现。金融方面,通过研发费用的税收减免等方式鼓励企业将AI产品盈利投入研发环节,强化应用到研发的反哺机制;同时,为AI应用企业、研发机构和投资机构提供交流平台,拓宽创新主体之间的对接渠道。
[1]本章作者:周子彭、李娜、陆趣、刘梦玲。
[2]Mayor A.Gods and Robots:Myths,Machines,and Ancient Dreams of Technology.Princeton University Press, 2019.
[3]Bishop C M.Pattern Recognition and Machine Learning.Springer,2006.
[4]LeCun Y,Bengio Y,Hinton G.“Deep Learning.”Nature,2015,521(7553).
[5]Legg S,Hutter M.“Universal Intelligence:A Definition of Machine Intelligence.”Minds and Machines, 2007, 17.
[6]Leningrad (RSFSR), Shirokov M, Moseley A C, et al.A Textbook of Marxist Philosophy. Gollancz, 1937.
[7]Plato P.The Republic.Oxford University Press,2008.
[8]Gardner H.Multiple Intelligences:The Theory in Practice.Basic Books/Hachette Book Group,1993.
[9]Stemberg R J.“Intelligence.State of the Art.”Dialogues in Clinical Neuroscience,2012,14(1).
[10]参见https://lexfridman.com/yann-lecun-3-transcript/。
[11]Chollet F.“On the Measure of Intelligence.”2019.
[12]Aquinas S T.“Summa Theologica.”1872.
[13]Christodoulou K C, Tsoucalas G.“Artificial Intelligence: From Talos to da Vinci.”2023.
[14]Descartes R.“Descartes: Discourse on the Method of Rightly Conducting the Reason, and Seeking Truth in the Sciences.”1658.
[15]Chomsky N.Language and Mind.Cambridge University Press,2006.
[16]Cajal S R.“Conexión General de los Elementos Nerviosos.”1889.
[17]Kandel E R.In Search of Memory:The Emergence of a New Science of Mind.W.W.Norton&Company, 2006.
[18]Cajal.“Conexión General de los Elementos Nerviosos.”1889.
[19]McCulloch W S,Pitts W.“A Logical Calculus of the Ideas Immanent in Nervous Activity.”The Bulletin of Mathematical Biophysics,1943.
[20]Rosenblatt F.“The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.”Psychological Review,1958,65(6).
[21]Minsky M L,Papert S A.Perceptrons:Expanded Edition.MIT Press,1988.
[22]Newell A.Unified Theories of Cognition.Harvard University Press,1990.
[23]Feigenbaum E A, Buchanan B G.“DENDRAL and META-DENDRAL: Roots of Knowledge Systems and Expert System Applications.”1994.
[24]Sipser M.“Introduction to the Theory of Computation.”ACM Sigact News,1996.
[25]Catania B,Zarri G P.Intelligent Database Systems.Addison-Wesley,2000.
[26]Fisher I A.“Cyc:History’s Forgotten AI Project.”Outsider Art,2024.
[27]Hopfield J J.“Neural Networks and Physical Systems with Emergent Collective Computational Abilities.”Proceedings of the National Academy of Sciences,1982,79(8).
[28]Rumelhart D E, Hinton G E, Williams R J.“Learning Representations by Back-Propagating Errors.”Nature,1986,323(6088).
[29]LeCun Y, Boser B, Denker J S, et al.“Backpropagation Applied to Handwritten Zip Code Recognition.”Neural Computation,1989,1(4).
[30]Hinton G E, Osindero S, Teh Y W.“A Fast Learning Algorithm for Deep Belief Nets.”Neural Computation,2006,18(7).
[31]Krizhevsky A, Sutskever I, Hinton G E.“Imagenet Classification with Deep Convolutional Neural Networks.”Advances in Neural Information Processing Systems,2012.
[32]Vaswani A,Shazeer N, Parmar N, et al.“Attention Is All You Need.”Advances in Neural Information Processing Systems,2017,30.
[33]Gupta A, Fan L, Ganguli S, et al.“Metamorph: Learning Universal Controllers with Transformers.”2022.
[34]Gao J, Cheng N, Fang B, et al.“Transformer in Touch: A Survey.”2024.
[35]Charoenkwan P, Nantasenamat C, Hasan M M, et al.“BERT4Bitter: A Bidirectional Encoder Representa-tions from Transformers (BERT)-Based Model for Improving the Prediction of Bitter Peptides.”Bioinformatics,2021,37(17).
[36]Trinh T H,Wu Y,Le Q V,et al.“Solving Olympiad Geometry Without Human Demonstrations.”Nature, 2024, 625(7995).
[37]数字智能指以虚拟智能助理形式存在的AI,可能仍以移动终端、互联网为载体,通过AI大模型对用户输入的文本、图像、视频、语音等信息进行处理,理解用户指令和需求,进行推理、规划等,内置长短期记忆功能,长期记忆部分依靠外挂知识库和增强检索引擎,并能根据任务要求和解决方案来发布指令或调用工具。
[38]具身智能主要指智能和物理实体的结合,如人形机器人和机器狗可以将感知、决策和执行加以统一,通过传感装置感知和收集各种类型的环境信息。
[39]参见https://app.youtubesummarized.com/r/3FxxT-sDnfk9zVtC5LOW-。
[40]Huh M, Cheung B, Wang T, et al.“The Platonic Representation Hypothesis.”2024.
[41]Sutton R.“The Bitter Lesson.”Incomplete Ideas (blog), 2019.
[42]参见https://www.nvidia.com/en-gb/about-nvidia/ai-computing/。
[43]Kaplan J, McCandlish S, Henighan T, et al.“Scaling Laws for Neural Language Models.”2020.
[44]Henighan T, Kaplan J, Katz M, et al.“Scaling Laws for Autoregressive Generative Modeling.”2020.
[45]Isik B, Ponomareva N, Hazimeh H, et al.“Scaling Laws for Downstream Task Performance of Large Language Models.”2024.
[46]Wei J, Tay Y, Bommasani R, et al.“Emergent Abilities of Large Language Models.”2022.
[47]Schaeffer R, Miranda B, Koyejo S.“Are Emergent Abilities of Large Language Models a Mirage?”2023.
[48]Villalobos P, Sevilla J, Heim L, et al.“Will We Run out of Data? An Analysis of the Limits of Scaling Datasets in Machine Learning.”2022.
[49]Chomsky N,Roberts L,Watmull J.“The False Promise of ChatGPT.”The New York Times,2023.
[50]Marcus G.“The Next Decade in AI: Four Steps Towards Robust Artificial Intelligence.”2020.
[51]Bekar C, Carlaw K, Lipsey R.“General Purpose Technologies in Theory, Application and Controversy:A Review.”Journal of Evolutionary Economics,2018,28.
[52]Korinek A, Suh D.“Scenarios for the Transition to Agi.”NBER Working Paper, 2024; IMF.“Gen-AI:Artificial Intelligence and the Future of Work.”2024.
[53]Araby.“AI, The Future Is Now: A Deep Dive into AI Adoption Across Industries.”2023; Araby.“S&P Global Market Intelligence, Risks, Regulation in Focus as AI Boom Accelerates.”2023.
[54]参见https://cloud.baidu.com/news/news_c5655de1-51e7-40e1-8811-a4e65ac6e387。
[55]Jovanovic B,Rousseau P L.“General Purpose Technologies.”Handbook of Economic Growth,2005.
[56]Pyzer-Knapp E O, Pitera J W, Staar P W J, et al.“Accelerating Materials Discovery Using Artificial Intelligence,High Performance Computing and Robotics.”npj Computational Materials,2022,8(1).
[57]“How Scientists Are Using Artificial Intelligence.”The Economist,2023.
[58]参见https://www.vellum.ai/blog/claude-3-opus-vs-gpt4-task-specific-analysis。
[59]参见https://www.vellum.ai/blog/analysis-gpt-4o-vs-gpt-4-turbo。
[60]参见https://explodingtopics.com/blog/chatgpt-users。
[61]参见https://www.reuters.com/technology/openai-hits-2-bln-revenue-milestone-ft-2024-02-09/。
[62]参见https://blogs.microsoft.com/blog/2024/05/20/introducing-copilot-pcs/。
[63]参见https://www.idc.com/getdoc.jsp?containerId=prUS51851424。
[64]Stanford.“Artificial Intelligence Index Report 2024.”2024.
[65]参见https://windowsontheory.org/2023/07/17/the-shape-of-agi-cartoons-and-back-of-envelope/。
[66]Jovanovic B,Rousseau P L.“General Purpose Technologies.”Handbook of Economic Growth,2005.
[67]参见https://wallstreetcn.com/articles/3710044。
[68]Thompson N, Fleming.“A Model for Estimating the Economic Costs of Computer Vision Systems That Use Deep Learning.”Proceedings of the AAAI Conference on Artificial Intelligence, 2024.
[69]参见本书第二章相关内容。
[70]Pilz K, Heim L, Brown N.“Increased Compute Efficiency and the Diffusion of AI Capabilities.”2024.
[71]参见https://newsletter.victordibia.com/p/top-5-ai-announcements-and-implications。
[72]Sachs G.“The Global Market for Humanoid Robots Could Reach $38 Billion by 2035.”2024.
[73]参见https://electrek.co/2024/03/27/elon-musk-tesla-optimus-robot-cost-less-than-half-car/。
[74]参见https://stanfordmag.org/contents/me-myself-and-ai。
[75]参见https://www.marketingaiinstitute.com/blog/sam-altman-atlantic。
[76]张小雪:《数字人的角色冲突与伦理风险》,《青年记者》,2023年第14期。
[77]World Bank Group.“Innovative China: New Drivers of Growth.”2019.
[78]此处的“理论知识”,即science、technology、innovation,简称STI,“‘工匠’知识”或“实践知识”为doing、using、interacting, 简称DUI,参见:Binz, et al.“Catch-up Dynamics in Early Industry.”2020。
[79]Romer P M.“Increasing Returns and Long-Run Growth.”Journal of Political Economy,1986,94(5).
[80]Rosiello A, Maleki A.“A dynamic Multi-Sector Analysis of Technological Catch-up: The Impact of Technology Cycle Times,Knowledge Base Complexity and Variety.”Research Policy,2021.
[81]Gunasekar S, Zhang Y, Aneja J, et al.“Textbooks Are All You Need.”2023.
[82]Koch B, Denton E, Hanna A, et al.“Reduced, Reused and Recycled: The Life of a Dataset in Machine Learning Research.”2021.
[83]陆趣、黎芝源、周子彭:《竞争人工智能 从论文突破性看中国人工智能创新水平机制》,中金研究院,2023年。
[84]参见https://macropolo.org/digital-projects/the-global-ai-talent-tracker/。
[85]Xu L, Xiong J, Yan J, et al.“Technological Uncertainty and Catch-Up Patterns: Insights of Four Chinese Manufacturing Sectors.”IEEE Transactions on Engineering Management,2023.
[86]参见https://artificialintelligenceact.eu/。
[87]参见https://arxiv.org/abs/2202.05924。
[88]OECD.“A Blueprint for Building National Compute Capacity for Artificial Intelligence.”2023.
[89]参见本书第十二章相关内容。
[90]“政策环境”指标采用牛津大学的AI治理指数,包括AI战略、监管质量、网络安全、伦理准则和可靠性五个维度的分数。
[91]参考华为昇腾910B芯片与英伟达专门针对中国、符合美国出口限制条款芯片的比较参数。
[92]Tortoise Media.“The Global Artificial Intelligence Index.”2023.
[93]参见https://www.reuters.com/technology/artificial-intelligence/eus-new-ai-rules-ignite-battle-over-data-transparency-2024-06-13/。
[94]Green A.“Artificial Intelligence and the Changing Demand for Skills in the Labour Market.”OECD, 2024.
[95]中金研究院:《科技创新的竞争与理论》,2023年。
[96]参见https://new.nsf.gov/news/nsf-announces-7-new-national-artificial。
[97]参见https://eur-lex.europa.eu/legal-content/EN/TXT/PDF/?uri=CELEX:52020DC0065。