1.5 ChatGPT的创新之处

1.5.1 人机交互的新变化

较早的人机交互主要是通过命令行实现的——用户输入一段命令,机器做出相应的反应。这种工作在当时是非常高效的,但是大多数人并没有掌握这种方法。之后出现了图形用户界面,图形用户界面比命令行友好很多。比如你想写文章,你可以在操作系统中打开Word文档,然后输入文字,之后点击保存,最后关闭文档。用户需要做的就是在不同的菜单中找到能够解决问题的按钮或命令。当前的人机交互则是通过自然语言进行。例如,我们可以向人工智能提问,查询过去半年公司每个业务线的收益情况,尤其是和近几年的数据进行比较。如果通过人工查询,这样一个任务至少需要半天时间才能完成,但是通过大模型和自然语言交互,整个过程可能仅仅几秒就可以得出最终的答案。

自然语言处理技术自诞生以来,先后经历了以下四种任务处理方式。

(1)非神经网络下的监督学习。由人工设计一系列特征模板输入模型之中,模型性能高度依赖输入模型的特征和专家知识。

(2)基于神经网络的监督学习。通过人工对数据进行标注,用神经网络进行自动特征提取。

(3)预训练+精调(Pre-train and Fine-tune),在超大规模文本数据集上基于自监督方式,预训练一个具备较强泛化能力的通用大模型,然后根据下游任务特点对模型进行微调,从而减少人工参与。

(4)预训练+提示(Pre-train and Prompt),在预训练模型之后,不对模型进行微调,而是将任务以提示语句的形式输入模型,模型自动适配下游任务。

过去的人工智能主要是做小模型,或者说是工具类的小模型,比如一个算法主要针对人脸识别或车牌识别等。研究人员去收集数据进行数据标注,之后对模型进行训练,这样的小模型或者算法没有太多的可扩展性。随着ChatGPT的发展,大模型可以被视为一个具有通识性知识的“大学生”,专业领域的人员可以通过专业领域的知识和技巧来引导它,给它启发,从而让大模型帮助我们解决实际问题并完成工作。

例如,很多人认为大模型的出现会让人工智能翻译更加普及,有可能会替代人工翻译。但现实场景是,机器翻译和人工翻译正在构建新的人机协同模式。这是因为,在医疗、金融、法律等专业领域,翻译错误可能导致严重的后果,人工翻译质量稳定、可靠,因此用户愿意为人工付费。通过人机协同实现混合翻译服务,可以先用人工智能完成翻译初稿,再用人工校对进行修正。有媒体报道,这种混合翻译的模式相比纯人工翻译能节约40%的成本,更受用户欢迎。

未来,判断一家公司是不是人工智能公司,其标准将主要在于其大模型做得如何。

1.5.2 ChatGPT的创新点

实际上,ChatGPT的诞生类似于汽车、电话和互联网的问世。

以电话为例,过去人与人之间的通信非常困难,沟通受限于物理距离,效率很低,但电话的出现让更多的人足不出户就能和朋友或者亲人联系,改变了我们的生活。汽车的出现也是如此,比如在一线城市,大部分的人出行都离不开汽车,无论你是拥有一辆汽车还是打车、坐公交车,汽车成为几乎每个人都会使用的工具。互联网也是一样,它是一个普罗大众每天都需要用的产品。可以看出,这些划时代产品的问世,都是从0到1的变化,让原本分散在多个领域的技术能够通过一个产品来集中体现,最终实现量变到质变的飞跃。

ChatGPT可能不是通用人工智能的最终形态,但是不妨碍ChatGPT会成为划时代的人工智能产品,它能够把之前分散在不同领域的人工智能技术和自然语言算法集合起来,通过工程能力形成一款产品。如同第一个实现人类登陆月球的阿波罗计划。登月这件事是一个系统工程,技术环节和理论环节都是现成的,并不复杂,也不需要从0到1的技术理论突破,但真正想要实现登月,却是非常艰难并且复杂的。

而且ChatGPT这款产品最关键的一点是,能够让很多普通用户使用。

首先,人工智能不再仅仅是对现实世界的简单复刻,而是变成了人类“想象力”的延伸。我们过去常说手机是人体器官的延伸,智能手机已成为非常重要的工具。而ChatGPT则会成为“想象力”的延伸。当你提出问题时,它会给出答案;当你提出一个天马行空的想法时,它可能会给你一些有用的回应和落地执行的策略。它就像一个非常贴心的助手,随时可以与你交流。这也就不难解释,为何ChatGPT与汽车、电话和互联网一样,都是划时代的重要发明。

例如,企业在做宣传的时候,最头疼的是哪些营销话术能说,哪些不能说。这种判断之前主要依赖有经验的法务人士,但是这很耗时而且效率不高。国内一家食品消费类公司在使用人工智能技术几个月之后,发现这个问题得到了有效解决,人工智能可以很好地对营销话术进行判断与审核,甚至能判断具体话术涉及哪些法律条文,以及曾经的判决案例是什么。这些场景在工作生活中非常普遍,也是我们经常遇到的痛点,有痛点就意味着有机会。

其次,ChatGPT使人和计算机之间的交互变得更加自然。当我们与ChatGPT交流或给它下任务时,你不需要编写代码,只需用最自然的语言,就像与他人交流或与朋友聊天一样。这是非常自然、高效、个性化和智能的交互入口。

以日本为例,由于社会老龄化和新生人口断崖式下降,日本各级政府和企业都非常欢迎使用新技术来补充劳动力。日本第二大银行瑞穗(Mizuho)宣布将为公司在日本地区的4.5万名员工提供ChatGPT等生成式人工智能服务,主要应用在起草金融合同、审查法律文件、生成金融报告摘要等方面。

最后,ChatGPT将各种人工智能技术和自然语言能力融入寻常百姓家,让每个人都能使用。人工智能从来没有像现在这样可以触达大部分人。只要你能说话或打字,就能与之交流,得到它的回复和响应。因此,正如凯文·凯利所言,评价一项技术成果需要考虑这项技术是否具有广泛的影响力和无限的可能,很明显人工智能的这个拐点可以催生出无限的可能,并引发万事万物的改变。

前不久,美国一家急诊科医生的经历就很有代表性。这位急诊科医生凌晨3点左右收治了一名96岁的阿尔茨海默病患者,患者由于肺部有积液,所以呼吸困难。患者的3个孩子也是70多岁的老人,但是在治疗方案上3个子女和医生争论不休,并且情绪激动。医生一边要治疗病人,一边还要安抚家属,显然时间上来不及。为此医生对ChatGPT下了一个指令:“为什么不能给水肿和呼吸困难的人进行静脉注射,并且用富有同情心的语言来解释”,ChatGPT写了一篇非常好的答复,医生让护士把这篇回答念给家属听,之后家属激动的情绪得到了有效的缓解。这是一个非常小的应用场景,不涉及付费和具体业务场景,但却是普通人拥抱人工智能的最细腻的体现。表1-2展示了生成式人工智能的典型应用领域与场景。

表1-2 生成式人工智能的典型应用领域与场景

总结来说,ChatGPT的创新之处有三点:第一,不仅仅是对技术或现实世界的复刻,而是我们想象力和能力的延伸;第二,交互更加自然,降低了使用门槛;第三,让人工智能技术飞入寻常百姓家,让每个人都能使用。