- 人工智能+机器人入门与实战
- 陈宇航 侯俊萍 叶昶
- 9字
- 2020-08-27 09:44:45
第1章 走近人工智能
1.1 初识人工智能
1.1.1 人工智能是什么
人工智能(Artificial Intelligence,AI),也被称作机器智能,指由人制造的机器所表现出来的智能。通常人工智能是指通过计算机程序实现的智能技术,因此常常被视作计算机科学的一个分支。
人工智能的研究具有高度的技术性和专业性,各分支领域都是深入且各不相通的,因而涉及范围极广。人工智能的核心问题包括构建能够跟人类相似甚至超越人的推理、知识、规划、学习、交流、感知、移动和操作物体的能力等。
虽然人工神经网络下的深度学习算法在20世纪80年代已有了突破性进展,但由于计算机计算能力的限制,其在人工智能领域的应用还没有发挥出应有的威力。近年来,随着超级计算机算力的飞速提升,加之深度学习算法的进一步优化,人工智能在视频识别、语言分析、棋类游戏等单方面的能力已经达到了超越人类的水平。另一方面,一个人工智能程序能够同时解决这几方面的不同问题,充分体现了人工智能的通用性。
人工智能的一个比较流行的定义,也是该领域较早的定义,是由当时麻省理工学院的约翰·麦卡锡在1956年的达特茅斯会议上提出的:人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样。随着人工智能60余年的发展,这个定义方式也在受到冲击。总的来说,人工智能的本质就是对人的思维的信息过程的模拟。
1.1.2 人工智能的发展历程
人工智能的起源
早在20世纪四五十年代,数学系与计算机工程师就已经开始探讨用机器模拟智能的可能。
1950年,艾伦·图灵(见图1.1)提出了著名的图灵测试:人类测试员通过文字与密室里的一台机器和一个人自由对话,如果测试员无法分辨谁是人、谁是机器,则参与对话的机器就被认为通过测试。
图1.1 艾伦·图灵(Alan Turing)(1912—1954年)
图灵测试在过去数十年中一直被广泛认为是测试机器智能的重要标准,对人工智能的发展产生了极为深远的影响。
1956年,约翰·麦卡锡等10人在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”,会上提出“人工智能”这一概念,这标志着人工智能学科的诞生。
人工智能研究发展的起起落落
人工智能概念的提出给世界带来了很大的震撼,人们乐观地预测,人类将在短时间内制造出完全智能的机器。麻省理工学院的约瑟夫·维森鲍姆(Joseph Weizenbaum)在1966年发表了世界第一款自然语言对话程序Eliza(见图1.2)。这款程序可以模拟人与人聊天的过程。虽然Eliza只是基于人类的对话提取关键词并做出预设的反应,但在早年还是让许多用户误认为是在与真实人类对话。
图1.2 Eliza与人的对话
然而,虽然如Eliza这样的早期人工智能产品层出不穷,但还是难以满足社会上对于人工智能的过高期待。从20世纪70年代起,对人工智能的批评声越来越多,公众的热情与投资都出现了大幅度的消退。
直到20世纪80年代,随着卡耐基·梅隆大学为DEC公司开发的专家系统XCON在商业上的巨大成功,人工智能才重新回到业界的视线中。专家系统是一种基于特定规则回答特定领域问题的系统,例如,XCON可以帮助DEC公司根据客户的需求自动选择计算机部件组合,准确率达到了专业技师的水平从而节省了大量的人力成本。但到了这一时期,人们已经逐渐不再追求建立一个通用的模拟人类的人工智能,而是开始专注于通过人工智能来解决具体领域的实际问题。
另一方面,在这一时期,人工神经网络(Artificial Neural Network,ANN)的研究也取得了重要进展。人工神经网络是一种模仿动物大脑的结构和功能的数学模型。人工神经网络通常由大量的人工神经元联结进行计算,并可以在外界信息的基础上改变内部结构,也就是具备学习功能。在20世纪80年代,反向传播算法有了关键进展,其被证明是用于人工神经网络训练的有效方法。
但到了20世纪80年代末、90年代初,业界逐渐发现以专家系统为代表的人工智能系统往往开发和维护成本高昂,而商业价值有限,人工智能的发展再次步入寒冬。
人工智能的新浪潮
进入21世纪后,计算机芯片的运算能力得到了飞速的提升。在这一背景下,人工智能算法也取得了重大发展。基于强劲的运算力,人工神经网络在语音识别、图像分析、视频理解等诸多领域都创造了新的成功。
2016年,谷歌(Google)旗下DeepMind开发的人工智能围棋程序AlphaGo通过人工神经网络深度学习训练,在一场举世瞩目的人机大战中以4:1战胜了围棋世界冠军李世石九段。这次成功点燃了社会对于新时代人工智能的巨大热情,人们开始意识到人工智能在很多领域的能力已经远超人类。
DeepMind团队在2017年末推出了增强版的人工智能下棋程序AlphaZero。它与初版的AlphaGo相比有几点重大的改变:一是AlphaZero只需要棋类的基本规则作为训练的基础,不需要任何人类棋谱作为参考;二是它采用了更为通用的算法,可以延展到将棋与国际象棋中。在短时间(34小时内)训练后,AlphaZero成功击败了围棋、将棋、国际象棋领域的当时最强的AI程序。这一成果让人们更清晰地认识到了机器自我学习的潜力,并对人工智能具备更强的通用性充满期待。
1.1.3 人工智能的应用现状
人工智能的概念覆盖了机器视觉、语音识别与人机交互、自动驾驶等多个范畴,在当今社会中已有着大量的运用。
机器视觉
机器视觉是指在人工智能系统中配备有视觉仪器并通过视觉仪器捕捉到的情报进行分析处理。机器视觉目前被广泛应用于安防、车牌识别系统、医疗辅助诊断、工业化生产线中。
在安防领域,机器视觉可以从大量监控视频数据中提取出有效的信息,从而辅助警方侦破案件;在医疗辅助诊断方面,机器视觉可以对医学影像进行分析,从而减少误诊或漏诊;在工业化生产中,机器视觉则可以对物品进行分类与分拣。
语音识别与人机交互
正确识别并理解人类语言一直以来都是人工智能研究的重要课题。近年来,这一领域也得到了高速发展。现在的人工智能系统能够以相当高的准确率将人类说的话转化为文本,并基于对语义的理解判断用意,进而做出针对性的答复。这一流程包含语音文字转化、自然语言理解等多个环节。
目前,主流网络视频流媒体服务提供商都提供了高效的人工智能自动实时字幕功能;Siri等移动智能助手也正一步步地进入我们的生活;而基于人工智能打造的智能客服系统还能有效地替代部分传统人工客服的作用并同时针对客户需求进行数据分析与优化。
自动驾驶
自动驾驶技术目前发展速度极为迅猛,大量的传统车企和科技公司纷纷投身于这一巨大的市场。Google旗下的自动驾驶汽车已经在小范围投入商业使用,而特斯拉汽车已经通过OTA(Over the Air)升级具备了部分自动驾驶功能。按照目前的发展趋势,自动驾驶汽车大范围投入实际使用已近在咫尺。
自动驾驶汽车显然是一个基于人工智能的复杂系统,它需要借助车载的大量传感器实时监测数据并进行分析,选择合适的行驶路线,保证高效、安全地运行。