1.5 边缘计算的历史与现状

随着大数据、云计算、物联网、人工智能等技术的迅速发展,互联网产业正发生着巨大的变革,这些变革也催生了新的计算模型。当下,随着4G/5G无线网络和物联网技术的迅速发展,万物互联的概念成为物联网基础上新的互联的构建模式,其相较于物联网的“物”与“物”的联结,突出了更高层次的“人”与“物”之间的交互,赋予了物联网中的设备更强的计算能力和感知能力。

由于万物互联的迅速发展,边缘设备逐渐由单一的数据生产者的角色转变为同时具有数据生产者和消费者的混合角色,边缘设备逐步具备了对其采集到的数据进行智能处理的能力。这种能力在当下爆炸式增长的边缘数据的前提下,为节省边缘设备到云计算中心的单一计算资源之间的数据通信量、提高数据处理性能以及降低能耗等方面提供了新的可能。为了解决数据传输、存储和计算的过程中传输带宽占用过大和单一云计算资源的计算负载方面的问题,学术界和工业界探索了怎样在靠近数据生成的边缘设备上进行数据处理,也就是如何将计算任务从数据中心向网络边缘进行迁移。本节尝试按照这些新技术的诞生顺序来介绍这些典型的计算模型,同时对边缘计算技术的发展现状做相应的介绍。

1.5.1 分布式数据库

分布式数据库结合了数据库技术与网络技术。随着大数据时代的到来,数据类型和数据量的迅速增长使得分布式数据库技术成为当下数据存储和处理的常用核心技术。分布式数据库是将数据存储在不同地理位置的数据库,它可以存储在位于统一物理位置的多台计算机(如数据中心),或者分散在互联的计算机网络上。与处理器紧密耦合并构成单个数据库系统的并行系统不同,分布式数据库系统由松散耦合的站点组成,因此可以利用多个站点来共同完成一件事务,从而提高用户对数据访问的效率。

分布式数据库可分为异构系统和同构系统,图1-7和图1-8分别描述了两者模型结构的差异。异构分布式数据库部署在具有不同硬件、操作系统、数据库管理系统及数据模型的环境中,而同构分布式存储系统运行在多台具有相同软硬件的机器上,且具备单一的访问接口。按照数据的组织形式不同,分布式数据库又可以分为关系型数据库、非关系型数据库、基于XML的数据库和NewSQL分布式数据库等。

图1-7 异构分布式数据库的应用示例

与边缘计算模型相比,分布式数据库主要实现了数据的分布式存储和共享,更加侧重大规模的数据存储和确保一致性的高效事务处理,提供了巨大的存储规模和广阔的共享范围,但通常不会额外关注数据在异构设备上的计算处理以及数据的存储和计算之间的分布关系。边缘计算中数据的共享范围有限,具有更高的隐私性和局部性,利用异构的边缘体系结构去支持多种类型的服务应用将是边缘计算面对大数据处理的基本思路。

图1-8 同构分布式数据库系统的应用场景示例

1.5.2 内容分发网络

边缘计算的历史可以追溯到20世纪90年代末的内容分发网络(Content Delivery Network, CDN),CDN是代理服务器及其数据中心的地理分布网络,其目标是在空间上为终端用户分配资源来提供高可用性和高性能的服务。CDN由Akamai公司于1998年提出,通过部署在网络边缘的缓存服务器来提高远程站点的获取和下载数据的速度并降低访问延迟,因此CDN得到了学术界和工业界的关注并快速发展。此后,Karbhari等人基于CDN提出了新的网络模型,称其为主动内容分发网络(Active Content Delivery Network, ACDN)[14],通过设计一系列算法,根据系统需求在不同服务器之间迁移应用,实现对资源位置的动态分配。

CDN的工作方式可以如图1-9所示,其中绿色和蓝色箭头分别代表请求和响应,箭头上的数字代表请求或响应发生的次序。首先,用户A通过Web请求自己所需的数据或文件,CDN会将这一请求发送到效率最高的接入点,这个接入点往往也是地理位置上最为接近用户A的。如果接入点中的边缘服务器上均没有该数据的缓存,那么将该数据的请求发送给其上游的源服务器,然后源服务器向接入点中的一台边缘服务器返回相应的文件或数据。这台边缘服务器将数据缓存下来,并发送给最开始的请求者,也就是用户A,而边缘服务器会根据其缓存数据的HTTP头部信息确定其存活时间(Time To Live, TTL)。其他用户可以通过与用户A相同的方式请求同一份文件或数据,若这些请求被重定向到相同的接入点中,且数据的TTL还未过期的话,边缘服务器将直接从缓存中返回,以此实现快速反馈的良好用户体验。

图1-9 内容分发网络工作示意图(见彩插)

CDN的大规模部署催生了边缘计算的概念,一些大公司利用CDN边缘服务器对Web内容进行分发,从而使用户能够通过距离更近的CDN边缘服务器获取可用资源,加速Web应用的访问。早期边缘计算中的“边缘”被认为是CDN缓存服务器,功能也只有简单的内容分发,而如今边缘计算的概念远超这个范畴,囊括了从用户数据到云计算中心的路径上的所有计算、网络和存储资源,边缘计算也更侧重于数据的计算和处理等任务。

1.5.3 移动边缘计算

网络中的多种设备(如智能手机、智能手表、无线传感器等)在万物互联的设计下能够实现相互连接,但多数网络终端设备的能源、硬件和计算资源非常有限,极大地限制了万物互联的可行性。移动边缘计算(Mobile Edge Computing, MEC)是一项新兴的网络结构,它将云计算服务拓展到边缘网络,以此来充分利用移动基站的计算资源。作为一项有前景的边缘技术,MEC可以应用到移动、无线和有线场景,利用相应的软硬件平台,部署到靠近终端用户的边缘网络上,以此实现高带宽、低延迟的网络传输和良好的用户体验。MEC为移动用户、企业和其他垂直细分市场提供多个应用服务供应商的无缝整合,是5G架构中的一个重要组成部分,支持各种需要超低时延的创新应用和服务,并在可扩展性、可编程性等角度实现5G技术的高要求。目前,移动边缘计算已被应用于移动大数据分析、车联网、增强现实、沉浸式媒体等对实时反馈有着严格要求的应用场景[15]

移动边缘计算强调在移动终端与云计算中心之间的网络路径上建立边缘服务器,以此实现对终端数据的处理,但通常认为终端设备基本不具备计算能力。与此不同的是,边缘计算模型中的终端设备可以具有数据生产者和消费者的双重身份,可以具备一定的算力,移动边缘计算可以被看作边缘计算的服务器层次架构。

1.5.4 雾计算

思科(Cisco)公司于2012年提出了雾计算的概念,用以代指分散的计算组织架构,其中数据、计算、存储和应用都位于数据源与云计算中心之间。在移动设备和云计算中心之间引入的中间“雾层”,实际上是由部署在网络边缘的雾服务器组成的。雾服务器减少了终端设备与云计算中心之间过多的数据通信量,可以显著减少信道中的功耗和带宽负载,也能作为缓存服务器在特定情况下同时满足大量用户对服务的请求。与此同时,雾服务器也可以向云计算中心请求更强的算力或其他应用和服务。

雾计算与边缘计算在概念上有许多相同点,在许多情况下两个称谓的含义相同,例如将数据和智能都下放到边缘服务器上,而边缘服务器位于更接近数据源的位置。在一些场合下,雾计算更侧重于将数据部署到雾服务器上处理,而边缘计算则支持在连接传感器本身的设备上或物理上靠近传感器的网关设备上进行计算与存储。

1.5.5 边缘计算技术的发展现状

自2015年,边缘计算技术迅速发展,由于能满足万物互联的诸多需求,其吸引了学术界和工业界的广泛关注。在学术界,2016年10月,ACM和IEEE联合举办了第一届边缘计算顶级会议ACM/IEEE SEC[16],这是全球首个边缘计算的学术会议。此后,INFOCOM、SIGCOMM等顶级学术会议也为边缘计算提供了专题研讨会。在国内,首届中国边缘计算技术研讨会于2017年5月举行;中国自动化学会边缘计算专业委员会于同年8月成立,边缘计算在国内的学术发展与全球范围基本同步。在工业界,许多IT公司和企业正大力推动边缘计算的发展和落地。2016年4月,欧洲电信标准协会(ETSI)发布了与移动边缘计算相关的重量级标准,对移动边缘计算的七大业务场景提出规范和详尽的描述。同年11月,中国科学院沈阳自动化研究所、英特尔公司、ARM公司、华为公司、中国信息通信研究院和软通动力公司联合倡议并建立了边缘计算产业联盟[17],致力于促进学术界、工业界和政府在边缘计算领域的协同合作。2019年1月,Linux基金会推出了LF Edge开源组织,致力于构建独立于硬件、操作系统和云的开放边缘计算框架。2020年6月,中国电信与中兴通讯携手构建大规模5G边缘节点,也是国内首个城市级应用节点,其融合了云-边协同、MEC边缘云、AI等技术,为雄安新区的智能城市建设提供了重要的支撑。