2.2 基础技术

2.2.1 高性能计算初探百亿亿级

国际科技竞争日益激烈,高性能计算机技术及应用水平已成为展示一国综合国力的一种标志。世界各主要国家向着当前最先进的百亿亿级(E级)计算能力水平不断发起冲击,而近年来异构超算平台、特色超算应用等成果的推出不断拓宽高性能计算的边界。

1.高性能计算机性能稳中有升

当前,世界高性能计算机继续向着百亿亿级(E级)计算发展。在2020年6月国际超级计算机性能评测组织“TOP 500”[1]第55期榜单中,由日本富士通公司(Fujitsu)研制、安装于日本神户的理化学研究所(RIKEN)计算科学中心的“富岳”(Fugaku)超级计算机以415.53 PFlops(千万亿次/秒)的浮点运算性能排名第1。“富岳”是全世界首台使用ARM架构并达到榜首的超级计算系统。在处理机器学习或其他人工智能应用的混合精度计算中,“富岳”的HPL-AI实测性能达到了1.42 EFlops(百亿亿次/秒),成为世界上首台性能达到E级的超级计算机。“TOP 500”榜单入门系统的浮点运算能力已提升至1.228千万亿次/秒,而全榜系统的聚合计算能力则提升至2.26 EFlops。在系统数量方面,中国继续以226台位居“TOP 500”榜首;系统数量排在中国之后的是美国(114台)、日本(30台)、法国(18台)、德国(16台)。前10名的榜单中共有4台新系统入围,但世界超级计算机前10强仍然是以日本、美国、中国和欧盟为主。在总体性能方面,美国仍以644 PFlops较中国的565 PFlops更胜一筹,在整体榜单上处于领先地位。2020年6月全球超级计算机前10强榜单如表2-1所示。

表2-1 2020年6月全球超级计算机前10强榜单

2.深度学习超算绿色(Green)性能凸显

随着现代超级计算机的计算速度越来越快,其中的能耗已经成为制约超级计算机发展的重要因素之一。主要用来衡量超算功耗性能的“Green 500”榜单是目前最权威的指标排名。“Green 500”排名以消耗1W电能可获得的计算性能为基本指标,其性能评估仍然采用基准测试程序High Performance Linpack(HPL),但需计算消耗1W电能所获得的计算性能。近年来“Green 500”排名靠前的超级计算机多为采用GPU技术的系统,日本和美国在节能超算系统技术领域较为领先。在2020年6月公布的最新一期“Green 500”排行榜上,由日本神户大学和RIKEN联合研制的深度学习用超级计算机MN-3名列第1位。MN-3实现了21.11GFlops/W(每瓦每秒211亿次浮点运算)的处理性能,达到了该榜单此前最高性能(18.404 GFlops/W,2018年6月)的1.15倍。“Green 500”的系统已处于“深度学习用超算超低功耗化”的竞赛中,而MN-Core及MN-3的技术处于全球领先地位。可用于实现高节电性能的主要技术有超低功耗的深度学习专用电路“MN-Core”、高速高效节点间数据传输互连“MN-Core Direct Connect”、面向深度学习的双精度矩阵乘法运算效率优化技术、大量集成MN-Core使功率效率最大化的技术。

3.异构超算平台加速融合发展

现代超级计算机的异构体系结构使得有限功耗下的计算性能得到了极大的提升,但也直接带来了编程更复杂的问题,限制了应用科学家对计算系统的高效使用。因此,各种面向异构编程模型也不断地涌现出来。其中比较流行的有以下几种:

(1)统一计算设备架构CUDA,其由研发GPU的英伟达公司(Nvidia)提出,但也仅支持英伟达的GPU。

(2)开放计算语言OpenCL是一种异构系统并行编程的开放标准,可跨平台、针对多种加速器部件开展并行编程。

(3)可移植异构计算接口HIP是厂商中立的C++编程模型,用于实现高度优化的GPU工作负载。

(4)OpenAPI统一、简化异构编程则是由Intel公司提出,它力图覆盖包括标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial)在内的广泛计算架构,分别应用于CPU、GPU、AI加速器和FPGA部件。

在异构超算平台发展的同时,高性能计算和人工智能(AI)也在加速融合发展。通过内存交互的模型来进行编程并使用相同的体系结构配置高性能计算、人工智能和大数据分析,采用一致的软件兼容不同硬件来进行HPC+AI的计算。

4.特色应用拓展超算发展方向

2019年,具有高性能计算风向标作用的“戈登·贝尔”(ACM Gordon Bell)奖被颁发给了苏黎世联邦理工学院(ETH Zurich)的研究团队,因为该团队研发了可映射晶体管热量仿真。通过以数据为中心的应用重组织,该计算模拟实现了至少两个数量级以上的计算效率提升。应用团队的代码在Summit超级计算机的4560个节点上实现了85.45PFlops(双精度)的持续性能和90.89Pflops(混合精度)。该计算模拟使重构的量子输运模拟器可用于处理由10000个原子构成的真实纳米电子器件,相较于原来的由1000个原子构成的体系,在同样精度和使用相同CPU/GPU数量的情况下,计算效率提升14倍。

2.2.2 芯片技术面临技术革新

芯片技术是现代科技的核心竞争力之一。近年来,随着芯片关键尺寸逐渐逼近物理极限,摩尔定律呈现出放缓趋势,在新兴技术突破、市场格局的变动、产业组织的调适等因素作用下,芯片发展将迎来新的拐点。

1.计算芯片产业集中,性能稳中有升

在CPU芯片方面,2019年全球市场规模为574.8亿美元,同比增长2.8%[2]。英特尔公司的X86架构CPU在桌面计算机、超级计算机/服务器市场均处于垄断地位。英特尔计划在2020年9月推出第11代Tiger Lake处理器,替代10nm+制程Ice Lake处理器。AMD公司在2019年凭借台积电7nm工艺制造的Zen2架构锐龙处理器,实现产品性能和市场份额的提升。

在GPU芯片方面,2019年全球GPU芯片市场规模为74.34亿美元,同比下跌10.3%[3]。GPU具有设计开发周期较短、并行计算能力强、软件生态齐全等主要优势,是国际主流云端技术路线。GPU全球市场基本被英伟达、AMD等公司垄断。英伟达在加速深度学习算法芯片市场占据垄断地位,并将GPU强大的算力性能用于包括AI、智能驾驶以及高性能平台等多个领域。英伟达于2019年12月在GPU技术大会上推出TensorRT的最新版本TensorRT 7;在2020年5月发布基于全新安培(Ampere)架构、台积电7nm制程、采用3D堆叠工艺的Tesla A100芯片,性能有较大提高,占了18.3%的市场份额。而移动GPU市场主要有高通、ARM和Imagination三大厂商,其中高通的GPU已集成在骁龙芯片上。

在DSP芯片方面,2019年全球DSP芯片市场规模为12.8亿美元,较2018年有较大降幅。目前,全球市场被德州仪器(39.6%)、恩智浦(25.3%)和ADI(22.4%)3家企业所垄断。未来DSP芯片有望向内核结构进一步改善、与微处理器/高档CPU/SoC融合、芯核集成度提高、可编程化、定点等方向发展。

2.存储芯片市场仍有波动,技术发力3D堆叠

当前,存储器工艺尺寸日益接近物理极限,因功耗和散热问题整体发展速度逐渐放缓。DRAM与NAND Flash是存储芯片产业的主要构成部分,占整个存储器产业市场规模的96%。前五大存储芯片企业三星(38.9%)、SK海力士(19.7%)、美光(18.5%)、铠侠[4](7.1%)、西部数据(5.6%)垄断总市场份额的90%左右。2019年,DRAM市场规模为621.7亿美元,同比下降37.8%;NAND市场规模426.3亿美元,同比下降26.4%。存储市场的低迷成为全球半导体市场下滑的主要因素。

在DRAM方面,价格波动幅度明显,整个市场常年经历高达30%的大幅度震荡。主流厂商目前均处于1Znm技术节点,量产进程有所区别。美光、SK海力士、三星在2019年下半年开始规模量产1Znm工艺DRAM。在高端产品方面,三星仍然占据领先优势,它在2020年7月宣布量产全球首款12Gb LPDDR5芯片。

NAND Flash在进入3D堆叠后更新换代快,容量增长迅速,市场供需关系波动明显,导致整个市场份额时常大幅度波动,NAND Flash企业与DRAM企业高度重合。在工艺制程进入14nm以后,技术难度成倍增加,3D NAND技术成为新的发展方向。国际主流企业在2019年开始普遍进入96~128层规模化量产,如2020年6月SK海力士发布的128层4D TLC NAND、2020年8月三星开始量产的第六代128层TLC 3D NAND、2020年8月铠侠推出的基于原第四代96层BiCS Flash的XL-Flash存储级内存。

3.通信芯片受5G技术驱动发展迅速

通信芯片主要分为基带芯片和射频芯片,在5G技术对集成电路产业发展的驱动下,通信芯片迎来新的发展机遇。根据Gartner预测数据,到2023年,全球5G智能手机渗透率将从2019年的1%增长到60%,将带动基带/应用处理器、射频前端、电源管理芯片等产品快速增长。各大半导体企业均在5G领域展开布局,高通、华为、联发科、三星等均已发布5G基带和SoC芯片。

基带芯片方面,将基带和应用处理器集成为一个SoC芯片的方案是目前主流发展趋势,代表性产品有高通X50/X55/X60、三星Exynos M5100/M5123、联发科Helio M70、华为巴龙5000、华为麒麟990 5G、紫光展锐春藤510等。高通、华为海思、英特尔、联发科和三星在2019年占据该领域全球市场前5名,高通凭借其包括X55超薄调制解调器和骁龙765/G 5G SoC在内的第二代5G产品以41%的收益份额居首。尽管新冠肺炎疫情加上季节性需求疲软影响了基带出货量,4G基带芯片出货量有所下滑,但细分市场仍为基带芯片供应商带来机遇,而5G基带芯片的高价格继续推动基带芯片市场的收益增长。

在射频芯片方面,滤波器和功率放大器(PA)是射频前端领域最大的两个细分方向,两者合计占射频前端市场的61%。目前,全球射频前端市场总规模稳定增加,且集中度较高,主要被Qrovo、Skyworks和Broadcom等国际巨头所垄断。此外,全球射频公司还在不断扩展技术、产品及市场渠道,进行整合演变。射频芯片向化合物半导体广泛应用、以BAW滤波器取代SAW滤波器、射频芯片集成化等方向发展。

4.芯片工艺创新聚焦新结构新材料

集成电路集成程度不断提升,工艺制程逼近物理极限。在关键尺寸持续缩小的过程中,新的器件结构(如GAA有望取代FinFET)、光刻设备(从DUV转至EUV)和材料(金属Co有望成为未来IC金属层核心)等推动工艺节点继续向更小尺寸发展。同时,随着先进制造生产线资金投入大幅度攀升,工艺成本的增加使得先进工艺企业数量迅速减少。联电和格罗方德相继宣布放弃10nm及以下工艺研发,未来先进制程工艺开发领域主导者仅剩台积电、三星、英特尔3家企业。

从代工厂在各关键尺寸的营收比例来看,2019年,全球代工厂销售收入为565亿美元,其中40nm以下尺寸的占比仍最高,市场份额从2018年的40%提升到2019年的47%。16/14nm及以下尺寸代工占比持续提升,代工龙头制造业企业台积电的16nm及以下先进工艺制程芯片销售额的占比已经高达50%,其中7nm制程芯片在2018年第三季度实现量产后,市场份额占比迅速提升,2019年第四季度的市场份额占比已达到35%。

在制造工艺方面,先进工艺制程继续延续摩尔定律。国际龙头制造业企业三星、台积电继续领跑先进工艺制程,开始向5nm、3nm甚至1nm工艺节点进军。台积电早在2020年实现5nm工艺量产,预计2021年率先风险量产3nm制程芯片,通过切入环绕式栅极技术(GAA)在2nm工艺研发上取得重大突破。三星在2019年4月份宣布完成5nm工艺开发,预计2020年底量产。

在技术方面,随着半导体器件制程线宽缩小至20nm以下,采用传统工艺制作的平面MOS晶体管遇到光刻技术、high-k绝缘层技术和功耗等多方面挑战,英特尔提出的鳍式场效应晶体管(FinFET)技术路线和IBM提出的全耗尽绝缘层上硅(FD-SOI)的技术路线应用广泛。目前FinFET技术已实现7nm工艺量产,5nm工艺已经开始风险生产,预计于2020年实现量产;而在高频、低功耗、抗静电等方面有明显优势的FD-SOI技术刚刚突破12nm工艺。

2.2.3 软件技术加速一体化、智能化发展

当前,随着摩尔定律的放缓,软件在推动信息技术发展上的比重逐渐加强。以操作系统为核心的云(服务器集群)、边(智能终端)、端(物联网设备)一体化、智能化融合的趋势明显;编程语言和编译工具链正在酝酿新一轮竞争,由此引发应用市场重新洗牌;工业软件的战略地位更加凸显。开源已成为生态竞争的主要方式。

1.操作系统产业格局稳定,持续多元化发展

操作系统在软件格局中居于基础性地位,主要分为服务器操作系统/云操作系统、终端操作系统、物联网操作系统。随着云、终端和物联网设备的发展与交互,操作系统也呈现出形态多元化、技术一体化的发展趋势。

(1)服务器操作系统/云操作系统经历行业巨头发起的产业整合。目前美国红帽(Red Hat)公司旗下的企业版RHEL、开源版CentOS、社区版Fedora占据领先地位。2019年7月,IBM正式宣布以约340亿美元的金额完成对红帽公司的收购。美国的Canonical公司则继续深耕其Ubuntu操作系统。华为公司将其欧拉操作系统开放出来,建立了openEuler开源社区。在云平台领域,以Docker为代表的容器技术更为流行,开源容器编排引擎Kubernetes的地位更加巩固。从微服务(Microservice)上发展起来的无服务架构(Serverless,事件驱动的云函数,无须服务器管理程序)继续成为热点,亚马逊AWS和微软Azure等主导的无服务架构展开了激烈竞争。

(2)终端操作系统主要包括移动端和桌面端两个部分,均取得新的进展。在移动端操作系统领域,安卓和iOS双雄并立,垄断格局难以撼动,其他操作系统份额不足1%[5]。谷歌新操作系统Fuchsia的部分源码已经公开,采用与Linux不同的微内核Zircon,配合DART语言和Flutter移动应用开发框架,可跨平台运行在多种智能终端上,有望更好地支撑VR/MR等未来应用。在桌面操作系统领域,Windows的市场占有率为77.04%,macOS的市场占有率为18.38%[6]。微软为了增加Windows对开发者的吸引力,主动引入了WSL(Windows Subsystem for Linux),通过虚拟化技术支持原生Linux发行版在Windows上运行。谷歌曾经力推的ChromeOS的增长速度低于预期。其他Linux各大发行版分别针对各自应用领域进行不同的优化,图形用户界面普遍开始采用Wayland渲染引擎,但进展缓慢。无论是终端和桌面,操作系统固有生态对新技术的迟滞效应都十分明显,生态垄断很难打破。

(3)物联网操作系统生态正在加速整合。随着物联网、边缘计算的概念普及,以及终端计算能力增强,越来越多计算任务在终端设备执行,物联网操作系统成为决定生态的关键。目前,国外主流的物联网操作系统包括亚马逊主导的FreeRTOS、ARM公司主导的MbedOS等,国内也有华为的LiteOS、阿里巴巴AliOS Things、腾讯的TencentOS-Tiny。物联网操作系统以轻量化、低功耗为主要目标,结构简单但涉及的硬件种类繁多,往往与云平台厂商绑定,成为其产品和服务的延伸。RISC-V指令集逐步兴起,以物联网为突破口,由此带来新生态的发展机会。

(4)多平台一体化的操作系统酝酿新的变革机遇。微软针对Windows操作系统进行了从服务器、桌面到智能终端的一体化布局,尽管在智能终端领域未能取得成功,但通过Azure云计算平台实现了服务器与桌面的操作系统高度复用。苹果推出了独立于macOS和iOS的新操作系统iPadOS,并内置Sidecar等功能打通不同硬件平台之间的应用。当前,跨场景、跨物理地域、跨设备、跨体系结构的需求给操作系统带来新的技术变革机遇,一体化迭代开发、智能化部署运维成为操作系统厂商的内在需求,将加速操作系统技术体系的内部整合。

2.编程语言与编译器酝酿新一轮竞争

编程语言和编译器、运行时环境、集成开发环境等决定了上层应用的开发模式、开发方法和开发工具,是建立应用软件生态话语权的基础,也是各大企业巨头除操作系统外争夺的另一个焦点。

(1)编程语言种类繁多、各具特色。当前C/C++语言继续是系统软件的首选,Python语言成为人工智能领域的主流,Java/JavaScript继续引领互联网和移动互联网应用。近年来,谷歌力推GO语言来开发服务器程序,力推Kotlin来替代Java作为Android操作系统上App开发的首选语言,力推Chrome V8引擎作为JavaScript的主流引擎(在其上构建的node.js已成为Web平台首选运行时框架),力推DART作为新一代操作系统Fuchsia的默认应用编程语言。苹果推出的Swift编程语言在2020年统计的流行编程语言排名中已进入前10。

(2)编译器新老并存,AI相关优化成为热点。诞生于20世纪80年代的GCC编译器目前已经非常庞大,继续在GNU/Linux体系中保持主流地位。LLVM编译器的应用开始于2000年,在苹果和谷歌的大力支持下,目前已与GCC编译器并驾齐驱。近年来,随着神经网络为代表的人工智能计算普及,编译器在统一算法模型和算子表示、发挥人工智能专用芯片算力上发挥着重要作用。2019年谷歌开源了全新的中介码与编译器框架MLIR,可以适配GPU、TPU、移动设备等不同种类硬件。

(3)集成开发环境(IDE)竞争激烈,开源成为主流。早期IBM发起的Eclipse开源编辑器仍然在持续迭代。谷歌主导的Android Studio目前仍然是Android操作系统上App开发的首选。JetBrain公司的IntelliJ IDEA仍然是目前最为流行的Java开发环境。微软在Visual Studio的基础上发起并主导了VS Code开源项目,目前已经成为GitHub上活跃度最高的开源集成开发环境项目,通过提供多种插件,可以支持物联网、移动端到服务器的多种应用开发。开源开放、支持第三方插件已经成为集成开发环境产品的核心竞争模式。

3.工业软件重要性凸显,垄断仍然明显

作为工业细分领域沉淀的生产力工具,工业软件生产效率提升具有重要意义。其中具有代表性的有用于芯片设计的电子设计自动化(EDA)软件、用于数值计算与仿真建模的工具软件、用户计算机辅助设计和制造的CAD/CAE软件。

(1)EDA领域仍然由少数企业占据垄断地位。用于芯片设计的EDA软件是芯片产业的关键环节。在全球范围内,铿腾(Cadence)、明导(Mentor)、新思(Synopsys)3家企业占了70%以上的全球市场份额。随着芯片制程的提升,EDA软件的复杂性和技术门槛也在增加,使得后来者更加难以超越。

(2)人工智能和开源给EDA领域带来新的变革机遇。人工智能技术开始正在EDA设计中被采用。例如,谷歌运用人工智能算法学习芯片的规划布局,在更短时间内可以设计出超越人工设计的产品。开源EDA软件也正在迅速发展,除了已有的gEDA等,还有加州大学伯克利分校面向RISC-V开源指令集推出的Chisel工具,配套FireSim仿真软件,有望打破商业EDA的垄断局面。谷歌也与SkyWater公司合作推出了开源的芯片过程设计工具包PDK。

(3)数值计算与仿真建模软件呈现三足鼎立的局面。MATLAB、Mathematica和Maple在全球并称三大数学建模软件。GNU Octave是与MATLAB对标的一款通用公共许可(GPL)下的开源软件,但不包括Simulink组件功能。SCILAB是由法国科学家开发的、开源的科学工程计算软件,但与MATLAB等在功能、性能上还有一定差距。

(4)计算机辅助软件CAD/CAE马太效应明显。美国欧特克(AutoDesk)公司的AutoCAD是一款最流行的自动计算机辅助设计软件,其旗下的Fusion 360实现了全流程的工业设计流水线,持续保持竞争优势。美国的ANSYS目前在有限元分析领域处于国际垄断地位,新推出的ANSYS 2020 R2再一次增强了团队协作功能。

(5)AR/VR成为CAD/CAE软件中的新增长点。拥有AR/VR基础的游戏引擎软件Unreal、Unity正逐步向工业领域扩张,例如,2020年5月Unity收购加拿大工业应用软件公司Finger Food。