数学如何赋能智能化产业创新应用

信风智库:实际上,大数据智能化也为数学提供了更为广阔的应用空间。在您的研究与实践中,具体体现在跟生产生活相关的哪些方面?


徐宗本:我举一个医疗领域的应用案例,比如CT诊断就是典型的用数学建模、用大数据分析诊断的应用。我们知道CT诊断的基本原理是通过X射线对人体需要检查的部位进行扫描,然后将扫描的光信号转变为数字信号,输入计算机进行处理分析,以此实现对人体内部器官的病变识别。

虽然传统的CT诊断应用广泛,但也存在两个最大的问题。首先是它的辐射较大,其实白血病的主要来源之一就是CT的辐射,所以医院一般都会要求患者一年只做一次CT。

其次就是CT设备的部署,主要集中在三甲医院。一来三甲医院的影像科人满为患,排号往往需要排两三天;二来农村的患者很难就近享受到CT医疗服务。这些都直接导致了老百姓看病难、看病贵的问题。

那么,这两个核心问题如何用大数据人工智能技术解决呢?

第一个层面是体系上的,简单来说,就是把传统CT诊断的扫描和成像过程进行分离。我们知道,扫描就是照X射线获得信号的过程,而成像是洗CT胶片,也就是将光信号转换成数据和图像的过程。如果我们能将这两个板块分离,让两个设备单独运行,就可以解决很多的问题。

我们可以将只负责扫描的CT终端机部署到任何地方,包括广大农村地区以及医院里的门诊科室,可以很方便、很及时地对病患进行扫描。而成像的部分则放在中心城市的三甲医院统一集中运用。这样一来,就实现了对医疗资源的进一步合理配置,也符合国家提倡的分级诊疗制度。

那么有人会问,扫描和成像的中间过程怎么解决呢?传统的CT设备将二者集中在一个地方,是因为信号传输受限,但随着5G的应用,通信传输效率也实现了质的提升,完全可以实现CT扫描信号远程同步实时传输,而成像中心的底片数据也可以实时反馈回各个终端,如此就构建了全新的CT诊断流程。

第二个层面是技术上的,用数学模型的方式重构CT扫描模型,最大限度地减少辐射。传统的CT通过高能量粒子构成X射线对人体内部进行扫描,而要想清晰成像,就必须匹配相当高的电压和电流,使用大剂量的X射线,但强烈的X射线在穿透人体时会影响细胞功能和代谢,从而引发临界点的癌细胞变异。这就是辐射的基本原理。

如果通过大数据人工智能,我们就能改善这一情况,核心就是用计算换剂量。怎么理解?我们可以利用大数据建立一个判断图像数据的数学模型,只需用少剂量的X射线扫描一部分关键信号,然后将这些信号放入数学模型进行比对,最终也能分析出符合实际的数据结果,进而实现精准成像。

实际上,数学模型重塑了原始投影和投影数据之间的关系。在这一基础上,CT扫描就可以将X射线的剂量降到以前的1/5甚至1/10。

通过这两个层面的结合,我们就打造了一个全新的智能化医疗产品——分布式微剂量CT,目前已经通过了相关机构的测试,逐步成熟并将量产。这个产品真正意义上把CT设备变成了打印机,我们可以将CT扫描终端投放到各个门诊,每一个城市只需建立一至两个影像中心,就可与周边的终端设备完成联动。

再分享第二个典型的案例,就是通过大数据智能化的方式提高核磁共振的检查诊断效率。我们知道,核磁共振的基本原理其实就是将人体置于特殊的磁场中,用无线电射频脉冲激发人体内的氢原子核,引起氢原子核共振。在停止射频脉冲后,人体内氢原子核按特定频率反馈信号,继而被体外的接收器收录,后经计算机处理形成图像。

核磁共振需要人在设备内持续与磁场寻求共振,这个过程需要耗费大量时间,短则几十分钟,长则一两个小时,这对于儿童以及精神状态不好的病人来说就特别痛苦,所以对于核磁共振来讲,大数据人工智能要解决的就不是辐射问题了,而是时间问题。

我们通过大数据可以打造一个快速精准的算法模型,大大提升核磁共振的检查效率。简单来理解,每个人的体内结构是不一样的,所以传统的核磁共振磁场需要花很多时间去覆盖人体内部,从而获得反馈信号。而通过算法模型,磁场就可以在人体内快速找到一条最优的路径,用最短的时间获得信号反馈。

怎么理解呢?就像我们用手机拨打电话,都会有“嘟嘟嘟”的导频声音,这就是在寻找最优的通信频段,从而接通信号实现通话。我们就是把这个原理引入到了提高核磁共振效率的研究当中。

我们设计的核磁共振,会先花一点时间采集病人的身体数据,然后快速按照病人的检查需求,通过一些复杂的数学公式,设定好一个最优信号获取与成像的方案,最终就能实现因人而异的核磁共振快速成像。目前,这项技术已经实现,可以将核磁共振的速度提升20~30倍。

其实,这两个案例不仅仅是解决了医疗设备的智能化提升问题,我们还能从中看到更大的价值。比如目前智慧医疗最大的瓶颈就在于医疗数据共享,我们可以通过医疗设备内在的大数据智能化应用,更全面且标准更统一地采集医疗大数据,而这些病例与诊断的大数据还可以在未来的智慧医疗中产生更巨大的价值。


信风智库:相比于欧美国家,我们在大数据人工智能方面的研究与应用,还应当注意哪些问题?


徐宗本:就算法本身而言,其实它跟数学一样,一般是公开的,并不保密。在大数据时代,可以说算法即技术,因为很多信息技术的应用都是大数据智能化成果的转化。目前市场上出现的各种智能产品,比如智能机器人与智能家居等,其内在逻辑都是基于人工智能算法,只是外在通过硬件的方式表现了出来,成为各种各样的产品。

当算法与大数据的场景相结合,就可以研发出一个很好的应用产品。在这方面,中国和国外的理念略有不同。实际上,对于数学算法原型本身的研究来说,国内外的水平其实相差不大,因为我们的逻辑推理能力是非常强的,我们能够在学术研究上实现很有价值的突破。但是,在对算法机理的精益求精上,我们重视程度还不够,往往醒得早、起得晚。

这是让我非常痛心和可惜的地方。有时候我们的学术研究过于急于求成而没有沉淀。比如我们提出了一个新的算法原型或者思想,就急于发表论文,展示成果;而国外大公司看到这个思想成果后,就会琢磨这个算法如何更加精细化,有没有可以落地的模式和场景,如何进一步深化研究与应用。对这些国外公司或机构而言,它们更注重技术的进一步研究与深化,从而创造更高的科研价值和市场价值。

这就跟制造业中的某些情况一样。有些制造技术的原型可能是我们自己创造的,而我们发布以后被国外的企业或机构引用,它们在这个基础上继续精益求精地钻研,最终将新理念、新技术与新工艺固化为一个系统或一个产品。而回过头来,我们看到这个系统或产品时,反而看不懂了。

所以,作为科学家,其实我们是非常忧虑的。我们科研和产业发展始终要解决一个问题,就是克服浮躁,要把事情做得更扎实,眼光看得更长远。从这个角度来讲,商业上某些挣快钱的资本逻辑,实际上就和科研逻辑有冲突。资本要求的是快速孵化、快速迭代与快速换项目;而科研真正需要的是从一而终,慢工出细活。


信风智库:大数据智能化产业是一个体系化、价值化的智慧生态,那么从国家战略、区域发展以及智能产业的角度来看,我们如何把这个生态构建好?


徐宗本:新一代信息技术的研究与应用,可以分为基础研究、技术研究和应用研究。对大数据产业链而言,可以分为数据采集、数据供给、数据存储、数据加工与数据应用等环节,只有链条上各个环节有机衔接,这条产业链才能真正意义上形成生产力。

那么,目前我们大数据产业的问题究竟出在哪里呢?其实就在于产业链不健壮,各个环节的资源配置还不够合理,有的环节产能过剩,有的环节产能严重不足,所以产业链整体上无法充分地形成生产力。

一个很典型的例子就是,很多地区盲目地建设数据中心,使得数据存储这个环节出现了产能过剩。这里面也有一个误区,认为发展大数据产业就是建设数据中心,或者认为数据中心是很显性的产业价值体现形式。

事实上,数据存储也的确是大数据产业链上非常重要的一环,可以很好地支撑通信运营商、科技型企业与平台型企业发展。因为数据中心的建设、运维和能耗的成本非常高,集中建设与运营的数据中心,则可以享受低价的电费和低价的厂房,这些企业就不需要单独建设数据中心了,大大节省了成本。

但是,从更宏观的全产业链角度看,仅仅是数据存储就能产生GDP吗?就好比我们把大米堆满了整个仓库,但不拿来做饭,就没有意义。数据中心一定要为数据运营服务。相比于数据存储,我们在数据供给和数据分析等环节上产能不足,我们更应该重点思考如何完善这些环节,这就又回到了重视基础研究上。

其实,人工智能的核心是算法。如何基于现实存在的问题构建解决问题的算法模型,这才是关键。说实话,算法以及背后数理基础的研究,是看不见摸不着的,其成果也不能显性地表达出来,也就不容易引起大家的注意。然而,这种看不见“软实力”的基础研究,不管对于产业链的健壮发展,还是对于科技自主可控,都可谓至关重要。

可以看到的是,我们国家对这方面越来越重视。随着科技创新体制改革的不断深化,作为科研人员,我们看到了更加广阔的前景。在政府的大力支持下,我们在广州建立了琶洲实验室,聚焦人工智能基础理论与核心算法、人工智能软硬件平台与关键技术,以及数字经济重点行业示范应用等研究。我们科研人员在很大程度上有了自主权,比如人才选拔任用、找项目定项目等方面。这充分激发了我们团队的积极性,使科研人员充分发挥专业所长,形成一套面向产业应用的基础科研创新模式。

与其他基础科研领域不同,大数据与人工智能更需要产学研的融会贯通,因为数据和算法本身就来自日常的生产生活,也是为了解决生产生活中的各种实际问题。那么,我们需要重视的是如何更好地将科研成果转化为产业价值,这就需要以市场为导向、以企业为主体的创新。

现阶段我国的科研创新主要还是由高校与研究所等科研机构来实施,具备独立研发能力的企业少之又少。这里面临的问题是,科研机构做出来的创新成果,很有可能离实际需求太过遥远,也不能实现产业价值转化,使得企业不愿意“买单”。所以,大数据与人工智能的产业创新,一定需要建立以企业为主体的自主研发创新生态。