闵万里:打通数据、算力、算法“孤岛”,助力AI赋能产业转型升级

发表于:2024-11-15 14:49:36

  以“中国经济的下一程:塑造新动能 释放新活力”为主题的新华网思客云丘山年会10日在山西临汾市云丘山举办。深圳清华大学研究院数字化工程服务中心主任、神思电子首席科学家闵万里在题为《数智化赋能产业转型升级》的主旨演讲中表示,目前数智化发展存在三座孤岛——数据、算力、算法,若能理顺三者关系,实现打通和融合,就能更好服务数智化赋能产业转型升级的进程。

深圳清华大学研究院数字化工程服务中心主任、神思电子首席科学家闵万里发表演讲

以下为演讲全文:

  以数智化赋能产业转型升级是一场智力革命。讲到了智力,就离不开讲科学和技术。

  科学帮助我们建立人类对社会的基本面的运行规律,也就是“去发现”,而技术是我们利用这些规律“去发明”那些可以改造社会的生产劳动的工具。而这两者的结合就能瞄准产业当中有价值的问题,然后通过解决问题来创造价值。

  上面这张图我想在500年前也是同样成立的,只是很可惜,那个年代没有资本的风投,只有一些民间企业家,政府的投资行为还比较少,那时科学和技术还是两个概念。

  所以上图这个公式如果成立的话,就一定会有短期资本直接注入到产业当中去,进而扩大产能、扩大再生产,然后大规模占领市场。长期的资本会投资技术,但是很遗憾,资本很少投资科学。为什么?从科学到技术的转化是非常艰难的。

  我们都知道牛顿在他那个年代写下了万有引力公式,但是他没有融到资。相反,爱迪生利用法拉第电磁感应定律、麦克斯韦方程组,最后发明了电灯泡,结果他就融到了资。JP摩根成了他的“天使投资人”。

  所以我想这张图其实给我们很多启示。要用数智化去赋能产业升级,首先要找准价值创造。价值创造成立的前提下才会有短期和长期这两种资本出现,当然这里头一个最大的前提就是科学,如果没有新的科学认知,这个事就走不了多远。

  什么是科学?我们用400年前的“大数据”举一个例子。

  伽利略发明了望远镜,帮助他总结了天体运动的数据。根据那个年代的“大数据”,最后得出开普勒三定律。开普勒告诉大家,行星都是绕着太阳走,太阳是椭圆形轨道当中的一个焦点,单位时间内扫过的面积是多少等等……他基于这些“大数据”给出了描述。到这个地方为止,他发现了一些规律,但是没有人去解释这个规律背后的基本原理,也就是“第一性原理”是什么。而牛顿的万有引力公式做到了这一点。牛顿精准地预测了整个天体运动的行为,并且告诉大家在太阳系之外还有其他星系,后来事实证明了这一点。这就说明,在懂得科学原理之后,你可以突破人类认知的边界,不断去上探价值的新高点。

  同样的道理,我们来看一看人工智能究竟咋回事。

  人工智能经历了从AIGC(人工智能生成内容)到AIGD(人工智能生成决策),从感知到思考到行动的转变过程。大家都在讲大模型的生成,其实人工智能是什么?从图像的识别上我们可以分为几类。图像有什么?是一个什么样的事情?看到了之后我们该怎么办?其实就这三个问题。相当于从哲学三段论的观点来说,就是“有什么”“干什么”和“怎么办”。同样的,如果你去读一篇文字,道理也是一样的,这个文字讲的什么主体?它的意思是什么?读了之后我该怎么办?这也是一个新闻报道或者舆情描述的基本逻辑。再比如,如何处理一段语音?你听了之后要把它转化为文字,再做实体的识别,然后再去看语义的理解,再问“怎么办”。所以在这个过程当中其实不外乎就是三件事:一是视觉、听觉;二是语义的理解;三是我们个人的行动。这里面最重要的是什么?不是AIGC,而是AIGD。这里的“D”意思是decision,也就是决策。当然,我们解决实体产业问题的时候,我们是需要用行动落地的。智慧上天,行动落地,落得越深,创造的价值就越深厚持久。

  回到那句话:科学是什么?人工智能的科学是什么?我们把科学的问题搞明白,就能知道我们在哪发力。

  大家都知道,大模型是数据、算力和算法的结合。2022年最火爆的大模型ChatGPT用到的模型数是多少?1750亿个参数。为什么是这个数?这里面有一个非常深刻的科学道理,一会我给大家解释。

  另外一方面,人工智能领域又有一个很神奇的术语叫“神经网络”。我们每一个人身上都有一个神经网络,就是人脑。人脑这个神经网络是一个由860亿个神经元组成的巨大网络。每一个神经元都在放电,放电了之后信号开始传递。我们经常讲“头皮发麻”,其实你在“放电”而已。一见钟情就是对那个人,也就是那个特定的“频道”发生了太多的电流活动,然后一下就产生了情感的共鸣。

  上图的右上角是20年前我在纽约做研究的时候,我的研究团队的一个志愿者被监测脑电波的照片。从他放电行为体现出的那样一个“尖峰”,就能看出哪一个频道放电行为特别活跃。

  我为什么又把860亿给标出来了?我们的人脑中,每一个脑细胞都有两种状态,一种是没有被激活的状态,一种是放电被激活了的状态,关键在于被激活的占多少。也就是说,如果要描绘一个人脑神经网络的状态,需要2×860亿个参数,每个脑细胞需要两个参数,总共是1720亿个参数,也就是说任何一个人对一种语言、图片或者视频的反应都可以用这1720亿个参数的巨大模型,完美地去呈现它。

  所以,大家就能理解为什么ChatGPT出现的爆发点是在1750亿个参数,而不是在100亿或者几百亿的量级上。这背后就是这样一个深刻的科学道理,就是我们人脑的所有活动如果需要一个数学模型描述,总共1720亿个参数就够了。

  讲完这些科学成果之后,下面我们就来讲怎么赋能产业。

  其实,命题、破题、选题、解题这4个步骤就在这个公式里面,包括三个核心要素:数据、技术和产业知识。很遗憾,很多时候大家忽略了产业知识、产业专家的重要性。行业专家的知识能够起到“四两拨千斤”的作用,如果我们用得好,会少走很多的弯路。

  在赋能的过程当中,我们有两个指标要去看。一个是效率,一个是效果。过程是讲效率,结果是讲效果,这两者的提升都有可能起到赋能的作用。

  接下来我会给大家讲四个我亲自干过的案例。他们各自有一定的代表性,既有政府手上的数据,也有企业的数据,既有基础民生智慧城市领域,也有制造业的……

  这里面讲到的行业知识就是机理模型,讲到的人工智能就是数据模型,这两者结合缺一不可。

  核心是要干什么?就是要把一个制造业的车间想象为一个神经网络,从人(人员)、机(机器)、料(原料)、法(方法)、环(环境)五大要素去解构它,做数字孪生,让产线“学会思考”。

  我们来看一个例子——单晶硅。这是两年前在四川我带着团队干的一个案例。单晶硅是太阳能光伏的上游产业,也是我们很多晶片、晶圆的“上游”。

  单晶硅的生产其实很有意思,主要是把石英砂加热到1400多度,然后在向上提拉的过程当中晶体生长出来,而如果提拉的速度不合适,它就“砰”一下断掉了。在老师傅的帮助下,我把整个流程画出来了。

  当我画了这个流程之后,我就要加入人工智能相关的事。这个时候就要建立一个数学模型去抽象它。怎么建?很简单。把每一个环节当中所有的参数变量,包括可控的和不可控的关键性变量,全部画出来,形成这样一个“神经网络”之后,下面就有一个很神奇的事出现。

  当有这样一个网络之后,我需要添加“辅助线”,就像我们在中学学几何,要添加辅助线去证明一些定理一样,在这里有没有可能我添加一些“辅助线”,发现某几个变量的组合,完美地决定了最终的结果。这就是构建一个“神经网络”的关键。

  我们把很多层“神经网络”的一些通道链接在一起,最后找到了直通最终结果的决定性变量,这里面这些结合虚线代表的是权重,就是α、β、γ等那些系数。

  这样一想,突然你发现,原来人工智能跟产线有这么神奇的交互,或者说叫同构映射。当我们建立这样一种数字化孪生之后,效果就出来了。所有的海量数据全部映射到这个图上,最后让人工智能去找这样的“辅助线”,找到之后直接看效果。

  人工智能跑了一个多月之后,得出了下面这张图。

  当中我们只需要关注最后那一列。这列的第一行是人工智能跑的,另外几行全部是老师傅跑的,做“人机大战”,结果就是人工智能的断线率比老师傅的还要低,产能也上去了,利润也上去了,重要的是这个过程中没有花一分钱去改造硬件,没有做工业互联网,也不需要5G。为什么?所有的数据都在这个企业的硬盘上。它以1300个单机炉已经跑了两年多,积累了海量的数据,积累了相当多的样本,得出有40%左右的断线率,只是以前没有人工智能的算法和模型以及算力去干这个事。

  当这些数据出来之后,我想所有人都不再质疑了,人工智能确实能帮产线多赚钱,而不是“帮工人打卡”这么庸俗。现在的问题也不是人工智能行不行,而是这家企业行不行,或者同行的单晶炉能不能干这件事的问题。

  所以我想对于一个制造业企业来说,在“龙头”打开一扇窗,让大家看到新价值创造的模式,它所带来的这种冲击力是用数字来说话的,不是靠图像。

  下面再讲一个更加传统的行业。咱们北方冬天要供热,可你能想象一个有50年历史的地下热水管网,它的那些阀门究竟该如何控制?根据寒潮的去来,然后怎么提前开阀门?这件事能不能用人工智能来干?我给大家讲,即使是这个“土得掉渣”的行业,答案仍是可以干,而且可以干得非常好。这是我2023年11月15号到今年3月15号在山东济南带着团队干的一件事。

  其实传统的人工调节是要怎么干呢?左边这张图大家能看到,当热源厂把热水的温度提起来之后,由近及远慢慢流到居民小区,它有一个渐进的过程。在这个过程当中热水来了,然后温度就升起来了,所以它是有先后顺序的。

  但是冷空气来的时候是一下子就到了。所以说,按传统的方式必然会造成有的地方冷空气来了,但小区里还是很冷;有的地方冷空气还没到的时候小区里面已经很热了,不平衡。如果人工智能要怎么干?

  人工智能要干的话就是按每一个阀门精准地去调,提前去调,有的地方先调大流量,有的地方先调小流量,根据热源厂的温度变化。这件事情感觉很简单,但是做起来特别难。为什么特别难?

  给大家看下面这张图就知道了。

  有很多阀门“不听话”,因为它们已经有几十年的历史了。你把阀门开大到5%的时候,它最多只能给你开到2%。也就是说你要精准指挥一群“不太听话的士兵”,去精准地“打一场仗”,而且不仅仅是要算得准确,还要算出、预判出它的反应,从而给它一个指令,让它能够最终达到你想要的效果。

  那么除了更精准,人工智能还会带来哪些好处?答案就在这张图上。

  这些数据模型要怎么做?这点我跳过去了,直接看结果——节省了3%的能耗。我们在整个县里50多个换热站干了这个事之后,得出了这个数,就写在最后那一列的那张表上,这是我们的客户统计出来的。

  3%是个什么概念?可能大家觉得很少。但是首先要明确:这是净利润,它没有投入,是零成本的,它不需要改造设备,现有的基础设施上的阀门怎么调,用人工智能算一下,然后执行下去,这样就有一个“军师”时刻帮你算,然后这样执行下去就能节能3%。在济南230万个采暖用户每年的成本大概是六七十亿。六七十亿的3%是多少?大概两个亿左右。这还是1.0的版本。所以我想,人工智能对于制造业企业,尤其这么传统的制造业企业来说,可以使它找到新价值创造的方式。

  所有的“钥匙”都在手上,有数据、有懂模型和机理的老专家,而且场景也是原来的场景,唯一缺的就是智力和算力。当我们把它需要的东西精准注入的时候,这家企业就能赚钱了!

  下面一个就更简单了。这是一个我们所有的人都知道的案例。

  开车的时候有时你会发现绿灯的方向没有车,但是绿信号灯还顽强地“绿”着。那一刻,你是否会想:为什么信号灯这么不聪明?看到路面上已经空空如也了,它还要“绿”着?因为我们知道它是按照固定的模板在倒计时。

  接下来我们就把人工智能用上去了,完美解决了这个问题。

  如下图显示,该路段21:00:26东西方向出现空放,原定持续83秒,3秒后发现空放。AI生成变灯策略,1秒后策略下发。行人灯闪,黄灯变灯完成,11秒后执行完毕。实际空放15秒,节省时间68秒。

  这一个例子中,它的难处不是在识别空放,它的难处是让20年前的信号灯能够及时跟上我们今天这个时代的节奏。

  能算得出来,也算得很快,但是执行器如果不够快怎么办?我们通过人工智能把这个路给打通了。

  下面再讲最后一个案例——防汛。

  这两年,个别城市在洪涝灾害中都被淹了。今年夏天,我们在济南做了一个尝试。

  我们把低洼地段的色块周边的摄像头提前“点亮”。当我们知道将要降雨的时候,总共3300多路摄像头在降雨三个小时的时间里面,被我们每30秒钟提取每个摄像头的数据,以此用来实时计算低洼地带积水的深度,以及统计是否有人被困。

  这个事也看上去很简单,对吧?它的难度在哪儿?要把3G时代建设的摄像头“拉流”,进行实时的计算,干5G时代的事。用3G的基础设施干5G时代的事,这一点在技术是有挑战的。但这个业务的社会价值很高。

  这是一个真实的案例,上图这位老人当时通过一个下穿桥,水流太急,老人因为腿脚不方便,倒下去了。我们的人工智能算出这个地方的水位高了,然后发现有个人不动,最后把这件事从后台“弹窗”出来之后,联动交巡警,才把他解救了。通过这个活生生的案例,尤其对于这位老人来说,人工智能的价值一下就显现出来了。人工智能不能阻挡洪水,但是它能够帮助那些老百姓至少早一刻钟逃离这些洪水。

  我想这就告诉我们一个事实,那就是人工智能如果深入到产业当中去,是能够解决很多以前解决不了的问题的。所有的要素都在,只是以前没有被整合。

  最后,我想用一个故事来收尾。

  两千多年前阿基米德聚焦几百面镜子,烧了敌人的船。两千多年后,在青海,我们有几万面镜子去反射阳光,聚焦熔岩电厂。跨越两千多年的两个完全不一样的形态,但它们的道理是一模一样的。如果我做个比喻,那些阳光就是源源不断的数据,那些镜子就是我们计算的芯片,而把阳光精准对焦到一个焦点,这种方法就是算法。

  阿基米德他干的就是数据加算力加算法的事,而两千多年后在青海这个地方还是一模一样的,只有用数据加算力加算法来聚焦,才能融化,融化了才能突破。

  刚刚讲的这几个案例中,其实我们就是在重整、解决算力、数据和算法的生产关系的问题。

  在今天的数字化时代,最大的三座“孤岛”正在形成。这三个新的“孤岛”一个是数据,一个是算力,一个是算法。我们的算力中心特别多,我们的数据也特别多,都是互联互通的,但是有数据的地方没有算力,有算力的地方没有数据,更没有算法。如果它们的生产关系没有理顺,我们干不了前面说的那些事。当我们把三者的关系给理顺之后,其实人工智能的突破,尤其是人工智能在产业的突破就是自然的事情了。当产业的数据已经极其丰富的时候,有数据、有场景、有算法,那就“三缺一”只缺算力了。

  所以我们需要在这个时代重新理顺生产关系,在顶层设计上去打破数据、算力、算法的“三国演义”,打破它们三分天下的局面,让数据、算力和算法不要彼此“走迷宫”,把它们三个放在同一个反应容器当中,催化价值反应的过程。我认为这是我们在数智化转型赋能产业升级过程中必须要做的一件事。技术的人干技术的事,搞“神经网络”,但是顶层设计的人必须重整生产关系,才能达成我们呼吁的“以价值创造来引领新质生产力的发展”。