国内云计算数据中心领域具规模和影响力的标志性盛会,第十二届中国IDC产业年度大典将于12.21-22日在国家会议中心举行。在昨天的主会场上,多位领导及嘉宾对目前数据中心整体市场进行了分析与点评,在今日的数据中心技术创新分论坛上,多位嘉宾将会对数据中心的技术创新进行分析与解读,让我们共同迎接今天的数据中心技术创新分论坛。

中国IDC产业年度大典作为国内云计算和数据中心领域规模大、具影响力的标志性盛会,中国信息通信研究院人工智能部主任,国际电信联盟机器焦点组副主席:孙明俊出席此次会议,并发表《人工智能之算力演进》主题演讲。

孙明俊

中国信息通信研究院人工智能部主任,国际电信联盟机器焦点组副主席:孙明俊

演讲实录如下:

孙明俊:大家早上好!很高兴作为这个会场的第一位演讲者,我每年都会来参加IDC圈的大会,在座的也有听众认识我,我来参加的时候是作为数据中心联盟秘书长的身份,今年换一个身份,今年的身份是作为人工智能的研究者。在座各位也有可能是换了身份,IDCC大会集中在数据中心领域,数据中心联盟从2014年开始建立,但是2013年开始工作,到今年为止运行了四个年头,在这里面我也可以看到数据中心领域受到云计算的带动,受到移动互联网发展的带动,再后来受到区块链领域的带动,有一个非常快速的发展,但是每一个领域在兴起的时候,数据中心都受到了很大的挑战。

比如说在2013年的时候,IDCC大会在2013年也出过关于数据中心的指导意见,当时的指导意见针对云计算来了,数据中心会有什么样的容量规模,网络连接这些方面的变化,应对这些变化,国家有没有办法从计划经济,我在全国各地见到大规模的数据中心,它有一个测算,有一个能源需求的预估、市场需求的预估,这两天的IDC圈的大典,大家很明显地可以看到,不管从数据中心自身的形态,还是从数据中心内延和外延的概念都有了很大的变化,我个人是研究者的身份,同时也会有一些分析,这个领域发展变化太快,虽然它作为一个古老的领域,但确实非常稀缺。这里面会有一些思考,这些思考目前还不能够做到像以前我站在这个会场的时候,有那么多很成熟的想法,比如说我们推进了数据中心的绿色认证,推进了绿色中心可靠性评估,推动了ODCC的工作等等,而现在只能看一看方向在哪儿?

在看方向在哪儿的时候,需要讲一下人工智能的趋势。人工智能的发展,每讲到人工智能都要拿一张图来秀一秀,实际上人工智能是渊源很长的领域,人工智能正式诞生是在1956年,昨天大家听了侯博士的诞生,任何一个技术或者一个产品的诞生都不太可能是从石头缝里蹦出来的,一定会有一个演进的历史。为什么会在1956年出现人工智能的事件?在此之前又什么样重要的事件发生?从而导致人工智能的出现。其实在1956年之前,可以看到人工智能的诞生受到了二战期间很多武器的进步,才推动了人工智能领域的诞生,比如今天看到机器人,二战期间武器的变化,在那时候自动控制理论已经出现。

人工智能领域,一是受到自动控制领域的推进,二是算法。到1996年这个节点为止,人工智能的算法,我很多专家都是从九十年代、八十年代开始搞人工智能,算法已经很成熟了,为什么人工智能没有发展起来?互联网的发展从1990年开始是正式的起点,这个孩子开始落地开始走,但是这个孩子走得特别快,他长的特别快,长到今天互联网已经成为我们生活的一部分,大家离开互联网都不知道生活会是什么状态。这样的状态为人工智能奠定了特别好的基础,这样的状态也促进了数据中心行业非常快速的发展,数据中心的规模从九十年代,不管是国际上的标准还是国内的标准,那会儿没有数据中心标准,也没有数据中心名词,叫机房,计算机机房、电信机房,没有数据中心,什么时候叫数据中心?数据这个词什么时候这么重要?从看到互联网源源不断地产生信息,源源不断地产生数据,数据越来越多,数据量以爆炸式进行增长,在爆炸式增长之后我们自己处理不了怎么办?用云计算处理。

综合这些挑战,最最关键的就是我刚才提到自动控制具备、互联网具备、算法具备,缺一个什么条件?就是缺算力。算力这个条件随着计算机的发展可以看到,像电子管计算机、晶体管计算机、集成电路数字计算机,真正我们能用计算机是从大规模集成电路计算机开始的,通信是所有产业的基础。这些条件都具备了,算力应该是什么样的?

人工智能的崛起有三大因素,实际上很多做人工智能的专家,尤其是在做应用层面的,他会认为深度学习才是所有崛起的基础,为什么呢?因为跑得再快,数据规模再大,数据资源再多,没有什么改变。如果没有芯片的支持,人工智能在这一波,比如说算法很牛,出来一个很新的算法,但是依然没有算力的提升,第二波起来了算法很牛很厉害,依然没有算力的支持。

阿尔法狗其实需要1920个CPU+280个GPU,才能完成它的计算,在以前这是不可想象的,人工智能的深度崛起确实是它的原始的动力,但是真正的能够让它稳固地往前走,必须是算力的演进。算力的演进就是阿尔法狗有个很著名的笑话,说阿尔法狗下一盘棋大概需要耗三千度电,李世石需要吃个馒头,这是非常巨大的对比。算力不断演进也可以看到,现在的阿尔法狗吃一个馒头还是不行的,但是已经2个TPU就可以完成这个工作了,电力的消耗已经在巨大的下降过程中。

刚才提到三个驱动的因素,真正的AI起来有几个条件。第一得有海量的数据,海量的数据其实是所有的现在的人工智能的算法的演进必须有数据作为制成,如果没有大量的标注好的数据库,从70%的识别率提升到95%的识别率。现在是人工智能的会场,门口都是人脸识别,可以识别出你是谁,你进入哪个会场,你走过的轨迹是什么,都会有。这是海量数据。

有海量数据还不行,人工智能公司其实没有赚到钱,我们做云计算的公司可能刚刚开始有了赚钱的可能性,但是真正在这一波里有一类公司是赚钱的,就是做数据标注的,光有数据不行,得有精准的数据、标注过的数据,人工智能的应用必须有这样的条件,客观、精准、自动标注过的数据,阿尔法狗有一个很大的特点,是单一领域的,大家可以看到人工智能领域以阿尔法狗为代表,当然阿尔法狗出来之后,把它挪到其他领域去应用。跟我们数据相关的就是超大的计算量,海量的数据要去标注,抓住专业领域,带来的就是更大的数据量,更大的数据量对于数据中心这个数据领域还是需要规模的不断扩大,网络的不断提升,才能去做。

人工智能现在最火的几块,通过最火的几块大家可以体会到数据中心这个领域,大家应该支撑什么样的业务,我们看看未来它发展的情况,应该有怎样的布局。

AI这个领域最吸引人眼球的,也是因为计算机视觉。前年马云在德国刷了一次脸支付,从这一点真正受到了老百姓的关注,计算机视觉作为进入AI大门的钥匙。外因我们可以看到,人工智能这个行业组织者从深度学习算法出现开始,2013年作为节点,从2亿美元迅速增长到2015年12亿美元的规模。这个外因除了投资的增效,还有政策的大力扶持,今年国家发了两个很大的政策,第一个是7月份发了新一代人工智能发展规划的政策,12月份工信部又发了一个落实推进新一代人工智能三年行动的计划,有一个非常落地的方案。因为我们要去看未来,国家要推的方向和产业发展的方向,通过这些方向也可以去看到未来我们对于基础设施的要求的变化。

在图象识别这个领域,大家很熟悉的是指纹识别和人脸识别。指纹识别应用比较成熟,它是非常单一的领域,其核心的技术都掌握在一家公司手里,它把成本降得非常的低,目前已经不是特别热的领域了。人脸识别这个领域,今年确实非常的火,在各个领域可以看到,甚至于现在包括很多的智慧小区,比如说智慧矿山,智慧煤矿等等这些领域,都开始用人脸识别,用人脸识别可以实现全程的管理,当然这里面还有一个问题,一个题外话,比如像煤矿的管理,人下去的时候脸是白的,上来的时候脸是黑的,识别出来还是有困难的。一般来说它会有一些辅助的能力,光靠人脸识别是不行的,比如说虹膜的识别、指纹的识别。人脸识别今年非常的热,我们可以看到今年在人脸识别这个领域,在IphoneX出来的时候,非洲的人可以照各种脸,很容易欺骗过人脸识别的系统,它必须个辅于其他的。但是人脸识别已经成为系统化、平台化的趋势,不管是阿里还是百度,都开始推出了在线的视觉处理平台,其中人脸是特别重要的一块。这是在生物识别领域。

其实生物识别就是人脸一张图片,再怎么着,数据量也大不到哪儿去。

场景识别,就是视频识别。真正的场景识别,比如说在工业领域,工业列与用的都是瑕疵品,比如像钢板从这里过去,以前是靠人去盯着瑕疵,人去盯着看,人的点出率应该不会超过70%,比如要靠机器的点出率大概是在90%的情况,但其实这仅仅能用于瑕疵。在整个的生产流程里,是不是可以用图象识别,用场景的识别去进行全程产业链的监控,来保证我的瑕疵度要降到非常的低,这个现在还是做不到的,这个运算量其实是非常巨大的运算量,因为它需要非常多的图片、视频的输入和场景的训练,才能实现从原料进厂到产品出厂做到识别的能力。这是在场景识别方面。

其实更多的像这样的一些场景,在现在有很多的宣传,但是现在是做不到的,很难。人脸识别的BUG依然非常的多。比如基于动态图象的识别,现在有很多企业去宣传,比如我站在这儿往这儿一走过去,不用看我的脸,就可以识别出来我是谁了,假设说去追一个在逃的通缉犯,通过他的步态就能识别出来,真正要实现这样的目标,还是很难的。

还有自然语言理解与交流,据微软统计,每天半夜十二点是小冰的使用率高峰,它真的是深入到我们的生活的一部分,其实我们可以看到,在云这个产业,包括云合成,包括自然语言理解,小冰当然是语音合成,大家之所以调戏它是因为它能够做到一定程度的自然语言理解,能够去识别,能够给你一个正确的回复。另外在语音识别这块,我们能够实现五米以内的近场的识别、远场的识别,但是在自然语言理解和交流非常的困难。这样的技术其实我们可以看到,我们的日常应用里已经有非常多的场景在用,语音处理作为平台,也是有非常大的空间,我觉得这个对于数据中心领域也是未来非常有刚需的方向。

讲到人工智能还需要讲认知与推理,实际上刚才的这些是通过自动学习算法来的,人需要神经科学的启发,用脑科学的方式去研究人工智能的实现方式,回到今天的主题就是讲算力演进,算力从NVIDIA我们就可以看出演进的趋势,我们现在全球90%的人工智能训练进片是英伟达供货的。

在芯片方面可以看到,刚才我提到的所有领域,其实现在都有专用芯片在研发,真正的在神经网络这个芯片非常的多,前天地平线刚发了一个旭日和征程的芯片,又在自动驾驶汽车上面,我们可以看到真正的在芯片这个方面,随着人工智能这一波,不光是现在提出的这些,当然我们可以看到寒武纪推出来的,如果我再来讲,它会变成更复杂的表。

算力架构是按冯诺依曼体系来做的,这还是基于现有的架构,未来我们可以看到非冯诺依曼体系架构,现在发了TrueNorth,随着量子计算的出现,我们觉得人工智能会出现新的变化。

刚才我讲到的其实更多的是在能耗方面,但是能源消耗方面真正随着人工智能的发展,应用数据量的非常巨大的量,真正对于数据中心的构建是非常大的挑战。另外我们可以看到对于十年实验的要求越来越苛刻,我举个例子,比如现在的智能客服,时延是对数据中心巨大的挑战。

另外我们可以看到这篇是在讲它演进的趋势,但我个人看来,我觉得其实目前来看,除了我刚才提到的各种应用作为平台,实际上这种融合趋势也越来越明显,可以看到这种融合的硬件平台算法,AI的能力在未来是很大的趋势,各个厂家都在推他们的GPU/FPGA融合算法的芯片,这在未来是一个趋势。

如果评价这个芯片对于深度学习,对于神经网络的支持能力,现在业内是没有统一的指标,不管是TPU还是什么,它是基于什么样的图片,什么样的神经网络来跑出来的这样一个能耗,它的算力速度等等,是没有统一的标准的所以我们现在也在跟各企业合作,来做人工智能芯片的算力的分析方案的工作。

我全部的介绍就到这儿,谢谢大家!

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-01-16 10:37:56
国内资讯 瞭望 | 前瞻2024人工智能四大趋势
2024年值得关注的是AI代理和无代码软件开发带来的“冲击波”。 <详情>
2024-01-09 16:53:00
市场情报 中兴通讯分布式存储+ DPU,加速数据中心转型
存储技术在不断地创新、完善、加速演进,以更好地满足业务的存储需求,但同时也使得存储协议和文件系统越来越繁重。 <详情>
2023-12-25 16:19:17
市场情报 人工智能产业蓬勃发展的背后:智能算力走上C位,中国移动谋篇布局
随着人工智能产业的成熟,特别是今年以来大模型的爆发,智算中心逐步替代了数据中心进入大众视野 <详情>