在过去十几年,随着互联网行业的发展,整个互联网不仅给我们的生活带来了很大的改变,而且也促使中国在技术方面实现了飞跃,同时,也是中国实现跨越式发展、超越领先的经济体的一个很大的机会。在数据中心或者基础架构团队,做业务、做技术,我们对自己的要求是是保证系统正常运行,稳定性达到99.99%;除此之外,我们还有更大的责任,怎么使得我们的业务、产品,更经济、更快速发展,基础架构和数据中心领域所有的创新都围绕业务展开。因此在每个阶段,无论是PC互联网,还是无线互联网,还是AI时代,我们的基础架构和数据中心技术都与此相关。这里我分享一下我在这方面的看法,也希望跟业界的朋友多做一些交流。
我们已经进入了智能互联网时代。去年,AlphaGo赢得两次围棋挑战赛,点燃了整个业界对AI的热情,无论是中国还是美国的硅谷,无论是创业公司还是各种会议,在AI领域如火如荼的展开。今年年初《强大脑》这个节目里,机器人用AI技术与人类做挑战,百度的小度在三项比赛里赢了两项,平了一项,这里用了语音识别技术、人脸识别技术等等。完成这些比赛是不容易的,背后用了几百块GPU的卡,数据处理量也非常庞大,能够实现精确的识别,背后依赖强大的数据中心和计算能力。今年年初通过AI技术实现了失散儿童的寻找。AI领域的另一个应用是无人驾驶。所有的技术让我们的生活变得更加的方便。
AI时代跟PC时代不一样,在AI时代我们更多地使用语音,使用背后的数据,使用计算能力,使用不同的算法,来实现更精准的、更好的应用。在百度,办公场所的闸机可以用人脸识别技术;在百度的阳泉数据中心,从2014年开始进行智能化,我们用AI技术,在智能散热、容量规划等方面都取得了很好的成绩。举一个简单的例子,比如:容量管理里,通过对数据的分析、建模,用不同的算法动态调整电力以及相关的配置,可以使我们的机架使用率提升17%;如:故障定位,整个数据中心包括全国的网络来讲是一个庞大的系统,系统出现的任何故障要定位到点,目前SDN技术还没有那么好的情况下,是一件非常困难的事情。以前出现一次拥塞可能需要30分钟,甚至需要更长时间才能定位到什么地方,现在利用AI技术可以缩短到3分钟就实现。AI技术它不断在改变我们的生活,未来在帮助进行企业精细化运营,提高企业管理水平等更多的应用。例如,办公楼空调每年耗费很大的电能,我们把AI的技术应用到百度的科技园大厦,用这个技术可以为我们全年的电量节省15%到20%。
百度在5月4号发布了百度新的使命——用科技让复杂的世界更简单,这是我们用技术改变世界愿景。在今年7月份AI开发者大会上,我们发布了DuerOS系统,通过语音入口,帮助人们更自然地与机器进行交互,更自然的实现各种操作。同样在各个行业大脑,无论是医疗、教育,也是用AI的技术在做这方面的工作。ABC智能云,是百度云区别于其他公有云的特点。同样,AlphaGo做围棋,是专用的AI系统,我们针对围棋的规则以及历史比赛的场景,不断去训练它,让这个机器更容易赢得一场比赛。每天用户寻找的问题、要解决的问题,不仅仅是围棋,也可能是象棋、军旗,也可以为你寻找各种各样的服务,未来搜索引擎更像通用的人工智能。
在AI时代,我们的网络会变得更加的强大,在5G的时代,我们的网络带宽,可能是现在家里带宽的100倍以上,网络延时会降低。对于5G时代,我们面临更多的机会。做基础架构和数据中心的需要更超前,无论网络,数据中心团队,服务器团队,一定要走在业务的前面,不能成为业务发展的障碍,而要成为业务发展的使能器。
AI时代的应用有这么几个特征,第一点是万物互联。随着5G和NB网络的到来,使得各种各样通电的设备都有机会与网络互联。这也更有机会让万物变得更加智能。第二点是海量数据。万物互联带来的一个结果就是产生大量的数据。模型训练需要更大量的数据,训练样本多精确度就高。为此,百度有专门设计的冰山存储服务器。第三点是模型复杂。以前一块GPU卡就可以做一个训练,但是现在为了提升效率和精度,模型会变得越来越大。百度为什么要做GPUBOX,为什么一个机器里要插16个卡,就是因为模型越来越大,算法需要的计算资源越来越多,这使我们的计算越来越精确,让我们训练的时间会越来越短。第四点是时效和敏感。在5G时代,网络速度将变得很快,有很多应用比如交互式的语音翻译对时效性要求很高,每个人都不希望对着手机说一句话等五秒钟,那是非常差的体验。
总结一下数据中心领域的技术趋势。第一点变化,数据中心节点规模从小变大。AI时代数据就是核心竞争力,数据交互的需求更大,大量数据的流动带来数据中心跨网流量的增大,同时也带来数据延迟的压力。数据中心由小变大,将使我们把数据交互尽可能控制在数据中心内部,数据中心的体量也从2万往10万+规模发展。第二点变化,计算和存储能力要求更大。我们在使用GPU、FPGA来提升计算性能,未来也会往ASIC方向发展,还有一些超融合的解决方案,比如offload一些负载到智能网卡来执行来解决大计算、大存储的需求。第三点变化,是端到端的通信更加顺畅,通过100G的网络和架构升级实现无阻塞无感知的网络。最后一点变化,是离用户更近,计算无处不在。CDN面临升级,CDN不仅要承担内容的发,未来还承担计算和连接的能力,把推送到离用户近的地方,比如语音识别或者是图象识别里的框选功能。未来挑战很大,在座的各位都肩负很艰巨的任务,期待通过不断改进和创新,让我们的基础架构和数据中心变得更有效率、更强大。谢谢大家!