46

华为杜伟:未来网络 联接物理虚拟、高效承载AI

 4 years ago
source link: https://www.sdnlab.com/23245.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

5月23日,在“SDN/NFV技术与应用创新”分论坛上华为公司ICT战略与业务发展首席网络专家杜伟给我们带来了《未来网络联接物理虚拟、高效承载AI》主题演讲。

duwei-huawei-668x400-1.jpg

杜伟指出,从2012年至今,网络一直在围绕云和内容发生变化,在过去的五年中,整个网络都在围绕云的变化提供服务。最早的CDN是人定义的边缘,而如今的边缘计算是围绕着公有云、云服务来提供的,网络主要是起到一个管道的作用。

内容自上而下已推动骨干网变革;数据自下而上将推动城域网变革

杜伟表示,在这个过程中内容自上而下已推动骨干网变革。例如,DCI网络在过去5年中主要是解决从中心云到边缘云的扩散过程中对骨干网提出的需求,但未来它将发生改变。随着2B业务越来越多,其主要的流向数据是自下而上且碎片化的,这就带来了数据流向的变化,它给运营商提供了一个新的机会。“为什么运营商在OTT主导云的阶段始终是在边缘,在业务里面参与不进去?这是因为运营商提供的是几个大的供应链,而自下而上的数据流是来自企业和终端用户,没有一家企业可以完全垄断,形成一个完全垄断的封闭的产业,它必须要有开放的平台。”杜伟指出,运营商要支持企业AI服务,提供边缘计算能力,支持低时延的网络,未来网络将从传统的管道走向计算的总线。

huawei-1-1.png

运营商“由外及内”三层网,相互依托,协同演进

运营商的网络可以分为横向和纵向。从横向看从外到内有三层网络,第一层是从设备到设备之间的一个基础网络,就是传统的设备端口级的互联。这个网络通常基于IP、光和无线构建,它主要的需求是大带宽、低时延和高可靠,主要由运营商管控。第二层网络是云化网络,是云和端租户级互联,基于SDN/NFV构建,主要的特点是敏捷和开放,它基本上是云管控的,为云定义为云提供服务。

huawei-2.png

未来还会出现第三张网络,也就是计算网络。它实现的是数据和计算之间的业务级互联。杜伟指出,“未来用户数据会呈20%的增长率,尤其是在AI化之后,需要大量的计算,而计算和数据又不在一起,计算网络的作用就是把数据带给计算,计算完之后把结果再推送给云库,实现数据和计算之间的业务互联。”计算网络基于分布式网络协议构建,主要的需求是实时和随需,杜伟解释道,“也就是说当我这个数据需要结算的时候我能找到计算资源在哪里,然后把数据传过去,计算完之后把结果推回来,就是完成这么一个工作。”

计算网络的主要特点是去中心化、对等协商,数据和用户之间直接协商来完成。这三个网络不是割裂的,而是相互依托的,计算网络要依托云化网络的构建,云化网络又要依托基础网络的大带宽和低时延。

商业和技术双轮驱动,网络技术“中心到接入”持续滚动发展

回顾网络的发展,从25年前的IP网络到如今的云网络,再到现在的SD-WAN阶段。我们发现云和网从物理变化走到了化学变化,为什么呢?杜伟表示,云里面有一些原则性的东西,比如说转发分离,这来自于云的理念,但是它并不是把云的原生的直接搬过来用,而是把云的理念用在了网络的设备和设计上,它和云没有关系,但是它把云的理念做了网络的创新。再者就是设备的羽化改造,把云和网络做了一个深度结合。

huawei-3.png

杜伟指出,未来一两年对网络最大的驱动是来自于AI,首先第一轮会在城域发生,因为数据是自下而上的。网络为AI服务,这又分为两个场景,一个是如何把AI用在网络运维上,第二个就是考虑网络如何支撑AI。

huawei-4.png

AI for Network

AI for Network是不得已而为之的,因为之前大量的工作是在内部完成的,但是它的维护太复杂,人类已经没有办法维护这种更复杂的网络了,所以就需要要引入AI、引入算法、引入大量的工具来实现云化网络的自动驾驶、自动运维。

huawei-5.png

杜伟表示,现在对于实现网络自动驾驶有两个革新的观点,一个是智,一个是简。智就是通过各种算法让结果实现自动运维,但是如果太过复杂其实对AI工程的实现难度也会构成挑战,所以这里又提到了第二个问题简,就是能不能降低复杂度,简化网络关系,让数据处理复杂度降低。

举一个数据中心的例子,传统的数据中心有一个PUE的概念,就是网络数据中心处理,它是瓦特/瓦特的关系,但是这个数据中心对于运营商的CO,尤其是电信的云数据中心其实不是很合适,因为电信云数据中心主要是解决比特的问题,所以对于运营商的数据中心我们需要考虑全栈的PUE,就是我们的能耗是要考虑比特/瓦特的PUE,我们要实现机房到设备到网络的多层全栈的PUE,这样价值才会更大。每一层都可以用AI技术来实现自动化运维,这个过程中还会面临数据共享、在线仿真、自主决策可靠性等挑战。所以,AI for Network会是一个比较长期的过程,从现在的人工为主,AI为辅,到未来AI为主,人工为辅,这是一个逐步过渡的过程。

huawei-6.png

Network for AI

第二阶段是Network for AI,企业的AI投资领域都是企业服务、医疗健康、金融、网络安全等,AI主要是替代传统人工在运维、安全各个领域的工作,AI的核心是算法加算力加数据。

huawei-7.png

杜伟指出,AI高效的核心是高效算力,因为数据来自于客户,客户把数据给你,我们应该如何提高高效的算力来帮助客户更便宜的完成计算?杜伟强调:“基于相同算法、相同成本、相同时间处理更多的业务数据,这个就是高效算力。高效算力和高效网络是非常类似的概念,也是运营商完全可以做的一件事情。”

huawei-8.png

高效算力包含三个核心要素:
第一,专业:聚焦专用场景可以用更低的功耗和成本完成更多的计算量。从CPU到GPU到TPU到NPU,围绕计算和AI需要有专用CPU、专用芯片来解决,所以它的计算量更高。
第二,弹性:如算力的超分配、算力提供的敏捷性,如轻计算100ms级弹性。高效算力还要解决毫秒级算力如何开发出来给用户使用。
第三,协同:它和网络资源池的概念比较类似。

传统的企业以人工管理为主,未来大量的企业和服务会走向AI,这时候就需要一张网来联接物理和虚拟世界,实现支持企业高效算力的服务。接入层要实现低功耗来满足企业部署的需求,整个网络的使用要满足低时延、高可靠,实现在边缘上支持分布式和强实时的计算网络。

下面是一个Network for AI的案例:

huawei-9.png

最后,杜伟总结城域有两个阶段,一个是AI for Network,很快还会出现Network for AI,就是网络如何服务企业需求构建一个新的网络架构。而运营商可以销售的资源将从现在的带宽转变为带宽+计算,这是未来需要持续探讨的一个课题,这其实也是帮助运营商打开了一个新的市场空间。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK