46

业界首款面向AI时代的数据中心交换机面世 实现从“傻瓜”到AI质的飞越

 5 years ago
source link: https://www.sdnlab.com/22872.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

随着数据中心网络基础设施的日益细化,一种新型交换机逐渐诞生,那就是数据中心交换机。与传统三层分层网络的网络交换机不同,数据中心交换机旨在支持关键任务应用程序的数据和存储。伴随海量数据处理需求及云计算、物联网、边缘计算等技术的发展,数据中心交换机经历了几个发展阶段,从“傻瓜式”发展到云化,再到融入AI,数据中心交换机的变化与发展推动了数据中心和网络向智能化转型。

huawei-AI-head-1-668x400.jpg

什么是数据中心交换机?

一般来说,数据中心交换机是一种高性能交换机,主要面向严重依赖虚拟化的大型企业和云提供商。它可以部署在整个数据中心,或锚定两层(leaf-spine)或单层平面网格或结构体系架构。

数据中心交换机功能

以下是数据中心交换机的一些共同特性:

  • 可以处理南北和东西向流量;
  • 所有数据中心交换机均用于ToR(top-of-rack)和EoR(end-of-row)架构;
  • 支持使用标准LAN以太网协议和SAN协议的高带宽互连。例如,光纤通道和以太网光纤通道;
  • 在硬件和软件中具有广泛的高可用性和容错系统。因此,能够为关键任务应用提供更好的正常uptime;
  • 分布式数据中心交换机的所有组件都可以从单个管理接口进行管理,以便于使用。

数据中心交换机的发展

从最初的“傻瓜式”交换机到面向云时代的数据中心交换机再到如今AI也烧到了数据中心交换机,数据中心交换机经历了质的飞跃。

早期的交换机是一种“傻瓜式”的交换机,用户只要接上网络设备就能使用,不用关注复杂的网络环境。交换机在初始化时,一切配置就已经设定好了。因为简单,所以这种交换机可做的功能也比较有限,仅限于在第二层做VLAN转发,在稍微复杂的网络环境中可能就会“罢工”。在当今需求不断变化的网络中,这种“傻瓜式”的交换机一般就是作为桥接设备,运用在简单的局域网中,真正到了数据中心里很少能见到“傻瓜式”交换机,因为他无法控制用户访问交换机,保障网络安全,以及提高网络传输效率。

很显然,“傻瓜式”交换机不符合数据中心的需求,目前数据中心里使用的绝大部分都是云数据中心交换机。云数据中心交换机可以对网络进行精细化管理,从接入到汇聚、核心网络,云数据中心交换机都可以具有一些网络功能,比如:接入部分的Dot1X认证、环路检测、MAC认证等等,汇聚部分的聚合、灵活QINQ、DHCP功能等,核心部分的路由策略、策略路由、防控列表等,一个云数据中心交换机至少要具备上百条网络协议功能,因此随着网络功能的增加,云数据中心交换机的配置越来越多,网络越做越发复杂,企业在数据中心网络运维的投入也越来越高,这给数据中心带来了沉重的压力。

数字化转型提速驱动数据量暴增,同时非结构化数据占比在持续提高,庞大的数据量和处理难度已远超人类的处理能力。人们需要基于机器运算深度学习的AI算法来完成海量无效数据的筛选和有用信息的自动重组,获得高效的决策建议和智慧化的行为指引。毫无疑问,智能交换机并不能满足数据中心网络发展的需求,人工智能交换机的概念就此诞生。早在2017年5月,网络巨头思科就曾斥资1.25亿美元收购了人工智能初创公司MindMeld,一个制造交换机的网络企业收购一家AI初创公司,显然是已经嗅到了其中的市场机会。通过AI技术可以很快掌握交换机上的流量转发情况,还可以输出流量分析结果供管理人员参考;通过AI技术可以根据交换机上的数据转发情况,自学习设计算法,对于效率不高的算法进行优化,然后将算法固化到硬件中去;AI交换机不需要做大量的阈值参数配置工作,极大简化了设备的配置量,大大提升了网络运维的效率;更加关键的是,AI交换机能够增强设备安全能力,这对提升网络设备的安全防护能力尤为重要。

业界首款面向AI时代的数据中心交换机的面世

在2019年1月9日举行的“网络新引擎 AI赢未来”华为网络春季新品发布会上,华为发布了业界首款面向AI时代的数据中心交换机CloudEngine 16800,定义了AI时代数据中心交换机的三大特征 - 内嵌AI芯片、单槽48 x 400GE高密端口、能够向自动驾驶网络演进,并创新性地引入AI技术,普惠AI助力客户加速智能化转型。

huawei-AI-head-668x400.png

业界首款内嵌AI芯片数据中心交换机,100%发挥AI算力

刷脸支付的背后是上亿次图像信息的智能识别,深度健康诊断需要基于数千个算法模型进行分析,快捷网购体验离不开数百台服务器的智能计算。新商业物种的诞生,产业的跨越式发展,以及用户体验得以改变,强烈地依赖于人脸识别、辅助诊断、智能推荐等AI应用的发展。AI算力受到数据中心网络性能的影响,正在成为AI商用进程的关键瓶颈,高性能数据中心集群对网络丢包异常敏感,当传统以太网络有0.1%的丢包,就会导致AI算力只能发挥50%。为了最大化AI算力,华为CloudEngine 16800搭载了高能效AI芯片,借助其实时学习训练能力,承载独创的iLossless智能无损交换算法,为以太网赋予了无丢包机制,并实现流量模型的自适应自优化,构建一个零丢包、低时延的数据中心网络,这样的机制可以使AI算力充分发挥,加速人工智能应用创新。

业界最高密度单槽位48 x 400GE,满足AI时代5倍流量增长需求

数字洪水来袭,预计全球年新增数据量将从2018年的 10ZB 猛增到2025年180ZB( 即1800亿TB),现有100GE为主的数据中心网络已无法支撑数据洪水的挑战。华为此次突破超高速信号传输、高效供电、超强散热等多个高密400GE技术难题打造的CloudEngine16800,单槽位可提供业界最高密度48x400GE线卡,整机提供业界最大的768端口400GE交换容量,交换能力高于业界5倍,满足AI时代流量倍增需求,同时单比特功耗可下降50%,更绿色节能。

使能自动驾驶网络,秒级故障识别、分钟级故障自动定位

当数据中心为人工智能提供了充分的技术支撑去创新时,人工智能也给数据中心带来巨大的收益。近几年,数据中心架构已经发生了巨大的变化,服务器规模由几十台扩大至上万台,同时计算网络、存储网络和数据网络逐渐融合,业务一旦发生故障,靠传统人工排查的运维手段定位故障需要数个小时,已难以为继。华为此次将数据中心交换机CloudEngine 16800赋予了AI能力,提升“网络边缘”的设备级智能化水平,让交换机具备本地推理和实时快速决策能力;再结合集中的网络分析器,构建分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位,使能自动驾驶网络加速到来;同时,该架构还可以大幅提升运维系统的灵活性和可部署性。

华为自2012年进入数据中心网络市场以来,已服务于全球6400+个用户,广泛部署在中国、欧洲,亚太,中东非洲,拉美等全球各地,帮助互联网、金融、政府、制造、能源、大企业等多个行业的客户实现了数字化转型。华为推出的面向AI时代的CloudEngine 16800数据中心交换机将助力客户加速智能化转型,实现普惠AI,共同构建万物互联的智能世界。

参考:
1、http://dc.idcquan.com/jhcc/142584.shtml
2、http://www.qianjia.com/html/2018-06/21_295877.html


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK