31

张宇峰:关于 SD-WAN QoE 与 SLA 的思考

 5 years ago
source link: https://www.sdnlab.com/23106.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

3月30日,2019 SD-WAN应用研讨会在北京顺利召开,互联港湾CTO张宇峰跟大家分享了SD-WAN的体验质量(QoE)和SLA的思考和实践。
001.jpg

图1 互联港湾CTO张宇峰

互联港湾最近刚通过了工信部可信云SD-WAN的认证,也是第一批走上国际大舞台的跨境数据通信联盟的正式成员之一。

体验质量QoE的层次

想把SD-WAN的体验做好并不那么容易,体验质量是个有层次的事, 就像洋葱一样。
002.jpg

图2 体验质量QoE的层次

首先是表层,它叫做1阶体验质量维度,也就是人类的感官体验,简单来说就是爽度。爽度受什么影响?速度、保真、一致性, 关于图像、声音、视频, 大家肯定有亲身体验。那么爽度靠什么保障?爽度因子。简单地说, 一是带宽, 是“量”,除了量还有“质量”, 带宽的质量, 由网工同学们熟悉的丢包、延迟、抖动这三个基本元素来定义。

第二个体验质量维度是靠谱度、安全感、自由度和性价比。靠谱度就是可用性、业务连续性、爽度的持续保障,这个也代表了服务商对不确定性和风险的控制能力,同时也能提供不同程度SLA的能力。安全感,主要是对服务的可用性和数据的保护。自由度,也就是业务敏捷性、部署、上线、配置、变更等更加灵活自由。最后是性价比,体验好还省钱,能整合资源, 统合综效。

张宇峰在研讨会上按照体验质量QoE的层次举了几个例子。

对企业关键应用的体验质量优化:最直观的大文件传输,传一个2G的文件,丢包严重的情况下,传输完成估计剩余时间是27个小时,使能优化策略后,下载速度瞬间增加,剩余时间只有16分钟。TCP感觉好多了, 优化简单直接。

003.jpg

图3 大文件传输优化前后的对比

然后, 稍微复杂点的体验是视频会议, 音视频. 图4是互联港湾工程师做的视频会议的测试,刚开始视频过程中有卡顿、模糊等现象,优化以后视频质量清晰,流畅很多, 音频也清楚很多。

004.jpg

图4 视频会议优化前后的对比

更深层看下视频会议. 图5中的视频会议软件都是一代代的推进,简单来讲有一些变化,一个是从私有驻地部署到云化/SaaS,从传统的C/S变成了B/S,另外还有一个就是鲁棒性的不断增强, 应用层自带的优化算法确实越来越强。

005.jpg

图5 UC的演进

虽然说视频会议变得越来越强大,但仍旧不能突破当前物理现实的限制。图6是一个简单的测试,几个ZOOM终端,中间用一个PC来进行流量控制问题的模拟,像丢包、抖动等。左边是截图都是ZOOM本身,达到20%的丢包后,视频变得卡顿,进行屏幕共享后,无法回避在网络丢包时的明显漂移(由数据重传导致), 造成音视频 与屏幕共享严重异步, 会议/分享无法正常有效进行。当丢包非常严重的时候,尽管优秀的应用优化算法能在很大程度上解决音视频优化问题, 屏幕共享要求的信息精确度和颗粒度使得TCP传输陷入重传死循环,因为音视频的缓冲平滑(“美颜相机”类算法)无法改变网络物理现实, 网络层的优化(如链路优化)还是有非常重要的保障作用。

006.jpg

图6 ZOOM视频优化前后对比

靠谱是什么?

靠谱是什么?首先得“看见体验”。刚才说的是爽度因子,第一个是带宽,需要知道不同的应用在不同的地方它们走的路径,URL访问图表记录、应用访问记录统计是客户最直接的对业务的应用和投入产出的反馈。

007.jpg

图7 应用访问的数据记录

第二个爽度因子就是带宽的质量, 关注的是体验的细节,只要在SD-WAN覆盖之内的网络,从A点到B点的延迟、丢包、抖动,都可以准确的显现出来,这样的话能够让用户、服务商、每一层提供服务的人都能看到目标业务应用在网络上的应用业务体验到底是什么样。

008.jpg

图8 目标业务的可视化Qos监控

看见体验后还需理解体验. 理解的方式, 比如使用DPI自动识别企业的主流应用,对企业应用的办公协同工具、通信类的,社交类等, 也可以按需添加应用。

009.jpg

图9 支持DPI识别的应用

在对体验有一定的了解之后,就要讨论怎么来保障,不同的应用类型需要做什么事情。这里的逻辑就是通过策略去识别,有自动识别,也有定向识别策略,另外针对某一条应用它的Qos敏感度是什么样的,比如说上文的视频,可以定义一个具体的针对这种应用业务直接定向来保障体验,图10是Qos策略的一个示例。

010.jpg

图10 QoE自动保障策略示例

还有一些其他的视频优化,按照业务的优先级,做优先选入,这也是针对不同的业务选不同的路径,把主线路给关键应用,其他的链路走互联网宽带。

011.jpg

图11 应用路径预配置示例

前面说了技术手段优化能力和策略,另外还有系统性全架构性的保障,这里面方方面面每一个维度,每个层级都要照顾到,像CPE冗余配置、控制器冗余配置、管理编排器冗余配置和分析平台冗余配置。

012.jpg

图12 系统全架构性的保障

对于新旧的体系,从技术上来讲就是新的服务组合和新的方式。互联港湾作为一个服务商希望把整个的网络困难降低,定向的去把所有的资源整合在一起,设备上都会有最优化的配置,跟客户一起演进协同,跟运营商一起合作。

013.jpg

图13 底层经典工程逻辑图

另外还有底层网络资源支撑,这个有很大的差别,现在很多的资源都可以合作。

014.jpg

图14 全球生态资源合作

最后是技术和资源的多维度加全覆盖,之前说的自动的传输能力,在盒子里面的软件加上资源配合,就可以自动的去监控,自动的优化。分支间转发直连。这个是全国最优质的资源可以在最关注的业务上有一定的保障。互联港湾也非常注重云网络的资源和服务,在这方面做了很多的工作,包括云资源池,尽量把企业客户拉近“供需”之间的“体验距离”最短就是最优化。技术加上资源多维度,加上全覆盖去保障体验。

015.jpg

图15 多维度全覆盖展示图

SLA的炼成

SLA的诉求,客户驱动了QoS SLA承诺,不管是文件还是视频,都需要有保障。还有专线的比较和SLA的生态资源的协同。

016.jpg

图16 SLA的诉求

下图为SLA的结构,乙方SD-WAN服务SLA包含两部分:

  • 网络可用性:面向网络联通性的基于网络收发能力的基础服务等级约定
  • QoS可用性:面向应用业务的基于丢包、抖动、延迟的高级服务等级约定

017.jpg

图17 SLA的结构

Qos的可用性是真正的体验担当,下图为高质量数字转播加视频会议的示例。

018.jpg

图18 高质量数字转播加视频会议示例

回到互联网,下图是产品设计圈层结构模型,外边是用户体验,它的应用就是最合适的体验。企业要做的事就是功能的结构圈,体验越强大功能越强大。但是真正的强大还需要更深一层,就是资源能力圈层,现在不是光靠自己的时代,企业需要去跟各方面的伙伴聊合作,也需要技术的推动。最里面就是所谓的核心存在圈,需要关注最终的体验。

019.jpg

图19 产品设计圈层结构模型

互联港湾已经有十年的互联网战斗经历,也整合了大量的资源,都集成在整个大的框架下,有持续的安全保障能力,可以在需要的时候为企业保驾护航。公司平台也在努力把更好的网络资源联合起来做调度和协同,让资源高效的交付。

020.jpg

图20 互联港湾SD-WANaaS服务

互联港湾的愿景是把作资源池连接和整合起来,让企业内部全球直连、全球生态系统伙伴直连实现客户随时,随地,随需的用户体验。

021.jpg

图21 互联港湾之愿景

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK