1

智能管理能力快速提升,华为存储做了什么?

 2 years ago
source link: http://stor-age.zhiding.cn/stor-age/2021/1129/3137685.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

智能管理能力快速提升,华为存储做了什么?

【原创】   2021-11-29 10:14:38

关键字: 华为存储

华为存储如何实现智能管理能力的快速提升,其中又涉及哪些隐藏的黑科技呢?

数字经济时代,数据成为新的生产要素,数据的重要性不言而喻。随着数字化转型的加速,数据量正在经历爆发式的增长,根据IDC预测,全球数据总量将会从2020年的50ZB快速增长到2025年的175ZB,其中,中国的数据量更是将达到48.6ZB。爆发增长的数据量对承载数据的存储提出了新要求,不仅需要高性能、高可靠、高可扩展的存储介质,还需要自配置、自修复、自优化的智能管理能力。

近期,国际权威分析机构Gartner发布2021年全球主存储魔力象限报告《Magic Quadrant for Primary Storage》,华为存储继2016年以来,连续第六年入选领导者象限,报告中将智能管理能力作为华为存储的主要优势之一

华为主存储基于人工智能的三层数据管理系统,提供可视化跨栈管理,高效模拟和分析工作负载,显著简化基础设施运营,提升数据中心管理效率。” 【摘自Gartner 2021存储魔力象限报告】

华为存储如何实现智能管理能力的快速提升,其中又涉及哪些隐藏的黑科技呢?

首先,华为近2年推出三层AI运维架构,针对不同的客户运维场景需求,可提供基于云上云下协同的运维场景覆盖。

其次,基于存储服务等级SLA的自动化能力,支持全自动化、代办任务、脚本编排等多种场景业务变更。

再次,基于机器学习的可视化虚拟机、主机、交换机、存储端到端运维分析能力,在故障感知、故障处理方面实现被从动运维到主动运维。

最后,基于混合数据集成的检测技术和仿真评估能力,高效模拟和分析工作负载,帮助客户基于最佳实践合理规划和优化业务。

正是这四点黑科技支撑着华为存储智能管理能力快速提升,接下来一一解读。

三层数据管理系统联动,为存储提供智能运维架构

华为在十多年大量运维经验积累基础上,提出领先的“云端-数据中心-设备”三层AI运维架构,包括设备AI、中心AI和云端AI。其核心是充分发挥三层协同的优势,进而实现AI能力的全栈覆盖。特别是云端AI平台可以发扬其数据与算力优势,提供AI模型的训练,实现少人或无人参与的自治闭环。数据管理三层架构通过打通云上云下的协同能力,使存储自配置、自修复、自优化的智能运维管理能力成为可能。

智能管理能力快速提升,华为存储做了什么?

图:“云端-数据中心-设备”三层AI运维架构

基于服务等级存储池化融合,实现存储业务变更自配置

传统的IT系统多是烟囱架构,即单台或者多台设备物理上对应某一个特定的业务,不能灵活适配业务场景的变化。华为拥有全场景的OceanStor系列化产品,进而可以通过存储资源池化打破设备的边界,实现存储资源的按需发放。

数据中心存储场景,在对多存储设备基于SLA的池化整合后,存储IOPS、时延、容灾、备份等能力配置在SLA中,数据发放时用户只需指定业务所需的SLA服务类型,不再需要人工干预,主机、FC交换机、存储自动按照SLA参数自动化资源发放,大幅降低变更发放复杂度、人为出错几率和提升作业效率。

  1. SLA定义:按照容量密度定义SLA的IOPS能力,合理分配存储性能资源。
  2. E2E自动化能力:资源发放过程中,全自动化完成存储资源分配、交换机ZONE的划分。
  3. 资源自动推荐:按照容量均衡、性能负载均衡的策略为资源分配过程推荐最佳存储资源。

可视化跨栈管理,让存储运维从人工辅助转向自修复

面向存储系统,云端运维eService对业务Workload进行实时采集、学习,针对存储设备硬件配置、软件配置、性能数据等进行综合分析,评估设备性能压力,结合华为丰富的专家经验,精准地描绘出设备性能画像,准确识别设备性能瓶颈并给出相应的修复策略。

面向数据中心,中心运维DME提供虚拟机、主机、交换机、存储端到端的自动化故障发现和解决能力,依据虚拟机在存储子网中的拓扑关系,基于智能算法,可以准确识别虚拟机因资源争抢出现的扰邻现象,展示扰邻根因并给出解决措施,快速高效解决虚拟机性能问题。

  1. VM到存储的拓扑可视:可视化展示从vDisk到磁盘阵列的端到端拓扑图。
  2. VM性能异常检测:自动化识别VM的CPU、内存、时延指标持续偏高异常。
  3. E2E性能自助分析:客户可选择VM、Host、DataStore、LUN对象的CPU、内存、IOPS、带宽、时延等指标,进行对比分析。
  4. VM扰邻分析:针对主机内存、CPU、IO资源快速定位存储子网中异常VM存在的扰邻根因,针对性给出扰邻现象的解决措施。

高效模拟和工作负载分析,开启存储自优化之门

针对运维工作中最难、最易出错的业务优化问题,云端运维eService运维软件提供设备采购、业务上线、业务扩展和业务迁移四大场景仿真能力

  1. 设备采购场景:支持自定义工作负载,评估设备性能能和容量,快速制定设备采购方案。
  2. 业务上线场景:仿真设备性能和容量变化趋势,合理规划业务上线目标设备,避免新业务上线因设备性能和容量压力激增导致业务故障。
  3. 业务扩展场景:仿真业务倍增时设备性能和容量压力,提前识别运行风险,保障业务稳定运行。
  4. 业务迁移:仿真业务迁移对设备性能和容量的影响,智能推荐迁移目标设备。

基于仿真结果,中心运维软件DME准确地预测业务变更后设备的性能、容量变化情况,主动进行业务优化,或者给出建议供客户,帮助客户实现资源最优化选择。

华为数据存储在运维管理领域将围绕极简、融合、智能打造自配置、自修复、自优化的数据管理软件,目前在金融、运营商、能源、医疗、教育等多个行业上百家大型客户得到广泛应用,并训练和积累数十种典型业务的Workload模型和大量存储优化算法。

在未来数字化转型的浪潮中,华为存储将利用在全球ICT领域技术储备的领先优势,逐步向高度智能化的变更、维护以及调优等运维管理模式演进,为客户提供最优存储运维管理方案,助力客户在数字化转型浪潮中脱颖而出!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK