2

中国云原生数据湖应用洞察白皮书

 2 years ago
source link: https://report.iresearch.cn/report/202204/3972.shtml
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

中国云原生数据湖应用洞察白皮书

与传统数仓设计架构不同,数据湖具有「数据多源异构、统一存储管理、多范式计算、schema后置和应用广泛」的特性。基于云特有的弹性、敏捷等优势,云原生数据湖被赋予「建立统一数据资产、低成本使用基础资源、高性能计算体验升级和敏捷创新赋能」的核心价值。在云原生与大数据背景下,云原生数据湖成为企业智胜未来的新一代生产力工具,市场即将迎来爆发期。本报告将聚焦云原生数据湖的市场现状、竞争格局及行业实践场景,探讨企业在科技、教育、新零售等不同领域的云原生数据湖实践,以期为更多企业提供云原生数据湖的选型建议。

1 云原生数据湖概念界定
1.1 数据糊的定义
1.2 数据湖 vs 数据仓库
1.3 云原生数据湖
1.4 云原生数据湖核心价值一:数据资产
1.5 云原生数据湖核心价值二:低成本
1.6 云原生数据湖核心价值三:高性能
1.7 云原生数据湖核心价值四:敏捷创新
2 云原生数据湖市场现状
2.1 发展历程
2.2 政策
2.3 投融资
2.4 中国云原生数据湖市场规模
2.5 增长机遇
2.6 痛点改进
3 云原生数据湖竞争分析
3.1 产业图谱
3.2 竞争格局
3.3 竞争要素剖析
3.4 竞争要素一:技术
3.5 竞争要素二:解决方案
3.6 竞争要素三:应用
4 云原生数据湖行业应用与最佳实践
4.1 行业分布
4.2 未来渗透
4.3 金融科技×数禾
4.4 在线教育×流利说
4.5 智能营销×汇量科技
4.6 新零售×百草味
4.7 互联网社交平台×Soul
4.8 自动驾驶×小鹏汽车
5 云原生数据湖选型建议与典型企业
5.1 建议一:战略规划
5.2 建议二:执行路线
5.3 建议三:具体选型
5.4 典型企业展示
5.4.1 阿里云
5.4.1.1 率先入局数据湖市场,持续迭代服务全行业客户数字化升级
5.4.1.2 兼容、弹性、一站式的大数据架构,满足企业多元洞察诉求
5.4.2 Databricks
5.4.2.1 湖仓一体架构,统一管理所有数据、分析和AI工作
5.4.2.2 加速“数据+AI”进程,降低项目风险,快速取得成功
5.4.3 Cloudera
5.4.3.1 CDP顺应大数据架构融合的趋势,为企业提供存算分离、流批一体的云原生解决方案
5.4.3.2 企业级数据云,加速金融、运营商等各行业数字化转型
6 云原生数据湖发展趋势
6.1 掘金市场
6.2 产品演进

图1-1 数据湖典型构架及特性
图1-2 数据湖与数据仓库对比
图1-3-1 2015-2024年中国整体云服务市场规模及增速
图1-3-2 2015-2024年中国整体IaaS和PaaS市场规模及增速
图1-4 基于云原生数据湖的统一资产建设
图1-5 云原生数据湖成本优化剖析
图1-6 云原生数据湖性能优化剖析
图1-7-1 企业IT部门定位变化
图1-7-2 云原生数据湖的应用创新价值
图2-1 中国云原生数据湖行业发展历程
图2-2 2015年-2021年中国大数据重点法律法规和产业政策脉络
图2-3 中国「数据服务」行业投资情况及美国云原生数据湖融资事件
图2-4 2018-2023年中国云原生数据湖市场规模及增速
图2-5 云原生数据湖为企业数字化转型各环节提供技术支持
图2-6 云原生数据湖应用的集中痛点
图3-1 中国云原生数据湖产业图谱
图3-2 2020年中国云原生数据湖市场(不含生态部分)竞争格局
图3-3 云原生数据湖竞争分析框架
图3-4 云原生数据湖核心技术
图3-5 云原生数据湖典型解决方案
图4-1 2020年中国云原生数据湖市场(不含生态部分)下游行业分布
图4-2 云原生数据湖的行业应用展望
图4-3 基于MaxCompute+DLF+EMR+OSS的湖仓一体架构
图4-4 流利说基于EMR+OSS的云上数据湖架构化
图4-5 汇量科技基于EMR+OSS的云上数据湖架构
图4-6 百草味基于“ EMR+Databricks+DLF ”的云上数据湖架构
图4-7 Soul“ EMR+OSS”的云上数据湖架构
图4-8 小鹏汽车云上数据湖架构
图5-1 建立基于统一底座的数据驱动策略
图5-2 企业DT能力建设的执行实践
图5-3 云原生数据湖的选型矩阵
图5-4-1-1 阿里云云原生数据湖解决方案:发展历程与演进路线
图5-4-1-2 阿里云云原生数据湖解决方案:架构与优势
图5-4-2-1 Databricks Lakehouse架构及优势
图5-4-2-2 Databricks Lakehouse行业应用
图5-4-3-1 Cloudera Data Platform(CDP)产品架构
图5-4-3-2 Cloudera的行业应用(部分)
图6-1 云原生时代的大数据治理——数据湖
图6-2 云原生数据湖基础架构演进过程中的要求


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK