11

数据源集市建设的初步思路和规划

 3 years ago
source link: https://mp.weixin.qq.com/s?__biz=MjM5ODEzNDA4OA%3D%3D&%3Bmid=2650318188&%3Bidx=1&%3Bsn=9dfd3c784ae01aa0dd0426741415538e
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

这是学习笔记的第  2310 篇文章

iMZvUzM.gif!mobile

最近在对接数据流转的一些问题,发现越是了解,越是担心,因为有不少潜在的问题,所以我就在想规划和统一所谓的数据源集市,能够实现数据流转方向的一个基线标准。

目前发现的问题:

1.数据出口通道繁杂,管理混乱

2.MySQL流转服务单点难以扩展

3.任务状态不清晰,缺乏统一管理

4.数据交付质量难以保证,反馈不及时

5.近实时数据同步需求难以满足

对此提出的改进方案有:

1.数据出口通道统一交付

2.构建数据源集市服务组,水平扩展压力

3.任务配置平台化,任务日志指标可视化

4.数据交付提供交付标准和数据质量日志

5.提供近实时方案作为备选,预知问题

整个数据源集市在数据流转体系中的角色和位置如下:

BBb2I3N.png!mobile

当日这里是刻意把数据源集市的一些组件和服务列举出来,能够尽可能在这个层面实现数据质量的标准和度量,简而言之,数据如果不合理,我应该及时预警,不能将错就错的提供给中下游,数据源集市需要做好这一层的保障。

在数据流转方向上,我把数据表分为状态表,流水表和配置表,他们在流转体系中的定位和标准也大有不同。

MFNnqmn.png!mobile

当然这仅仅是数据流转体系内的冰山一角,而如果要把数据的认知和数据源要整合起来,形成统一的认知,这个工作量是极为巨大的。

我感觉对于数据的认知,一旦抛出这个话题,就好像打开了一扇窗,经过了更大范围的讨论,我感觉我本来想要的是一口井,没想到现在需要引一条河流,而且还要再河流上再搭一座桥,真让人头大。

各大平台都可以找到我

  • 微信公众号:杨建荣的学习笔记

  • Github:@jeanron100

  • CSDN:@jeanron100

  • 知乎:@jeanron100

  • 头条号:@ 杨建荣的学习笔记

  • 网易号:@杨建荣的数据库笔记

  • 大鱼号:@杨建荣的数据库笔记

  • 腾讯云+社区:@杨建荣的学习笔记

近期热文:

《大江大河2》最触动我的一段经典对话

MySQL 5.7和MySQL 8.0的4个细节差异

从生命周期的角度来规划数据库运维体系

使用图表分析2020北京积分落户的数据

MySQL 8.0给开发方向带来的一些困扰

关于故障复盘的一些总结

迁移到MySQL的业务架构演进实战

MySQL业务双活的初步设计方案

如何优化MySQL千万级大表,我写了6000字的解读

一道经典的MySQL面试题,答案出现三次反转

小白学MySQL要多久?我整理了10多个问题的答案

转载热文:

工行“去O”数据库选型与分布式架构设计

MySQL 实战笔记 第01期:MySQL 角色管理

MGR用哪个版本?5.7 vs 8.0

SQLcl这个可爱的小工具,来了解一下呀~

CPU占用又爆了?MySQL到底在干什么

这个MySQL优化原理剖析,比照X光还清楚

自己动手写SQL执行引擎

最受欢迎的微服务框架概览

程序员,保住你的钱袋子!

QQ群号: 763628645

QQ群二维码如下, 添加请注明:姓名+地区+职位,否则不予通过

qIZJNzj.jpg!mobile

在看 ,让更多人看到


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK