直击阿里新一代数据库技术：如何实现极致弹性能力？

Original 张瑞阿里开发者 2017-12-27 00:08 Posted on

阿里妹导读：张瑞，阿里巴巴研究员，阿里集团数据库技术团队负责人，经历阿里数据库技术变革历程，连续六年作为数据库总负责人参与双11备战工作。今天，我们邀请他来分享新一代数据库技术在双11中的应用。

阿里数据库技术团队负责人张瑞

张瑞：双11是一场技术大练兵，是互联网界的超级工程。需要做到支撑尽可能高的零点峰值，给用户最好的体验；也要做到成本尽可能低，要求极致的弹性能力；还要做到整体系统的稳定。

数据库如何实现极致弹性能力？

数据库上云

大家都知道，数据库实现弹性能力是比较困难的，一方面是因为数据库对性能要求非常高，另一方面是需要进行大量数据的搬迁，成本很高。数据库弹性的第一个方向是数据库上云，通过云的弹性能力来解决数据库的资源问题。

数据库上云面临以下几个难点：

1. 数据库如何快速上云，构建混合云？

2. 如何降低虚拟化带来的性能损耗？

3. 公有云环境和内部网络的互通问题。

经过几年的探索，这些难点都已得到解决。第一，数据库使用了高性能ECS，通过使用SPDK、DPDK技术和NVMe存储，可以让虚拟化损耗非常小，接近物理机；第二，我们建设了一套数据库混合云管理系统，可以同时管理云上和云下环境，在双11前快速把混合云构建起来，支撑双十一。第三，我们通过VPC网络连接阿里内部和公有云的网络，解决了混合云场景下的网络互联问题。

数据库弹性调度

使用云的资源还不够，为了实现更加极致的弹性能力，我们通过离在线混部技术，可以让数据库使用离线集群的计算资源，最大程度的降低成本。为了实现离在线混部技术，有两大基础条件：第一是容器化，通过容器实现了计算节点的资源隔离和统一调度，第二是计算存储分离，它是数据库弹性调度能力的基础。非常幸运的是，这几年技术的发展让存储计算分离成为可能，比如：25G高速网络、RDMA技术，高性能分布式存储等。

数据库存储计算分离架构如图，包括存储层、网络层和计算层，存储使用阿里自研分布式存储系统-盘古，数据库计算节点则部署在阿里自研容器（Pouch）中，通过25G网络与存储节点连接。

为了实现数据库存储和计算分离，我们在分布式存储-盘古上做了非常多的优化，比如：

响应延时：单路读写响应延时0.4ms，RDMA网络响应延时小于0.2ms；
二三异步：第三个数据副本异步完成，极大提升了延时的稳定性；
QoS流控：根据前台业务负载情况控制后台IO流量，保证写入性能；
快速Failover：存储集群单机failover优化为5秒，达到业界领先水平；
高可用部署：单集群四Rack部署，将数据可靠性提升到10个9。

同时，在数据库方面我们也做了大量优化，最重要的是降低计算节点和存储节点的网络传输量，以此来降低网络延迟对于数据库性能的影响。第一是redo log sync优化，将数据库吞吐提升了100%。第二是由于盘古支持原子写功能，所以我们关闭了数据库的Double Write Buffer，高压力下数据库吞吐提升20%，网络带宽节省了100%。

双11数据库混部技术

容器化和存储计算分离，使得数据库无状态化，具备调度能力。在双11高峰，通过将共享存储挂载到不同的计算集群（离线集群），实现数据库的快速弹性。

阿里新一代数据库技术

阿里最早是商业数据库，然后我们做去IOE，研发出阿里MySQL分支AliSQL和分布式中间件TDDL。2016年，我们开始研发阿里新一代数据库技术，我们把它命名为X-DB，X代表追求极限性能，挑战无限可能的含义。

阿里的业务场景对于数据库有很高的要求：

数据要可扩展；
持续可用、数据要强一致；
数据量大、重要程度高；
数据有明显的生命周期特性，冷热数据特点鲜明；
交易、库存，支付等业务，操作逻辑简单，要求高性能。

因此，定义新一代数据库就要包含几个重要特点：具备数据强一致、全球部署能力；内置分布式、高性能、高可用能力；具备自动数据生命周期管理能力。

X-DB架构图

X-DB架构如图，引入Paxos分布式一致性协议解决问题；可异地部署，虽然网络延时增加，但能够保持高性能（吞吐），在同城三节点部署模式下，性能与单机持平，同时具备网络抖动的高容忍性。

X-DB核心技术之一：高性能Paxos基础库X-Paxos是实现三节点能力的核心，可实现跨AZ、Region的数据强一致能力，实现5个9以上的持续可用率。

X-DB核心技术之二：Batching & Pipelining。X-DB在事务提交时，必须保证日志在数据库节点的多数派收到并提交，这是保证数据强一致基础，由于事务在提交时必须需要跨网络，这一定会导致延时增加，要保证高延时下的吞吐是非常困难的。Batching & Pipelining技术保证尽可能批量提交，数据可以乱序接收和确认，最终保证日志顺序提交。可以在高延时的情况下，保持很高的吞吐能力。

X-DB核心技术之三：异步化提交，数据库线程池在提交时会等待，为了最大程度提升性能，我们采用了异步化提交技术，最大可能保证数据库线程池可以高效工作。通过这些技术保证X-DB在三节点模式下的高吞吐量。

X-DB与MySQL Group Replication对比测试

我们与Oracle官方的Group Replication作对比。在三节点同IDC部署模式下，sysbench标准化测试。Insert场景，我们可以做到MySQL官方的2.4倍，响应时间比官方低。

在异地部署模式下，sysbench标准化测试。Insert场景，X-DB（5.04万）性能优势特别明显，是MySQL GR（0.85万）的5.94倍，响应延时X-DB（58ms）是MySQL GR（150ms）的38%。

典型应用场景

同城跨AZ部署替代传统主备模式，我们把原来主备模式变成三节点，解决跨AZ数据质量问题和高可用问题。跨AZ数据强一致，单AZ不可用数据零丢失、单AZ不可用秒级切换、切换自封闭，无第三方组件。相对主备模式零成本增加。

跨Region部署，用更底层的数据库技术解决异地多活问题，三地六副本（主备模式）降低为三地五副本（三地五节点四数据），对于业务来说，可以享受跨Region数据强一致，单个Region不可用零数据丢失；跨Region强同步下依然保持高性能；切换策略灵活，可以优先切换同Region，也可定制跨Region切换顺序。

数据库在双11中的黑科技

X-KV在双11中的应用

X-KV是基于官方MySQL Memcached plugin的增强，今年我们做了大幅度的改进，支持更多数据类型，支持非唯一索引、组合索引，multi get功能，还支持Online Schema change。最大变化是通过TDDL支持SQL转换。对于业务方，X-KV优势是超高读取性能，数据强一致，减少应用响应时间，降低了成本，同时因为支持SQL，应用可以透明迁移，使用成本大幅降低。

TDDLfor X-KV实现了如下功能：