每个程序员都应该知道的延迟数字

公众号简介里写着分布式存储，但一直没有写过，这篇简单的小文章，算是一个开篇。

Jeff Dean 在他关于分布式系统的 ppt [1] 中列出了“每个程序员都应该了解的数字(Numbers Everyone Should Know)”，对计算机各类操作的耗时做了大致估计。这些数字在很多地方都很有用。

NRfYnaV.jpg!mobile

这些数字最早应该出现在 Peter Norvig 著名的博客《Teach Yourself Programming in Ten Years》 [2] ，不过略有一些不同：

JVBfA3z.jpg!mobile

这些数字还准确吗？

这些数字大多是 2009 年给出的，虽然摩尔定律已经失效，但计算机发展到今天，这些数字确实有些过时。

但是，jeff dean 和 Peter Norvig给出这些数字的重点在于 它们之间的数量级和比例 ，而不是具体的数字。

对于今天的数字，伯克利大学有个动态网页 [3] ，可以查看每年各个操作耗时的变化，根据网页的数据，总结每 10 年来的变化如下图：

NramAj6.jpg!mobile

可以观察到：

• 网络传输速度有了质的飞跃； • 同一数据往返 和 从美国发送到欧洲 的耗时没有任何变化，原因可以理解，信号在光纤中是速度是不变的； • 2000 年以来，前两列的数值没有太大变化，但是内存、SSD 和机械硬盘顺序读取速度有了非常大的提升；

2020 年版本

操作延迟执行一个指令 1 ns L1 缓存查询 0.5 ns 分支预测错误（Branch mispredict） 3 ns L2 缓存查询 4 ns 互斥锁/解锁 17 ns 在 1Gbps 的网络上发送 2KB 44 ns 主存访问 100 ns Zippy 压缩 1KB 2,000 ns 从内存顺序读取 1 MB 3,000 ns SSD 随机读 16,000 ns 从 SSD 顺序读取 1 MB 49,000 ns 同一个数据中心往返 500,000 ns 从磁盘顺序读取 1 MB 825,000 ns 磁盘寻址 2,000,000 ns (2 ms) 从美国发送到欧洲的数据包 150,000,000 ns（150 ms）

注：

1 ns = 10^-9 s

1 ms = 10^-3 s = 1,000 us = 1,000,000 ns

这些数字有什么作用？

对于 ns 为单位的时间我们可能没有什么概念，所以我们可以将数字乘以 10 亿 [4] ，来观察数量级的差距。

操作延迟 L1 缓存查询 0.5 s L2 缓存查询 4 s 在 1Gbps 的网络上发送 2KB 44 s 主存访问 100 s 从内存顺序读取 1 MB 50 min SSD 随机读 4.4 h 从 SSD 顺序读取 1 MB 13.6 h 同一个数据中心往返 5.8 days 从磁盘顺序读取 1 MB 9.5 days 磁盘寻址 23.1 days 从美国发送到欧洲的数据包 4.8 years

这样一来就非常明显了，L1 缓存查询相当于一次心跳，这样的话对于内存、网络、SSD 和机械硬盘之间的访问速度有了一个直观的对比：

• 内存：100 秒 • SSD：4.4 小时 • 同一数据中心往返：5.8 天 • 机械硬盘寻址：23.1 天

了解这些数字有助于设计和比较不同的解决方案。可以看出，从远程服务器的内存中读数据要比直接从硬盘上读取要快的。

推广到一般的应用，这也意味着使用磁盘存储往往比使用数据库服务要慢（数据库通常已经把需要的数据放到了内存）。BTW，这些数字也被 CMU 的数据库课程引用 [5] 。

对于读取 1MB 数据，内存、SSD 和磁盘基本差了一个数量级：

• 内存：50 分钟 • SSD：13.6 小时 • 磁盘：9.5 天

尤其在设计存储引擎时，很多开源软件（Kafka、Leveldb、Rocksdb）都充分利用了存储介质顺序读、写速度远远快过随机读、写的特性，只做追加写操作来达到最佳性能。

延迟、带宽和吞吐之间有什么区别？

StackOverflow 有一个延伸问题 [6] ，延迟(Latency)、带宽(Bandwidth)和吞吐(Throughput)之间有什么区别？

最佳回答用水管来举例。

Q3yiYj3.jpg!mobile

• 延迟表示通过管道需要花费的时间 • 带宽表示管道的宽度 • 每秒钟流过的水的数量就是吞吐

References

[1] Jeff Dean 在他关于分布式系统的 ppt: https://www.cs.cornell.edu/projects/ladis2009/talks/dean-keynote-ladis2009.pdf

[2] 《Teach Yourself Programming in Ten Years》: http://norvig.com/21-days.html#answers

[3] 动态网页: https://colin-scott.github.io/personal_website/research/interactive_latency.html

[4] 将数字乘以 10 亿: https://gist.github.com/hellerbarde/2843375

[5] CMU 的数据库课程引用: https://15445.courses.cs.cmu.edu/fall2019/slides/03-storage1.pdf

[6] StackOverflow 有一个延伸问题: https://stackoverflow.com/questions/36949735/what-is-the-difference-between-latency-bandwidth-and-throughput

欢迎关注我的公众号：

F32Ufu.png!mobile

这些数字还准确吗？

2020 年版本

这些数字有什么作用？

延迟、带宽和吞吐之间有什么区别？

References

Recommend

什么都挡不住美国人回家过年：新冠阴影下的感恩节和黑五

直播带货越来越火，电商代运营却越来越难

微分方程VS机器学习，实例讲解二者异同

滴滴补课

奇客日本公司 Square Enix 宣布永久性远程办公政策

奇客作者支付 9500 欧元自然期刊论文可免费阅读

奇客法国要求科技巨头缴纳数字税

奇客剑桥大学图书馆宣布达尔文笔记丢失 20 年

奇客犹他州沙漠发现金属巨石

奇客法国科学家声称数字一代智商下降

About Joyk