10

AMD EPYC服务器市占率为什么越来越高?AMD环意大利的神奇之旅

 3 years ago
source link: https://zhuanlan.zhihu.com/p/435310356
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

AMD EPYC服务器市占率为什么越来越高?AMD环意大利的神奇之旅

中央处理器 (CPU)话题下的优秀答主

AMD CPU不但在消费端市场攻城略地,在服务器领域,也越来越被广大厂商采用。这不,前不久我们公司又部署了一批CI服务器,CI脚本大都工作良好,就两台虚拟机编译脚本怎么都运行不了。经过两个礼拜的折腾,CI小哥已经快要放弃了,忽然想到,是不是这台虚拟机运行在AMD的EPYC上呢?结果一查,果然是。这就好办了,更换了编译库,完美解决问题,编译速度甚至更快了。

这也难怪,基于AMD EPYC的服务器市占率不断提高:

v2-29392765b21a0d27a9f084ddb7230b74_720w.jpg

从几乎为0到超过10%的市占率,发生了什么?为什么EPYC的服务器市占率越来越高呢?

AMD CPU涅槃重生之旅

逆转发端于采用Zen内核的Naples(那不勒斯),也就是EPYC 7001。Naples,这是个意大利西南部城市,采用它作为code name的第一代EPYC服务器CPU于2017发布,从此涅槃重生,一段环游意大利的神奇之旅就此展开:

v2-cf56382df245288b16cd016a3ea2360f_720w.jpg来源:AnandTech

经历了推土机架构的彻底失败之后,背负着“i3秒全家”沉重负担的AMD卧薪尝胆,推出了颠覆性架构Zen。Naples就是基于Zen的第一代EPYC服务器CPU,尽管开始的路并不是十分顺利,前一代Opteron服务器CPU效能低下,留下了可怕的印象。但广大服务器厂商并不希望Intel一家垄断全部市场,这给AMD留下了一丝机会。AMD能不能抓住它呢?

当时高性能计算和人工智能兴起,而算力的主要提供者是GPU,哪个主板能够插更多的GPU,哪个主板就能提供更多算力。于此相应,需要大量内存。AMD敏感的抓住了这个强需求,推出Naples CPU:

v2-05cc0a6a39c1d7044c299ef8400b5b5d_720w.jpg

Zen一代核心性能尽管有了跨越性的提高,但相比Intel当时CPU仍有些许不足;四Die的设计延迟增高,被人嘲笑为胶水服务器CPU。尽管有这些缺憾,但正如AMD Naples宣传海报突出的那样,单CPU 64,双CPU高达128 PCIe Lanes相较同时代的Intel 服务器CPU Skylake SP,提高了三成GPU连接能力(128 vs 98 Gen3连接);另一方面,内存通道从6个提高到8个,也同样提高了三成内存连接能力。这些加上小Die带来的成本优势,AMD生生在细分市场中开始生长,并不断开始侵蚀Intel的固有领地。

第二代EPYC,代号是另一个意大利城市:Rome,在2019年发布。彼时,Zen 2在消费端市场上,性能已经得到很多用户的认可。AMD更进一步,在Naples的基础上引入更先进的Chiplet设计:

这种划分IO Die和 CPU Die的方式放大了小Die的成本优势。CPU Die这种计算Die,对制程比较敏感,可以用台积电最新的制程生产;而IO Die对制程不敏感,可以用上一代制程,做的大一点。这种天才设计让CPU内部组合超级灵活,而经过优化的Package封装走线让延迟的问题进一步改善。于此同时,作为卖点的更多PCIe(Gen 4)和内存通道得到了保留,而另一边意识到问题的Intel却受制于大Die的设计,无法在Die的Floor Plan中为放入更多的PCIe和内存控制器。Zen2的架构也进行了改善,加上台积电7nm制程工艺,这些弥补了核心性能的差距。提高的性能 + 低价格 + 更多GPU + 更多内存,这些差异化特点,让AMD EPYC服务器CPU的市占率开始爬坡。市占率逐渐增加。

这里要提一句,看Naples和Rome的介绍都说单Socket有128个PCIe Lanes,有的图片却说只有64个Lanes,怎么回事呢?其实另外64个Lanes可以做Infinity Fabic,也可以作为PCIe。在双路上就是Infinity Fabic,而单路上完全可以做PCIe link。这就让基于Rome CPU的服务器主板,派生了一种典型用法,用一个EPYC 7002 CPU替换两颗Intel 低端Xeon CPU,同时却能提供更多的PCIe连接,并大大简化了主板设计和拥有低得多的成本

环绕意大利的旅程,去年来到另一个城市,Milan(米兰)。以它命名的第三代EPYC CPU封装形式和第二代几乎一样:

Milan带来的更多是内核Zen3 带来的升级。

Zen3性能提高亮点

Zen3究竟做了哪些改动,让单核心新能提高了19%?内核架构Zen 3相比Zen 2进行了很大提高:

改进的分支预测、更宽的浮点unit、更快的LOAD/STORE指令(每时钟3次LOAD和2次STORE,比Zen2各增加一次)和更多的TLB Walker,这些改动都提高了Zen3的IPC。更重要的是,Zen3将分离的两块16MB L3 Cache合并成一块32MB L3 Cache,让Cache性能得到了极大提升:

架构的这些改进, 辅以7nm+的工艺,AMD宣布性能有19%的核心性能提升。加上Infinity Fabric的升级(16Gbps->18Gbps),让Milan相比Rome性能进一步提高:

那么究竟代号Milan的EPYC 7003性能如何呢?知名网站AnandTech做过测评(参考资料1),大家可以参考。有意思的也加入了Ampere的双路Altra处理器来参与比较,还有需要注意的是Intel参赛选手是基于14nm Cascade Lake的8280,而不是最新的10nm的Icelake,有些不太公平(可能是AnandTech没有Icelake的平台),而且Intel平台只有6个Channel,导致内存少了三成。

这里引用一些网站的评测结果:

来源: AnandTech来源: AnandTech

可以看到EPYC 7003 CPU的成绩是碾压性的,其他单核和浮点测试等等数据大家感兴趣可以直接阅读参考资料1。据AnandTech评测,Milan的单核性能提高幅度在20%到25%,达到了AMD的宣称值。这里要大家注意一下Ampere的Altra,ARM服务器性能也十分突出。

AMD的神奇之旅的故事不但没有减慢,还在加速。这不,AMD这次不是来到一个地方,而是两个地方,分别是热那亚 (Genoa)和贝加莫(Bergamo)。Genoa有96个Zen 4的内核

而Bergamo是专门为了云厂商(CSP)优化过的,含有128个 Zen 4c内核

这个‘c’的意思是Cloud,凸显了云厂商的牛逼地位。两者都是基于5nm的工艺,并支持现在堪称高性能计算的标配的PCIe Gen5和DDR5。同时AMD更新了路线图:

Genoa和Bergamo将在2022年正式产品面世,到时候将和Intel 10nm服务器第二代Sapphire Rapids正面对抗。两者ecosystem的小伙伴们都已经忙碌了起来,2022年,注定又是一个不平凡的一年!

AMD YES!

欢迎大家关注本专栏和用微信扫描下方二维码加入微信公众号"UEFIBlog",在那里有最新的文章。关注公众号,留言“资料”,有一些公开芯片资料供下载。

参考资料:

[1] : Anandtech 资料:https://www.anandtech.com/show/16529/amd-epyc-milan-review/6


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK