4

国产百亿亿次超算拥有超过4000万个内核,达到5 ExaFLOP混合精度性能

 9 months ago
source link: http://www.expreview.com/89757.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

国产百亿亿次超算拥有超过4000万个内核,达到5 ExaFLOP混合精度性能

吕嘉俭发布于 2023-8-22 16:13
本文约 740 字,需 2 分钟阅读

近几年由于众所周知的原因,与美国大肆宣传不同,国内在百亿亿次(ExaFLOP级别)超级计算机的开发上非常地低调,很少公开资料,也没有参与排名。此前无锡国家超算中心及负责开发申威处理器的江南计算技术研究所曾向美国计算机协会(ACM)戈登·贝尔奖提交了新款超算系统的部分数据,加上更早之前在一些平台上进行的算力测试,外界才对国内超算的情况有所了解。

Supercomputing 2023将于今年11月12日至17日在美国丹佛举行,期间会有神威太湖之光下一代超算系统的信息。据TechPowerup报道,新一代基于申威HPC架构打造的超级计算机将拥有超过4000万个内核,这很可能是国内首台百亿亿次超算系统。

shenwei_T.jpg

目前得到的报告里,讨论了新一代超算系统在HPL-MxP基准测试中达到了5 ExaFLOP的性能。这是一种混合精度HPC基准,用于测试系统在需要64位精度的常规HPC工作负载和需要32位精度的AI工作负载中的性能。

2016年推出的神威太湖之光超算使用了40960个国产申威SW26010处理器,总共有10649600个内核,采用了混合架构。其基于自主研发的64位RISC架构,具有4个集群(CG)和一个协议处理单元(PPU)。每个集群有一个MPE(management processing element), MPE是一个超标量乱序核,具有256位向量引擎、32KB/32KB L1指令/数据缓存、256KB L2缓存。它还集成了64个计算处理元素(CPE),具有相同的256位向量引擎以及64KB快速数据存储和16KB指令存储。CPE以8x8阵列形式组成,使用网状网络相互连接。

此前有报道称,新一代申威处理器具备8个CG群集,比原来的4个翻了一倍,CG架构不变,仍然是一个MPE和64个CPE组成。

在第61期全球超算Top500榜单里,来自美国橡树岭国家实验室的Frontier是至今唯一一台达到ExaFLOP级别的超级计算机系统,在高性能Linpack(HPL)基准里运算性能为1.194 Exaflop/s。不过有消息指出,国内神威太湖之光的升级版本神威海洋之光和天河三号在2021年就达到ExaFLOP级别。


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK