79

中美对抗持续升级,超级计算机霸主花落谁家?

 5 years ago
source link: http://www.10tiao.com/html/768/201806/2651946984/1.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

美国科技圈最近闹了个大新闻 —— Summit (顶点)超级计算机以每秒20亿亿次的计算速度,超过曾经计算速度居世界首位的中国神威·太湖之光。


20亿亿次每秒,是个啥概念呢? 也就是说,你想人工手算达到Summit一秒的计算量?那你得准备好63亿年!


但是,自2013年以来,从天河到神威,一直是中国稳坐超级计算机的第一把交椅。


这一次,中国科技圈在继中兴被罚、华为被查、关税被加等事件后,又被美国将了一军!


这一次对中国的打击有多大?中国元气是否能快速恢复?而这超级计算机到底是什么利器?其重要性在哪里?今天,小探就用最通俗易懂的话语跟大家聊一聊超级计算机的故事。


还你一个真实的超级计算机


这次让美国重回超级计算机宝座的Summit到底是个啥?先上图。


图片来自网络,版权归作者所有


这个大家伙有多大呢?大概占据了两个网球场的空间。


我们普通电脑一般是一个计算服务器,而Summit 使用了4608个!其中每个服务器含有2个IBM公司生产的22核Power9处理器(CPU),和6个英伟达生产的Tesla V100图形处理单元加速器 (GPU)。正是在这么庞大的背景下,其浮点运算速度峰值才达到了每秒20亿亿次。造出这么一台庞然大物,硅谷的两巨头IBM 和 Nvidia,功不可没


“Summit可是 IBM 人工智能Watson的孙子”,IBM的CEO罗睿兰骄傲地宣称,同时也彰显了IBM在人工智能领域的雄心与其重回超算核心架构的决心。


而NVIDIA的CEO 黄仁勋则一再强调,从超级计算机Summit可以看到GPU才是未来。虽然CPU仍然是数据处理的中心,但GPU已经接管了大部分的工作负载。


图片来自网络,版权归作者所有


在超级计算机的运转过程中,这么多服务器,当然会拼命发热。为了给这家伙散热,每分钟需要有4000加仑的水流过,去带走13兆瓦的热量。打个比方,要想机器不被烧毁,你就必须得把一个15平方米的屋子装满水,每分钟推走一个。不过还好,橡树岭国家实验室周围就有个水坝。


官方宣称,Summit 耗资约2亿美金,约合人民币13亿。而事实上,为了研发它,英伟达、IBM这两大企业在过去的三年时间里投入的人力物力绝对超过60亿美金!也就是约合人民币450亿


看来,超级计算机不仅能烧电,还很能烧钱。这是为啥呢?


在回答这个问题之前,咱们先开个脑洞。既然超级计算机被定义为一种“由数百、数千甚至更多的处理器(机)组成的,能计算普通PC机和服务器不能完成的大型、复杂课题的计算机,” 那是不是多个计算机联合起来就能组成一个超级计算机呢


理论上可能,但现实并不可行。这是因为从构架设计来看,即使我们把100台苹果 Mac 机连接起来,但是他们的算力并不会是每台机子相叠加的结果。这是由于通信是否能同步等技术层面的问题还有待解决,想让这100台计算机的算力规模化(scale)还很难。


图片来自网络,版权归作者所有


打个比方,住在北京的两个人分别去上海和宁波取两份快递。结果一个回了,另一个半路拉肚子没回来,那总部的人就要等着第二个人回来,整个任务才算完成。


而联结的计算机越多,越容易出问题。这是因为内存、处理器、评判之间如何协作都需要细致规划与处理。并且,100台计算机的散热问题如何解决业会让人头疼。这也是为什么超级计算机一般会修建在水坝旁的缘故。


这样看来,想要算力超强,还得靠专业实验室里的超级计算机。换句话说,和普通计算机比,超级计算机设计的难点也就在于:如何实现大规模集成与互联并行运算、节点间的交换、更高的效率与功耗比这三个方面。


解决这些问题,大量科研经费的支持必不可少。这也是超级计算机的研发烧钱的原因。


超级计算机到底有何用途?


这么烧钱的大家伙,那实际用途是不是很多?事实上并非如此。


超级计算机的实际应用范围很小,与我们日常生活中最紧密相关的应用,可能只占整个超级计算机应用的3%不到。


虽然超级计算机在进行特定的运算方面表现突出,但在处理一般工作时却差强人意。这主要归因与它的数据延迟过大。超级计算机虽然算的快,但需要你提前把一大堆数据送过去,想让它即时传输数据?那还不如用普通电脑。


换句话说,你用超级计算机打游戏,可能还没有你的笔记本电脑更方便。


但是,对于特定产业而言,超级计算机与普通计算机相比确实有“超级”之处,这也是为什么很多国家都愿意在它的研发上面砸钱。


从应用上看,超级计算机常用于需要大量运算的工作,比如天气预报、气候研究、运算化学、分子模型、天体物理模拟、汽车设计模拟、密码分析等领域。而相比之下,普通计算机在这些高精端领域,算力不足就体现得尤为明显了。


小探采访了一位曾在美国新墨西哥高级计算研究中心工作的工程师。据他介绍,他当年的研究主要是利用超级计算机计算量大这一特点来计算特定区域的风速与气流状况,从而来确定飞机的起飞方向。


“如果用普通计算机一次次模拟试验,估计我可能现在还在实验室吧。”


图片来自网络,版权归作者所有


根据田纳西州橡树岭国家实验室 (Oak Ridge National Lab) Summit项目负责人介绍,Summit 是第一台既支持传统计算也支持运行人工智能应用程序的超级计算机。最近大火的机器学习和神经网络等运行都可以在其上实现。


相比较于之前的超级计算机,Summit的使用价值更高。比如,测试 Summit 时使用的人工智能程序包括海量的报告和医疗图像,这就可以用来尝试发现基因与癌症的关系,还可以用来发现可能导致帕金森等遗传特征。


美国能源部长Rick Perry补充到:这台超级计算机的用途不仅仅在医疗领域,能源方面和网络安全它都帮得上忙!


同时,据了解,“迷你Summit” —— 一种类似Summit的小型超级计算机已经开始和美国四家银行展开合作,开始商业用途了。

 

如此看来,超级计算机在未来会在更多领域大施拳脚。可想而知,大国之间的竞争必然更多了。


叫我第一名


在超级计算机进入更多应用领域之前,各国之间的竞争又是为何?


来自英伟达的工程师K表示,对于Summit  的应用,目前来看,它还并没有处于实战状态,所以结果不得而知。但是大国之间对于速度最快的角逐却不得不让人想起冷战时期的“军备竞赛”。


而持有这一观点的人也不在少数。


“超级计算(Supercomputing)”这一名词早在1929年《纽约世界报》中首次出现。当时报道的内容是关于“IBM为哥伦比亚大学建造大型报表机(tabulator)”。


想法虽然好,但是真正落实到成品还是在近半个世纪后的1976年。美国克雷公司推出了世界上首台运算速度达每秒2.5亿次的超级计算机——“克雷1号”,实现了当时绝无仅有的超高速——可持续保持每秒1亿次运算。


图片来自网络,版权归作者所有


之后,  美国、日本、中国等国家设计出的超级计算机分别突破了每秒万亿次、千万亿次、万万亿次的运算大关。


从历史上看,从70年代超级计算机诞生以来,美国就长期占据着世界第一的位置。虽然在80、90年代,日本异军突起,但只是昙花一现。直到近十年来,美国在超级计算机领域的霸主地位才被中国占据。


中国于80年代开始了超级计算机的研发并于1983年12月4日由军方主导研制成功银河一号超级计算机。银河系列的银河超级计算机,使中国成为世界上少数几个能发布5至7天中期数值天气预报的国家之一。

 

图片来自网络,版权归作者所有

 

对于并行型计算机,在90年代开始研发神威超级计算机。2015年“神威太湖之光”用全国产CPU研制,其浮点运算速度峰值可达每秒12.5亿亿次,其一秒钟的算力相当于一个人不间断计算40亿年。虽然其最快超级计算机的地位成为被美国的Summit在最近打破打破,但它的出现却代表了中国在超级计算机领域的强大实力。


说到日本,人家也是超级计算机大户。2011年,日本超级计算机“京”以每秒8162万亿次运算速度成为全球最快的超级计算机,时隔7年,日本再回超级计算机榜单榜首。

 

如此群雄逐鹿的超级计算机竞赛到底意义何在?


对此我们可以划分两个维度来看待。从技术层面看,超级计算机在气候研究、运算化学、分子模型、密码分析等特定高尖端领域的作用确实有必要长足研究。并且,其实际应用场景也在不断增加,比如Summit超级计算机与人工智能的结合会在医疗、能源、网络安全等方面有所影响。


而从军事实力角度来看,很多军工刚面的特定研究需要借助超级计算机的强大算力。并且,超级计算机的霸主地位通常意味着一个国家在科技领域的领先地位。尤其是对于民族自豪感的提升,更是一针催化剂。


在美国主流媒体的报道中,不乏“超过中国”“从中国夺回”等显眼的字眼。在美国又开始激发民族自豪感的同时,这种罕见地与中国相提措辞让我们看到了美国主流媒体终于清醒地意识到中国在科技领域的崛起。



也是从政治这个角度上,小探觉得更多的吃瓜群众们最关心的会是中国又有没有机会再重回霸主地位?


中国何时再登顶?


美国此次来势汹汹,且做足架势表示“后面还有呢!”据美国科技媒体报道,Summit可不是美国超级电脑领域的唯一杀手锏。另一台名为Sierra的超级电脑,预计峰值算力可以超过每秒12亿亿次。虽然算力不及Summit的20亿亿次,但美国伯克利国家实验室正进一步研发它。其实力也不可小觑。


但是,咱们不怕!


其实,早在美国当年在超级计算机霸主地位被中国占据时,美国的数学、科技等基础教育就曾被大家拿出来诟病。事实上,在基础自然科学教育领域,美国已不再有昔日的一人独大的地位。事实上,自从川普上台以来颁布的诸如减少大学研究所里自然科学领域的资金拨款、以及差点成行的博士生奖学金需要缴税等政策,我们就可以看出美国基础科学已有江河日下的苗头。而基础科学是计算机等众多热门专业的基石。基石被撼动,大厦岂有不倾之理?


同时,中国在超级计算机领域的实力不容小觑。就在Summit研制出的不久之前,国家超算天津中心当日对外展示了我国新一代百亿亿次超级计算机“天河三号”原型机。据了解,该超级计算机本月部署,年底正式投入使用。在被公认为“超算界的下一顶皇冠”百亿亿次的“E级超算”,中国不甘示弱,甚至可以说,是暂时领先。


图片来自网络,版权归作者所有


小探相信,超级计算机的争夺战,未来会更精彩!吃瓜群众拭目以待!


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK