媒体报道

首页-红旗娱乐-「直到梦想到手」

2022-11-12 16:56:10 yqs888 0

首页-红旗娱乐-「直到梦想到手」报道,2022国际超算大会发布最新TOP500榜单,美国田纳西州橡树岭国家实验室(ORNL)的“前沿”(Frontier)以1.102 exaflops的成绩屠榜,成为第一个真正突破Exascale大关的超算。

在这一份榜单中,我国的神威太湖之光位列第六,天河二号位列第九,与前几年相比排名有所下降,算力也不及美国“前沿”的十分之一。

长期以来,超算被视为综合国力的象征之一,是支撑国家持续发展的关键技术之一。那么,中国的超算能力如何?国内芯片供应链是否能够支撑中国搭建超算中心呢?

超算市场的形成


简单来说,超级计算机是指由数千甚至更多处理器组成、能计算普通计算机和服务器不能完成的大型复杂课题的计算机,它是将大量的处理器集中在一起以处理庞大的数据量,同时运算速度比常规计算机快许多倍。

根据中国科学院院士钱德沛2019年所做的一个报告,1993-2012年,超级计算机的性能大约每10年提高1000倍,从2013年起,上升速率变缓,降低为每10年100倍左右。但无论如何,超级计算机性能增长的速度远高于民用PC的性能增长,这说明超级计算机性能提高固然要靠单芯片性能的增长,也非常依赖系统规模的扩大。

风暴平台


超算性能增长曲线

最早,超算领域一直是由美国主导的,美国是该领域的传统强国,已构建了三大E级超算体系。自20世纪80年代中期开始,日本逐渐追赶上,其自主研发的超级计算机的性能屡创佳绩。

近几年,中国在超算领域也逐渐崛起,占据了突出优势。在2022年的榜单上,中国共有两个超级计算机进入前十,分别是HPL得分为93PFlop/s、位列第六的“神威·太湖之光”和HPL得分为61.4PFlop/s、位列第九的“天河二号”。

截至目前,我国共挂牌8座国家级超算中心,分别位于天津、长沙、济南、广州、深圳、无锡、郑州、昆山。

那么如此重要的算力场景,究竟需要那些芯片呢?

超算中心需要哪些芯片?


先来看国内,2010年,中国的“天河一号”位居全球超级计算机500强排行榜榜首。其思路采用“CPU+GPU”的设计思路,结合了大约7000个英伟达GPU和14000个英特尔CPU,将GPU(图形芯片)用于超级计算机,起到了“CPU加速器”的作用。

尽管“天河”的主要部件仍来自英特尔与英伟达两个美国制造商,但互联芯片则完全是中国自主研发,“天河”安装有由中国自主研发的“飞腾1000”芯片,部分取代了进口芯片。

2016年“神威·太湖之光”诞生,是世界首台峰值运算性能超过每秒十亿亿次浮点运算能力的超级计算机。这台计算机共有40960颗国产芯片,运算系统全面采用了国产“申威26010”众核处理器。这也是我国第一台全部采用国产处理器构建的超级计算机。

从北京超级云计算中心来看,根据处理器的类别,北京超级云计算中心的超算分区可以划分为四大系列:基于AMD芯片的A分区与M分区,以及A分区的加强版「A6分区」;基于英特尔芯片的T分区与L分区;基于国产芯片(如海光x86 CPU)的先导一号;基于英伟达芯片的AI智算云,比如N17、N19区。

其中,A分区采用的是AMD在2019年推出的第二代EPYC(霄龙)服务级处理器,代号罗马(Rome),基于7nm工艺,搭载64核心128线程,每一个核心的内存为4GB,在提升核心的同时也提升了时钟速度,加速频率可达3.4GHz。

国外方面,今年在超算榜单排名第一的美国的“前沿(Frontier)”超级计算机,相较于神威·太湖之光,美国的Frontier只有9408个节点,每个节点配备一个AMD Epyc 7A53 CPU和四个AMD Instinct MI250X加速卡。显然,Frontier的节点间通信的压力要小得多,也更容易设计。

该系统共包括8730112个内核,整个系统总共有9400多个CPU和37000多个GPU。Frontier核心计算部分主要依靠AMD Instinct MI250X加速卡,采用的是CDNA2架构。

此外,每块加速卡上还集成了128GB HBM2e高带宽内存。现在的超算主要还是冯·诺依曼结构占主导,内存速度将直接影响计算速度,这种内存比普通的要快得多,目前却只有少数企业能够生产。

超算中心如何分配芯片


超级计算机的性能野蛮生长了20年,至今为止,美国研制Frontier的花费也不过区区6亿美元,这说明超算系统规模的扩大并不是简单的堆硬件。

日本“富岳”(Fugaku)超算,宣称它的浮点运算速度峰值可达每秒41.5亿亿次;中国的“神威太湖之光”,它的浮点运算速度峰值是每秒12.5亿亿次。都达到了10亿亿次以上。超算用了很多个芯片,让它们同时执行任务,而单个芯片的性能跟个人电脑的芯片是差不多的。用科学术语来说,这叫做“并行计算”,这是高性能计算的基本思路。


首页
产品
新闻
联系