全球超算TOP500新榜單:日本蟬聯第一、大陸屈居第四

本文經超能網授權轉載,其它媒體轉載請經超能網同意

TOP500官方公布了第56期榜單,日本的Fugaku超算鞏固了在榜單中第一的地位,也反映出榜單上性能增長曲線趨于平緩。雖然有兩個新系統成功進入前十名,但整個榜單錄得的新入榜數量是自1993年該項目開始以來最少的,

在高性能Linpack(HPL)基準里,榜單的入圍門檻上升至1.32 PetaFLOPS,與2020年6月排名中記錄的1.23 PetaFLOPS相比有小幅增長。

Top500的總性能也從6月的2.22 ExaFLOPS增長到最新榜單上的2.43 ExaFLOPS,但每個系統的平均性能幾乎沒有任何增長,從6個月前的145,363個核心增長到當前榜單中的145,465個核心。

不過前十名中也有一些顯著的進展,包括兩個新系統,以及排名第一的Fugaku超級計算機創下的新高。

得益于這段時間內添加的新硬件,Fugaku將其HPL性能增長到442 PetaFLOPS,與該系統在2020年6月首次亮相時的416 PetaFLOPS相比,有小幅增長。

更重要的是,Fugaku將其混合精度HPC-AI基準上的性能提高到2.0 ExaFLOPS,優于其六個月前1.4 ExaFLOPS的記錄,這代表著在任何類型的硬件上,對任何精度的基準測量值首次超過1 ExaFLOPS。

Top500前十名:

1、Fugaku,由富士通建造,安裝在日本神戶的RIKEN計算科學中心(R-CCS)。擁有442 PetaFLOPS的新世界紀錄。這使其領先榜單中排名第二的系統三倍。

2、Summit,是IBM在田納西州橡樹嶺國家實驗室(ORNL)建造的系統,以148.8 PetaFLOPS的性能保持著美國最快的系統,擁有4356個節點,每個節點都容納了兩個22核Power9 CPU和6個NVIDIA Tesla V100 GPU,

3、位于加利福尼亞州勞倫斯-利弗莫爾國家實驗室的系統Sierra,以94.6 PetaFLOPS的HPL排名第三。其架構與Summit非常相似,其4320個節點中的每個節點都配備了兩顆Power9 CPU和四顆NVIDIA Tesla V100 GPU,

4、由大陸國家并行計算機工程與技術研究中心(NRCPC)開發并安裝在無錫國家超級計算中心的神威太湖之光位列第四,它完全采用了Sunway SW26010處理器,在HPL上實現了93 PetaFLOPS,

5、Selene,它是NVIDIA公司內部安裝的NVIDIA DGX A100 SuperPOD。在6月份的時候是第七名,但現在規模已經翻了一番,使得它的排名上升了兩位。該系統基于AMD EPYC處理器,采用英偉達新的A100 GPU進行加速。由于升級,Selene在HPL上實現了63.4 PetaFLOPS。

6、天河-2A(Milky Way-2A),由大陸國防科技大學部開發的系統,部署在廣州的國家超級計算機中心,排名第六,它采用英特爾Xeon CPU和NUDT的Matrix-2000 DSP加速器,在HPL上達到61.4 PetaFLOPS。

7、新上榜的JUWELS Booster Module,位列榜單第七。阿托斯制造的BullSequana機器最近安裝在德國Forschungszentrum Jülich(FZJ)。它是模塊化系統架構的一部分,第二款基于Xeon的JUWELS模塊單獨列在TOP500的第44位,這些模塊通過使用ParTec Modulo集群軟體套件進行集成,增壓模塊使用AMD EPYC處理器與NVIDIA A100 GPU進行加速,與排名第5的Selene系統類似,JUWELS Booster Module單獨運行時能夠達到44.1 HPL PetaFLOPS,這使其成為歐洲最強大的系統。

8、義大利Eni S.p.A.公司安裝的戴爾PowerEdge系統HPC5排名第八,使用了英特爾Xeon Gold CPU和NVIDIA Tesla V100 GPU,性能達到35.5 PetaFLOPS,在榜單上用于商業用途的系統里,以這臺性能最為強大。

9、安裝在德克薩斯大學部德克薩斯高級計算中心的戴爾C6420系統Frontera現在列在第九位,它使用其448,448個英特爾Platinum Xeon核心,實現了23.5 PetaFLOPS。

10、排名第十的Dammam-7安裝在沙特阿拉伯的沙特阿美公司,是目前前十名中的第二臺商用超級計算機,也是前十里第二臺新上榜的機器。HPE Cray CS-Storm系統采用英特爾Xeon Gold CPU和NVIDIA Tesla V100 GPU,它在HPL基準上達到了22.4 PetaFLOPS,

Green500的情況:

1、最節能的系統是美國NVIDIA新推出的DGX SuperPOD,它在2.4 HPL性能運行期間取得了26.2 GigaFLOPS/Watt的能效,功耗為38MW(忽略擴展所需的額外硬件),位列TOP500的第172位,

2、雖然上屆Green500冠軍MN-3的得分從21.1提高到了26.0 GigaFLOPS/Watt,但卻滑落到了第二名的位置。該系統采用MN-Core芯片,這是一款針對矩陣運算進行優化的加速器。它在TOP500中排名第332位,

3、安裝在德國Forschungszentrum Jülich(FZJ),它實現了25.0 GigaFLOPS/Watt,在TOP500中排名第七。

4、阿托斯制造的另一臺機器Spartan-2,它在HPL上實現了24.3 GigaFLOPS/Watt,在TOP500榜單中排名第148位,

5、Selene,效率為24.0 GigaFLOPS/Watt。它也占據了TOP500榜單的第五位,

6、除MN-3系統外,其余排名前五的Green500系統均采用了全新的NVIDIA A100 GPU作為加速器,同時這四款系統均采用AMD EPYC作為主CPU,

7、在Green500排名前40的系統中,有37個系統利用了加速卡,2個系統使用了A64FX矢量處理器,1個系統(神威太湖之光)是申威多核處理器。

TOP500其他一些數據:

1、共有149個系統使用加速卡/協從處理器技術,比6個月前的146個有所增加,其中140個采用了NVIDIA芯片,

2、Intel繼續在TOP500的處理器份額中占據主導地位,超過90%的系統配備了Xeon或Xeon Phi芯片,盡管最近高性能計算領域的替代處理器架構興起,但AMD處理器(包括大陸海光的芯片)在目前的榜單中僅占21個系統,還有10個基于Power架構的系統和5個基于ARM架構的系統,不過,采用基于AMD處理器的系統數量比半年前增加了一倍。

3、系統互連的分類基本沒有變化,大約一半的系統(254個)使用以太網,大約三分之一的系統(182個)使用InfiniBand,大約十分之一的系統(47個)使用OmniPath,一個系統使用Myrinet;其余的系統使用定制互連(38個)和專有網路(6個),在總容量方面,InfiniBand連接的系統仍然占主導地位,其性能超過1個ExaFLOPS,由于Fugaku使用專有的Tofo D互連,6個專有網路系統的總性能(472.9 PetaFLOPS)幾乎與254個基于以太網的系統(477.7 PetaFLOPS)相當,

4、大陸以212臺機器上榜,繼續在系統占有率上領先,輕松擊敗美國的113臺,和日本的34臺,盡管系統數量較少,美國仍以668.7 PetaFLOPS的總性能領先于大陸的564.0 PetaFLOPS,得益于排名第一的Fugaku系統,日本593.7 PetaFLOPS的總性能超過了大陸,

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧