超算TOP500榜單公布英偉達優勢前所未有？

本周，一年一度的高性能計算大會ISC如期而至，世界TOP 500超級計算機排名也隨之更新公布，對比去年的榜單，今年TOP 10的榜單中，來自美國新能源部勞倫斯伯克利國家實驗室的Perlmutter系統新晉入圍。

在TOP500的榜單中，大陸超級計算機的數量雖然下降至186臺，但對比位居第二的美國的123臺，依然遙遙領先，

一個值得注意的事實是，此次榜單中有342套系統采用了英偉達技術提供加速，對比去年的333套提升2%，榜單上使用InfiniBand的系統數量也比去年增加了20%，另外，名單上更新的兩個新系統“超級云”，能夠同時滿足AI、高性能計算（HPC）和云端需求。

這意味著，高性能計算正在同AI加速融合，而在這一融合趨勢下，英偉達在超算領域的優勢前所未有，

不止是TOP10中的8臺，新晉系統也選英偉達

雷鋒網(公眾號：雷鋒網)此前在《全球TOP10超級計算機8臺都選英偉達的三大原因》一文中分析過，由于高速數據互連技術的普及，以及英偉達GPU系統能夠提高將超算的能效提升2.8倍，全球TOP10超級計算機中的8臺都采用了英偉達GPU或InfiniBand網路技術。

在最新公布的榜單中，不少新晉系統也都選擇英偉達提供支持，其中包括云端的兩個新系統。

Microsoft Azure是其中之一，在TOP 500榜單上連續占據第26位到第29位，利用集群將公有云服務提升到新的水平，作為新興的共享超級計算機，地球上的任何用戶都可以按需使用。

在Azure系統的背后，有8個NVIDIA A100 Tensor Core GPU為其各個虛擬實例提供動力支持，每個芯片都有自己的HDR 200G InfiniBand 通信接口，可以與Azure云中的數千個GPU建立高速連接。

劍橋大學部的新系統Wilkes-3是另一個超級云系統，也是世界上第一臺云原生超級計算機，該系統使用了320個連接在HDR 200G Infiniband 網路上的 A100 GPU，且有經過優化的NVIDIA BlueField DPU提供安全、虛擬化的數據處理，保證虛擬資源的隱私性和安全性。

此外，本次進入TOP10的新系統Perlmutter，以 64.59 Linpack petaflops 在 TOP500 中排名第 5，也是由來自英偉達6144個A100GPU提供動力支持，

國家能源研究科學計算中心 (NERSC) 數據和分析服務組代理負責人 Wahid Bhimji 表示：“AI是美國能源部的一個增長領域，其可行性已被驗證，正計劃投入生產，”

英偉達更新超算平臺，加入三項關鍵技術

為了持續滿足高性能計算對AI的需求，英偉達也在本次ISC大會上發布全新的HGX A100系統，且已經在英國愛丁堡大學部托管的DiRAC超級計算機中落地。

英偉達HGX A100加入了三項關鍵技術：NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 網路和 NVIDIA Magnum IO GPUDirect Storage 軟體，

其中，A100 80GB PCle GPU采用NVIDIA Ampere架構，與A100 40GB相比其內存帶寬頻到2TB/S，提升25% 。更高的內存容量和內存帶寬，能夠將更多的數據和更大的神經網路保存在內存中，從而最大限度地減少節點通信和能耗，研究人員也能獲得更高的吞吐率和更快的結果，

在網路方面，英偉達并購Mellanox后，釋放 InfiniBand高效網路潛能，InfiniBand 作為全球唯一具有完全負載轉移功能的網路內計算互連系統，英偉達為此配備了NVIDIA Quantum-2固定配置交換機和模塊化交換機，

NVIDIA Quantum-2 模塊化交換機最高可提供 2048 個 NDR 400Gb/s InfiniBand 端口（或 4096個 NDR200 端口）的可擴展端口配置，雙向總吞吐量達到每秒 1.64 PB，是上一代 HDR InfiniBand 模塊化交換機系列的5倍。

NVIDIA Quantum-2 交換機具有向前和向后兼容的特性，可以輕松遷移和擴展現有的系統和軟體，

在軟體方面，Magnum IO GPUDirect Storage軟體提供了GPU內存和存儲之間的直接內存訪問，能夠實現復雜工作負載處理性能。英偉達稱，應用程式通過直接路徑從低 I/O 延遲中受益并能夠使用網路適配器的全部帶寬，同時減少 CPU 的利用負載并管理數據消耗增加所產生的影響，

目前，英偉達最新HGX高性能計算平臺已落地英國愛丁堡大學部，為其托管的新型DiRAC超級計算機Tursa提供動力支持，

愛丁堡大學部的 Peter Boyle 教授對HGX所提供的支持表示肯定：“Tursa 旨在應對獨特的研究挑戰，為科學建模和仿真解鎖新的可能性。NVIDIA 加速計算平臺提供超大規模服務，通過精確平衡網路帶寬和FLOPS 來以實現這項研究所需的出色性能，進而助力新發現。”

幾十年前，學術研究中心嘗試模擬原理的相互作用，吸引了航空航天、醫療健康等多個行業的注意，但其所需要的巨量計算阻礙了發展研究，直到加速計算和深度學習的出現，才使得高性能計算落地得以推進，

“得益于各種進步，我們正處于高新能計算革命的開端。”黃仁勛如此評價當下高性能計算的發展。

綠市集：免費活動歌頌永續生活