本周,一年一度的高性能計算大會ISC如期而至,世界TOP 500超級計算機排名也隨之更新公布,對比去年的榜單,今年TOP 10的榜單中,來自美國新能源部勞倫斯伯克利國家實驗室的Perlmutter系統新晉入圍。
在TOP500的榜單中,大陸超級計算機的數量雖然下降至186臺,但對比位居第二的美國的123臺,依然遙遙領先,
一個值得注意的事實是,此次榜單中有342套系統采用了英偉達技術提供加速,對比去年的333套提升2%,榜單上使用InfiniBand的系統數量也比去年增加了20%,另外,名單上更新的兩個新系統“超級云”,能夠同時滿足AI、高性能計算(HPC)和云端需求。
這意味著,高性能計算正在同AI加速融合,而在這一融合趨勢下,英偉達在超算領域的優勢前所未有,
不止是TOP10中的8臺,新晉系統也選英偉達
雷鋒網(公眾號:雷鋒網)此前在《全球TOP10超級計算機8臺都選英偉達的三大原因》一文中分析過,由于高速數據互連技術的普及,以及英偉達GPU系統能夠提高將超算的能效提升2.8倍,全球TOP10超級計算機中的8臺都采用了英偉達GPU或InfiniBand網路技術。
在最新公布的榜單中,不少新晉系統也都選擇英偉達提供支持,其中包括云端的兩個新系統。
Microsoft Azure是其中之一,在TOP 500榜單上連續占據第26位到第29位,利用集群將公有云服務提升到新的水平,作為新興的共享超級計算機,地球上的任何用戶都可以按需使用。
在Azure系統的背后,有8個NVIDIA A100 Tensor Core GPU為其各個虛擬實例提供動力支持,每個芯片都有自己的HDR 200G InfiniBand 通信接口,可以與Azure云中的數千個GPU建立高速連接。
劍橋大學部的新系統Wilkes-3是另一個超級云系統,也是世界上第一臺云原生超級計算機,該系統使用了320個連接在HDR 200G Infiniband 網路上的 A100 GPU,且有經過優化的NVIDIA BlueField DPU提供安全、虛擬化的數據處理,保證虛擬資源的隱私性和安全性。
此外,本次進入TOP10的新系統Perlmutter,以 64.59 Linpack petaflops 在 TOP500 中排名第 5,也是由來自英偉達6144個A100GPU提供動力支持,
國家能源研究科學計算中心 (NERSC) 數據和分析服務組代理負責人 Wahid Bhimji 表示:“AI是美國能源部的一個增長領域,其可行性已被驗證,正計劃投入生產,”
英偉達更新超算平臺,加入三項關鍵技術
為了持續滿足高性能計算對AI的需求,英偉達也在本次ISC大會上發布全新的HGX A100系統,且已經在英國愛丁堡大學部托管的DiRAC超級計算機中落地。
英偉達HGX A100加入了三項關鍵技術:NVIDIA A100 80GB PCIe GPU、NVIDIA NDR 400G InfiniBand 網路和 NVIDIA Magnum IO GPUDirect Storage 軟體,
其中,A100 80GB PCle GPU采用NVIDIA Ampere架構,與A100 40GB相比其內存帶寬頻到2TB/S,提升25% 。更高的內存容量和內存帶寬,能夠將更多的數據和更大的神經網路保存在內存中,從而最大限度地減少節點通信和能耗,研究人員也能獲得更高的吞吐率和更快的結果,
在網路方面,英偉達并購Mellanox后,釋放 InfiniBand高效網路潛能,InfiniBand 作為全球唯一具有完全負載轉移功能的網路內計算互連系統,英偉達為此配備了NVIDIA Quantum-2固定配置交換機和模塊化交換機,
NVIDIA Quantum-2 模塊化交換機最高可提供 2048 個 NDR 400Gb/s InfiniBand 端口(或 4096個 NDR200 端口)的可擴展端口配置,雙向總吞吐量達到每秒 1.64 PB,是上一代 HDR InfiniBand 模塊化交換機系列的5倍。
NVIDIA Quantum-2 交換機具有向前和向后兼容的特性,可以輕松遷移和擴展現有的系統和軟體,
在軟體方面,Magnum IO GPUDirect Storage軟體提供了GPU內存和存儲之間的直接內存訪問,能夠實現復雜工作負載處理性能。英偉達稱,應用程式通過直接路徑從低 I/O 延遲中受益并能夠使用網路適配器的全部帶寬,同時減少 CPU 的利用負載并管理數據消耗增加所產生的影響,
目前,英偉達最新HGX高性能計算平臺已落地英國愛丁堡大學部,為其托管的新型DiRAC超級計算機Tursa提供動力支持,
愛丁堡大學部的 Peter Boyle 教授對HGX所提供的支持表示肯定:“Tursa 旨在應對獨特的研究挑戰,為科學建模和仿真解鎖新的可能性。NVIDIA 加速計算平臺提供超大規模服務,通過精確平衡網路帶寬和FLOPS 來以實現這項研究所需的出色性能,進而助力新發現。”
幾十年前,學術研究中心嘗試模擬原理的相互作用,吸引了航空航天、醫療健康等多個行業的注意,但其所需要的巨量計算阻礙了發展研究,直到加速計算和深度學習的出現,才使得高性能計算落地得以推進,
“得益于各種進步,我們正處于高新能計算革命的開端。”黃仁勛如此評價當下高性能計算的發展。