去年11月份,AMD發布了頂級加速計算卡Instinct MI100,首次采用針對HPC高性能計算、AI人工智能全新設計的CDNA架構,和游戲向的RDNA架構截然不同。現在,第二代的MI200也首次浮出了水面。
MI100采用臺積電7nm工藝制造,集成120個計算單元、7680個流處理器,并專門加入Matrix Core(矩陣核心)用于加速HPC、AI運算,還整合了4096-bit 32GB HBM2顯存,支持PCIe 4.0 x16和八卡并行,整卡功耗300W,
它的FP64雙精度浮點性能首次突破10TFlops(也就是每秒1億億次),混合精度和FP16半精度的AI性能提升接近7倍,
根據最新消息,MI200將會采用下一代CNDA架構,并首次引入MCM多芯片封裝,看這樣子翻番到1.5萬個流處理器問題不大,
本次曝光的MI200將用于HPE Cray EX超級計算機,執行加速計算,產品名被描述為“MCM Special FIO Accelerator”,其中FIO代表“Factory Installation Option”(廠商安裝選項),此外還有OAM形態,代表開源加速卡。
不過,MI200的具體規格目前一無所知,除了猜測流處理器可能因為MCM封裝而翻一番,還有望加入FullRate640ps指令集、支持全速率FP64浮點計算,
MI200預計今年晚些時候發布,未來將搭配代號“Trento”(特倫托)的霄龍處理器,共同用于AMD為美國國防部打造的百億億次超級計算機“Frontier”。
Trento并未出現在AMD霄龍演進路線圖上,其實是即將發布的第三代“Milan”(米蘭)的定制版,專為超算優化,可能會提前支持PCIe 5.0,