除了基于3D V-Cache堆疊緩存的升級版霄龍7003x系列處理器,AMD還為數據中心帶來了另一款神器:Instinct MI200系列加速卡(加速器),
這是AMD的第一款ExaScale百億億次級別加速卡產品,號稱在同類產品中擁有世界上最快的HPC性能、AI性能,
Instinct MI200系列升級為新的CDNA2計算架構,搭配升級的6nm FinFET工藝,并使用2.5D EFB橋接技術,業內首創多Die整和封裝(MCM),內部集成了兩顆核心。
還有第三代Infinity Fabric總線互連技術,帶寬100GB/s,最多8條與第三代霄龍處理器互通,實現CPU/GPU內存一致性。
軟體API支持OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA,
新系列分為兩款型號,Instinct MI250X集成了220個計算單元、14080個流處理器核心,最高頻率1.7GHz,并有第二代矩陣核心,峰值性能為:FP16半精度383TFlops、FP32單精度/FP64單精度47.9TFlops、FP32單精度/FP64雙精度矩陣95.7TFlops、INT4/INT8/BF16 383TFlops。
內存/顯存搭配8192-bit位寬的128GB HBM2e,頻率1.6GHz,峰值帶寬3276.8GB/s,并支持全芯片ECC。
整卡采用OAM模塊形態(未來也會推出PCIe擴展卡形態),支持PCIe 4.0 x16,被動散熱(系統散熱),典型功耗500W,峰值功耗560W。
Instinct MI250精簡為208計算單元、13312流處理器核心,各項性能指標也順應下降約5.5%,其他規格完全不變。
AMD宣稱,Instinct MI200系列性能雙精度性能比競品高出最多4.9倍,比上代提升最多4倍。
MI200系列已經贏得了多項客戶解決方案,包括ATOS BullSequana X410-A5 2U1N2S(雙CPU四GPU)、戴爾PowerEdge R7525(雙CPU三GPU)、技嘉G262-Z00(雙CPU四GPU)、HPE Cray EX235a(單CPU四GPU)等等,其他客戶還有話說、聯想、KOI Cmputers等等,
尤其是與美國國防部橡樹嶺國家實驗室、HPE合作打造的超級計算機“Frontier”,采用第三代霄龍處理器、MI250X加速卡,峰值算力高達150億億次浮點計算每秒,