NVIDIA今天在GTC大會上宣布,多家大陸頂級云服務提供商、系統制造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA技術,為各種AI應用提速。
今年5月,NVIDIA推出了首款基于安培架構的A100 GPU,臺積電7nm工藝制造,集成多達542億個晶體管,核心面積達826平方毫米,內置6912個FP32 CUDA核心,最高加速頻率1.4GHz,搭配512-bit 40GB HBM2顯存,帶寬達1.6TB/s。
相比上代伏特架構的V100核心,它的INT8推理、FP32訓練性能提升20倍,FP64計算性能提升2.5倍,是歷史上進步最大的一次。
A100 GPU還配備了精度更高的第三代Tensor Core張量核心、GPU間傳輸率高達600GB/s的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0、NVIDIA Magnum IO軟體SDK,可實現成千上萬個GPU集群的高效擴展,
部署A100的大陸云服務商有:
- 阿里云
已發布gn7 GPU系列云服務器,內置8塊A100,主要面向AI訓練和高性能計算應用,可提供新一代GPU計算實例,相比上一代平臺AI性能提升最高20倍,高性能計算提升2.5倍,
- 百度智能云
即將推出lgn3 GPU系列云服務器、vGPU云服務器、百度太行裸金屬服務器。
最多搭載8塊A100 GPU、8TB NVMe SSD、數百G帶寬,主要面向AI訓練/推理、高性能計算應用、科學計算等場景,計算能力20倍于上代V100。
- 滴滴云
A100裸金屬服務器,配置8塊A100 GPU、2顆AMD EPYC 7302處理器、1024GB內存、2個240GB SATA SSD、2個2TB NVME SSD,適用于AI、數據分析、高性能計算等多種應用場景。
- 騰訊云
已推出云服務器GT4,搭配AMD第二代霄龍平臺,最高180核心vGPU,適用于深度學習訓練、推理、高性能計算、數據分析、視訊分析等領域,
部署A100的大陸OEM廠商有:
- 新華三
已推出搭載8顆A100 GPU的全互聯6U服務器H3C UniServer R5500 G5,同時全線GPU服務器機型已同步適配升級,包括H3C UniServer R4900 G3(2U 3GPU)、R5300 G3(4U 8GPU)、R4950 G5(2U 4GPU),部分機型已完成NVQUAL認證,全面覆蓋集群建設、大規模AI模型訓練、高性能計算、AI項目部署等應用場景,
- 浪潮
已發布發布多款支持A100 40G的AI服務器,可配置8-16顆,包括NF5488M5-D、NF5488A5、 NF5688M6、NF5888M6,還推出了三款支持A100 PCIe版本的服務器NF5468M6、NF5468A5、NF5280M6,
配備最新A100 80GB GPU的AI服務器NF5488M5-D、NF5488A5也已全球量產供貨,
- 聯想
推出了配備A100 GPU的HG680X,4U 8GPU規格,可滿足單機多卡需求,支持兩種拓撲形式,存儲支持最多8個NVMe SSD加16個2.5英寸SAS/SSD,或者24個2.5英寸SAS/SSD。
適用于大型深度學習模型訓練場景、大量數據的推理場景,適應不同深度學習算法與改進,可滿足互聯網、金融、制造等不同行業客戶的多樣化需求,
- 寧暢
X640 G30 GPU服務器完成8卡A100的適配,并通過了NVIDIA NVQUAL的官方認證,可針對不同場景進行GPU互聯拓撲調整、升級算力,現已在客戶處完成批量部署,應用于海量數據訓練、深度學習、語音識別、圖像識別等領域,