NVIDIA 542億晶體管巨型GPU火了:大陸八大巨頭集體擁抱

NVIDIA今天在GTC大會上宣布,多家大陸頂級云服務提供商、系統制造商都部署了NVIDIA A100 Tensor Core GPU、NVIDIA技術,為各種AI應用提速,

今年5月,NVIDIA推出了首款基于安培架構的A100 GPU,臺積電7nm工藝制造,集成多達542億個晶體管,核心面積達826平方毫米,內置6912個FP32 CUDA核心,最高加速頻率1.4GHz,搭配512-bit 40GB HBM2顯存,帶寬達1.6TB/s,

相比上代伏特架構的V100核心,它的INT8推理、FP32訓練性能提升20倍,FP64計算性能提升2.5倍,是歷史上進步最大的一次。

A100 GPU還配備了精度更高的第三代Tensor Core張量核心、GPU間傳輸率高達600GB/s的第三代NVIDIA NVLink、NVIDIA NVSwitch、PCIe 4.0、NVIDIA Magnum IO軟體SDK,可實現成千上萬個GPU集群的高效擴展。

部署A100的大陸云服務商有:

- 阿里云

已發布gn7 GPU系列云服務器,內置8塊A100,主要面向AI訓練和高性能計算應用,可提供新一代GPU計算實例,相比上一代平臺AI性能提升最高20倍,高性能計算提升2.5倍。

- 百度智能云

即將推出lgn3 GPU系列云服務器、vGPU云服務器、百度太行裸金屬服務器。

最多搭載8塊A100 GPU、8TB NVMe SSD、數百G帶寬,主要面向AI訓練/推理、高性能計算應用、科學計算等場景,計算能力20倍于上代V100,

- 滴滴云

A100裸金屬服務器,配置8塊A100 GPU、2顆AMD EPYC 7302處理器、1024GB內存、2個240GB SATA SSD、2個2TB NVME SSD,適用于AI、數據分析、高性能計算等多種應用場景。

- 騰訊云

已推出云服務器GT4,搭配AMD第二代霄龍平臺,最高180核心vGPU,適用于深度學習訓練、推理、高性能計算、數據分析、視訊分析等領域,

部署A100的大陸OEM廠商有:

- 新華三

已推出搭載8顆A100 GPU的全互聯6U服務器H3C UniServer R5500 G5,同時全線GPU服務器機型已同步適配升級,包括H3C UniServer R4900 G3(2U 3GPU)、R5300 G3(4U 8GPU)、R4950 G5(2U 4GPU),部分機型已完成NVQUAL認證,全面覆蓋集群建設、大規模AI模型訓練、高性能計算、AI項目部署等應用場景,

- 浪潮

已發布發布多款支持A100 40G的AI服務器,可配置8-16顆,包括NF5488M5-D、NF5488A5、 NF5688M6、NF5888M6,還推出了三款支持A100 PCIe版本的服務器NF5468M6、NF5468A5、NF5280M6。

配備最新A100 80GB GPU的AI服務器NF5488M5-D、NF5488A5也已全球量產供貨,

- 聯想

推出了配備A100 GPU的HG680X,4U 8GPU規格,可滿足單機多卡需求,支持兩種拓撲形式,存儲支持最多8個NVMe SSD加16個2.5英寸SAS/SSD,或者24個2.5英寸SAS/SSD。

適用于大型深度學習模型訓練場景、大量數據的推理場景,適應不同深度學習算法與改進,可滿足互聯網、金融、制造等不同行業客戶的多樣化需求,

- 寧暢

X640 G30 GPU服務器完成8卡A100的適配,并通過了NVIDIA NVQUAL的官方認證,可針對不同場景進行GPU互聯拓撲調整、升級算力。現已在客戶處完成批量部署,應用于海量數據訓練、深度學習、語音識別、圖像識別等領域,

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧