能不能拿下ARM還是一樁懸案,不過NVIDIA已經迫不及待利用ARM做抓手,來打擊做x86 CPU的Intel和AMD了。
在最新公開資料中,NVIDIA曬出了配備ARM處理器(Ampere Altra)和A100 GPU加速卡的平臺和x86處理器平臺的性能差異,基于MLPerf最新的1.1基準,
可以看到,在深度學習推薦模型DLRM、自然語言處理網路BERT、會議識別RNN-T、醫學圖像劃分3D U-Net、圖像分類的ResNet-50等負載中,與x86表現不相上下,甚至在3D U-Net單項中還實現反超。
此番,參與對比的還有高通AI100、Intel至強8380(Ice Lake)等。
加速卡方面,如果以A30為標準,離線環境下,A100在大多數工作負載下的處理速度都是A30的2倍左右;在服務器環境下,基于x86的A100對會議識別RNN-T的處理速度接近A30的3倍。
據了解,MLPerf是當前全球最具影響力的AI計算基準評測組織,由圖靈獎得主大衛·帕特森(DavidPatterson)聯合谷歌、斯坦福、哈佛大學部等單位共同成立,每年組織全球AI訓練和AI推理性能測試并發榜,