今天,ARM發布了2020年度新品家族,包括純粹64位的超大核心Cortex-X2、大核心Cortex-A710、小核心Cortex-A510(分別取代X1、A78、A55),三級緩存和叢簇設計DSU-110,互連網格網路IP CI-700,芯片網路IP NI-400,
今年3月底,ARM正式發布了64位指令集ARMv9,號稱10年來最重要的創新,IPC性能提升多達30%。
4月底,我們看到了ARMv9指令集的首個產品,面向數據中心的Neoverse N2(同時還有32位的Nerovers V1),
現在,ARMv9首次來到了消費級市場,而且同時用于三種不同級別的核心,上來就是完整的一整套解決方案,
先來看超大核心X2,僅支持AArch64 64位指令而不再兼容32位,擁有全新層級的性能,
前端方面,分支預測與預取單元解耦分離,從而可以在內核之前提前運行,從而減少預測錯誤,同時改進了分支預測精度,提升了大型指令負載的性能,
核心方面,流水線長度從11個指令周期減少到10個,其中分派階段從2個周期減少到1個,這可是個非常大的變動。
同時,亂序執行窗口增大了最多30%,244條增至最多288條,再加上指令壓縮和綁定,實際還可以保存更多,
FP/ASIMD流水線現在支持SVE2,矢量長度為128b,可以大大提升機器學習性能。
后端方面,載入存儲窗口和結構增大了33%,可以提升內存級并行度,一級緩存d-TLB也增大了20%,另外增強了數據預取能力,
性能方面,ARM宣稱X2相比于X1整數性能提升16%,機器學習性能則可以翻一番,不過注意對比時X2的三級緩存容量為8MB,增大了一倍,
X1核心何時商用取決于芯片廠商,不過ARM提到它正在用于筆記本等大屏計算設備,顯然已經有了不少設計,只待宣布,
延伸閱讀:
ARM A710、A510大小核齊發:專為大陸保留32位兼容、性能暴漲62%