18嵗以下不要點，成人專區

ARM連發四款Mali GPU：一律全新架構、性能飛躍最多6倍

2021-5-26 17:04:04

除了面向64位移動計算的Cortex-X2、Cortex-A710、Cortex-A510三款全新CPU IP，ARM今天還帶來了多達四款新的移動GPU IP，同樣啟用新的命名規則，分別是Mali-G710、Mali-G610、Mali-G510、Mali-G310，

G710、G510、G310分別定位旗艦、主流、入門級市場，依次取代現有的G78、G57、G310。

G610其實和G710是一回事兒，只是核心數較少時單獨使用的名字。

這是ARM Valhall GPU架構的第三代產品，也是第一次完整覆蓋高中低端各個領域，

搭配同時發布的Cortex-X2/A710/A510 CPU、CoreLink CI-700一致性互連技術、CoreLink NI-700芯片網路一起，它們可以構成完整、強大的SoC解決方案。

雖然架構變化不大，只是繼續優化提升，但是這一代Mali GPU的性能進步還是很可觀的：

G710號稱綜合性能提升20％、機器學習性能提升35％、紋理性能提升50％、能效提升20％，

G510綜合性能提升100％、機器學習性能提升100％、能效提升22％。

G310雖然定位最低但變化最大，號稱紋理性能提升多達6倍、Vulkan性能提升4.5倍、安卓UI內容性能提升2倍。

G710的執行引擎設計和G77、G78十分相似，變化更多是一些細節。

wavefront/warp大小從8翻番到了16，而且每個執行引擎有兩個數據路徑，最終形成每個核心32個FMA，

ISA指令集也有了不小的改進，可以更好地滿足Vulkan等現代GPU的需求，但暫無細節，

G710還新增了一個執行引擎，每個著色器核心的計算性能因此翻番，同時每核心每時鐘周期的不同吞吐量也有4倍、8倍的增加。

紋理單元也是全新的，每時鐘周期可以處理最多80億紋理，再加上面積優化，單位密度紋理性能提升了50％。

16寬度執行單元單實例變成了4寬度四實例，整體吞吐量不變，但是資源分配更合理，效率更高，

新的執行引擎每核心每時鐘周期FMA翻了一番，同時功耗也優化降低了20％，

另外，傳統的工作管理器(Job Manager)變成了新的“指令流前端”(Command Stream Frontend)，負責調度和處理draw-call，還第一次帶來了固件層，與硬件緊密配合處理主機需求。

G710可以配置8-16個不同核心數，G610則是最多6個核心，另外二級緩存可以配置2個或4個區塊，每個區塊256KB或者512KB，也就是整體最小512KB，最多2MB，

G510支持2-6個核心配置，每核心每執行單元的配置也可以定制，紋理單元也大大加強，

執行引擎還是2個，但也可以配置為只用1個，每時鐘周期64 FMA會因此減少到48 FMA。

ARM列舉了G510 10種可能的不同規格配置，計算能力、填充率各有不同，適合不同應用需求，

G310雖然定位最低，但這次升級力度最大，終于拋棄了古老的Bifrost架構。

它因此有了新的執行引擎設計，支持靈活的規模配置，每核心可以有16、32、48、64 FMA，紋理單元最低則是每時鐘周期2個，

不過，G310僅支持單核心設計，

ARM gpu Mali-G310 Mali-G510 Mali-G610 Mali-G710

0 条回复 A文章作者 M管理員

暫無討論，說說你的看法吧

1

綠市集：免費活動歌頌永續生活
2023/05/26
2

CT檢查免顯影劑 AI只花90秒鎖定腦傷區與體積精準即時搶救
2023/05/26
3

捲假包風波！王思佳親解「不回小S留言」原因：不想拖下水
2023/05/26
4

日本長野殺警案！霰彈槍射殺4人「2警1女亡」議長兒凌晨落網
2023/05/26
5

網路紅什麼／汙衊老闆性騷擾！纏訟近3年千萬粉絲帳號被封小慧君嘴硬：只是違規而已
2023/05/26
6

疫情中斷後首次重啟！塔利班宣布恢復阿富汗對中國直飛航線
2023/05/26