這兩年,Intel越來越“超前”,以往新一代產品發布才會公布的諸多技術細節,都會提前幾個月公諸于世。在今天的年度架構日活動上,Intel就公布了Alder Lake 12代酷睿的架構、技術細節,
第一篇先來看12代酷睿的整體設計、技術特性、大小核調度,之后我們會單獨分析大核心、小核心的架構設計。
Intel此前的Lakefield處理器第一次采用了大小核混合架構設計(Intel Hybrid Technology),但只是一次試水之作,12代酷睿才是真正的起點。
其中,大核心叫做“性能核心”(Performance Cores),或者“P核心”(P-Cores),Golden Cove架構,最多8核心16線程,AVX-512指令集、DLBoost深度學習加速也只有大核心才支持,
小核心則叫做“能效核心”(Efficiency Ccores),或者“E核心”(E-Cores),Gracemont架構,最多8核心8線程,對不支持超線程。
為了解決大小核調度問題,Intel發明了新的“Thread Director”(線程調度器),并與微軟全力合作,搭配Windows 11的任務調度器,將合適的負載分配給不同核心、線程,
12代酷睿都嵌入了一個微控制器,負責監視每個線程的性質和性能需求,衡量其載入、存儲、分支、內存訪問延遲、指令類型等,然后報告給Windows 11系統調度器,由后者結合運行環境,將此線程分配到最合適的核心。
Intel宣稱,該技術可以在最短30微秒的時間里確定一個線程的性質、歸屬,而傳統的系統調度器需要上百甚至幾百微秒,還可能分配錯誤。
另外,Thread Director還會針對性地優化頻率,尤其是在移動端,保證效率的同時還能提高能效,而且可以在微秒級別調整頻率。
Windows 10呢?自然不會有Thread Director,只有一個基礎版的Intel HGS(硬件指引調度),具體細節不詳,但效率肯定不會高到哪里去,
Linux呢?Intel說目前的優化重點是Windows 11,也會和業界合作對Linux內核進行優化,但需要時間。
12代酷睿將有三種封裝版本:
一是桌面高性能版的LGA1700獨立封裝,也就是S系列,最多8大8小16核心24線程,核顯最對32EU單元,功耗最高125W;
二是移動低功耗版的BGA Type3整合封裝,也就是UP3系列,尺寸50×25×1.3毫米,最多6大8小14核心20線程,核顯最多96EU單元,功耗12-35W(此前曝料還有45/55W);
三是超低功耗版的BGA Type4整合封裝,也就是UP4系列,尺寸28.5×19×1.1毫米,最多2大8小10核心12線程,核顯最多96EU單元,功耗可以低至9W。
三種版本除了核心規模不同,本質上相同的,多個IP模塊也是通用的,比如都集成新一代GNA 3.0高斯神經加速器,執行AI加速,
不過,IPU(圖像處理器單元)、雷電4、Wi-Fi 6E都是移動端才有,其中UP3系列支持四個雷電4端口,UP4系列則是兩個,
三級緩存增至最大30MB,而現在的11代移動版最多24MB,桌面版則是只有16MB。
內存方面,桌面版同時支持DDR5-4800、DDR4-3200、LPDDR5-5200、LPDDR4X-4266,而且所有版本都是同時支持四種內存,硬件層面沒有區別,因此在一些迷你機平臺上,應該會看到直接搭配LPDDR5/4X。
此外,還會支持內存的動態電壓頻率縮放,并強化超頻,
但是,移動端的內存支持規格沒有公開,估計和桌面版差不多,
PCIe連接方面,桌面版處理器會支持16條PCIe 5.0、4條PCIe 4.0,配套的芯片組(Z690)則最多支持12條PCIe 4.0、16條PCIe 3.0。
這一次Intel可是極為慷慨了,尤其是在PCIe 4.0上被對手搶先,終于扳回了一局,即便是PCIe 5.0全部給顯卡,也可以同時搭配最多四塊頂級SSD。
內部互連方面,12代提供了三種高速通道,
一是Compute Fabric,主要連接CPU核心、高速緩存,帶寬可達驚人的1TB/s,并支持動態緩存優化。
二是Memory Fabric,連接內存和其他模塊,帶寬最高204GB/s,支持動態位寬和頻率。
三是I/O Fabric,用戶輸入輸出,最高帶寬64GB/s,正好對應PCIe 5.0 x16,支持基于需求的實時帶寬控制,
不過,內存帶寬有點疑問:12代酷睿支持128-bit內存位寬,可以做到四個32-bit DDR5通道,而要想達到204GB/s的帶寬,必須支持到DDR5-12750的高頻率,但實際只有DDR5-4800,一半都沒有,暫時還不知道Intel是如何算出這個帶寬數字的,