40核心25倍性能碾壓64核心!Intel 10nm就是這么狂

說到處理器,對于大眾用戶而言,關注最多的自然是距離最近的桌面、筆記本消費級產品,而作為廠商最新技術的最強代表,服務器、數據中心才是真正的殺場。

3月16日,AMD發布了第三代霄龍7003系列(代號Milan),擁有7nm工藝、Zen3架構、64核心128線程等傲人規格。近幾年,AMD在數據中心領域也是不斷取得突破,市場份額已經從當初的0.7%,來到了7%之上,

但在這個龐大的市場上,Intel依然是王者一般的存在,雖然單看產品性能參數可能有些不敵,但無論是多達13倍的市場份額領先,還是全面豐富的技術特性,抑或更廣闊的生態應用系統,都不是一個數量級。

事實上,這么多年來,Intel至強幾乎已經等于服務器、數據中心的代名詞,2013年至今累計云端部署超過10億個核心,云服務商超過800家,發展了三代的可擴展至強累計出貨也已超過5000萬顆。

現在,Intel終于帶來了第三代至強可擴展平臺Ice Lake-SP,再次將自己的優勢展現得淋漓盡致,尤其是豐富的產品矩陣,


本次大陸區發布會選在了首鋼園三高爐,頗有賽博朋克氣息,也是冬奧會場地,往昔與未來在這里交織


Intel副總裁兼大陸區總經理王銳發表主題演講

新至強擁有全新的10nm制造工藝、最多40核心80線程、全新Sunny Cove CPU架構、20% IPC性能提升、46%平均性能提升、74% AI推理性能提升,堪稱Intel至強近年來最大的一次飛躍,

但是,新至強不是單打獨斗,周邊圍繞著Intel GPU、XPU、FPGA、內存、存儲、連接、安全等等各條產品線和技術,從而構成一個軟硬結合的完整解決方案,

此前已經陸續發布的傲騰持久內存Pm200系列、傲騰SSD P5800X、閃存SSD D5-P5316/D7-P5510、20萬兆以太網卡E810、Agilex FPGA等等,這些都是新至強的得力助手,互相結合大大拓展了整體平臺的實力,

按照Intel的說法:“我們沒有把至強稱作一個服務器產品,它是一個數據中心產品,”

需要指出的是,去年6月19日發布的Cooper Lake,也是屬于第三代至強可擴展家族,區別在于Cooper Lake只用于四路、八路市場,而新的Ice Lake-SP則是針對單路、雙路市場,

說起來,Ice Lake-SP可謂命運多舛,發布時間一再延遲,主要是和新上的10nm工藝有關,而且引入了全新架構(Cooper Lake還是14nm和老架構),導致同一家族的兩個系列產品間隔了將近10個月,

當然了,對于數據中心平臺而言,正式發布并不是開始,事實上在發布之前,Ice Lake-SP已經出貨了20多萬顆,擁有了極為豐盛的產品、方案。

王銳也表示:“至強處理器的出貨有保證,特別是數據中心。我們在全力提升產能,實際的提升比計劃更高。”

另外在新的CEO帕特·基因格上任后,Intel已經在大刀闊斧地變革自己,包括加速推進新架構新工藝新產品,強化制造和產能,開放代工和外包。

接下來,我們就從架構技術、性能、生態三個方面,深入了解一下Ice Lake-SP。


Intel市場營銷集團副總裁兼大陸區數據中心銷售總經理陳葆立展示Ice Lake-SP

一、架構技術:全面翻新、延遲優秀

Intel提出,新至強最值得關注的變化,主要有三個方面,一是目前唯一內建AI加速的x86數據中心處理器,二是高級先進的安全解決方案,三是可擴展性、靈活性、可定制性,

接下來的解讀中,我們也會逐一涉及這三個方面。

架構方面,新至強引入了Sunny Cove,也就是輕薄筆記本上Ice Lake-U 10代低功耗酷睿平臺的同款(事實上二者處理器代號都是相通的),都是首次結緣10nm,當然這次針對數據中心應用做了調整優化,

至于為何二者發時間錯開了一年半,筆記本端去年都已經進化到第二代10nm Tiger Lake,架構也已升級為Willow Cove,你應該懂的。

簡單來說,Sunny Cove架構改進了前端部分,容量更大,分支預測更精準,加寬加深了流水線,結構和執行資源上規模更大,同時增強了TLB、單線程執行、預取等環節,還針對數據中心重點優化了緩存、矢量吞吐等部分,

對比二代可擴展至強Cascade Lake,新至強的最大核心數從28個增加到40個,

對于為何選擇40核心這個節點,陳葆立表示,這是根據整個產品迭代所做的一個比較好的平衡,無論是核心數,還是不同工作負載的加速指令、配套的產品,設計芯片需要做很多事情,尤其是把功能做好是最優先的,能夠更好地滿足客戶需要,而不是純粹選一個核心數。

當然,不同的設計策略也決定了核心數量。AMD霄龍是多個小芯片組成,雖然每個小芯片最多也才8個核心,但可以通過“并聯”輕松堆砌更多核心。

Intel則依然堅持單芯片設計,再加上制造工藝、內部架構,天然決定了不容易擴展太多核心,不過Intel也在不斷推進各種先進封裝技術,未來的芯片規模有望實現突飛猛進,

每核心緩存一級從32KB增大一半來到48KB,二級從1MB增大四分之一來到1.25MB,三級而從1.375MB小幅增大1.5MB,并支持Hemisphere高性能交錯模式,

內存支持從六通道DDR4-2933擴展到了八通道DDR4-3200,并改進內存調度器實現更低的延遲、更高的帶寬,而且還有傲騰持久內存200系列這個殺手锏,

處理器間互連通道還是兩條或三條UPI總線,但是帶寬從10.4GT/s擴大到11.2GT/s,同時首次原生支持PCIe 4.0,通道數也從48條增加到64條。

獨家的AVX-512指令集這次增加了大量的新指令,涉及到加解密、壓縮解壓、安全等各個方面,可擴大應用范圍、提升性能,這也是Intel一貫的長項。

Intel還和新發布的AMD三代霄龍做了正面對比,強調了自己在緩存延遲、內存延遲方面的優勢。

緩存延遲方面,新至強的一二級其實比三代霄龍還稍微高一些,但三級就完全不一樣了,畢竟一個是單Die,一個是多芯片,不再同一個數量級,尤其是霄龍涉及到跨Die通信、跨處理器的時候,延遲可以達到新至強的兩倍甚至五倍。

內存方面,新至強的通道數、頻率算是追平對手,但是延遲低得多,而且有獨家的傲騰持久內存加持,單顆處理器支持最多4TB DDR4內存,或者4TB DDR4+2TB傲騰內存。

三代霄龍最多支持3TB DDR4,其實也可以搭配傲騰內存,但最大容量僅為1.5TB,而且關乎運行模式、平臺聯動、指令和應用優化,估計幾乎不會有客戶會去這么搭配,AMD也坦承一切取決于客戶自己的部署,——有點像Thunderbolt雷電技術,

指令集這個東西,一直都是Intel占據領導地位,這次也新增了大量新指令,包括大數算數(AVX-512整數IFMA)、矢量AES、Caryy-less乘法指令、伽羅華域新指令、SHA-NI、VBMI等等,就不展開講了,大家只要看看后邊的性能提升就明白它們的威力了。

很多時候,一條指令的加入,很容易就可以在特定負載中帶來數倍乃至數十倍的性能提升,遠不是單純改進硬件就能媲美的。

Intel技術專家表示:“工作負載加速器指令就好比性能倍增器,它提供的增益要比僅向處理器添加核心所能帶來的增益高很多,”

Intel副總裁兼至強處理器與存儲事業部總經理Lisa Spelman也強調說:“幾年前開始我們就開始早早投資指令集和軟體,這個戰略正在產生巨大的回報。”

安全也是數據中心必不可少的關鍵一環,新至強的一大重點就是支持SGX軟體防護擴展技術,它面世已經好幾年,這是第一次登陸至強可擴展平臺,用于雙路系統,

它具備持續增強的安全能力,并通過了數百次的調研和生產部署,可大大縮小系統內的攻擊層面,抵御各種攻擊途徑,保護敏感代碼和數據,而且指定位址空間可隔離并處理最多達1TB的代碼與數據,滿足主流工作負載的需求。

尤為值得一提的是,SGX安全技術是獨立于操作系統、硬件配置的,不受軟硬件變動的影響和約束,部署更方便,效果也更明顯,即便是操作系統、BIOS、驅動、虛擬機都被攻擊了,它依然能保護數據,

再結合全內存機密技術、平臺固件彈性技術,新至強可以真正解決敏感的數據保護問題。

說了半天,大家可能會問,這次到底發布了什么產品?真的是相當相當豐盛。

如上圖,最左側一列是此前發布的四路、八路Cooper Lake,中間和右側是新發布的單路、雙路Ice Lake-SP,按照產品線分為鉑金、金牌、銀牌三個序列(沒有了最低端的銅牌)。

按照應用方向,則分別注重單核性能、擴展性能、SGX安全性能、網路優化、云優化、媒體處理優化、長壽命、單路型、液冷散熱等等,劃分得非常細致,當然不同類型有所交錯,有的型號可適用于多個方面,

Intel還為不同版本加上了不同的字母后綴,包括V(SaaS云)、P(IaaS云)、S(512GB SGX)、Q(液冷散熱)、Y(SST-PP 2.0)、N(網路/網路虛擬優化)、M(媒體處理優化)、T(長壽命與擴展溫度范圍)、U(單路)等等,著實有點眼花繚亂。

頂級旗艦是至強鉑金8380,40核心80線程,基準頻率2.3GHz,全核加速3.0GHz、單核加速3.4GHz,二級緩存50MB,三級緩存60MB,熱設計功耗270W,批發價8099美元,

相比之下,上代旗艦至強鉑金8280 28核心56線程,頻率2.7-4.0GHz,二級緩存28MB,三級緩存38.5MB,熱設計功耗205W,批發價10009美元,

這代最強的28核心是至強金牌6348,頻率2.6-3.5GHz,二級緩存35MB,三級緩存42MB,熱設計功耗235W,價格3072美元,

兩相對比,同樣核心的時候,新一代頻率低了不少,熱設計功耗反而高了,這也是這代的普遍趨勢,10nm對比爐火純青的14nm還是差點勁,不過價格降到了只要三成!40核心也比上代28核心便宜了兩成!

4/6核心型號取消,改為直接8核心起步,而基準頻率最高3.6GHz的至強金牌6334,就是一款8核心,但這已經是極限了,最高加速此時也只有3.7GHz,而熱設計功耗達到了165W,上代可是還有多款型號加速到了4.5GHz,

熱設計功耗最低的也有105W,包括8核心的至強銀牌4309Y、10核心的至強銀牌4310T,頻率分別為2.8-3.6GHz、2.3-3.4GHz,

另外注意有個特殊的液冷散熱型至強鉑金8368Q,38核心,頻率2.6-3.7GHz,熱設計功耗270W,可能是偏向OEM定制。

其他型號就不一一解讀了,感興趣的可以自己慢慢對比。

  • 首頁
  • 上一頁
  • 1
  • 2
  • 下一頁
  • 尾頁
  • 全文

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧