近日,騰訊招聘官網出現了多個與芯片有關的崗位,引發外界關注。
騰訊招聘披露的芯片研發崗位包括:芯片架構師、芯片驗證工程師、芯片設計工程師等多個職位,工作地點可選擇北京、上海、深圳等。
以芯片架構師為例,職責包括:負責AI芯片和通用處理器或者細分領域的需求分析,主導AI,處理器芯片架構設計,競爭分析和規格定義;負責芯片領域的技術演進路標、關鍵技術,主導關鍵技術和架構的研究;負責大型芯片的架構設計,關鍵模塊的把控和設計等。
而芯片設計工程師則要求精通數字電路設計流程,精通RTL代碼書寫,具有電路優化的經驗;4年以上數字前端設計經驗,有大規模 SoC 芯片設計成功量產經歷以及CPU/NPU 等設計經驗者優先等,
該招聘消息一經爆出,業界開始紛紛猜測:騰訊真的要進軍“卡脖子”芯片領域?
對此疑問,7月16日騰訊相關人士回應稱,這是基于一些業務需要騰訊在特定領域有一些芯片研發的嘗試,主要是AI加速和視訊編解碼等,但這并非外界所認為的通用芯片。
互聯網大廠齊聚“造芯”賽道
實際上,騰訊幾年前就已經開始了芯片領域的布局,
2016年11月,騰訊就與阿里一起領投了可編程芯片公司Barefoot Networks的2300萬美元C輪融資。
隨后在2018年,AI芯片公司——上海燧原科技有限公司獲得了騰訊領投的Pre-A輪3.4億元人民幣投資,
2019年6月,騰訊跟投燧原科技的新一輪融資,在今年,騰訊又繼續跟投了燧原科技的C輪融資。
據天眼查數據顯示,2020年3月19日深圳寶安灣騰訊云計算有限公司成立。該公司經營范圍就包含了集成電路設計、研發等。
然而對于造芯這件事,騰訊并非是以BAT為代表的大型互聯網公司中的唯一一家。
早在2018年7月,百度公司發布云端全功能AI芯片“昆侖”,其中包含訓練芯片昆侖818-300,推理芯片昆侖818-100,
目前,百度第一代昆侖芯片已于2020年初量產,目前已經規模化部署超過2萬片,第二代昆侖芯片已經流片成功,將于2021年下半年量產。
而阿里巴巴在2018年9月的云棲大會上宣布成立平頭哥半導體有限公司,主要任務是從事芯片的自研開發與戰略布局。2019年9月阿里巴巴第一顆自研芯片——AI推理芯片含光800正式問世,阿里巴巴表示該芯片已經量產,服務于阿里巴巴內部,
“造芯”的初心,是為了打造一朵更高效的云
“隨著云計算承載的業務規模越來越大,傳統服務器難以完全滿足云計算數據中心場景下對超大規模、需求多樣、高性價比、安全可靠以及軟硬件一體化等方面的要求,”
2020 Techo Park開發者大會上騰訊云服務器與供應鏈管理部總經理劉裕勛就曾對雷鋒網表示到。
隨著云計算產業的發展,從技術的角度說,云計算已經超過IT基礎設施的范疇,正向上定義軟體應用服務,向下定義芯片、服務器等IT硬件。
從技術角度來看,20年前,虛擬化技術實現了硬件細節的抽象,讓基礎設施成為由軟體管理的單一實體,過去10年,云計算進一步推動了這一進程,使硬件成為一種抽象資源,而且對于客戶來說,這個資源越來越多地由別人來管理,
然而,云計算技術雖然使硬件變得抽象,但實際上,云服務商卻在硬件層面在做這大量的創新工作,開始從最基礎的芯片來構建云。
同樣,在劉裕勛看來,隨著云原生理念的不斷推進,云基礎架構的演進過程中會呈現出三個特點:高復雜度、高性價比、安全性。
當海量業務承載在云基礎架構設施的時候,業務的多樣性,對于軟硬件一體化的系統實際上提出了更高的要求,面臨這樣的復雜度,云廠商根據自身的情況,必然要開始自己進行研究相關芯片,或者是與其他芯片廠商聯合起來進行深度定制,以此來解決各種復雜場景下的兼容性問題,
自研芯片的背后,則是對于BAT這般體量的云服務商而言,則是性價比最高的一條道路,
而在技術上,以英特爾的CPU為例,CPU的另外一個名字叫通用計算。而這也就代表著,搭載通用CPU的服務器具有很高的通用性,但是實際的應用中,勢必會造成性能的浪費。
對于普通用戶來說,可能十幾上百臺服務器就是應用的極限了,但是互聯網大廠的服務器動輒就是上萬甚至幾十萬臺,因此每臺性能的略微降低累積起來都是一個不得了的數字
更重要的是,由于互聯網應用的特殊性,相當一部分新采購的服務器都要進行針對性的優化,或者需要進行部分配件的調整與革新,也就需要投入大量的人力、精力和財力,造成資源的浪費,
因此對于以騰訊云為代表的云廠商來說,勢必要從整機的設計上面,去精簡不需要的功能;優化整機的散熱能力,降低能耗。配備一個非常強的供應鏈的管控。去降低計算力的單位成本,并進而將這種成本紅利釋放給數百萬的云上用戶。
而在安全方面,從芯片層面就進行自研、定制化,勢必能更好的保證整機系統的安全可靠。
就在近日上海閉幕的世界人工智能大會上,華為輪值董事長胡厚崑表示道:“只有基礎打得牢,根技術扎得深,應用創新跑得快,才有人工智能產業的參天大樹和生態的持續繁榮。”
其中技術要扎到根,根深才能葉茂,值得就是應該大力發展根技術,如處理器、AI計算框架等,增強人工智能產業的發展韌性,
“硬件創新”已成云廠商必爭之地
除大陸云廠商之外,國外三家規模較大的云服務商亞馬遜、微軟和谷歌也硬件方面進行重金投入,用于提高自身云平臺的性能或者調優服務來滿足特定的用途,例如人工智能開發等等,
如谷歌把自己的云計算戰略重點放在了處理人工智能工作負載上,為此設計了名為TPU的微處理器家族,號稱相比GPU的成本更低性能更高,
對此,谷歌曾對外表示,2015年的時候在多層神經網路ResNet 50上訓練一個深度學習模型的成本超過20萬美元,而今天,成本比一杯咖啡還便宜。
此外,微軟Project Olympus是一項針對微軟基于OCP構建的云平臺打造一系列服務器結構塊的項目,AWS基于ARM的Graviton處理器從2015年開始開發,到現在已經在AWS EC2實例中實現普及,
“硬件專業化可以將延遲、性價比和功耗/性能比提高10倍,但多年來,大多數計算工作負載一直停留在通用處理器上,”AWS工程師James Hamilton在一篇部落格文章中這樣寫道。亞馬遜每年要安裝一百多萬個專用芯片,專門用于機器學習工作負載,
亞馬遜的Nitro項目則是將硬件和軟體結合,消除虛擬化的開銷,
阿里云的神龍架構則也是通過芯片層面的,通過軟硬件結合的方式,來降低虛擬化損耗,華為云的擎天、京東的京剛則也是通過同樣的方式。
對此,劉裕勛對雷鋒網表示到,云上的客戶是非常的“挑剔”的,同時云計算市場的競爭也很激烈,客戶都希望用低成本,高質量的產品,客戶要求的苛刻會推動我們去做更多的變革和演進。
在此背景下,對于云服務商而言,通過自研服務器、自研數據中心技術、再到上層的IaaS、PaaS、SaaS平臺的協同打造,勢必是一條必須要走的道路。