隨著RTX 30系顯卡的發布,人們在關心性能的同時,一些軟性技術的應用和更新更受到玩家的青睞,如游戲中的光追表現和DLSS效果。
這兩種技術可以說有著劃時代意義,光線追蹤可以讓我們在游戲中獲得更為真實的光線效果,讓游戲畫面不斷趨近于真實。
同時還可以節省大量游戲開發者的時間,而DLSS效果則可以在不降低畫質的情況下讓幀數暴漲,
在新的GeForce RTX 30系顯卡中,NVIDIA更新了RT Core和Tensor Core,并且新增了大量支持這兩項技術的游戲,今天筆者簡單為大家簡單說明并進行幾款游戲的實測展示,
首先介紹一下測試平臺,為了能完全發揮技嘉AORUS RTX 3080 XTREME 10G顯卡的性能,我們選擇了目前桌面旗艦級CPU和主板i9-10900k和Z490主板,
RT Core及光線追蹤詳解
其實,光線追蹤的概念在很早就已經被人所提出了,光線追蹤技術其實就是將光源產生的光線所產生的折射,反射等光線變化和對陰影產生的反應通過計算準確的反映到畫面之中,為人們帶來百分之百的光影效果,
在此次的NVIDIA Ampere架構中,NVIDIA官方宣布為第二代RT Core,它和第一代有什么不同呢。
首先要知道RT Core的工作原理是,著色器發出光線追蹤的請求,交給RT Core來處理,它將進行兩種測試,分別為邊界交叉測試(Box Intersection testing)和三角形交叉測試(Triangle Intersection testing)。
基于BVH算法來判斷,如果是方形,那么就返回縮小范圍繼續測試,如果是三角形,則反饋結果進行渲染。
相較于初代的Turing RTX架構,NVIDIA Ampere架構在算力上有著成倍的增長,同時新的架構翻倍了光線與三角形的相交吞吐量,RT Core達到58 RT TFLOPS,而Turing為34 RT TFLOPS。
而光線追蹤最耗時的正是求交計算,因此,要提升光線追蹤性能,主要是對兩種求交(BVH/三角形求交)進行加速,
在Turing的RT Core中,可以每個周期完成5次BVH遍歷、4次BVH求交以及一次三角形求交,在第二代RT Core 里,NVIDIA增加了一個新的三角形位置插值模塊以及一個的額外的三角形求交模塊,這樣做的目的是為了提升諸如運動模糊特效時候的光線追蹤性能。
《軒轅劍7》光線追蹤演示
關于概念性的東西我們就說這么多,相信玩家更想看到的還是光追的實際效果,首先我們來測試一下近期上線的大陸游戲《軒轅劍7》。
在《軒轅劍7》中,我們以序章的街道場景來做對比,第一張圖為打開光追后的效果,光線追蹤的效果顯而易見。
打開光追后街道的燈光、陰影以及太陽光在水面的反射都有很大改善,而游戲整體的色調也由冷變暖,更富有生活氣息,
第二組對比我們選擇了太史府門前,通過對比不難發現,打開光追后的效果影響了游戲整體的氣氛,第一張的燈光氛圍營造出了回家溫馨的感覺,而第二張畫面陰暗感覺馬上會有什么不好的事發生,雖然比較符合游戲背景,但整體觀感略差,
Tensor Core及DLSS詳解
我們都知道光線追蹤在游戲內會耗費巨大的計算資源,這也導致了它在20系顯卡中由于算力的因素,玩家反響并不大,而在全新的NVIDIA Ampere架構中不但引入了第二代RT Core,還有第三代Tensor Core。
NVIDIA自Volta架構開始,在GPU中增加了針對深度學習加速設計的矩陣運算單元,并稱之為Tensor Core(張量計算核心),
在圖靈架構里,NVIDIA引入了第二代Tensor Core,而到了RTX 30系列所采用的Ampere架構,則進化到了第三代Tensor Core。
在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自動識別并消除不太重要的DNN(深度神經網路)權重,同時依然能保持不錯的精度。
首先原始的密集矩陣會經過訓練,刪除掉稀疏矩陣,再經過訓練稀疏矩陣,從而實現稀疏優化,進而提高Tensor Core的性能,
在實際應用中,深度學習技術在圖形圖像各個領域都有著價值巨大的應用,而在游戲體驗中則是被稱為深度學習超采樣的DLSS技術,最新一代的DLSS能夠使得游戲畫質極大提升,細節和銳度媲美、甚至超越原生分辨率,
DLSS本質是一種圖像重建算法,其加原理其實也很簡單。開啟DLSS后,游戲引擎中的諸如動態光源、陰影的計算,封閉空間環境遮擋(SSAO)、屏幕空間反射(SSR),甚至實時光線追蹤。
都會被降低到1/2甚至1/4像素的低分辨率下運行,GPU的負擔大幅度減輕,渲染得出的最終場景會通過Tensor Core結合DLSS進行高分辨率重建,從而用較低的GPU負載獲得流暢且畫質極佳的游戲體驗效果,
《堡壘之夜》、《死亡擱淺》DLSS效果展示
下面我們來通過實測看一下不同游戲中開啟DLSS后的效果,我們選擇了《堡壘之夜》和《死亡擱淺》進行測試。
首先來看《堡壘之夜》的對比畫面,其實在游戲中DLSS的開關幾乎不會影像畫面,但是帶來幀數的變化卻非常明顯。
第一組對比由于天色的變化略失精準,但打開DLSS質量模式后,角色衣服的褶皺及棱角更明顯,在幀數上DLSS關為78幀,DLSS質量為115幀,幀數提升47%。
第二組對比為DLSS性能與DLSS極致性能,兩者從畫面上幾乎看不出區別,但是幀數仍然提升非常恐怖,
相較于關閉DLSS的幀數,DLSS性能為129幀,提升65%;DLSS極致性能為145幀,提升85%,
145幀的成績已經完全達到高刷新電競顯示器的幀率要求,同時在游戲中也能更順暢,最主要的是畫質沒有任何降低。
下面我們來看小島先生的最新游戲《死亡擱淺》,這款游戲有個特別的設計就是自帶銳化,從圖中我們也能看到,在一些細小部位,銳化的痕跡十分明顯。
在關閉DLSS的情況幀數為118,而打開DLSS質量模式后幀數為145,畫面經過AI處理,消除了很多鋸齒,幀數方面,打開DLSS質量模式后,提升為22%。
在選擇DLSS性能和DLSS極致性能后,幀數為150幀和163幀,同樣畫面相較原生畫質來說將銳化效果進一步消除,觀感更柔和。與原生畫面的幀數相比,提升分別為27%和38%。
其實和光追相比,我認為DLSS對于玩家來說更是終極夢想,在畫質不變甚至更好的情況下極大提升游戲幀數,這意味著你可以花費更少的價格體驗到更高端顯卡的性能,同時如果你的顯卡性能夠強勁幀數比較富裕,還可以再開啟光追效果,進一步增加沉浸感。