它的使命就是干掉RX 6900 XT!RTX 3080 Ti首發評測

一、前言:它的使命就是干掉RX 6900 XT!

RTX 3080 Ti誕生所經歷的曲折可謂一言難盡!在NVIDIA最初的計劃中,RTX 3080 Ti擁有20GB的大容量GDDR6X顯存,顯存位寬和帶寬與RTX 3080相同。不過誰也不曾料到AMD的RDNA2構架的強悍遠超出NVIDIA以及所有完全的事先預料,

特別是RX 6900 XT的性能與NVIDIA頂級的RTX 3090相差無幾,但是售價僅有7999元,而后者則是11999元,

很顯然,按照原定計劃,顯存帶寬被大量閹割的RTX 3080 Ti對上RX 6900 XT時并無必勝的把握,為此,NVIDIA重新設計了RTX 3080 Ti核心,雖然顯存容量減少到了12GB,但是完整的384Bit位寬得到了保留,顯存帶寬遠超RTX 3080。

NVIDIA賦予RTX 3080 Ti的使命就是干掉RX 6900 XT!


GA102-225-A1構架圖

完整的GA102共有7組GPC,每組GPC有6組TPC加16組ROP單元,總計是42組TPC、共計10752個流處理器、112個ROP單元、

同樣的完整的GA102核心的每個TPC有2組SM單元、2個RT Core、8個Tensor Core、8個紋理單元。

而RTX 3080 Ti所使用的GA102-225-A1核心依舊保持了7組GPC,完整的112個ROP得以保存,不過NVIDIA在其中的2組GPC中分別屏蔽掉了一組TPC。

因此它只有40組TPC、算下來就是10240個流處理器、320個紋理單元、320個Tensor Core。


RTX 3080 Ti GPU-Z參數

RTX 3080 Ti的詳細規格如下:

關于安培GPU的構架此前我們已經有過詳細的介紹,在這里我們化繁為簡,將其做了簡單的歸納如下:

1、整合INT32與FP32單元

圖靈的INT32單元只能做整數運算,閑置率很高,為了解決這個問題,提升INT32單元的利用率,NVIDIA改進了INT32單元,使之不僅可以運行整數運算,也能進行單精度浮點運算,相當于整合了INT32和FP32單元,因而使得以FP32單元計數的GPU流處理器數量直接翻倍,單精度浮點性能也同樣翻倍,

2、RTX IO技術

這項技術可以讓游戲在加載時完全規避CPU,直接將游戲數據包從SSD寫入到GPU的顯存中,由GPU替代CPU進行數據解包。GPU的整數/浮點性能數十倍于CPU,可以瞬間完成數據的解包工作,

不過這項技術需要微軟DirectStorage API的支持,預計2022年會正式開始應用,

3、NVIDIA DLSS:

從游戲內的物理和動畫模擬到實時渲染和AI增強的直播功能,AI正在引發一場游戲革命。借助GeForce RTX GPU的專用AI處理器Tensor Cores,NVIDIA DLSS在提升幀率的同時,生成精美、清晰的游戲圖像,為玩家提供更大的性能空間,以最大限度地提高光線追蹤設置并提高輸出分辨率,現在已有超25款游戲支持DLSS,并且數量還在逐月遞增,

4、NVIDIA Reflex:降低輸入延遲

NVIDIA Reflex技術可以降低系統延遲(或稱輸入延遲),使游戲的響應速度更快,使玩家在多人競技游戲中占據優勢。

在傳統的PC體系中,雖然強力的顯卡可以輕松渲染出足夠高的幀率,但這些游戲畫面都需要CPU進行調度分配,不合理的調度會使得CPU手忙腳亂,玩家滑鼠發出的指令其實無法第一時間到達游戲世界,這個過程我們稱之為延遲。

為了降低系統延遲,幫助GPU渲染的圖像能夠第一時間迅速呈現在屏幕,NVIDIA Reflex技術也隨著RTX 30系列的發布而登場。NVIDIA Re flex SDK被直接植入到了游戲,

NVIDIA Reflex SDK能夠更好的控制CPU的運行速度,允許及時向GPU提交例如點擊滑鼠的關鍵動作,同時還確保GPU沒有間斷運行,保證畫面的流暢輸出。

而最新發布的360Hz刷新率的電競G-Sync顯示器還內建了延遲分析器,可以讓你更系統化的量化電競游戲中的延遲數據。 NVIDIA Reflex技術是職業電競選手和精英玩家唯一專業的選擇。

5、第二代RT Core

光線追蹤是一種在計算機世界中完美再現真實世界的渲染技術,它的算法符合物理規律,不會像傳統光柵化渲染那樣容易產生各種問題。比如一個典型的例子就是光柵化算法無法正確處理焦散這種光學現象,炎熱的夏天陽光透過游泳池在水底投射得斑紋光影就是典型焦散,傳統光柵化算法使用的是動態貼圖,看起來雖然也像那么回事,但是無法和玩家互動,例如當角色進入泳池游泳就無法進行正確處理渲染,畫面往往出現不合理渲染效果,或者游戲中的陽光位置變化,天氣變化對泳池光影的影響也無法正確表現,而光線追蹤技術可以實時自動的演算焦散效果,讓畫面更加真實,

但是光線追蹤最大的問題是需要消耗巨大的計算資源,顯示器就像一塊窗子,虛擬的每一條光線都會穿過屏幕像素直達場景,并從存儲器中查找會被擊中的三角形,而且每條射線都要做這個動作,如果希望效果好的話,每像素可能還需要若干條甚至上萬條射線,

如果場景里有幾千萬個三角形,逐個三角形做遍歷求交,就需要消耗大量的高速緩存和總線帶寬,計算單元需要浪費大量時間等待三角形數據傳輸,

RTX 30系列顯卡基于新一代NVIDIA Ampere架構,擁有第二代光線追蹤計算核心,相比于第一代光線追蹤計算核心,RTX 30系列的光線追蹤核心性能足足提高了1.7倍,而且硬件上特別支持對運動模糊場景的光追效果計算。從而帶給玩家更流暢的光線追蹤游戲視覺體驗。

特別是體驗《賽博朋克2077 》這樣支持光線追蹤技術的新一代游戲,RTX 30系列能夠輕松駕馭賽博朋克的頹廢風格,流暢渲染都市夜晚霓虹燈下,大量的賽車,追逐,打斗等運動場景。為玩家帶來最極致的視覺體驗。

6、第三代Tensor Core

NVIDIA 自 Volta架構開始,在GPU中增加了針對深度學習加速設計的矩陣運算單元,并稱之為 Tensor Core(張量計算核心)。

在圖靈架構里,NVIDIA 引入了第二代 Tensor Core,而到了RTX 30系列所采用的Ampere架構,則進化到了第三代Tensor Core。

深度學習技術在圖形圖像各個領域都有著價值巨大的應用,而在游戲體驗中則是被稱為深度學習超采樣的DLSS 技術。最新一代的DLSS 能夠使得游戲畫質極大提升,細節和銳度媲美、甚至超越原生分辨率,

DLSS 本質是一種圖像重建算法,其加原理其實也很簡單。開啟DLSS后,游戲引擎中的諸如動態光源、陰影的計算,封閉空間環境遮擋(SSAO)、屏幕空間反射(SSR),甚至實時光線追蹤,都會被降低到1/2甚至1/4像素的低分辨率下運行,GPU的負擔大幅度減輕,渲染得出的最終場景會通過Tensor Core結合DLSS進行高分辨率重建,從而用較低的GPU負載獲得流暢且畫質極佳的游戲體驗效果。

和圖靈相比,安培的張量性能可以最高達到 2.7 倍,這使得RTX 30系列可以輕松使用DLSS技術在4K 甚至8K分辨率下,依然帶給玩家最極致的光線追蹤游戲體驗效果。

7、GeForce Experience功能

所有NVIDIA GeForce GPU都能從GeForce Experience中獲益,數以千萬計的玩家都在使用該工具來優化游戲設置、記錄和上傳游戲、直播游戲、拍攝屏幕截圖,以及下載和安裝Game Ready驅動。

8、一鍵自動式GPU調校

GeForce Experience現已支持GPU調校,它能使用高級掃描算法自動創建GPU超頻配置文件,

9、增強型游戲內監控懸浮窗

GeForce Experience強大的游戲內懸浮窗功能現已能讓玩家查看更多詳細的性能統計資訊、溫度和延遲指標,包括 NVIDIA Reflex的延遲分析器統計資訊。

相關閱讀:
NV黃仁勛站了出來:成幣圈新吹微星電競主機升級支持NV神技、性能免費提升10%曝華為反對NV 2500億的天價“親事” 黃仁勛回應Intel旗艦獨顯真身首秀!就靠它干翻RTX 3080?DLSS永遠的神 還有什么比在太空打飛機更熱血的呢?

  • 首頁
  • 上一頁
  • 1
  • 2
  • 3
  • 4
  • 5
  • 下一頁
  • 尾頁
  • 全文

文章內容導航
  • 第一頁 前言:它的使命就是干掉RX 6900 XT!
  • 第二頁 外觀:與RTX 3080長一樣
  • 第三頁 測試平臺:全核5.2GHz的i9-10900K + 皇家戟4000MHz C15 32GB內存
  • 第四頁 2K分辨率游戲性能測試:與RTX 3090僅差了1%
  • 第五頁 4K分辨率游戲性能測試:比RX 6900 XT強5%
  • 第六頁 溫度與功耗測試:烤機時顯存輕松過100度
  • 第七頁 光線追蹤測試
  • 第八頁 總結:專為游戲玩家打造的頂級游戲GPU

0 条回复 A文章作者 M管理員
    暫無討論,說說你的看法吧