市場動態 展覽 硬體 處理器 觀察

NVIDIA解釋為什麼只有GeForce RTX40顯示卡支援DLSS 3深度學習技術
同時也確認GeForce RTX40顯示卡採用23相位電路設計

正式揭曉GeForce RTX40顯示卡之後,NVIDIA進一步解釋其DLSS 3實際運作原理,同時也說明為什麼GeForce RTX30以前的顯示卡無法相容此項技術。

-
▲以「Ada Lovelace」架構打造的GeForce RTX40顯示卡

依照NVIDIA GPU工程資深副總裁Jonah Alben、應用深度學習研究部門副總裁Bryan Catanzaro等人說明,嚴格說起來是只有GeForce RTX40顯示卡可以完整支援DLSS 3深度學習技術功能。

實際上,若將DLSS 3深度學習技術功能拆解來看,確實只有GeForce RTX40顯示卡可透過深度學習方式在每組畫格之間插入自動生成內容,藉此讓每秒顯示畫格數可以大幅提升,藉此增加遊戲畫面穩定性,尤其對於市場越來越多高畫面更新率的螢幕,以及強調更快反應速度的鍵盤、滑鼠配件,NVIDIA認為在顯示輸出表現提高畫格數,將能減少遊戲過程因畫格數產生延遲,進而導致操作失誤,或是畫面出現碎裂等情況。

-
▲DLSS 3整體運作流程
-
▲透過深度學習方式,自動在每組畫格之間生成內容,讓整體畫格數可大幅提升

如果從是否支援以深度學習驅動的超解像功能,以及NVIDIA REFLEX低延遲技術來看,實際上前者從GeForce RTX20顯示卡以後產品就支援,而後者更是從GeForce 900系列顯示卡以後產品便開始加入,因此嚴格說起來只有只有GeForce RTX40顯示卡完整支援DLSS 3深度學習技術,其他顯示卡還是可以使用部分DLSS 3深度學習技術涵蓋功能。

從規格上來看,GeForce RTX40顯示卡相比先前推出產品增加光流加速器的設計,因此讓整體渲染處理效率提升,進而讓GeForce RTX30顯示卡以前產品無法發揮完整DLSS 3功能。

而目前NVIDIA的作法是僅在GeForce RTX40顯示卡提供使用DLSS 3技術,而未來是否會比照Ray Tracing即時光影追跡功能,原本僅提供GeForce RTX10顯示卡以後產品使用,後來也逐步開放讓早期與後來推出的GeForce GTX系列顯示卡使用,只是多少會影響整體效能表現。

-
▲目前僅GeForce RTX40顯示卡完整支援DLSS 3技術

針對遊戲開發商、創作者應用需求,NVIDIA強調僅需接入新版API即可快速套用DLSS 3效果,目前也與Unity、Unreal Engine等諸多遊戲引擎整合相容,並且讓多款遊戲都能順利使用DLSS 3相關技術。

-
▲與Unity、Unreal Engine等諸多遊戲引擎整合相容,並且讓多款遊戲都能順利使用DLSS 3相關技術

至於GeForce RTX40顯示卡與先前產品主要差異,除了是否支援完整的DLSS 3深度學習技術,本身更透過提升Shader Core、RT Core及Tensor Core設計,讓即時光影追跡效率大幅提升,同時配合SER (Shader Execution Reordering)渲染執行重新排序功能,讓顯示卡可以針對動態顯示內容中被列為優先顯示項目進行渲染。

-
▲「Ada Lovelace」架構此次主要功能特色,其中包含SER (Shader Execution Reordering)渲染執行重新排序功能、DLSS 3等

另一方面,以「Ada Lovelace」架構設計的GeForce RTX40顯示卡更加入諸多深度學習應用功能,例如原本在先前顯示卡產品必須逐一描繪樹葉外貌圖像的流程,在GeForce RTX40顯示卡即可直接藉由過往深度學習結果快速取樣完成渲染,而透過此次增加的光流加速器更可提升即時光影追跡呈現正確度。

-
▲在「Ada Lovelace」架構設計中,可以透過深度學習方式快速生成、渲染3D影像,進而提升整體顯示效率
-
▲藉由過往深度學習結果快速取樣完成渲染
-
▲透過此次增加的光流加速器更可提升即時光影追跡呈現正確度

同時,此次也加入名為RTX Remix的技術,藉由人工智慧自動將紋理內容精緻化,同時也能變得更加自然生動,讓原本解像能力較低的遊戲畫面可以變得更精緻,尤其對於許多可加入MOD模組修改人物外觀的PC遊戲,更能以真實、擬真效果呈現。

而針對GeForce RTX40顯示卡設計,PCB電路板依然配合穿透式散熱設計,而此次風扇葉片與散熱鰭片密度都有增加,而整體厚度也明顯增加許多,以創始版設計來看,大約會佔用3.5個PCIe插槽寬幅,甚至在特定OEM版設計更會佔用高達5組PCIe插槽寬幅,因此過往小型機殼要能順利安裝新款顯示卡,可能會面臨不少挑戰。

-
▲「Ada Lovelace」架構設計
-
▲「Ada Lovelace」架構讓電力精簡為原本的2分之1
-
▲透過23相位電路設計,讓電力輸出變得更穩定,不像GeForce RTX 3090會有明顯波動
-
▲GeForce RTX40顯示卡依然維持穿透式散熱設計
-
▲創始版的厚度明顯增加許多
-
▲部分OEM版顯示卡如華碩打造的ROG Strix RTX 4090,整體厚度就顯得相當厚實

不過,從整體電功耗來看,GeForce RTX 4090的運作功率為450W,實際上與GeForce RTX 3090 Ti相同,而GeForce RTX 4080的運作功率,依照配置記憶體容量差異分別為320W與285W,實際上並沒有太大差異。

但GeForce RTX40顯示卡採用特殊的23相位電路設計,其中20相位電路供GPU使用,其餘3相位則是供顯示卡驅動,這樣的設計實際上可以將電力傳輸負擔予以分散,並且透過加密的風扇葉片與鰭片設計加速散熱,因此可讓顯示卡在高度負載情況下維持穩動供電,藉此讓顯示卡能維持穩定輸出。

對於價格方面,NVIDIA執行長黃仁勳表示基於原物料價格,以及新技術導入,因此讓新款顯示卡價格上漲,但同時也調整先前推出的GeForce RTX30顯示卡售價,藉此作為GeForce RTX40顯示卡以外的合適選擇。

-
▲GeForce RTX40顯示卡主要規格比較
楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響