對(duì)于每一代 GPU,Imagination 內(nèi)部的性能團(tuán)隊(duì)都會(huì)運(yùn)行廣泛的測(cè)試內(nèi)容,分析并理解不同類型的工作負(fù)載及其瓶頸。作為分析的一部分,數(shù)據(jù)顯示許多現(xiàn)代游戲在執(zhí)行后處理算法上花費(fèi)了越來(lái)越多的時(shí)間,以實(shí)現(xiàn)景深、光暈、模糊等效果。
大多數(shù)這些后處理過(guò)程都是以紋理采樣為主的過(guò)濾效果,它們對(duì)算術(shù)邏輯單元 (ALU) 的要求不高,但受限于紋理處理單元 (TPU) 的吞吐率。解決這個(gè)問(wèn)題的一種方法是簡(jiǎn)單地改變 TPU 單元與 USC/ALU 比例。然而,我們的分析表明這并非一個(gè)好策略,原因有以下幾點(diǎn)。
首先,在常規(guī)渲染過(guò)程中,D系列 GPU 中 ALU 與 TPU 的比例已經(jīng)是最佳的,增加更多的 TPU 并不會(huì)帶來(lái)任何好處,因?yàn)楣ぷ髫?fù)載受限于 ALU。同時(shí),其他處理過(guò)程是 TPU 密集型的,同時(shí)也是帶寬密集型的,因此增強(qiáng) TPU 并不會(huì)有幫助,因?yàn)闆](méi)有足夠的帶寬來(lái)滿足額外的 TPU 吞吐量,因此性能不會(huì)得到提升。
我們的團(tuán)隊(duì)發(fā)現(xiàn)后處理工作負(fù)載以及計(jì)算圖像處理工作負(fù)載具有以下特點(diǎn):
- 在一個(gè)區(qū)域內(nèi)進(jìn)行規(guī)則的處理/采樣,有大量的采樣點(diǎn)重復(fù)利用,這些采樣點(diǎn)命中紋理緩存;
- 對(duì)單一渲染目標(biāo)/紋理進(jìn)行2D采樣,不涉及層次細(xì)節(jié) (LOD) 和透視。
上述兩個(gè)特性促使我們?cè)?D系列 GPU 中實(shí)現(xiàn)了新的 TPU 模式,可以使性能翻倍,但僅當(dāng)硬件檢測(cè)到這些特性時(shí)才生效。第一個(gè)特性是重要的,因?yàn)槌R?guī)的采樣加上樣本重復(fù)利用率高(例如,移動(dòng)窗口濾波器)可以避免帶寬限制。第二個(gè)特性也是重要的,因?yàn)樗刮覀兡軌虮3种貜?fù)邏輯的數(shù)量較低,避免所有 TPU 邏輯均翻倍的前提下,提供峰值吞吐率翻倍的效果。
這種方法的結(jié)果是適度增加了TPU 的大小,但在策略生效的情況下性能翻倍,同時(shí)保持與總體特性相平衡。IMG D 系列 GPU 實(shí)現(xiàn)了真正的加速,并避免了 ALU 和/或帶寬瓶頸情況,這些情況下 TPU 已經(jīng)足夠快。這意味著對(duì)于某些類型的處理,DXT-48-1536 將有效地表現(xiàn)出等同 DXT-96-1536的性能,每時(shí)鐘處理雙倍數(shù)量的雙線性濾波紋理樣本,與前代 CXT-48-1536 相比則可提供兩倍的執(zhí)行速率。
作為示例,下圖顯示了一個(gè)典型的手機(jī)游戲及其渲染過(guò)程。頂部的條形圖從左邊開(kāi)始,顯示了各種 Vulkan 渲染過(guò)程,其中包含幾個(gè)預(yù)處理過(guò)程,通常用于陰影貼圖,對(duì)深度測(cè)試單元造成很大壓力。渲染的第二階段是主場(chǎng)景,本例中是一個(gè) GBuffer 渲染過(guò)程和一個(gè)光照過(guò)程。我們可以看到,這是幀處理時(shí)間的主要部分,ALU和 TPU 的負(fù)載相對(duì)均衡;這通過(guò)紅色曲線(TPU 負(fù)載)和綠色曲線(ALU 負(fù)載)表示。我們可以看到,隨著時(shí)間的推移,兩者都顯示出平均利用率,這對(duì)于主場(chǎng)景來(lái)說(shuō)是典型的,其中 ALU 和 TPU 工作的混合比例平衡。

最讓我們感興趣的渲染過(guò)程是最后一組,即后處理過(guò)程。通常,這是在之前的主渲染過(guò)程之上應(yīng)用光暈、模糊等許多 HDR 風(fēng)格后處理效果的地方。在這個(gè)區(qū)域值得注意的是,紅色的 TPU 曲線在很多情況下都升高,而綠色的 ALU 曲線卻非常低。這表明 TPU 單元造成了處理瓶頸——而這正是 2D 雙速率 TPU 設(shè)計(jì)要解決的問(wèn)題。它為這些工作負(fù)載將 TPU 的速度翻倍,從而將渲染時(shí)間減少了一半,加快了幀渲染的速度。
-
gpu
+關(guān)注
關(guān)注
28文章
5050瀏覽量
134025 -
TPU
+關(guān)注
關(guān)注
0文章
160瀏覽量
21478 -
imagination
+關(guān)注
關(guān)注
1文章
611瀏覽量
62975
發(fā)布評(píng)論請(qǐng)先 登錄
【CPKCOR-RA8D1】3、2D繪圖引擎(D/AVE)DRW
從 2D 到 3.5D 封裝演進(jìn)中焊材的應(yīng)用與發(fā)展
TechWiz LCD 2D應(yīng)用:不同結(jié)構(gòu)下的VT曲線
Techwiz LCD 2D應(yīng)用:二維LC透鏡建模分析
HT 可視化監(jiān)控頁(yè)面的 2D 與 3D 連線效果
TechWiz LCD 2D應(yīng)用:半透反射式顯示模式仿真
億源通科技OFC 2025展示2D光纖陣列,助力OCS技術(shù)創(chuàng)新
STM8/STM32 products有2D marking和沒(méi)有2D marking的工藝有差別嗎?
從圖形處理到AI加速,一文看懂Imagination D系列GPU
TechWiz LCD 2D應(yīng)用:不同結(jié)構(gòu)下的VT曲線
AN-1249:使用ADV8003評(píng)估板將3D圖像轉(zhuǎn)換成2D圖像
技術(shù)前沿:半導(dǎo)體先進(jìn)封裝從2D到3D的關(guān)鍵

Imagination D系列GPU:關(guān)于2D 雙速率紋理處理
評(píng)論