隨著NVIDIA RTX 40系列、AMD RX 7000系列的陸續(xù)登場,新一輪顯卡大戰(zhàn)漸入高潮。那么,“后發(fā)制人”的AMD RX 7900系列有什么特異之處呢?
近日,被業(yè)界譽(yù)為“RDNA架構(gòu)技術(shù)傳奇的”AMD Radeon技術(shù)事業(yè)部工程研發(fā)高級副總裁王啟尚(David Wang)先生,接受了快科技的專訪,暢聊了多個有關(guān)AMD RX 7900系列顯卡的前沿技術(shù)話題。
王啟尚在美國華盛頓大學(xué)獲得電子工程碩士學(xué)位,曾先后就職于LSI Logic、Axil、SGI、ArtX等半導(dǎo)體芯片企業(yè),2000年加入ATI,2006年隨著ATI被收購而進(jìn)入AMD。
王啟尚具備極其豐富的圖形芯片設(shè)計、開發(fā)與管理經(jīng)驗(yàn),在AMD(ATI)眾多GPU產(chǎn)品的研發(fā)中起到了不可替代的領(lǐng)導(dǎo)作用,尤其是RDNA系列GPU架構(gòu),以超高能效而聞名。
↑↑↑王啟尚
——HYPR-RX:一鍵開啟大禮包
AMD Adrenalin驅(qū)動軟件中提供了豐富、強(qiáng)大的功能,但事實(shí)上,很多游戲玩家拿到卡之后直接就開始玩了,很少會去仔細(xì)研究一些特別的功能會帶來什么樣的好處,造成浪費(fèi),也不利于發(fā)揮顯卡的全部實(shí)力和潛力。
為此,AMD開發(fā)了HYPR-RX,將Adrenalin驅(qū)動內(nèi)的多個功能與技術(shù)整合在一起,包括Radeon Boost性能加速、Radeon Anti-Lag抗延遲、RSR超分辨率等,可以一鍵開啟。
這樣,它們就能協(xié)同,由此能夠降低延遲也能提供相比原來設(shè)置最高達(dá)85%的更強(qiáng)性能。
該功能預(yù)計2023年上半年正式上線,目前僅支持RX 7000系列顯卡,暫時不會支持RX 6000系列或更老的型號。
——FSR:從超分辨率到補(bǔ)幀
截止10月底,AMD FSR超分辨率技術(shù)已經(jīng)獲得超過216款游戲的支持,其中85款已支持FSR 2。
FRS技術(shù)的下一個版本是FSR 2.2,重點(diǎn)進(jìn)一步改善了畫質(zhì),比如減少快速移動物體的重影。
它和FSR 2.1/2.0同樣基于時域放大算法,不需要依靠AI或者專用的AI硬件,就可以實(shí)現(xiàn)出色的畫質(zhì)和性能。
據(jù)介紹,AMD和3DMark所屬公司UL Solutions也有很好的合作。目前,3DMark有針對NVIDIA DLSS和Intel XeSS的功能進(jìn)行測試,正在擴(kuò)展功能測試項(xiàng)目,其中就會包括一項(xiàng)專門針對AMD FSR的測試,它將使用FSR 2.2幫助用戶在他們的硬件上進(jìn)行FSR的性能和圖像質(zhì)量的對比。
王啟尚透露,在縮放技術(shù)上,AMD的下一個重大版本將是FSR 3,支持AMD Fluid Motion Frame補(bǔ)幀技術(shù),預(yù)計可帶來比FRS 2最多2倍的幀率,技術(shù)上會有很大的優(yōu)勢。
FSR 3技術(shù)預(yù)計將在2023年推出,更多細(xì)節(jié)會在后續(xù)出。
從目前的情況看,筆者認(rèn)為AMD FSR 3不再是傳統(tǒng)的超分辨率縮放技術(shù),而是全新的幀生成技術(shù),通過AI計算、匹配直接在渲染幀之間插入新的幀,從而大幅提升幀率,并保持同樣甚至更好的畫質(zhì)。
這樣一來,F(xiàn)SR 3同樣也不會取代 FRS 2.x,而是并行發(fā)展,游戲也可以同時支持,讓玩家根據(jù)自己的需求和喜好來使用。
——多媒體:支持AV1、賽靈思AI助陣
多媒體一直是AMD GPU的強(qiáng)項(xiàng),視頻編解碼、媒體串流等方面每一代都有創(chuàng)新技術(shù)和應(yīng)用。
RDNA3架構(gòu)集成了全新的媒體引擎,支持AV1視頻編解碼,其內(nèi)部的頻率也增加了1.8倍,所以基本上能夠?qū)⒁恍┚幋a和解碼的時間相比上代節(jié)省一半。
AMD還在其中集成了賽靈思開發(fā)出的內(nèi)容自適應(yīng)機(jī)器學(xué)習(xí)技術(shù),能夠提升文本內(nèi)容在編碼解碼時的質(zhì)量,目前只適用Windows 11上的DX應(yīng)用程序,且目前它的分辨率只支持1080p分辨率及以下。不過王啟尚表示,未來將繼續(xù)加強(qiáng)該技術(shù)并擴(kuò)展至比較高的分辨率。
該技術(shù)是AMD高級媒體框架(AMF)的一部分,基于著色器,改進(jìn)編碼時文本的質(zhì)量,不過僅支持Windows 11 DX應(yīng)用,且最高支持分辨率為1080p。
王啟尚還詳細(xì)介紹了AMD的兩種串流新技術(shù),都集成在AMD錄制與直播中。
一是“串流預(yù)分析”(Pre-Analysis),可以分析視頻幀中每個區(qū)塊(block)的時間活動和空間復(fù)雜性,并提取其他視頻屬性,比如場景變化、靜態(tài)場景、運(yùn)動強(qiáng)度等。
根據(jù)所使用的前向緩沖區(qū)的深度,該技術(shù)可以在實(shí)際編碼之前,分析最多達(dá)40幀畫面,讓編碼器提前得知未來幀的特征,從而采取主動行動,提升視頻畫面質(zhì)量。
此外,它還可以提高編碼效率,為視頻流中與其他塊有著更高相關(guān)性的塊提供更多的碼率。
還有“串流預(yù)濾波”(Pre-Filtering),一個低通感知保邊濾波器,可以去除幀畫面中視覺上不重要的細(xì)節(jié),而過濾強(qiáng)度可以根據(jù)視頻內(nèi)容、目標(biāo)碼率自適應(yīng),最終能在同等碼率下實(shí)現(xiàn)更高質(zhì)量的編碼。
——功耗:專注每瓦性能、小芯片設(shè)計有個最大優(yōu)勢
性能之外,用戶對于CPU處理器、GPU顯卡的功耗問題越來越重視,畢竟,節(jié)能減排是社會大趨勢,是綠色可持續(xù)發(fā)展的根本。在這方面,高能效的RDNA架構(gòu)正好契合。
王啟尚表示,提高性能以滿足不斷增長的現(xiàn)代游戲需求是當(dāng)下、未來的重點(diǎn),需要不斷改進(jìn)芯片的設(shè)計和架構(gòu),但是提高性能的時候,一定又會產(chǎn)生更多的功耗,所以必須思考如何改變核心架構(gòu)。
RDNA3就充分體現(xiàn)了AMD在能效即每瓦性能上所花費(fèi)的大量心思,在RDNA2 提高54%的基礎(chǔ)上,再一次提高了54%,顯示了AMD有能力、有決心繼續(xù)打造更節(jié)能、更安靜、更低溫的顯卡。
比如RX 7900 XTX,對比上代RX 6950 XT,提供了大幅提高的性能和大量的新體驗(yàn),但功耗只增加了25W。
更進(jìn)一步,AMD在設(shè)計RX 7900系列顯卡時,選擇了性能、功耗的更佳平衡點(diǎn),希望帶來更有能效的顯卡,不需要額外的轉(zhuǎn)接頭,兩個標(biāo)準(zhǔn)的8針電源接口即可供電。
而說到功耗控制,就繞不開制造工藝,其越先進(jìn),就可以帶來越好的能效。
RX 7900系列使用的是臺積電5nm制造工藝,而競品RTX 40系列使用的是所謂臺積電4N。
對此,王啟尚表示,AMD和臺積電在制造工藝優(yōu)化方面有著很深的合作關(guān)系,RX 7900系列基于AMD與臺積電合作開發(fā)且調(diào)優(yōu)的5nm工藝,具有更高的功率、性能和更小面積。
對其他廠商可能使用市場叫法來命名其5nm制程工藝,王啟尚表示不發(fā)表任何評論。
此外,RX 7900系列第一次引入了chiplet小芯片設(shè)計,就像AMD銳龍、霄龍?zhí)幚砥髯龅哪菢印?/p>
王啟尚提出,chiplet設(shè)計的最大優(yōu)勢,就是便于選擇使用最合適的制造工藝完成適當(dāng)?shù)墓ぷ鳎热缬嬎愫诵氖褂帽容^昂貴的5nm工藝,實(shí)現(xiàn)出色的每瓦性能,I/O核心、Infinity Cache高速緩存則使用成熟的6nm工藝,最終在每個價位上實(shí)現(xiàn)更強(qiáng)的性能。
——競爭:RX 7900 XTX的真正對手是它!
有趣的是,我們的第一反應(yīng)是RX 7900 XTX要競爭RX 4090,不過王啟尚表示,從市場定價來講,RX 7900 XTX對標(biāo)RTX 4080是更合適的,有著額外的8GB GDDR6顯存、更寬的384-bit位寬、領(lǐng)先的DisplayPort 2.1技術(shù)等。
順帶一提,王啟尚還確認(rèn),RX 7900系列顯卡沒有著色器執(zhí)行重排序(SER)。
在他看來,在光線追蹤的實(shí)現(xiàn)中,將光線遍歷和光線著色混合在一起是沒有必要的。他表示:“你可以看到從RDNA 2到RDNA 3,在光追上面的比較,在性能上面其實(shí)有很大的進(jìn)步,所以我們覺得這樣混在一起對我們架構(gòu)來說是沒有必要的。”
如果遍歷的速度很快,而著色成本又很高,那么這種做法顯然是十分有效的,可以提高著色的利用率,并分別處理遍歷與著色的需求。
可以說,RDNA3是王啟尚帶領(lǐng)團(tuán)隊(duì)親手培育養(yǎng)大的又一個好孩子,從種種設(shè)計和特性來看已經(jīng)展現(xiàn)出了不俗的實(shí)力,更加讓我們期待它解禁上市后秀出真正的實(shí)力。
尤其是在各種高端芯片產(chǎn)品功耗不斷膨脹的情況下,RDNA3依然有著如此出色的能效,以更小的代價實(shí)現(xiàn)更好的性能,帶來更好的體驗(yàn),值得整個行業(yè)思考和借鑒。
↑↑↑王啟尚手持RX 7900 XTX
文章來源:快科技