一、摩爾線程MTT S80顯卡介紹
國(guó)內(nèi)的新興GPU廠商摩爾線程在今年3月份推出了第一款國(guó)產(chǎn)GPU“蘇堤”。
時(shí)隔七個(gè)月,摩爾線程帶來了第二款多功能GPU“春曉,以及基于這款GPU打造的MTT S80游戲顯卡。
它內(nèi)置圖形渲染引擎、多媒體引擎、AI計(jì)算加速,以及物理仿真與科學(xué)計(jì)算引擎,以滿足更加廣泛和不同平臺(tái)的多元算力需求 ,是一個(gè)全能型的GPU,并且這是業(yè)內(nèi)首款支持PCI-E 5.0的顯卡。
今天,我們就來體驗(yàn)一下這款用國(guó)產(chǎn)GPU打造的MTT S80游戲顯卡。
從公司的官方介紹得知,摩爾線程成立于2020年10月,相當(dāng)年輕,但他們的核心成員均來自NVIDIA,以及微軟、Intel和AMD等科技公司的技術(shù)人員。
所以這是一支“覆蓋GPU研發(fā)設(shè)計(jì)、生產(chǎn)制造、市場(chǎng)銷售、服務(wù)支持等完整架構(gòu)的成熟團(tuán)隊(duì)”,并且去年11月宣布了20億元的A輪融資。
MTT S80是摩爾線程基于“春曉”GPU打造的游戲顯卡,這是業(yè)界首款配備PCIe 5.0接口的同類產(chǎn)品。
GPU頻率為1.8GHz,配備256bit/16GB的GDDR6顯存,顯存?zhèn)鬏斔俾?4Gbps,顯存帶寬為448 GB/s;配置了一個(gè)8Pin外接供電接口。
“春曉”GPU采用7nm工藝生產(chǎn),集成220億個(gè)晶體管,擁有4096個(gè)可編程MUSA核心和128個(gè)專用張量計(jì)算核心,內(nèi)置MUSA架構(gòu)通用計(jì)算核心以及張量計(jì)算核心,可以支持FP32、FP16和INT8等計(jì)算精度,不像其他廠商那樣在游戲顯卡上閹割半精度浮點(diǎn)能力 ,不僅為游戲玩家提供強(qiáng)大的的3D渲染能力,還可以為學(xué)生和研究人員等提供在人工智能、通用計(jì)算和多媒體處理等方面的完整GPU能力。
摩爾線程表示,新款GPU在1.8GHz的主頻下,能夠提供14.4TFLOPS的單精度浮點(diǎn)算力,圖形渲染能力方面較“春曉”平均提升3倍;編碼能力提升4倍,解碼能力提升2倍;AI計(jì)算加速平均提升4倍,物理仿真計(jì)算性能提升2.5倍。此外,摩爾線程還引入了新技術(shù)支持窄帶高清,節(jié)約30%以上的帶寬。
除了基礎(chǔ)的圖形圖像渲染和視頻編解碼功能之外,MTT S80還能夠提供完整的AI訓(xùn)練和推理、通用計(jì)算、GPU虛擬化、安卓容器云加速等功能。
“春曉”GPU里面的128個(gè)張量計(jì)算核心,對(duì)摩爾線程自研的TensorX推理引擎提供了完整支持,使其可以在AI和通用計(jì)算等應(yīng)用中展現(xiàn)出強(qiáng)大性能。
實(shí)際應(yīng)用當(dāng)中,MTT S80可支持PyTorch、TensorFlow、百度飛槳(PaddlePaddle)等多種主流深度學(xué)習(xí)框架,并實(shí)現(xiàn)了對(duì)數(shù)十種深度學(xué)習(xí)算法的加速。
MTT S80顯卡提供了三個(gè)DisplayPort 1.4a接口和一個(gè)HDMI 2.1接口,支持8K@30Hz視頻或1080P@360Hz高刷新率的顯示輸出。
內(nèi)置的MUSA智能多媒體引擎2.0能夠提供AV1、H.265、H.264、VP9等主流編碼格式的硬件編碼、解碼功能,為視頻編輯、視頻直播、多人視頻會(huì)議場(chǎng)景提供更多并行路數(shù)、更高分辨率、更高幀率的硬件編碼能力,可以極大的節(jié)省CPU的負(fù)載。
憑借MTT S80,讓摩爾線程成為國(guó)內(nèi)首家支持Windows環(huán)境和DirectX圖形接口的GPU公司,驅(qū)動(dòng)程序里已內(nèi)置MUSA DirectX Driver模塊,并完成對(duì)數(shù)十款主流游戲的適配,同時(shí)還對(duì)Vulkan、OpenGL、OpenGL ES等主流圖形接口提供支持。
摩爾線程MTT S80顯卡介紹
摩爾線程MTT S80的外形識(shí)別度挺高的,外觀追求極簡(jiǎn)設(shè)計(jì),裝飾甚少。
顯卡上兩個(gè)8cm的風(fēng)扇夾著中間一把小一點(diǎn)的7cm風(fēng)扇,采用11葉高風(fēng)量葉片,支持智能調(diào)速,風(fēng)扇中央的三角形標(biāo)志就是摩爾線程的Logo。
散熱器的整流罩是磨砂面的,出風(fēng)口在上下兩側(cè),整卡尺寸為286 x 111 x 49 mm,以顯卡的標(biāo)準(zhǔn)來說的話不算大。
背面則有金屬背板加固防止顯卡彎曲,并且提供一定的散熱能力,而且顯卡尾巴是有開孔的,這部分也沒有PCB,能讓散熱器的第三吧風(fēng)扇風(fēng)流能直接吹透散熱鰭片,使其散熱效能得到充分的體現(xiàn),進(jìn)一步降低顯卡的工作溫度。
顯卡提供了三個(gè)DisplayPort 1.4a接口和一個(gè)HDMI 2.1接口,比較有趣的是顯卡的擋板是完全封死的,完全不透風(fēng),在近些年的顯卡設(shè)計(jì)中比較少見,只有AMD公版卡會(huì)這樣做。
不過顯卡散熱鰭片布置是縱向而不是橫向的,即使開孔也只會(huì)有少量的風(fēng)從這個(gè)位置出來,對(duì)散熱提升有限,而且這樣設(shè)計(jì)有助于提高擋板強(qiáng)度,從這個(gè)角度來看的話,顯卡厚度比雙槽略微多一點(diǎn)點(diǎn)。
供電口位于顯卡尾部,這個(gè)口不是PCIe的8pin口,而是EPS 12V 8pin,也就是CPU用的8pin口,理論上可以提供300W的電力,比常規(guī)的PCIe 8pin口高一倍,帶動(dòng)TGP只有255W的MTT S80完全不是問題。
不過由于預(yù)留給卡扣的空間不大,那種4+4的CPU供電口是插不進(jìn)去的, 原生的8pin線可以,當(dāng)然有些電源可能會(huì)不夠CPU供電線用,所以摩爾線程配了一根轉(zhuǎn)接線,可以用兩個(gè)PCI-E 8pin口來為這塊顯卡供電。
二、顯卡拆解:PCB精悍、供電散熱強(qiáng)悍
拆開顯卡后,我們發(fā)現(xiàn)顯卡的PCB其實(shí)只有整卡長(zhǎng)度的一半多一點(diǎn), 而供電接口是由固定在背板的延長(zhǎng)線延伸至顯卡尾部的。
供電布置也很有意思,GPU核心供電是顯卡頂部中央4相加顯卡右下角那兩相,顯存供電則是PCB頂部?jī)蓚?cè)各一相,這6+2相供電全部使用Alpha & Omega的AOZ5311NQI,最大持續(xù)電流為55A,10毫秒內(nèi)峰值電流可達(dá)80A,10微秒內(nèi)峰值電流則達(dá)到120A。
“春曉”GPU的核心代號(hào)為SD102AA-500,核心面積還蠻大的,四周圍繞著8顆三星的GDDR6顯存,組成256bit/16GB的規(guī)格,顯存型號(hào)是K4ZAF325BM-HC16,這其實(shí)是16Gbps的顯存,現(xiàn)在只跑在14Gbps,未來開放超頻的話顯存是有一定提升空間的。
MTT S80顯卡所用的散熱器規(guī)格還是很大的,和GPU接觸的是散熱器的純銅底座,而且散熱器也有照顧到顯存與供電MOS,能有效降低這些元件的工作溫度,讓它們能穩(wěn)定的工作。
散熱器用了4根6mm直徑熱管,連通大量鍍鎳鋁制鰭片,配合兩個(gè)8cm風(fēng)扇和一個(gè)7cm風(fēng)扇,對(duì)于一張TBP只有255W的顯卡來說已經(jīng)是非常高的規(guī)格了。
三、理論性能測(cè)試
這次之所以說是體驗(yàn)而不是評(píng)測(cè),是因?yàn)槟壳八麄兲峁┑娘@卡驅(qū)動(dòng)還不算完善。雖然他們用兩年多的時(shí)間就把GPU和顯卡做出來確實(shí)是非常強(qiáng)的一支團(tuán)隊(duì),但顯卡驅(qū)動(dòng)的編寫與游戲引擎的適配還需要有很長(zhǎng)一段路要走,所以我們今天只是跑一些能跑的測(cè)試項(xiàng)目,而傳統(tǒng)顯卡測(cè)試的3DMark跑分和游戲測(cè)試這次大家基本看不到了。
測(cè)試平臺(tái)基于酷睿i7-12700K處理器打造,配置總?cè)萘繛?6GB(8GB*2)的DDR4-3600內(nèi)存,主板是配套銷售的華碩TUF GAMING B660M-PLUS D4,由于測(cè)試項(xiàng)目需要分別在Windows 10和Ubuntu兩個(gè)系統(tǒng)下運(yùn)行,所以準(zhǔn)備了兩套系統(tǒng)。
MTT S80顯卡的中央風(fēng)扇以及背板開孔處是有氛圍燈的,顏色是摩爾線程的橙色,為顯卡添加信仰。
先來看看在Ubuntu系統(tǒng)跑的測(cè)試。
摩爾線程MTT S80顯卡的顯存帶寬我們測(cè)出來有370.5GB/s,高于RTX 3060,畢竟是256bit顯存位寬的對(duì)192bit,顯存頻率雖然低一點(diǎn),但總帶寬上還是有優(yōu)勢(shì)的。
MTT S80顯卡的單精度浮點(diǎn)算力有13.9TFLOPS,比RTX 3060要高一些,可見這GPU的定位確實(shí)是直指GA106的。
我們使用OCL Bandwidth Test來測(cè)試了PCI-E接口的帶寬,采用PCI-E 5.0 x16的MTT S80顯卡下行帶寬28.7GB/s,上行帶寬打到42.8GB/s,比還是用PCI-E 4.0 x16的RTX 3060高得多。
上面三個(gè)都是OpenGL的測(cè)試,目前來說由于驅(qū)動(dòng)的關(guān)系,MTT S80在這些項(xiàng)目的性能表現(xiàn)還不盡人意,部分測(cè)試和RTX 3060差距有點(diǎn)大。
然后就是大家比較熟悉的Windows 10系統(tǒng)。
從3DMark06的紋理填充測(cè)試來看,MTT S80在單紋理填充性能上是要遠(yuǎn)高于RTX 3060的,但在多紋理填充性能上則比RTX 3060略低一些,可以看得出這兩個(gè)GPU的側(cè)重點(diǎn)不一樣。
但實(shí)際跑分結(jié)果就沒有這么好看了,還有很大提升空間,4K分辨率下差距略微少一點(diǎn),這也可以看得出摩爾線程現(xiàn)在的顯卡驅(qū)動(dòng)優(yōu)化還沒到位,顯卡的性能沒有得到充分發(fā)揮。
我們也使用Fillrate Tester測(cè)試了顯卡的紋理填充性能,數(shù)值上和3DMark06有一定出入,但趨勢(shì)是一樣的,MTT S80的紋理填充率遠(yuǎn)高于RTX 3060。
MTT S80可以運(yùn)行Unigine Valley v1.0測(cè)試的DX9和DX11模式,所以我們都跑了,但幀率大幅低于RTX 3060,摩爾線程的驅(qū)動(dòng)開發(fā)人員來說,還有許多工作要干。
四、實(shí)際游戲體驗(yàn)
目前摩爾線程公布出來MTT 80顯卡已適配的包括:《英雄聯(lián)盟》、《穿越火線》、《QQ飛車》、《QQ炫舞》、《夢(mèng)幻西游》、《起凡群雄逐鹿》、《勁舞團(tuán)》、《跑跑卡丁車》、《暗黑破壞神III》32bit、《終極街霸IV》、《圍攻》、《我的世界》以及《極品飛車:熱力追蹤III》,還有超過60款可運(yùn)行的游戲。
我們?cè)谄渲刑暨x了幾款跑了下。
《英雄聯(lián)盟》運(yùn)行正常,在1080p分辨率最高設(shè)置下能平均幀跑到149fps,在4K分辨率下能跑到128fps,很明顯在1080p下顯卡的性能發(fā)揮不完全。
《穿越火線》運(yùn)行也正常,在最高設(shè)置下1080p的平均幀率是182fps,4K分辨率下是165fps,流暢度有保障。
《QQ飛車》由于游戲鎖幀,所以在1080p和4K下都是40fps滿幀率運(yùn)行。
《街霸IV》在最高設(shè)置下1080p的平均幀率是104pfs,4K分辨率則是87fps,這游戲本身是鎖60fps的,所以MTT S80可以在4K最高畫質(zhì)下提供這游戲最流暢的游戲體驗(yàn)。
《最終幻想14:天堂之劍》不是已適配游戲,但在可運(yùn)行游戲列表內(nèi),我們跑了下它的Benchmark,它DX9和DX11模式都能跑,但是有貼圖錯(cuò)誤和顏色渲染錯(cuò)誤,整個(gè)畫面非常奇怪,1080p的幀數(shù)是47.2fps,4K則是43.1fps。
整體來看,4K分辨率下摩爾線程MTT 80顯卡有更好的發(fā)揮,而1080p分辨率并不能很好的體現(xiàn)顯卡的性能。
五、視頻編碼解碼測(cè)試
上面的視頻編碼轉(zhuǎn)碼測(cè)試都是在Ubuntu系統(tǒng)里面跑的,由于測(cè)試腳本使用的編碼器是摩爾線程專用的,所以沒有對(duì)比。
我們用MTT S80并行處理50路的視頻,轉(zhuǎn)碼則是20路,每項(xiàng)測(cè)試的總fps都很高,顯卡內(nèi)置的媒體引擎性能非常強(qiáng)。
在Windows系統(tǒng)里面我們可以用自帶的“電影與電視”播放一個(gè)8K 30fps的HEVC 8bit編碼視頻,從任務(wù)管理器來看摩爾線程MTT 80顯卡的視頻解碼器還沒滿載,對(duì)于顯卡來說還是很輕松的,不過8K@30Hz也是這款顯卡的解碼上限,再高幀率的話就不行了。
目前Windows系統(tǒng)已經(jīng)適配顯卡的H.264、H.265、VP9解碼,AV1目前僅在Linux系統(tǒng)上支持,Windows系統(tǒng)還有待驅(qū)動(dòng)更新。
六、溫度與功耗測(cè)試
顯卡功耗測(cè)試使用的是NVIDIA提供的PCAT工具,可以精確測(cè)量顯卡PCIe與外接電源接口的實(shí)際功率。
但目前MTT S80顯卡 在WIndows下跑不了Furmark,目前觀測(cè)到GPU負(fù)載最高的是Unigine Valley,但GPU負(fù)載也就90%左右。
此外,MTT S80暫時(shí)還沒提供功耗控制功能,所以目前待機(jī)時(shí)GPU頻率降不下去,導(dǎo)致待機(jī)功耗非常高。
此功能還在測(cè)試中,未來會(huì)增加到顯卡上,實(shí)現(xiàn)不同應(yīng)用場(chǎng)景下的功耗狀態(tài)切換。
負(fù)載時(shí)摩爾線程MTT S80的平均功耗是210.5W,而峰值功耗240.4W,待機(jī)時(shí)的平均功耗則是114.6W, 這待機(jī)是絕對(duì)有問題的,負(fù)載時(shí)顯卡溫度不過57℃,溫度非常低,當(dāng)然此時(shí)GPU沒有滿載,而待機(jī)溫度則是44℃。
七、兼容性有待提升未來可期
摩爾線程MTT 80顯卡的硬件是沒有問題的,從理論測(cè)試來看,顯卡的像素填充率和紋理填充率遠(yuǎn)高于RTX 3060,單精度浮點(diǎn)算力和顯存帶寬也比RTX 3060更高,也是目前唯一的PCIe 5.0顯卡,可以提供遠(yuǎn)超現(xiàn)在主流顯卡的接口帶寬,顯卡的多媒體引擎現(xiàn)在也可以提供最高8K 30fps視頻解碼,“春曉”GPU的實(shí)力確實(shí)過硬。
但現(xiàn)在顯卡的驅(qū)動(dòng)還不成熟,整體還有待優(yōu)化,實(shí)際游戲中的表現(xiàn)和中高端GPU還有差距,現(xiàn)在的驅(qū)動(dòng)還沒發(fā)揮出GPU一半的實(shí)力,所以驅(qū)動(dòng)方面的改進(jìn)是目前摩爾線程首要工作,當(dāng)然更重要的是對(duì)游戲的適配性。
從我們的測(cè)試來看,MTT 80對(duì)DX9的游戲基本都能運(yùn)行,但不在適配名單內(nèi)的游戲運(yùn)行起來可能會(huì)有貼圖錯(cuò)誤,而DX10、DX11、DX12的游戲目前問題比較多,所以顯卡驅(qū)動(dòng)目前最優(yōu)先的是游戲的兼容性。
目前顯卡已經(jīng)支持超過60款游戲的運(yùn)行,隨著未來驅(qū)動(dòng)的改善,游戲支持?jǐn)?shù)量會(huì)增加得與來越快。
顯卡的多媒體引擎是支持持AV1、H.265、H.264等主流格式的編碼或解碼,最高支持到8K分辨率的視頻,現(xiàn)在已經(jīng)兼容主流視頻應(yīng)用和瀏覽器調(diào)用MTT S80進(jìn)行硬件解碼,我們實(shí)際測(cè)試它可以流暢播放8K@30Hz的H.265視頻。
當(dāng)然了編碼方面現(xiàn)在還得軟件適配才行,現(xiàn)在摩爾線程已經(jīng)在和剪映合作,估計(jì)很快就會(huì)提供對(duì)應(yīng)的適配。
“春曉”GPU內(nèi)是有128個(gè)張量計(jì)算核心的,可應(yīng)用在AI訓(xùn)練方面,比如摩爾線程未來會(huì)上線MT馬良AIGC平臺(tái)。
它是一個(gè)AI作畫工具,在發(fā)布會(huì)上他們也實(shí)際展示過,可支持中英文代碼生成圖片、簡(jiǎn)筆畫創(chuàng)作、圖片超分等功能,創(chuàng)作者可以根據(jù)自己的需求生成插畫,是一個(gè)非常方便的AI實(shí)際應(yīng)用,未來還會(huì)有更多AI應(yīng)用會(huì)適配摩爾線程的MUSA架構(gòu)。
總的來說,摩爾線程MTT 80硬實(shí)力是有的,兩年就做出這種性能的GPU出來摩爾線程的努力和實(shí)力值得肯定,但目前驅(qū)動(dòng)還遠(yuǎn)沒到理想狀態(tài),還有很大提升空間,可以期待它未來驅(qū)動(dòng)優(yōu)化好后的表現(xiàn)。
文章來源:快科技