ARM公司供稿 您可能會(huì )發(fā)覺(jué)每年到了這個(gè)時(shí)候,我們都會(huì )開(kāi)始討論最新的高端GPU。2017年也不例外,ARM Mali團隊宣布Mali-G72加入高端GPU產(chǎn)品系列。 2017年高級移動(dòng)設備GPU 跟隨去年Mali-G71的腳步,ARM今年在Computex2017 大會(huì )上發(fā)布了基于Bifrost 架構的Mali-G72,在更小面積與更低功耗的基礎上,提供更強大的效能。Mali-G72不僅能應用到高保真手機游戲以及機器學(xué)習設備,還能將VR能力提升至全新境界。采用Mali-G72的設備,整體圖形性能是前一代的1.4倍,無(wú)論業(yè)界要推出多么炫酷的應用,Mali-G72都已做好準備迎接挑戰。 • Mali-G72 的亮點(diǎn): o 相較現有產(chǎn)品,設備性能提升40% o 能效提升25%,芯片面積效能提升20% o 機器學(xué)習效率提升17% o 眾多針對Bifrost的優(yōu)化,包括緩沖記憶、區塊拓展性,L1 緩存尺寸 ![]() 高保真移動(dòng)游戲崛起 移動(dòng)端設備高保真游戲的崛起是催生Mali-G72的重要力量。盡管《糖果傳奇》(Candy Crush)等簡(jiǎn)單游戲仍有龐大市場(chǎng),但復雜的游戲卻也在不斷地創(chuàng )收,中國移動(dòng)游戲產(chǎn)業(yè)43%的收入都是由此而來(lái)。例如Digital Legends公司的個(gè)人射擊游戲《電磁風(fēng)暴》(Afterpulse),在過(guò)去是不可能出現在移動(dòng)平臺上的。高頂點(diǎn)數所需的耗電量、眾多圖形命令、更復雜的頂點(diǎn)與像素著(zhù)色器,以及諸如動(dòng)態(tài)陰影等先進(jìn)的圖形效果,對于過(guò)去而言,實(shí)在是要求過(guò)高,且會(huì )降低質(zhì)量與游戲時(shí)間。我們與生態(tài)系統內的伙伴和開(kāi)發(fā)商共同探討,通力合作,確保我們的產(chǎn)品能滿(mǎn)足他們的不同需求。ARM與Digital Legends的合作能支持最新的圖形技術(shù),并搭配ARM的優(yōu)化工具以實(shí)現效能與效率最大化,與Mali-G71相比,Mali-G72寫(xiě)入帶寬可節省42%。加上使用像素本地儲存(PLS),可以再額外節省45%,讓整體寫(xiě)入帶寬一舉節省68%。此類(lèi)合作造就了Mali-G72的各種創(chuàng )新,并讓移動(dòng)游戲商得以實(shí)現如《電磁風(fēng)暴》般的多功能游戲。 ![]() * Newzoo 對營(yíng)收排名前200名的游戲所進(jìn)行之研究 支持下一代虛擬現實(shí) 虛擬現實(shí)也在不斷發(fā)展,所以ARM 也要不斷精進(jìn)自己的技術(shù),在市場(chǎng)中繼續保有領(lǐng)先地位。超過(guò)50%現有的移動(dòng)VR設備由Mali驅動(dòng),而搭載Mali的Mate 9,是市面上第一個(gè)取得Daydream平臺認證的VR設備之一,因此,我們首要任務(wù)是繼續推動(dòng)創(chuàng )新。你或許曾見(jiàn)過(guò)ARM最近在2017 游戲開(kāi)發(fā)者大會(huì )(GDC)中發(fā)布的Circuit VR展示,我們正致力開(kāi)發(fā)移動(dòng)Multiview等技術(shù),以降低多次繪制同一圖形的額外負擔–就如同你通常會(huì )在VR環(huán)境中做的事一樣(實(shí)際上你的兩只眼睛需要一個(gè)完整的渲染繪制)。另外還要加上注視點(diǎn)渲染技術(shù),也就是你只會(huì )看見(jiàn)與視網(wǎng)膜在一直線(xiàn)上的高解析影像,而當你突然需要渲染繪制四個(gè)或更多視野時(shí),Multiview就真正派上用場(chǎng)了。其他像多重采樣抗鋸齒(MSAA)等技術(shù)則會(huì )讓線(xiàn)條的某一邊增加融入像素,使其看起來(lái)比較平滑,以降低VR頭盔在近距離空間內偶爾會(huì )看到的鋸齒效果。Mali-G72在最低的效能成本下,可達成8倍或16倍的MSAA。上述所提,當然是基于現存的創(chuàng )新科技,包括全調適紋理壓縮技術(shù)(ASTC),讓我們能整合高質(zhì)量的紋理,且不需要與帶寬進(jìn)行妥協(xié)。 ![]() 優(yōu)化設備上的機器學(xué)習 如前所述,機器學(xué)習也是另一關(guān)鍵移動(dòng)的使用案例,如今,機器學(xué)習通常在云端上進(jìn)行,運用訓練神經(jīng)網(wǎng)絡(luò )的大量數據集實(shí)現智能連接,但越來(lái)越多的數據也需要在設備端進(jìn)行,比如像翻譯這樣的簡(jiǎn)單任務(wù),通過(guò)云端持續傳送大量數據,不但增加成本,而且速度也很慢。我希望智能手機能在我需要的時(shí)候干我所想;如果連接或數據傳送需要等很長(cháng)時(shí)間,那么這個(gè)設備再好我也不太想用,這也是為何業(yè)界開(kāi)始研究“將機器學(xué)習界面放到設備本身”的原因。華為已預料到會(huì )有這種需求,以飛快的速度在八個(gè)月內推出搭載Mali-G71的Mate 9。在這款手機上,機器學(xué)習算法會(huì )找出你最常用的應用程序,,并對其能耗性能進(jìn)行優(yōu)先設置,保證實(shí)現最優(yōu)性能;贐ifrost架構的Mali-G71已經(jīng)相當擅長(cháng)機器學(xué)習界面,如下圖表- 華為Mate 9搭載Mali-G71 MP8在執行AlexNet時(shí),比具有類(lèi)似圖形性能的低階獨立顯卡還要快上87%。 而Mali-G72性能更好,我們之前討論的算法優(yōu)化及增加的高速緩存已經(jīng)非常成熟,借由此大幅降低帶寬,Mali-G72可以實(shí)現機器學(xué)習最大的效率與效能。我們是如何實(shí)現的呢? ![]() Bifrost 架構的創(chuàng )新 除了繼續保持Bifrost最主要的高效能特色,像是CPU與GPU彼此間完整的系統一致性、索引式定位著(zhù)色器等,Mali-G72同時(shí)還有多項新武器。優(yōu)化算法效率以及強化復雜的圖形性能與可擴展性,讓Mali-G72 成為明年橫跨智能手機、虛擬現實(shí)、機器學(xué)習與其它高端移動(dòng)產(chǎn)品中的最佳選擇?纯碅RM實(shí)際上在其中做了哪些改進(jìn)? ARM增加了區塊緩沖存儲器(tile buffer memory),以便讓GPU在每個(gè)運行區塊(tile)支持更多的儲存空間。這可在輕負載情況下提升數據吞吐量,也讓多重采樣抗鋸齒(MSAA, Multi Sample Anti-Aliasing)與像素本地儲存(PLS, Pixel Local Storage) 技術(shù)獲得更佳的利用率,同時(shí)也顯著(zhù)提升效能與視覺(jué)質(zhì)量。我們也重新平衡了執行引擎的數據路徑,以移除某些鮮少使用的指令,并以更簡(jiǎn)單的指令順序取而代之,以便降低使用面積與耗電,為我們的合作伙伴降低實(shí)施成本,并提升整套系統的效率。為了支持更高的圖形復雜性,ARM已針對更多復雜運算進(jìn)行優(yōu)化,例如最頻繁使用的互反平方根,并增加區塊的緩存以加速數據存取。這些改變能改善高效能系統的性能擴展能力,同時(shí)也提供終端使用者更佳的圖形體驗。為了進(jìn)一步降低帶寬,ARM同時(shí)增加了一級緩存與寫(xiě)回緩存的大小,同時(shí)也改變指令緩存邏輯,以便在不增加整體面積與耗電情況下進(jìn)行更佳利用,并減少對復雜內容產(chǎn)生的緩存遺漏情況。對于合作伙伴而言,如此細心地在效能與效率間取得平衡,對某些應用是極為重要的。 ![]() 總結 比起前一代產(chǎn)品,這款基于Bifrost架構的Mali-G72實(shí)現了多種創(chuàng )新,包括效能提升25%、每平方毫米的芯片面積效能提升20%,以及機器學(xué)習效率提升17%。除此之外,它還能讓整體設備效能提升40%。Mali-G72在明年高端智能手機的表現超出預期已指日可待。 ![]() |
image006.jpg (34.56 KB)