功效比超高的DXTP GPU IP將為圖形計算與邊緣AI應用SoC的創(chuàng )新提供巨大的幫助 作者:北京華興萬(wàn)邦管理咨詢(xún)有限公司 翔煜 商瑞 Imagination于不久前正式發(fā)布了DXTP GPU IP,這款新產(chǎn)品的亮點(diǎn)在于,在標準圖形工作負載下,其能效比(FPS/W)相比前代產(chǎn)品實(shí)現了高達20%的提升。作為GPU IP行業(yè)的領(lǐng)導者,截至2023年的公開(kāi)數據顯示,搭載Imagination IP授權的芯片累計出貨量高達110億顆。這些芯片廣泛應用于移動(dòng)設備(包括智能手機)、汽車(chē)、消費電子產(chǎn)品和電腦等多個(gè)領(lǐng)域。 此次功效得到大幅提升的DXTP GPU的發(fā)布,正值在DeepSeek等大模型技術(shù)的推動(dòng)下,邊緣AI設備廣泛興起的產(chǎn)業(yè)轉型期,功效更高的GPU IP將為邊緣端側AI SoC的開(kāi)發(fā)提供巨大的支持。同時(shí),DXTP GPU也是Imagination繼不久前發(fā)布比鎖步和雙備份成本低很多的、已獲得ASIL-B認證的GPU分布式功能安全機制后又一個(gè)重大技術(shù)持續進(jìn)步。 ![]() 而回顧GPU的技術(shù)升級浪潮,可以發(fā)現Imagination始終以創(chuàng )新為核心動(dòng)力,在近幾年不斷推出具有突破性的IP產(chǎn)品,從根本上重塑了圖形計算和人工智能領(lǐng)域的發(fā)展藍圖。因此,本文以Imagination在GPU領(lǐng)域的持續創(chuàng )新為例,通過(guò)盤(pán)點(diǎn)該公司近年來(lái)在GPU技術(shù)領(lǐng)域內的創(chuàng )新,分析其長(cháng)期堅持的技術(shù)創(chuàng )新戰略,以及這一戰略與國內芯片設計公司在各個(gè)領(lǐng)域內協(xié)同創(chuàng )新的機會(huì ),共同探索如何成為行業(yè)引領(lǐng)者實(shí)現雙贏(yíng),支持國內芯片企業(yè)去實(shí)現更多的創(chuàng )新與突破。 Imagination:持續的技術(shù)創(chuàng )新助其成為GPU行業(yè)的引領(lǐng)者 2021年,Imagination推出了業(yè)界首款在移動(dòng)平臺上支持硬件光線(xiàn)追蹤的GPU IP——Imagination CXT GPU,這一創(chuàng )舉在移動(dòng)圖形處理領(lǐng)域具有里程碑意義。在CXT誕生之前,移動(dòng)設備受限于硬件性能和功耗等因素,圖形渲染的真實(shí)感和沉浸感遠不及桌面設備。 ![]() CXT通過(guò)引入Imagination開(kāi)發(fā)的PowerVR Photon架構的光線(xiàn)加速集群(RAC),成功解決了這一難題。RAC采用了先進(jìn)的光線(xiàn)處理算法,能夠高效處理光線(xiàn)的傳播、反射、折射和陰影計算等復雜操作。 ![]() CXT的光線(xiàn)追蹤技術(shù)能夠實(shí)時(shí)計算光線(xiàn)的傳播路徑,生成逼真的光影效果,使得游戲中的物體與場(chǎng)景之間的光影交互更加自然。此外,CXT在功耗控制方面也進(jìn)行了優(yōu)化。它采用了動(dòng)態(tài)功耗管理技術(shù),根據光線(xiàn)追蹤任務(wù)的復雜度自動(dòng)調整硬件資源的分配,在保證圖形質(zhì)量的同時(shí),盡可能降低能耗。這使得移動(dòng)設備在運行支持光線(xiàn)追蹤的游戲時(shí),不會(huì )因為功耗過(guò)高而導致發(fā)熱嚴重或續航時(shí)間大幅縮短,為移動(dòng)光線(xiàn)追蹤技術(shù)的普及奠定了堅實(shí)的基礎。 ![]() ![]() 2023年,Imagination推出新一代的IMG DXT GPU,在CXT GPU取得成功的基礎上,進(jìn)一步發(fā)展了光線(xiàn)追蹤技術(shù)。DXT GPU具備可擴展的光線(xiàn)追蹤功能,這一創(chuàng )新特性使廠(chǎng)商能夠根據不同的應用場(chǎng)景和設備性能需求,靈活調整光線(xiàn)追蹤的精度和復雜度。對于高端游戲和專(zhuān)業(yè)圖形設計領(lǐng)域,DXT能夠提供更高質(zhì)量的光線(xiàn)追蹤。在有復雜渲染需求的大型游戲中,DXT不僅可以實(shí)現全域光照效果,并且模擬真實(shí)世界中光線(xiàn)在場(chǎng)景中的多次反射和折射,使整個(gè)游戲場(chǎng)景更加明亮和自然。同時(shí),DXT上的擴展光線(xiàn)追蹤技術(shù)在專(zhuān)業(yè)圖形設計、建筑設計和影視特效制作等許多領(lǐng)域,可以幫助設計師實(shí)現更加真實(shí)的渲染效果和更加逼真的虛擬場(chǎng)景,提高成品質(zhì)量和視覺(jué)沖擊力。 ![]() ![]() Imagination在其DXT GPU中還加入了多項創(chuàng )新,例如“2D雙速率紋理映射”技術(shù),該技術(shù)能在同一時(shí)間處理兩種不同分辨率的紋理,通過(guò)智能切換紋理分辨率,在保證圖形質(zhì)量的同時(shí),顯著(zhù)提升紋理處理速度,減少內存帶寬占用。在復雜2D場(chǎng)景渲染中,例如手機游戲中的角色和場(chǎng)景繪制,它能根據畫(huà)面元素的遠近和重要程度,動(dòng)態(tài)調整紋理分辨率,近景和關(guān)鍵元素采用高分辨率紋理以呈現精細細節,遠景元素則使用低分辨率紋理,從而在不影響視覺(jué)效果的情況下,大幅提升渲染效率,優(yōu)化圖形處理性能。 ![]() 2023 年末,為了幫助桌面和數據中心客戶(hù)實(shí)現高性能的云端GPU創(chuàng )新解決方案,Imagination推出了DXD GPU IP。該款GPU的創(chuàng )新之處在于首次將Imagination的API覆蓋擴展至DirectX,這一舉措顯著(zhù)提升了DXD與Windows平臺上的應用程序和游戲的兼容性。同時(shí),Imagination 的硬件虛擬化技術(shù) HyperLane 在DXD中發(fā)揮了關(guān)鍵作用,該技術(shù)支持在單個(gè)GPU上安全且獨立地運行多達八個(gè)操作系統,這意味著(zhù)當 DXD部署在服務(wù)器中時(shí),能夠支持多達八個(gè)用戶(hù)同時(shí)進(jìn)行游戲,極大地提升了服務(wù)器的使用效率,降低了云游戲的運營(yíng)成本,并為云游戲行業(yè)的發(fā)展帶來(lái)了創(chuàng )新的運營(yíng)模式。 ![]() 時(shí)間來(lái)到2024年9月,針對全球汽車(chē)智能化的需求,Imagination推出了其算力最高可擴展至24 TOPS INT8的DXS系列GPU,該系列IP不僅為智能駕駛艙和先進(jìn)駕駛輔助(ADAS)等應用所需SoC帶來(lái)澎湃的算力,而且轉為諸如汽車(chē)處理器等對安全性要求極為嚴苛的應用,開(kāi)發(fā)了結合GPU的計算模式特點(diǎn)并大幅降低成本分布式功能安全機制(DSM),這為汽車(chē)和工業(yè)等越來(lái)越多需要GPU的圖形處理能力和計算能力的電子系統帶來(lái)了巨大的創(chuàng )新。 ![]() 通過(guò)引入DSM機制,Imagination DXS GPU能以比鎖步或者功能備份等功能安全機制小得多的資源開(kāi)銷(xiāo)實(shí)現ASIL-B級別的功能安全,這在降低了高昂的成本的同時(shí)還提升了效率。采用DSM分布式安全機制的DXS GPU已經(jīng)通過(guò)嚴格的ASIL-B認證,汽車(chē)SoC開(kāi)發(fā)商僅需增加大約10%的芯片面積就實(shí)現了功能安全,如果結合該公司的HyperLane硬件虛擬化技術(shù),還能大幅度提升這些汽車(chē)SoC的計算性能和效率。以自動(dòng)駕駛系統為例,DXS能夠實(shí)時(shí)、安全地處理海量的傳感器數據,而HyperLane則通過(guò)虛擬化技術(shù)隔離數據和處理過(guò)程,在確保系統的安全性和可靠性的同時(shí),為自動(dòng)駕駛芯片的創(chuàng )新提供了堅實(shí)的支持。 集大成的D系列收官之作:DXTP 融合創(chuàng )新服務(wù)端側AI 新推出的Imagination DXTP GPU是其D系列的巔峰之作,匯聚了前代產(chǎn)品的眾多優(yōu)點(diǎn)。它不僅繼承了DXT系列GPU的圖形處理能力和能效優(yōu)勢,例如“2D雙速率紋理映射”技術(shù),還融合了DXS系列的計算能力和能效優(yōu)勢,包括用于A(yíng)I加速的大容量本地內存。在能效方面,DXTP GPU表現出色,在常規圖形工作負載下,其功耗效率(FPS/W)比前一代產(chǎn)品DXT提升了高達20%。 在端側AI應用場(chǎng)景中,這一特性對主控SoC尤為關(guān)鍵。以智能家居為例,搭載DXTP的芯片可以利用大容量本地內存快速存儲和處理AI模型數據,用智能攝像頭去實(shí)時(shí)識別畫(huà)面中的人物、物體,還能借助DXTP的高性能計算能力對識別結果進(jìn)行快速分析,例如判斷是否有異常行為等,然后及時(shí)向用戶(hù)推送警報信息,極大提升了智能家居主控SoC的智能特性和響應速度。 DXTP GPU卓越的能源效率使其能夠在相同的功耗預算下實(shí)現更高的幀率(FPS),這使得下游相關(guān)方能夠在不影響電池續航的前提下,為終端用戶(hù)帶來(lái)更先進(jìn)的圖形處理體驗和計算功能。DXTP GPU為SoC芯片設計公司帶來(lái)兩個(gè)方面的創(chuàng )新:首先是“利用率”顯著(zhù)提升,它能將理論上的TFLOPS高效轉化為實(shí)際的FPS,實(shí)現了極高的效率,同時(shí)將功耗浪費降至最低。 其次是DXTP GPU提供了芯片資源使用靈活性,它能夠處理圖形或AI工作負載,或者同時(shí)處理這兩種計算需求,因此在A(yíng)I功能已成為智能手機等設備差異化競爭的焦點(diǎn)的今天,DXTP能夠支持在GPU上無(wú)需額外的芯片面積來(lái)專(zhuān)門(mén)用于A(yíng)I處理,也不會(huì )犧牲用戶(hù)界面或游戲體驗,這體現了對芯片資源的高效靈活利用。 搭載DXTP GPU的新一代SoC已在設計之中 DXTP GPU提供DXTP-48-1536和DXTP-64-2048兩種配置,兩款產(chǎn)品均已經(jīng)向芯片設計公司出售了授權,因此預計搭載該GPU的SoC將很快可以提供給系統廠(chǎng)商使用。其中,DXTP-64-2048在1GHz的運行頻率下,具備64 GPixel/s的處理速度,能夠實(shí)現2 TFLOPS的FP32、4 TFLOPS的FP16以及8 TOPS的INT8峰值計算性能;DXTP-48-1536同樣具備48 GPixel/s的處理速度、1.5 TFLOPS的FP32、3.0 TFLOPS的FP16和6 TOPS的INT8性能。 ![]() 在功能特性上,DXTP引入全新的靈活任務(wù)調度機制。該機制可實(shí)時(shí)監測各個(gè)任務(wù)的狀態(tài)和資源需求,依據任務(wù)優(yōu)先級和實(shí)時(shí)需求動(dòng)態(tài)分配計算資源。當同時(shí)運行圖形渲染和AI計算任務(wù)時(shí),能合理分配資源,確保系統高效運行,提升整體性能和響應速度,進(jìn)一步提高能源利用效率,有力推動(dòng)邊緣AI應用發(fā)展。 ![]() DXTP 的均衡架構設計同樣是一項創(chuàng )新。這種架構通過(guò)優(yōu)化渲染計算的吞吐量,相較于前代產(chǎn)品實(shí)現了高達50%的性能提升。通過(guò)擴展緩存容量和系統級帶寬,DXTP 構建了更高效的通道,能夠更有效地替代 GPGPU 完成各類(lèi)復雜計算工作,完成數據存儲和傳輸。在處理大規模數據集時(shí),緩存能夠暫存頻繁訪(fǎng)問(wèn)的數據,從而減少讀取時(shí)間;而更高的系統級帶寬則確保了數據在不同組件間快速傳輸,有效避免了傳輸瓶頸。無(wú)論是實(shí)時(shí)渲染大型3D游戲,還是處理AI計算任務(wù)中的海量數據,DXTP 都能憑借其架構優(yōu)勢高效且穩定地執行。 此外,借助Imagination的低開(kāi)銷(xiāo)HyperLane技術(shù),DXTP支持完全安全的GPU多任務(wù)處理,可同時(shí)運行圖形和計算任務(wù),極大地提升了系統靈活性。例如,在智能汽車(chē)場(chǎng)景中,車(chē)輛行駛時(shí),DXTP 一方面要負責渲染高精度的 3D 地圖,為駕駛員提供清晰直觀(guān)的導航界面,實(shí)時(shí)呈現路況和周邊環(huán)境信息;另一方面,還要同步處理來(lái)自多個(gè)傳感器的 AI 計算任務(wù),如對攝像頭捕捉到的圖像進(jìn)行實(shí)時(shí)分析,識別行人和其他車(chē)輛,以輔助自動(dòng)駕駛決策。這兩項任務(wù)對計算資源的需求都很高,且對處理的及時(shí)性和準確性要求嚴格,DXTP 憑借 HyperLane 技術(shù),能將圖形渲染和 AI 計算任務(wù)高效分配到不同的虛擬環(huán)境中,讓它們互不干擾地穩定運行,保障了駕駛過(guò)程中的安全性和用戶(hù)體驗。 ![]() 生態(tài)合作創(chuàng )新支持開(kāi)發(fā)者更方便完成設計并復用成果 Imagination不僅在硬件技術(shù)上不斷創(chuàng )新,還積極構建豐富的軟件生態(tài)系統,推動(dòng) GPU 技術(shù)的廣泛應用,展現了其全方位支持芯片設計企業(yè)及其用戶(hù)去實(shí)現創(chuàng )新的能力。 Imagination與Android和Linux生態(tài)系統緊密協(xié)作,致力于挖掘GPU的計算潛力。通過(guò)與這些主流操作系統的深度整合,Imagination為開(kāi)發(fā)者打造了一個(gè)更加便捷、高效的開(kāi)發(fā)環(huán)境。同時(shí),Imagination為開(kāi)發(fā)者們提供了豐富的創(chuàng )新資源和強大的工具,包括定期更新的驅動(dòng)程序、詳盡的指南和示例代碼,支持OpenGL/ES、OpenCL、Vulkan等多種標準。開(kāi)發(fā)者可以根據項目需求選擇最合適的開(kāi)發(fā)框架,從而提升開(kāi)發(fā)的靈活性和效率,為創(chuàng )新應用的開(kāi)發(fā)提供了有力支持。 在圖形處理、GPU計算和人工智能領(lǐng)域,Imagination與UXL基金會(huì )開(kāi)展合作,利用其oneAPI等開(kāi)放標準支持開(kāi)發(fā)者去降低創(chuàng )新門(mén)檻并充分復用創(chuàng )新成果。例如通過(guò)結合使用Imagination的OpenCL工具包,相較于開(kāi)源人工智能方案,能夠實(shí)現高達4倍的人工智能應用性能提升。這一合作成果為人工智能開(kāi)發(fā)者提供了更加強大、高效的開(kāi)發(fā)工具,加速了人工智能應用在GPU上的開(kāi)發(fā)和部署,推動(dòng)了人工智能領(lǐng)域的創(chuàng )新發(fā)展。 Imagination還擁有一系列功能豐富的開(kāi)發(fā)者工具,可用于性能分析與調試,同時(shí)還提供帶有示例和指南的軟件開(kāi)發(fā)工具包(SDK)。這些工具和SDK可從開(kāi)發(fā)者門(mén)戶(hù)網(wǎng)站下載,并且已經(jīng)被眾多游戲工作室長(cháng)期使用。Imagination的開(kāi)發(fā)者社區充滿(mǎn)活力,便于分享經(jīng)驗、解決問(wèn)題。社區活動(dòng)和競賽激發(fā)創(chuàng )新,技術(shù)交流讓開(kāi)發(fā)者掌握最新動(dòng)態(tài),而競賽則促進(jìn)了思想交流和應用創(chuàng )新,營(yíng)造了一個(gè)充滿(mǎn)創(chuàng )新活力的生態(tài)環(huán)境。 ![]() 通過(guò)前面介紹的這些創(chuàng )新產(chǎn)品、技術(shù)和生態(tài)舉措,可以發(fā)現Imagination一方面致力于從算力指標、整體功耗、芯片面積、功能安全和架構均衡性等基礎性能上挖掘性能極限正在重新定義GPU,另一方面還在架構靈活性、用戶(hù)體驗、特色功能和AI支持能力等產(chǎn)品特色功能上支持SoC設計企業(yè)及其用戶(hù)去引領(lǐng)或者適應新的商業(yè)模式,第三還聯(lián)合產(chǎn)業(yè)內外各類(lèi)創(chuàng )新主體攜手推動(dòng)這些技術(shù)更快轉化為智能化轉型的強大動(dòng)力,共同去引領(lǐng)邊緣AI時(shí)代的創(chuàng )新發(fā)展。在邊緣AI快速發(fā)展的今天,Imagination在GPU領(lǐng)域的持續創(chuàng )新,不斷為SoC設計企業(yè)帶來(lái)可以引領(lǐng)市場(chǎng)的全新功能,還為整個(gè)圖形計算和人工智能計算在端側智能領(lǐng)域帶來(lái)了新的發(fā)展機遇。 |