作者:Imagination高級首席解決方案架構師 章政 根據工業(yè)和信息化部裝備一司發(fā)布的消息:2025年1月,中國汽車(chē)產(chǎn)銷(xiāo)分別完成245萬(wàn)輛和242.3萬(wàn)輛,產(chǎn)量同比增長(cháng)1.7%,銷(xiāo)量同比下降0.6%。其中,新能源汽車(chē)產(chǎn)銷(xiāo)分別完成101.5萬(wàn)輛和94.4萬(wàn)輛,同比分別增長(cháng)29%和29.4%,新能源汽車(chē)新車(chē)銷(xiāo)量達到汽車(chē)新車(chē)總銷(xiāo)量的38.9%;乘用車(chē)產(chǎn)銷(xiāo)分別完成215.1萬(wàn)輛和213.3萬(wàn)輛,同比分別增長(cháng)3.3%和0.8%。中國汽車(chē)工業(yè)在繼續保持全球產(chǎn)量第一的同時(shí),也在加速電氣化進(jìn)程,同時(shí)也在不斷推進(jìn)智能化。圖形處理器(GPU)已經(jīng)成為智能駕駛和新一代座艙中,被用以實(shí)現先進(jìn)駕駛輔助(ADAS)或者自動(dòng)駕駛(AD),或者處理更多的屏顯、實(shí)現人機互動(dòng)和汽車(chē)與環(huán)境互動(dòng)的核心處理器件之一,基于GPU開(kāi)發(fā)的智駕芯片和智能座艙芯片具有廣闊的前景。 作為世界第四大芯片IP公司,Imagination在全球汽車(chē)GPU IP市場(chǎng)一直處于領(lǐng)先地位,并專(zhuān)為汽車(chē)市場(chǎng)開(kāi)發(fā)了XS系列GPU,該系列最新的DXS是一款可擴展、靈活的GPU IP,專(zhuān)為處理駕駛艙、信息娛樂(lè )和高級駕駛輔助系統中的圖形和計算工作負載而打造。該處理器不僅以單核1.5TFLOPS的處理能力在計算性能方面引領(lǐng)行業(yè)同儕,而且還引入多項創(chuàng )新實(shí)現了分布式安全性,消除了芯片設計公司以往為實(shí)現ASIL-B等級功能安全而產(chǎn)生的額外開(kāi)銷(xiāo)。目前,采用這種創(chuàng )新的、低成本的分布式安全機制DXS GPU已通過(guò)了ASIL-B汽車(chē)功能安全性認證。 除了上面提到的算力和分布式安全等硬件方面的創(chuàng )新,Imagination還為DXS系列GPU配置了全面的計算庫和工具鏈,以期望提升開(kāi)發(fā)效率和充分釋放DXS GPU的性能方面,從而進(jìn)一步加速智能駕駛芯片的設計和普及。 深度優(yōu)化的全新底層計算庫提升開(kāi)發(fā)效率 Imagination提供的一系列底層計算庫都經(jīng)過(guò)深度軟件調優(yōu)。全新計算庫和人工智能工具包,可幫助軟件開(kāi)發(fā)人員實(shí)現高達80%的GPU利用率。這也將加速常見(jiàn)計算工作負載的處理,如計算機視覺(jué)和ADAS系統感知數據的預處理和后處理。這一套與DXS GPU硬件同時(shí)完成開(kāi)發(fā)的計算庫包括: 傅里葉變換加速庫(imgFFT) 傅里葉變換加速庫(imgFFT)在智能駕駛領(lǐng)域是處理傳感器數據的得力助手。智能汽車(chē)搭載的雷達、攝像頭等傳感器會(huì )生成海量數據,imgFFT能快速將時(shí)域數據轉換到頻域。例如,毫米波雷達不斷發(fā)射和接收電磁波,產(chǎn)生的時(shí)域信號經(jīng) imgFFT 處理后,車(chē)輛可清晰分辨出周邊物體的速度、距離等信息。在圖像識別方面,攝像頭拍攝的圖像數據,通過(guò) imgFFT頻域數據分析提取,可突出圖像中的邊緣、紋理等關(guān)鍵特征,使圖像識別算法能更精準地識別道路標志、車(chē)道線(xiàn)以及其他車(chē)輛,幫助車(chē)輛提前做出反應,極大地提升了自動(dòng)駕駛系統的環(huán)境感知能力和安全性。 線(xiàn)性代數庫(imgBLAS) 線(xiàn)性代數庫(imgBLAS)為智能駕駛中的復雜運算提供了高效支持。在路徑規劃算法里,imgBLAS的矩陣運算能力發(fā)揮著(zhù)關(guān)鍵作用。當車(chē)輛規劃行駛路線(xiàn)時(shí),要綜合考慮地圖數據、實(shí)時(shí)路況、自身位置等信息,這些都以矩陣形式呈現。借助 imgBLAS的矩陣乘法、加法等優(yōu)化函數,車(chē)輛能快速計算出不同路徑的成本和可行性,找到最優(yōu)行駛路徑。在機器學(xué)習模型訓練中,imgBLAS同樣不可或缺。像訓練用于預測交通流量的模型時(shí),涉及大量數據的矩陣運算,imgBLAS能大幅提升運算速度,縮短模型訓練時(shí)間,使模型更快適應路況變化,為自動(dòng)駕駛決策提供更準確的依據。 神經(jīng)網(wǎng)絡(luò )庫(imgNN) 神經(jīng)網(wǎng)絡(luò )庫(imgNN)是推動(dòng)自動(dòng)駕駛技術(shù)智能化的核心力量。在自動(dòng)駕駛系統的深度學(xué)習模型中,imgNN為模型的訓練和推理提供了有力支持。在訓練階段,imgNN優(yōu)化了模型參數更新的計算過(guò)程,加速了模型的收斂速度,使模型能夠更快地學(xué)習到圖像中各類(lèi)物體的特征。在實(shí)際駕駛中,模型進(jìn)入推理階段,imgNN能夠高效處理攝像頭傳來(lái)的圖像數據,迅速識別出車(chē)輛、行人、障礙物等目標,并準確判斷其位置和運動(dòng)狀態(tài),幫助車(chē)輛及時(shí)做出制動(dòng)、避讓等決策,使得自動(dòng)駕駛系統的反應更加靈敏、決策更加精確,有力地推動(dòng)了自動(dòng)駕駛技術(shù)從理論走向實(shí)際應用。 Imagination還將其開(kāi)發(fā)庫與oneAPI Toolkit、TensorGraph Reference Kit進(jìn)行對接和優(yōu)化,無(wú)論開(kāi)發(fā)者在何種架構、平臺上開(kāi)發(fā),或是使用開(kāi)源框架,都能無(wú)縫使用這些庫,極大地提升了開(kāi)發(fā)環(huán)境選擇的靈活性。 Imagination 的創(chuàng )新生態(tài)系統構建 Imagination致力于解決GPU開(kāi)發(fā)的局限性問(wèn)題,為開(kāi)發(fā)者們提供了一套全面且極具創(chuàng )新性的解決方案。Imagination構建了領(lǐng)域專(zhuān)家合作伙伴的生態(tài)系統,與UXL基金會(huì )緊密合作,通過(guò)開(kāi)源持續推動(dòng)oneAPI標準的發(fā)展,為開(kāi)發(fā)者開(kāi)辟了一條清晰且便捷的道路,以便實(shí)現軟件的可移植性,并有效利用異構硬件。這一方案不僅打破了硬件廠(chǎng)商的壁壘,還極大地提升了開(kāi)發(fā)效率,讓開(kāi)發(fā)者能夠專(zhuān)注于算法優(yōu)化和應用創(chuàng )新,從而在激烈的技術(shù)競爭中占據優(yōu)勢。 UXL 基金會(huì ),即 Unified Acceleration Foundation,是在當前全球 GPU 開(kāi)發(fā)格局下應運而生的重要組織,其愿景是打破少數廠(chǎng)商利用其軟件平臺與 GPU 硬件構建的封閉生態(tài)系統帶來(lái)的限制,使全球開(kāi)發(fā)者可以不依賴(lài)某一特定軟件平臺進(jìn)行 AI 和其他應用程序開(kāi)發(fā),從而使其他硬件廠(chǎng)商的 GPU 在軟件開(kāi)發(fā)后解決適配上面臨的諸多困難。在此背景下,高通、谷歌、英特爾、Imagination Technologies和三星等科技巨頭聯(lián)合成立了 UXL 基金會(huì )。 UXL 基金會(huì )的目標是構建一個(gè)開(kāi)源項目,打造一套能驅動(dòng)多種GPU等加速器芯片的軟件和工具,使開(kāi)發(fā)者的代碼能在任何機器上運行,而無(wú)需考慮具體使用何種芯片和硬件,以此推動(dòng)建立開(kāi)放標準的生態(tài)系統,打破硬件與軟件之間的壁壘,統一異構計算生態(tài)。UXL基金會(huì )致力于軟件開(kāi)發(fā)移植和成果復用,通過(guò)構建開(kāi)源項目和制定統一標準簡(jiǎn)化開(kāi)發(fā)流程。它基于oneAPI來(lái)提供跨平臺編程接口和工具,如oneDPL、oneDNN等,以促進(jìn)軟件快速移植和開(kāi)發(fā)效率。 因此,Imagination積極參與發(fā)起UXL 基金會(huì ),并為此提供了諸多技術(shù)貢獻,還積極支持開(kāi)放社區與協(xié)作機制,推動(dòng)全球的開(kāi)發(fā)者可以在社區中共享代碼、分享經(jīng)驗和交流創(chuàng )新成果。目前,Imagination及其客戶(hù)和合作伙伴通過(guò)oneAPI,攜手解決了軟件開(kāi)發(fā)移植過(guò)程中遇到的許多問(wèn)題,不僅有效地支持了開(kāi)發(fā)者去提升開(kāi)發(fā)效率,還可加速軟件移植和實(shí)現無(wú)形資產(chǎn)的全面復用。 全面的工具加速開(kāi)發(fā)項目應用落地 Imagination的PVRTune工具為開(kāi)發(fā)者提供了精確的性能分析支持。該工具專(zhuān)門(mén)針對包括新推出的DXS GPU在內的PowerVR器件進(jìn)行硬件級別的性能深度剖析。利用PVRTune,開(kāi)發(fā)者能夠實(shí)時(shí)監控GPU負載、內存帶寬等關(guān)鍵性能指標。在識別問(wèn)題后,能夠迅速定位性能瓶頸,優(yōu)化代碼結構,從而顯著(zhù)提升應用的運行效率。PVRTune還支持多線(xiàn)程調試,協(xié)助開(kāi)發(fā)者均衡各線(xiàn)程負載,預防資源沖突。通過(guò)其直觀(guān)的可視化界面,開(kāi)發(fā)者可以清晰地查看性能數據,并精確調整參數,進(jìn)一步優(yōu)化應用性能,確保即便在復雜場(chǎng)景中也能保持高效運行。 此外,Imagination也致力于為開(kāi)發(fā)者們提供參考計算和AI工具包,助力客戶(hù)在實(shí)際應用中充分利用計算庫。該參考計算和AI工具包已在客戶(hù)和合作伙伴的項目開(kāi)發(fā)中實(shí)現了許多成功范例。例如,澎峰科技基于Imagination的計算庫構建AI解決方案,借助參考工具包,在Imagination GPU上運行各類(lèi)人工智能應用,其中大語(yǔ)言推理引擎PerfXLM相較于CPU方案,性能提升高達100%,且移植耗時(shí)極短。 DXS GPU將Imagination 的綜合優(yōu)勢全面帶入智能汽車(chē)領(lǐng)域 目前,已有領(lǐng)先汽車(chē)芯片企業(yè)購買(mǎi)了Imagination的DXS系列汽車(chē)GPU IP的授權,預計在不久的將來(lái),業(yè)界將看到采用DXS GPU IP開(kāi)發(fā)的高算力、具有功能安全性的智駕芯片。這些智駕芯片除了充分發(fā)揮Imagination獨特的PowerVR GPU架構、在行業(yè)內領(lǐng)先的HyperLane硬件隔離技術(shù)等創(chuàng )新,也為最終應用的開(kāi)發(fā)者提供了從生態(tài)系統、底層庫、性能分析工具到參考工具包的全方位支持,有效解決了傳統開(kāi)發(fā)環(huán)境的局限性問(wèn)題。從而推動(dòng)開(kāi)發(fā)者發(fā)揮GPU技術(shù)在更靈活、更通用和生命周期更長(cháng)等方面的優(yōu)勢,助力智駕芯片開(kāi)發(fā)者快速實(shí)現高質(zhì)量創(chuàng )新。 |