引言隨著(zhù)AI技術(shù)不斷發(fā)展,越來(lái)越多的嵌入式設備開(kāi)始集成NPU(神經(jīng)網(wǎng)絡(luò )處理單元),以實(shí)現更高效的AI推理。作為國產(chǎn)芯片廠(chǎng)商的佼佼者,瑞芯微推出的RK3588、RK3576、RK3568、RK3562系列芯片在市場(chǎng)中占據了重要地位。今天,我們一起深入對比、測評上述芯片的NPU性能,快速解決在項目選型中帶來(lái)的困擾。 測試數據匯總巔峰對決:RK3576 VS RK3588 圖1 輕量角逐:RK3562 VS RK3568圖2 數據解讀與應用指南通過(guò)在不同平臺上對yolov5s(640×640)目標檢測模型的推理性能測試對比,可以看出RK3588憑借6TOPS NPU算力,49fps的推理實(shí)測性能,成為圖像識別、多模態(tài)分析等高性能AI應用的首選。 其次,RK3576的推理實(shí)測性能是45fps。其具備超高性?xún)r(jià)比,在中高性能場(chǎng)景下更占據優(yōu)勢。以工業(yè)控制領(lǐng)域為例,在對設備運行狀態(tài)進(jìn)行實(shí)時(shí)監測與故障診斷時(shí),RK3576既能滿(mǎn)足對數據處理速度和精度的要求,又能為企業(yè)有效控制成本,毫無(wú)疑問(wèn)成為工業(yè)自動(dòng)化升級的不二之選。 RK3568與RK3562均為輕量級NPU性?xún)r(jià)比方案,RK3568基于yolov5s(640×640)模型的實(shí)測推理性能達到17fps,適合用于如AGV機器人等基礎的AI擴展場(chǎng)景。而RK3562以21fps的實(shí)測推理性能,在低功耗邊緣設備領(lǐng)域表現出色,如IoT門(mén)禁系統。這兩款芯片均為1TOPS算力,能更好滿(mǎn)足用戶(hù)對于輕量化是我需求,以顯著(zhù)的成本優(yōu)勢,為大規模普及AI應用提供了可能。 RK3576全國產(chǎn)工業(yè)核心板創(chuàng )龍科技基于瑞芯微RK3576J/RK3576,推出了工業(yè)核心板和評估板。其中,瑞芯微RK3576J/RK3576處理器集成了四核ARM Cortex-A72@2.2GHz + 四核1.8GHz ARM Cortex-A53@2.0GHz + ARM Cortex-M0,搭載6TOPS NPU。 創(chuàng )龍科技的RK3576J/RK3576核心板的ARM、ROM、RAM、電源、晶振、連接器等所有元器件均采用國產(chǎn)工業(yè)級方案,國產(chǎn)化率100%,可提供報告。此外,RK3576J/RK3576評估板具備豐富的接口資源,包括4路Ethernet、3路USB3.2、2路CAN-FD、2路RS485、PCIe 2.1等通信接口,以及MIPI CSI、LVDS OUT、MIPI DSI、DP(DisplayPort)、HDMI OUT、MIC IN、HP OUT、LINE IN等音視頻接口,滿(mǎn)足您的項目評估需求! RK3576工業(yè)核心板典型應用場(chǎng)景圖3 開(kāi)發(fā)環(huán)境Windows開(kāi)發(fā)環(huán)境:Windows 7 64bit、Windows 10 64bit U-Boot:U-Boot-2017.09 Kernel:Linux-6.1.75 LinuxSDK:LinuxSDK-[版本號] (基于rk3576_linux6.1_release_v1.0.0_20240620) 硬件平臺:創(chuàng )龍科技TL3576-EVM工業(yè)評估板 案例功能案例基于RKNN API實(shí)現對圖片中目標對象的識別,并將識別結果以加水印的方式添加至圖像,并保存成圖片文件。案例循環(huán)測試10次,統計出推理的平均處理耗時(shí)。 程序原理流程圖如下所示: 圖4 案例測試請通過(guò)網(wǎng)線(xiàn)將評估板千兆網(wǎng)口ETH1 RGMII連接至路由器。請將案例bin目錄下的所有文件拷貝至評估板文件系統任意目錄下。 圖5 在可執行文件所在目錄,執行如下命令,對圖片目標對象進(jìn)行模型推理。 備注:模型運行的時(shí)間會(huì )有抖動(dòng)。 Target# ./yolov5_object_detect yolov5s-640-640_rk3576.rknn car.jpg 圖6 從輸出信息可知,本案例程序識別出測試圖片包含person、car、bus、truck等對象,運行1次模型耗時(shí)為31.48ms;循環(huán)運行10次模型平均耗時(shí)為22.26ms(約為45fps)。 圖7 案例程序對測試圖片的目標對象標記成功后將輸出名稱(chēng)為out.jpg的標記圖片至當前目錄,請將out.jpg文件拷貝至Windows下,并使用PC端相關(guān)軟件對比查看car.jpg與out.jpg,測試結果如下所示。 圖 8 圖9 從out.jpg圖片可知,案例程序能正確框選出人物、汽車(chē)等物體,同時(shí)顯示person、car等文字標簽和置信度,標記對象的數量及信息等與程序打印信息一致。 本程序能夠支持識別的目標數據集類(lèi)型說(shuō)明位于案例目錄"bin\model\"目錄下的coco_80_labels_list.txt文件,用戶(hù)可根據相關(guān)目標類(lèi)型進(jìn)行測試驗證。 圖10 同時(shí)可以測得CPU占用率約為14%,NPU占用率約為36%,內存占用率約為8%。 圖11 圖12 到這里,我們的演示步驟結束。查看更多RK3576相關(guān)的案例演示 ,歡迎各位工程師在公眾號(Tronlong創(chuàng )龍科技)查閱,快來(lái)試試吧! |