CEVA憑借NeuPro-M異構安全處理器架構重新定義邊緣 AI 和邊緣計算設備的高性能 AI/ML 處理

發(fā)布時(shí)間：2022-1-14 18:37 發(fā)布者：eechina

關(guān)鍵詞： NeuPro-M , 邊緣計算 , 異構處理器 , 神經(jīng)網(wǎng)絡(luò )

CEVA推出用于人工智能和機器學(xué)習 (AI/ML) 推理工作的最新一代處理器架構NeuPro-M。NeuPro-M由多個(gè)專(zhuān)用協(xié)處理器和可配置硬件加速器組成，是瞄準廣闊的邊緣 AI 和邊緣計算市場(chǎng)的異構處理器架構，能夠同時(shí)無(wú)縫處理深度神經(jīng)網(wǎng)絡(luò )的各種工作，性能較上一代產(chǎn)品提升 5到15 倍。NeuPro-M支持系統級芯片(SoC)和異構SoC (HSoC)可擴展性，最高性能可達 1,200 TOPS，并提供可選的穩健安全啟動(dòng)和端至端數據隱私功能，開(kāi)創(chuàng )了業(yè)界先河。

NeuPro–M系列處理器初始包含以下預配置內核：

• NPM11 – 單個(gè) NeuPro-M 引擎，在 1.25GHz 下算力高達 20 TOPS
• NPM18 – 8 個(gè) NeuPro-M 引擎，在 1.25GHz 下算力高達 160 TOPS

在處理 ResNet50卷積神經(jīng)網(wǎng)絡(luò )時(shí)，單個(gè) NPM11內核可將性能提升至上一代產(chǎn)品的五倍，并將內存帶寬消耗減少六倍，從而實(shí)現高達 24 TOPS/W的出色功效，完美體現其業(yè)界領(lǐng)先的性能水平。

以成功的上一代產(chǎn)品為基礎，NeuPro-M能夠處理所有已知的神經(jīng)網(wǎng)絡(luò )架構，并集成了下一代網(wǎng)絡(luò )，如transformer、3D convolution、self-attention和全部類(lèi)型的循環(huán)神經(jīng)網(wǎng)絡(luò )的原生支持。經(jīng)優(yōu)化的NeuPro-M可處理 250 多種神經(jīng)網(wǎng)絡(luò )、450 多種AI 內核和 50 多種算法。嵌入式矢量處理單元(VPU)確保對未來(lái)新的神經(jīng)網(wǎng)絡(luò )拓撲和AI處理工作提供基于軟件的驗證和支持。而且，對于常見(jiàn)基準測試，CDNN離線(xiàn)壓縮工具可以將NeuPro-M的FPS/Watt性能提高 5到10 倍，并且對精度僅有極小的影響。
CEVA副總裁兼視覺(jué)業(yè)務(wù)部門(mén)總經(jīng)理 Ran Snir評論道：“隨著(zhù)生成的數據越來(lái)越多，以及傳感器相關(guān)軟件工作負載不斷遷移到神經(jīng)網(wǎng)絡(luò )以獲得更好的性能和效率，對邊緣 AI和邊緣計算的人工智能和機器學(xué)習處理需求的增速驚人。由于這些設備的功率預算保持不變，我們必需找到創(chuàng )新方法，在這些日益復雜的系統邊緣使用人工智能。我們利用在數百萬(wàn)臺無(wú)人機、安全攝像頭、智能手機和汽車(chē)系統應用等設備中部署 AI 處理器和加速器的豐富經(jīng)驗來(lái)設計NeuPro-M架構。NeuPro-M創(chuàng )新的分布式架構和共享內存系統控制器將帶寬消耗和延遲降至最低，并提供出色的整體利用率和電源效率。這允許我們的客戶(hù)在 SoC 或小芯片 (chiplet) 中連接多個(gè)NeuPro-M兼容內核來(lái)應對最嚴苛的 AI 工作，從而將智能邊緣處理器設計提升至全新的水平�！�

NeuPro-M異構架構由特定功能協(xié)處理器和負載平衡機制組成，相比上一代產(chǎn)品，這是實(shí)現巨大的性能和效率飛躍的重要因素。通過(guò)將控制功能分配給本地控制器并以分層方式實(shí)現本地內存資源，NeuPro-M 實(shí)現了處理數據流的靈活性，從而實(shí)現超過(guò)90%的利用率，并且在任意給定時(shí)間內防止不同協(xié)處理器和加速器出現數據不足現象。它使CDNN 框架根據特定網(wǎng)絡(luò )、所需帶寬、可用內存和目標性能來(lái)實(shí)施各種數據流方案，從而獲得最佳的負載平衡。

NeuPro-M 架構亮點(diǎn)包括：

• 由 4K MACs(乘累加單元)組成的主網(wǎng)格陣列，混合精度為 2到16 位
• 用于權重和激活操作的Winograd transform引擎，可將卷積時(shí)間減少兩倍，并允許在精度降低到少于0.5% 的情況下進(jìn)行 8 位卷積處理
• 用于避免每層具有零值權重或激活操作的Sparsity引擎，最多可將性能提升四倍，同時(shí)減少耗用內存帶寬和降低功耗
• 具有完全可編程的矢量處理單元，用于處理未獲支持的全新神經(jīng)網(wǎng)絡(luò )架構(具有全部數據類(lèi)型)，從 32 位浮點(diǎn)到 2 位二進(jìn)制神經(jīng)網(wǎng)絡(luò ) (BNN)
• 將可配置的權重數據壓縮至兩位，同時(shí)讀取內存時(shí)進(jìn)行實(shí)時(shí)解壓縮以減少耗用內存帶寬
• 使用動(dòng)態(tài)配置兩級內存架構，最大限度地減少與外部 SDRAM 之間的數據傳輸功耗

使用NeuPro-M 架構中創(chuàng )新功能，同時(shí)使用 Winograd 變換正交機制、Sparsity引擎和低分辨率 4x4 位激活，可將網(wǎng)絡(luò )(如 Resnet50 和 Yolo V3)的循環(huán)次數減少三倍以上。

由于神經(jīng)網(wǎng)絡(luò )權重和偏差以及數據集和網(wǎng)絡(luò )拓撲成為所有者的重要知識產(chǎn)權，因而業(yè)界迫切需要保護這些信息免遭未經(jīng)授權的使用。NeuPro-M架構可選用信任根、身份驗證和加密加速器來(lái)支持安全接入。

針對汽車(chē)市場(chǎng)，CEVA提供NeuPro-M 內核及其 CEVA 深度神經(jīng)網(wǎng)絡(luò ) (CDNN)深度學(xué)習編譯器和軟件工具包，不僅符合汽車(chē) ISO26262 ASIL-B 功能安全標準，并滿(mǎn)足嚴格的質(zhì)量保證標準 IATF16949 和 A-Spice要求。

結合CEVA 屢獲殊榮的神經(jīng)網(wǎng)絡(luò )編譯器 CDNN 及其功能強大的軟件開(kāi)發(fā)環(huán)境，NeuPro-M架構可為客戶(hù)提供一個(gè)完全可編程的硬件/軟件 AI開(kāi)發(fā)環(huán)境，最大限度地提升 AI操作性能。CDNN 包含創(chuàng )新的軟件，能夠充分利用客戶(hù)的 NeuPro-M定制硬件來(lái)優(yōu)化功耗、性能和帶寬。CDNN 軟件還包含了用于減少耗用內存和優(yōu)化負載平衡算法的內存管理器，并廣泛支持各種網(wǎng)絡(luò )格式(包括 ONNX、Caffe、TensorFlow、TensorFlow Lite、Pytorch 等)。CDNN 與常見(jiàn)的開(kāi)源框架 (包括 Glow、tvm、Halide 和 TensorFlow) 兼容，并包含模型優(yōu)化功能，例如“層融合(layer fusion)”和“訓練后量化(post training quantization)”，同時(shí)使用精確的守恒方法。

目前CEVA向主要客戶(hù)提供NeuPro-M授權許可，并于今年第二季提供全面授權許可。CEVA 還為客戶(hù)提供異構 SoC 設計服務(wù)，幫助其進(jìn)行系統集成并支持系統設計和小芯片開(kāi)發(fā)，從而為NeuPro-M客戶(hù)帶來(lái)裨益。如需了解更多的信息，請訪(fǎng)問(wèn)公司網(wǎng)頁(yè) https://www.ceva-dsp.com/product/ceva-neupro-m/。

本文地址：http://selenalain.com/thread-782736-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

相關(guān)文章

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

相關(guān)視頻

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页