Cadence發(fā)布業(yè)界首款面向汽車(chē)、監控、無(wú)人機和移動(dòng)市場(chǎng)的神經(jīng)網(wǎng)絡(luò )DSP IP

發(fā)布時(shí)間:2017-5-4 11:29    發(fā)布者:eechina
具備1TMAC/秒計算能力的完整獨立 DSP解決方案

楷登電子(美國Cadence公司,NASDAQ: CDNS)今日正式公布業(yè)界首款獨立完整的神經(jīng)網(wǎng)絡(luò )DSP —Cadence Tensilica Vision C5 DSP,面向對神經(jīng)網(wǎng)絡(luò )計算能力有極高要求的視覺(jué)設備、雷達/光學(xué)雷達和融合傳感器等應用量身優(yōu)化。針對車(chē)載、監控安防、無(wú)人機和移動(dòng)/可穿戴設備應用,Vision C5 DSP 1TMAC/s的計算能力完全能夠勝任所有神經(jīng)網(wǎng)絡(luò )的計算任務(wù)。如需了解更多內容,請參訪(fǎng)www.cadence.com/go/visionc5。

隨著(zhù)神經(jīng)網(wǎng)絡(luò )應用的日益深入和復雜,對計算的要求也與日俱增;同時(shí),神經(jīng)網(wǎng)絡(luò )的自身架構在不斷更新?lián)Q代,新網(wǎng)絡(luò )、新應用和新市場(chǎng)也層出不窮。上述趨勢之下,業(yè)界亟需一款針對嵌入式系統量身定制的高性能、通用型神經(jīng)網(wǎng)絡(luò )解決方案,不僅應該具備極低的功耗,還應擁有高度的可編程能力,以適應未來(lái)變化,降低風(fēng)險。

神經(jīng)網(wǎng)絡(luò )DSP vs. 神經(jīng)網(wǎng)絡(luò )加速器

基于攝像頭的視覺(jué)系統在汽車(chē)、無(wú)人機和安防領(lǐng)域最為常見(jiàn),這種架構需要兩種最基礎的視覺(jué)優(yōu)化計算模式。首先,利用傳統視覺(jué)算法對攝像頭捕捉到的照片或圖像進(jìn)行增強;其次,使用基于神經(jīng)網(wǎng)絡(luò )的認知算法對物體進(jìn)行檢測和識別,F有的神經(jīng)網(wǎng)絡(luò )加速器解決方案皆依賴(lài)與圖像DSP連接的硬件加速器;神經(jīng)網(wǎng)絡(luò )代碼被分為兩部分,一部分網(wǎng)絡(luò )層運行在DSP上,卷積層則運行在硬件加速器上。這種架構不但效率低下,且耗能較高。

Vision C5 DSP是專(zhuān)門(mén)針對神經(jīng)網(wǎng)絡(luò )進(jìn)行了特定優(yōu)化的DSP,可以實(shí)現全神經(jīng)網(wǎng)絡(luò )層的計算加速(卷積層、全連接層、池化層和歸一化層),而不僅僅是卷積層的加速。因此,主視覺(jué)/圖像DSP能力得以釋放,獨立運行圖像增強應用,Vision C5 DSP則負責執行神經(jīng)網(wǎng)絡(luò )任務(wù)。通過(guò)移除神經(jīng)網(wǎng)絡(luò )DSP和主視覺(jué)/圖像DSP之間的冗余數據傳輸,Vision C5 DSP的功耗遠低于現有的神經(jīng)網(wǎng)絡(luò )加速器。同時(shí),Vision C5 DSP還提供針對神經(jīng)網(wǎng)絡(luò )的單核編程模型。

“我們的很多客戶(hù)都在糾結如何選擇理想的神經(jīng)網(wǎng)絡(luò )平臺,畢竟一款產(chǎn)品的開(kāi)發(fā)可能耗時(shí)數年,”Cadence公司Tensilica事業(yè)部市場(chǎng)高級總監Steve Roddy表示!半S時(shí)在線(xiàn)(always-on)嵌入式系統的神經(jīng)網(wǎng)絡(luò )處理器不僅需要低功耗和較快的圖像處理速度,靈活性和永不過(guò)時(shí)(future-proof)的前瞻性也必不可少。目前的平臺都不夠理想,客戶(hù)亟需一個(gè)全新的解決方案。Vision C5 DSP通用型神經(jīng)網(wǎng)絡(luò )DSP應運而生,它集成方便、使用靈活,功耗能效較CNN加速器、GPU和CPU也更為出色!

“現實(shí)世界中的深度學(xué)習應用數量龐大,種類(lèi)繁多,對計算的要求非?量,”嵌入視覺(jué)聯(lián)盟(Embedded Vision Alliance)創(chuàng )始人Jeff Bier表示!癡ision C5 DSP作為神經(jīng)網(wǎng)絡(luò )專(zhuān)用編程處理器,可以幫助我們在低成本、低功耗設備上應用深度學(xué)習技術(shù)!

Vision C5 DSP的參數與性能

依托獨立引擎,Vision C5 DSP具備領(lǐng)先的神經(jīng)網(wǎng)絡(luò )性能:
•    不到1mm2的芯片面積可以實(shí)現1TMAC/秒的計算能力(吞吐量較Vision P6 DSP提高4倍),為深度學(xué)習內核提供極高的計算吞吐量
•    1024 8-bit MAC或512 16-bit MAC 確保8-bit 和16-bit精度的出色性能
•    128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架構
•    專(zhuān)為多核設計打造,以極少的資源代價(jià)獲得NxTMAC的處理能力
•    內置iDMA和AXI4總線(xiàn)接口
•    使用與Vision P5和P6 DSP一致的經(jīng)驗證軟件工具包
•    基于業(yè)界知名的AlexNet CNN Benchmark,Vision C5 DSP的計算速度較業(yè)界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

Vision C5 DSP是一款靈活前瞻的永不過(guò)時(shí)(future-proof)解決方案,支持各類(lèi)內核尺寸、深度和輸入規格。Vision C5 DSP采用多項系數壓縮/解壓技術(shù),支持未來(lái)添加的新計算層。與之相反,CNN硬件加速器由于程序重編能力有限,擴展能力較差。

Vision C5 DSP搭載Cadence神經(jīng)網(wǎng)絡(luò )Mapping工具鏈,可將Caffe和TensorFlow等映射為在Vision C5 DSP上高度優(yōu)化過(guò)的可執行代碼,充分發(fā)揮手動(dòng)優(yōu)化神經(jīng)網(wǎng)絡(luò )庫的豐富功能。

Cadence正與多家早期客戶(hù)展開(kāi)合作。如需了解Vision C5 DSP的詳細內容,請聯(lián)系您的Cadence銷(xiāo)售代表。

本文地址:http://selenalain.com/thread-362802-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页