Arm公司近期宣布了其Project Trillium項目,這是一套包括新的高度可擴展處理器的Arm IP組合,這些產(chǎn)品可以提供增強的機器學(xué)習(ML)和神經(jīng)網(wǎng)絡(luò )(NN)功能。當前的技術(shù)產(chǎn)品主要針對移動(dòng)設備市場(chǎng),將讓全新的搭載機器學(xué)習功能的設備具有先進(jìn)的計算能力,包括最先進(jìn)的目標檢測功能。 Arm IP 產(chǎn)品事業(yè)部總裁 Rene Haas 表示:“隨著(zhù)人工智能快速部署到終端設備,大量提升計算需求的同時(shí),也要求保持出色的能效表現。 基于這樣的需求,Arm宣布推出全新機器學(xué)習平臺Project Trillium。 新的設備需要高性能的機器學(xué)習與人工智能能力,這正是這些全新處理器可以提供的。 結合我們的平臺提供的高度靈活性和可擴展性,我們的合作伙伴將可針對多種設備進(jìn)行創(chuàng )新,創(chuàng )造無(wú)限可能。 現在的機器學(xué)習技術(shù)通常是針對特定的設備類(lèi)別或某個(gè)市場(chǎng)領(lǐng)域的需求。Arm的Project Trillium則通過(guò)提供最佳的可擴展性來(lái)改變這一點(diǎn)。雖然最初的發(fā)布是針對移動(dòng)處理器的,但未來(lái)的Arm 機器學(xué)習產(chǎn)品系列將會(huì )按照性能需求滿(mǎn)足不同應用場(chǎng)合的需求,包括從傳感器、智能音箱,到移動(dòng)設備、家庭娛樂(lè )以及其他領(lǐng)域的應用。 性能 Arm全新的機器學(xué)習和目標檢測處理器不僅相比于獨立的CPU, GPU和各種加速器有了顯著(zhù)的效率提升,而且遠勝像DSP這樣的傳統可編程邏輯處理器。 Arm 機器學(xué)習處理器是專(zhuān)門(mén)針對機器學(xué)習而重新設計的。它基于高度可擴展的Arm 機器學(xué)習架構, 并達到了機器學(xué)習應用場(chǎng)景要求的最高性能和效率: • 在移動(dòng)計算領(lǐng)域,Arm 機器學(xué)習處理器可以提供每秒超過(guò)4.6萬(wàn)億次的運算能力。 • 憑借智能數據管理,每秒萬(wàn)億次的運算(TOPs, Trillion Operations Per Second)在實(shí)際應用中可以進(jìn)一步實(shí)現2~4倍的有效吞吐量的提升。 • 在散熱和和成本受限的環(huán)境下,Arm 機器學(xué)習處理器能夠以超過(guò)每瓦特每秒3萬(wàn)億次運算操作的效能(TOPs/W)達到無(wú)以倫比的性能。有關(guān)Arm機器學(xué)習處理器的更多細節可在我們的網(wǎng)站上找到。 Arm 目標檢測處理器是專(zhuān)門(mén)為高效識別人或其他物體而設計的,它能夠在每幀圖像中識別出的物體對象的數目幾乎不受限制: • 在全高清分辨率下可以做到實(shí)時(shí)每秒60幀的檢測。 • 性能可以達到傳統DSP的80倍,并且相對于以往的Arm技術(shù),檢測質(zhì)量有了顯著(zhù)提高。有關(guān)Arm 目標檢測處理器的更多細節可在我們的網(wǎng)站上找到。 組合使用時(shí),Arm深度學(xué)習處理器和目標檢測處理器性能表現會(huì )更好,它們搭配能夠提供高性能、高能效的人物檢測和識別解決方案;谶@些技術(shù),用戶(hù)們將會(huì )在省電的模式下,在他們的智能設備上盡情體驗高分辨率的,且實(shí)時(shí)、精細的人臉識別功能。 當和Arm Compute Library和CMSIS-NN一起使用時(shí), Arm神經(jīng)網(wǎng)絡(luò )(NN)軟件庫專(zhuān)門(mén)為神經(jīng)網(wǎng)絡(luò )運算(NN)進(jìn)行了優(yōu)化,并且無(wú)縫的把如TensorFlow、Caffe和Android NN等神經(jīng)網(wǎng)絡(luò )框架和全系列的Arm Cortex® CPU, Arm Mali™ GPU, 和機器學(xué)習處理器高效連接在一起。這樣開(kāi)發(fā)人員能夠充分利用底層Arm硬件的能力和性能,從而從ML應用中獲得最高的性能。關(guān)于A(yíng)rm NN軟件的更多細節可在我們的網(wǎng)站上找到。 新的Arm機器學(xué)習IP套件將于今年4月有早期預覽版本提供給客戶(hù),在2018年中會(huì )發(fā)布通用版本。 |