6月20日,中星微發(fā)布中國首款嵌入式神經(jīng)網(wǎng)絡(luò )處理器(NPU),該芯片已于今年3月6日實(shí)現量產(chǎn)。![]() 國家重點(diǎn)實(shí)驗室執行主任張韻東介紹說(shuō),NPU采用了“數據驅動(dòng)并行計算”的架構,徹底顛覆了傳統的馮諾依曼架構。這種數據流(Dataflow)類(lèi)型的處理器,極大地提升了計算能力與功耗的比例,特別擅長(cháng)處理視頻、圖像類(lèi)的海量多媒體數據,使得人工智能在嵌入式機器視覺(jué)應用中可以大顯身手。 張韻東表示,這款被命名為“星光智能一號”的芯片是中星微“星光中國芯”工程的最新成果,已成功在視頻監控領(lǐng)域實(shí)現產(chǎn)業(yè)化,并可廣泛應用于智能駕駛輔助、無(wú)人機、機器人等嵌入式機器視覺(jué)領(lǐng)域。 在不久前的人機大戰中,AlphaGo依靠模仿人腦生物機理的深度學(xué)習算法而擊敗人類(lèi)。深度學(xué)習,是源于對生物人腦機理的仿生學(xué)研究而形成的一種人工智能算法。作為深度學(xué)習神經(jīng)網(wǎng)絡(luò )的一種,卷積神經(jīng)網(wǎng)絡(luò )CNN (Convolutional Neural Network)算法,已成為當前人工智能機器視覺(jué)領(lǐng)域的研究熱點(diǎn)。CNN算法模型的特性可以概括為海量的輸入數據、大規模的MAC運算、稀疏的權值矩陣、靈活的數據位寬和多樣的網(wǎng)絡(luò )拓撲等特性。 張韻東介紹,NPU是針對CNN的算法模型特性而專(zhuān)門(mén)設計的一款神經(jīng)網(wǎng)絡(luò )處理器。每個(gè)NPU處理器具有4個(gè)內核(NPU Core),每個(gè)內核有兩個(gè)數據流處理器(Dataflow Processor), 每個(gè)數據流處理器具有8個(gè)長(cháng)位寬或16個(gè)短位寬的SIMD(單指令多數據)運算單元。在一個(gè)時(shí)鐘周期內可同時(shí)完成64個(gè)長(cháng)位寬MAC運算或者128個(gè)短位寬MAC運算。每個(gè)NPU核具有38G Ops的長(cháng)位寬處理能力或者76G Ops的短位寬處理能力。NPU的處理性能可以組成多核陣列來(lái)提升,也可以通過(guò)多芯片級聯(lián)的方式進(jìn)一步擴展,以滿(mǎn)足更復雜的CNN網(wǎng)絡(luò )運算的性能需求。 “每個(gè)NPU核還具有256KB Level-2 Cache,以及整塊數據搬移(Block Data Access),片內數據共享(Data-sharing Between Processor Units),提升數據流的吞吐效率! 張韻東表示,在軟件方面,利用了稀疏數據優(yōu)化(Optimization for Sparse Data)等特性提高計算效率!癗PU支持Caffe、TensorFlow等多種神經(jīng)網(wǎng)絡(luò )框架, 支持AlexNet、GoogleNet等各類(lèi)神經(jīng)網(wǎng)絡(luò )! --騰訊科技 |