芯動(dòng)力與聯(lián)想攜手打造獨立加速器(dNPU)解決方案,賦能AI PC浪潮

發(fā)布時(shí)間:2025-3-12 16:58    發(fā)布者:工程新聞
  隨著(zhù)DeepSeek效應持續讓AI產(chǎn)業(yè)巨震,其在提供出色性能的基礎上,降低了對于算力的需求,可使AI更高效、更低成本地部署在端側設備,既而推動(dòng)AIoT從“萬(wàn)物互聯(lián)”邁向“萬(wàn)物智聯(lián)”的同時(shí),也為邊緣AI“主力軍”AI PC的端側部署大模型提供了全新的解題思路。
      據IDC預測,AI PC在中國PC市場(chǎng)中新機的裝配比例將在未來(lái)幾年中快速攀升,將于2027年達到85%,成為PC市場(chǎng)主流。市場(chǎng)總規模將從2023年的3900萬(wàn)臺增至2027年的5000萬(wàn)臺以上,增幅接近28%。
      眾所周知,端側大模型的快速演變對AI芯片性?xún)r(jià)比和適配能力提出了更高的要求,AI PC中的AI生成任務(wù)對計算資源和處理能力的要求不盡相同,需要從以通用計算為核心的計算架構向更加高性能的異構AI計算架構升級,讓CPU、GPU和NPU等不同的計算單元“各司其職”協(xié)同作戰,賦能AI PC增強的生成式AI體驗。在這一過(guò)程中,AI芯片重任在肩,而究竟哪類(lèi)芯片能擔當重任呢?
      作為PC界的龍頭,聯(lián)想給出了自己的答案。在2025年3月3日在西班牙巴塞羅那的MWC Barcelona2025盛會(huì )上,聯(lián)想展示了全面升級的AI PC。新款AI PC首次采用國內珠海市芯動(dòng)力科技有限公司基于可重構并行處理器RPP的AzureBlade M.2加速卡,并將其命名為dNPU,不僅顯著(zhù)提升了推理速度和整體性能,讓系統運行更加流暢,而且還顯著(zhù)降低了系統整體功耗,實(shí)現了高效運行和節能降耗的雙重目標和雙重優(yōu)化。
      “dNPU代表了未來(lái)大模型在PC等本地端推理的技術(shù)方向和趨勢!鄙鲜鲐撠熑藦娬{。

      端側AI算力追求極致性?xún)r(jià)比 GPGPU站上舞臺中央
      隨著(zhù)大模型為主的生成式AI技術(shù)取得快速發(fā)展,各大PC廠(chǎng)商不僅在積極探索全新的AI PC形態(tài),為推動(dòng)大模型推理快速高效實(shí)現也在積極采納和部署強勁的AI芯片。
      傳統AI PC解決方案是在CPU中嵌入iNPU,在運行大語(yǔ)言模型時(shí),通常依賴(lài)GPU進(jìn)行加速,iNPU只有在特定的場(chǎng)景中才能被調用。然而,GPU在處理大模型時(shí)可能會(huì )面臨一些性能瓶頸,如GPU的架構雖然適合并行計算,但在處理深度學(xué)習任務(wù)時(shí),會(huì )導致資源利用率不足或延遲較高。此外,GPU在推理階段的功耗相對較高。
      而且在群雄逐鹿的通用GPU市場(chǎng)中,面臨著(zhù)英偉達、英特爾、AMD等巨頭的強大競爭,國內廠(chǎng)商要在重重壁壘中開(kāi)辟自己的天地,需要獨辟蹊徑,打造全生態(tài)。芯動(dòng)力敏銳地觀(guān)察到,高性?xún)r(jià)比是邊緣計算核心要求,且性能與TOPS不直接掛鉤,不同計算階段對性能要求不同,采用探索創(chuàng )新型的計算機架構的GPGPU是解決通用高算力和低功耗需求的必由之路,并已成為業(yè)界共識。
      基于這一深刻洞察,芯動(dòng)力推出了可重構并行處理器(RPP)架構,通過(guò)底層創(chuàng )新RPP架構,解決了高性能與通用性難兼以得的矛盾,利用數據流結構來(lái)避免了數據反復調用帶來(lái)的效率損失。并且芯動(dòng)力具有編譯器、運行時(shí)環(huán)境、高度優(yōu)化的RPP庫,可全面兼容CUDA的端到端完整軟件棧,從而實(shí)現邊緣AI應用的快速高效部署。
      基于上述架構和設計創(chuàng )新,芯動(dòng)力開(kāi)發(fā)了AzureBlade M.2加速卡集成的AE7100芯片,作為一款高能效GPGPU,相比傳統GPU,針對神經(jīng)網(wǎng)絡(luò )的計算特點(diǎn)進(jìn)行了優(yōu)化,通過(guò)集成大量專(zhuān)用的計算單元(如矢量?jì)群嘶蛏窠?jīng)加速器)和片上內存,可高效處理矩陣乘法和卷積等操作,從而在通用性、低時(shí)延、低功耗、低成本和快速部署等方面展現出顯著(zhù)優(yōu)勢,成為解鎖端側各大模型的關(guān)鍵,并成為聯(lián)想AI PC落地的新動(dòng)能。
(AI NOW不做大模型推理:右側 GPU usage 和 dNPU 占用率均為 0%)

(AI NOW進(jìn)行大模型推理:右側 GPU usage 仍為 0%,dNPU 在 40% 上下波動(dòng))
      “一是系統運行更絲滑。dNPU 在執行深度學(xué)習任務(wù)時(shí),無(wú)需占用CPU、顯存或GPU資源,這種設計不僅最大限度地減少了對傳統GPU和顯存的依賴(lài),還通過(guò)dNPU的高效計算能力,顯著(zhù)提升了推理速度和整體性能,讓系統運行更加絲滑流暢,大幅提升用戶(hù)體驗。二是低功耗優(yōu)勢。通過(guò)實(shí)測,在未啟用AI NOW推理時(shí),CPU的功耗僅為 7.52W,而推理時(shí)功耗上升至14.88W。dNPU的架構設計賦予其低功耗的特性,同時(shí)釋放了原本由GPU占用的高功耗資源,進(jìn)一步優(yōu)化了系統能效,不僅實(shí)現了推理任務(wù)的高效執行,更顯著(zhù)降低了系統整體功耗,為用戶(hù)帶來(lái)性能與能效的雙重優(yōu)化體驗!甭(lián)想工作人員介紹dNPU在處理大模型時(shí)的顯著(zhù)優(yōu)勢時(shí)表示,“因而,聯(lián)想AI PC在A(yíng)I計算、AI擴展、多模態(tài)交互、智能化等層面,均實(shí)現了顯著(zhù)的提升!
      憑借芯動(dòng)力的底層創(chuàng )新、深厚積淀和積極拓展,不僅在A(yíng)I PC領(lǐng)域取得了開(kāi)門(mén)紅,在同樣廣闊的泛安防/邊緣服務(wù)器、工業(yè)影像/機器視覺(jué)、信號處理/醫療影像、機器人等邊緣AI應用市場(chǎng)都已有眾多應用落地,并與眾多重要企業(yè)達成了戰略合作。
      這些市場(chǎng)的廣闊發(fā)展前景也在徐徐展開(kāi),以安防IPC芯片市場(chǎng)為例,2026年全球規模將達 10.9億美元,2025全球3D視覺(jué)識別芯片市場(chǎng)規模將達27億美元;在工業(yè)影像/機器視覺(jué)市場(chǎng),芯動(dòng)力RPP架構GPU可對標英偉達AI算力顯卡+高端FPGA;針對泛安防/邊緣服務(wù)器市場(chǎng),國產(chǎn)邊緣算力芯片之外提供新的選擇;在信號處理市場(chǎng),更是可直接替代國外高端DSP,而更多的客戶(hù)合作和應用落地。

      AI芯片實(shí)現高能效低功耗 加速卡成就“全武行”
      芯動(dòng)力開(kāi)發(fā)的AzureBlade M.2加速卡被PC巨頭聯(lián)想成功合作,無(wú)疑再次佐證了芯動(dòng)力RPP芯片的硬核實(shí)力。
      具象來(lái)看,AE7100芯片作為此款M.2加速卡的核心,是芯動(dòng)力基于RPP架構自主研發(fā)的AI芯片,其尺寸僅為17mm×17mm,堪稱(chēng)業(yè)界最小、最薄的GPU。它不僅可以輕松放入標準M.2卡,還具備強大的計算能力,支持32Tops算力。
      集成了耀眼AE7100芯片的AzureBlade M.2加速卡,更是將高性能、低功耗、小體積的優(yōu)勢發(fā)揮到極致。它的尺寸僅為22mm×80mm,大約半張名片大小,卻擁有高達32TOPs的算力以及60GB/s的內存帶寬,功耗也可以做到動(dòng)態(tài)控制。
      值得一提的是,為將芯片融入筆記本電腦,芯動(dòng)力還革新了封裝技術(shù),采用扇出型封裝,實(shí)現了無(wú)基板的FC-BGA,實(shí)現了低成本先進(jìn)封裝。此封裝方式提升了線(xiàn)密度至5微米,通過(guò)三層金屬線(xiàn)設計減小了芯片面積,降低了芯片的厚度。優(yōu)化了散熱與電氣性能,封裝后的M.2卡為AI PC提供了dNPU解決方案。
      眾所周知,無(wú)生態(tài)不AI。而在軟件層面,AE7100實(shí)現了從底層指令集到上層驅動(dòng)的全面兼容,巧妙沿用英偉達軟件棧,并進(jìn)行了SIMT指令集、驅動(dòng)層和開(kāi)發(fā)庫的優(yōu)化,極大地提升了開(kāi)發(fā)效率與邏輯實(shí)現的直觀(guān)性。由于該加速卡兼容CUDA和ONNX,能夠滿(mǎn)足各類(lèi)AI應用的多樣化需求,其高算力和出色的內存帶寬確保了數據的高效穩定處理與傳輸。
      對于A(yíng)I PC 來(lái)說(shuō),依靠本地算力能夠推動(dòng)更大參數規模的模型推理亦是AI PC功能實(shí)現的關(guān)鍵。而芯動(dòng)力的M.2加速卡已可完美支撐大模型在A(yíng)I PC等設備上的流暢運行,并且適配了Deepseek、Llama3-8B、Stable Diffusion、通義千問(wèn)等開(kāi)源模型。
      在聯(lián)想將芯動(dòng)力RPP架構GPGPU命名為dNPU之際,也表明dNPU正成為推動(dòng)AI PC蓬勃發(fā)展的關(guān)鍵驅動(dòng)力,不僅能夠提升AI模型的推理速度、降低功耗與提升能效,還可支持多樣化的AI應用,推動(dòng)AI PC的創(chuàng )新與落地。有判斷稱(chēng),未來(lái)dNPU極有可能如同當下的GPU一般,成為電腦的一項常規可選配置,一旦電腦配備dNPU,用戶(hù)便能在終端設備上自由地提出問(wèn)題,它會(huì )憑借強大的運算能力迅速給出精準解答。
      從成本角度來(lái)看,傳統做法是將dNPU集成到CPU中,這會(huì )導致成本大幅增加。以某大廠(chǎng)處理器為例,采用3NM工藝制造,其研發(fā)與生產(chǎn)成本極高,導致產(chǎn)品價(jià)格居高不下,而大多消費者對這種高成本的配置并沒(méi)有強烈需求。與之相比,將dNPU作為獨立的標準化插件,具有更高的性?xún)r(jià)比和靈活性。
      屆時(shí),dNPU將作為標準化插件,廣泛出現在市面上所有可選擇配置的電腦機型中。無(wú)論是追求極致性能的專(zhuān)業(yè)人士,還是日常使用電腦的普通用戶(hù),都能從中受益。它將為各類(lèi)用戶(hù)提供強大的AI運算支持,極大地提升電腦在如智能語(yǔ)音交互、圖像識別處理、數據分析預測等豐富多樣的人工智能應用場(chǎng)景下的性能表現,為用戶(hù)帶來(lái)更為高效、智能的使用體驗 。

      持續精進(jìn)RPP和適配大模型 邁向芯征程
      所謂眾行者遠。芯動(dòng)力作為聯(lián)想AI PC產(chǎn)品dNPU方案的合作伙伴,不僅是對芯動(dòng)力GPGPU創(chuàng )新性架構的最佳背書(shū),還為AI PC等端側設備提供了革命性支持,解決了大模型在端側部署的關(guān)鍵技術(shù)難題。這一創(chuàng )新技術(shù)必將加速大模型在端側設備的普及與應用,為行業(yè)創(chuàng )造前所未有的價(jià)值。
      不僅如此,它在工業(yè)自動(dòng)化、泛安防、內容過(guò)濾、醫療影像及信號處理等眾多領(lǐng)域都展現出了廣泛的應用潛力,為邊緣AI的智能化發(fā)展提供了強大的動(dòng)力。
      展望未來(lái),隨著(zhù)大語(yǔ)言模型向支持多模態(tài)、多專(zhuān)家系統的復雜模型轉變,對存儲能力和計算靈活性要求更高,可重構芯片以其低功耗和高靈活性將成為極具潛力的解決方案。
      而且,算力產(chǎn)品與各類(lèi)模型的適配將成為標準化的流程,模型適配程度將直接影響應用了算力產(chǎn)品的AI PC在模型推理方面的表現。同時(shí),算力廠(chǎng)商不能只針對特定的應用進(jìn)行調優(yōu),鑒于A(yíng)I PC中應用將主要以插件的形式被大模型調用,對各類(lèi)大小模型以及其調用的應用進(jìn)行綜合適配才最為重要。因而,AI算力廠(chǎng)商還要持續深入建立通用、兼容的AI開(kāi)發(fā)框架,并降低大模型和應用開(kāi)發(fā)適配門(mén)檻。
      芯動(dòng)力還觀(guān)察到,邊緣計算作為云端算力有效補充,是AI大模型落地的必然趨勢。未來(lái)邊緣AI時(shí)代加速到來(lái),將滲透至物理世界各個(gè)角落,持續打造高性?xún)r(jià)比dNPU、適配DeepSeek等新型大模型等是AI芯片廠(chǎng)商的“馬拉松”。芯動(dòng)力將繼續秉承創(chuàng )新精神,基于RPP架構實(shí)現算力及性?xún)r(jià)比的持續提升,還將推出基于RPP集成Chiplet的8nm R36 GPU,2027年將推出更高性能的3nm R72 GPU。同時(shí),深入提升軟件適配能力,強化對更大規模模型的支持,擴展智算生態(tài)合作圈,全面推動(dòng)邊緣AI技術(shù)的部署與落地。
      DeepSeek的技術(shù)突破,使AI更高效、更低成本地部署在端側設備,推動(dòng)AIoT持續邁向“萬(wàn)物智聯(lián)”。我們有理由相信,基于RPP架構的GPU及后續更高性能的迭代芯片不僅是AIPC加速處理器的理想選擇,在對延遲、功耗和體積有著(zhù)極高要求的邊緣應用中也將持續綻放光芒。

本文地址:http://selenalain.com/thread-883633-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页