邊緣AI廣泛應用推動(dòng)并行計算崛起及創(chuàng )新GPU滲透率快速提升

發(fā)布時(shí)間:2025-6-11 19:49    發(fā)布者:eechina
關(guān)鍵詞: 邊緣計算 , 邊緣AI , GPU
作者: Imagination Technologies 的產(chǎn)品管理副總裁 Dennis Laudick

人工智能(AI)在邊緣計算領(lǐng)域正經(jīng)歷著(zhù)突飛猛進(jìn)的高速發(fā)展,根據IDC的最新數據,全球邊緣計算支出將從2024年的2280億美元快速增長(cháng)到2028年的3780億美元*。這種需求的增長(cháng)速度,以及在智能制造、智慧城市等數十個(gè)行業(yè)中越來(lái)越多的應用場(chǎng)景中出現的滲透率快速提升,也為執行計算任務(wù)的硬件設計以及面對多樣化場(chǎng)景的模型迭代的速度帶來(lái)了挑戰。

AI不僅是一項技術(shù)突破,它更是軟件編寫(xiě)、理解和執行方式的一次永久性變革。傳統的軟件開(kāi)發(fā)基于確定性邏輯和大多是順序執行的流程,而如今這一范式正在讓位于概率模型、訓練行為以及數據驅動(dòng)的計算。這并不是一時(shí)的潮流。AI 代表了計算機科學(xué)的一次根本性、不可逆的轉變 —— 從基于規則的編程,邁向自適應的、基于學(xué)習的系統,這些系統正逐步被集成到越來(lái)越廣泛的計算問(wèn)題與能力中。

這一轉變也對硬件提出了相應的變革需求。在A(yíng)I架構和算法不斷演進(jìn)(并將持續演進(jìn))的時(shí)代,為狹窄定義任務(wù)而打造的高度專(zhuān)用芯片的舊模式已不再適用。為了滿(mǎn)足不斷變化的AI需求(尤其是在邊緣側),我們需要具備與工作負載同樣動(dòng)態(tài)、適應能力強的計算平臺。

這正是通用并行處理器(即GPU)成為邊緣AI未來(lái)的關(guān)鍵所在,并開(kāi)始取代專(zhuān)門(mén)的處理器,如神經(jīng)網(wǎng)絡(luò )處理器(NPU)。這不僅僅是性能上的考量——它關(guān)乎靈活性、可擴展性,以及與未來(lái)軟件發(fā)展趨勢的同步。

Makimoto波動(dòng)理論與“靈活性”的回歸

要理解這一轉變,我們只需回顧“Makimoto波動(dòng)理論”:這是由日本工程師牧本次雄(Tsugio Makimoto)提出的一個(gè)概念,描述了計算產(chǎn)業(yè)在不同階段不斷在“標準化”與“定制化”之間擺動(dòng)的趨勢,其背后是市場(chǎng)需求、技術(shù)創(chuàng )新和軟件復雜性等因素的持續變化。

(Makimoto 波動(dòng)理論展現了計算產(chǎn)業(yè)在“靈活性”與“專(zhuān)用性”之間的歷史擺動(dòng)。而當前AI的發(fā)展軌跡,標志著(zhù)計算正再次呈現出在“靈活性”和“通用平臺”之間的擺動(dòng)。)

這一模型與AI硬件的演變過(guò)程高度契合。在A(yíng)I發(fā)展的早期階段,工作負載較為明確且穩定,此時(shí)采用NPU等固定功能加速器是合理的。這類(lèi)處理器對特定任務(wù)(例如使用CNN進(jìn)行圖像分類(lèi)或目標檢測)進(jìn)行了深度優(yōu)化。

但如今AI已進(jìn)入高速演進(jìn)階段。我們已走出簡(jiǎn)單、靜態(tài)模型的時(shí)代,邁入混合網(wǎng)絡(luò )、Transformer架構、基礎模型和持續創(chuàng )新的浪潮之中。為去年AI打造的定制硬件,根本無(wú)法跟上當今的發(fā)展節奏。

正如我們在本文一開(kāi)始所介紹的那樣,當一個(gè)行業(yè)不得不去面對超高的增長(cháng)率,以及每天都在不斷出現的新應用場(chǎng)景和為此而快速迭代的模型,使我們再次站在了“Makimoto拐點(diǎn)”上 —— 從專(zhuān)用硬件,回歸到可擴展、可適配的通用計算平臺。

AI是一個(gè)并行計算問(wèn)題,而非專(zhuān)用計算問(wèn)題

AI的本質(zhì)在于并行計算。深度學(xué)習嚴重依賴(lài)并發(fā)操作 —— 矩陣運算、張量乘法、向量計算 —— 這些正是GPU天生擅長(cháng)的工作負載。能夠同時(shí)渲染數百萬(wàn)像素的架構,如今正好可以處理數百萬(wàn)神經(jīng)元的激活。

如今的通用GPU早已不僅僅用于圖形處理。它們擁有可編程管線(xiàn)、計算著(zhù)色器,以及日益增強的AI中心化設計,不僅能加速傳統負載,也能支持新興的AI工作負載,是邊緣AI中強大而靈活的計算引擎。

相比之下,像NPU這樣的專(zhuān)用處理器則難以應對持續的變革。它們對特定操作進(jìn)行了優(yōu)化,而當AI領(lǐng)域快速演進(jìn)時(shí),這些芯片便迅速被淘汰。顯然,面對這種全新的軟件范式,我們需要的是一種通用的、并行的、靈活的硬件平臺 —— GPU。

為什么通用平臺在邊緣側更具優(yōu)勢

邊緣AI不僅需要性能,更需要適應性、可重用性與較長(cháng)的生命周期;隨著(zhù)AI處理器的設計越來(lái)越復雜,且隨著(zhù)市場(chǎng)規模的擴大會(huì )吸引更多的玩家,大家都爭相采用更先進(jìn)的工藝來(lái)實(shí)現性?xún)r(jià)比和功耗的優(yōu)化,以及在生態(tài)建設方面的大量花費,使得每個(gè)芯片項目的投入正變得越來(lái)越高。針對這些技術(shù)經(jīng)濟學(xué)挑戰,現代GPU等通用并行處理器在這幾個(gè)方面均具備明顯優(yōu)勢:
靈活性:可編程,能夠支持新的模型類(lèi)型而無(wú)需更換硬件;
可擴展性:可適配從物聯(lián)網(wǎng)(IoT)傳感器到智能攝像頭再到自動(dòng)駕駛汽車(chē)等各種邊緣設備;
軟件生態(tài)成熟:擁有豐富的開(kāi)源工具與開(kāi)發(fā)標準(如OpenCL、LiteRT和TVM);
可持續性:延長(cháng)產(chǎn)品生命周期,減少不斷重新設計芯片的需求。

簡(jiǎn)而言之,GPU的通用并行計算從架構層面就為AI的持續演進(jìn)而設計。而GPU領(lǐng)域內的本身創(chuàng )新也在快速驗證這一趨勢,例如Imagination在不久前發(fā)布的E系列GPU就具有突破性的高效并行處理架構,在提供卓越圖形性能的同時(shí),針對人工智能工作負載,其 INT8/FP8 算力可在 2 到 200 TOPS 之間擴展。

展望未來(lái)

盡管有越來(lái)越多的證據說(shuō)明GPU具備的優(yōu)勢,市場(chǎng)仍然習慣將AI加速與NPU或定制芯片劃等號。但正如圖形行業(yè)早年發(fā)現,固定功能的圖形管線(xiàn)無(wú)法跟上游戲創(chuàng )新的節奏;如今AI行業(yè)也發(fā)現:固定硬件無(wú)法匹配快速變化的軟件需求。

是時(shí)候重新教育整個(gè)生態(tài)了。邊緣AI的未來(lái)不屬于那些高度優(yōu)化但功能狹窄的芯片,而是屬于可編程的、可適配的并行計算平臺,它們能與智能軟件共同成長(cháng)并擴展。諸如Imagination全新的E系列GPU,它為未來(lái)的邊緣應用提供了一種通用且可編程的解決方案,涵蓋圖形渲染、桌面和智能手機等領(lǐng)域,可實(shí)現自然語(yǔ)言處理、工業(yè)計算機視覺(jué)以及自動(dòng)駕駛等應用。

幾十年前,Makimoto就洞察了這一趨勢。如今,我們正在親身經(jīng)歷他的遠見(jiàn) —— 順應著(zhù)通用性和靈活性的浪潮前行。GPU 不再是追趕者,它已處于領(lǐng)先位置。

關(guān)于作者

Dennis Laudick擔任Imagination Technologies 的產(chǎn)品管理副總裁。在加入公司之前,Dennis 曾在 Arm 任職超過(guò)13年,擔任汽車(chē)、AI和 GPU 相關(guān)業(yè)務(wù)的產(chǎn)品與市場(chǎng)領(lǐng)導職務(wù)。在此之前,他還曾在多家半導體與OEM巨頭企業(yè)擔任高級管理崗位。

本文地址:http://selenalain.com/thread-888677-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页