SHMT技術(shù)推動(dòng)計算變革:不動(dòng)硬件,速度翻番、能耗減半

發(fā)布時(shí)間:2024-2-25 11:02    發(fā)布者:eechina
關(guān)鍵詞: SHMT
來(lái)源:IT之家

在第 56 屆 IEEE / ACM 微體系結構國際研討會(huì )上,美國加州大學(xué)河濱分校(UCR)的研究人員展示了一種全新的方法,可以實(shí)現計算速度翻番、能耗減半的效果。

研究人員表示這項技術(shù)理論上適用于從智能手機到數據中心服務(wù)器的任何處理器和加速器,但需要進(jìn)一步地開(kāi)發(fā)適配。

加利福尼亞大學(xué)電氣與計算機工程系副教授、本研究報告的共同作者曾宏偉(Hung-Wei Tseng)表示:

你不需要增加新的處理器,可以在現有計算機平臺上部署。這項技術(shù)的核心,是幫助你更合理高效地管理可用硬件資源。

研究人員開(kāi)發(fā)的平臺打破了傳統的編程模式,團隊將其稱(chēng)為同步異構多線(xiàn)程(SHMT)。傳統編程模式是在一段時(shí)間內,只向系統的一個(gè)計算組件(中央處理器、圖形處理器、張量處理器或其他處理器或加速器)提供數據,而 SHMT 技術(shù)在所有組件之間同時(shí)并行執行代碼。


傳統、現代異構和 SHMT 的并行化方法比較

SHMT 采用質(zhì)量感知工作偷。≦AWS)調度策略,保持平衡控制計算質(zhì)量和工作負載,因此降低了資源調用。

SHMT runtime 系統將創(chuàng )建一組虛擬操作(vOPS),并劃分為一個(gè)或多個(gè)高級操作(HLOP),以便同時(shí)使用多個(gè)硬件資源。


根據所選政策加速 SHMT 計算


傳統計算與 SHMT 的活動(dòng)和閑置消耗比較

SHMT runtime 系統將 HLOPS 分配到任務(wù)隊列,在目標硬件上運行。由于 HLOPS 與硬件無(wú)關(guān),runtime 系統可根據需要將任務(wù)重定向到計算平臺的一個(gè)或另一個(gè)組件。

研究人員以他們創(chuàng )建的測試平臺為例,展示了新軟件庫的有效性。他們創(chuàng )造了一種混合體,既可以被視為智能手機,也可以被視為一種個(gè)人電腦,甚至是服務(wù)器。



該測試平臺基于一塊帶有 PCIe 接口的背板,一臺搭載英偉達 Nano Jetson 模塊組的“計算單元”,通過(guò) M.2 Key E 插槽連接谷歌 Edge 加速器(TPU)。該模塊帶有四核 ARM Cortex-A57 處理器(CPU)和 128 個(gè) Maxwell 架構圖形內核(GPU)。

本系統的主內存為 4 GB LPDDR4,頻率為 1600 MHz,速度為 25.6 Gbps,用于存儲一般數據。Edge TPU 模塊額外包含 8 MB 內存,并使用 Ubuntu Linux 18.04 作為操作系統。

在一個(gè)使用標準測試應用程序的簡(jiǎn)易異構平臺上運行 SHMT 軟件包的結果表明,與基本計算分配方法相比,采用最有效策略的 QAWS 框架的計算速度提高了 1.95 倍,消耗顯著(zhù)降低了 51%。

這種方法如果應用于數據中心,可以在保持現有硬件不變的情況下,最大化性能收益。目前,所提出的解決方案尚未準備好付諸實(shí)施,但肯定會(huì )有很多人對此感興趣。
本文地址:http://selenalain.com/thread-851684-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页