HPC 研究人員借助 NVIDIA BlueField DPU 為網(wǎng)絡(luò )計算的未來(lái)打下堅實(shí)基礎

發(fā)布時(shí)間:2022-5-31 16:25    發(fā)布者:eechina
關(guān)鍵詞: HPC , DPU , BlueField , 網(wǎng)絡(luò )計算
全球的超級計算中心都在紛紛利用 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò )上的NVIDIA BlueField DPU 將加速計算提升到一個(gè)新的水平

在歐洲和美國,HPC 開(kāi)發(fā)者正在利用 NVIDIA BlueField-2 DPU 內的 Arm 核和加速器的強大功能為超級計算機提供強大助力。

美國洛斯阿拉莫斯國家實(shí)驗室 (LANL) 正在與 NVIDIA 進(jìn)行一項為期多年的廣泛合作,這項合作旨在將計算型多物理應用的性能提高 30 倍。

LANL 研究人員預計,使用在 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò )上運行的 DPU(數據處理器)可顯著(zhù)提升性能。這將使利用 BlueField 以及NVIDIA DOCA 軟件框架在計算存儲、模式匹配等領(lǐng)域實(shí)現技術(shù)創(chuàng )新。

面向 DPU 的開(kāi)放式 API

這些努力還將有助于進(jìn)一步定義 OpenSNAPI,任何人都可通過(guò)該應用接口來(lái)控制 DPU。這是統計計算框架( Unified Communication Framework) 的一個(gè)項目,Unified Communication Framework 是一個(gè)旨在實(shí)現 HPC 應用異構計算的聯(lián)盟,成員包括 Arm、IBM、NVIDIA、美國國家實(shí)驗室和美國的一些大學(xué)。

LANL 已經(jīng)感受到網(wǎng)絡(luò )計算的強大功能,這要歸功于其創(chuàng )建的 DPU 賦能的存儲系統。

加速閃存盒(ABoF,如下圖所示)將固態(tài)存儲與 DPU 和 InfiniBand 加速器相結合,可為 Linux 文件系統的關(guān)鍵性能部分提供加速。它的性能高達同類(lèi)存儲系統的 30 倍,并將成為 LANL 基礎架構中的關(guān)鍵組件。

一位研究人員在近期的 LANL 博客中表示:“ABoF 讓計算靠近存儲,可更大限度減少數據移動(dòng),從而提高仿真和數據分析工作流程的效率!

德克薩斯州打造出云原生超級計算平臺

德克薩斯高級計算中心 (TACC) 近期也開(kāi)始在 Dell PowerEdge 服務(wù)器中采用 BlueField-2。它將在 InfiniBand 網(wǎng)絡(luò )上使用 DPU,使其 Lonestar6 系統成為云原生超級計算的開(kāi)發(fā)平臺。

TACC 的 Lonestar6 為德州農工大學(xué)、德州理工大學(xué)和北德克薩斯大學(xué)的眾多 HPC 開(kāi)發(fā)者,以及一些研究中心和教職人員提供服務(wù)。

MPI 獲得加速

在距 TACC 東北部 1200 英里的地方,俄亥俄州立大學(xué)的研究人員展示了 DPU 如何將一個(gè) HPC 熱門(mén)編程模型的運行速度提高 26%。

他們通過(guò)卸載消息傳遞接口 (MPI) 的關(guān)鍵部分,加速了 P3DFFT,這是一個(gè)用于眾多大規模 HPC 仿真的數學(xué)庫。

俄亥俄州立大學(xué)計算機科學(xué)與工程專(zhuān)業(yè)的教授 Dhabaleswar K. (DK) Panda 在其帶領(lǐng)的 MVAPICH 開(kāi)源軟件團隊推動(dòng) DPU 工作,他表示:“DPU 就像是為忙碌的高管處理工作的助手,它們將成為主流,因為它們可以加速運行各種工作負載!

HPC 中心和云中的 DPU

對于運行藥物研發(fā)或飛機設計等 HPC 仿真應用的超級計算機而言,高達兩位數的性能加速是驚人的。Panda 表示,云服務(wù)可以利用這些加速提高客戶(hù)的生產(chǎn)力,他已收到多個(gè) HPC 中心的代碼請求。

Quantum InfiniBand 網(wǎng)絡(luò )以及 NVIDIA SHARP 特性,助力他高效完成工作。

他說(shuō):“其他人還在談?wù)摼W(wǎng)絡(luò )計算,而 InfiniBand 已經(jīng)在為它提供支持!

達勒姆開(kāi)發(fā)負載均衡

歐洲的多個(gè)研究團隊正利用 BlueField DPU 加速 MPI 和其他 HPC 工作負載。

例如,英格蘭北部的達勒姆大學(xué)正在開(kāi)發(fā)一款軟件,用于在 16 個(gè)節點(diǎn)的 Dell PowerEdge 集群上使用 BlueField DPU 以實(shí)現 MPI 作業(yè)的負載均衡。該項目的首席調查員 Tobias Weinzierl 表示,該軟件將為全球各地的 HPC 設施更高效地處理更好算法鋪平道路。

劍橋大學(xué)和慕尼黑的 DPU 應用

劍橋大學(xué)、倫敦和慕尼黑的研究人員也在使用 DPU。

倫敦大學(xué)學(xué)院正在探索如何在 BlueField-2 DPU 上為主機系統調度作業(yè)。例如,可以使用它的能力在主機處理器之間移動(dòng)數據,以便在需要時(shí)數據已然就位。
Dell PowerEdge 服務(wù)器內的 BlueField DPU 可為 Cambridge Service for Data Driven Discovery 服務(wù)卸載主機 CPU 的安全策略、存儲框架和其他作業(yè),從而更大限度地提高系統性能。

與此同時(shí),慕尼黑工業(yè)大學(xué)計算機體系架構和并行系統組的研究人員正在尋找方法,使用 DPU 來(lái)卸載 MPI 和操作系統任務(wù),這是 EuroHPC 項目的一部分。

在美國,佐治亞理工學(xué)院的研究人員正在與桑迪亞國家實(shí)驗室合作,利用 BlueField-2 DPU 加速分子動(dòng)力學(xué)研究。一篇論文描述了他們目前的工作成果,其中表明,算法可以加速高達 20%,且不會(huì )損失模擬的準確性。

不斷擴展的網(wǎng)絡(luò )

本月早些時(shí)候,日本研究人員宣布將推出一款采用新版 NVIDIA H100 Tensor Core GPU 的系統,該系統將搭載速度更快、更智能的 NVIDIA Quantum-2 InfiniBand 網(wǎng)絡(luò )平臺。

NEC 將使用 H100 的為筑波大學(xué)計算科學(xué)中心構建算力大約為 6 PFLOPS 超級計算機。研究人員將使用該系統實(shí)現氣候學(xué)、天體物理學(xué)、大數據、AI 和更多方面的研究。

與此同時(shí),Panda 等研究人員已經(jīng)開(kāi)始考慮如何使用 BlueField-3 DPU 的核心功能。

他打趣道:“這就像雇傭擁有大學(xué)學(xué)位的行政助理,而不是那些擁有高中文憑的行政助理一樣,所以我希望能夠完成越來(lái)越多的工作卸載!

本文地址:http://selenalain.com/thread-791766-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页