Graphcore公布首次MLPerf提交結果,AI性能穩居領(lǐng)先地位

發(fā)布時(shí)間:2021-7-1 21:14    發(fā)布者:eechina
關(guān)鍵詞: Graphcore , IPU , POD64 , MLPerf
今天Graphcore(擬未科技)正式公布其參與的首次MLPerf提交結果,Graphcore產(chǎn)品表現優(yōu)異,AI性能穩居領(lǐng)先地位。MLPerf是AI行業(yè)最受認可的比較基準測試。此次測試結果顯示,在Graphcore IPU-POD64上,BERT的訓練時(shí)間只有9分多鐘,ResNet-50的訓練時(shí)間為14.5分鐘,AI性能已達超級計算機級別。

MLPerf還對比了市面上的Graphcore系統與NVIDIA的最新產(chǎn)品,結果證實(shí)Graphcore在“每美元性能”(Performance-Per-Dollar)指標上穩居領(lǐng)先地位。對客戶(hù)而言,這項重要的第三方測試確認了Graphcore系統不僅具有新一代AI的優(yōu)異性能,同時(shí)在目前的廣泛應用中也表現得更出色。

MLPerf基準測試

對于第一次MLPerf(訓練版本1.0)提交,Graphcore選擇聚焦在關(guān)鍵圖像分類(lèi)和自然語(yǔ)言處理的應用基準測試類(lèi)別。MLPerf圖像分類(lèi)基準使用流行的ResNet-50版本1.5模型,在ImageNet數據集上訓練,以達到適用于所有提交情況的準確率。對于自然語(yǔ)言處理,使用了BERT-Large模型和選取的一個(gè)代表性片段。該片段大約占總訓練計算工作負載的10%,并使用維基百科數據集進(jìn)行訓練。Graphcore決定提交使用ResNet-50和BERT的圖像分類(lèi)和自然語(yǔ)言處理,在很大程度上是由客戶(hù)和潛在客戶(hù)驅動(dòng)的,因為這是他們最常用的一些應用和模型。此次在MLPerf測試中的強勁表現,進(jìn)一步證明了Graphcore系統完全可以滿(mǎn)足當今的AI計算要求。

參與測試的兩個(gè)Graphcore系統,IPU-POD16和IPU-POD64,均已在生產(chǎn)中交付給客戶(hù)。

•        價(jià)格實(shí)惠、結構緊湊的5U IPU-POD16系統適用于剛開(kāi)始構建IPU AI計算能力的企業(yè)客戶(hù)。它由4個(gè)1U的IPU-M2000和1個(gè)雙CPU服務(wù)器(dual-CPU server)組成,可以提供4 PetaFLOPS的AI處理能力。
•        縱向擴展的IPU-POD64包含16個(gè)IPU-M2000和數量靈活的服務(wù)器。Graphcore系統實(shí)現了服務(wù)器和AI加速器的解耦,因此客戶(hù)可以根據工作負載指定CPU與IPU的比率。例如,和自然語(yǔ)言處理相比,計算機視覺(jué)任務(wù)通常對服務(wù)器的需求更高。對于MLPerf,IPU-POD64在BERT的提交中使用了1臺服務(wù)器,在ResNet-50的提交中使用了4臺服務(wù)器。每臺服務(wù)器均由2個(gè)AMD EPYC CPU驅動(dòng)。

MLPerf測試包含開(kāi)放分區和封閉分區兩個(gè)提交分區。封閉分區嚴格要求提交者使用完全相同的模型實(shí)施和優(yōu)化器方法,包括定義超參數狀態(tài)和訓練時(shí)期。開(kāi)放分區保證和封閉分區完全相同的模型準確性和質(zhì)量,但支持更靈活的模型實(shí)施以促進(jìn)創(chuàng )新。因此,該分區支持更快的模型實(shí)現,更加適應不同的處理器功能和優(yōu)化器方法。對于像Graphcore IPU這樣的創(chuàng )新架構,開(kāi)放分區更能體現出產(chǎn)品的優(yōu)異性能,但Graphcore還是選擇在開(kāi)放和封閉分區都進(jìn)行了提交。

測試結果體現了Graphcore系統的優(yōu)異性能,即使在具有限制規格的開(kāi)箱即用的封閉分區上也是如此。更令人矚目的是開(kāi)放分區結果,Graphcore能夠在其中優(yōu)化部署,以充分利用IPU和系統功能。這更貼近真實(shí)應用,支持客戶(hù)可以不斷提升其系統性能。


“每美元性能”指標

MLPerf被稱(chēng)為比較基準,實(shí)際上進(jìn)行直接比較可能很復雜。從相對簡(jiǎn)單的硅片到有著(zhù)昂貴存儲的復雜堆棧式芯片,如今的處理器和系統架構可謂千差萬(wàn)別。從“每美元性能”角度來(lái)看,往往最能夠說(shuō)明問(wèn)題。

Graphcore的IPU-POD16是一個(gè)5U的系統,標價(jià)149,995美元。如前所述,它由4個(gè)IPU-M2000加速器以及行業(yè)標準主機服務(wù)器構成。每個(gè)IPU-M2000由4個(gè)IPU處理器構成。MLPerf中使用的NVIDIA DGX-A100 640GB是一個(gè)6U機盒,標價(jià)約為300,000美元(基于市場(chǎng)情報和公布的經(jīng)銷(xiāo)商定價(jià)),有8個(gè)DGX A100芯片。IPU-POD16的價(jià)格是它的一半。在這個(gè)系統中,IPU-M2000的價(jià)格和一個(gè)DGX A100 80GB的價(jià)格是一樣的,或者在更細的層次上,一個(gè)IPU的價(jià)格是它的四分之一。

在MLPerf比較分析中,Graphcore采用了嚴格監管的封閉分區的結果,并針對系統價(jià)格對其進(jìn)行了歸一化。對于ResNet-50和BERT,很明顯Graphcore系統提供了比NVIDIA產(chǎn)品更好的每美元性能。在IPU-POD16上進(jìn)行ResNet-50訓練的情況下,Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上,Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系統的經(jīng)濟性可以更好地幫助客戶(hù)實(shí)現其AI計算目標,同時(shí),由于IPU專(zhuān)為AI構建的架構特點(diǎn),Graphcore系統還可以解鎖下一代模型和技術(shù)。

Graphcore高級副總裁兼中國區總經(jīng)理盧濤表示:“首次提交MLPerf就獲得如此出色的成績(jì),我們感到非常自豪。此次測試還會(huì )帶給Graphcore客戶(hù)更多價(jià)值,因為我們在準備階段所做的所有改進(jìn)和優(yōu)化都會(huì )反饋到Graphcore軟件棧中。全球范圍內的Graphcore用戶(hù)都會(huì )從MLPerf測試中受益匪淺,不僅局限于BERT和ResNet-50模型。我們將繼續參與包括訓練和推理在內的MLPerf測試,為追求更優(yōu)性能、更大規模和添加更多模型,貢獻Graphcore的所有智慧和力量!

本文地址:http://selenalain.com/thread-769813-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页