Graphcore公布首次MLPerf提交結果，AI性能穩居領(lǐng)先地位

發(fā)布時(shí)間：2021-7-1 21:14 發(fā)布者：eechina

關(guān)鍵詞： Graphcore , IPU , POD64 , MLPerf

今天Graphcore（擬未科技）正式公布其參與的首次MLPerf提交結果，Graphcore產(chǎn)品表現優(yōu)異，AI性能穩居領(lǐng)先地位。MLPerf是AI行業(yè)最受認可的比較基準測試。此次測試結果顯示，在Graphcore IPU-POD64上，BERT的訓練時(shí)間只有9分多鐘，ResNet-50的訓練時(shí)間為14.5分鐘，AI性能已達超級計算機級別。

MLPerf還對比了市面上的Graphcore系統與NVIDIA的最新產(chǎn)品，結果證實(shí)Graphcore在“每美元性能”（Performance-Per-Dollar）指標上穩居領(lǐng)先地位。對客戶(hù)而言，這項重要的第三方測試確認了Graphcore系統不僅具有新一代AI的優(yōu)異性能，同時(shí)在目前的廣泛應用中也表現得更出色。

MLPerf基準測試

對于第一次MLPerf（訓練版本1.0）提交，Graphcore選擇聚焦在關(guān)鍵圖像分類(lèi)和自然語(yǔ)言處理的應用基準測試類(lèi)別。MLPerf圖像分類(lèi)基準使用流行的ResNet-50版本1.5模型，在ImageNet數據集上訓練,以達到適用于所有提交情況的準確率。對于自然語(yǔ)言處理，使用了BERT-Large模型和選取的一個(gè)代表性片段。該片段大約占總訓練計算工作負載的10%，并使用維基百科數據集進(jìn)行訓練。Graphcore決定提交使用ResNet-50和BERT的圖像分類(lèi)和自然語(yǔ)言處理，在很大程度上是由客戶(hù)和潛在客戶(hù)驅動(dòng)的，因為這是他們最常用的一些應用和模型。此次在MLPerf測試中的強勁表現，進(jìn)一步證明了Graphcore系統完全可以滿(mǎn)足當今的AI計算要求。

參與測試的兩個(gè)Graphcore系統，IPU-POD16和IPU-POD64，均已在生產(chǎn)中交付給客戶(hù)。

• 價(jià)格實(shí)惠、結構緊湊的5U IPU-POD16系統適用于剛開(kāi)始構建IPU AI計算能力的企業(yè)客戶(hù)。它由4個(gè)1U的IPU-M2000和1個(gè)雙CPU服務(wù)器（dual-CPU server）組成，可以提供4 PetaFLOPS的AI處理能力。
• 縱向擴展的IPU-POD64包含16個(gè)IPU-M2000和數量靈活的服務(wù)器。Graphcore系統實(shí)現了服務(wù)器和AI加速器的解耦，因此客戶(hù)可以根據工作負載指定CPU與IPU的比率。例如，和自然語(yǔ)言處理相比，計算機視覺(jué)任務(wù)通常對服務(wù)器的需求更高。對于MLPerf，IPU-POD64在BERT的提交中使用了1臺服務(wù)器，在ResNet-50的提交中使用了4臺服務(wù)器。每臺服務(wù)器均由2個(gè)AMD EPYC CPU驅動(dòng)。

MLPerf測試包含開(kāi)放分區和封閉分區兩個(gè)提交分區。封閉分區嚴格要求提交者使用完全相同的模型實(shí)施和優(yōu)化器方法，包括定義超參數狀態(tài)和訓練時(shí)期。開(kāi)放分區保證和封閉分區完全相同的模型準確性和質(zhì)量，但支持更靈活的模型實(shí)施以促進(jìn)創(chuàng )新。因此，該分區支持更快的模型實(shí)現，更加適應不同的處理器功能和優(yōu)化器方法。對于像Graphcore IPU這樣的創(chuàng )新架構，開(kāi)放分區更能體現出產(chǎn)品的優(yōu)異性能，但Graphcore還是選擇在開(kāi)放和封閉分區都進(jìn)行了提交。

測試結果體現了Graphcore系統的優(yōu)異性能，即使在具有限制規格的開(kāi)箱即用的封閉分區上也是如此。更令人矚目的是開(kāi)放分區結果，Graphcore能夠在其中優(yōu)化部署，以充分利用IPU和系統功能。這更貼近真實(shí)應用，支持客戶(hù)可以不斷提升其系統性能。

“每美元性能”指標

MLPerf被稱(chēng)為比較基準，實(shí)際上進(jìn)行直接比較可能很復雜。從相對簡(jiǎn)單的硅片到有著(zhù)昂貴存儲的復雜堆棧式芯片，如今的處理器和系統架構可謂千差萬(wàn)別。從“每美元性能”角度來(lái)看，往往最能夠說(shuō)明問(wèn)題。

Graphcore的IPU-POD16是一個(gè)5U的系統，標價(jià)149,995美元。如前所述，它由4個(gè)IPU-M2000加速器以及行業(yè)標準主機服務(wù)器構成。每個(gè)IPU-M2000由4個(gè)IPU處理器構成。MLPerf中使用的NVIDIA DGX-A100 640GB是一個(gè)6U機盒，標價(jià)約為300,000美元（基于市場(chǎng)情報和公布的經(jīng)銷(xiāo)商定價(jià)），有8個(gè)DGX A100芯片。IPU-POD16的價(jià)格是它的一半。在這個(gè)系統中，IPU-M2000的價(jià)格和一個(gè)DGX A100 80GB的價(jià)格是一樣的，或者在更細的層次上，一個(gè)IPU的價(jià)格是它的四分之一。

在MLPerf比較分析中，Graphcore采用了嚴格監管的封閉分區的結果，并針對系統價(jià)格對其進(jìn)行了歸一化。對于ResNet-50和BERT，很明顯Graphcore系統提供了比NVIDIA產(chǎn)品更好的每美元性能。在IPU-POD16上進(jìn)行ResNet-50訓練的情況下，Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上，Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系統的經(jīng)濟性可以更好地幫助客戶(hù)實(shí)現其AI計算目標，同時(shí)，由于IPU專(zhuān)為AI構建的架構特點(diǎn)，Graphcore系統還可以解鎖下一代模型和技術(shù)。

Graphcore高級副總裁兼中國區總經(jīng)理盧濤表示：“首次提交MLPerf就獲得如此出色的成績(jì)，我們感到非常自豪。此次測試還會(huì )帶給Graphcore客戶(hù)更多價(jià)值，因為我們在準備階段所做的所有改進(jìn)和優(yōu)化都會(huì )反饋到Graphcore軟件棧中。全球范圍內的Graphcore用戶(hù)都會(huì )從MLPerf測試中受益匪淺，不僅局限于BERT和ResNet-50模型。我們將繼續參與包括訓練和推理在內的MLPerf測試，為追求更優(yōu)性能、更大規模和添加更多模型，貢獻Graphcore的所有智慧和力量�！�

本文地址：http://selenalain.com/thread-769813-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

相關(guān)文章

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页