來(lái)源:21世紀經(jīng)濟報道 AI芯片的戰役正愈演愈烈。 7月11日,英特爾(33.98, 0.68, 2.04%)面向中國市場(chǎng)推出了AI芯片Habana Gaudi 2,Gaudi 2直接對標英偉達GPU的100系列,欲爭奪AI算力市場(chǎng)的寶座。 眾所周知,目前GPU資源緊缺,英偉達的100系列在國內禁售,而百模大戰之下算力的需求還在飆升。對于中國市場(chǎng)而言,當前急需AI芯片“解渴”,對于英特爾而言,眼下正值算力緊缺的窗口期,也是進(jìn)攻的絕佳時(shí)機。 英特爾也強調,Gaudi 2芯片是專(zhuān)為訓練大語(yǔ)言模型而構建,采用7納米制程,有24個(gè)張量處理器核心。事實(shí)上,去年英特爾就已經(jīng)在海外發(fā)布了Gaudi 2,此次在中國推出的是“中國特供版”。 由于各國的出口管制限制,外界首要關(guān)心的是AI芯片在中國市場(chǎng)的供應可持續性。對此,英特爾公司執行副總裁、數據中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera在接受21世紀經(jīng)濟報道記者采訪(fǎng)時(shí)做出了肯定的回答。 Sandra Rivera說(shuō)道:“這張卡也是中國定制版的產(chǎn)品,對于出口或者是支持中國的客戶(hù)是沒(méi)有任何問(wèn)題的。英特爾肯定是合法合規地在中國繼續支持我們的客戶(hù),不管是Gaudi 2或者是未來(lái)的Gaudi 3,我們一定是在合法合規的情況下做出一些中國定制的產(chǎn)品,以滿(mǎn)足中國的客戶(hù)的需求! 同時(shí),芯片的性能并沒(méi)有打折,她表示:“在網(wǎng)絡(luò )速度上,(中國版)和國際版相比,是從24個(gè)網(wǎng)口變成21個(gè)網(wǎng)口,但是整體性能還是基本一致的! 隨著(zhù)大模型的日新月異,英特爾在近幾個(gè)月內圍繞著(zhù)Gaudi2繼續進(jìn)行優(yōu)化。 Sandra Rivera介紹道,在性能上,根據機器學(xué)習與人工智能開(kāi)放產(chǎn)業(yè)聯(lián)盟MLCommons在6月底公布的AI性能基準測試MLPerf Training 3.0結果顯示,Gaudi 2是除了英偉達產(chǎn)品外,唯一能把MLPerf GPT 3.0模型跑起來(lái)的芯片。 在發(fā)布會(huì )現場(chǎng),英特爾也直接將Gaudi2和英偉達的A100進(jìn)行比較,其野心可見(jiàn)一斑。根據英特爾公布的數據,從計算機視覺(jué)模型訓練到1760億參數的BLOOMZ推理,Gaudi 2每瓦性能約A100的2倍,模型訓練和部署的功耗降低約一半。 同時(shí),英特爾高管還介紹道,目前相比A100,Gaudi 2價(jià)格更有競爭力,且性能更高。接下來(lái)到9月,采用FP8軟件的Gaudi 2預計能夠提供比H100更高的性?xún)r(jià)比。 整體而言,除了芯片,在此次發(fā)布會(huì )上,英特爾展示了一系列支持大模型的算力解決體系,接下來(lái)具體的落地應用和產(chǎn)品迭代狀況也受到關(guān)注。 一方面,目前在中國市場(chǎng)上,英特爾已經(jīng)和浪潮信息、新華三、超聚變等國內主要的服務(wù)器廠(chǎng)商合作,其中,浪潮信息的NF5698G7是專(zhuān)為面向生成式AI市場(chǎng)的新款AI服務(wù)器,支持8顆OAM高速互聯(lián)的Gaudi2加速器,而在終端客戶(hù)方面,Sandra Rivera表示:“中國市場(chǎng)對人工智能解決方案的需求非常強勁,我們正在與幾乎所有傳統客戶(hù)洽談。我們的云服務(wù)提供商、通信服務(wù)提供商都是企業(yè)客戶(hù),因此對人工智能解決方案有著(zhù)強烈的需求! 另一方面,在產(chǎn)品路線(xiàn)上,英特爾近年一直強調XPU,即多樣化、多組合的異構計算。在A(yíng)I相關(guān)的產(chǎn)品線(xiàn)上,既有集成AI加速器的CPU處理器、有GPU產(chǎn)品,以及Habana Gaudi系列代表的ASIC類(lèi)型AI芯片。 Habana Labs成立于2016年,主要研發(fā)方向為人工智能、深度學(xué)習計算等,創(chuàng )業(yè)初期就得到了英特爾的投資,而后在2019年12月以20億美元被其正式收購。 對于GPU和AI芯片的組合,Sandra Rivera透露:“Gaudi是一個(gè)人工智能加速的專(zhuān)屬產(chǎn)品,在英特爾產(chǎn)品里,如果是針對大模型這個(gè)工作負載,它是性能最佳、最優(yōu)的一個(gè)產(chǎn)品。明年我們還會(huì )有下一代產(chǎn)品Gaudi 3發(fā)布。在2025年的時(shí)候,我們會(huì )把Gaudi的AI芯片跟GPU路線(xiàn)圖合二為一,推出一個(gè)更整合的GPU的產(chǎn)品! 大模型的火熱還在持續拉動(dòng)AI芯片的需求。 Sandra Rivera告訴21世紀經(jīng)濟報道記者:“在4月份回顧一季度的情況時(shí),我們看到了各種人工智能帶來(lái)的芯片需求,包括Gaudi在內,需求至少翻了兩倍以上! TrendForce集邦咨詢(xún)向21世紀經(jīng)濟報道記者提供的數據顯示,目前主要由搭載NVIDIA A100、H100、AMD(114.58, 3.26, 2.93%) MI300,以及大型CSP業(yè)者如Google、AWS等自主研發(fā)ASIC的AI服務(wù)器成長(cháng)需求較為強勁,2023年AI服務(wù)器出貨量(包含搭載GPU、FPGA、ASIC等)出貨量預估近120萬(wàn)臺,年增率近38%,AI芯片出貨量同步看漲,可望成長(cháng)突破五成。 芯片廠(chǎng)商們也在A(yíng)I領(lǐng)域開(kāi)足馬力。英偉達不必多言,當前不論是100系列還是800系列,都十分緊缺,在A(yíng)I芯片市場(chǎng)上占據先發(fā)優(yōu)勢;在6月中旬,AMD推出了新一代AI芯片、數據中心CPU以及DPU,其中AI芯片Instinct MI 300X,直接對標英偉達H100;此外,谷歌(119.62, 1.91, 1.62%)、亞馬遜(130.8, 2.02, 1.57%)、百度(148.83, 5.50, 3.84%)等大廠(chǎng)也都在自研AI芯片,在算力市場(chǎng)上的競爭維度更加豐富。 而除了硬件之外,軟件也同樣關(guān)鍵。比如,目前大部分AI芯片都繞不開(kāi)英偉達的CUDA平臺,CUDA建立了一套軟硬件間的開(kāi)發(fā)標準。如何從CUDA遷移、如何建立自己的優(yōu)勢生態(tài)都是挑戰者的重要課題。 對于軟件生態(tài)的競爭,Sandra Rivera表示:“軟件開(kāi)發(fā)或者是開(kāi)發(fā)者生態(tài),其實(shí)是英特爾多年的一個(gè)強項,在整個(gè)數據中心領(lǐng)域的軟件生態(tài)中,一個(gè)是x86的軟件生態(tài),另外一個(gè)是CUDA。而且我們注意到,隨著(zhù)越來(lái)越多的公司希望使用人工智能,軟件生態(tài)系統也正在加速挖掘更多硬件潛能,以大幅提高生產(chǎn)力! 她進(jìn)一步談道:“英特爾希望能在多種語(yǔ)言環(huán)境中,能夠提供更簡(jiǎn)便的應用。通過(guò)軟件、庫和工具提供一種模塊化的方法,來(lái)優(yōu)化并加速跨多種架構的異構負載。當然在人工智能或者是AI運算的時(shí)候,確實(shí)很多人在用CUDA,但是大部分開(kāi)發(fā)者不會(huì )做那么底層的開(kāi)發(fā),他們是在一個(gè)比較高的框架,比如說(shuō)在PyTorch、TensorFlow上面去創(chuàng )新! Habana Labs首席運營(yíng)官Eitan Medina進(jìn)一步向21世紀經(jīng)濟報道記者指出:“在Gaudi2之前,我們已經(jīng)有一代產(chǎn)品,在軟件上也做了好幾年的積累,底層的軟件庫都已經(jīng)開(kāi)發(fā)好了,我們希望讓開(kāi)發(fā)者能夠在最上層的20%的比例能夠做他的開(kāi)發(fā),這里的開(kāi)發(fā)和CUDA并沒(méi)有那么直接的關(guān)聯(lián)! Gaudi系列作為英特爾AI的一艘旗艦,外界也拭目以待Gaudi 2在實(shí)際應用中的性能表現、算力實(shí)力。從硬件迭代到軟件生態(tài),AI芯片的競爭故事還將繼續。 |