來(lái)源: 最話(huà)FunTalk 作者:何伊然 美國政府的最新“芯片禁令”提前生效。 10月25日,英偉達向美國證券交易委員會(huì )遞交的一份文件中披露,美國政府通知該公司,針對適用于總處理性能大于等于4800TTP并為數據中心設計或銷(xiāo)售的產(chǎn)品的相關(guān)出口管制,立即生效。該管制影響到的英偉達產(chǎn)品有A100、A800、H100、H800和L40S等。 事情緣起當地時(shí)間10月17日,美國商務(wù)部工業(yè)和安全局更新了針對中國的“先進(jìn)計算芯片和半導體制造設備出口管制規則”(下稱(chēng)“新規”),新規設置了“性能密度閾值”作為參數,只要芯片總算力大于或等于4800TTP,不論互聯(lián)帶寬多少都受管制。在新規的補充說(shuō)明里,美國商務(wù)部毫不掩飾地表示設置這一參數的目的就是限制芯片被用于訓練大型兩用AI基礎模型。 該新規將英偉達、AMD、英特爾等廠(chǎng)商現有的高性能算力芯片全部涵蓋。此外,美國商務(wù)部還擴大了芯片制造工具出口限制清單,中國兩家國產(chǎn)GPU制造商摩爾線(xiàn)程、壁仞科技被列入“實(shí)體清單”。媒體還爆料,美國政府在考慮限制向中國AI公司出租云服務(wù),確保美國企業(yè)不能“靈活運用”規則。 原本新規有30天公示期,被行業(yè)人士視為“最后30天窗口期”。在窗口期內,中國企業(yè)可以集中采購、運輸急需的高端AI芯片。出于對中國市場(chǎng)的依賴(lài)和商業(yè)契約,理論上美國芯片企業(yè)會(huì )配合盡快完成中國企業(yè)的訂單。 結果8天后,新規提前執行。受此消息影響,英偉達股價(jià)在當天下跌4.31%,第二天又下跌3.48%。而對于中國科技、大模型創(chuàng )業(yè)企業(yè)來(lái)說(shuō),同樣是影響巨大的,這意味著(zhù)無(wú)法再獲得訓練大模型所需的高性能算力芯片。 《最話(huà)》了解到雖然提前儲備了不少H800芯片,但面對新規提前執行,各家中國科技企業(yè)并沒(méi)有解決辦法。 如果說(shuō)有,那就是“推動(dòng)算力國產(chǎn)化”。 從目前來(lái)看,除了租用云服務(wù)算力,能大量采購到的部分替代英偉達的高性能算力芯片,只有華為昇騰系列(HUAWEI Ascend)AI算力芯片。 《最話(huà)》從接近華為的人士了解到,目前無(wú)論是華為AI集群的算力,還是涉及到的硬件設備,“供應都是非常充足的! 01 “卡脖子” 自從生成式AI浪潮席卷全球,各大科技巨頭紛紛加碼大模型開(kāi)發(fā)。訓練大模型需要大量高性能AI算力芯片。據市場(chǎng)調查機構TrendForce數據顯示,如果以英偉達A100芯片的處理能力計算,GPT-3.5大模型需要上萬(wàn)塊GPU來(lái)處理訓練數據。 中國科技企業(yè)開(kāi)發(fā)的大模型所需的高性能算力芯片也在萬(wàn)塊以上,并且隨著(zhù)大模型迭代,所需的芯片量還會(huì )增加。 按照一份流傳出的交流紀要,阿里云AI專(zhuān)家提到,阿里云在云上就有上萬(wàn)片的A100,整體能夠達到10萬(wàn)片,集團體量應該是阿里云的5倍。騰訊云利用H800加速卡打造的大模型算力集群,集群規模達到了數千臺服務(wù)器。 2022年10月,美國發(fā)布了針對A100、H100和GH200等AI芯片的限制措施,停止向中國出口。 一時(shí)間A100芯片價(jià)格暴漲,《最話(huà)》了解到今年原價(jià)1萬(wàn)美元/張的A100,年中在市場(chǎng)上報價(jià)15萬(wàn)元/張,更有“黃!眻髢r(jià)155萬(wàn)元/張,是原價(jià)的21倍。 英偉達通過(guò)減配等方式繞過(guò)了美國“芯片禁令”,可以繼續對華銷(xiāo)售H800和A800型號芯片,綜合使用效率雖然只有A100/H100的60%,但已經(jīng)是中國企業(yè)在從英偉達手里買(mǎi)到的最好的芯片。 根據英偉達2022年財報,中國區銷(xiāo)售收入占到總收入的20%。媒體推測,僅中國四大互聯(lián)網(wǎng)巨頭百度、字節跳動(dòng)、騰訊和阿里巴巴就向英偉達下單購買(mǎi)了價(jià)值50億美元的A800顯卡。 英偉達當然不想失去中國市場(chǎng),今年初,英偉達CEO黃仁勛就在媒體面前反復強調著(zhù)中國市場(chǎng)不可替代的重要性,“沒(méi)有另一個(gè)中國,只有一個(gè)中國!彼踔吝表示,限制向中國出口人工智能芯片將導致美國行業(yè)永久失去機會(huì ),也不可能限制住中國的發(fā)展。 雖然英偉達舍不得數十億美元的訂單,但作為一家美國企業(yè),英偉達必須要遵守美國監管機構的新規。 在新規公布后,英偉達緊急表示:“鑒于全球對我們產(chǎn)品的需求,我們預計新的規定短期內不會(huì )對我們的財務(wù)業(yè)績(jì)產(chǎn)生實(shí)質(zhì)性的影響!辈贿^(guò),官方也承認:“新規定可能會(huì )影響公司的開(kāi)發(fā)和交付能力,包括按時(shí)完成某些產(chǎn)品開(kāi)發(fā),為現有客戶(hù)提供支持,或者向受影響地區以外的客戶(hù)供應這些產(chǎn)品! 坊間流傳的消息顯示,英偉達建議國內客戶(hù)在10月17日晚12點(diǎn)前增補訂單,并間接承認后續新增訂單將很難獲得供貨保證。 而現在未交付的訂單和增補的訂單都打了水漂。對于此前下了訂單,等著(zhù)芯片構建算力集群的中國科技公司來(lái)說(shuō),新規提前執行,芯片沒(méi)了,也不知何時(shí)才能拿到。 一位云計算企業(yè)人士說(shuō),“合同都提前寫(xiě)好了不可抗力會(huì )免責,這沒(méi)辦法!睂τ谧庥盟麄兯懔Φ拇竽P涂蛻(hù),云計算企業(yè)也要求客戶(hù)給予免責。至于自建算力的大模型企業(yè),同樣面臨著(zhù)“停芯”“后續無(wú)芯可用”的窘境。一連串連鎖反應正在發(fā)生。 國際市場(chǎng)調研機構Counterpoint估算,目前中國科技企業(yè)落后OpenAI的GPT-4等頂尖大模型大約2.5年到3年。芯片供應不穩定的狀態(tài)下,該機構認為,中國科技企業(yè)與全球同行的差距,在未來(lái)幾年將繼續拉大。 02 “B計劃” 所以,無(wú)論是從自主可控還是從經(jīng)營(yíng)角度,中國科技企業(yè)必須盡快另覓高性能算力芯片的供應商。 算力芯片粗略可分為訓練、推理兩種用途,前者需要更大的算力規模。從目前來(lái)看,國內投入大規模量產(chǎn)并在業(yè)務(wù)上使用的算力芯片有華為昇騰910、阿里倚天710、百度昆侖芯2代、騰訊紫霄、海光DCU Z100等。 據《電子工程專(zhuān)輯》發(fā)布的《45家國產(chǎn)AI芯片廠(chǎng)商調研分析報告》,阿里倚天710是CPU,用于邏輯計算,而非AI推理訓練;百度昆侖芯2代被應用于文心一言大模型的推理端,訓練端主要還是使用英偉達V100和A100;海光DCU Z100訓練算力較小,不到100TFLOPS,只適合一些推理場(chǎng)景,不足以支持訓練大模型;騰訊紫霄雖然大規模投入實(shí)際業(yè)務(wù)中,但定位于偏中低端,用于A(yíng)I推理。 2019年8月23日正式推出的華為昇騰910是國內算力最強的AI處理器,芯片基于自研華為達芬奇架構3D Cube技術(shù)。昇騰910A只支持FP16半精度計算,而昇騰910B已升級到支持FP32單精度計算,昇騰910B的FP32單精度計算算力可達75T,支持HBM內存技術(shù),可以用于大模型訓練,已適配盤(pán)古、Llama、清華大學(xué)自研大模型等。 科大訊飛在第三季度業(yè)績(jì)說(shuō)明會(huì )上曾透露,公司已于今年初與華為昇騰啟動(dòng)專(zhuān)項攻關(guān),如今華為發(fā)布的昇騰910B能力已經(jīng)基本做到可對標英偉達A100芯片,未來(lái)算力緊張狀態(tài)將得到緩解。 昇騰910系列芯片采用7nm工藝制程,此前由臺積電代工。一位數碼博主在微博上稱(chēng),“華為芯片制造問(wèn)題解決了,往后幾年將是海思各類(lèi)芯片的井噴,華為昇騰也全面開(kāi)花了”。 這與《最話(huà)》了解到的情況大致相同,麒麟9000S芯片的良品率已經(jīng)基本達到臺積電水平,這意味著(zhù)7納米的良品率和產(chǎn)能已經(jīng)不是大問(wèn)題,目前華為內部各條業(yè)務(wù)線(xiàn)都在搶產(chǎn)能,其中就包括昇騰910系列芯片。 《最話(huà)》從接近華為的人士了解到,目前昇騰主要有兩種類(lèi)型的客戶(hù),一類(lèi)是制造業(yè)客戶(hù),買(mǎi)兩三臺做AI質(zhì)檢,對并行計算沒(méi)什么要求;還有一類(lèi)是央企國企背景的企業(yè),會(huì )與華為有深度溝通和合作。但一些中型或者大型科技企業(yè),“目前合作是比較少的,它們過(guò)去肯定是優(yōu)先購買(mǎi)英偉達的產(chǎn)品,現在有可能轉向購買(mǎi)國產(chǎn)AI算力芯片了! “目前來(lái)看,華為無(wú)論是平臺的算力,還是涉及到的硬件設備的供應,都是非常充足的!痹撊耸勘硎。 昇騰910B支持的FP32單精度計算,對于一般圖形處理計算、深度學(xué)習、大模型等領(lǐng)域,已經(jīng)夠用。但對于需要處理的數字范圍大且需要精確計算的科學(xué)計算,如計算化學(xué)、分子建模、流體動(dòng)力學(xué)等,就需要支持FP64雙精度計算。 原定于2021年推出的昇騰920,因受2019年美國對華為的制裁影響,進(jìn)度大幅延宕。今年5月,在華為昇騰開(kāi)發(fā)者峰會(huì )上,一張PPT引發(fā)了關(guān)注,很多人在猜測云腦Ⅲ 原型機采用的會(huì )不會(huì )就是昇騰920。這就只有時(shí)間來(lái)證明了。 同時(shí),華為也在開(kāi)發(fā)技術(shù)工具,幫助客戶(hù)在不同計算卡間解決算力調度問(wèn)題,方便客戶(hù)混合部署。 03 背水一戰 新規出臺后,黃仁勛強調,中國本土也有包括華為在內很多優(yōu)秀的科技廠(chǎng)商,英偉達必須努力與這些企業(yè)競爭。 但誰(shuí)都知道,英偉達在GPU、高性能算力芯片領(lǐng)域的地位是短時(shí)間內難以撼動(dòng)的;ㄆ煅芯糠治鰩烠hristopher Danely(克里斯托弗·丹尼利)表示,英偉達將占據AI高性能計算芯片市場(chǎng)至少90%的份額。 新規如果不能解除,那就意味著(zhù)絕大部分想自研通用大模型的中國AI創(chuàng )業(yè)企業(yè)將面臨巨大挑戰,當然,資金實(shí)力雄厚的科技大企業(yè),還可以通過(guò)與華為等協(xié)同攻關(guān)或直接采購以熬過(guò)難關(guān)。 這是在與時(shí)間賽跑。 英偉達首席科學(xué)家表示:“隨著(zhù)訓練需求每6到12個(gè)月翻一番,這一差距將隨著(zhù)時(shí)間的推移而迅速擴大!鄙墒紸I實(shí)在發(fā)展的太快了,新規毫無(wú)疑問(wèn)是想拉大國內企業(yè)和美國企業(yè)在人工智能上的時(shí)間差和代差。面對英偉達在硬件上、Open AI在算法上不斷迭代,中國科技企業(yè)并沒(méi)有太多猶豫時(shí)間,也沒(méi)有太多試錯機會(huì ),必須保證每一步做出正確的決定。 美國政府一紙規定,就讓英偉達被迫退出中國高性能算力芯片市場(chǎng),這一局面不是黃仁勛希望看到的。10月21日,黃仁勛曾表示,英偉達會(huì )遵循美國政府的相關(guān)規定,但也“希望盡可能擁有較大的市場(chǎng),會(huì )盡量支援各個(gè)市場(chǎng)需求,也支持中國大陸市場(chǎng)客戶(hù)! 只是處在夾縫中的英偉達并沒(méi)有選擇的余地。同樣沒(méi)有選擇余地的還有AMD、英特爾,AMD的MI250X、MI300,英特爾的Gaudi 2、Gaudi 3也上了管制名單。據報道,黃仁勛、英特爾高層和美國高級官員交涉過(guò),但無(wú)功而返。 AI算力芯片折舊一般2-3年,最長(cháng)不超過(guò)5年。管制新規生效后,即使國內科技大廠(chǎng)、大模型創(chuàng )業(yè)公司囤積了不少H800,很會(huì )在未來(lái)兩三年后面臨折舊、換代的需求,如果得不到補充,將面臨巨大困境。 與此同時(shí),哪怕其他國產(chǎn)AI芯片企業(yè)能解決授權、設計問(wèn)題,在制造領(lǐng)域還得靠臺積電等芯片企業(yè)代工,在供應渠道上也有一定不確定性。 現在就需要看國內企業(yè)能否通力合作解決半導體制造全產(chǎn)業(yè)鏈問(wèn)題了。 此時(shí)此刻,所有科技公司都在夾縫中尋找生機,英偉達、AMD、英特爾掌握著(zhù)先發(fā)優(yōu)勢和巨大市場(chǎng),新規并不會(huì )造成致命影響,但對于國內科技、算力芯片企業(yè)來(lái)說(shuō),在管制新規的高壓之下,想要活下去,唯有背水一戰。 |