來(lái)源:虎嗅網(wǎng) 作者:齊健 2023年,英偉達幾乎一整年都在關(guān)注高端顯卡、AI大模型、超級計算等數據中心業(yè)務(wù),以至于市場(chǎng)都快要忘記英偉達在PC市場(chǎng)上也是壟斷全球市場(chǎng)的硬件“軍火商”。 事實(shí)上,在數據中心業(yè)務(wù)中賺得盆滿(mǎn)缽滿(mǎn)的同時(shí),英偉達并沒(méi)有忘本,黃仁勛早已開(kāi)始盤(pán)算,如何用AI到“電競椅和辦公桌”上去賺錢(qián)了。 在剛剛結束的2024 CES上英偉達發(fā)布了大量聚集PC端的AI應用和GPU新品。包括GeForce RTX 40 SUPER系列顯卡,NVIDIA AI Workbench,開(kāi)源庫TensorRT-LLM,以及生成式AI驅動(dòng)的語(yǔ)音和動(dòng)畫(huà)模型在內的NVIDIA ACE微服務(wù)。 一系列PC端的GPU產(chǎn)品和應用,全部圍繞本屆CES上PC廠(chǎng)商們最關(guān)注的話(huà)題AIPC。然而,對于一心撲在A(yíng)I上的英偉達來(lái)說(shuō),對PC用戶(hù)的“關(guān)心”,還保留了多少呢?英偉達對業(yè)界熱炒的AIPC到底是什么態(tài)度? PC業(yè)務(wù)的前景不如數據中心 事實(shí)上,在2023年AI大模型爆發(fā)以前,英偉達最大的市場(chǎng)一直是PC端的“游戲”板塊。 英偉達從2015年開(kāi)始把主營(yíng)業(yè)務(wù)分為游戲(Gaming)、企業(yè)(Enterprise)、高性能計算和云(HPC & Cloud)、自動(dòng)駕駛(Automotive)幾個(gè)板塊。也是自2015年起,超算和云,也就是未來(lái)的數據中心業(yè)務(wù),開(kāi)始在英偉達的營(yíng)收中一步步走向高位。 2016年,英偉達對其業(yè)務(wù)板塊進(jìn)行了調整,去掉了Enterprise和HPC & Cloud兩個(gè)板塊,取而代之的是今天的專(zhuān)業(yè)可視化(Professional Visualization)和數據中心(Datacenter)。英偉達還首次單獨公布了這幾個(gè)業(yè)務(wù)板塊的營(yíng)收情況。游戲業(yè)務(wù)的目標用戶(hù)就是個(gè)人電腦,專(zhuān)業(yè)可視化的用戶(hù)則多數是商業(yè)客戶(hù)使用的工作站。 2016年英偉達全年的總收入為50.10億美元。在2016年1月31日結束的財年中,英偉達的游戲業(yè)務(wù)收入為28.18億美元;專(zhuān)業(yè)可視化業(yè)務(wù)的收入為7.50億美元;數據中心業(yè)務(wù)的收入為3.39億美元;自動(dòng)駕駛業(yè)務(wù)收入為3.20億美元。 其中游戲業(yè)務(wù)和專(zhuān)業(yè)可視化分別占總收入的56.25%和14.97%,今天如日中天的數據中心,在當時(shí)只占總收入的6.77%。 個(gè)人電腦市場(chǎng)雖然穩定,但市場(chǎng)似乎已經(jīng)能夠看到天花板了,不僅增長(cháng)速度有限,且由于技術(shù)門(mén)檻不高,這一領(lǐng)域的市場(chǎng)競爭也日益激烈。 2017、2018年,AI技術(shù)首次爆發(fā)。給英偉達帶來(lái)了一條新的增長(cháng)曲線(xiàn)。 2018財年,GPU加速計算對于深度學(xué)習的支持使得英偉達的數據中心業(yè)務(wù)快速增長(cháng),當年數據中心業(yè)務(wù)的收入為193.2億美元,專(zhuān)業(yè)可視化為93.4億美元。數據中心的營(yíng)收和增幅都遠超專(zhuān)業(yè)可視化。 數據中心業(yè)務(wù)的飛速發(fā)展,可以說(shuō)是把英偉達從傳統游戲硬件供應商,帶上了多元化技術(shù)公司的軌道。 市調機構TBRC在2024年1月發(fā)布的最新報告中預測,2023年全球個(gè)人電腦市場(chǎng)規模約為2040.9億美元,預計到2024年將增長(cháng)到2123.8億美元,復合年增長(cháng)率(CAGR)為4.1%。個(gè)人電腦市場(chǎng)規模預計在未來(lái)幾年將保持增長(cháng)。到2028年,或將增至2677.1億美元,復合年增長(cháng)率為6.0%。 數據中心的市場(chǎng)規模和增長(cháng)潛力則比個(gè)人電腦更大。2023年的全球數據中心市場(chǎng)規模約2526.8 億美元,比個(gè)人電腦市場(chǎng)規模大了約20%。預計到 2024 年將增至2749.8 億美元,復合年增長(cháng)率 (CAGR) 為 8.8%。未來(lái)幾年數據中心市場(chǎng)規模的增長(cháng)也更為強勁。TBRC預計,到2028 年,這一市場(chǎng)的規模將增至3884.1 億美元,復合年增長(cháng)率(CAGR) 為9.0%。 相比于個(gè)人電腦業(yè)務(wù),數據中心無(wú)論是市場(chǎng)規模、市場(chǎng)競爭格局,還是用戶(hù)需求、技術(shù)發(fā)展趨勢,不管當下還是未來(lái),都明顯更好做,也更賺錢(qián)。 數據中心有多賺錢(qián)? 在英偉達最新的2024財年第三季度財報中,快速上升的數據中心業(yè)務(wù)營(yíng)收1451.4億美元,占總營(yíng)收的80%,完全碾壓了英偉達在PC端的傳統核心業(yè)務(wù)“游戲”。對于英偉達來(lái)說(shuō),數據中心業(yè)務(wù)不管是當下還是未來(lái),都是最能賺錢(qián),賺錢(qián)最快,賺錢(qián)最簡(jiǎn)單的業(yè)務(wù)。 今天的技術(shù)趨勢強烈指向云計算、大數據、人工智能和機器學(xué)習等領(lǐng)域,這些都是數據中心業(yè)務(wù)的關(guān)鍵驅動(dòng)力。 AI推動(dòng)著(zhù)各家公司對高算力、超級算力的需求持續上漲。2023年年中,科技博客GPU Utils對GPU短缺問(wèn)題做了一次調查,博主Clay Pascal給出的調查結果稱(chēng),彼時(shí)谷歌云擁有大約2.5萬(wàn)塊H100,微軟云服務(wù)Azure可能有1萬(wàn)-4萬(wàn)塊H100,甲骨文的情況應該類(lèi)似。Azure的大部分容量都將流向OpenAI。 Clay Pascal預測對于H100的需求,OpenAI可能需要5萬(wàn)塊,Meta可能需要2.5萬(wàn)塊,大型云廠(chǎng)商可能每家都需要3萬(wàn)塊,加上其他一些初創(chuàng )企業(yè),可能總共需要大約43.2萬(wàn)塊H100。以每塊約3.5萬(wàn)美元計算,所需GPU的價(jià)值約為150億美元。這還不包括中國公司。 Clay Pascal在博客中寫(xiě)道:我被告知,對于需要100或1000塊(英偉達GPU)H100的公司來(lái)說(shuō),Azure(微軟云服務(wù))和GCP(谷歌云服務(wù))實(shí)際上已經(jīng)沒(méi)有容量了,亞馬遜也接近沒(méi)有容量了。 研究機構 Omdia 的調研結果則稱(chēng),英偉達在2023年第三季度售出了近50萬(wàn)個(gè)A100和H100 GPU,基于H100的服務(wù)器的交付周期已延長(cháng)至36到52周。雖然不知道目前英偉達的補貨情況,不過(guò)從OpenAI近期接連發(fā)生的斷網(wǎng),停賬號,以及新功能升級來(lái)看,不管補貨能力如何,需求的巨大缺口仍在。 在巨大的需求面前,英偉達也開(kāi)始了坐地起價(jià)。在芯片行業(yè)中,高端產(chǎn)品的利潤率通常較高,不少高端產(chǎn)品的利潤率可達50%以上。而英偉達的高端GPU利潤率高得可怕,投資銀行Raymond James的消息稱(chēng)H100 GPU的成本只有3320美元,但英偉達賣(mài)出的價(jià)格為2.5-3萬(wàn)美元,利潤率高達1000%。 如今英偉達a100和H100服務(wù)器的價(jià)格,在國內更是炒得離譜,2023年最后三個(gè)月,8卡H100服務(wù)器的價(jià)格上浮一度達到300萬(wàn)元人民幣。 英偉達有多需要AIPC? 數據中心這么好賺,那是否意味著(zhù)英偉達會(huì )就此減弱對PC市場(chǎng)的關(guān)注呢? 短期來(lái)看恐怕還不會(huì ),畢竟在過(guò)去30年里,PC一直是英偉達的主戰場(chǎng)。在這里,英偉達不僅有優(yōu)勢,有經(jīng)驗,更重要的是有信心。 個(gè)人電腦市場(chǎng),特別是游戲和專(zhuān)業(yè)圖形處理領(lǐng)域,在今天仍然是英偉達重要的收入來(lái)源。英偉達2024財年第三季度業(yè)績(jì)顯示,游戲業(yè)務(wù)營(yíng)收為285.6億美元,同比增長(cháng)超80%。隨著(zhù)游戲行業(yè)的發(fā)展和虛擬現實(shí)技術(shù)的進(jìn)步,PC市場(chǎng)的增長(cháng)潛力仍然巨大。 另一方面,英偉達在PC市場(chǎng)上,亦處在壟斷地位。英偉達在2022年全球獨立GPU市場(chǎng)中的市占率為88%,AMD和Intel僅占8%和4%。 更重要的是,英偉達在GPU方面豐富的產(chǎn)品線(xiàn),可以在PC市場(chǎng)上長(cháng)期發(fā)貨優(yōu)勢。英偉達提供了一系列針對不同用戶(hù)需求的GPU產(chǎn)品,包括面向游戲玩家和創(chuàng )作者的Ampere,以及面向數據中心的Hopper3。英偉達還構建了包括驅動(dòng)程序、開(kāi)發(fā)工具和應用程序在內的全面生態(tài)系統。 從目前來(lái)看如果英偉達的RTX40系列顯卡在PC上能夠支持新的AI業(yè)務(wù),那么未來(lái)仍將獨占這一百億級別的市場(chǎng),甚至通過(guò)AI技術(shù)的升級,進(jìn)一步擴大個(gè)人pc市場(chǎng)中GPU的裝機率,推動(dòng)全球市場(chǎng)規模更上一個(gè)臺階。 2023年數據中心業(yè)務(wù)的增長(cháng)速度驚人,與AI大模型這一新興技術(shù)的爆發(fā)密切相關(guān)。然而,AI大模型目前對全球科技市場(chǎng)來(lái)說(shuō)仍處在非常早期的階段,未來(lái)的增長(cháng)持續性到底如何,對云端服務(wù)器的需求如何都未可知。 而PC業(yè)務(wù),在過(guò)去30年中已經(jīng)走出了一條穩定的增長(cháng)曲線(xiàn)。由此可想,雖然英偉達勢必會(huì )重點(diǎn)投資更有利可圖且增長(cháng)潛力更大的數據中心業(yè)務(wù),但一定也不會(huì )把早已站穩腳跟的PC業(yè)務(wù)市場(chǎng)拱手讓人。 RTX 40系列的機遇和挑戰 AIPC概念在市場(chǎng)上被熱炒,很多廠(chǎng)商都在提出把AI落地到本地,從而降低云計算成本、提高安全性和響應效率。這無(wú)疑給PC端的GPU創(chuàng )造了新的市場(chǎng)機遇。 英偉達在2024 CES上最新發(fā)布的GeForce RTX 40 SUPER系列顯卡中,GeForce RTX 4080 SUPER在A(yíng)I視頻生成上比GeForce RTX 3080 Ti快1.5倍,圖片生成上快1.7倍。SUPER GPUs的Tensor Cores能夠實(shí)現每秒高達836萬(wàn)億次AI運算(TOPS),從而為游戲、創(chuàng )作和日常生產(chǎn)力帶來(lái)變革性的AI能力。 ![]() NVIDIA AI Workbench則允許開(kāi)發(fā)者快速創(chuàng )建、測試和定制預訓練的生成式AI模型和大型語(yǔ)言模型(LLM)。TensorRT-LLM是一個(gè)開(kāi)源庫,用于加速PC上大型語(yǔ)言模型的運行。最新版本的TensorRT-LLM現已可用,它為PC增加了更多預優(yōu)化模型,與其他推理后端相比,運行速度提高了多達5倍。 此外,英偉達還發(fā)布了生成式AI驅動(dòng)的語(yǔ)音和動(dòng)畫(huà)模型在內的NVIDIA ACE微服務(wù),使開(kāi)發(fā)者能夠向游戲中添加智能、動(dòng)態(tài)的數字化角色。此外,NVIDIA還發(fā)布了“Chat with RTX”技術(shù)演示,它允許AI愛(ài)好者通過(guò)所謂的“檢索增強生成”(RAG)技術(shù),輕松地將PC上的大型語(yǔ)言模型(LLM)連接到自己的數據。 這些新品都針對生成式AI做了大量?jì)?yōu)化,為GPU在未來(lái)的AIPC中發(fā)力提供了機會(huì )。 有趣的是,最近有研究團隊發(fā)現RTX 4090在一定條件下甚至有可能替代服務(wù)器級芯片。 上海交通大學(xué)的研究團隊就開(kāi)發(fā)了一個(gè)名為PowerInfer的高性能 CPU/GPU 混合 LLM 推理引擎。這款引擎大幅降低了對 GPU 內存的需求,并減少了 CPU 與 GPU 之間的數據傳輸,從而提高了整體效率?梢栽趩蝹(gè) NVIDIA RTX 4090 GPU 上運行大型語(yǔ)言模型(LLM),達到平均每秒產(chǎn)生 13.20 個(gè) token 的速度,峰值速度更是高達 29.08 tokens/s,這與頂尖的 A100 GPU 服務(wù)器性能相差無(wú)幾,僅低 18%,適用于多種 LLM 應用場(chǎng)景。 PC端GPU在A(yíng)I加持下雖然機遇巨大。但在A(yíng)IPC的大潮流中競爭也比高端GPU更激烈。 如今,英偉達要面對的競爭中已經(jīng)不只有AMD和Intel了。蘋(píng)果M系列芯片提出的統一內存架構(Unified Memory Architecture, UMA),給生成式AI的預訓練過(guò)程提供了一種選擇。 UMA允許CPU和GPU共享相同的物理內存,減少了數據在不同內存之間的復制需求,提高效率。此外蘋(píng)果的硬件優(yōu)化使其設備在執行AI相關(guān)任務(wù)時(shí)能耗更低。蘋(píng)果的硬件和軟件高度集成的特性,也為特定的AI應用提供了更好的優(yōu)化空間。 目前,已經(jīng)有大量AI大模型開(kāi)發(fā)者開(kāi)始嘗試使用蘋(píng)果電腦訓練大語(yǔ)言模型。最新款Mac Studio的頂配版本,已經(jīng)可以訓練700億參數的LLaMA2模型。 不過(guò),雖然UMA具備諸多優(yōu)勢,但它更多地集中在蘋(píng)果自己的生態(tài)系統內,與外部系統的兼容性可能有限。且相比專(zhuān)業(yè)的GPU,蘋(píng)果的硬件可能在處理極其復雜的AI模型時(shí)有性能瓶頸。 英偉達在A(yíng)I領(lǐng)域深耕多年,擁有強大的技術(shù)積累和廣泛的應用生態(tài),這些都是蘋(píng)果短時(shí)間內難以匹敵的。盡管蘋(píng)果UMA可能在某些方面對英偉達構成挑戰,但英偉達的GPU在A(yíng)I領(lǐng)域依然具有很強的競爭力。 PC業(yè)務(wù)能救中國市場(chǎng)嗎? 黃仁勛在英偉達2024財年第三季度的財報電話(huà)中提到,英偉達20-25%的業(yè)務(wù)來(lái)自中國,美國對中國的高端芯片制裁,將會(huì )對英偉達造成嚴重影響。 2023年8月,英國《金融時(shí)報》曾報道了一則中國云廠(chǎng)商搶購英偉達高端GPU的新聞,稱(chēng)百度、字節跳動(dòng)、騰訊和阿里巴巴四家公司合計向英偉達訂購了價(jià)值50億美元的AI芯片。而受美國制裁法案的影響,英偉達機會(huì )完全無(wú)法履行這些訂單。 為了保住中國業(yè)務(wù),英偉達再度開(kāi)始積極設計3款”中國特供“芯片。 某國內服務(wù)器制造商近期曾向虎嗅透露,芯片限制政策對國內服務(wù)器生產(chǎn)沒(méi)有影響,因為不管英偉達推出什么芯片,服務(wù)器要做的只是適配N(xiāo)V-Link。目前搭載新的“中國特供”芯片的服務(wù)器已經(jīng)接受了很多客戶(hù)的下單,不過(guò)受到美國政府加強管制的影響,原本計劃2024年1月到貨的“中國特供”,現在看肯定要延后了。 有消息稱(chēng),拜登政府已經(jīng)開(kāi)始調查英偉達為中國開(kāi)發(fā)的三款新型AI芯片的具體細節。美國商務(wù)部長(cháng)吉娜·雷蒙多在接受外媒采訪(fǎng)時(shí)談道:“我們會(huì )檢查每一個(gè)新芯片的每一個(gè)規格,顯然是為了確保它不違反出口管制! 雷蒙多說(shuō),英偉達“能夠、愿意、也應該向中國出售AI芯片,因為大多數AI芯片將用于商業(yè)應用”,但“我們不能允許他們運送最復雜、處理能力最高的AI芯片,這將使中國能夠訓練他們的前沿模型”。她強調說(shuō)不能向中國企業(yè)出售其最先進(jìn)的半導體,并表示將不斷更新出口管制規則。 美國對中國的芯片封鎖,與其說(shuō)是在制裁中國,倒不如說(shuō)是在制裁英偉達。 1月7日,美國《華爾街日報》以“英偉達在中國的新困境,客戶(hù)不想要它的降級芯片”為題,報道了英偉達為應對拜登政府出口限制,向中國出售降級特供版AI芯片,但中國客戶(hù)不感興趣的最新困境。 事實(shí)上,RTX40系列顯卡在中國的銷(xiāo)售也未必會(huì )一帆風(fēng)順,有消息稱(chēng),目前英偉達在中國可以銷(xiāo)售的最高端芯片為RTX 4090D,這款新芯片比RTX4090的性能低了5%左右。英偉達介紹該產(chǎn)品將從2024年1月起陸續在中國上市。 有知情人士向虎嗅透露,為了緩和與中國客戶(hù)的關(guān)系,英偉達在積極開(kāi)發(fā)“中國特供”的同時(shí),也在與中國服務(wù)器廠(chǎng)商協(xié)商,希望能在中低端服務(wù)器,以及PC業(yè)務(wù)方面做出一些讓步,從而在不取消訂單的情況下,用其他產(chǎn)品替代已經(jīng)下單但不能發(fā)貨的高端芯片產(chǎn)品。 雖然對于中國的AI公司來(lái)說(shuō),沒(méi)有全面封鎖GPU芯片就等于斷了AI研發(fā)的電。但這對中國的芯片企業(yè)來(lái)說(shuō),或許是一個(gè)好消息。 |