在今日召開(kāi)的Advancing AI 2025峰會(huì )上,全球半導體巨頭AMD正式發(fā)布基于CDNA 4架構的Instinct MI350系列AI加速器,以“史上最大性能飛躍”向英偉達發(fā)起正面挑戰。新系列包含風(fēng)冷版MI350X和液冷版MI355X兩款產(chǎn)品,搭載288GB HBM3E內存,FP4精度下算力達20.1 PFLOPS,推理性能較前代提升35倍,標志著(zhù)AMD在A(yíng)I算力競賽中邁出關(guān)鍵一步。![]() 核心突破:CDNA4架構重構AI計算范式 MI350系列基于臺積電第二代3nm(N3P)制程工藝,集成1850億個(gè)晶體管,采用Chiplet 3D混合封裝技術(shù)(XCD計算核心+IOD I/O核心),通過(guò)第四代Infinity Fabric總線(xiàn)實(shí)現5.5TB/s芯片間互聯(lián)。其核心創(chuàng )新包括: · 全精度計算引擎:首次支持FP4/FP6低精度格式,結合增強型矩陣計算引擎,在混合精度計算中性能提升2倍,DeepSeek-R1等大模型推理效率達英偉達H100的90%-120%。 · 內存帶寬巔峰:288GB HBM3E內存帶寬達8TB/s,較前代MI325X提升33%,可承載萬(wàn)億參數大模型,700億參數模型推理延遲降至毫秒級。 · 能效比優(yōu)化:通過(guò)架構改進(jìn)與制程升級,MI350X在維持1000W TDP(熱設計功耗)下實(shí)現38倍能效提升,液冷版MI355X峰值功耗1400W,較前代翻倍但性能提升4倍。 市場(chǎng)對標:直擊英偉達軟肋,生態(tài)布局補位 AMD CEO蘇姿豐在發(fā)布會(huì )上直面與英偉達的競爭:“MI355X在FP4精度下生成Token的速度比英偉達B200快20%-30%,每美元投資可多生成40%的Token!边@一表態(tài)直指英偉達Hopper架構在能效比上的短板。 市場(chǎng)數據顯示,MI350系列已獲得頭部云服務(wù)商青睞: Meta、微軟、甲骨文已在生產(chǎn)環(huán)境部署MI300X,MI350將延續這一合作關(guān)系; OpenAI CEO山姆·阿爾特曼現身捧場(chǎng),表示期待MI400(2026年發(fā)布)的更強性能; 戴爾、惠普、超微正研發(fā)支持8卡至128卡液冷互聯(lián)的機架級方案,劍指超大規模AI訓練集群。 戰略布局:從芯片到全棧的AI野心 AMD此次發(fā)布會(huì )不僅推出硬件,更構建了端到端AI基礎設施藍圖: 軟件生態(tài):即將發(fā)布的ROCm 7軟件棧推理性能提升3.5倍,支持LLaMA、DeepSeek等主流模型開(kāi)箱即用,180萬(wàn)個(gè)Hugging Face模型已適配; 系統級創(chuàng )新: MI350X風(fēng)冷機柜:8卡設計高度僅6U,HBM顯存容量18TB,FP8算力590 PFLOPS; MI355X液冷機柜:16卡設計顯存36TB,FP8算力1.28 EFLOPS,較前代密度提升117%; 網(wǎng)絡(luò )突破:聯(lián)合推出智能網(wǎng)卡Pensando Pollara 400,基于Ultra Ethernet標準,卸載GPU/CPU通訊負載,吞吐量較RoCEv2網(wǎng)卡提升10%-20%。 未來(lái)路線(xiàn)圖:MI400與Helios架構蓄勢待發(fā) 蘇姿豐在會(huì )后透露,下一代Instinct MI400將于2026年發(fā)布,搭載432GB HBM4內存,帶寬躍升至19.6TB/s,FP4算力預計達40 PFLOPS。配套的“Helios”AI機架式服務(wù)器將整合EPYC CPU、MI400 GPU和Pensando智能網(wǎng)卡,支持72顆GPU緊密耦合,縱向擴展帶寬達260TB/s。 |