AMD、Intel已用上Chiplet，英偉達落后了？

發(fā)布時(shí)間：2023-1-17 08:35 發(fā)布者：eechina

關(guān)鍵詞： AMD , Intel , Chiplet , 英偉達

來(lái)源：半導體行業(yè)觀(guān)察

雖然摩爾定律已經(jīng)逐漸走到盡頭，但我們卻來(lái)到了一個(gè)更加看點(diǎn)十足的時(shí)代，不同于以往每隔18個(gè)月靠工藝迭代帶來(lái)的常規演變，以英特爾、英偉達和AMD為首的芯片巨頭之間的競爭變得異常激烈。從英特爾、英偉達、AMD三家的產(chǎn)品布局來(lái)看，三家幾乎都集齊了CPU、GPU甚至是DPU產(chǎn)品線(xiàn)。如今，他們正在醞釀更大的規劃！

隨著(zhù)近日AMD推出CPU和GPU組合的下一代數據中心APU——Instinct MI300，自此，三家的“多PU組合”爭斗戰已然打響。在此之前，英特爾的Falcon Shores XPU混合搭配CPU + GPU，英偉達的Grace Hopper Superchip是Grace CPU + H100 GPU的組合，都是如出一轍。他們都在做一件偉大的事情：在一個(gè)芯片中集成CPU、GPU和AI加速器，最終成為一個(gè)類(lèi)似APU的產(chǎn)品，目標是更廣闊的超級計算市場(chǎng)。但是在實(shí)現方式上，英偉達落后了？

英特爾的XPU計劃之一：Falcon Shores

首先來(lái)說(shuō)下英特爾的XPU計劃？XPU是指使用多種計算架構以最好地滿(mǎn)足單個(gè)工作負載的執行需求的想法，這是英特爾過(guò)去幾年來(lái)最感興趣的一個(gè)方向。英特爾希望將X86和Xe結合起來(lái)用于超級計算/HPC市場(chǎng)。這也導致了英特爾開(kāi)始研發(fā)從CPU、GPU個(gè)一些ASIC產(chǎn)品（如IPU、VPU、FPGA）等等各種產(chǎn)品。

在英特爾2022年年度投資者會(huì )議上，英特爾披露了一個(gè)代號為Falcon Shores的處理器新架構，它將x86 CPU和Xe GPU硬件組合到單個(gè)Xeon插槽芯片中，利用下一代封裝、內存和 I/O 技術(shù)，為計算大型數據集和訓練巨大 AI 模型的系統提供巨大的性能和效率改進(jìn)。不過(guò)英特爾的目標似乎不僅僅是將CPU和GPU集成在一起，英特爾正在尋求為擁有絕對海量數據集HPC用戶(hù)開(kāi)辟市場(chǎng)——這種數據集無(wú)法輕松適應獨立GPU相對有限的內存容量。

Falcon Shores的目標是在2024年推出，采用埃米級制程，這意味著(zhù)它可能會(huì )使用Intel 20A或Intel 18A制造工藝制造。英特爾預計Falcon Shores在多個(gè)指標上比當前一代產(chǎn)品增長(cháng)5倍，包括每瓦性能提高5倍，單個(gè) (Xeon) 插槽的計算密度提高5倍，內存容量增加5倍，內存帶寬增加5倍。

英特爾表示，Falcon Shores的混合設計是通過(guò)使用tile（也稱(chēng)為小芯片）實(shí)現的，通過(guò)提供x86和Xe內核之間的靈活比例，這將使芯片制造商在設計過(guò)程的后期配置芯片方面具有更大的靈活性。

AMD發(fā)布Instinct MI300 APU

近日，AMD在CES 2023上披露了其下一代數據中心處理器Instinct MI300，被AMD稱(chēng)之為下一代數據中心APU。它采用了13個(gè)Chiplet，共有1460億個(gè)晶體管，MI300可以說(shuō)是AMD迄今為止最大的芯片。

該芯片的計算部分由九個(gè)5nm小芯片組成，它們包含CPU或GPU內核，但AMD沒(méi)有詳細說(shuō)明每個(gè)小芯片的使用數量。這九個(gè)裸片被3D堆疊在四個(gè)6nm基礎裸片之上，而且這些裸片是有源的中介層，可以處理 I/O和各種其他功能。從下圖中可以清晰的看到，Instinct MI300中心芯片側面的八個(gè)HBM3堆棧。

MI300的關(guān)鍵優(yōu)勢除了將CPU內核和GPU內核放在同一設計中的操作簡(jiǎn)單性之外，還在于它可以讓兩種處理器類(lèi)型共享一個(gè)高速、低延遲的統一內存空間。這將使在CPU和GPU兩個(gè)核之間快速且輕松的傳遞數據，能讓每個(gè)核處理他們最擅長(cháng)的計算方面。此外，它還可以通過(guò)讓兩種處理器類(lèi)型直接訪(fǎng)問(wèn)同一內存池，簡(jiǎn)化插槽級別的HPC編程。

但是MI300芯片并不是批量產(chǎn)品，因為其價(jià)格昂貴且相對稀缺，所以它們不會(huì )像EPYC Genoa數據中心CPU那樣得到廣泛部署。AMD預計將在2023年下半年交付Instinct MI300。但是，這一Chiplet的設計技術(shù)將會(huì )衍生出更多的變體。

英偉達Grace Hopper Superchip

不同于英特爾和英偉達采用Chiplet架構的做法，英偉達首款GPU+CPU組合——Grace Hopper Superchip還是單芯片的方式，下圖是渲染圖。

Nvidia對其Grace Superchip的渲染圖：兩個(gè)帶有RAM的處理器合二為一

NVIDIA®Grace Hopper架構將NVIDIA Hopper GPU與NVIDIA Grace™ CPU結合在一起，在單個(gè)超級芯片中連接高帶寬和內存一致的NVIDIA NVLink Chip-2-Chip(C2C)®互連，并支持新的NVIDIA NVLink開(kāi)關(guān)系統。

NVLink C2C是NVIDIA為超級芯片開(kāi)發(fā)的內存相干、高帶寬和低延遲互連。它是Grace Hopper超級芯片的核心，提供高達900 GB/s的總帶寬。這比加速系統中常用的x16 PCIe Gen5通道的帶寬高7倍。結合NVIDIA NVLink切換系統，所有運行在最多256個(gè)NVLink連接的GPU上的GPU線(xiàn)程現在都可以以高帶寬訪(fǎng)問(wèn)高達150TB的內存。

NVIDIA Grace Hopper超級芯片邏輯一覽（圖源：英偉達）

英偉達表示，該超級芯片將為運行TB級數據的應用程序提供高達10倍的性能提升，英偉達已承諾在2023年上半年推出其超級芯片。

可以看出，英特爾、英偉達和AMD都開(kāi)始在CPU+GPU組合上發(fā)力，他們所采用的方式：要么芯片繼續平鋪做大，要么拼3D堆疊、Chiplet、拼架構，目前從各家的CPU+GPU組合型產(chǎn)品推出的時(shí)間上來(lái)看，AMD和英偉達都在2023年，而英特爾將在2024年。軟件支持方面，英特爾有oneAPI，英偉達有CUDA，AMD似乎還稍遜一些。而在架構方面，英特爾、AMD均已奔向3D Chiplet，但英偉達似乎仍在單芯片上努力。

英偉達何時(shí)擁抱Chiplet？

Chiplet用于CPU已經(jīng)不是新聞了，AMD多年來(lái)一直在其Ryzen和Epic等CPU處理器中使用Chiplet設計并取得了巨大成功。英特爾也于2023年1月11日正式發(fā)布了基于Chiplet設計的第四代至強CPU-Sapphire Rapids，它通過(guò)內置加速器將目標工作負載的平均每瓦性能提升了2.9倍，在優(yōu)化電源模式下每個(gè)CPU節能可高達70瓦，將總體成本降低52%-66%。

但是就目前的情況來(lái)看，GPU也已邁入了Chiplet時(shí)代。如今英特爾和AMD已經(jīng)均已發(fā)布了3D Chiplet CPU和GPU中的產(chǎn)品。而英偉達無(wú)論是GPU還是CPU似乎還在單芯片上努力，英偉達要落后了嗎？

2023年1月11日，英特爾發(fā)布了其首款Chiplet小芯片封裝的GPU，代號Ponte Vecchio，GPU Max系列單個(gè)產(chǎn)品整合47個(gè)小芯片，集成超過(guò)1000億個(gè)晶體管。這是英特爾性能最高、密度最高的通用獨立GPU。英特爾的這一芯片的具體性能對比情況暫未可知，但是我們暫且可以看看AMD與英偉達的GPU性能對比。

AMD最新一代的GPU Navi 31，是AMD第一款、也可以說(shuō)是歷史上第一個(gè)基于Chiplet設計的GPU，AMD的兩款最新顯卡Radeon RX 7900 XTX和Radeon RX 7900 XT均是基于Navi 31。其中，XTX是旗艦機型，擁有更多的shader處理器，更高的內存帶寬，更多的顯存，而XT則是有些弱化的版本。

如果我們將AMD的顯卡和英偉達的RTX 4080作對比，AMD的GPU的性能非常接近英偉達的RTX 4080。據chipsandcheese的評測對比數據，如下圖所示，英偉達的4080采用4nm制程，晶體管密度比AMD的低一些，面積也更大一些，但英偉達4080具有更高的SM數量，這意味著(zhù)寄存器文件和FMA單元相比AMD要有更多的邏輯控制。英偉達還具有更簡(jiǎn)單的緩存層次結構的優(yōu)勢，它仍然提供相當大的緩存容量。

AMD 7900/6900與英偉達4080的比較（圖源：chipsandcheese）

英偉達的GPU目前做法還是將所有的晶體管，都放在一個(gè)更大的單芯片上，采用尖端工藝4納米節點(diǎn)。

而AMD的Navi 31基于Chiplet設計和先進(jìn)的RDNA3架構。其裸片由GCD核（圖形計算芯片）和 MCD內存小芯片（內存緩存芯片）組成。從下圖可以清晰的看到，中間部分是5nm制程的GCD核，周?chē)謩e是6顆6nm制程的MCD，包含內存控制器和Infinity緩存。這說(shuō)明，著(zhù)色器處理器和其他單元比較獲益于先進(jìn)工藝，而對于內存控制器和緩存來(lái)說(shuō)則不必需要使用最先進(jìn)的工藝。

兩種不同工藝的芯片組裝在一起，所使用的尺寸更小，與此同時(shí)，Chiplet的設計方式使得晶圓的缺陷芯片數量也少的多，從這個(gè)意義上來(lái)說(shuō)，Chiplet架構的使用降低了成本。Chiplet的設計還助于通過(guò)在圖形芯片上使用更少的區域來(lái)實(shí)現VRAM連接，從而實(shí)現更高帶寬的 VRAM 設置。但是也不是萬(wàn)利的，代價(jià)就是AMD必須支付更昂貴的封裝解決方案，因為簡(jiǎn)單的封裝走線(xiàn)在處理GPU的高帶寬要求方面表現不佳。

此外，AMD Navi 31 GPU很重要的一項創(chuàng )新是Infinity Link總線(xiàn)，為何要說(shuō)到這個(gè)呢？因為Chiplet的設計方式肯定會(huì )產(chǎn)生更多的延遲，而GPU是對延遲極其敏感的，所以AMD特意為此開(kāi)發(fā)了全新的Infinity Link總線(xiàn)（即 Infinity Fanout Links 系統）來(lái)連接GDC和MCD部件，從而在GCD和MCD小芯片部件之間實(shí)現5.3 TB/s的帶寬，這種超級先進(jìn)的互連系統無(wú)疑是小芯片GPU設計的關(guān)鍵決定因素。

可以說(shuō)，AMD的Navi 31為圖形處理器世界帶來(lái)了真正革命性的小芯片GPU設計，如果這一設計取得成功，那么未來(lái)GPU就可以不用依賴(lài)先進(jìn)工藝來(lái)提升性能，而是通過(guò)堆疊更多的GCD來(lái)實(shí)現。GPU市場(chǎng)迎來(lái)新的戰爭。

寫(xiě)在最后

3D IC設計逐漸成為了主流，Chiples也進(jìn)一步崛起，在芯片大廠(chǎng)的推動(dòng)下，基于Chiplet的3D IC設計進(jìn)一步展示了其說(shuō)服力。Chiplet將徹底改變這個(gè)行業(yè)。英偉達何時(shí)采用Chiplet，備受業(yè)界關(guān)注，不過(guò)估計也快了，畢竟黃仁勛已指出，"Moore's Law is dead" 。

本文地址：http://selenalain.com/thread-809526-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

相關(guān)文章

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

相關(guān)視頻

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页