作者:應用材料公司 Mahendra Pakala 在物聯(lián)網(wǎng)、大數據和人工智能 (AI) 的推動(dòng)下,從交通運輸、醫療保健到零售和娛樂(lè )等眾多行業(yè)將走上轉型之路,應用材料公司將其統稱(chēng)為 AI 計算時(shí)代。 在以前的計算時(shí)代中,大型機/小型機、PC/服務(wù)器和智能手機/平板電腦均受益于摩爾定律的進(jìn)步,伴隨著(zhù) 2D 微縮,產(chǎn)品的性能、功耗和面積/成本(也稱(chēng)為“PPAC”)得以同步提升。 雖然 AI 時(shí)代的各類(lèi)應用正在蓬勃發(fā)展,但摩爾定律卻放緩了腳步;因此,行業(yè)需要在 2D 微縮以外取得突破,以全新方式推動(dòng) PPAC 的提升。具體而言,我們需要新的計算架構、新材料、新結構(特別是節省面積的 3D 結構),以及用于芯片堆疊和異構設計的高級封裝。 AI 時(shí)代的架構變化正在對邏輯和存儲器產(chǎn)生影響。機器學(xué)習的算法大量地使用通用邏輯中極為復雜的矩陣乘法運算,這推動(dòng)了加速器及其存儲器的轉變。AI 計算包含兩種明顯不同的存儲器任務(wù):第一種是存儲計算的中間結果;第二種是存儲與訓練模型相關(guān)的權重。 性能和功耗對于云計算和邊緣計算都十分重要,而存儲器方面的創(chuàng )新能夠為此提供助力。一種使用現有存儲器技術(shù)的方法是“近存儲器”,其中大量工作存儲器被壓縮并放置在物理上與邏輯存儲器緊密相鄰的位置,通過(guò)高速接口連接。例如,3D 堆疊和硅通孔技術(shù)正愈發(fā)受到歡迎。作為這些應用中的“工作存儲器”,SRAM 和 DRAM 的一個(gè)主要缺點(diǎn)在于它們是易失性存儲器,需要持續供電來(lái)保存數據(如權重)。 為了降低云和邊緣的功耗,設計人員正在評估兼具高性能和非易失性的新型存儲器,因為它們只有在主動(dòng)讀寫(xiě)時(shí)才需要使用電源。有三種方案引領(lǐng)著(zhù)新型存儲器, 它們分別是磁性RAM (MRAM)、相變式 RAM (PCRAM) 和電阻式 RAM (ReRAM) 。 不同于使用電荷,上述三款存儲器利用新材料產(chǎn)生不同的電阻率狀態(tài) ,而高低電阻依次表示 1 和 0。MRAM 利用磁場(chǎng)方向的變化來(lái)控制電阻率。PCRAM 利用了從非晶態(tài)到晶態(tài)的材料排列結構變化。ReRAM 在材料中創(chuàng )造了一條電流通路。PCRAM 和 ReRAM 均提供電阻率的中間階段,這可在每個(gè)單元中存儲多層的比特數據。 我們來(lái)了解一下 AI 時(shí)代的計算應用,了解它們如何在未來(lái)藍圖中推動(dòng)創(chuàng )新。 ![]() 圖 1. AI 時(shí)代推動(dòng)半導體創(chuàng )新的復興之路 物聯(lián)網(wǎng)邊緣應用可被劃分為低性能/低功耗應用,以及高性能/高功耗應用。 例如,采用 AI 算法的安全攝像頭是一種低性能/低功耗應用,AI 算法非常適合面部和語(yǔ)音識別等應用。設計目標是盡可能多地處理邊緣數據,并且僅將重要信息傳輸到云。由于采樣頻率較低,因此性能要求也很低。功耗(包括待機功耗)至關(guān)重要,對于電池供電設備尤為如此。 目前,業(yè)界在邊緣設備中使用 SRAM 存儲器。SRAM 并非理想選擇,因為每個(gè)存儲單元需要多達六個(gè)晶體管,而且源泄漏功率會(huì )很高。在存儲權重方面,SRAM 的能效并不突出,特別是在低頻設計中使用時(shí)。作為替代方案,MRAM 可確保將晶體管密度提高數倍,從而實(shí)現更高的存儲密度或更小的芯片尺寸。MRAM 的另一個(gè)關(guān)鍵特性在于,這種產(chǎn)品經(jīng)專(zhuān)門(mén)設計,可以安裝到嵌入式片上系統產(chǎn)品 (SOC) 的后端互連層中。MRAM 可用于存儲 SOC 的操作系統和應用程序,無(wú)需使用嵌入式閃存芯片便可實(shí)現這一目的,從而減少了系統芯片的總數和成本。 高性能“近邊緣”應用,如缺陷檢測和醫學(xué)篩檢,則需要更高的性能。MRAM 的一種變型稱(chēng)作自旋軌道轉矩 MRAM (SOT-MRAM),經(jīng)證實(shí),這種產(chǎn)品在速度和功耗方面可能優(yōu)于自旋轉移力矩 MRAM (STT-MRAM)。 云計算需要盡可能高的計算性能,而訓練時(shí)則需要將大量數據轉移到機器學(xué)習加速器附近,相應地,需要為機器學(xué)習加速器提供較大的片上 SRAM 緩存并輔以大型片外 DRAM 陣列——這就要求使用持續的電源。用電量對云服務(wù)提供商非常重要,因為 AI 時(shí)代的數據會(huì )呈指數級增長(cháng),而電網(wǎng)功率有限且成本高昂。PCRAM 的功耗和成本比 DRAM 更低,而性能則比固態(tài)硬盤(pán)和機械硬盤(pán)更高,因此成為云計算架構的首選方案。 除了上述“二進(jìn)制”的邊緣應用、近邊緣應用和云應用方面具備廣闊前景外,在存儲內計算的研究也在日益深入?梢韵胂,在存儲器陣列中為機器學(xué)習執行頻繁的矩陣乘法運算。設計人員正在探索偽交叉點(diǎn)架構,其中權重存儲在各個(gè)存儲器節點(diǎn)上。PCRAM、ReRAM 甚至鐵電場(chǎng)效應晶體管 (FeFET) 都是優(yōu)秀的備選方案,因為它們都有每單元多層存儲的潛力。目前而言,ReRAM 看起來(lái)是最適合此類(lèi)應用的存儲器?梢岳脷W姆定律和基爾霍夫定律在陣列內完成矩陣乘法運算,而無(wú)需向芯片內移入和移出權重。多層單元架構能夠實(shí)現全新級別的存儲器密度,為設計和使用更大的模型提供支持。需要對新材料進(jìn)行全面的開(kāi)發(fā)和工程設計,才能將這些新的模擬存儲器付諸現實(shí),目前應用材料公司正在積極探索部分極具代表性的方案。 當摩爾定律的指數級發(fā)展速度逐漸減緩,AI 時(shí)代將迎來(lái)數據上的指數級增長(cháng)。這種壓力已經(jīng)在推動(dòng)著(zhù)架構、材料、3D 結構以及用于芯片堆疊和異構集成的先進(jìn)封裝不斷創(chuàng )新。存儲器與 AI 計算引擎的關(guān)系越來(lái)越緊密,最終,存儲器可能成為 AI 計算引擎本身。隨著(zhù)這些創(chuàng )新嶄露頭角,我們將見(jiàn)證性能、功耗和密度(面積/成本)的顯著(zhù)提升——隨著(zhù)新型存儲器的逐步優(yōu)化,邊緣、近邊緣和云應用的需求最終會(huì )得到滿(mǎn)足。我們需要硬件上的全面復興來(lái)釋放 AI 時(shí)代的全部潛力。 |