僅需28nm工藝,提升AI芯片十倍能效,國產(chǎn)存算一體「超速前進(jìn)」

發(fā)布時(shí)間:2022-9-30 10:24    發(fā)布者:eechina
關(guān)鍵詞: 28nm , AI
來(lái)源:雷鋒網(wǎng)

僅僅在五、六年前,人工智能還只存在于人們的想象。

短短幾年間AI快速擴張,AI算力和運算數據量每年都在以指數級增加,對算力的需求空前,但摩爾定律卻已接近極限。

在能耗墻和存儲墻的阻擋下,半導體愈來(lái)愈蹣跚的算力提升已經(jīng)追不上狂奔的AI。

存算一體架構有機會(huì )讓AI面臨的問(wèn)題迎刃而解。時(shí)代的浪潮下,一批探索存算一體的企業(yè)相繼成立。

在這個(gè)領(lǐng)域中,國內外研究幾乎站在同一起跑線(xiàn)上。

其中億鑄科技是將新型存儲器ReRAM用于存算一體賽道的“先行者”。成立僅僅兩年,億鑄科技就已能夠設計出能效比超過(guò)主流計算卡十倍的基于ReRAM的存算一體AI大算力芯片。

在即將到來(lái)的存算一體爆發(fā)期,國產(chǎn)廠(chǎng)商們將要迎來(lái)的,是一場(chǎng)與國外巨頭們堂堂正正的對決。

名為GPU的馬,拉不動(dòng)AI的車(chē)

自1956年約翰.麥卡錫在達特茅斯會(huì )議上提出人工智能的概念,AI已經(jīng)發(fā)展了70年。

70年間,AI曾經(jīng)爆發(fā)過(guò)三次浪潮。

在前兩次浪潮中,AI由于種種原因,最終未能普及。

直到第三次浪潮中,深度學(xué)習技術(shù)的興起,解決了AI普適性與可維護性的問(wèn)題,這一賽道才真正迎來(lái)曙光,造就了現代意義上的基于深度學(xué)習的“人工智能”。

隨著(zhù)深度學(xué)習的廣泛應用,對算力的需求日益增加,這讓能夠提供大規模算力的GPU在A(yíng)I領(lǐng)域變得越來(lái)越重要。

然而GPU畢竟不是專(zhuān)為人工智能而生,隨著(zhù)人工智能發(fā)展走入深水區,GPU的問(wèn)題逐漸浮現,尤其是AI發(fā)展中的“存儲墻”、“能耗墻”問(wèn)題,GPU無(wú)法突破。

無(wú)論是CPU還是GPU,采用的都是存算分離的馮諾依曼架構。

在馮諾依曼架構下,80%-90%的功耗發(fā)生在數據傳輸上,99%的時(shí)間消耗在存儲器讀寫(xiě)過(guò)程中,導致了“存儲墻”和“功耗墻”問(wèn)題。

馮諾依曼架構的芯片在工作時(shí),計算單元要先從內存中讀取數據,計算完成后再存回內存,才能最終輸出。

但在過(guò)去幾十年中,存儲器與處理器的發(fā)展嚴重失衡,自上世紀八十年代以來(lái),存儲器讀取速率的提升遠遠跟不上處理器性能的增長(cháng)。

這導致了計算畸形的漏斗結構:無(wú)論處理器所在的漏斗“入口”一端處理了多少數據,也只能通過(guò)存儲器狹窄的“出口”輸出,嚴重影響了數據處理的效率。

曾在A(yíng)I芯片公司W(wǎng)ave Computing工作過(guò)的熊大鵬博士對此深有感悟。

2014年左右,熊大鵬正在從事GPGPU領(lǐng)域的研究,在工作中他深感能耗墻與功耗墻的限制下,人工智能難以持續發(fā)展。

熊大鵬認為,打破內存與計算隔閡的存算一體架構是人工智能未來(lái)的一個(gè)可能解。

不同于馮諾依曼架構,存儲單元與計算單元一體的結構讓數據不必在兩者之間反復“搬運”,從而讓“能耗墻”與“功耗墻”問(wèn)題迎刃而解。

談起對存算一體技術(shù)的初印象,熊大鵬說(shuō)到:“2017年我第一次接觸到存算一體技術(shù),當時(shí)就震驚于怎么會(huì )有這么好的東西能夠恰好解決AI芯片面臨的問(wèn)題!

在初識存算一體后,熊大鵬興趣盎然,立刻開(kāi)始了著(zhù)手從產(chǎn)業(yè)界到學(xué)界學(xué)習和調研,對存算一體建立了系統的認識。

當時(shí),把存算一體運用到AI中還只是一種理論,熊大鵬還沒(méi)有找到將他在存算一體領(lǐng)域的雄心落實(shí)的機會(huì )。

熊大鵬得以實(shí)現抱負的契機是與ReRAM的偶遇,這也是他在2020年創(chuàng )立存算一體AI芯片公司億鑄科技的關(guān)鍵。

存算一體的「天時(shí)」、「地利」與「人和」

2018年,熊大鵬在工作中接觸到了ReRAM的領(lǐng)軍企業(yè)Crossbar。當時(shí)正在苦苦尋找存算一體技術(shù)在A(yíng)I芯片領(lǐng)域落地方案的他,剛一接觸ReRAM,就近乎直覺(jué)地認為ReRAM有解決存算一體落地問(wèn)題的能力。

存算一體的存儲介質(zhì)選擇一般有三種方案:Flash等傳統存儲介質(zhì);相對成熟的易失性存儲器SRAM;以及ReRAM等新型存儲器。

熊大鵬說(shuō),不同的存儲介質(zhì)有不同的特點(diǎn),也有各自最適配的應用領(lǐng)域,而在他看好的AI大算力芯片場(chǎng)景下,ReRAM則是最合適的選擇。

在他看來(lái),NAND Flash讀寫(xiě)延時(shí)較大,性能相對落后,并且工藝節點(diǎn)在40nm左右,難以隨先進(jìn)工藝繼續迭代,無(wú)法滿(mǎn)足AI大算力芯片的計算需求。

SRAM存儲器在大算力場(chǎng)景下則存在單位密度受限、漏電流和工程落地難度和成本較高等問(wèn)題。

而ReRAM雖然在應用于模擬存算一體時(shí)也存在著(zhù)精度和數模轉換等難題,但在熊大鵬看來(lái),億鑄科技選擇的基于ReRAM的全數字化存算一體技術(shù),能較好解決精度和數模轉換等難題,無(wú)疑更適合應用在A(yíng)I大算力芯片的場(chǎng)景中。

ReRAM是一種新型非易失存儲器,其基本存儲單元被稱(chēng)為憶阻器,是一種可編程電阻,其特點(diǎn)是在斷電之后電阻值依然能夠長(cháng)期保持。

憶阻器可編程的性質(zhì)讓其非常適合在ReRAM存儲單元上加上計算功能,而斷電后保持數據不丟失的特性也讓它能夠成為可靠的存儲器,這都讓ReRAM與存算一體架構的要求不謀而合。

在與一家全球ReRAM新型存儲技術(shù)領(lǐng)軍企業(yè)中的老朋友們,還有斯坦福大學(xué)、德克薩斯大學(xué)奧斯汀分校、上海交通大學(xué)、復旦大學(xué)、中國科學(xué)技術(shù)大學(xué)等高校的知名科學(xué)家們經(jīng)過(guò)幾個(gè)月的討論后,熊大鵬對使用ReRAM存算一體技術(shù)解決AI大算力芯片問(wèn)題有了初步想法,隨即開(kāi)始組建團隊。

用ReRAM和全數字化存算一體技術(shù)做AI芯片是一條全新的道路,前人留下的腳印甚少,過(guò)河沒(méi)有石頭可摸。

一開(kāi)始熊大鵬也考慮過(guò)從技術(shù)更成熟的SRAM開(kāi)始,再過(guò)渡到ReRAM。

最終是團隊的支持給了熊大鵬信心。團隊組建的過(guò)程中,熊大鵬找到了過(guò)去在Wave Computing共事過(guò)的Debu博士。

Debu博士是IEEE Fellow、曾就職于斯坦福大學(xué),當時(shí)在Cadence擔任首席科學(xué)家兼AI部門(mén)CTO,也在研究基于SRAM的存算一體IP Core,并且已經(jīng)成家。如果接受熊大鵬的邀約,在家庭和事業(yè)兩方面都面臨著(zhù)困難。

但Debu在了解到熊大鵬決定入局基于ReRAM的全數字化存算一體芯片后,頓覺(jué)這是一項面向未來(lái)的大事業(yè),解決了他在Cadence研究過(guò)的基于SRAM 存算一體未能解決的技術(shù)瓶頸,克服種種困難最終還是決定加入到億鑄科技創(chuàng )業(yè)的行列中。

Debu不遠千里來(lái)投,讓熊大鵬感受到了有識之士對這個(gè)賽道的信心,而許多之前曾與熊大鵬有過(guò)深入交流的包括工藝器件、電路設計、架構方案和軟件生態(tài)等各方專(zhuān)家學(xué)者的加入,則給了熊大鵬技術(shù)攻關(guān)的底氣。

“不論是ReRAM還是MRAM都是比較前沿的領(lǐng)域,單憑企業(yè)自身很難成功,離不開(kāi)新型存儲器領(lǐng)域領(lǐng)先的合作伙伴企業(yè)和一流研究團隊的支持!毙艽簌i說(shuō)。

有了這些的支持,熊大鵬終于下定決心,決定直接從ReRAM開(kāi)始。

“我們的創(chuàng )業(yè)團隊是‘三老’團隊,”熊大鵬略帶調侃地說(shuō),“老同事,老同學(xué),老朋友!

原本就對AI芯片十分熟悉的熊大鵬和對基于SRAM存算一體擁有開(kāi)發(fā)經(jīng)驗的Debu讓億鑄科技開(kāi)局已占地利,而眾多老友的加入讓億鑄科技又添人和。而在熊大鵬看來(lái),存算一體的天時(shí)也正在當下。

決戰近在咫尺,中國芯這次正面「亮劍」

對于國產(chǎn)存算一體芯片的企業(yè)們來(lái)說(shuō),前路依然漫漫,但代表著(zhù)決戰的鼓聲已經(jīng)悄然迫近。

創(chuàng )業(yè)者的身份外,熊大鵬還是一名在芯片領(lǐng)域縱橫多年的投資人。

作為投資人,熊大鵬見(jiàn)證了許多新興技術(shù)的成長(cháng)。過(guò)往的經(jīng)驗告訴他,屬于存算一體的時(shí)代距離現在并不遙遠。

在熊大鵬看來(lái),存算一體產(chǎn)業(yè)從已經(jīng)實(shí)現了從端側小算力到云端大算力的全場(chǎng)景覆蓋,整個(gè)產(chǎn)業(yè)鏈的配套正在成熟。

同時(shí),潛在客戶(hù)對存算一體的認知也越來(lái)越清晰,從“沒(méi)聽(tīng)說(shuō)”到“有了解”再到如今已經(jīng)對產(chǎn)品“有期待”。

在國家對能耗越來(lái)越嚴格的管控趨勢下,數據中心對高能效比的大算力產(chǎn)品的需求也在高漲。而存算一體芯片超高能效的特性正好可以滿(mǎn)足市場(chǎng)需求。

種種因素相疊加,熊大鵬做出判斷:“2024年到2025年,存算一體的產(chǎn)品會(huì )全面開(kāi)花!

距離存算一體的全面爆發(fā),還有三年時(shí)間。對于國產(chǎn)存算一體廠(chǎng)商來(lái)講,這正是屬于他們的“天時(shí)”。

億鑄科技僅正式運營(yíng)兩月后,就獲得了由聯(lián)想之星、中科創(chuàng )星和匯芯投資聯(lián)合領(lǐng)投的過(guò)億元天使輪融資。在推動(dòng)ReRAM落地的關(guān)鍵技術(shù)上,億鑄科技也已經(jīng)取得了突破。

如果用模擬或混合方式構建芯片,憶阻器在受到工藝和環(huán)境的影響時(shí),會(huì )出現精度漂移和數模/模數轉換能耗問(wèn)題。這也是ReRAM落地存算一體的關(guān)鍵阻礙。

為了突破這一難關(guān),億鑄科技選擇攻關(guān)全數字化存算一體技術(shù)。

基于全數字化方式構造芯片,無(wú)需模數和數模信號轉換器,不會(huì )受到信噪比的影響,精度可以達到32bit甚至更高,既不會(huì )產(chǎn)生精度損失,也不會(huì )面臨模擬計算帶來(lái)的諸如IR-DROP等問(wèn)題。

基于全數字化方式,億鑄科技將開(kāi)發(fā)業(yè)界首顆基于ReRAM的全數字化存算一體AI大算力芯片,采用chiplet技術(shù),單模組將突破1000TOPS算力,超出GPU 250TOPS算力的四倍多。

熊大鵬表示,億鑄科技的產(chǎn)品落地正在快速推進(jìn),第一代芯片將于2023年落地,并在同年投片第二代芯片。

雖然一切順利,但無(wú)論對億鑄科技還是對存算一體芯片來(lái)說(shuō),這都遠遠不是終點(diǎn)。

熊大鵬認為,在技術(shù)上實(shí)現存算一體和在商業(yè)上取得成功是兩種概念。在他看來(lái),存算一體芯片要想大規模被應用,首先要建立起自己的生態(tài)。

熊大鵬告訴我們,在大算力應用場(chǎng)景下,存算一體的競爭力在于構建生態(tài)系統。

僅僅“參與”到現有的生態(tài)中,這遠遠不夠,只有跳出傳統架構的局限,一開(kāi)始就以存算一體作為思路構建整體系統才能真正發(fā)揮存算一體的競爭力。

億鑄科技的目標除了將存算一體架構在A(yíng)I大算力領(lǐng)域商用落地之外,還期望和其他存算一體賽道上的伙伴們共建生態(tài)。

而在美國對我國半導體領(lǐng)域持續打壓的背景下,存算一體芯片還承載著(zhù)著(zhù)沖破藩籬的使命。

前段時(shí)間,美國出臺了對我國的先進(jìn)制程和高性能計算設計工具EDA等的出口限制政策,這無(wú)疑將對我國AI研究的未來(lái)帶來(lái)更大挑戰。

熊大鵬認為,在先進(jìn)工藝短期內無(wú)法實(shí)現全國產(chǎn)化的大前提下,國內半導體必須具備在性能表現相同的條件下發(fā)展與先進(jìn)制程解耦的技術(shù)。

存算一體就是一種突破先進(jìn)制程對性能限制的有效路徑:億鑄科技基于成熟的28nm CMOS工藝和國內既有產(chǎn)業(yè)配套設計的存算一體AI大算力芯片已經(jīng)可以實(shí)現7nm CMOS先進(jìn)制程AI芯片10倍以上能效比和性能。

并且,在存算一體賽道上,國產(chǎn)芯片廠(chǎng)商們并非單方面的追趕。

在熊大鵬看來(lái),與傳統賽道相比,在存算一體芯片領(lǐng)域,國外“巨頭們”并沒(méi)有在這條新開(kāi)辟的道路上領(lǐng)先太多。

“總的來(lái)說(shuō),國內外在存算一體領(lǐng)域差距不大,而且在某些方面,我們做的更快更好。國內做存算一體的基本都是初創(chuàng )公司,初創(chuàng )公司可以大干快上地投入,無(wú)懼國外巨頭們的競爭,而這些巨頭們卻未必有擁抱革命性技術(shù)來(lái)革自己命的決心,效率也不一定比我們高!毙艽簌i總結道。

對于這場(chǎng)即將降臨的決戰的最終結果,熊大鵬顯得信心十足:“到了存算一體全面開(kāi)花的那天,我們一定能夠戰勝他們!

存算一體賽道上,第一批國產(chǎn)挑戰者已經(jīng)起跑,相信在存算一體未來(lái)幾年內將到來(lái)的“未來(lái)之戰”中,國產(chǎn)芯片公司一定能夠跑出存算領(lǐng)域的“領(lǐng)航者”。如果想和作者更深度討論存算一體芯片的話(huà)題,可以添加作者微信Soldier7887(注明來(lái)意),下一篇文章我們將講一講基于SRAM的存算一體AI大算力芯片,歡迎從業(yè)者與作者討論。
本文地址:http://selenalain.com/thread-802439-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页