芯片工程師展示了一個(gè)高度專(zhuān)業(yè)化的行業(yè)如何使用 NVIDIA NeMo 來(lái)定制大語(yǔ)言模型,以獲得競爭優(yōu)勢。![]() 10 月 31 日,NVIDIA 發(fā)布的一篇研究論文描述了生成式 AI 如何助力芯片設計,后者是當今最復雜的工程工作之一。 這項工作展示了高度專(zhuān)業(yè)化領(lǐng)域的公司如何利用內部數據訓練大語(yǔ)言模型,從而開(kāi)發(fā)提高生產(chǎn)力的 AI 助手。 像半導體設計這樣如此具有挑戰性的工作并不多見(jiàn)。在顯微鏡下,NVIDIA H100 Tensor Core GPU(上圖)這樣最先進(jìn)的芯片看起來(lái)就像一個(gè)精心規劃的大都市,由數百億個(gè)晶體管組成,把它們連接起來(lái)的線(xiàn)比人的頭發(fā)絲還細 1 萬(wàn)倍。 多個(gè)工程團隊進(jìn)行協(xié)作,需要長(cháng)達兩年的時(shí)間才能構建出這樣一個(gè)數字化超級大都市。 一些小組定義芯片的整體架構,一些小組負責各種超小型電路的設計與布局,還有一些小組負責測試工作。每項工作都需要采取專(zhuān)門(mén)的方法、軟件程序和計算機語(yǔ)言。 大語(yǔ)言模型廣闊的前景 該論文的主要作者、NVIDIA 研究總監 Mark Ren 表示:“我相信,隨著(zhù)時(shí)間的推移,大語(yǔ)言模型將全面助力所有流程! 在同日舉行的國際計算機輔助設計會(huì )議上,NVIDIA 首席科學(xué)家 Bill Dally 發(fā)表主題演講并公布了這篇論文。這個(gè)年度盛會(huì )每年都會(huì )吸引數百名電子設計自動(dòng)化(EDA)領(lǐng)域的工程師參加。 此次會(huì )議在舊金山舉行。Dally 在會(huì )上表示:“這標志著(zhù)在將大語(yǔ)言模型用于復雜的半導體設計方面邁出了重要一步。這項工作表明,即使高度專(zhuān)業(yè)化的領(lǐng)域也可以利用內部數據來(lái)訓練極具價(jià)值的生成式 AI 模型! ChipNeMo 浮出水面 這篇論文詳細介紹了 NVIDIA 工程師如何創(chuàng )建名為 ChipNeMo 的定制大語(yǔ)言模型,供內部使用。該模型使用公司內部數據進(jìn)行訓練并生成和優(yōu)化軟件,以更好地協(xié)助人類(lèi)設計師。 Ren 在 EDA 領(lǐng)域從業(yè)超過(guò) 20 多年,他表示,從長(cháng)遠來(lái)看,工程師們希望生成式 AI 能夠用于芯片設計的各個(gè)階段,從而大幅提升整體生產(chǎn)力。 在針對可能的使用場(chǎng)景對 NVIDIA 工程師進(jìn)行調研之后,研究團隊一開(kāi)始選擇了三個(gè)場(chǎng)景:聊天機器人、代碼生成器和分析工具。 初始用例 維護已知 bug 的更新描述需要耗費大量時(shí)間,而上述分析工具中的后者能夠實(shí)現此類(lèi)任務(wù)的自動(dòng)化,并已得到廣泛的采用。 一個(gè)聊天機器人原型可以回答有關(guān) GPU 架構和設計的問(wèn)題,并且已經(jīng)幫助許多工程師在早期測試中快速找到技術(shù)文檔。 ![]() 代碼生成器將幫助設計者編寫(xiě)芯片設計軟件。 一個(gè)正在開(kāi)發(fā)中的代碼生成器(如上圖所演示)已經(jīng)用兩種芯片設計師專(zhuān)用語(yǔ)言創(chuàng )建了大約 10-20 行軟件的片段。它將與現有工具集成,為工程師們提供一個(gè)方便的助手來(lái)進(jìn)行設計。 使用 NVIDIA NeMo 定制 AI 模型 這篇論文主要關(guān)注該團隊收集設計數據并使用這些數據創(chuàng )建專(zhuān)門(mén)的生成式 AI 模型,這個(gè)過(guò)程可以移植到任何行業(yè)。 作為起點(diǎn),該團隊選擇了一個(gè)基礎模型,并使用 NVIDIA NeMo 對其進(jìn)行了定制。作為 NVIDIA AI Enterprise 軟件平臺的一部分,NVIDIA NeMo 是一個(gè)用于構建、定制和部署生成式 AI 模型的框架。定的 NeMo 模型具有 430 億個(gè)參數,這衡量了它對模式的理解力。它使用超過(guò)一萬(wàn)億個(gè)文本和軟件中的 token、單詞和符號進(jìn)行了訓練。 ![]() ChipNeMo 提供了一個(gè)技術(shù)團隊如何用自己的數據改進(jìn)預訓練模型的示例。 然后,該團隊在兩輪訓練中完善了該模型。第一輪使用了相當于大約 240 億個(gè) token 的內部設計數據,第二輪使用了約 13 萬(wàn)個(gè)對話(huà)和設計示例。 這項工作是半導體行業(yè)進(jìn)行生成式 AI 概念研究和印證的幾個(gè)例子之一, 這一趨勢剛剛開(kāi)始在實(shí)驗室興起。 分享經(jīng)驗 Ren 的團隊學(xué)到的一個(gè)最重要的經(jīng)驗就是定制大語(yǔ)言模型的重要性。 在芯片設計任務(wù)中,只有 130 億個(gè)參數的定制 ChipNeMo 模型的性能達到或超過(guò)了更大的通用大語(yǔ)言模型(例如包含 700 億個(gè)參數的 LLaMA2)。在某些使用場(chǎng)景中,ChipNeMo 模型甚至好很多。 他補充道,在這一過(guò)程中,用戶(hù)需要謹慎地確定他們收集什么數據以及如何清理數據以用于訓練。 最后,Ren 建議用戶(hù)及時(shí)了解可以加快和簡(jiǎn)化工作的最新工具。 NVIDIA Research 在全球各地擁有數百名科學(xué)家和工程師,專(zhuān)注于 AI、計算機圖形學(xué)、計算機視覺(jué)、自動(dòng)駕駛汽車(chē)、機器人學(xué)等領(lǐng)域。近期的其它半導體項目包括使用 AI 設計更小、更快的電路,以及優(yōu)化大型模塊的布局。 希望構建自己的定制大語(yǔ)言模型的企業(yè)現在可以從使用 GitHub 和 NVIDIA NGC 目錄中的 NeMo 框架開(kāi)始。 |