近日,由Aitomatic公司及其“AI聯(lián)盟”合作伙伴共同開(kāi)發(fā)的SemiKong正式發(fā)布。這一大型語(yǔ)言模型(LLM)是全球首個(gè)專(zhuān)為滿(mǎn)足半導體行業(yè)需求而精心打造的AI工具。 SemiKong基于Meta的Llama 3.1 LLM平臺構建,擁有700億參數。它的開(kāi)發(fā)過(guò)程凝聚了多方力量,Aitomatic公司負責主導開(kāi)發(fā),而“AI聯(lián)盟”中的眾多合作伙伴也積極參與其中!癆I聯(lián)盟”于2023年成立,成員涵蓋了Meta、AMD、IBM等科技企業(yè),還包括耶魯大學(xué)、東京大學(xué)等研究機構。該聯(lián)盟旨在構建、支持和倡導整個(gè)AI技術(shù)領(lǐng)域的開(kāi)放式創(chuàng )新,以此抗衡英偉達在科技行業(yè)的主導地位。 SemiKong的核心目標在于融入半導體設計公司的工作流程,充當“數字專(zhuān)家”角色。它在半導體行業(yè)有著(zhù)諸多重要意義。一方面,它能夠將新芯片設計的上市時(shí)間縮短20 - 30%,這無(wú)疑將極大地提高半導體行業(yè)的研發(fā)效率。另一方面,SemiKong可使首次投產(chǎn)成功率提高20%,同時(shí)把新工程師的學(xué)習曲線(xiàn)縮短高達50%,這對于半導體行業(yè)的人才培養和生產(chǎn)力提升有著(zhù)積極的推動(dòng)作用。 從技術(shù)角度來(lái)看,SemiKong的訓練過(guò)程主要分為預訓練領(lǐng)域知識、自我微調(指令數據集)、合并和量化這三個(gè)主要階段。盡管它有8B和70B兩個(gè)版本,但最近發(fā)布的700億參數版本已經(jīng)展現出卓越的性能。它在準確性、相關(guān)性和對半導體工藝的理解方面都取得了顯著(zhù)的進(jìn)步。即使是其較小版本,在特定領(lǐng)域的應用中也常常超越較大的通用模型,這為那些想要打造適合自身的專(zhuān)有模型的芯片公司提供了一個(gè)極具價(jià)值的基座。 此外,SemiKong作為首個(gè)半導體專(zhuān)用的開(kāi)源大模型,于2024年7月9日起在HuggingFace和GitHub上提供下載。它的問(wèn)世不僅是Aitomatic公司及其“AI聯(lián)盟”合作伙伴的重要成果,也將為半導體行業(yè)的發(fā)展格局帶來(lái)新的變革機遇,有望重塑半導體制造業(yè)的未來(lái)。 |