筆者按:2024,行業(yè)“GPT時(shí)刻”來(lái)臨。筆者看到,在匯聚人類(lèi)頂尖智慧與精湛工藝的半導體行業(yè),以智現未來(lái)為代表的工業(yè)軟件供應商,正發(fā)揮著(zhù)其深耕行業(yè)數十年的數據積淀、技術(shù)儲備和深厚的一線(xiàn)服務(wù)經(jīng)驗,以大模型為武器,盤(pán)活工廠(chǎng)數據資產(chǎn),解決晶圓廠(chǎng)數據孤島困局、“經(jīng)驗沉沒(méi)”和“人才密度不足”等諸多難題,開(kāi)啟全新的工業(yè)智能時(shí)代。 ChatGPT引爆了新一輪的人工智能浪潮,各行各業(yè)都在翹首期盼擁有專(zhuān)屬于自己的“AI引擎”。正如每一次技術(shù)革新都將人類(lèi)生產(chǎn)力推向新的高度一樣,在特定行業(yè)內,對垂直領(lǐng)域大模型的需求日益增長(cháng)。與應用廣泛的通用大型語(yǔ)言模型不同,這些垂直領(lǐng)域的大模型專(zhuān)注于深入理解和處理特定領(lǐng)域的信息,提供更專(zhuān)業(yè)化的服務(wù),并從根本上提升相關(guān)行業(yè)的生產(chǎn)力。同時(shí),利用大模型洞察垂直領(lǐng)域更為復雜的隱藏邏輯,讓大模型涌現出像人一樣去使用工具甚至制造工具的能力,提供切實(shí)的生產(chǎn)力的改進(jìn),將是我們一同面臨的機遇和挑戰。 作為國內首家推出專(zhuān)在泛半導體領(lǐng)域應用的大語(yǔ)言模型的企業(yè),深圳智現未來(lái)工業(yè)軟件有限公司無(wú)疑在行業(yè)變革中扮演著(zhù)領(lǐng)軍角色。其發(fā)布的“靈犀”大語(yǔ)言模型及其在泛半導體行業(yè)應用案例不僅展示了該技術(shù)在提升芯片制造效率、降低成本以及增強產(chǎn)品質(zhì)量方面的巨大潛力,可以預見(jiàn),其將為晶圓廠(chǎng)的智能制造提供強大助力。 半導體晶圓廠(chǎng):數據資產(chǎn)的困局與大模型破局之道 半導體制造代表了當前工業(yè)的最高水準,其工藝極其復雜,往往涉及數千個(gè)步驟,在生產(chǎn)中會(huì )產(chǎn)生海量的數據;而單個(gè)工程師一般只具備某個(gè)小領(lǐng)域的專(zhuān)業(yè)知識,服務(wù)于不同的工程師的各種應用應需求而生,造成了數據割裂的現象;數據分析起來(lái)耗時(shí)費力,且高度依賴(lài)工程師的個(gè)人經(jīng)驗。 以下是現階段以晶圓廠(chǎng)為代表的高端制造業(yè)面臨的典型問(wèn)題: 管中窺豹,問(wèn)題處理效率低下:囿于個(gè)人經(jīng)驗和精力的限制,工程師們雖精于一隅,卻難以窮盡全域。面對突發(fā)問(wèn)題,工程師可依據過(guò)往經(jīng)驗對知識能力范圍內的特定問(wèn)題作出迅速響應,當超出自身經(jīng)驗范疇時(shí),只能從頭摸索,耗費大量時(shí)間和精力。只有當一線(xiàn)工程師處理不了的問(wèn)題才會(huì )升級到⼆線(xiàn),這無(wú)疑減緩了生產(chǎn)的步伐,影響整體效率。 數據孤島,知識壁壘阻礙協(xié)作:?jiǎn)蝹(gè)工程師可能只負責產(chǎn)線(xiàn)的一小段,不同工藝段的數據互不貫通,難以理解其工藝段的數據結構和具體含義,處理問(wèn)題就需要跨領(lǐng)域協(xié)調(Inter-Module Meeting),甚⾄反復多次,溝通成本較高,延誤問(wèn)題解決。 經(jīng)驗沉淀和知識傳承成難題:海量生產(chǎn)數據是晶圓廠(chǎng)寶貴的“資產(chǎn)”。然而,問(wèn)題往往是在發(fā)生后才被追溯,大量的經(jīng)驗和知識散落在各個(gè)角落,難以積累沉淀。而且即使有意去調用這些數據,⽂檔、報告難以檢索,更難以借鑒,利⽤率低,造成“經(jīng)驗沉沒(méi)”。 重復操作易出錯,自動(dòng)化機制亟需建立:晶圓廠(chǎng)生產(chǎn)過(guò)程中存在大量需要人工決策的重復性工作,不僅浪費了寶貴的人力資源,也容易導致人為失誤,降低生產(chǎn)質(zhì)量。 ![]() 為了應對這些挑戰,一方面,不少晶圓廠(chǎng)開(kāi)始著(zhù)手打造大數據底座,實(shí)現數據集成,雖然減少了數據對齊時(shí)間,卻仍未能擺脫對工程師個(gè)體經(jīng)驗的依賴(lài)。 另一方面,雖然產(chǎn)業(yè)也在不斷地培養新人才。但是,新入行的初級工程師需要較長(cháng)的訓練和學(xué)習時(shí)間,難以快速積累經(jīng)驗。案例研究Case study和培訓手段匱乏、導師人手不足等問(wèn)題,也制約了人才的培養速度和質(zhì)量。此外,過(guò)往案例檢索困難,導致知識難以有效傳承,也成為人才培養的一大難題。更令人擔憂(yōu)的是,好不容易培養出來(lái)的人才如果流失,寶貴的經(jīng)驗也隨之付諸東流。 大語(yǔ)言模型的出現,為晶圓廠(chǎng)的困境帶來(lái)了破局的曙光。大語(yǔ)言模型一個(gè)已經(jīng)驗證的能力是把非結構化的數據結構化,一方面能夠有效的把歷史上積累的數據資產(chǎn)盤(pán)活,另一方面通過(guò)整合結構化和非結構化數據形成對工廠(chǎng)全貌的認識。此外,大語(yǔ)言模型還具備強大的推理能力,特別是能夠從歷史分析、操作和報告中學(xué)習并進(jìn)行邏輯推理。通過(guò)對大量數據的深度學(xué)習,大模型能夠打通信息孤島,實(shí)現全局的智能分析。同時(shí),大模型還有希望從大量的數據和積累中,洞察出更為復雜的高階關(guān)聯(lián),實(shí)現智能涌現的價(jià)值。 “種子”選手智現未來(lái):用大模型打造半導體工廠(chǎng)的智能數字底座 面對全面的挑戰,⼤模型極有可能是實(shí)現下⼀代的智能制造的最佳路徑。通過(guò)大模型的思考鏈(chain of thought)和驗證鏈(chain of verification),進(jìn)而結合多個(gè)專(zhuān)家系統,將不同的大模型串聯(lián)起來(lái),形成價(jià)值鏈(chain of value),使大模型能夠從“被動(dòng)調用”轉變?yōu)椤爸鲃?dòng)發(fā)現問(wèn)題”,通過(guò)“舉一反三”,創(chuàng )造涌現性?xún)r(jià)值,為制造業(yè)帶來(lái)革命性的變革。 然而,并不是簡(jiǎn)單的遷移就可以讓大模型發(fā)揮理想的價(jià)值,想要參與到晶圓廠(chǎng)紛繁復雜的工藝制造中,大語(yǔ)言模型需要行業(yè)大量高質(zhì)量的語(yǔ)料結合經(jīng)驗的積淀來(lái)完成訓練,同時(shí)需要對行業(yè)充分的理解并贏(yíng)得客戶(hù)的信任。行業(yè)大模型對數據、算法、算力皆有要求,需要深厚工程化思維的不斷積累,業(yè)內鮮少有企業(yè)能夠具備轉化的所有條件。在擁有并理解大量專(zhuān)業(yè)數據這方面,只有占據半導體數據高地、深耕工程智能領(lǐng)域幾十年的寥寥數家公司,可以生成并系統化、規范化地積累了大量的高質(zhì)量語(yǔ)料。 智現未來(lái)在這場(chǎng)已經(jīng)到來(lái)的技術(shù)革新浪潮中,就像是“天生”的種子選手一樣,具備發(fā)展泛半導體行業(yè)垂直大模型的所有先天條件。智現未來(lái)脫胎于工程智能全球“三大家”之一的BISTel,其在工程智能領(lǐng)域深耕20多年,具備深厚的經(jīng)驗、清晰的行業(yè)認知、技術(shù)儲備及大量標桿客戶(hù)的成功案例,積累了豐富的生產(chǎn)數據和工藝數據。這些寶貴的數據財富、全面的行業(yè)理解、構建高質(zhì)量模型的人才積累,為智現未來(lái)打造國內首個(gè)半導體垂直類(lèi)大語(yǔ)言模型——“靈犀”,奠定了堅實(shí)的基礎。 以下是智現未來(lái)“靈犀”大語(yǔ)言模型的價(jià)值實(shí)現路徑: ![]() ①在當前市場(chǎng)中,眾多基礎大型語(yǔ)言模型(LLM)如GPT 4、Llama 3等紛紛涌現,它們具備基礎的讀寫(xiě)能力,類(lèi)似于知識面廣泛的“高中生”。盡管對半導體這類(lèi)專(zhuān)業(yè)領(lǐng)域有所涉獵,但理解尚淺。如何對這些基礎大模型進(jìn)行測評?一方面需要AI專(zhuān)家,另一方面,需要將其接入成熟的半導體行業(yè)應用軟件做基準測試(benchmark)。 ②為進(jìn)一步提升,模型需深入學(xué)習專(zhuān)業(yè)知識,仿佛“高中生”進(jìn)入大學(xué)專(zhuān)攻半導體專(zhuān)業(yè),通過(guò)吸收半導體領(lǐng)域公有域的知識和資料,逐步成長(cháng)為知識豐富的“半導體專(zhuān)業(yè)大學(xué)生”。語(yǔ)料選擇和如何教授成為這一階段的關(guān)鍵點(diǎn)。 ③接下來(lái),由具備數十年實(shí)戰經(jīng)驗和行業(yè)積累的資深專(zhuān)家“智現未來(lái)”擔任導師,結合智現未來(lái)20余年積累的私有數據(包括設備和工藝數據、文檔、模型、算法、代碼等等)深化訓練。 ④經(jīng)過(guò)上述的培育,模型蛻變?yōu)楣こ讨悄茴I(lǐng)域的“研究生”,這就是智現未來(lái)的“靈犀”大語(yǔ)言模型。 ⑤進(jìn)一步,“靈犀”大模型被放入客戶(hù)的晶圓廠(chǎng)實(shí)地環(huán)境中,采用智現未來(lái)提供的專(zhuān)業(yè)工具鏈和流程,由工廠(chǎng)和智現未來(lái)的專(zhuān)家共同指導,經(jīng)過(guò)二次訓練和客戶(hù)私有數據的定制化學(xué)習,錘煉成為該領(lǐng)域的技術(shù)專(zhuān)家。 ⑥作為工廠(chǎng)的技術(shù)專(zhuān)家,大模型能夠提供智能缺陷檢測、智能報告生成、智能故障分析以及客戶(hù)專(zhuān)屬的行業(yè)服務(wù)。 這樣的一個(gè)大模型集合了所有⼯程師的視⻆和經(jīng)驗,既懂設備,又懂工藝、制造、良率分析,涌現出超越個(gè)體之和的分析和解決問(wèn)題的能⼒,成為生產(chǎn)制造過(guò)程的“超級大腦”。 此外,區別于人類(lèi),AI可以實(shí)現24小時(shí)不間斷運行且錯誤率極低。AI更大的優(yōu)勢在于,它不僅能處理常規數據,還能洞察更高維的關(guān)聯(lián),提取到⼈看不到的信息,實(shí)現從“類(lèi)人(like human)”到“超越人類(lèi)(beyond human)”的智能飛躍。例如:為了適應人的感知,以往的wafer map通過(guò)晶圓網(wǎng)格配合顏色可以展現芯片的三個(gè)維度(x, y, Good/NG),但對于每個(gè)芯片(die)來(lái)說(shuō),除了基本的良品(good)與不良品(NG)分類(lèi)外,其下還隱藏著(zhù)更多維度的測試結果,如電性特性等關(guān)鍵參數,而AI能夠直接處理這些高維的數據。 “靈犀”大語(yǔ)言模型:半導體“智造”利器已光芒初現 盡管大語(yǔ)言模型在行業(yè)應用才處于探索階段,但是“靈犀”已經(jīng)在有限的探索范圍內閃現了其可能照亮未來(lái)的光芒;谇捌陂L(cháng)期的積累,僅僅不到半年的驗證及探索,“靈犀”大模型已經(jīng)在缺陷圖像識別、Wafer Map失效自動(dòng)分類(lèi)、FDC設備異常監控、良率分析預測、設備預防維護、智能專(zhuān)家推理、群體智能知識中臺等多個(gè)領(lǐng)域都已展現出巨大潛力,迸發(fā)“靈犀”之光。 案例一:多模態(tài)缺陷識別 半導體生產(chǎn)中存在大量缺陷分析需求,傳統方法依賴(lài)人工標注和分析,需要大量(可能是上萬(wàn)個(gè))缺陷樣本的積累才能建立出一個(gè)缺陷識別機制,且依賴(lài)樣本照⽚與標記的質(zhì)量,這不僅耗時(shí)且易出錯。如何有效整合多維度數據以提升分析的深度和積累經(jīng)驗,從而提高缺陷分析的效率和準確性,成為行業(yè)面臨的一個(gè)重大挑戰。 基于“靈犀”大語(yǔ)言模型的多模智能缺陷改良系統,通過(guò)實(shí)時(shí)監控生產(chǎn)線(xiàn),能夠結合圖⽚特征、產(chǎn)線(xiàn)數據、⽂本經(jīng)驗等多模態(tài)的數據,構建復合矩陣的多元分析,實(shí)現自動(dòng)識別缺陷,快速準確分類(lèi),并自主生成缺陷報告和根因分析。該方案僅需要以前2%的數據即可做到更準確的識別,將訓練的樣本數量減少2個(gè)數量級。這不僅大幅提升了效率,還減少了樣本標錯的機率。原來(lái)數百工程師一年的工作量,“靈犀”大模型只需要2~3個(gè)月就可以完成,分類(lèi)準確率更是提升超過(guò)10%。 “靈犀”之光的閃現點(diǎn): “靈犀"的多模態(tài)能力突破了單個(gè)工程師對單一知識領(lǐng)域的局限,打破了"管中窺豹"的狹窄視角,實(shí)現了對復雜工程問(wèn)題的全面理解和深入洞察,真正做到知識集合、共享的群體智能。 借助AI技術(shù),“靈犀”大語(yǔ)言模型幫助工程師實(shí)現了對數據的即時(shí)分析,極大減少了人工干預,顯著(zhù)提高了報告的準確性與及時(shí)性。 至關(guān)重要的是,所有分析過(guò)程和結果都被有效整合并沉淀至大語(yǔ)言模型之中,為模型的持續學(xué)習與訓練提供了寶貴資源,確保了智能缺陷改良能力的不斷演進(jìn)與升級。 案例二:良率分析應用(Yield Analysis) 良率(Yield)是半導體產(chǎn)業(yè)的終極挑戰,芯片的良率也直接關(guān)乎著(zhù)芯片制造的成本,因此良率分析對于半導體制造商來(lái)說(shuō)極為關(guān)鍵。通過(guò)系統分析不良品和確定造成不良的原因,可以采取措施提高良率,進(jìn)而降低成本。 目前市場(chǎng)上廣泛使用的如YMS良率管理系統、DMS缺陷管理系統等良率分析平臺,均屬于管理系統。這些系統在設計時(shí)面臨一定挑戰,由于良率分析方法因人而異,對自由度有極高要求,使得軟件設計和操作起來(lái)都很復雜,也很難滿(mǎn)足高級分析需求,且常常無(wú)法有效關(guān)聯(lián)原始追蹤數據(Raw Trace Data)。 基于“靈犀”大語(yǔ)言模型的良率分析系統能夠根據歷史和實(shí)時(shí)數據自動(dòng)建模,提供“千人千面”的分析工作臺,增強數據探索自由度!办`犀”極大地簡(jiǎn)化了交互流程,加快了問(wèn)題解決速度。 不同于其他YMS良率管理系統,搭載“靈犀”的良率分析系統(YAS)融合了半導體領(lǐng)域資深AI工程師的智慧與能力,隨時(shí)在線(xiàn)的Copilot“老師傅當助理”,可快速調用數據、自動(dòng)執行建模與分析,找到影響良率的根因,并提供優(yōu)化建議,形成報告,幫助工廠(chǎng)快速做出更加精準的生產(chǎn)決策,大幅提升了生產(chǎn)管理的智能化水平。 除此之外,“靈犀”還在多個(gè)領(lǐng)域能夠創(chuàng )造令人驚嘆的價(jià)值。例如,“靈犀”大模型通過(guò)自動(dòng)化建模和分析,使設備預測性維護從被動(dòng)轉為主動(dòng),優(yōu)化維護計劃,讓設備維護更加精準,既避免出現安全生產(chǎn)事故,又避免“過(guò)度”維護,從而提高半導體晶圓廠(chǎng)的生產(chǎn)效率并減少經(jīng)濟損失。 可以預見(jiàn),“靈犀”大模型的應用,將為半導體行業(yè)帶來(lái)一場(chǎng)深刻的變革,推動(dòng)半導體制造業(yè)智能化升級,提高生產(chǎn)效率、降低生產(chǎn)成本、提升產(chǎn)品質(zhì)量,釋放巨大的生產(chǎn)潛力,為行業(yè)發(fā)展注入新的活力。 ![]() ( 圖源:攝圖網(wǎng)) 展望:大模型碰撞工程智能,涌現高質(zhì)量新質(zhì)生產(chǎn)力的無(wú)限可能 目前,業(yè)界普遍認為大模型的能力在于其對復雜符號關(guān)系的把握以及對世界高階相關(guān)性的認知,這些能力正在超越人類(lèi)的認知極限。特別是在智能制造這一領(lǐng)域,大模型通過(guò)分析和處理大量數據,能夠識別現階段人類(lèi)工程師難以察覺(jué)的模式和關(guān)聯(lián),從而優(yōu)化生產(chǎn)流程,提升制造效率和質(zhì)量。這種超越人類(lèi)的認知能力,不僅加速了智能制造的發(fā)展,也必將會(huì )對其他相關(guān)領(lǐng)域產(chǎn)生深遠的影響。 工程智能作為高階智能制造技術(shù),面對的是極復雜、高標準、擁有大量樣本數據和經(jīng)驗積累的場(chǎng)景,而這些都作為大量的優(yōu)質(zhì)數據樣本,沉淀在代碼和文檔中。大模型與工程智能的相遇,更像是各自準備,相向而行的不期而遇。 可以預見(jiàn)的是,以智現未來(lái)為代表的工程智能解決方案供應商,將會(huì )用數十年來(lái)構建的成熟可靠的產(chǎn)品體系,在大模型的深度融合和加持下,實(shí)現革命性的全面煥新。大模型作為中間能力,必將深度滲透并強化了工程智能系統中數據搜集、智能監測、智能分析、智能預測、智能決策等各個(gè)關(guān)鍵環(huán)節。大模型與工程智能的碰撞,是如虎添翼的優(yōu)勢相乘,天然的優(yōu)質(zhì)土壤遇到基因優(yōu)良的種子,一定可以結出豐碩的成果。 ![]() ( 圖源:攝圖網(wǎng)) “GPT時(shí)刻”已經(jīng)到來(lái)。根據預測未來(lái)3年,AI在整個(gè)制造業(yè)的投入規模和產(chǎn)出價(jià)值都將會(huì )成倍增長(cháng)。像”靈犀“這樣的工業(yè)大模型的崛起,正悄然開(kāi)啟半導體工廠(chǎng)的全新篇章。在這個(gè)新的章節中,所有的數據、操作都必須接入大模型,所有的決策都將以大模型為基礎;每個(gè)⼯程師都需要⼀組⼯程師助理,以便集中精力解決更重要的問(wèn)題,提升產(chǎn)線(xiàn)效率;每個(gè)⼯⼚都需要⼀個(gè)專(zhuān)屬于自己的專(zhuān)家系統,將分散的知識經(jīng)驗形成資產(chǎn)沉淀,打造可泛化的群體智能,靜待智能涌現,為“智造”創(chuàng )造無(wú)限可能。 |