即便放眼整個(gè)IC行業(yè),像Chris Rowen博士這般愛(ài)談技術(shù),同時(shí)又可以講得如此深入淺出的,著(zhù)實(shí)少見(jiàn)。他可以一邊舉起手中的iPhone做各種演示,也可以拿起隨手拾見(jiàn)的小紙條寫(xiě)寫(xiě)畫(huà)畫(huà)來(lái)加強語(yǔ)氣。他咬字無(wú)比清晰準確(尤其在諸如Interestingly或者particularly 這類(lèi)副詞的時(shí)候會(huì )讀得緩慢甚而產(chǎn)生了某種韻律感),似乎是在運用一種類(lèi)似于詩(shī)人誦詩(shī),抑或冒險家在眾人面前娓娓道來(lái)諸多奇跡的情緒和語(yǔ)氣,來(lái)描述那些 SoC設計的理念。很神奇。 而更加奇妙的是,他幾乎經(jīng)歷過(guò)微處理器的所有起起伏伏,前世今生。他是RISC架構的奠基人之一,分別參與了Intel和MIPS公司的大躍進(jìn)時(shí)代,如今,又帶著(zhù)一種全新SoC架構的理念,在或多或少地改變著(zhù)我們的數字時(shí)代。所以,與其說(shuō)是采訪(fǎng),還不如說(shuō)是在聽(tīng)一個(gè)傳奇(而且這個(gè)傳奇也不過(guò)是翩翩中年哦!)講故事。 Power Density、Parallel、Multi-Core、FPGA、 RISC、SoC,這些詞于談笑間輾轉騰挪,有一瞬間,我差點(diǎn)覺(jué)得對面坐著(zhù)的是Wes Anderson,那個(gè)拍出過(guò)《了不起的狐貍爸爸》(Fantastic Mr. Fox)的我最中意的好萊塢導演。不避世也不趨世。獨辟蹊徑,信手拈來(lái)。關(guān)鍵都還挺帥的。 1、我看過(guò)您2004年寫(xiě)的 “復雜SoC設計”,非常喜歡的第8章(Chris Rowen:“SOC設計的未來(lái)”哈哈)。恩您還記得。因為你的所有預言都應驗了,這非常有趣。所以我的問(wèn)題是,您如何看待再6年之后的SoC設計,或者說(shuō)和SoC設計有關(guān)的那些技術(shù)趨勢? Chris Rowen :哇,這個(gè)問(wèn)題還不賴(lài)!我認為這個(gè)市場(chǎng)的大方向還是相當清楚的?纯词袌(chǎng)層面的基本趨勢,再看看技術(shù)層面的基本趨勢,你就可以看到他們在哪里重合。就技術(shù)而言,你會(huì )發(fā)現摩爾定律(Moore's Law)作為經(jīng)濟驅動(dòng)力的事實(shí)。但是摩爾定律真正有趣的部分在于,第一,是“集成度(Density)持續提高”。每隔2年半或者3年,硅密度就要提高一倍,這意味著(zhù)近一倍成本的降低,讓射頻產(chǎn)品中的數字模塊集成度越來(lái)越高。這也意味著(zhù),各種系統都在規模(Scale)上變得越來(lái)越小。所以無(wú)論是電腦亦或消費電子設備,每一個(gè)系統的目的都是集成于同一塊芯片。這就變得有趣起來(lái)。因為在過(guò)去,你可以生產(chǎn)通用(Generic)存儲器,通用處理器,通用射頻,諸如此類(lèi),然后一股腦兒放在一塊兒,建一個(gè)非常牛逼的專(zhuān)用(Specific)系統。但是在今天,事情都顛過(guò)來(lái)了。你更希望把一坨不同的功能集合到一塊芯片上。當然在這個(gè)意義上,你還是得搞出一塊專(zhuān)用芯片。但是挑戰變大了,因為芯片本身需要更加專(zhuān)注于某一個(gè)特殊應用,而應用處理器、內部總線(xiàn)等等其他玩意兒,也要變得更小更強更快! 另一件吊詭的事就是,摩爾定律并沒(méi)有在晶體管層面帶來(lái)太多的功率改進(jìn)。在過(guò)去,當東西變小了,功率自然就降低了,所以工程師也壓根不需要操心什么芯片架構 (Architecture)。而現在,如果工程師想要優(yōu)化功耗,首先就要優(yōu)化架構。他得考慮我怎么著(zhù)才能更有效地完成這個(gè)計算?譬如用更少的晶體管門(mén)或者運算周期,甚至在這個(gè)任務(wù)不運行的時(shí)候關(guān)閉掉相應子系統?傊,這活兒變智能(Intelligent)了。 所以舉個(gè)例子啊,比如你想做個(gè)手機,就必須要注意區分不同的使用場(chǎng)景,譬如聽(tīng)音樂(lè )、看YouTube視頻、發(fā)短信、上網(wǎng),或者煲電話(huà),這些都是完全不同的情景。你得關(guān)掉所有沒(méi)用的子系統。更細心,更積極。因此對于芯片設計師(Chip Architect)或者系統設計師來(lái)說(shuō),這是最好的時(shí)代。因為有這么多的事兒可做。但對于一個(gè)晶體管工人(Transistor Guy)而言,這可真是最壞的時(shí)代!一切都已經(jīng)上升,已經(jīng)上升到系統或者應用的級別。這就是技術(shù)領(lǐng)域正在發(fā)生的大事件。 2、未來(lái)幾年市場(chǎng)方面的變化呢? Chris Rowen :說(shuō)到市場(chǎng)。我認為最大的趨勢是一切都已經(jīng)移動(dòng)起來(lái),因為人們的生活方式已經(jīng)徹底改變了。當你可以隨身攜帶那么多的設備,就會(huì )希望能夠持續地連接到互聯(lián)網(wǎng) 上。這種影響不僅表現在設備上,還表現在無(wú)線(xiàn)基礎設施,以及云計算上。而且經(jīng)濟層面的機會(huì ),將會(huì )隨之變得非常,非常深遠。因為你會(huì )看到,譬如在這種設備 (Chris拿起手里的iPhone開(kāi)始演示)的層面,無(wú)線(xiàn)連接的帶寬起碼還要提高30倍。為了獲得足夠豐富的娛樂(lè )體驗,我們或許需要幾十甚至幾百兆比特的帶寬。在世界每一個(gè)地區,高端用戶(hù)越來(lái)越多。中國就是一個(gè)鮮活的例子。不光如此。在印度、南美、非洲、加勒比海地區,人人都希望持續不斷地連接到互聯(lián)網(wǎng)。 所以,你必須很好地設定人們日益增長(cháng)的期望值,F在有10倍的寬帶人口增長(cháng)每個(gè)人都有30倍的寬帶需求,因此就有了 300倍的寬帶要求。而系統的每 個(gè)層面都需要滿(mǎn)足這種需求。對于無(wú)線(xiàn)基礎設施制造商來(lái)說(shuō),他們的機會(huì )是巨大的。譬如華為。但是制造商是沒(méi)可能贏(yíng)得300倍收入的。有可能獲得更多的收入, 但不是三百倍以上。因此,他們必須在得到大幅增加帶寬的同時(shí),大幅降低資金成本(Capital Cost)和經(jīng)營(yíng)成本(Operate Cost)。 3、那么接下來(lái)在SoC設計上會(huì )有什么事情發(fā)生? Chris Rowen :你可以看下無(wú)線(xiàn)基站作為例子。傳統意義而言,它們是昂貴的。你可以找些通用芯片、通用DSP、通用FPGA?墒墙裉,為了滿(mǎn)足對帶寬的要求,您需要更 多的高度定制的SoC,芯片平臺和軟件的需求也上升很快。所以這將使集成度更高,每塊芯片上集成更多的DSP,而每塊DSP上嵌入更多的軟件程序,甚至是 軟件內容的爆炸性發(fā)展。 有趣的是,每部分網(wǎng)絡(luò )基礎設施(Network Infrastructure)的功耗都是巨大的。那么即便為綠色節能考慮,減少為更加緊密集成的系統都是異常重要的;緦⒚黠@變小,這意味著(zhù)整個(gè)基站 都可變成塔頂的一個(gè)小盒子,而不是……裝在塔頂可是簡(jiǎn)單很多。 當然在系統層面,你一旦降低成本以后降低功耗也就水到渠成。所以這兩者之間是一個(gè)非常良性的關(guān)系。關(guān)鍵是硅晶圓的集成。這也是Tensilica會(huì ) 如此迅速成長(cháng)成為世界領(lǐng)先的DSP內核供應商之一的原因。 甚至可以看到這種變化體現到了云計算上。因為現在你需要300倍的帶寬,也就相應地對視頻服務(wù)、視頻壓縮、互聯(lián)網(wǎng)數據庫搜索、社會(huì )網(wǎng)絡(luò ),如此等等, 都提出了更高的需求。而所有這些事情,真的都是很復雜的應用程序呢。 不過(guò)有趣的是,他們都是些并行的應用程序。這是個(gè)好消息。因為在計算機業(yè)已經(jīng)發(fā)生的一件事情便是,單個(gè)微處理器的速度已經(jīng)很難再提高了。Intel在1990年,戲劇性地發(fā)現了單處理器性能呈指數增長(cháng)的改善。但是他們也旋即發(fā)現當處理器頻率達到約3.5到4GHz的時(shí)候,功率密度(Power Density)遇到了瓶頸。于是,他們開(kāi)始嘗試多核技術(shù)。 還好人民群眾想做的事,基本都是天然就可以并行處理的。所以,你在做互聯(lián)網(wǎng)數據庫檢索(Internet Database Search)的時(shí)候,確實(shí)可以設置多內核、多芯片,甚至多系統。因為你的查詢(xún)請求通常將被發(fā)往多個(gè)地點(diǎn)。所以在互聯(lián)網(wǎng)云計算的領(lǐng)域,運用多核的機會(huì )無(wú)比 廣闊。 而且確實(shí)存在是一個(gè)問(wèn)題,就是你如何在有效的MIPS指令內獲得足夠低的功耗;蛘哒f(shuō),如何在設計電池壽命最長(cháng)的移動(dòng)設備,和最可擴展的服務(wù)器之間 取得關(guān)聯(lián)?因為所有都和功耗有關(guān),而非峰值的性能。 4、那么Tensilica是如何來(lái)克服在功耗上的挑戰的?和競爭對手比起來(lái)又有何區別? Chris Rowen :舉個(gè)例子。Tensilica贊同為特定的任務(wù)去優(yōu)化處理器。優(yōu)化流水線(xiàn)(Pipeline),優(yōu)化接口,優(yōu)化設計層面,然后把多個(gè)內核放在一起,以建 立一個(gè)多核系統。這種優(yōu)化的能力將產(chǎn)生巨大的影響。我會(huì )在今天下午的會(huì )上談到這個(gè)稱(chēng)作Turbo解碼器的專(zhuān)用(Specialized)處理器。 Turbo是一種特殊的算法,可以從嘈雜的噪聲中提取有用信息,在一個(gè)工作循環(huán)(cycle)內,這個(gè)解碼器可以執行大約3萬(wàn)次,哦對的沒(méi)錯3萬(wàn)次 RISK指令。是的,通用的壓縮(Compression)處理器只能執行一次指令,而這個(gè)專(zhuān)用處理器可以執行3萬(wàn)次。當然這是一個(gè)極端的例子,只是想表 明當你知道你的問(wèn)題在哪里,你就可以做出很多令人難以置信的事情。并行,并因此難以置信的高效率。 同樣的原則可以適用于各個(gè)層面,適用于各種其他門(mén)類(lèi)的專(zhuān)用DSP、無(wú)線(xiàn)接收器,適用于基帶和音頻的通用DSP,也適用于客戶(hù)意欲進(jìn)行視頻處理或其他圖形壓縮、安全操作、網(wǎng)絡(luò )協(xié)議處理,以及廣泛應用于射頻的深嵌入式控制(Deeply Embedded Control)。 Tensilica特別集中精力于那些能夠專(zhuān)門(mén)優(yōu)化的能力,以及真正方便使用多核的能力。而因此,我們從那些傳統的CPU老家伙們中區別了出來(lái)。譬 如Intel、ARM、MIPS,或者其他什么人。他們都面臨一個(gè)相同的物理問(wèn)題,摩爾定律在給了他們更多的晶體管之后,卻沒(méi)有給他們更好的功率控制,對不對? 他們很少去考慮并行的問(wèn)題。而與之相反,我們在應用層面非常努力地工作,以期尋找到解決方案。在云計算那段,我們確實(shí)可以將任務(wù)分割成很多子任務(wù), 但是當我在這里玩游戲(Chris又一次拿起手里iPhone開(kāi)始演示),我真的被限制了。你看,一個(gè)手指只能玩一樣東西哈。因此在應用處理器的層面,你 真的無(wú)法得到啥好處。MIPS、ARM,甚至還有Intel,都面對著(zhù)這樣一個(gè)無(wú)法在當前硅科技下有效完成多任務(wù)的問(wèn)題。而那是我們擅長(cháng)的。 我們看到這個(gè)市場(chǎng)在迅速增長(cháng),去年的出貨量增長(cháng)了大約70%。然后我們會(huì )試圖進(jìn)入所有的DPP(Data-Plane Processor)領(lǐng)域,包括DSP、音頻視頻、安全,以及深嵌入式控制,這其實(shí)和應用處理器的范疇離得很遠。所以啊,我們常常會(huì )發(fā)現自己和MIPS、 ARM或Intel出現在同一塊芯片上。你知道吧,其實(shí)我們就是工廠(chǎng)的工人啊(Chris突然哈哈大笑)!因為有這么多不同的處理器,在Date- Plane里又有這么多不同的任務(wù),那些小而高效的處理器會(huì )有很多機會(huì ),很多接口(Socket)。 這種對于應用處理器或者接口的互補性,甚至于可以讓?xiě)锰幚砥髟趫绦蓄?lèi)似于信號處理這種實(shí)時(shí)任務(wù)的時(shí)候,也完全關(guān)閉;蛘弑热缍嗝襟w應用,應用處理 器當然可以去做,但是如果我們優(yōu)化專(zhuān)用音頻DSP的話(huà),將獲得4到5倍的效率。尺寸更小,單位時(shí)間內的吞吐量卻更大。而且可以用如此多的音視頻處理器夠你 選擇。所以幾乎任何時(shí)刻,系統設計師或者SoC設計師都可以通過(guò)區別應用場(chǎng)景的方式,來(lái)決定卸載(Off Load)哪個(gè)處理器。 這也是為什么我認為我們可以在音頻方面取得這么大的成功。當你正在設計一個(gè)手機,或者閱讀顯示器,或者機頂盒,或者數字電視,或者數碼相機,你會(huì ) 說(shuō),啊,這里有一種場(chǎng)景需要我做大量音頻的工作。于是,把那種卸載很自然地就被設計到到基本構架里去了。 而且,我們可以為應用層面的處理器自動(dòng)生成軟硬件,尤其是基于音頻和基帶的非常全面的軟件庫(Software Libraries)。因此,不管是老手還是菜鳥(niǎo),在我們的店鋪里都能找到他們所有需要的軟硬件解決方案,以幫助他們最快地進(jìn)入市場(chǎng)。集成音頻、集成基 帶,或者其他各種功能。 5、那么Tensilica有什么具體的應用嗎? Chris Rowen :今天下午,我將討論一下移動(dòng)電話(huà)。這是一個(gè)巨大的市場(chǎng),一個(gè)可以滿(mǎn)足之前所說(shuō)帶寬需求的市場(chǎng)。特別是從當前正從3G向4G升級,大家都聚焦在LTE身 上。不僅因為L(cháng)TE看上去很像是最后標準的勝者,也因為它非常像WiMax。我們已經(jīng)能夠提供參考設計,幫助客戶(hù)建立他們自己定義的多核LTE手機,在市 場(chǎng)中搶得先機。這只是一個(gè)我們進(jìn)入領(lǐng)域的實(shí)例。 我們也在做一個(gè)很類(lèi)似的數字電視解調器。因為有人希望既為移動(dòng)應用又為起居室設計一種通用的數字電視接收器。這里有個(gè)很大的問(wèn)題,就是全世界在視頻 領(lǐng)域有好多不同的標準和概念,而每個(gè)人都真心希望擁有一塊可以解決一切的視頻芯片。我們準備來(lái)設計一塊。其實(shí)應用一樣的原理,就是找些DSP和專(zhuān)用核,優(yōu) 化最密集的任務(wù),并充分利用我們最重要的能力——生成處理器的功率效率非常小,以及和世上最穩定的通用DSP一樣易于編程的軟件工具。昨天晚上客戶(hù)還和我 們說(shuō),DSP如此招人待見(jiàn)的最主要原因就是可編程。譬如TI的那些DSP。我們同樣在努力使編譯器更強大,使程序模型簡(jiǎn)單,使程序員更不操心。我們還微處 理器的流水線(xiàn)設計上增強了視覺(jué)效果。這種架構下要還能生成不正確的代碼,也怪難的。 因此,我們擁有一個(gè)非常高效的處理器。但是效率(Efficiency)這個(gè)詞值得商榷。傳統意義上而言,效率就是指最少的門(mén)數、最小的功耗,巴拉 巴拉。但效率也是將產(chǎn)品推向市場(chǎng)的時(shí)間。需要多少工程師才能部署好這個(gè)系統?每行代碼的成本是多少?每個(gè)工程師小時(shí)(Engineer Hour)所能帶來(lái)的收入?除了硅片層面的效率以外,這些同樣是測量效率的重要參數。我認為我們在這兩面都推動(dòng)得很好。剛才討論的那種架構,也特別適合在 大量出貨的領(lǐng)域。移動(dòng)設備、客廳設備、數碼相機,這些都是我們做得非常好的地方。這幾個(gè)領(lǐng)域四大廠(chǎng)商中的三位,十大廠(chǎng)商中的六個(gè)都是我們的客戶(hù)。 我們主要是在DPP方面擁有很強的知識積累,但同樣的影響也已經(jīng)開(kāi)始在云計算上面出現。當然,現在云計算的變化還比較慢,部分原因是它并非對功耗如 此敏感,但我認為整體上還是會(huì )有影響的。 6、您會(huì )在很多其他領(lǐng)域譬如數字電視和有線(xiàn)通信,使用這種結構? Chris Rowen :當然。那些可以為不同應用優(yōu)化處理器的架構是很重要的。而且我們也發(fā)現,即使在一個(gè)新的水平,很多需求也是 相似的。因此同樣的Hi-Fi工具,同樣的音頻DSP,即可部署在世界最好的智能手機上,也同樣可以部署在最好的數字電視、藍光(Blue Ray)影碟機上。因為它是非常小而快的。這方面的要求是相同的。 同樣,如果你看下Altas LTE的內部架構,其主要構造模塊BBE16或許是世界上最快的DSP核。而它同樣也在數字電視解調子系統中使用。同樣再一次因為它的快速、易編程,以及 節約功耗。所以,我們可以看到在手機和客廳之間,在這兩個(gè)媒體處理器和基帶處理器之間,都有著(zhù)共同的需求。 7、我看到您說(shuō),芯片的整合將集中在射頻、存儲和數字電路。那么您覺(jué)得它們三者還有可能合并成一個(gè)嗎? Chris Rowen :嗯。如果你從半導體工藝(Semiconductor Process)技術(shù)的角度來(lái)看,我認為在晶體管和器件優(yōu)化的層面將會(huì )有些事情發(fā)生。因此在某些情況下,你可以作出權衡。特別是,我們正與很多客戶(hù)一起工 作,以簡(jiǎn)化射頻電路。通過(guò)盡量多的數字處理器,你可以部分程度地脫離射頻和數字間的邊界。由于相比射頻而言,數字會(huì )有更加陡峭的生產(chǎn)成本曲線(xiàn)(Cost Production Curve),我們也就有更大的動(dòng)力去做。因此,我們會(huì )越來(lái)越依賴(lài)于數字方面的有效解決方案。 同樣的事情發(fā)生在存儲器。人們偶爾也會(huì )使它們結合在一起,但不是一個(gè)簡(jiǎn)單的組合,內存的加工設備(Fabrication Facility)與一般的優(yōu)化有所不同。所以我相信,多芯片封裝(Multi-Chip Packaging)將越來(lái)越重要。尤其當你將芯片組(Die)一塊又一塊摞起來(lái)的時(shí)候。所以,你可以在數字芯片組上面摞存儲芯片組,然后上面再摞射頻芯 片組。這有可能在成本上是最劃算的。然后也可能有一種折衷的工藝技術(shù),把它們所有三個(gè)都放在一塊硅片上。這取決于你的應用程序,比如需要一些存儲單元,又 或者需要一些射頻的單元。 但最終,我想我們還會(huì )堅持三套不同的加工工藝,然后依靠封裝技術(shù)來(lái)整合在一起。不過(guò)這并不意味著(zhù),只要你能想辦法把它們三個(gè)捏一塊兒,你就得到一個(gè) 系統(System)了。因為還有物理屬性的要求,比如要多加塊電池什么的。但總的來(lái)說(shuō)你要知道,物理尺寸是會(huì )越來(lái)越小了。 但你要知道還有個(gè)巨大的挑戰,就是人們的手指不能變小,眼睛也不能變小。所以所謂得到“小尺寸”的設備,我們還是有實(shí)際限制的。我們在元器件層面的小,其實(shí)是對應于我們自己可以接受 多小的屏幕和按鈕。所以說(shuō)到最后,這事兒還是更和成本相關(guān)。 8、在書(shū)里您還預測了FPGA 的未來(lái)。而幾天之前,Xilinx宣布嵌入ARM 的Cortex A9核。您覺(jué)得這是否是一種新趨勢?是否與Tensilica的 DPU形成競爭呢? Chris Rowen :其實(shí)……并沒(méi)啥。我的意思是這種往處理器里一股腦嵌入FPGA的活兒,大概已經(jīng)折騰了快10年了。Altera宣布他們與ARM互相嵌的時(shí)候,讓我想想啊,也是8年前了吧? (Larry:沒(méi)錯!) 所以,這就跟任何一個(gè)系統想要找塊芯片,或者三塊芯片一塊兒呆著(zhù),沒(méi)啥區別。當然,偶爾你也會(huì )碰巧搞出一塊啥都囊括了的數字芯片。話(huà)說(shuō)回 來(lái),FPGA兄弟們有一個(gè)根本性的挑戰,那就是FPGA的通用性非常高,可以做的事兒也賊多。但禍福相倚,要是讓它專(zhuān)注做一件事的話(huà),也就不是那么有效率 了。所以,如果你想真正有效地利用處理器,我估計你情愿在處理器里隨便嵌一個(gè)稍微穩定點(diǎn)的東西,而不是FPGA。 我認為這是非常自然的一步。Xlinx以前也搭過(guò)Power PC,對吧?這其實(shí)是一碼事。它壓根沒(méi)有改變任何原有的架構,也沒(méi)有在CPU和FPGA的功能之間取得任何邏輯上的合并(Merge)。部分是因為他們沒(méi) 有任何合并的工具軟件模式。 當然,FPGA是很容易配置的,而且價(jià)格也便宜。因此,他們占據了一部分的市場(chǎng),尤其是那些量低而開(kāi)發(fā)成本又低的。因此,我們在市面上看到大量的FPGA設計。但是基于FPGA的設計總量是很小的。它其實(shí)是一個(gè)利基(Niche)市場(chǎng)。極端地說(shuō),即便有很多工程師在使用它,但幾乎所有都是低產(chǎn)量 的。 所以我的意思是,FPGA很重要,但不是Tensilica公司關(guān)注的。我們專(zhuān)注于高產(chǎn)量,并且幫助那些試圖在設計上節約幾納米硅片的兄弟們。他們離得是遠了點(diǎn)兒。當然他們偶爾也會(huì )重疊。譬如基站。以前有很多基站是采用 Altera的儲存方 案的。挺重的。慢慢地我們看到越來(lái)越多因為容量、成本和功耗的要求,從FPGA轉向了更加高集成度的芯片解決方案。 9、我在IEEE的設計與測試(Design & Test)上看到一篇您的談話(huà)。您說(shuō),如果我們想要進(jìn)入嵌入式系統設計的大規模并行領(lǐng)域,可配置的多核處理器SoC就有一些問(wèn)題必須得到解決。幾年前,您 還提到過(guò),Intel最大的問(wèn)題是怎樣為通用計算應用配置多核處理器。您現在還覺(jué)得多核處理器遭遇困境嗎? Chris Rowen :這個(gè)……其實(shí)是分開(kāi)的兩碼事。對于多核應用層面而言,確實(shí)存在著(zhù)重大考驗。就是如何找到足夠多的線(xiàn)程 (Thread)來(lái)運行。但它不是Intel單獨遇到的問(wèn)題。這是一個(gè)涉及到應用程序是如何被調用,以及在當下如此小型的設備上如何架構的問(wèn)題。即便打開(kāi) 我自己的筆記本電腦,當我想看看到底有多少個(gè)線(xiàn)程準備在跑,它基本上都是很少的。通常情況下,操作系統、用戶(hù)界面和應用程序開(kāi)發(fā)等等所調用的方式,都完全 沒(méi)有最大化利用線(xiàn)程的數量。 所以,我認為你在基本的架構層面可以做的,就是提供更多的線(xiàn)程運行,并且充分地利用到并行。當然在應用層面也會(huì )有很多層級限制。你知道現在很方便就 去搞個(gè)四核八核十六核的,但是在PC這一端,相對于服務(wù)器,只有相對較少的條件可以讓我們找到這些線(xiàn)程。于是一大現象便是操作系統和應用程序的逐步重組 (Restructuring)。 另一個(gè)同樣重要的現象是,確定哪些任務(wù)可以被放進(jìn)數據層(Data Plane)。讓我們來(lái)想想哪些東西通常是可以被放進(jìn)數據處理器的,譬如在無(wú)線(xiàn)信道這類(lèi)的通訊子系統,譬如存儲系統,比如你怎么分發(fā)數據,或者你知道的, 安全冗余,也可能是針對壓縮流(Packing Stream)的特殊網(wǎng)絡(luò )處理器,它可以是視頻也可以是音頻。這些東西其實(shí)是更本質(zhì)(Inherently)的并行處理。 所以吧,我覺(jué)得這里有兩種并行重組。其一是所謂的,去各地兒找更多的線(xiàn)程應用。另一種是為了維持整體系統中卸載(Off Loading)并行部分的最大值,并讓之進(jìn)入數據層。實(shí)際上我認為,在數據層提取并行是更容易操作的。因此,在數據層有效使用多核的數量,遠大于單單在 應用層面使用的多核。這也就是為啥我們認為自己正走在康莊大道上。關(guān)注于數據層,可以使我們在多核方面的成長(cháng)速度大大超過(guò)那些只盯著(zhù)應用層面的兄弟。 10、所以在手機上就不是個(gè)問(wèn)題咯? Chris Rowen :恩可以這么說(shuō)。這變得相當容易,讓我們舉一個(gè)LTE基帶(Baseband)的例子吧。我們的Atlas平 臺可以弄出七或八核,取決于你想怎么用。DoCoMo和他的合作伙伴,NEC、富士通以及松下,已經(jīng)宣布并且詳細描述了他們LTE基帶架構。第一代是8到 10核。另一個(gè)叫做Blue Wonder Communication的合作伙伴也推出了他們的8至10核的LTE基帶。因此,現在就有三種不同的LTE基帶,而這三種都使用了約8個(gè)核。在這個(gè)層 面上是可以有大量的并行解決方案的。 再看看下一代的LTE,大概有六點(diǎn)性能方面的因素需要考慮。其中一些是單核怎樣可以更快,但更大部分和多核有關(guān)。所以我們很容易找到那些有效應用而 20核甚至更多核于單一功能譬如基帶的案例。和那些圍觀(guān)應用處理器的哥們比起來(lái),他們如果感覺(jué)好,就整兩個(gè)核玩玩;如果還很爽,那就再整四個(gè)。我覺(jué)得在數 據層和應用層上,多核是有完全不同的機會(huì )的。 11、最后一個(gè)問(wèn)題:您當年在斯坦福參與奠基了RISC 架構,后來(lái)也曾是MIPS的共同創(chuàng )始人。那么,請問(wèn)您如何看待RISC架構的未來(lái)?依舊是ARM和MIPS之間的戰爭,抑或會(huì )發(fā)生一些新的大事件? Chris Rowen :這個(gè)……在科學(xué)上,理想架構已經(jīng)完全改變了。這場(chǎng)關(guān)于CISC和RISC架構的爭論,其實(shí)就是通用(General Purpose)架構甲跟通用架構乙之間的競爭罷了。RISC贏(yíng)得了一職半銜,是因為在某個(gè)特定時(shí)期內它手下有好幾十項半導體技術(shù)。但在這場(chǎng)戰爭中,摩爾 定律一下給出了這么多的晶體管,以至于你隨便搞個(gè)簡(jiǎn)單的解碼或者流水線(xiàn),都能奢侈地愛(ài)用多少就用多少。沒(méi)人管。所以一個(gè)RISC解碼器可能要一萬(wàn)門(mén),而 CISC解碼器需要五萬(wàn)門(mén)。其實(shí)也差不多了多少。 不過(guò)我覺(jué)得除了通用架構之間互掐以外,還有一場(chǎng)更加深遠的革命。我們現在來(lái)比較通用架構和一大家子的特殊用途(Special Purpose)架構,怎么樣?幾乎任何時(shí)候你都可以說(shuō),如果一個(gè)產(chǎn)品是圍繞某種特定的需求來(lái)設計,那么特殊用途架構鐵定勝出。RISC扁了CISC一段時(shí)間,因為它的效率高出2倍以上。那么為具體應用特殊定制的架構,就比所有通用架構都高效5至10倍以上了。 因此,這個(gè)世界不能再簡(jiǎn)單分成我的通用架構,和你的通用架構。當然對于那些非常分散(Defused)并且普適(Generic)的應用程序,就好 比在筆記本上用的那些,我們還是需要通用架構的。因為一會(huì )兒你要看視頻,一會(huì )兒又要運行Word或打游戲,或者Excel工作表。這是非常多 樣的。所以你需要一個(gè)德智體全面發(fā)展的處理器。不能太特別。 但總之,你不得不面對一個(gè)世界,那里有各種各樣不同的任務(wù),而每樣任務(wù)都是獨特的。而且更為重要的是,當你因為摩爾定律而在芯片上集成的片上系統越 多,你越會(huì )發(fā)覺(jué)有足夠多的處理器適用于各種特定的應用子系統。 因此對于我來(lái)說(shuō),計算的未來(lái)不是產(chǎn)生新的通用架構,而是特殊用途架構的集合。譬如一個(gè)音頻子系統、視頻子系統,一個(gè)基帶子系統、存儲子系統,哦對, 還有應用處理器子系統。其中只有一個(gè)需要通用的結構(Construction),其他里面都將是特殊的架構。在科學(xué)上,摩爾定律帶來(lái)多核,多核又將帶來(lái) 特殊架構的解決方案。異型多核(Heterogenic Multi-Core)就是一種新架構。而且我覺(jué)得會(huì )成為主流。Intel、ARM、MIPS這些公司當然還會(huì )有很大的市場(chǎng),但只限于應用處理器領(lǐng)域。其實(shí)在科學(xué)上,通用目的(General Purpose)最終就會(huì )變成某一個(gè)特殊目的(Specific Purpose)。 |