雜談移動(dòng)平臺多核處理器

發(fā)布時(shí)間:2013-1-26 22:09    發(fā)布者:1770309616
關(guān)鍵詞: 移動(dòng)平臺 , 多核處理器
  近幾年,移動(dòng)平臺廠(chǎng)商爭先推出多核處理器,以順應市場(chǎng)日益提高的性能需求。
  由于移動(dòng)市場(chǎng)競爭異常激烈,多核處理器變成了營(yíng)銷(xiāo)工具,廠(chǎng)商利用這個(gè)最顯著(zhù)的差異化特性向消費者傳遞一個(gè)過(guò)于簡(jiǎn)化的信息:處理器核數越多,平臺就越好,性能就越高,事實(shí)卻復雜得多,在多核處理器平臺內,處理器數量對總體性能只產(chǎn)生一定的影響,不同的底層硅技術(shù)將會(huì )對性能產(chǎn)生完全不同的影響,多個(gè)關(guān)聯(lián)因素決定了多核處理平臺能效(例如,平臺對軟件性能的有效影響、芯片頻率、芯片大小和功耗)。
  本文論述并比較目前移動(dòng)平臺所采用的主要的多核處理技術(shù),重點(diǎn)介紹多核處理技術(shù)與意法·愛(ài)立信未來(lái)產(chǎn)品所采用的具有突破性的FD-SOI硅技術(shù)之間的協(xié)同效應,通過(guò)對比個(gè)人計算機市場(chǎng),例證移動(dòng)平臺的單核處理器還有很大的性能提升空間,從軟件性能角度分析,目前集中資源于速度更快的雙核處理器比速度較慢的四核處理器更贏(yíng)利。
  此外,我們還將論述 FD-SOI技術(shù)如何在相同功耗條件下提高雙核處理器頻率,以及如何擴展高能效工作模式,所有這些優(yōu)勢產(chǎn)生一個(gè)比異構和同構四核處理器更簡(jiǎn)單、更便宜、更高效的解決方案。
  多核處理器的問(wèn)世是必然,而不是可以選擇!
  多核處理器是技術(shù)發(fā)展的必然,而不是人類(lèi)可選的,在此重申這一點(diǎn)很重要。從歷史看,當工作頻率提高到芯片散熱極限時(shí),主流PC機多核處理器開(kāi)始問(wèn)世。事實(shí)上,自硅技術(shù)集成初期到2003-2005年間,在主流計算機中,工作頻率提高和晶體管數量主要用于提升單核處理器的性能(見(jiàn)圖1)。在此期間,應用軟件的性能提升與硬件技術(shù)發(fā)展保持同步,日益增多的舊版軟件無(wú)需做任何修改,導致計算機行業(yè)出現空前的增長(cháng)。
  只要可能,這個(gè)趨勢就不會(huì )發(fā)生改變,直到芯片散熱達到極限為止。頻率提高而非晶體管數量增加是芯片達到散熱極限的部分原因。在這一問(wèn)題上,多核處理器被認為是連續利用數量不斷增加的晶體管同時(shí)把功耗限制在可控范圍內的唯一解決辦法。雖然有悖常理,但是,單核處理器在假定頻率時(shí)的功耗高于雙核處理器在假定頻率的二分之一時(shí)的功耗,這是因為處理器頻率越高,所需的電壓就越高,此外,動(dòng)態(tài)功耗與電壓是平方關(guān)系(圖2所示是簡(jiǎn)單的動(dòng)態(tài)功耗計算式)。
圖 2: 雙核處理器與單核處理器動(dòng)態(tài)功耗對比
  多核處理器確實(shí)使硬件集成度遵循摩爾定律(晶體管數量每18個(gè)月增加一倍),為此而付出的代價(jià)是軟件性能提升被完全破壞。對于軟件,再也沒(méi)有免費的午餐,正如Herb Sutter 2005年發(fā)表的一篇著(zhù)名論文[1]所述,從那時(shí)開(kāi)始,為了繼續高效地應用硬件技術(shù)進(jìn)步,軟件開(kāi)發(fā)人員必須采用并行且均衡的編程方式,使代碼能夠高效地映射到多核處理器,換句話(huà)說(shuō),軟件需要并行化,糟糕地是,軟件并行化在整個(gè)計算機領(lǐng)域仍然是最嚴峻的挑戰之一,雖然最初的研發(fā)熱情還沒(méi)有減退,但是,到目前還沒(méi)有發(fā)現一個(gè)效率令人滿(mǎn)意的通用解決方案[2]。很多本身是串行的應用軟件則根本沒(méi)有并行化解決方案。
  這個(gè)問(wèn)題難度非常大,在過(guò)去10年來(lái)進(jìn)展很小。G. Blake et al在2010年的論文[3]中提出兩個(gè)重要看法:
  在雙核處理器問(wèn)世時(shí),用戶(hù)感受到的響應速度快是雙核處理器的最直接的優(yōu)點(diǎn),但是,
  10年后,大多數軟件,包括要求嚴格的游戲、辦公軟件、多媒體播放器和網(wǎng)絡(luò )瀏覽器,還是僅能充分利用雙核處理器,只有很少的應用軟件(視頻制作)能夠更高效地利用雙核處理器。
  事實(shí)上,自多核處理器在10年前問(wèn)世至今,除很少的應用軟件外,大多數PC軟件還沒(méi)有實(shí)現并行化。因為多任務(wù)操作系統和某些應用軟件的設計方法的原因,例如,用于處理用戶(hù)界面等異步事件的事件驅動(dòng)型代碼,某些并行處理功能是原生的,但是,這些原生并行線(xiàn)程的均衡性通常很差,通常相互關(guān)聯(lián),只有少數線(xiàn)程可并行使用現有多核處理器,然而最終只能發(fā)揮雙核以下處理器的能力。
  軟件開(kāi)發(fā)人員選擇不將其代碼并行化,因為大多數PC機應用軟件根本沒(méi)有必要并行化,或者并行化成本過(guò)高。某些小眾市場(chǎng)是例外,例如,某些多媒體應用軟件、CAD工具和某些專(zhuān)業(yè)領(lǐng)域,軟件性能是這些市場(chǎng)最關(guān)注的差異化特性。人們預計多核處理器將在視頻游戲中找到用武之地,如上文所述,實(shí)際上卻不是這樣,其中一個(gè)原因是,最近幾年,圖形處理器 (GPU)的發(fā)展速度比多核CPU還要快,因此,在充分利用圖形處理器上投入資源的回報率更高,而將復雜的游戲引擎并行化,使其能夠在多核CPU上運行,是一件費力不討好的工作。
  在其它領(lǐng)域,多核處理器的情況不盡相同。例如,在網(wǎng)絡(luò )數據中心,因為并行工作負荷量大,多核處理器發(fā)展順利。在科學(xué)計算領(lǐng)域,軟件并行化有其合理性。
  移動(dòng)業(yè)和PC業(yè)一樣嗎?
  智能手機性能演進(jìn)實(shí)質(zhì)上是一個(gè)加速的且時(shí)空轉換版的臺式計算機性能演進(jìn)過(guò)程。蘋(píng)果iPhone的演進(jìn)過(guò)程是一個(gè)很好的實(shí)例,我們很容易在一定時(shí)期內找到一致的數據,且蘋(píng)果iPhone也能代表大多數手機平臺。
  圖3所示是Dhrystone MIPS (DMIPS) CPU性能測試成績(jì),其中數據是ARM分析其處理器所用數據。同樣地,我們應將測試成績(jì)轉換成圖1中的英特爾CPU性能測試所用的指令級并行測試(ILP),即在不考慮處理器的頻率時(shí)測試CPU架構的效率。IDMIPS-single表示單核處理器的相對性能,測試成績(jì)是通過(guò)DMIPS/MHz乘以頻率而得來(lái),而DMIPS-dual是 DMIPS-single乘以2,表示蘋(píng)果從iPhone 4S開(kāi)始的雙核處理器的最高總體性能。對于軟件性能分析,我們只是引用了Anandtech[4]的iPhone 5產(chǎn)品評測中的基準測試成績(jì): Sunspider 和 Browsermark 是網(wǎng)絡(luò )瀏覽器 (Javascript) 基準測試工具,因為是單線(xiàn)程,所以無(wú)法測試多核處理器;Geekbench是一個(gè)多線(xiàn)程基準測試工具,應該能夠體現多核處理器的性能優(yōu)勢。
  我們在圖3中注意到兩個(gè)要素:
圖 3: iPhone CPU和軟件相對性能演進(jìn)(來(lái)源: Wikipedia, Anandtech)
  1.    CPU 架構效率 (DMIPS/MHz) 、頻率和最終的單核性能 (DMIPS-single) 并沒(méi)有飽和,相反,還有很大的提升空間,這種趨勢完全不同于PC機單核處理器的演進(jìn)路線(xiàn),后者顯然從2003年開(kāi)始達到飽和。因此,我們得到的初步結論是,移動(dòng)應用單核處理器不同于PC處理器,到目前其性能還沒(méi)有達到飽和狀態(tài)。
  2.    我們預想軟件性能與單核處理器性能成正比例關(guān)系。實(shí)際上,從iPhone 4S 到 iPhone 5,Sunspider和 Browsermark的測試成績(jì)增幅很大。這兩款手機都是雙核處理器,而且這兩種基準測試都是單線(xiàn)程,因此,軟件性能提升與多核處理器無(wú)關(guān)。測試成績(jì)提升的原因是網(wǎng)絡(luò )瀏覽器的軟件性能大幅提升,特別是Javascript的優(yōu)化起到重要作用,另外,其它硬件也很可能被優(yōu)化,例如,改進(jìn)存儲器子系統。相反, Geekbench是一個(gè)多核線(xiàn)程基準測試工具,系統軟件變化對其影響不大。iPhone 5的Geekbench測試成績(jì)大幅提升,這似乎表明多核處理器至少發(fā)揮了一定作用,但是,令人奇怪地是,從單核 iPhone 4到雙核iPhone 4S,我們并沒(méi)有看到同樣的成績(jì)提升。在任何情況下,所有的基準測試,包括Geekbench,都保持在雙核處理器的理論性能峰值以下。我們稍后將提供更多的軟件性能提升數據,但是,分析這些基準測試工具的測試成績(jì),我們至少可以得到以下初步結論:像PC機一樣, 軟件性能提升與單核處理器性能成正比,同時(shí)還與應用軟件有關(guān);而與多核處理器性能的關(guān)系不大,或根本不成比例關(guān)系。
  移動(dòng)平臺并沒(méi)有出現我們看到的臺式機CPU演進(jìn)過(guò)程中的飽和狀態(tài),這是因為智能手機市場(chǎng)剛剛開(kāi)始高速增長(cháng),是平臺廠(chǎng)商進(jìn)一步優(yōu)化處理器架構和硅技術(shù)起主要動(dòng)因,而競爭不激烈的傳統嵌入式系統市場(chǎng)卻沒(méi)有這種動(dòng)因。顯然,PC機更成熟的超級優(yōu)化的架構和硅技術(shù)與智能手機平臺剛起步的架構與技術(shù)之間存在很大的差異:
  PC單核處理器在2003年達到散熱極限時(shí),此后性能再也沒(méi)有增長(cháng)的空間;而移動(dòng)平臺則不同,智能手機時(shí)代始于2007年,移動(dòng)單核處理器還擁有巨大的性能提升空間,到今天為止,還沒(méi)有跡象顯示移動(dòng)平臺性能飽和。
  人們不禁要問(wèn):為什么移動(dòng)平臺不同于PC處理器,在單核性能達到飽和前就轉向多核處理器?我們認為有兩個(gè)原因,第一個(gè)原因是,移動(dòng)計算產(chǎn)品沿用數十年前的技術(shù)知識,特別是人們普遍知道,現代的操作系統能夠更高效地利用雙核處理器,高速緩存一致性和多任務(wù)處理操作系統等基本技術(shù)已經(jīng)到位。因為能夠充分利用雙核處理器,就沒(méi)有必要再等。而且,這個(gè)過(guò)程進(jìn)展得非?;第二個(gè)原因是進(jìn)攻性的營(yíng)銷(xiāo)策略。
  像大多數商用平臺一樣,CPU在進(jìn)入四核時(shí)代后的發(fā)展方向目前尚不清楚,PC業(yè)的經(jīng)驗告訴我們,即使多核處理器存在于市場(chǎng)10年后,使用雙核以上的處理器對于大多數軟件是沒(méi)有實(shí)用意義,唯一的技術(shù)解釋是移動(dòng)應用軟件比PC軟件更易于多核處理,但是,我們在短時(shí)間內不會(huì )看到這種情況發(fā)生。
  事實(shí)上,有說(shuō)服力的技術(shù)原因根本就不存在。動(dòng)機似乎都與市場(chǎng)營(yíng)銷(xiāo)有關(guān),因為智能手機市場(chǎng)競爭激烈,多核處理器是一個(gè)很有進(jìn)攻性的武器。目前,廠(chǎng)商利用處理器內核數量使自己的產(chǎn)品保持差異化,甚至消費者也這樣做。具有諷刺意義的是,技術(shù)上沒(méi)有任何新發(fā)明,市場(chǎng)營(yíng)銷(xiāo)上沒(méi)有新意,相同的廣告詞早在PC多核問(wèn)世時(shí)就被廣泛使用。像PC機一樣,人們很快就會(huì )意識到,移動(dòng)設備內的CPU內核數量與產(chǎn)品帶給客戶(hù)的真正價(jià)值沒(méi)有直接關(guān)聯(lián)。
  網(wǎng)絡(luò )瀏覽器是最重要的手機應用軟件之一,也是手機高性能CPU的最大受益者,同時(shí)還是要求嚴格的PC級應用軟件的一個(gè)實(shí)例,瀏覽器的性能非常重要,因為它直接影響用戶(hù)視覺(jué)互動(dòng)性。隨著(zhù)網(wǎng)絡(luò )帶寬不斷增加,今天的處理速度已處于臨界線(xiàn),將來(lái)HTML5  rich API和不斷增加的編程內容(javascript)對處理速度要求更高。網(wǎng)絡(luò )瀏覽器還是高效使用今天的雙核處理器的一個(gè)很好的實(shí)例,因為操作系統支持功能、軟件工程、人機互動(dòng)(防止UI死屏)、安全性和穩健性(不同處理過(guò)程中的多個(gè)標簽)的原因,瀏覽器引入了并行活動(dòng)。但是,因為缺少充足的均衡的軟件并行技術(shù),瀏覽器無(wú)法滿(mǎn)足雙核以上數理器的運行需求,測試結果顯示,處理器從雙核進(jìn)化到四核,瀏覽器性能提升很小或根本沒(méi)有提升。
圖4: 網(wǎng)絡(luò )瀏覽與多核處理器
  圖4所示是在同一四核處理器硬件/軟件平臺上運行的兩款主流瀏覽器的測試成績(jì),通過(guò)軟件設置(熱插撥)可以選擇不同的處理器數量,因此,測量結果完全是同一硬件/軟件環(huán)境的真實(shí)數據。在所有的配置中,工作頻率完全相同。相對分數是指在多次重復測量中若干個(gè)主流網(wǎng)站上的網(wǎng)頁(yè)加載時(shí)間的平均值,因此,這個(gè)用例代表了真實(shí)的網(wǎng)站瀏覽體驗,而不是人為的基準測試。當從單核切換到雙核時(shí),速度提升30%是一個(gè)較好的成績(jì),符合預期。然而,從雙核切換到四核時(shí),處理速度只取得0-11%的提升。在雙核處理器上進(jìn)行相似的測試,從單核切換到雙核時(shí),處理速度提升高達50%。
  另一方面,如前文分析PC處理器時(shí)提到的,不論處理器有多少個(gè)內核,頻率提高總是有益于提升軟件性能。當對多核處理器方案進(jìn)行比較時(shí),這一點(diǎn)很重要,因為處理器內核增加會(huì )對頻率產(chǎn)生負面影響;ミB線(xiàn)和存儲器等共享資源沖突,高速緩存、一致性電路的擴展受限,這些因素都會(huì )限制多核處理器的頻率提升。為提升多核處理器的總體頻率,需要使用軟件多核處理方法補償多核處理器降低的頻率。例如,我們在以前的折衷分析 [5]中提到,四核處理器的頻率比雙核處理器降低約27%,軟件必須有70%的代碼實(shí)現并行化,才能使四核處理器的性能優(yōu)于雙核處理器,這是一個(gè)很大的比例,幾乎沒(méi)有應用軟件能夠達到這個(gè)水平,當然不是通過(guò)原生并行,因為取得如此高的平行化,需要特殊的專(zhuān)門(mén)的并行化工作。
圖 5: 速度較快的雙核處理器與速度較慢的四核處理器性能比較
  前文提到軟件并行化程度很低,所以速度較快的雙核處理器可輕松戰勝速度較慢的四核處理器,這種現象在網(wǎng)絡(luò )瀏覽器中特別明顯,如圖5所示,為了與1.4GHz的雙核處理器比較,我們人為的將四核處理器的配置降至1.2GHz,從圖中可以看出,即便兩者頻率相差很小,低于20%,速度較快的雙核處理器始終優(yōu)于速度較慢的四核處理器。
  我們對手機的其它重要應用軟件進(jìn)行了類(lèi)似的測試,例如,視頻游戲、程序啟動(dòng)時(shí)間和多媒體功能,每次都取得相似的結果:在頻率相同的條件下,CPU從雙核進(jìn)化到四核,性能提升很小或根本沒(méi)有提升;當速度相差15-20%時(shí),速度較快的雙核總能擊敗速度較慢的四核。
  從正面看,智能手機搭載四核處理器應當會(huì )刺激軟件開(kāi)發(fā)人員更有效地利用四核處理器,希望比PC業(yè)在最近10年做得更成功。智能手機的可用資源比PC機的可用資源更敏感,即使移動(dòng)處理器無(wú)限接近PC處理器,兩者之間還有很大差距。在軟件方面,在移動(dòng)移動(dòng)平臺上運行PC級的應用軟件還有很大的壓力,綜合以上,再加上更低的功耗限制和更激烈的市場(chǎng)競爭環(huán)境,這些應該給軟件開(kāi)發(fā)人員足夠的動(dòng)機,投入更多的資源提高多核處理器的利用率。
  多媒體是一個(gè)令人關(guān)注的領(lǐng)域,這個(gè)領(lǐng)域通常對處理性能要求嚴格,多媒體軟件自然適合并行化。擴增實(shí)境、計算攝影學(xué)、手勢識別等令人興奮的新應用領(lǐng)域都將應用并行處理技術(shù),因為這些功能的穩定性不適合硬件加速。在這些應用領(lǐng)域,多核處理器也有競爭技術(shù),通用圖形處理器(GPGPU)同樣是可編程多核處理器解決方案,不同的是,GPGPU將代碼映射到GPU而不是CPU。目前,GPGPU的編程難度比多核CPU更大,但是GPU硬件發(fā)展速度很快,編程模型和工具也取得很大進(jìn)展,因此,目前發(fā)展趨勢還不明朗。
  異構多核處理技術(shù)
  移動(dòng)異構多核處理器的設計原理是,使用高性能但功耗高的處理器執行要求嚴格的應用任務(wù),使用速度慢但高能效的處理器運行要求不高的任務(wù)。目前市場(chǎng)上已經(jīng)有異構四核處理器平臺,例如,NVIDIA的 Tegra 3采用的Variable SMP [6]技術(shù),采用 ARM big.LITTLE[7]解決方案的異構多核處理器預計不久就會(huì )上市。
  這個(gè)想法當然很好,但是成功還需要一些時(shí)間;像比較雙核與四核處理器一樣,簡(jiǎn)單的解決方案只要可行,總是被優(yōu)先選用,特別是涉及復雜的軟件修改時(shí),簡(jiǎn)單的解決方案總是勝出。我們稍后將分析如何利用 FD-SOI 硅技術(shù)以更簡(jiǎn)單、更有效的方式達到同樣的效果。
  異構多核處理器使軟硬件都變得十分復雜,圖6所示是ARM big.LITTLE硬件解決方案。
圖 6: ARM big.LITTLE (source: [7])
  硬件變復雜的主要原因是,處理器高速緩存只有保持一致性,才能用于智能手機操作系統假設的共享存儲器系統,為此,AMR在互聯(lián)線(xiàn)上引入了ARM ACE接口技術(shù),但這卻提高了硬件復雜程度,導致緩存一致性流量增加。
  在軟件方面,如果把架構的全部潛力都發(fā)揮出來(lái),系統異質(zhì)管理對于操作系統可能是一件非常復雜的任務(wù)。理論上,操作系統應該有足夠高的智能,能夠區別要求條件不同的應用任務(wù),將其分配給大處理器或小處理器執行。為限制在昂貴的集群器間移植軟件,這些決策應該相對穩定。同時(shí),應用軟件可能會(huì )突然改變行為,系統必須能夠迅速做出響應,這需要提高動(dòng)態(tài)電壓和頻率,而且在兩個(gè)集群器上單獨進(jìn)行,增加要考慮的功率狀態(tài)的數量。不僅今天的操作系統無(wú)法提供發(fā)揮多核處理器的全部潛能所需的先進(jìn)復雜技術(shù),而且錯誤的決策在實(shí)際應用中可能會(huì )適得其反,大量的軟件移植會(huì )引起用戶(hù)可見(jiàn)的系統故障,錯誤決策引起性能降低或浪費電能。完美地支持異構多核處理器需要多年的研發(fā)活動(dòng)和優(yōu)調技術(shù)。
  為了限制系統做出錯誤決策的風(fēng)險,研發(fā)人員開(kāi)發(fā)出了中間解決方案,但是,該解決辦法需要以降低多核處理器潛能利用率為代價(jià)。例如,某個(gè)解決方案通過(guò)專(zhuān)屬方式使用大小 集群器,即不是并行處理,而是根據系統總體負荷從一個(gè)集群器切換至另一個(gè)集群器,以避免智能映射每個(gè)獨立軟件線(xiàn)程變得更加復雜,這種方法的缺點(diǎn)是沒(méi)有并行使用集群器,所以沒(méi)有發(fā)揮多核處理器的全部潛能。
  另一個(gè)最新的方法是把大小處理器整合成一對固定的處理器,操作系統負責管理每個(gè)大小處理器,將其視為一個(gè)電壓/頻率工作點(diǎn)擴展的單一抽象處理器,這種方法的缺點(diǎn)是在集群器之間頻繁移植軟件具有一定的風(fēng)險,抽象處理器的工作模式配對不是原生的,因為在硬件上,工作點(diǎn)是由集群器實(shí)現的,而非大小處理器對。
  總之,異構多核處理器當然是一項前景不錯的技術(shù),特別是在移動(dòng)市場(chǎng)。然而,因為技術(shù)復雜,特別是在軟件方面,這項技術(shù)需要經(jīng)過(guò)多年的研發(fā)和優(yōu)調才會(huì )發(fā)揮出全部的潛能。
  硅制造工藝的新進(jìn)展: FD-SOI
  近些年,為確保硅制造技術(shù)節點(diǎn)進(jìn)一步降低,突破傳統技術(shù)即將達到的極限,半導體企業(yè)進(jìn)行了大量新技術(shù)研發(fā),取得了很多具有突破性的開(kāi)發(fā)成果,例如, FinFET 和 FD-SOI制造工藝。意法·愛(ài)立信將意法半導體的FD-SOI (全耗盡型絕緣體上硅)技術(shù)用于其性能非常優(yōu)異的下一代28nm移動(dòng)平臺。在這里,我們只從計算性能的角度簡(jiǎn)要分析FD-SOI的技術(shù)優(yōu)勢,說(shuō)明此項技術(shù)如何能夠進(jìn)一步提升單核處理器的性能,讓我們繼續專(zhuān)注速度更快的雙核處理器,以獲得更高的軟件性能。
  如圖7所示,由于插入超溥埋氧層襯底,FD-SOI使晶體管電特性得到大幅提升,同時(shí)繼續使用非常成熟的平面工藝制造芯片。
圖 7: 體效應晶體管與 FD-SOI晶體管比較
  下面概括FD-SOI的優(yōu)點(diǎn):
  速度更快:在相同的技術(shù)節點(diǎn),FD-SOI晶體管的溝道比體效應晶體管的溝道短,而且前者是全耗盡型溝道,無(wú)摻雜劑。在這兩個(gè)因素共同作用下,FD-SOI晶體管在相同電壓時(shí)開(kāi)關(guān)速度更快,在功耗相同條件下,高壓工作頻率提高35%,低壓工作頻率提高100%。
  功耗更低:有多個(gè)因素促使功耗降低:全耗盡溝道消除了漏極引起的寄生效應,在低功耗模式,可更好地限制載流子從源極流向漏極;更厚的柵電介質(zhì)層可降低柵極泄漏電流;更好地控制體偏壓技術(shù) (為更好地控制速度和功耗而向晶體管體施加的電壓)。結果,在高性能時(shí),功耗降低 35%;在低性能時(shí),功耗降幅更大,高達50% 。
  工藝更簡(jiǎn)單:FD-SOI制造工藝與28nm體效應技術(shù)(bulk)的相近程度達到 90%,總工序減少15%,研發(fā)周期更短。此外,FD-SOI技術(shù)無(wú)需壓力源或其它類(lèi)似的復雜技術(shù),而其它工藝可能需要這些技術(shù)。最終工藝的復雜度低于體效應技術(shù),遠遠低于FinFET技術(shù)。
圖 8: FD-SOI: 速度更快,功耗更低
  從微處理器設計角度看, 相對于體效應技術(shù),FD-SOI的優(yōu)勢十分明顯(見(jiàn)圖8):
  電壓/功耗相同時(shí),FD-SOI可取得更高的頻率,或者在頻率相同時(shí),FD-SOI的功耗更低;
  可取得的最高頻率更高;
(后續見(jiàn)下面)
本文地址:http://selenalain.com/thread-109734-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
1770309616 發(fā)表于 2013-1-26 22:15:33
  采用FD-SOI技術(shù)的處理器能夠以更低的電壓維持非常不錯的頻率 (比如,1GHz,0.65V),在低功耗模式時(shí), FD-SOI的對比優(yōu)勢更加突出,如圖8的低壓區所示,在低功耗模式,FD-SOI的頻率比bulk技術(shù)高100%。
  在高頻率時(shí),能效提高幅度大約35%。在大量的用例中,這個(gè)成績(jì)足以讓FD-SOI雙核處理器戰勝速度較慢的bulk四核處理器,如前文所述,這是因為目前軟件性能提升受限。
  在低功耗方面,FD-SOI技術(shù)的影響更大,無(wú)需采用更復雜且還不成熟的異構多核處理器降低功耗的方式。
  上文論述的擴展的工作模式是以前提到的FD-SOI的技術(shù)優(yōu)勢共同實(shí)現的,其中體偏壓(body biasing)扮演重要作用。體偏壓是在晶體管體上施加特定電壓,根據每個(gè)特定工作模式優(yōu)調晶體管特性。FD-SOI技術(shù)無(wú)需體效應晶體管的管體與源漏極之間的寄生二極管,所以,FD-SOI準許施加電壓范圍更寬的偏壓。
圖 9: FD-SOI 提高體偏壓效果
  實(shí)際上,我們似乎用兩個(gè)不同的處理器設計取得了相同的效果(見(jiàn)圖9)。其中一個(gè)是為高性能優(yōu)化的,另一個(gè)則是為低功耗優(yōu)化的,但是我們只使用一個(gè)電路,通過(guò)改變體偏壓,利用電壓控制高性能和低功耗模式的轉換。意法·愛(ài)立信將這個(gè)概念稱(chēng)為 “eQuad” (eQuad: e = electrical),最終特性相當于甚至高于前文提及的異構四核處理器。
圖 10: eQuad與 big.LITTLE對比
  圖10比較了我們的首款 FD-SOI產(chǎn)品 NovaThor™ L8580與采用big.LITTLE配置的四核處理器;前者內置一顆基于兩個(gè)ARM Cortex-A9處理器的 eQuad處理器,后者的工作頻率在最近新推出的四核處理器中具有代表性。因為電壓/頻率范圍被擴展,不論是在高頻工作還是低功耗時(shí),NovaThor? L8580在相同的功耗下總能提供更高的性能,這歸功于Cortex-A9處理器。與Cortex A15/A7相比,Cortex-A9是ARM的上一代處理器架構。除更高的性能和更低的功耗外,NovaThor?L8580還有一個(gè)重要優(yōu)勢:采用簡(jiǎn)單的傳統的雙核處理器結構,且處理器管理軟件的技術(shù)也非常成熟,而big.LITTLE產(chǎn)品則需要前文討論的異構多核處理器所需的復雜的軟硬件管理方法。
  意法·愛(ài)立信計算技術(shù)開(kāi)發(fā)藍圖
  意法·愛(ài)立信計算產(chǎn)品戰略與開(kāi)發(fā)藍圖 (圖11) 反映了目前可以例證的觀(guān)點(diǎn):采取能夠讓當代手機軟件充分發(fā)揮處理器全部潛能的方式,充分利用隨著(zhù)硅技術(shù)演進(jìn)而不斷提高的處理器性能,這意味著(zhù)速度較快的雙核處理器是最佳選擇。
圖 11: 意法·愛(ài)立信計算產(chǎn)品開(kāi)發(fā)藍圖簡(jiǎn)圖
  值得一提的是,設計頻率更高的雙核處理器,同時(shí)遵守移動(dòng)功耗限制標準,比復制缺乏主動(dòng)性的設計,開(kāi)發(fā)頻率較低的四核處理器,需要投入更大的研發(fā)資源。我們始終堅持這個(gè)發(fā)展方向的原因是,目前軟件性能直接受益于更高的頻率,而無(wú)需對軟件代碼做任何修改,要想發(fā)揮雙核以上的處理器的全部潛能,需要在軟件上投入巨大的研發(fā)資源。
  考慮到將來(lái),我們正在研究各種不同的可行方案,其中包括四核處理器以及此后的技術(shù)演進(jìn)。像PC處理器一樣,移動(dòng)處理器的頻率提升遲早受到功耗限制。我們的下一代產(chǎn)品還將受益于FD-SOI取得的硅技術(shù)突破,但是,將來(lái)頻率開(kāi)始無(wú)限接近PC處理器的情況,不可避免地達到飽和狀態(tài),轉向四核處理器是繼續提升性能的唯一途徑。希望軟件在此之前有長(cháng)遠的發(fā)展,以便更有進(jìn)攻性的四核處理器的全部潛能被全部發(fā)揮出來(lái)。
  結論
  本文重點(diǎn)介紹了PC機處理器與智能手機處理器在產(chǎn)品演進(jìn)路線(xiàn)上的主要不同之處:2005年,PC機處理器頻率引起的功耗達到飽和后,PC多核處理器上市,這是必然結果;而智能手機的多核處理器卻遠在頻率飽和前就提前問(wèn)世。
  手機提前進(jìn)入雙核時(shí)代要歸功于PC業(yè)。雙核技術(shù)已經(jīng)成熟,可隨時(shí)實(shí)現和應用。雙核處理器之所以卓有成效,是因為:在操作系統和應用軟件內,存在原生、但有限的并行代碼。然而,從雙核演進(jìn)到四核主要是智能手機市場(chǎng)的進(jìn)攻性營(yíng)銷(xiāo)策略導致。從技術(shù)層面講,不存在令人信服的動(dòng)因,軟件還不能有效地利用雙核以上的處理器。事實(shí)上,不論是10年來(lái)的PC業(yè),還是最近的智能手機業(yè),還沒(méi)有充足的動(dòng)力推動(dòng)大多數開(kāi)發(fā)人員從事成本昂貴且費事的軟件并行化項目。由于雙核以后的處理器需要軟件并行化,這導致現有的四核處理器無(wú)法發(fā)揮全部潛能。
  為進(jìn)一步擴大移動(dòng)平臺的性能和低功耗工作范圍,各大廠(chǎng)商最近推出了異構多核處理器,提出了在同一個(gè)系統使用不同類(lèi)型的處理器的概念。當然,這項技術(shù)對智能手機很有吸引力,但是需要更復雜的硬件,要求操作系統提供更先進(jìn)的控制功能。初步方案已經(jīng)問(wèn)世,但是支持資源有限。全面利用這項技術(shù)還需進(jìn)一步的研究和優(yōu)調。
  盡管是首批推出雙核處理器的廠(chǎng)商[8][9],但是意法·愛(ài)立信決定暫不加入四核陣營(yíng),而是選擇以提高雙核工作頻率為首要任務(wù),因為這才是讓今天的軟件立即發(fā)揮處理器的全部性能的有效方式。
  此外,最近推出的 FD-SOI硅技術(shù)讓我們能夠進(jìn)一步提高雙核處理器的性能,超越采用體效應技術(shù)的處理器的性能極限。FD-SOI不僅在相同功耗條件下大幅提升頻率,還大幅擴展了低功耗工作模式,至少目前無(wú)需采用更加復雜且能效更低的異構多核處理器。FD-SOI有多項技術(shù)優(yōu)點(diǎn):可以施加范圍更寬的體偏壓,從低功耗向高性能動(dòng)態(tài)調節晶體管特性。意法·愛(ài)立信將這套擴展的工作模式的應用稱(chēng)為“eQuad”,因為這個(gè)雙核處理器相當于異構四核處理器,通過(guò)給晶體管施加偏置電壓,可實(shí)現低功耗或高性能優(yōu)化。
  即使采用FD-SOI技術(shù),工作頻率最終也還是會(huì )飽和,這將迫使我們進(jìn)入四核及后四核時(shí)代。在此之前,我們將繼續利用FD-SOI技術(shù)提高性能,降低功耗,同時(shí)希望軟件有長(cháng)足進(jìn)展,能夠提高多核處理器的利用率。
  參考文獻
  [1]    Herb Sutter,“The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software”, Dr. Dobb‘s Journal, 30(3), March 2005.
  [2]    Krste Asanovic, Ras Bodik, Bryan Christopher Catanzaro, Joseph James Gebis, Parry Husbands, Kurt Keutzer, David A. Patterson, William Lester Plishker, John Shalf, Samuel Webb Williams and Katherine A. Yelick, “The Landscape of Parallel Computing Research: A View from Berkeley”, EECS Department, University of California, Berkeley, Technical Report No. UCB/EECS-2006-183, December 18, 2006.
  [3]    Geoffrey Blake, Ronald G. Dreslinski, Trevor Mudge (University of Michigan), Krisztián Flautner (ARM), “Evolution of Thread-Level Parallelism in Desktop Applications”, ISCA’10, June 19-23, 2010, Saint-Malo, France.
  [4]    Anandtech The iPhone 5 Review - Six Generations of iPhones: Performance Compared (http://www.anandtech.com/show/6330/the-iphone-5-review/9)
  [5]    Marco Cornero, “Quad cores in mobile platforms: is the time right?”, EETimes Europe October 2011 (also available here: http://www.power-eetimes.com/en/quad-cores-in-mobile-platforms-is-the-time-right.html?cmp_id=71&news_id=222903513&vID=35)
  [6]    “Variable SMP (4 -PLUS PLUS -1?) – A MultiA Multi -Core CPU Architecture for Low Power and High Performance”, white paper, NVIDIA (http://www.nvidia.com/object/white-papers.html)
  [7]    Peter Greenhalgh, “Big.LITTLE Processing with ARM Cortex?-A15 & Cortex-A7, Improving Energy Efficiency in High-Performance Mobile Platforms”, white paper, ARM September 2011 (http://www.arm.com/products/processors/technologies/biglittleprocessing.php)
  [8]    Press release: “ST-ERICSSON COLLABORATES WITH ARM TO DEMONSTRATE THE WORLD‘S FIRST SYMMETRIC MULTI PROCESSING MOBILE PLATFORM TECHNOLOGY ON SYMBIAN OS”, February 16, 2009 (http://www.stericsson.com/press_releases/SMP_ARM_Symbian.jsp)
  [9]    Marco Cornero, “Enabling Symmetric Multi-processing for Symbian Mobile Devices”, Symbian Exchange and Exposition 2009 conference, London, 27-28 October 2009 (http://www.scribd.com/doc/22063340/Device-Creation-Marco-Cornero-ST-Ericsson)

來(lái)源:集微網(wǎng)
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页