作者:上方文Q 蘋(píng)果表面上是一家手機廠(chǎng)商,但這幾年已經(jīng)悄然在移動(dòng)處理器行業(yè)占據了一定的地位,尤其是CPU:A6首次使用自主設計架構Swift,A7首次使用64位ARMv8架構Cyclone。A8又能帶來(lái)什么驚喜呢? 很可惜,如果你期待又一次革命,那恐怕要失望了。無(wú)論CPU還是GPU,A8都只是一次穩健的進(jìn)步,并不算很激進(jìn)。 ![]() A8 ![]() A8內核照片與基本布局 【新工藝、內存】 A8最大的亮點(diǎn)其實(shí)是制造工藝,并且創(chuàng )造了多個(gè)第一: 它是第一批采用20nm工藝制造的移動(dòng)處理器之一,也是最重要的一個(gè)。 這是蘋(píng)果第一次使用最先進(jìn)的半導體工藝(28nm誕生了一年多采用上)。 這是蘋(píng)果第一次使用非三星工廠(chǎng)代工,當然也是第一次使用臺積電代工,而且一下子就搶走了絕大部分產(chǎn)能。 臺積電宣稱(chēng),20nm工藝相比于28nm可使芯片速度提升30%,或者集成度提高90%,或者功耗降低25%,具體如何權衡就看芯片設計了。A8晶體管數量翻了一番,核心面積小了13%,性能……稍后再說(shuō)。 ![]() A8的內存子系統基本沒(méi)變,只有一些細微的調整。SRAM緩存依然存在,繼續同時(shí)為CPU、GPU服務(wù)(可視為三級緩存),容量還是4MB,而內存控制器還是支持LPDDR3-1600。 經(jīng)過(guò)測試發(fā)現,A8的內存帶寬比A7略有增加,2-9%的樣子,很小,說(shuō)明來(lái)自進(jìn)一步優(yōu)化。 ![]() 更有趣的是內存延遲,1-4MB SRAM緩存區域、6+MB內存區域都降低了大約20ns,但具體如何實(shí)現的仍有待考察。 ![]() 除了CPU、GPU、緩存、內存,A8里還有其他大量的固頂功能模塊(或者最多時(shí)彈性很有限的DSP),包括音頻控制器、USB控制器、視頻編解碼器、閃存控制器、攝像頭ISP等等。具體在芯片的哪個(gè)位置、特性如何還不清楚,但至少知道,A8支持H.265格式視頻編碼,不過(guò)目前只會(huì )用于FaceTime視頻通話(huà)。 ![]() ![]() A8、A7對比 ![]() 蘋(píng)果自主處理器歷史 【CPU架構:沒(méi)有革命 仍然驚喜】 兩年多過(guò)去了,我們對A6、A7 CPU架構仍然知之甚少,蘋(píng)果始終不肯公布任何技術(shù)細節。A8仍是如此,這一次甚至連架構代號都還不知道(以前兩代分別是Swift、Cyclone)。 就目前所知,A8 CPU架構設計并沒(méi)有像A6、A7上那樣有著(zhù)革命性的地方,也就是個(gè)增強版的Cyclone,但也并不算是壞事。A7架構已經(jīng)十分優(yōu)秀:較寬、較高的IPC設計,延遲很低,可以在很低的頻率下取得很高的性能。(Intel酷睿的理念也與此類(lèi)似) A7的頻率只有1.3GHz,A8也不過(guò)區區1.4GHz,但正因為如此,蘋(píng)果無(wú)需在頻率上投入太多,就能獲得理想的性能,同時(shí)保證功耗足夠低,這對移動(dòng)設備來(lái)說(shuō)顯然是再理想不過(guò)的。 換句話(huà)說(shuō),蘋(píng)果在去年就完成了其他芯片廠(chǎng)商明年才有可能做到的。 ![]() 盡管不用再費力挖掘架構細節,但我們仍然想知道,A8究竟改變了什么。 根據估量,A8 CPU部分面積約12.2平方毫米,相比于A(yíng)7 17.1平方毫米縮小了29%,也就是說(shuō)在塞入了更多晶體管后,蘋(píng)果憑借更新的工藝,反而減小了CPU所占面積。 從測試數據看,A8、A7 CPU的確是如出一轍,很多底層測試中都表現得就像同一顆芯片,只是浮點(diǎn)加法和整數乘法延遲更短了一些,緩沖和分支預測也可能略有不同。 A7只有1個(gè)整數乘法單元,需要4個(gè)周期執行,A8則只需3個(gè)周期,更神奇的是整數乘法性能翻了一番還多,這意味著(zhù)現在有2個(gè)整數乘法單元了。 浮點(diǎn)加法也有很大提升,不過(guò)幅度沒(méi)這么高,執行周期從5個(gè)縮短到4個(gè),貌似仍是3個(gè)浮點(diǎn)ALU單元。 總體而言,A8、A7的變化有點(diǎn)像是Intel Tick-Tock的后一步,即升級工藝,架構上只是微調增強。 ![]() 接下來(lái)看一些更接近表層的測試。這里使用多年前用于PC系統的SPEC CPU2000,如今移動(dòng)處理器的檔次拿來(lái)跑它正合適。 ![]() A8的頻率高了100MHz,也就是大約7.7%,排除這一因素后,A8的性能仍然明顯高于A(yíng)7,12個(gè)子項全部有提升,尤其是MCF、GCC、PerlMmk、GAP的幅度都很高,最高達55%。 再來(lái)看Geekbench 3,包括整數、浮點(diǎn)兩部分。 ![]() 仍然普遍有提升,幅度也不錯,最高達到了37%,但是加解密差點(diǎn),排除頻率因素后偶爾甚至還有所倒退。 ![]() 浮點(diǎn)部分更好些,各項提升相對比較均勻。 總體而言,A8 CPU沒(méi)有再次革命,但憑借架構優(yōu)化、內存延遲改進(jìn)、頻率提升,仍然有了不小的進(jìn)步,完成了“A7升級版”的基本任務(wù)。 明年,大批的64位ARM處理器將陸續登場(chǎng),既有公版的A57,也會(huì )有非公版的自主設計,蘋(píng)果將面臨嚴峻的挑戰,但相信A8仍然能有自己的立足之地。 雖然四核、六核、八核將大行其道,蘋(píng)果依然只是個(gè)雙核,但是已經(jīng)可以看出,蘋(píng)果的單線(xiàn)程IPC一直十分優(yōu)秀,而現在很多工作任務(wù)仍然無(wú)法很好地支持多核,A8根本不用怕。 當然了,下一代A9能再次帶來(lái)什么驚喜更值得期待。 ![]() 【GPU架構:六核?沒(méi)必要】 庫克宣稱(chēng)A8 GPU性能提升最多50%,這很自然讓我們以為是從四核變成了六核,會(huì )用上Imagination最頂級的PowerVR GX6650。 但是經(jīng)過(guò)對芯片的觀(guān)察,卻只發(fā)現了四個(gè)GPU核心,排除了六核的可能性。 ![]() 再結合其他信息,尤其是蘋(píng)果的Metal編程指導,最終確認A8采用的是四核PowerVR GX6450,也就是A7 G6430的升級版,基于最新的PowerVR Series6XT架構,年初的CES大會(huì )上才宣布。 ![]() Series6XT是此前2012年誕生的Series6架構的增強版(G6430就屬于后者),重點(diǎn)是通過(guò)架構上的各種調整和優(yōu)化,提升性能、增加功能,比如支持下一代紋理壓縮技術(shù)ASTC(自適應可擴展紋理壓縮)。 該技術(shù)來(lái)自出品了OpenGL、OpenGL ES等標準規范的行業(yè)組織Khronos,可提供更好的紋理壓縮性能、更精細的質(zhì)量控制,同時(shí)也是所有GPU都可以支持的通用格式。 蘋(píng)果一直都在用PowerVR GPU,一直支持PVRTC、PVRTC2,ATSC則可以進(jìn)一步提升游戲畫(huà)質(zhì)和性能。 Series6XT架構還有新的電源管理技術(shù),能降低待機、輕負載時(shí)的功耗,比如說(shuō)“PowerGearing G6XT”門(mén)控技術(shù)可以單獨開(kāi)關(guān)每個(gè)GPU核心(著(zhù)色器簇/USC),自然能夠延長(cháng)手機的待機時(shí)間。 Series6XT通過(guò)一系列底層優(yōu)化,提升了總體性能,官方宣稱(chēng)最多可達50%,正好也是蘋(píng)果宣傳的數據,但具體怎么做的,Imagination并未公開(kāi)。 我們只知道,新架構對核心(著(zhù)色器簇)本身做了改進(jìn),仍然是16寬度的SIMD結構,但每條流水線(xiàn)都增加了一組中等/半精度FP16 ALU,也就是從2×3變成了2×4,理論上性能可提升33%。 FP16操作比FP32節省帶寬和功耗,但是需要精心編程才能高效利用,否則性能提升會(huì )很有限。 FP32部分仍然是每條流水線(xiàn)兩個(gè)ALU,每時(shí)鐘周期最多四個(gè)FP32浮點(diǎn)操作,或者說(shuō)128個(gè)MAD(乘加運算)。 ![]() 前端和后端的幾何處理、紋理填充同樣有所改進(jìn),但還是細節不詳。 最后是GPU計算性能。iOS仍然沒(méi)有提供這方面的良好支持,OpenCL也沒(méi)有相應的版本。iOS 8增加了Metal API,可以同時(shí)用于圖形、計算,但效果如何還有待觀(guān)察。 GPU頻率完全不知道,也不太容易測試。 ![]() 總體而言,GX6450可以在部分優(yōu)化、支持到位的項目中獲得50%的性能提升,有的則可能只會(huì )看到15-20%,一般來(lái)說(shuō)也就是30-35%的樣子吧。 ![]() 為什么還是四核? 其實(shí),Imagination已經(jīng)有了更強大的六核心型號G6630、GX6650,完全可以更好地滿(mǎn)足更大屏幕的iPhone 6、iPhone 6 Plus,而且有了新工藝的支持,晶體管、核心面積都可以更好地控制,為什么還是堅持四核心呢? 這再次體現了蘋(píng)果的設計原則:絕不盲目追新,夠用就好。 A8 CPU上只是一次進(jìn)化,GPU也不必急著(zhù)革命,尤其是G6430本來(lái)就已經(jīng)很強大了,iPad Air 2048×1536的屏幕都不在話(huà)下,iPhone 6 Plus 1080p又算什么,GX6450本身的改進(jìn)加上頻率提升(如果有的話(huà))確實(shí)正好。 A7 GPU部分的面積是22.1平方毫米,A8縮小到了19.1平方毫米?雌饋(lái)很理想,但別忘了20nm理論上可以讓它縮小11.1平方毫米的。這說(shuō)明A8 GPU還是增強了很多的,尤其是那兩塊清晰可見(jiàn)的共享紋理單元,將對紋理性能產(chǎn)生至關(guān)重要的影響。 說(shuō)到最后,對明年的A9更期待了:16nm工藝、CPU新架構、六核心GPU…… ![]() |