ARM Cortex-A55: 從端到云實(shí)現高效能

發(fā)布時(shí)間:2017-6-16 10:43    發(fā)布者:eechina
ARM公司供稿

你是否已經(jīng)聽(tīng)說(shuō)了最近市場(chǎng)上發(fā)布了幾款新的 CPU?它們的性能非常強大!當然,我說(shuō)的就是 ARM Cortex-A75 和 Cortex-A55,即首批基于新近發(fā)布的 DynamIQ 技術(shù)的 Cortex-A 系列處理器。本文我們討論的就是 Cortex-A55:一款對為未來(lái)數字世界舉足輕重的處理器,原因如下。

出生名門(mén),久經(jīng)考驗


ARM Cortex-A75 和 Cortex-A55 是首批問(wèn)世的 DynamIQ 處理器。

想要理解 Cortex-A55 的真正潛力,我們來(lái)簡(jiǎn)要回顧一下其上一代產(chǎn)品:ARM Cortex-A53。采用這款 CPU 的設備已超過(guò) 15億臺,該 CPU 依然是當今業(yè)界出貨量最高的 64 位 Cortex-A 系列 CPU。Cortex-A53 于 2012 年發(fā)布,其獨一無(wú)二的設計,集性能、低功耗以及尺寸擴展性于一身,具備一系列多用途特性,因而可應用于諸多市場(chǎng),其中包括高端智能手機、網(wǎng)絡(luò )基礎設施、汽車(chē)信息娛樂(lè )、高級駕駛員輔助系統 (ADAS)、數字電視、入門(mén)級移動(dòng)設備和消費級設備乃至人造衛星。

然而自 2012 年以來(lái),我們周?chē)氖澜绨l(fā)生了許多變化。我們現在看到的新興趨勢表明,保持互聯(lián)、萬(wàn)物智能的數字世界具有非常大的發(fā)展潛力。從完全自主的自動(dòng)駕駛汽車(chē)到各類(lèi)設備上的智能應用程序,人工智能 (AI) 和機器學(xué)習 (ML) 將真正融入到我們的日常生活中,這一點(diǎn)已成定局。物聯(lián)網(wǎng) (IoT) 應用的盛行意味著(zhù)“物”的爆炸性增長(cháng),越來(lái)越多的“物”在持續生成數據、消費數據以及與數據進(jìn)行交互。增強現實(shí)、虛擬現實(shí)以及混合現實(shí) (AR、VR 以及 MR) 注定會(huì )徹底改變我們人類(lèi)之間以及人機之間的互動(dòng)方式,將現實(shí)世界與數字世界融于一體。

在過(guò)去兩年里,ARM 的工程師致力于研究 Cortex-A53 的后繼產(chǎn)品,以滿(mǎn)足這類(lèi)新興技術(shù)的需求,我們的目標是打造出一款性能、效能以及擴展性均大幅提升的 CPU,而且這款 CPU 還需要具備諸多先進(jìn)的特性,從而滿(mǎn)足從端到云的各種未來(lái)應用需求,幸運的是我們做到了。

性能全面提升


Cortex-A55 實(shí)現了全面的性能提升

Cortex-A55 采用最新的 ARMv8.2 架構,并在其前代產(chǎn)品的基礎上打造而成。它在性能方面突破了極限,同時(shí)依舊保持了與 Cortex-A53 相同的功耗水平。我們盡全力改進(jìn) Cortex-A53,并賦予其以下特性:
•    在相同的頻率與工藝條件下,內存性能最高可達 Cortex-A53 的兩倍
•    在相同的頻率與工藝條件下,效能比 Cortex-A53 高 15%
•    擴展性比 Cortex-A53 高十倍以上

這些歸功于我們專(zhuān)注于 Cortex-A53 現有的設計理念并挑戰這些理念。
•    我們對分支預測程序(branch predictor)進(jìn)行了全面修改,在其算法中融入了神經(jīng)網(wǎng)絡(luò )元素來(lái)改進(jìn)預測。此外還新增了零周期分支預測程序(Zero-cycle branch predictor)以便進(jìn)一步減少流水線(xiàn)中的泡沫。這樣可以使指令之間的空閑時(shí)間越來(lái)越短。

•    我們的設計是,使二級高速緩存對每一顆 CPU 而言都是專(zhuān)用緩存,這樣一來(lái)與 Cortex-A53 相比,二級高速緩存的存取時(shí)間縮短了 50% 以上。我們還將二級高速緩存的工作頻率設計成與 CPU 相同的頻率。通過(guò)降低延遲大幅提升 CPU 在各類(lèi)基準測試工具中的性能。

•    我們推出了三級高速緩存,可供集群內的所有 Cortex-A55 CPU 共享。這讓 DynamIQ 集群能夠得益于 CPU 附近增多的內存容量,從而提升性能、降低系統功率。三級高速緩存是 DynamIQ 共享單元 (DSU) 的一部分,DSU 是 DynamIQ 處理器中的一個(gè)新的功能單元。

•    8 位整數矩陣乘法對神經(jīng)網(wǎng)絡(luò )性能的影響超過(guò)85%。Cortex-A55 NEON 流水線(xiàn)中增添了新的架構指令,使其能夠在每個(gè)周期執行 16 次 8 位整數運算。這些新的指令還使該 CPU 能夠在每個(gè)周期執行 8 次 16 位浮點(diǎn)運算、對兩條 MAC 指令進(jìn)行舍入操作,有利于色彩空間轉換。

相較Cortex-A53,實(shí)現效能的大幅提升


在功率和熱效率方面繼續保持領(lǐng)先

對分支預測程序、NEON 和 FP 單元的上述改進(jìn)以及內存延遲的縮短僅僅是 Cortex-A55 取得大幅性能提升的部分原因。Cortex-A55 不但實(shí)現了大幅性能提升,而且保持了與 Cortex-A53 相類(lèi)似的功耗?偠灾,Cortex-A55 在節能性方面實(shí)現了 15% 的提升。相對于性能而言,功率在產(chǎn)品設計中更加重要。在提供同等性能的情況下,Cortex-A55 消耗的功率比 Cortex-A53 低 30% 之多!

Cortex-A55 提供持續性能的時(shí)間遠比當今的 Cortex-A53 解決方案更長(cháng)。這一點(diǎn)對于 AR、VR 以及 MR 等領(lǐng)域的用戶(hù)體驗而言至關(guān)重要,這些領(lǐng)域預計將會(huì )在未來(lái)移動(dòng)市場(chǎng)上占據主導地位。這些使用場(chǎng)合已經(jīng)高度線(xiàn)程化,對延遲有嚴格的要求。后者指的是移動(dòng)時(shí)間延遲,根據行業(yè)研究,這種延遲需要保持在 20 毫秒或以下,這樣才不會(huì )導致惡心和頭暈。雖然當今的 CPU 已經(jīng)實(shí)現了達到 20 毫秒延遲所需的性能水平,但是發(fā)熱限制意味著(zhù)這些 CPU 無(wú)法長(cháng)時(shí)間維持這樣的性能水平。有了 Cortex-A55,我們就能給出未來(lái) VR 設備中延長(cháng)持續性能時(shí)間的解決方案。


高級特性和更高的性能可滿(mǎn)足基礎設施市場(chǎng)的需求

行業(yè)領(lǐng)先的效率讓 Cortex-A55 在基礎設施市場(chǎng)卓爾不群。以太網(wǎng)供電 (PoE) 無(wú)線(xiàn)接入點(diǎn)以及安裝在后視鏡上的發(fā)熱受限的汽車(chē)解決方案等應用均可利用熱效率極高的 Cortex-A55 在特定的發(fā)熱范圍內提供最高性能。在 5G 遠程無(wú)線(xiàn)電頭端 (RRH),Cortex-A55 CPU 還能夠在特定功率范圍內最大限度增加網(wǎng)絡(luò )吞吐量。

從端擴展至云


合適的尺寸和計算性能可滿(mǎn)足各類(lèi)需求

除了性能與效率以外,Cortex-A55 的物理芯片尺寸以及計算性能也具有極高的擴展性。為此,它包含了多個(gè) RTL 配置選項,從而使可配置容量達到了 Cortex-A53 的十倍。事實(shí)上,它擁有 3,000 多種獨特的配置,因而成為了史上最具擴展性的 Cortex-A CPU。

Cortex-A55 延續了 Cortex-A53 的靈活性,具備 NEON、Crypto 以及 ECC (糾錯碼) 等選項,但是也采用了新的實(shí)用配置選項。例如,專(zhuān)用二級高速緩存的可配置容量從 64KB 到 256KB 不等,可帶來(lái) 10% 的性能提升。專(zhuān)用二級高速緩存能夠很好地提升性能,而且它無(wú)疑會(huì )成為諸多市場(chǎng)的默認之選,它還被設計成了可選項,以便在物聯(lián)網(wǎng)等對尺寸敏感的市場(chǎng)上進(jìn)一步減小芯片尺寸。


DynamIQ 共享單元 (DSU) 中新特性詳解

DSU 無(wú)論在 Cortex-A55 還是在 Cortex-A75 上都很常見(jiàn)。它包含更多的配置選項,可根據用戶(hù)自身的應用情況進(jìn)行定制。例如 CPU 之間共享的三級高速緩存可從 0KB 擴展至最大 4MB。它還通過(guò) AMBA 5 ACE 或 CHI 支持多用途接口選項,從而可用于更廣泛的系統。加速器相干性端口 (ACP) 和低延遲外圍端口 (PP) 也被集成到 DSU 當中,這讓緊密耦合的加速器能夠連接至 Cortex-A55 以便處理通用計算。這些特性加上 Cortex-A55 的機器學(xué)習功能,讓更多的計算能夠在更靠近物聯(lián)網(wǎng)網(wǎng)關(guān)應用“端”的地方執行。

囊括諸多先進(jìn)特性,可用于各類(lèi)新興應用


加速各個(gè)領(lǐng)域中的人工智能應用

人工智能會(huì )越來(lái)越普及,這已不是什么新鮮事。引申開(kāi)來(lái),我們的設備運行機器學(xué)習任務(wù)也會(huì )變得十分普遍。有多種方法可以在芯片上實(shí)現機器學(xué)習的處理,然而 CPU 在這方面擁有獨特的優(yōu)勢。CPU 可進(jìn)行通用計算,因此它可以運行到人工智能應用的芯片當中。目前機器學(xué)習和人工智能持續換代,固定功能的硬件不但價(jià)格昂貴,而且對機器學(xué)習而言容易過(guò)時(shí)。

對 Cortex-A55 NEON 流水線(xiàn)的改進(jìn)和新增的機器學(xué)習指令意味著(zhù) Cortex-A55 在矩陣乘法運算方面的機器學(xué)習性能比Cortex A53要高出很多。最近發(fā)布的 ARM 計算庫(ARM Compute Libraries)是專(zhuān)為 ARM Cortex-A NEON 和 Mali GPU IP 而優(yōu)化的入門(mén)級軟件函數集,它也可以應用于 Cortex-A55 NEON 并進(jìn)一步提升其機器學(xué)習性能!


Cortex-A55 可打造更安全的自主系統

Cortex-A55的可靠性、可用性和可服務(wù)性 (RAS) 特性也很高,這些特性使其能夠服務(wù)于基礎設施以及汽車(chē)等各個(gè)領(lǐng)域。對汽車(chē)市場(chǎng)而言,Cortex-A55 的安全性現已得到提升。它在每一級高速緩存上均提供可選的 ECC 和奇偶校驗特性,而且還支持“data poisoning”,這種方法可推遲已檢測到的、不可糾正的錯誤,適用于更有彈性的系統。它還是首款在避免系統故障方面采用全新設計流程的 Cortex-A 系列 CPU,因而在搭配 Cortex-R52 的情況下十分適合 ASIL D 應用。

深度嵌入高級電源管理特性


高級電源管理特性可提升節能性

Cortex-A55 具備諸多全新的電源特性,例如硬件控制狀態(tài)轉換能夠更快地從 ON 轉換至 OFF。Cortex-A55 還能夠根據當前運行的應用程序自主地關(guān)閉三級高速緩存。對于 VR 等需要更多內存的重載型應用程序,三級高速緩存會(huì )完全打開(kāi)。然而對于音樂(lè )播放等完全駐留在一級和二級高速緩存中的輕載型應用程序而言,三級高速緩存會(huì )被關(guān)閉。額外還有兩種功率模式用于重載和輕載之間的應用情形。

現在還可以創(chuàng )建單顆 CPU 或 CPU 群組,其中每一顆 CPU 都處于集群內各自獨立的電壓域中,因此能夠更精細地動(dòng)態(tài)提升電壓和頻率。這有兩大好處:首先,它讓設計師能夠進(jìn)一步調節系統,從而實(shí)現最佳的性能和節能性。其次,這還意味著(zhù) DynamIQ 系統能夠更輕松地緊密匹配設備多變的發(fā)熱限制,因此可以最大限度發(fā)揮性能。

big.LITTLE處理的新時(shí)代

big.LITTLE 技術(shù)自 2011 年問(wèn)世以來(lái)一直是異構處理的代名詞。因此當今市面上每三臺安卓 ARMv8 設備中就有兩臺依賴(lài) big.LITTLE 技術(shù)來(lái)實(shí)現功率和性能優(yōu)化。DynamIQ big.LITTLE 是 DynamIQ 系統的新一代異構計算技術(shù)。

它讓設計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案,大小 CPU 在物理上位于單一 CPU 集群中。所有的軟件線(xiàn)程遷移和由此造成的大小 CPU 之間的高速緩存窺探(cache snoop)現在均發(fā)生在該集群內。與 Cortex-A73 相比,Cortex-A75 CPU 可以用于頻率更高的使用場(chǎng)合,同時(shí)利用Cortex-A55 依舊保持持續的 DVFS 曲線(xiàn)。這是 big.LITTLE 系統的一項重要設計要求。這些特性合在一起,與上一代 big.LITTLE 技術(shù)相比,可大幅提升峰值性能、持續性能以及智能功能。


DynamIQ big.LITTLE 可帶來(lái)更豐富的用戶(hù)體驗

當今的中端移動(dòng)和消費級市場(chǎng)普遍采用基于 Cortex-A53 的 4 核和 8 核解決方案。然而,隨著(zhù)人工智能和虛擬現實(shí)等高級使用場(chǎng)合從高端市場(chǎng)滲透到中端市場(chǎng),廠(chǎng)商需要以更低的成本提供更高的性能和智能功能。DynamIQ big.LITTLE 通過(guò)推出新的異構 CPU 配置來(lái)滿(mǎn)足這一需求,例如 1 顆 Cortex-A75 + 3 顆 Cortex-A55 (1大+3小) 和 1 顆 Cortex-A75 + 7 顆 Cortex-A55 (1大+7小) 等等。這些新的配置以類(lèi)似的芯片尺寸可分別與 4 核和 8 核的 Cortex-A55 設計相比,可以實(shí)現 2 倍以上的單線(xiàn)程性能。

現已推出基礎設施和移動(dòng)片上系統 (SoC) 設計指南

ARM 長(cháng)期以來(lái)一直在范例 SoC 設計驗證我們的知識產(chǎn)權方面有著(zhù)大量投入。由于 ARM 的知識產(chǎn)權組合與日俱增,這些范例系統的復雜度和范圍也隨之增長(cháng)。從 SoC 架構到詳細的產(chǎn)前分析,這項工作涵蓋了方方面面。ARM 將以“系統指南”的形式提供這類(lèi)知識。

除了全新 CPU 以外,ARM 還提供各種新的系統指南,這些指南涵蓋了移動(dòng)系統和基礎設施系統:
•    針對移動(dòng)系統的 CoreLink SGM-775 系統指南專(zhuān)為 Cortex-A75、Cortex-A55 以及 Mali-G72 而設計和優(yōu)化
•    SGM-775 包括文檔、模型和軟件,而且可供 ARM 合作伙伴免費使用
如需詳細了解如何實(shí)施移動(dòng)和基礎設施系統,敬請訪(fǎng)問(wèn)我們的系統指南頁(yè)面。

基于 Cortex-A55 的設備預計什么時(shí)候上市?

Cortex-A55 的最終發(fā)布令人激動(dòng)不已。Cortex-A55 在性能、節能性以及擴展性等方面的長(cháng)足進(jìn)步將使其成為 ARM 的下一款出貨量最大的 Cortex-A 系列 CPU。然而,激動(dòng)人心之處不止于此。這一生態(tài)系統內的大量 ARM 合作伙伴現已獲得 Cortex-A55 的相關(guān)許可,我已經(jīng)等不及想要看一看他們在接下來(lái)的幾個(gè)月里將會(huì )發(fā)布哪些新一輪智能計算解決方案。雖然我們無(wú)法預測基于 Cortex-A55 的設備會(huì )以何種形式展現,但是可以確定的是,從2018年起未來(lái)將會(huì )無(wú)比激動(dòng)人心!

本文地址:http://selenalain.com/thread-452396-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页