一種基于多核處理器DM8168的視頻處理方法

發(fā)布時(shí)間:2015-11-12 15:29    發(fā)布者:designapp
關(guān)鍵詞: TI , DSP , DM8168
  摘要:隨著(zhù)1080P高清視頻以及4K超高清晰視頻的普及和應用,基于傳統單核DSP處理器的視頻信息處理已有些力不從心。為此TI公司推出了一款專(zhuān)門(mén)用于高清視頻處理的多核DSP處理器,它擁有4個(gè)不同類(lèi)型的處理器,使得視頻處理達到了一個(gè)更高水平。本文分析研究了該處理器的多核DSP結構及應用開(kāi)發(fā)方法,并對多核間的協(xié)調工作及負載情況進(jìn)行了測試分析。
  引言
  以DSP為核心的處理器憑借自身硬件結構的優(yōu)勢和算法優(yōu)化使得一般的嵌入式產(chǎn)品在視頻應用領(lǐng)域得到了廣泛的應用。隨著(zhù)高清視頻應用的增多,傳統單核DSP處理器已經(jīng)不能很好地滿(mǎn)足應用需求了。為此,TI公司推出了一款專(zhuān)門(mén)針對高清大數據量快速計算的專(zhuān)用多核DSP處理器DM8168。與傳統單核DSP或ARM+DSP的異構多核結構相比,DM8168集成了4個(gè)不同類(lèi)型的處理器,除了傳統ARM+DSP結構外,DM8168還擁有兩個(gè)專(zhuān)門(mén)針對高清視頻的圖像處理器。因此,研究如何基于這種復雜的多核DSP進(jìn)行應用設計,是有一定實(shí)用價(jià)值的。
  本文在一款基于多核DSP DM8168處理器的SEED-DVS8168平臺上,研究了16通道D1數據格式60 fps的大數據量高速視頻采集及壓縮的實(shí)現方法,并且對DM8168實(shí)現過(guò)程中4個(gè)核心處理器的負載進(jìn)行了測試和分析。
  1 硬件平臺結構
  TMS320DM816是TI公司推出的達芬奇(DaVinci)硬件平臺。它在DM8168開(kāi)發(fā)板上拓展了16路模擬輸入口,集成了多種外設接口。DM8168硬件平臺為T(mén)I的高性能異構多核SoC片上系統,該平臺集成了一個(gè)主頻為1.2 GHz的ARM Cortex—A8處理器,一個(gè)主頻為1GHz的C674x DSP以及3個(gè)主頻為600 MHz高清視頻圖像協(xié)處理器(High Definition Video/Imaging Coprocessor,HDVICP),以及一個(gè)高清視頻處理子系統(Hight Defi nition Video Processing Subsystem,HDVPSS)。多核DSP系統應用中,各處理器在硬件上相互獨立、相互配合,極大地提升了整個(gè)系統的效率。本文針對DM8168集成的4片TVP8158對16路60 fps視頻的采集壓縮過(guò)程進(jìn)行了研究,并對結果進(jìn)行了分析。硬件平臺結構如圖1所示。
  


  1.1 ARM Cortex—A8處理器
  ARM Cortex—A8是一款專(zhuān)門(mén)針對多任務(wù)應用的高性能哈佛結構處理器。本文中ARM Cortex—A8處理器主要用于控制管理各個(gè)從處理器,配置和調節各子系統的協(xié)同工作,管理外部設備及外部存儲器。
  1.2 高清視頻處理子系統HDVPSS
  HDVPSS集成了兩個(gè)獨立的視頻捕捉輸入端口VIN0、VIN1,每個(gè)VIN口又分為A、B兩組,即VINOA、VINOB、VIN1A、VIN1B。每個(gè)TVP5158復合了4路視頻送入VIN口,HDVPSS采集到數據之后利用內部硬件把視頻抽離分解出來(lái)進(jìn)行后期處理,捕捉時(shí)鐘高達165MHz。此外,HDVPSS每個(gè)視頻輸入端口支持縮放、像素格式轉換、支持1路高達1080P60或8路復用的D1數據處理。功能上,HDVPSS集成了兩個(gè)視頻處理引擎,具有去隔行處理、降噪、格式轉換、視頻輸入/輸出等數據處理能力。
  1.3 高清視頻協(xié)處理器HDVOCP
  HDVICP是一個(gè)視頻編解碼硬件加速器,可以最大支持1080P60標準高清視頻的編解碼流。硬件加速可支持MPEG1/2/4 ASP/SP、H.264 BL/MP/HP、VC-1 SP/MP/AP、RV9/10、AVS-1.0等主流的編解標準。HDVICP集成了運動(dòng)估計加速引擎、幀內預測估計引擎、熵編/解碼器等硬件模塊。HDVICP直接在硬件上提升了原本復雜的數字圖像處理運算,從而增強了HDVICP的視頻處理能力。HDVICP的內部結構如圖2所示。
  


  在外部,HDVICP與其他處理器之間通過(guò)郵箱中斷以及硬件自旋鎖來(lái)實(shí)現。郵箱中斷通過(guò)寫(xiě)寄存器的方式向某個(gè)從處理器發(fā)送中斷信號,自旋鎖機制則為訪(fǎng)問(wèn)系統共享資源提供了完善的解決方案;內部,同步箱負責所有嵌入式模塊的調度,同步各加速器之間的參數以及數據。
  1.4 數字信號處理DSP
  C674x DSP內核是TMS320C6000 DSP平臺上的高性能浮點(diǎn)數字信號處理器,其除了具有傳統DSP的硬件運算加速器單元外,還具有SPLOO P、壓縮的指令集、增強的指令集、異常處理以及優(yōu)先級管理,完備的硬件支持使得C674x DSP在應用中具有強大地數據信號處理能力。本系統研究中將傳統的視頻采集及壓縮編碼這類(lèi)算法從DSP模塊中分離出來(lái),極大地減輕了DSP的負載,使多核DSP協(xié)同工作的環(huán)境、性能得到了極大的優(yōu)化。
  2 系統軟件設計
  DM8168的主處理器是ARM Cortex—A8,開(kāi)始上電之后U-Boot引導其從ROM中啟動(dòng)Linux,一旦啟動(dòng)成功,ARM Cortex—A8便引導從處理器C674x DSP和媒體控制器的電源管理、重啟控制以及設置可執行文件的入口到相應寄存器中,完成這個(gè)軟件運行環(huán)境的建立。
  結合DM8168硬件平臺的特點(diǎn),軟件系統整體劃分為4個(gè)模塊。其中ARM為主控模塊,運行Linux系統,主要負責整個(gè)系統的控制以及外設管理;另外3個(gè)內核運行BIOS6系統,其中VPSS M3運行在HDVPSS上,主要管理視頻的采集、存儲以及輸入/輸出;Video M3運行在HDVICP上,主要負責視頻的編解碼;C674x DSP主要執行軟件的顯示策略以及用戶(hù)算法。軟件結構設計如圖3所示。
  


  多通道視頻處理框架(Multi—channel FrameWork,McFw)中對視頻處理常用的捕獲、壓縮編碼、解碼、顯示等處理過(guò)程進(jìn)行了優(yōu)化,該框架下的視頻處理以L(fǎng)ink為基本處理單位進(jìn)行。視頻傳遞采集、編碼以及顯示過(guò)程大致分為以下幾個(gè)過(guò)程。
  (1)原始采集過(guò)程
  系統獲得采集任務(wù)之后,首先初始化采集參數,包括采集設備的檢測、需采集的視頻格式、輸出格式等。稍后調用McFW框架下的System _linkCreate()創(chuàng )建CaptureLink,調用System_linkStart()進(jìn)行視頻采集,模擬信號經(jīng)過(guò)主板上集成的4片TV5158解碼芯片之后轉換為16ChD1 YUV422i 60fps的數字信號傳遞給VPSS協(xié)處理器,等待下一步處理。
                               
                                                               
                               
                  (2)視頻處理
  VPSS協(xié)處理器檢測到視頻輸入以后,對輸入的視頻進(jìn)行降噪、去隔行處理等,然后將數據傳遞給HDVICP協(xié)處理器,DM8168內部集成的3個(gè)HDVICP協(xié)處理器的視頻編解碼硬件加速支持MPEG4 H.264等視頻的編解碼格式,運行在HDVICP上的視頻編碼子系統(Video Encode Subsyst em,VENC)以及視頻解碼子系統(Video Decode Subsystem,VDEC)具體實(shí)現16 Ch D1 60 fps的H.264編碼壓縮/解碼處理。
  (3)視頻的存儲、顯示以及傳輸
  HDVICP協(xié)處理器壓縮產(chǎn)生的視頻數據,放入內存共享區,供ARM處理器進(jìn)行后期的網(wǎng)絡(luò )傳輸或本地存儲。同時(shí),也將數據傳遞給HDVPSS協(xié)處理器實(shí)現16 Ch視頻的顯示輸出。
  (4)視頻采集的銷(xiāo)毀
  視頻采集結束后,HDVPSS首先調用System_link Stop()停止視頻采集,然后調用System_linkDelete()釋放占用資源。視頻采集編碼過(guò)程如圖4所示。
  


  視頻的采集、降噪、壓縮編碼/解碼、顯示都由Host A8進(jìn)行控制,每個(gè)視頻采集過(guò)程中的功能都在各自處理上進(jìn)行了模塊的劃分,以獨立的線(xiàn)程運行。各模塊間通過(guò)消息中斷、IPC等方式進(jìn)行通信,通過(guò)共享內存實(shí)現數據共享。
  3 結果測試與分析
  本研究方法中,模擬視頻信號經(jīng)過(guò)主板上集成的4片TVP5158解碼芯片轉換為16Ch D1 YUV422i 60fps數字信號傳遞給HDVPSS協(xié)處理器進(jìn)行降噪、隔行掃描處理,數據預處理之后HDVPSS將數據傳送給HDVICP協(xié)處理器進(jìn)行視頻的H.264壓縮存儲,同時(shí)數據也由HDVPSS協(xié)處理器的HDMI數據輸出接口輸出到顯示器。多核CPU負載情況統計如表1所列。
  


  實(shí)驗結果中,Host A8作為主控處理器,負責多核DSP的任務(wù)調度和協(xié)調,HDVPSS以及HDVICP協(xié)處理器承擔了16 D1視頻的采集以及壓縮編碼工作,處理器負載較均衡。由于協(xié)處理器獨立承擔視頻的處理任務(wù),DSP在本設計中只負責SCD算法,負載較小。整體上來(lái)看,由于多核DSP DM8168的各個(gè)核心處理器之間相互協(xié)同工作,整個(gè)系統的負載較均衡,整個(gè)系統得到了有效的利用,且性能也比較突出。
  結語(yǔ)
  針對16通道D1數據格式的大數據量視頻數據置的采集編碼,在傳統達芬奇DSP處理器上實(shí)現相對較為困難,而本文針對基于多核DSP DM8 168將視頻的采集、降噪、隔行掃描以及壓縮編碼等任務(wù)從傳統的單核DSP處理器上獨立出來(lái),分別由從硬件加速的HDVPSS協(xié)處理器和HDVICP協(xié)處理器來(lái)完成,極大地提升了視頻采集的效率,同時(shí)也減輕了單核DSP的任務(wù)負擔,功能模塊化設計大大提升了嵌入式設備的整體處理能力,效果較為明顯。但從實(shí)際應用的角度來(lái)考慮,本設計可能考慮得不夠全面,需在后期設計中不斷地充實(shí)和完善。
                               
                                                               
                               
               
本文地址:http://selenalain.com/thread-156261-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页