隨著(zhù)網(wǎng)絡(luò )和多媒體技術(shù)的發(fā)展,視覺(jué)通信的重要性和需求急劇增加,如桌面視頻會(huì )議、移動(dòng)終端、基于因特網(wǎng)的視音頻通信等。隨之而來(lái)的是視頻壓縮技術(shù)的迅速發(fā)展和視頻壓縮標準的不斷推出。國際運動(dòng)圖像編碼專(zhuān)家組(MPEG)先后推出了MPEG-1、MPEG-2和MPEG-4.MPEG-4是由國際運動(dòng)圖像專(zhuān)家組于1998年11月制定的。它是一個(gè)面向多媒體應用的壓縮標準,其應用覆蓋范圍遠大于MPEG-1和MPEG-2等標準。從移動(dòng)可視電話(huà)到專(zhuān)業(yè)視頻編輯,既支持自然圖像,也支持計算機合成圖像。最重要的是它支持交互功能。這是由于MPEG-4采用了與其它標準不同的、基于對象的圖像描述方式。目前,國內有關(guān)MPEG-4應用技術(shù)的研究及開(kāi)發(fā)的工作正在悄然興起。筆者在研究了MPEG-4視頻標準之后,充分利用TMS320C6201的硬件資源和軟件優(yōu)化,實(shí)時(shí)實(shí)現了嵌入式MPEG-4視頻解碼器。 1 MPEG-4視頻碼流及主要算法 MPEG-4采用了基于對象的壓縮編碼技術(shù)。在編碼前,首先要對視頻序列進(jìn)行分析,從原理圖像中分割出各個(gè)視頻對象,然后南分別對每個(gè)視頻對象單獨編碼。每個(gè)對象都有自己的形狀信息(shape)、運動(dòng)信息(motion)、紋理信息(texture)。對視頻對象的編碼就是對這3種信息進(jìn)行編碼。MPEG-4通過(guò)運動(dòng)預測和運行補償來(lái)去除連續幀之間的時(shí)間冗余。運動(dòng)預測與運動(dòng)補償的精度可以為整像素、半像素或1/4像素,另外還增了重疊運動(dòng)補償方式。與形狀相關(guān)算法有:基于鄰近信息的算術(shù)編碼、水平和垂直填補、擴張填補等。與紋理編碼相關(guān)的算法有:離散余弦變換(DCT)、量化、DCT系數的DC/AC差分預測、Zig-Zag掃描、游程編碼、霍夫曼變長(cháng)編碼等。 筆者實(shí)現的是MPEG-4的SVP(Simple Visual Profile)視頻解碼。視頻序列全部為矩形,所以不存在任意形狀編碼。視頻序列按照視頻對象層VOL(Video Object Layer)、視頻對象平臺VOP(Video Object Plane)、宏塊MB(Macro Block)視順序編成一串碼流。1個(gè)VOL中包含多個(gè)VOP,1個(gè)VOP中包含多個(gè)MB。MB是碼流中的基本單位。MB又分為幀內MB(intraMB)、幀間MB(imterMB)。幀間4VMB(inter4VMB)等幾種。在I-VOP中,所有的宏塊都是intraMB。P-VOP中宏塊有多種可能,可以是intraMB、interMB或inter4VMB。P-VOP中的interMB或inter4VMB的碼流描述如下: MB碼流=MB形狀+MB頭信息+MV+DCT紋理信息(Y1+Y2+Y3+Y4+U+V) 由于是矩形幀,所以無(wú)形狀編碼MB shape部分。 MB頭信息中主要包括4個(gè)參數:not_coded(本MB是否編碼的標志位)、mcbpc(色度塊U和V是否編碼的標志位)、cbpy(亮度塊Y1~Y4是否編碼的標志位)、dquant(本MB中DCT系數量化步長(cháng)的增量值)。 MV為運動(dòng)矢量,實(shí)際寫(xiě)入碼流的是運動(dòng)矢量誤差值(ΔMV),這是因為編碼中MV采用差分編碼。如果MB是一個(gè)interMB,則表示本MB只有1個(gè)運動(dòng)矢量,所以在碼流中只傳1個(gè)ΔMV;如果MB是一個(gè)inter4VMB,則表示本MB有4個(gè)運行矢量,即每個(gè)子塊(block)有1個(gè)運動(dòng)矢量,所以在碼流中需傳送4個(gè)ΔMV,即mvd1、mvd2、mvd3和mvd4。 最后是一連串經(jīng)過(guò)量化、Zig-Zag掃描、游程編碼和霍夫曼變長(cháng)編碼的DCT系數,按照Y1、Y2、Y3、Y4、U和V的先后順序編碼。 2 TMS320C6201 DSP及EVM板介紹 2.1 TMS320C6201 DSP TMS320C6201是美國TI公司的C6000系列新一代數字信號處理器中的第1個(gè)產(chǎn)品,于1997年3月發(fā)布。它是一個(gè)32bit的定點(diǎn)DSP芯片。該芯片具有8個(gè)相互獨立的功能單元,可以工作在200MHz的CPU時(shí)鐘頻率,全速運行時(shí)可達到1600 MIPS。其主要特性包括: *芯片內核采用VelociTI TM先進(jìn)的超長(cháng)指令字(VLIW)結構,具有高度的并行性和快速的運行能力,每個(gè)時(shí)鐘周期最多可同時(shí)執行8條32位指令,并且所有的指令都可以有條件執行; *具有豐富的指令系統且可對字節操作,支持16位的乘法運算; *有4個(gè)彼此獨立的快速的DMA通道,可以進(jìn)行多種形式的數據傳輸。 *片內數據存儲區和程序存儲區各64KB,并支持多種數據寬度8位/16位/32位;32位的外部存儲器接口,提供與片外SDRAM、SDSRAM和SRAM的直接接口。 TMS320C6201的以上特點(diǎn),能滿(mǎn)足視頻圖像處理的實(shí)時(shí)性要求。例如:TMS320C6201 DSP計算1塊8%26;#215;8 IDCT(逆變散余弦變換)僅用(168+62)個(gè)時(shí)鐘周期,為1.15μs。 2.2 EVM板 TMS320C6201 EVM板是一塊帶有PCI接口的插卡,除了可以插在計算機主板的PCI插槽上使用外,還可以外配電源作為獨立的模塊工作,并通過(guò)XDS510仿真器進(jìn)行調試。該板上配有1片TMS320C6201 DSP,最高工作在160MHz。 EVM板上提供的片外存儲器包括1組64Kbit%26;#215;32(256KB)、133MHz的SBSRAM,配置成CE0;2組4MB、100MHz的SDRAM,分別配置成CE2和CE3;另外還可以通過(guò)板上的外部存儲器接口(EMIF)擴展存儲空間,這些擴展存儲器配置成CEI。 3 用TMS320C6201實(shí)現MPEG-4 SVP解碼 3.1 MPEG-4視頻解碼原理 MPEG-4的一個(gè)VOP的解碼過(guò)程如圖1所示,解碼器用這一過(guò)程從編碼位流中恢復視頻對象。不難看出,解碼器主要由形狀解碼器、運動(dòng)解碼器和紋理解碼器3部分組成。 3.2 程序流程 整個(gè)程序采用模塊化設計,以?xún)?yōu)化C語(yǔ)言編程為主。限于篇幅,僅列出主程序流程(如圖2所示)和MB解碼流程(如圖3所示)。 主程序在初始化后,首先從碼流中解出VOL和VOP的頭,然后根據這些頭信息以宏塊為單位進(jìn)行解碼。MB解碼單獨做成函數,也是首先解出頭信息,據此判斷出宏塊類(lèi)型:幀內MB、幀間MB或幀間4VMB。幀內MB解碼是以1塊為單位作紋理解碼,解出的紋理值在block[64]中,最后存入解碼后宏塊行緩存區內;2種幀間MB解碼相同部分都是先解出運動(dòng)矢量MV,根據MV進(jìn)行運動(dòng)補償得到預測值存入解碼后宏塊行緩存區,再以塊為單位進(jìn)行紋理解碼,解出殘差值存入block[64]中,最后將block[64]加入到解碼后宏塊門(mén)緩存區中得到最后結果。不同的是,在解碼MV時(shí)intraMB解出1個(gè)MV;而inter4VMB解出4個(gè)MV。因此,運動(dòng)補償時(shí),一個(gè)按宏塊做,一個(gè)按塊做。另外還有一種情況,就是P-VOP中的MB沒(méi)有被編碼(not_coded=1),碼流中沒(méi)有此宏塊的數據,應該MV=0、DCT系數全為0處理,即從前一幀同樣位置處找到參考塊作為當前宏塊的結果。 3.3 存儲器分配 MPEG-4 SVP解碼器是在EVM板上編程實(shí)現的。由于TMS320C6201 DSP片內數據存儲空量只有64KB,而圖像處理的數據量非常大,因此,合理有效地分析存儲空間是解碼設計中的關(guān)鍵問(wèn)題。內部64KB存儲空間內開(kāi)辟了一些空間用于暫存解碼中常用的一些信息,具體設置如表1所列。 表1 內部數據存儲器空間分配 全局變量所占空間/B 變長(cháng)解碼(VLD)表 4906 Zig-Zag掃 192 VOL、VOP和MB的頭信息 108 DC/AC預測和MB模式 5560 MV預測 9504 量化步長(cháng) 396 解碼輸出緩存區(1個(gè)宏塊行) 8448 輸入的壓縮碼流緩存區 10K 合 計 38.3K 輸入的壓縮碼流和解碼后的視頻輸出都存儲在片外。輸入的壓縮碼流在程序開(kāi)始前由PC機傳輸到EVM板的外部存儲器中保存,解碼時(shí)分批將數據通過(guò)DMA方式復制到片內。片內設置1個(gè)壓縮碼流緩存區。解碼后的視頻序列存放在外部存儲器中,在內部緩存1個(gè)宏塊行,每解完1個(gè)宏塊行后,就用DMA傳輸到外部存儲器中。 3.4 程序優(yōu)化 (1)軟件開(kāi)發(fā)流程及開(kāi)發(fā)工具 整個(gè)程序的編寫(xiě)和調試按照C6000軟件開(kāi)發(fā)流程進(jìn)行,流程分為:產(chǎn)生C代碼、優(yōu)化C代碼和編寫(xiě)線(xiàn)性匯編程序3個(gè)階段。使用的開(kāi)發(fā)工具是TI的集成開(kāi)發(fā)環(huán)境CCS(Code Composer Studio)。在CCS下,可以對軟件進(jìn)行編輯、編譯、調試、代碼性能測試(profile)等所有工作。 (2)程序優(yōu)化措施 為使程序優(yōu)化,采取如下措施: ①為編寫(xiě)出優(yōu)化的C程序,在編程時(shí)盡量按照C6000環(huán)境下支持的優(yōu)化C的方法進(jìn)行編程,這樣有助于C編譯器產(chǎn)生高效的匯編代碼。 ②使用TI提供的庫函數,大大提高了編程效率。 ③使用DMA傳數,提高了CPU的效率。 在解碼程序中用DMA方式實(shí)現了下列數據的傳輸: *碼流輸入——碼流從片外存儲器傳輸到片內; *解碼后的結果輸出——解碼完一宏塊行后,將結果從片內傳輸到片外保存; *頂部和低部的填充; *運動(dòng)補償時(shí),將在片外找到的參考塊傳輸到片內。 (3)采用線(xiàn)性匯編對某些程序段做進(jìn)一步優(yōu)化。 為了提高代碼性能,對影響應用程序的代碼可以用線(xiàn)性匯編重新編寫(xiě)。 3.5 MPEG-4 SVP解碼器的特性及測試結果 按照上述思路所實(shí)現的MPEG-4 SVP視頻解碼器完全符合MPEG-4的SVP規范,其特點(diǎn)如表2所列。輸入圖像分辨率可為QCIF或CIF,輸入比特率為64Kbps、128Kbps和384Kbps,輸出圖像格式為4:2:0YUV,最大解碼速率為30幀/s。 表2 MPEG-4 SVP視頻解碼器特性表 壓縮標準 MPEG-4SVP 輸入圖像分辨率 QCIF(176%26;#215;144),CIF(352%26;#215;288) 像素精度 8bit/pixel 掃描格式逐行掃描 輸入比特率/Kbps 64,128,384 最大解碼幀率最高30幀/s 輸出圖像格式 4:2:0 YUV 在解碼軟件是在EVM板上調試通過(guò)的,解碼時(shí)間可在CCS環(huán)境下測得。對于不同的圖像解碼所用的時(shí)間是有差異的。筆者對多種情況的碼流進(jìn)行了測試,在1秒內都能解出25~30幀,甚至更多幀從而實(shí)現了實(shí)時(shí)解碼。 結束語(yǔ) 筆者在研究了MPEG-4的視頻編解碼算法之后,成功地在TMS320C6201 EVM板上編程實(shí)現子MPEG-4 SVP的實(shí)時(shí)解碼,為最終設計出獨立的MPEG-4解碼器打下了基礎。此解碼器可以嵌入到某些移動(dòng)終端中,用于解碼VPEG-4碼流,如PDA、機頂盒和住宅網(wǎng)關(guān)等;還可以與相應的編碼器配套用于遠程監控中。 |