基于TMS320DM642的MPEG4編碼器設計與實(shí)現

發(fā)布時(shí)間：2010-8-2 10:24 發(fā)布者：lavida

關(guān)鍵詞： MPEG4 , TMS320DM642 , 編碼器

1 引言

近年來(lái)，隨著(zhù)網(wǎng)絡(luò )和多媒體技術(shù)的發(fā)展，視頻信息通信的重要性和需求急劇增長(cháng)，而其中的關(guān)鍵就在于視頻壓縮編碼技術(shù)的應用。文獻[1]曾提出了一種基于TMS320DM642 DSP的視頻編碼方案，實(shí)現了H.264算法。同H.264相比，MPEG4具有軟硬件開(kāi)發(fā)成本低和更容易實(shí)現的優(yōu)勢，是目前視頻編碼應用的主流。本文提出了一種基于TMS320DM642 DSP的MPEG4視頻編碼器的實(shí)現方法，該方案可用于遠程視頻監控、視頻會(huì )議等諸多領(lǐng)域。

MPEG4是由國際運動(dòng)圖像專(zhuān)家組(MPEG)開(kāi)發(fā)制定的國際通用視頻壓縮編碼標準，目前已經(jīng)發(fā)展成為可適應不同傳輸帶寬、可用最少的數據來(lái)獲得最佳質(zhì)量圖像的高效壓縮算法和工具。MPEG采用了DCT、量化、熵編碼等算法，通過(guò)對形狀、運動(dòng)、紋理等信息的分析，消除圖像數據在時(shí)間和空間上的相關(guān)性，具有高效壓縮性及普遍適用性等獨特優(yōu)勢，為視頻信息高效存儲、傳輸提供了方便。

MPEG4為不同的應用對應的碼率、分辨率、質(zhì)量和服務(wù)定義了編碼器和碼流的不同框架和級別，其中的簡(jiǎn)單框架提供了對矩形視頻對象的編碼功能。本文所實(shí)現的就是MPEG4視頻編碼算法的簡(jiǎn)單框架。

2 MPEG4編碼器硬件平臺

實(shí)現MPEG4編碼器的硬件平臺以TMS320DM642DSP為核心，并配合以適當的外部存儲器SDRAM，FLASH等外圍設備。

2.1 TMS320DM642特性

TMS320DM642是TI為多媒體應用而開(kāi)發(fā)的基于C64x內核的高性能定點(diǎn)數字信號處理器，時(shí)鐘頻率600 MHz，最高處理能力可達4 800 MIPS。DM642具有C6000系列DSP的公共定點(diǎn)指令集，增加了多媒體擴展指令，可以更加方便快速地執行圖像處理中的算法。DM642的這些特點(diǎn)，使其非常適合于視頻圖像處理，是實(shí)現MPEG4視頻編碼器的理想硬件平臺。

2.2 硬件系統結構

DM642作為整個(gè)系統的核心，對視頻數據進(jìn)行高速處理，完成MPEG4編碼算法；可編程視頻格式轉換電路將輸入的原始視頻數據進(jìn)行預處理，轉換成編碼器可接受的視頻格式的數字信號；E2PROM和FLASH用來(lái)固化應用程序和初始化參數，SDRAM作為片外存儲器，在編碼過(guò)程中存儲待處理的視頻數據，以上三者通過(guò)EMIF總線(xiàn)與DM642連接；通過(guò)JTAG接口，利用CCS，可方便地實(shí)現系統軟硬件仿真與調試；實(shí)時(shí)時(shí)鐘為數字視頻提供實(shí)時(shí)時(shí)間基準信息。

3 MPEG4編碼器的軟件實(shí)現和優(yōu)化

3.1 MPEG4的軟件實(shí)現

MPEG4是一個(gè)開(kāi)放的框架標準，并沒(méi)有規定具體的算法和程序，用戶(hù)可根據需要自行開(kāi)發(fā)代碼，我們采用了XVID 1.1.0開(kāi)放源碼來(lái)實(shí)現MPEG4編碼器。XVID代碼實(shí)現了MPEG4的簡(jiǎn)單框架算法，不需要形狀編碼，只對I-VOP和P-VOP進(jìn)行編碼。但XVID是針對PC機應用而設計開(kāi)發(fā)的，要將他移植到DSP中，必須對代碼進(jìn)行分析，結合DSP的指令結構和特點(diǎn)進(jìn)行修改。

XVID代碼實(shí)現的MPEG4編碼器，以原始視頻數據中的每一幀作為一個(gè)視頻對象，首先判斷是I幀還是P幀，I幀需要對整幀圖像數據進(jìn)行編碼存儲，P幀則進(jìn)行運動(dòng)估計和補償，只編碼當前幀與參考幀之間的圖像殘差和運動(dòng)矢量。每幀數據都被分為16×16宏塊，每個(gè)宏塊又分為8×8子塊，在宏塊和子塊的基礎上進(jìn)行DCT、量化、VLC編碼�；诓桓叩膱D像質(zhì)量需求，我們減化了XVID的某些功能，如GMC(全局運動(dòng)補償)、RVLC等，減少了代碼運算量，降低了復雜度。

3.2 代碼優(yōu)化

為提高代碼執行效率，必須結合DSP的特點(diǎn)對代碼進(jìn)行優(yōu)化，優(yōu)化主要分為3個(gè)層次：

3.2.1 項目級優(yōu)化

TI提供了功能強大的集成開(kāi)發(fā)環(huán)境CCS，包含了各種高效的編譯工具，在代碼編譯過(guò)程中，通過(guò)使用編譯器提供的編譯選項(如-o3和-pm等)，編譯器可自動(dòng)改善代碼結構，減少代碼中指令的相關(guān)性，通過(guò)軟件流水等方法，提高指令并行性，改善循環(huán)性能，并可以?xún)?yōu)化代碼的尺寸。

3.2.2 C語(yǔ)言程序級優(yōu)化

通過(guò)使用CCS中的profile工具，對C代碼進(jìn)行評估，找出運算量最大的程序段，如DCT、量化、運動(dòng)估計等，這部分代碼的優(yōu)化對提高編碼器性能有顯著(zhù)影響，我們采用了以下C程序級優(yōu)化方法：

(1) 使用C6000 DSP特有的關(guān)鍵字和內聯(lián)函數來(lái)改寫(xiě)C代碼，如使用關(guān)鍵字restrict可消除數據間的相關(guān)性以提高代碼并行執行能力，而使用內聯(lián)函數(如_add2()，nassert())可快速優(yōu)化C代碼，作為直接映射為內聯(lián)C6000指令的特殊函數，可提高代碼在DSP中的執行效率。
(2) 使用整型訪(fǎng)問(wèn)短型數據，使用32位整型一次訪(fǎng)問(wèn)2個(gè)16位短型數據，分別存放在32位寄存器的高、低16位字段，可減少對內存的訪(fǎng)問(wèn)次數，將程序讀取數據的效率提高一倍，再使用能同時(shí)對2個(gè)寄存器對應高低16位進(jìn)行操作的內聯(lián)函數，如add2()；mpy2()等，可大大提高代碼執行效率。
(3) 采用循環(huán)展開(kāi)的方法，將多循環(huán)變?yōu)樯傺h(huán)甚至單循環(huán)，減少循環(huán)嵌套，消除冗余循環(huán)，可以提高指令并行執行的程度。
(4) DSP沒(méi)有專(zhuān)門(mén)的硬件除法運算單元，除法都用連續減法實(shí)現，運算量比較大，所以要盡量減少除法運算，不能減少的除法用移位運算來(lái)實(shí)現，可減少運算耗時(shí)。
(5)使用TI圖像庫函數。TI提供了功能強大的IM-AGE庫支持，包括了很多圖像處理常用函數，如8×8子塊的DCT變換(IMG_fdct_8×8)、SAD計算(IMG_sad_8×8)，這些函數都是優(yōu)化過(guò)的，代碼效率很高，可直接應用到程序中。

3.2.3 匯編程序級優(yōu)化

線(xiàn)性匯編語(yǔ)言是C6000系列DSP所特有的一種編程語(yǔ)言，類(lèi)似匯編，但不需要給出指令使用的功能單元、寄存器、并行性等細節信息，匯編優(yōu)化器可根據代碼情況自動(dòng)確定。我們將代碼中運算量大、調用頻率高的關(guān)鍵部分用線(xiàn)性匯編進(jìn)行了改寫(xiě)，如量化、DCT、SAD等模塊，進(jìn)一步優(yōu)化了循環(huán)迭代、提高了指令的并行性效果。

3.3 存儲空間的配置

DSP的片上存儲空間有限，編碼器要處理的大量視頻數據(包括當前幀和參考幀等圖像)必須放在片外，而CPU訪(fǎng)問(wèn)片外的速度要比訪(fǎng)問(wèn)片內慢很多。利用DM642的EDMA功能，CPU對前一幀數據編碼的同時(shí)，通過(guò)ED-MA通道提前將片外的數據搬移到片上內存，二者并行工作，提高了數據由片外傳輸至片內的效率，可減少CPU等待時(shí)間。

3.4 實(shí)驗結果

使用編碼器對標準qcif格式(176×144)測試序列進(jìn)行編碼來(lái)測試編碼器性能，其中news序列300幀，suzie序列150幀，foreman序列400幀，通過(guò)TI的集成開(kāi)發(fā)環(huán)境CCS 2.0進(jìn)行硬件仿真實(shí)驗，在設定碼率為100 b／s的條件下，結果。

通過(guò)分析測試序列編碼結果，編碼器的編碼速率達到25 fps以上，可以滿(mǎn)足實(shí)時(shí)編碼的要求。在傳輸碼率降低的情況下，編碼速率還可以進(jìn)一步提高。從編碼結果可以發(fā)現，不同測試序列編碼前后的壓縮比不同，這是由于測試序列圖像的運動(dòng)情況、背景變換造成的，如suzie序列背景單一，運動(dòng)緩和，壓縮比較高，而news序列由于背景不斷變換，壓縮比就相對較低。通過(guò)對比編碼前和編碼后解碼得到的圖像，畫(huà)面無(wú)失真現象，圖像質(zhì)量并沒(méi)有明顯下降。

4 結語(yǔ)

本文探討了MPEG4編碼器在DM642上的實(shí)現方案和優(yōu)化的方法，實(shí)現了MPEG4編碼的簡(jiǎn)單框架算法。實(shí)驗結果表明，本文所提出的方案具有較高的易實(shí)現性和實(shí)用性，增加和改進(jìn)的代碼優(yōu)化方法是有效的，性能測試獲得了滿(mǎn)意的效果。在此基礎上，我們還可進(jìn)一步對實(shí)現MPEG4高級框架和代碼優(yōu)化方法的改進(jìn)，進(jìn)行更深入地研究，以滿(mǎn)足更高的應用要求。

本文地址：http://selenalain.com/thread-18433-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

相關(guān)文章

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

相關(guān)視頻

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页