在TM1300上實(shí)現H.26L的4×4點(diǎn)整數變換

發(fā)布時(shí)間:2010-3-9 23:06    發(fā)布者:hkx
關(guān)鍵詞: TM1300 , H.26L
引言

H.26L是下一代視頻編碼標準。最初,H.26L由ITU-T的VCEG小組開(kāi)始著(zhù)手制訂。2001年11月,MPEG和VCEG聯(lián)合成立 JVT小組共同參與制訂H.26L。也正因為MPEG的加入,H.26L將被納入MPEG-4的第十部分。由于H.26L標準還在制訂過(guò)程中,本文暫時(shí)以 JVT提供的測試模型TML8為參考。

H.26L信源編碼的基本編碼框架類(lèi)似于當前流行的視頻編碼標準,采用結合變換編碼和預測編碼的混合編碼技術(shù)。它出色的性能主要來(lái)源于引入的新編碼特性:4×4點(diǎn)整數變換、使用UVLC進(jìn)行熵編碼、1/4~1/8像素精度的運行矢量、有多種塊大小進(jìn)行運動(dòng)估計等等。這些新的編碼技術(shù)從不同側面提高了壓縮性能和容錯性能。尤其是4×4點(diǎn)整數變換,是所有視頻壓縮協(xié)議中獨一無(wú)二的。

雖然H.26L標準還在制訂中,但是在初步的測試中,它的編碼性能超越了現存所有標準,包括H.263+和MPEG-4(Simple profile)。這些試驗結果表明,在取得相同的客觀(guān)視頻質(zhì)量下,H.26L比H.263+能夠節省20%~50%的碼率,比MPEG-4(SP)節省多達50%的碼率。作為下一代視頻編碼標準,H.26L展示了其巨大的發(fā)展前景。

1 H.26L的4×4點(diǎn)整數變換

1.1 變換簡(jiǎn)介

在H.26L編碼技術(shù)中,4×4點(diǎn)整數變換可以看作是DCT變換的整數版本,主要完成去除圖像的空間相關(guān)性,與4×4點(diǎn)DCT變換有著(zhù)相同的性質(zhì)。先考慮一維的整數變換:設a,b,c,d是4個(gè)待變換的點(diǎn),A,B,C,D是對應的4個(gè)變換系數,則可以用以下公式表示a,b,c,d點(diǎn)的正變換:
A=13a+13b+13c+13d
B=17a+7b-7c-17d
C=13a-13b-13c+13d
D=7a-17b+17c-7d

反變換公式如下:
a‘=13A+17B+13C+7D
b‘=13A+7B-13C-17D
c‘=13A-7B-13C+17D
d‘=13A-17B+13C-7D

其中a和a‘的關(guān)系是a‘=676a。也就是說(shuō),經(jīng)過(guò)反變換后,還需要進(jìn)行歸一化操作,使得正變換和變換尺度一致。
同樣二維的4×4整數變換的變換核是可分離的。分離的變換將計算復雜度從O(N4)降到O(N3)。

1.2 與8×8點(diǎn)DCT變換的比較

與傳統的DCT變換相比,H.26L采用4×4點(diǎn)整數變換為視頻編碼帶來(lái)了以下優(yōu)點(diǎn):
①有助于減少塊斑和環(huán)形斑,提高了圖像質(zhì)量。由于對變換系數進(jìn)行了量化,造成了高頻系數丟失,所以恢復的圖像中會(huì )有塊班和環(huán)形班。在H.26L中,采用了更小的4×4點(diǎn)變換,可以有效抑制塊斑和環(huán)形斑。
②整數變換減小了積累誤差。傳統的積累誤差來(lái)自?xún)蓚(gè)方面:正變換和反變換不匹配造成的誤與量化造成的誤差。為了達到壓縮的目的,第二種誤差不可避免。但是,由于H.26L采用了精確的整數變換,所以正變換和反變換不會(huì )產(chǎn)生誤差,這樣有效地減少了積累誤差。
③運算速度快。因為H.26L采用的變換公式是一個(gè)簡(jiǎn)單的整數方程,也就是說(shuō)計算都是基于整數的,而不是浮點(diǎn)數,所以它減少了單個(gè)變換的計算量,也有利于采用定點(diǎn)的DSP實(shí)現。

2 在TM1300中的實(shí)現

TM1300是一款32位超高性能的多媒體處理器。它的核心處理器采用的是VLIW超長(cháng)指令字結構,可以在每一個(gè)時(shí)鐘周期內同時(shí)進(jìn)行5個(gè)操作;支持高度并行的定制操作,能大大加快數字信號處理和多媒體應用中常見(jiàn)的特殊運行的性能,而定制操作在使用上類(lèi)似于C語(yǔ)言函數調用,方便了程序的設計。

本文針對4×4點(diǎn)整數變換的特點(diǎn)和TM1300的定制運算指令的特點(diǎn),對整數變換作了以下調整:先做行變換,再做列變換。由于行變換的結果不會(huì )超過(guò)16位的表示范圍,故在作列變換之前,重新合并數據,再作列變換,這樣作是基于以下兩點(diǎn)考慮。

第一,由于視頻輸入數據為無(wú)符號的字節型,而TM1300是32位的處理器,以字為單位訪(fǎng)問(wèn)內存,能提高訪(fǎng)問(wèn)的效率。當前4×4數據塊(指針為P1)和參考幀4×4數據塊(指針為P2)的數據組織如下。待變換的點(diǎn)為當前數據塊的值與參考幀數據塊對應的值之差。
P1:cal,cb1,cc1,cd1 P2:ra1,rb1,rc1,rd1
ca2,cb2,cc2,cd2 ra2,rb2,rc2,rd2
ca3,cb3,cc3,cd3 ra3,rb3,rc3,rd3
ca4,cb4,cc4,cd4 ra4,rb4,rc4,rd4

第二,可以利用8位乘/累加的定制操作,一個(gè)操作能完成4個(gè)8位乘/累加,一個(gè)機器周期(CLK)最多能執行5個(gè)操作。與非定制的乘/累加相比,減少了運算的次數,提高了程序運行的并行度。


圖1為ifir8ui定制操作功能示意圖

3 實(shí)驗結果

本文提出的基于TM1300的4×4整數變換的快速算法,使用了并行算是技術(shù)大大減少了計算量。實(shí)驗表明,進(jìn)行1個(gè)4×4點(diǎn)整數變換,直接用乘法和加法運算需要80個(gè)機器周期,改進(jìn)后的算法只需28個(gè)機器周期;而利用TM1300進(jìn)行1個(gè)8×8點(diǎn)定點(diǎn)DCT變換需要180個(gè)機器周期,也明顯大于 4個(gè)4×4點(diǎn)整數變換時(shí)間。在變換方面H.264的變換編碼運算復雜度小于其它編碼方法。

參考文獻

   1. ITU-T/SG 16NCEG (Q.6). Draft ITU-T Recommendation H.26L. Document VCEG-P07 16th Meeting: FairfaxVirginia USA  
       6-10 May 2002
   2. Topiwala P.Sullivan G.Joch A Performance Evaluation of H.26L TML-8 versus H.263++ and MPEG-4 2001
   3. Topiwala P.Sullivan G.Joch A Overview and Performance Evaluation of theITU-T Draft H.26LVideo Coding Standard   
       2001
   4. Joint Video Team (JVT Evaluation and Simplification of H.26L Baseline Coding Tools. Document JVT-B0302nd Meeting:
      Geneva CH Jan. 29 - Feb. 1 2002

作 者:武漢大學(xué) 段漢文 黃曉杰  
來(lái) 源:單片機嵌入式系統應用 2003(8)
本文地址:http://selenalain.com/thread-9135-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页