運動(dòng)圖像遠程實(shí)時(shí)傳輸H.263壓縮方法分析/優(yōu)化

發(fā)布時(shí)間:2010-6-29 16:38    發(fā)布者:vinda
運動(dòng)圖像遠程實(shí)時(shí)傳輸系統的網(wǎng)絡(luò )傳輸部分架構在Internet之上,而現階段Internet的狀況是帶寬小、延遲大、不穩定。所以為了獲得良好的實(shí)時(shí)傳輸效果,除了改善傳輸控制機制之外,還需要實(shí)現高壓縮比、低耗時(shí)、能達到實(shí)時(shí)壓縮和解壓縮效果的運動(dòng)圖像壓縮方法。H.263是國際電信協(xié)會(huì )-電信標準化部門(mén)ITU-T(The International Telecommunications Union-Telecommunication Standardization Sector)于1995年通過(guò)的用于低比特率實(shí)時(shí)傳輸的視頻編解碼協(xié)議。其設計初衷是滿(mǎn)足帶寬低于64kbps的低帶寬視頻應用需求,如視頻會(huì )議、可視電話(huà)等,F在H.263也被應用于運動(dòng)圖像遠程實(shí)時(shí)傳輸系統中,但原始的H.263在實(shí)時(shí)性和壓縮比等方面還有不少可優(yōu)化余地。本文針對具體的運動(dòng)圖像遠程實(shí)時(shí)傳輸系統應用,在大量研究工作基礎上提出多個(gè)H.263的優(yōu)化策略,并取得了相當好的效果。

1 H.263壓縮算法的分析概要

H.263的輸入視頻幀格式為QCIF(Quarter Common Intermediate Format,大小為176×144)、CIF(Common Intermediate Format,大小為352×288)等。將每個(gè)視頻幀分成許多宏塊(MB-Micro Block),每個(gè)宏塊由4個(gè)Y亮度塊、1個(gè)Cb色度塊和1個(gè)Cr色度塊組成。塊(Block)的大小為8×8。H.263以宏塊為單位進(jìn)行視頻幀的壓縮。

H.263使用離散余弦變換DCT(Discrete Cosine Transform)減小空間冗余,使用運動(dòng)估計和運動(dòng)補償(Motion Estimation and Motion Compensation)減小時(shí)間冗余。H.263有兩種編碼方式,一種是Intra方式,幀內編碼,產(chǎn)生的幀作為關(guān)鍵幀-I幀;另一種是Inter方式,幀間編碼,產(chǎn)生的幀作為非關(guān)鍵幀-P幀。

通過(guò)分析,將H.263壓縮算法的流程圖歸納為如圖1所示。


通過(guò)分析和測試表明,DCT、運動(dòng)估計和運動(dòng)補償是H.263最重要的部分,同時(shí)也是H.263實(shí)現中最耗時(shí)的運算環(huán)節。要提高H.263的運算速度,就要針對這些環(huán)節進(jìn)行優(yōu)化。

2 轉換函數、DCT和運動(dòng)估計環(huán)節的優(yōu)化

2.1 色彩空間轉換函數的優(yōu)化

CIF格式基于YUV色彩空間,而應用程序中,大多數視頻采集程序只提供RGB色彩空間的視頻幀,因此需要建立從RGB色彩空間到YUV色彩空間的轉換函數。

RGB到YUV的轉換函數如下所示,其中Y為YUV色彩空間的亮度值,U(Cb)和V(Cr)為YUV色彩空間的色度值。

Y=0.299×R+0.587×G+0.114×B;
Cr=V=(R-Y)×127/179;
Cb=U=(B-Y)×127/226;

H.263原有的色彩空間轉換算法采用浮點(diǎn)運算,但浮點(diǎn)運算會(huì )消耗較多的CPU周期。為了加快視頻處理速度,采用整型乘法和向右移位來(lái)代替浮點(diǎn)乘除,從而有效縮短了轉換時(shí)間。

優(yōu)化后的轉換函數如下:
Y=((R×313524)>>20)+((G×615514)>>20)×((B×119538)>>20);

Cr=V=((R-Y)×743962))>>20;

Cb=U=((B-Y)×589244))>>20;

2.2 DCT、IDCT算法的優(yōu)化

二維DCT公式為:



通過(guò)分析得出,DCT快速算法的實(shí)現可以有兩種方式。一種方法是把已有的快速變換算法(如FFT、FHT等)映射到DCT計算中,這種方式多了一個(gè)映射環(huán)節,增加了計算的復雜度;另一種方法是從DCT變換本身尋找規律進(jìn)行改進(jìn)。

在H.263應用中,注意到兩條規律:一是能量集中在少部分DCT系數上;二是隨著(zhù)量化步長(cháng)的增大,被量化為零的DCT系數增多,而且對DCT計算的精度要求降低。于是,采用一種零系數預測策略,即根據量化步長(cháng),首先對DCT變換的輸入數據分類(lèi),對于給定的量化步長(cháng),如果輸入數據將要被量化為0,那么這些數據就不必做DCT運算,而直接將變換結果置為0。這樣只需對部分數據進(jìn)行DCT變換,因此節省了大量無(wú)效運算。另外,利用DCT的局部并行性,使用Intel的多媒體處理指令集-MMX來(lái)實(shí)現DCT計算,大幅度提高了運算速度。

2.3 運動(dòng)估計與運動(dòng)補償算法的優(yōu)化

運動(dòng)估計是指在參考幀中搜索一個(gè)與當前幀圖像塊最相似的圖像塊,即最佳匹配塊,搜索結果用運動(dòng)向量來(lái)表示。運動(dòng)補償是指利用參考幀和已求得的運動(dòng)向量重構當前幀,把重構幀和當前幀的差值作為當前幀的補償值進(jìn)行壓縮編碼。兩者互相配合,共同實(shí)現壓縮效果。

運動(dòng)估計算法的研究從兩方面著(zhù)手:快速搜索算法和塊匹配準則。

最簡(jiǎn)單的搜索算法是全搜索法(FS),這種算法精度高,但計算量過(guò)于龐大。為了加快運算速度,保證精度,人們提出了很多快速搜索算法:三步法(TSS)及基于三步法的改進(jìn)算法、二維對數法(LOGS)、交叉搜索法(CS)、四步法(4SS)、預測搜索法(PSA)、鉆石搜索法(DS)等。鉆石搜索法是迄今為止綜合性能最優(yōu)的快速搜索算法之一,用于本次項目研究中。

塊匹配準則決定何時(shí)找到最佳匹配塊,從而終止搜索進(jìn)程。傳統的準則有絕對平均誤差函數(MAE)、互相關(guān)函數(CCF)、均方誤差函數(MSE)、最大誤差最小函數(MME)等。由于傳統方法沒(méi)有考慮人眼的視覺(jué)特性,所以判斷結果和人眼的感知相差較大。實(shí)際H.263采用的塊匹配準則為MSE的替代準則SAD(絕對差和),兩者的公式如下:



其中:F0和F-1分別代表當前幀和重構幀(參考幀);k,l為待編碼宏塊在當前幀中的坐標;x,y為重構幀中參考宏塊的坐標;N表示宏塊的尺寸,此處為16。從公式中可見(jiàn),SAD用絕對值運算代替了MSE的乘方運算,明顯降低了運算量,從而可以加快計算速度。

測試表明,SAD的計算量要比MSE的計算量減少三分之一,而它們的圖像效果相當。

此外,還可以利用硬件特性加速塊匹配準則的運算速度,Intel的MMX技術(shù)提供了這種特性。SAD等塊匹配準則主要針對短數據的重復計算,MMX增加了系統單個(gè)指令操作數據的數目(SIMD),從而可以在一個(gè)指令中完成多組數據的計算,實(shí)現并行機制,從而加快運算速度。

3 提高壓縮比的選擇

H.263提供了許多高級模式來(lái)提高視頻壓縮比。從對壓縮效率的貢獻角度看,大運動(dòng)向量模式、高級預測模式、PB幀模式和增強PB幀模式是最重要的4個(gè)高級模式。

在大運動(dòng)向量模式和高級預測模式下,運動(dòng)向量可以指到圖像邊界以外,增大了運動(dòng)向量的表達范圍,從而在本質(zhì)上提高了運動(dòng)補償的精度以改善編碼效率。

基本PB幀模式下,一個(gè)PB幀是一個(gè)P幀和一個(gè)B幀組成的整體。當前P幀由前一個(gè)P幀預測得到,B幀則由前一個(gè)P幀和當前P幀預測得到(見(jiàn)圖2)。PB幀模式在增加較少比特數的情況下,將幀率提高了近一倍。


增強PB幀模式的主要改進(jìn)點(diǎn)在于預測方式的增強;綪B幀模式對B幀圖像(或宏塊 )僅允許使用雙向預測,而增強的PB幀模式對B幀圖像則允許使用前向預測(見(jiàn)圖3)、后向預測(見(jiàn)圖4)和雙向預測(見(jiàn)圖2)三種手段。這樣,在壓縮過(guò)程中,有機會(huì )選擇更合適的預測方法處理B幀圖像(或宏塊),從而提高B幀的壓縮效率;綪B幀模式的B幀只能通過(guò)雙向預測獲得,這對慢速運動(dòng)圖像效果較好。當輸入運動(dòng)圖像存在快速不規則運動(dòng)時(shí),B幀質(zhì)量會(huì )急劇惡化,而增強PB幀模式的B幀有三種預測方式可選,可以解決這一難題。通過(guò)分析和測試表明,增強PB幀模式比基本PB幀模式有更強的魯棒性,更適用于運動(dòng)圖像遠程實(shí)時(shí)傳輸。


大運動(dòng)向量模式和高級預測模式由于增大了運動(dòng)向量的表示范圍,可以增強運動(dòng)補償的精度,從而提高壓縮比;而增強PB幀模式引入B幀,有三種預測方式可以生成B幀,在相同幀率的情況下,將壓縮比提高近80%,壓縮效果明顯。在實(shí)際程序設計中,筆者配合傳輸環(huán)境測試模塊,在網(wǎng)絡(luò )帶寬較低時(shí)實(shí)現這三種方式的配合使用,發(fā)揮了更大的壓縮效率,達到更高的壓縮比。

4 實(shí)驗數據和性能分析

4.1 算法優(yōu)化測試

分別取100幀三種不同格式(SUB-QCIF:88×72,QCIF:178×144,CIF:352×288)的視頻幀,每20幀取1個(gè)關(guān)鍵幀,視頻幀質(zhì)量取6000,比較優(yōu)化前和優(yōu)化后算法的時(shí)間效率,結果如(圖5)所示。


縱軸單位為毫秒,表示壓縮完成所需時(shí)間?梢(jiàn),要處理的視頻幀越大,優(yōu)化后的算法取得的加速效果越明顯。

4.2 增強PB幀模式壓縮效果測試

分別取100幀三種不同格式(SUB-QCIF:88×72,QCIF:178×144,CIF:352×288)的視頻幀,每20幀取1個(gè)關(guān)鍵幀,視頻幀質(zhì)量取6000,比較使用增強PB幀模式前和使用增強PB幀模式后算法的壓縮效率,結果如(圖6)所示。


縱軸為壓縮比。要處理的視頻幀越大,冗余信息越多,增強PB幀模式的壓縮效果越明顯。
本文地址:http://selenalain.com/thread-14051-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页