視頻標準核心技術(shù)比較

發(fā)布時(shí)間：2010-9-28 22:19 發(fā)布者：eetech

關(guān)鍵詞：比較 , 標準 , 核心技術(shù) , 視頻

視頻編碼技術(shù)在過(guò)去幾年最重要的發(fā)展之一是由ITU和ISO/IEC的聯(lián)合視頻小組 (JVT)開(kāi)發(fā)了H.264/MPEG-4 AVC標準。在發(fā)展過(guò)程中，業(yè)界為這種新標準取了許多不同的名稱(chēng)。ITU在1997年開(kāi)始利用重要的新編碼工具處理H.26L（長(cháng)期），結果令人鼓舞，于是ISO決定聯(lián)手ITU組建JVT并采用一個(gè)通用的標準。因此，大家有時(shí)會(huì )聽(tīng)到有人將這項標準稱(chēng)為JVT，盡管它并非正式名稱(chēng)。ITU在2003年 5月批準了新的H.264標準。ISO在2003年10 月以MPEG-4 Part 10、高級視頻編碼或AVC的名稱(chēng)批準了該標準。

H.264 實(shí)現的改進(jìn)創(chuàng )造了新的市場(chǎng)機遇

H.264/AVC在壓縮效率方面取得了巨大突破，一般情況下達到MPEG-2及MPEG-4簡(jiǎn)化類(lèi)壓縮效率的大約2倍。在JVT進(jìn)行的正式測試中，H.264在85個(gè)測試案例中有78％的案例實(shí)現1.5倍以上的編碼效率提高，77％的案例中達到2倍以上，部分案例甚至高達4倍。H.264 實(shí)現的改進(jìn)創(chuàng )造了新的市場(chǎng)機遇，如：600Kbps的VHS品質(zhì)視頻可以通過(guò)ADSL線(xiàn)路實(shí)現視頻點(diǎn)播；高清晰電影無(wú)需新的激光頭即可適應普通 DVD。

H.264標準化時(shí)支持三個(gè)類(lèi)別：基本類(lèi)、主類(lèi)及擴展類(lèi)。后來(lái)一項稱(chēng)為高保真范圍擴展 (FRExt)的修訂引入了稱(chēng)為高級類(lèi)的4個(gè)附加類(lèi)。在初期主要是基本類(lèi)和主類(lèi)引起了大家的興趣�；绢�(lèi)降低了計算及系統內存需求，而且針對低時(shí)延進(jìn)行了優(yōu)化。由于B幀的內在時(shí)延以及CABAC的計算復雜性，因此它不包括這兩者�；绢�(lèi)非常適合可視電話(huà)應用以及其他需要低成本實(shí)時(shí)編碼的應用。

主類(lèi)提供的壓縮效率最高，但其要求的處理能力也比基本類(lèi)高許多，因此使其難以用于低成本實(shí)時(shí)編碼和低時(shí)延應用。廣播與內容存儲應用對主類(lèi)最感興趣，它們是為了盡可能以最低的比特率獲得最高的視頻質(zhì)量。

盡管H.264采用與舊標準相同的主要編碼功能，不過(guò)它還具有許多與舊標準不同的新功能，它們一起實(shí)現了編碼效率的提高。其主要差別，概述如下：

幀內預測與編碼：H.264采用空域幀內預測技術(shù)來(lái)預測相鄰塊鄰近像素的Intra-MB中的像素。它對預測殘差信號和預測模式進(jìn)行編碼，而不是編碼塊中的實(shí)際像素。這樣可以顯著(zhù)提高幀內編碼效率。

幀間預測與編碼：H.264中的幀間編碼采用了舊標準的主要功能，同時(shí)也增加了靈活性及可操作性，包括適用于多種功能的幾種塊大小選項，如：運動(dòng)補償、四分之一像素運動(dòng)補償、多參考幀、通用 (generalized)雙向預測和自適應環(huán)路去塊。

可變矢量塊大�。涸试S采用不同塊大小執行運動(dòng)補償�？梢詾樾≈�4(4的塊傳輸單個(gè)運動(dòng)矢量，因此在雙向預測情況下可以為單個(gè)MB傳輸多達32個(gè)運動(dòng)矢量。另外還支持16(8、8(16、8(8、8(4和4(8的塊大小。降低塊大小可以提高運動(dòng)細節的處理能力，因而提高主觀(guān)質(zhì)量感受，包括消除較大的塊化失真。

四分之一像素運動(dòng)估計：通過(guò)允許半像素和四分之一像素運動(dòng)矢量分辨率可以改善運動(dòng)補償。

多參考幀預測：16個(gè)不同的參考幀可以用于幀間編碼，從而可以改善視頻質(zhì)量的主觀(guān)感受并提高編碼效率。提供多個(gè)參考幀還有助于提高H.264位流的容錯能力。值得注意的是，這種特性會(huì )增加編碼器與解碼器的內存需求，因為必須在內存中保存多個(gè)參考幀。

自適應環(huán)路去塊濾波器：H.264采用一種自適應解塊濾波器，它會(huì )在預測回路內對水平和垂直區塊邊緣進(jìn)行處理，用于消除塊預測誤差造成的失真。這種濾波通常是基于4(4塊邊界為運算基礎，其中邊界各邊的3個(gè)像素可通過(guò)4級濾波器進(jìn)行更新。

整數變換：采用DCT的早期標準必須為逆變換的固點(diǎn)實(shí)施來(lái)定義舍入誤差的容差范圍。編碼器與解碼器之間的 IDCT 精度失配造成的漂移是質(zhì)量損失的根源。H.264利用整數4(4空域變換解決了這一問(wèn)題——這種變換是DCT的近似值。4(4的小區塊還有助于減少阻塞與振鈴失真。

量化與變換系數掃描：變換系數通過(guò)標量量化方式得到量化，不產(chǎn)生加大的死區。與之前的標準類(lèi)似，每個(gè)MB都可選擇不同的量化步長(cháng)，不過(guò)步長(cháng)以大約12.5％的復合速率增加，而不是固定遞增。同時(shí)，更精細的量化步長(cháng)還可以用于色度成分，尤其是在粗劣量化光度系數的情況下。

熵編碼：與根據所涉及的數據類(lèi)型提供多個(gè)靜態(tài)VLC表的先前標準不同，H.264針對變換系數采用上下文自適應VLC，同時(shí)針對所有其他符號采用統一的VLC (UniversalVLC)方法。主類(lèi)還支持新的上下文自適應二進(jìn)制算術(shù)編碼器 (CABAC)。CAVLC優(yōu)于以前的VLC實(shí)施，不過(guò)成本卻比VLC高。

CABAC利用編碼器和譯碼器的機率模型來(lái)處理所有語(yǔ)法元素 (syntax elements)，包括：變換系數和運動(dòng)矢量。為了提高算術(shù)編碼的編碼效率，基本概率模型通過(guò)一種稱(chēng)為上下文建模的方法對視頻幀內不斷變換的統計進(jìn)行適應。上下文建模分析提供編碼符號的條件概率估計值。只要利用適當的上下文模型，就能根據待編碼符號周?chē)囊丫幋a符號，在不同的概率模型間進(jìn)行切換，進(jìn)而充份利用符號間的冗余性。每個(gè)語(yǔ)法元素都可以保持不同的模型（例如，運動(dòng)矢量和變換系數具有不同的模型）。相較于VLC熵編碼方法 (UVLC/CAVLC)，CABAC 能多節省10％bit速率。

加權預測：它利用前向和后向預測的加權總和建立對雙向內插宏模塊的預測，這樣可以提高場(chǎng)景變化時(shí)的編碼效率，尤其是在衰落情況下。

保真度范圍擴展：2004年7月，H.264標準增加了稱(chēng)為保真度范圍擴展 (FRExt) [11]的新修訂。這次擴展在H.264中添加了一整套工具，而且允許采用附加的色域、視頻格式和位深度。另外還增加了對無(wú)損幀間編碼與立體顯示視頻的支持。FRExt修訂版在H.264中引入了4種新類(lèi)，即：

High Profile (HP)：用于標準 4:2:0色度采樣，每分量8位彩色。此類(lèi)引入了新的工具—— 隨后詳述。

High 10 Profile (Hi10P)：用于更高清晰度視頻顯示的標準 4:2:0 色度采樣，10位彩色。

High 4:2:2 10 bit color profile (H422P)：用于源編輯功能。

High 4:4:4 12 bit color profile (H444P)：最高品質(zhì)的源編輯與色彩保真度，支持視頻區域的無(wú)損編碼以及與新的整數色域變換（從RGB到YUV及黑色）。

在新的應用領(lǐng)域中，H.264 HP對廣播與DVD尤為有利。某些試驗顯示出H.264 HP的性能比MPEG2 提高了3倍。下面介紹H.264 HP中引入的主要附加工具。

自適應殘差塊大小與整數8(8變換：用于變換編碼的殘差塊可以在8(8與4(4之間切換。引入了用于8(8塊的新16位整數變換。較小的塊仍然可以采用以前的4(4變換。

8(8亮度幀內預測：增加了8種模式，除之前的16(16和4(4塊以外，使亮度內部宏模塊還能夠對8(8塊進(jìn)行幀內預測。

量化加權：用于量化8(8變換系數的新量化加權矩陣。

單色：支持黑／白視頻編碼。

AVS

2002 年，中國信息產(chǎn)業(yè)部成立的音視頻技術(shù)標準 (AVS)工作組宣布準備針對移動(dòng)多媒體、廣播、DVD等應用編寫(xiě)一份國家標準。該視頻標準稱(chēng)為AVS，由兩個(gè)相關(guān)部分組成針對移動(dòng)視頻應用的AVS-M和針對廣播與DVD的AVS1.0。AVS標準與H.264相似。

AVS1.0同時(shí)支持隔行和逐行掃描模式。AVS中P幀可以利用2幀的前向參考幀，同時(shí)允許B幀采用前后各一個(gè)幀。在隔行模式下，4個(gè)場(chǎng)可以用作參考�？梢�?xún)H在幀級執行隔行模式中的幀／場(chǎng)編碼，這一點(diǎn)與H.264不同，其中允許此選項的MB級自適應。AVS具有與H.264相似的環(huán)路濾波器，可以在幀級關(guān)閉。另外，B幀還無(wú)需環(huán)路濾波器。幀內預測是以8(8塊為單位進(jìn)行。MC允許對亮度塊進(jìn)行1／4象素補償。ME的塊大小可以是16(16、 16(8、8(16或8(8。變換方式是基于16位的8(8整數變換（與WMV9相似）。VLC是基于上下文自適應2D運行／級別編碼。采用4個(gè)不同的 Exp-Golomb編碼。用于每個(gè)已量化系數的編碼自適應到相同8(8塊中前面的符號。由于Exp-Golomb表是參數化的表，因此表較小。用于逐行視頻序列的AVS 1.0的視頻質(zhì)量在相同比特率時(shí)稍遜于H.264主類(lèi)。

AVS-M主要針對移動(dòng)視頻應用，與H.264基本規范存在交叉。它僅支持逐行視頻、I與P幀，不支持B幀。主要AVS-M編碼工具包括基于 4(4塊的幀內預測、1／４象素運動(dòng)補償、整數變換與量化、上下文自適應VLC以及高度簡(jiǎn)化的環(huán)路濾波器。與H.264基本規范相似AVS-M中的運動(dòng)矢量塊大小降至4(4，因此MB可擁有多達16個(gè)運動(dòng)矢量。采用多幀預測，但僅支持2個(gè)參考幀。此外，AVS-M中還定義了H.264 HRD／SEI消息的子集。AVS-M的編碼頻率約為0.3dB，在相同設置下稍遜于H.264基本規范，而解碼器的復雜性卻降低了大約20％。

H.264和AVS的背景

H.264/MPEG-4AVC是ITU-T的VCG（Video Coding Experts Group）和ISO/IEC的MPEG(Moving Picture Experts Group)聯(lián)合開(kāi)發(fā)的新一代視頻編碼標準。應用范圍包括可視電話(huà)、視頻會(huì )議等。H.264的主要特色就是極大得提高了壓縮率，是MPEG-2及 MPEG-4壓縮效率的一倍以上。H.264核心技術(shù)與之前標準相同，仍采用基于預測變換的混合編碼框架，但是在細節的實(shí)現上有很大不同，就是細節上的改進(jìn)導致壓縮效率極大得提高。而且新一代視頻編碼標準H.264具有良好的網(wǎng)絡(luò )適應性和容錯等特點(diǎn)。

AVS的誕生可以說(shuō)是一個(gè)歷史的機遇，面對H.264以及MPEG-2等標準高額的專(zhuān)利費，我國數字視頻產(chǎn)業(yè)面臨嚴重挑戰。加上我國致力于提高國內數字音視頻產(chǎn)業(yè)的核心競爭力，由國家信息產(chǎn)業(yè)部科學(xué)技術(shù)司于2006年6月批準成立了“數字音視頻編解碼技術(shù)標準工作組”，聯(lián)合國內從事數字音視頻編解碼技術(shù)研發(fā)的科研機構和企業(yè)，針對我國音視頻產(chǎn)業(yè)的需求，提出了我國自主知識產(chǎn)權的信源編碼標準―――《信息技術(shù)先進(jìn)音視頻編碼》系列標準，簡(jiǎn)稱(chēng)AVS(audio video coding standard).自主的AVS標準在技術(shù)和性能上處于國際先進(jìn)水平，如果抓住這次機遇，我國在技術(shù)－專(zhuān)利－標準－芯片－系統－產(chǎn)業(yè)這個(gè)產(chǎn)業(yè)鏈上，就有可能具有全面的主動(dòng)權。

H.264和AVS核心技術(shù)分析及對比

H.264和以前的標準一樣，還是采用的混合編碼的框架，AVS視頻標準采用了與H.264類(lèi)似的技術(shù)框架，包括變換、量化、熵編碼、幀內預測、幀間預測、環(huán)路濾波等模塊。他們核心技術(shù)的不同包括以下幾點(diǎn)：

一、變換和量化

H.264對殘差數據采用基于塊的變換編碼，去除原始圖像的空間冗余，使圖像能力集中在小部分系數上，直流系數值一般來(lái)說(shuō)是最大的，這樣可以提高壓縮比、增強抗干擾能力。先前標準一般采用DCT變換，這種變換的缺點(diǎn)是會(huì )出現失配現象，原始數據經(jīng)過(guò)變換和反變換恢復后會(huì )有一個(gè)差值，由于是實(shí)數運算計算量也比較大。H.264采用的是基于4×4塊的整數變換。

AVS采用8×8的整數變換，可以在16位處理器上無(wú)失配地實(shí)現。對高分辨率的視頻圖像去相關(guān)性要比4×4變換有效，采用了64級量化，可以適應不同的應用和業(yè)務(wù)對碼流和質(zhì)量的要求。

二、幀內預測

H.264和AVS技術(shù)都采用幀內預測的方式，用相鄰的像素預測當前塊，采用代表空間域紋理的多種預測模式。H.264的亮度預測有4×4塊和 16×16塊2種預測方式，對于4×4的塊：從－135度到＋22.5度方向加上一個(gè)直流預測一共是9種預測方向；對于16×16塊：有4種預測方向。色度預測是8×8塊，有4種預測模式，類(lèi)似于幀內16×16預測的4種模式，其中DC為模式0、水平為模式1、垂直為模式2、平面為模式3。

三、幀間預測

H.264幀間預測是利用以編碼視頻幀和基于塊的運動(dòng)補償的預測模式，與以往標準幀間預測的區別在于塊尺寸范圍更廣、亞像素運動(dòng)矢量的使用和多參考幀的運用。

H.264有16×16、16×8、8×16、8×8、8×4、4×8和4×4一共8種宏塊及子宏塊劃分，而AVS只有16×16、16×8、8×16和8×8一共4種宏塊劃分方式。

H.264支持使用多個(gè)不同的參考幀對幀間宏塊和片進(jìn)行預測，AVS中P幀可以利用至多2幀的前向參考幀，B幀采用前后各一個(gè)參考幀。

四、熵編碼

H.264制定了基于信息量的熵編碼效率，一種是對所有的待編碼的符號采用統一的可變長(cháng)編碼（UVLC），另一種是采用基于內容的自適應二進(jìn)制算術(shù)編碼（CABAC, Context-Adaptive Binary Arithmetic Coding），大大減少了塊編碼相關(guān)性冗余，提高了編碼效率。UVLC計算復雜度較低，主要針對對編碼時(shí)間很?chē)栏竦膽�，缺點(diǎn)就是效率低，碼率較高。 CABAC是一種效率很高的熵編碼方法，其編碼效率比UVLC編碼高50%。

AVS熵編碼采用自適應變長(cháng)編碼技術(shù)。在A(yíng)VS熵編碼過(guò)程中，所有的語(yǔ)法元素和殘差數據都是以指數哥倫布碼的形式映射成二進(jìn)制比特流。

采用指數哥倫布碼的優(yōu)勢在于：一方面，它的硬件復雜度比較低，可以根據閉合公式解析碼子，無(wú)需查表；另一方面，它可以根據編碼元素的概率分布靈活地確定以K階指數哥倫布碼編碼，如果K選得恰當，則編碼效率可以逼近信息熵。

對預測殘差的塊變換系數，經(jīng)掃描形成（level、run）對串，level、run不是獨立事件，而存在著(zhù)很強的相關(guān)性，在A(yíng)VS中level、run采用二維聯(lián)合編碼，并根據當前l(fā)evel、run的不同概率分布趨勢，自適應改變指數哥倫布碼的階數。

另外，在A(yíng)VS中沒(méi)有SI、SP幀�？梢赃@樣說(shuō)，AVS是在H.264的基礎上發(fā)展起來(lái)的，吸收了H.264的精華，但為了繞過(guò)專(zhuān)利的困擾，又不得不放棄H.264的一些核心算法。換來(lái)的代價(jià)就是，編碼效率稍微降低一點(diǎn)的情況下，復雜度極大得降低了。

AVS是我國自主知識產(chǎn)權的標準，現在還沒(méi)有大規模使用，處在起步階段。大多數企業(yè)處于觀(guān)望狀態(tài)，沒(méi)有資金大量投入，面臨重重困難，但是它的廣闊前景是不容忽視的，又有國家的大力支持，一定會(huì )發(fā)展的更加完美。

本文地址：http://selenalain.com/thread-29769-1-1.html 【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問(wèn)題，我們將根據著(zhù)作權人的要求，第一時(shí)間更正或刪除。

相關(guān)文章

網(wǎng)友評論

貿澤電子有獎問(wèn)答視頻，答對領(lǐng)10元微信紅包

廠(chǎng)商推薦

相關(guān)在線(xiàn)工具

相關(guān)視頻

關(guān)于我們 - 服務(wù)條款 - 使用指南 - 站點(diǎn)地圖 - 友情鏈接 - 聯(lián)系我們
電子工程網(wǎng) © 版權所有京ICP備16069177號 | 京公網(wǎng)安備11010502021702

快速回復 返回頂部 返回列表

午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页