1、引言 IPTV業(yè)務(wù)是指基于寬帶互聯(lián)網(wǎng)與寬帶接入,以機頂盒或其它具有視頻編解碼能力的數字化設備作為終端,通過(guò)聚合SP的各種流媒體服務(wù)內容和增值應用,為用戶(hù)提供多種互動(dòng)多媒體服務(wù)的寬帶增值業(yè)務(wù)。 IPTV能否成功開(kāi)展的一個(gè)關(guān)鍵點(diǎn)是采用什么樣的視頻編解碼標準,因為IPTV業(yè)務(wù)需要在有限的網(wǎng)絡(luò )帶寬條件下提供清晰的圖像質(zhì)量,對編碼效率有較高的要求;同時(shí),視頻編碼標準的選擇會(huì )直接影響到整個(gè)IPTV產(chǎn)業(yè)鏈的發(fā)展,涉及從內容編碼到流媒體服務(wù)器以及組播復制點(diǎn)直至用戶(hù)機頂盒各個(gè)層面,要從某一種編碼格式轉換為另一種編碼格式,需要進(jìn)行的系統升級甚至硬件更換的成本是極其巨大的。也正因為這一點(diǎn),視頻編碼標準的選擇一直是IPTV業(yè)界關(guān)注的首要問(wèn)題。 2、視頻編解碼標準簡(jiǎn)介 視頻編解碼標準有很多種,目前國內IPTV產(chǎn)業(yè)中主要采用了MPEG-4、H.264技術(shù)以及中國提出的具有自主知識產(chǎn)權的標準AVS這3種標準,相對于H.264和AVS技術(shù)標準,MPEG4 ASP在流媒體和IPTV應用市場(chǎng)中起步時(shí)間最早,因此產(chǎn)業(yè)化程度最成熟,IPTV設備提供商的支持也最廣泛;AVS的產(chǎn)業(yè)化程度最低,H.264次之。下面對這3種標準進(jìn)行介紹。 2.1 MPEG-4標準簡(jiǎn)介 運動(dòng)圖像專(zhuān)家組(MPEG)于1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底公布了MPEG-4第 2版,且于2000年年初正式成為國際標準。MPEG-4與MPEG-1和MPEG-2有著(zhù)很大的差異,MPEG-4不只是具體壓縮算法,它是針對數字電視、交互式繪圖應用、交互式多媒體等整合及壓縮技術(shù)的需求而制定的國際標準。 MPEG-4除采用第一代視頻編碼的核心技術(shù),如變換編碼、運動(dòng)估計與運動(dòng)補償、量化、熵編碼外,還提出了一些有創(chuàng )見(jiàn)性的關(guān)鍵技術(shù),其中包括: (1)視頻對象提取技術(shù) MPEG-4標準同以前標準的最顯著(zhù)的差別在于它是采用基于對象的編碼理念,即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后再經(jīng)過(guò)復用傳輸到接收端,然后再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣可以實(shí)現對不同的對象采用不同的編碼方法和表示方法,又有利于不同數據類(lèi)型間的融合,同時(shí)也便于對各種對象進(jìn)行操作及編輯。視頻對象提。匆曨l對象分割)是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。 (2)VOP視頻編碼技術(shù) 視頻對象平面(VOP,Video Object Plane)是視頻對象(VO)在某一時(shí)刻的采樣,VOP是MPEG-4視頻編碼的核心概念。MPEG-4在編碼過(guò)程中針對不同VO采用不同的編碼策略,即對前景VO的壓縮編碼盡可能保留細節和平滑;對背景VO則采用高壓縮率的編碼策略,甚至不予傳輸而在解碼端由其他背景拼接而成。這種基于對象的視頻編碼不僅克服了第一代視頻編碼中高壓縮率編碼所產(chǎn)生的方塊效應,而且使用戶(hù)可與場(chǎng)景交互,從而既提高了壓縮比,又實(shí)現了基于內容的交互,為視頻編碼提供了廣闊的發(fā)展空間。MPEG-4支持任意形狀圖像與視頻的編解碼。 (3)視頻編碼可分級性技術(shù) MPEG-4通過(guò)視頻對象層(VOL,Video Object Layer)數據結構來(lái)實(shí)現分級編碼。MPEG-4提供了兩種基本分級工具,即時(shí)域分級(Temporal Scalability)和空域分級(Spatial Scalability),此外還支持時(shí)域和空域的混合分級。每一種分級編碼都至少有兩層VOL,低層稱(chēng)為基本層,高層稱(chēng)為增強層;緦犹峁┝艘曨l序列的基本信息,增強層提供了視頻序列更高的分辨率和細節。 (4)運動(dòng)估計與運動(dòng)補償技術(shù) MPEG-4采用I-VOP、P-VOP、B-VOP3種幀格式來(lái)表征不同的運動(dòng)補償類(lèi)型。它采用了H.263中的半像素搜索技術(shù)和重疊運動(dòng)補償技術(shù),同時(shí)又引入重復填充(repetitive padding)技術(shù)和修改的塊匹配(modified block matching)技術(shù)以支持任意形狀的VOP區域。 在MPEG-4視頻編碼中,運動(dòng)估計相當耗時(shí),對編碼的實(shí)時(shí)性影響很大。因此這里特別強調快速算法。運動(dòng)估計方法主要有像素遞歸法和塊匹配法兩大類(lèi),前者復雜度很高,實(shí)際中應用較少,后者則在H.263和MPEG中廣泛采用。 2.2 H.264標準簡(jiǎn)介 2003年,ITU-T通過(guò)了一個(gè)新的數字視頻編解碼標準,即H.264標準,H.264是由ISO/IEC與ITU-T組成的聯(lián)合視頻組制定的新一代視頻壓縮編解碼標準。國際電信聯(lián)盟將該系統命名為H.264/AVC,國際標準化組織和國際電工委員會(huì )將其稱(chēng)為14496-10/MPEG-4 AVC。 H.264標準只有3個(gè)子集:基本子集、主體子集和擴展子集;咀蛹菍(zhuān)為視頻會(huì )議應用設計的,能夠提供強大的差錯隱消技術(shù),并且支持低延時(shí)編/解碼技術(shù),使視頻會(huì )議顯得更自然。主體子集和擴展子集更適合于電視應用(數字廣播、DVD)和延時(shí)影響不會(huì )太大的視頻流應用。 H.264標準的關(guān)鍵技術(shù)如下: (1)幀內預測編碼 幀內編碼用來(lái)縮減圖像的空間冗余。為了提高H.264幀內編碼的效率,在給定幀中充分利用相鄰宏塊的空間相關(guān)性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時(shí),首先可以根據周?chē)暮陦K預測,然后對預測值與實(shí)際值的差值進(jìn)行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。H.264提供6種模式進(jìn)行4×4像素宏塊預測,包括1種直流預測和5種方向預測,H.264也支持16×16的幀內編碼。 (2)幀間預測編碼 幀間預測編碼利用連續幀中的時(shí)間冗余來(lái)進(jìn)行運動(dòng)估計和補償。H.264的運動(dòng)補償支持以往的視頻編碼標準中的大部分關(guān)鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀——SP幀,碼流中包含SP幀后,能在有類(lèi)似內容但有不同碼率的碼流之間快速切換,同時(shí)支持隨機接入和快速回放模式。 (3)整數變換 在變換方面,H.264使用了基于4×4像素塊的類(lèi)似于DCT的變換,但使用的是以整數為基礎的空間變換,不存在反變換。與浮點(diǎn)運算相比,整數 DCT變換會(huì )引起一些額外的誤差,但因為DCT變換后的量化也存在量化誤差,與之相比,整數DCT變換引起的量化誤差影響并不大。此外,整數DCT變換還具有減少運算量和復雜度,有利于向定點(diǎn)DSP移植的優(yōu)點(diǎn)。 (4)量化 H.264中可選32種不同的量化步長(cháng),這與H.263中有31個(gè)量化步長(cháng)很相似,但是在H.264中,步長(cháng)是以12.5%的復合率遞進(jìn)的,而不是一個(gè)固定常數。在H.264中,變換系數的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描,大多數情況下使用簡(jiǎn)單的之字形掃描;雙掃描僅用于使用較小量化級的塊內,有助于提高編碼效率。 (5)熵編碼 視頻編碼處理的最后一步就是熵編碼,H.264標準采用的熵編碼有兩種:一種是基于內容的自適應變長(cháng)編碼(CAVLC)與統一的變長(cháng)編碼(UVLC)結合;另一種是基于內容的自適應二進(jìn)制算術(shù)編碼(CABAC)。CAVLC與CABAC根據相臨塊的情況進(jìn)行當前塊的編碼,以達到更好的編碼效率。CABAC比CAVLC壓縮效率高,但要復雜一些。 2.3 AVS標準簡(jiǎn)介 AVS是基于我國創(chuàng )新技術(shù)和部分公開(kāi)技術(shù)的自主標準,AVS標準包括系統、視頻、音頻、數字版權管理等4個(gè)主要技術(shù)標準和一致性測試等支撐標準。2002年在信息產(chǎn)業(yè)部支持下,成立了“數字音視頻編解碼技術(shù)標準”工作組(簡(jiǎn)稱(chēng)AVS工作組),在國內外上百家企業(yè)和科研單位共同參與下,AVS標準制定工作進(jìn)展順利,其中最重要的視頻編碼標準于2005年通過(guò)國家廣電總局測試,2006年1月得到信息產(chǎn)業(yè)部批準,2月國家標準化管理委員會(huì )正式頒布,3月1日起實(shí)施。 AVS視頻編解碼的核心技術(shù)包括:8×8整數變換、量化、幀內預測、1/4精度像素插值、特殊的幀間預測運動(dòng)補償、二維熵編碼等。 (1)變換量化 AVS的8×8變換與量化可以在16位處理器上無(wú)失配地實(shí)現,從而克服了H.264之前所有視頻壓縮編碼國際標準中采用的8×8 DCT變換存在失配的固有問(wèn)題。而H.264所采用的4×4整數變換在高分辨率的視頻圖像上的去相關(guān)性能不及8×8的變換有效。AVS采用了64級量化,可以完全適應不同的應用和業(yè)務(wù)對碼率和質(zhì)量的要求。 (2)幀內預測 AVS的幀內預測技術(shù)沿襲了H.264幀內預測的思路,用相鄰塊的像素預測當前塊,采用代表空間域紋理方向的多種預測模式。但AVS亮度和色度幀內預測都是以8×8塊為單位的。亮度塊采用5種預測模式,色度塊采用4種預測模式,而這4種模式中又有3種和亮度塊的預測模式相同。在編碼質(zhì)量相當的前提下,AVS采用較少的預測模式,使方案更加簡(jiǎn)潔、實(shí)現的復雜度大為降低。 (3)幀間預測 幀間運動(dòng)補償編碼是混合編碼技術(shù)框架中最重要的部分之一。AVS標準采用了16×16,16×8,8×16和8×8的塊模式進(jìn)行運動(dòng)補償,而去除了H.264標準中的8×4,4×8,4×4的塊模式,目的是能更好地刻畫(huà)物體運動(dòng),提高運動(dòng)搜索的準確性。較少的塊模式,能降低運動(dòng)矢量和塊模式傳輸的開(kāi)銷(xiāo),從而提高壓縮效率、降低編解碼實(shí)現的復雜度。 (4)熵編碼 AVS熵編碼采用自適應變長(cháng)編碼技術(shù),在A(yíng)VS熵編碼過(guò)程中,所有的語(yǔ)法元素和殘差數據都是以指數哥倫布碼的形式映射成二進(jìn)制比特流。采用指數哥倫布碼的優(yōu)勢在于:一方面 ,它的硬件復雜度比較低,可以根據閉合公式解析碼字,無(wú)需查表;另一方面,它可以根據編碼元素的概率分布靈活地確定以k階指數哥倫布碼編碼,如果k選得恰當,則編碼效率可以逼近信息熵。 3、三種編碼標準的對比與選擇 3.1 基本性能對比 3種編碼標準的基本功能對比如表1: 表1 3種視頻編解碼標準的基本功能 這3種主要編碼技術(shù)各有優(yōu)缺點(diǎn),MPEG-4標準因為發(fā)布較早,產(chǎn)業(yè)化程度較高,因此產(chǎn)品相對成熟,內容比較豐富、價(jià)格也較低,同時(shí)算法復雜度較低,但相應的問(wèn)題是編碼效率也相對較低,需要占用較多的帶寬,對網(wǎng)絡(luò )要求較高,對于現有網(wǎng)絡(luò )需要進(jìn)行升級改造才能滿(mǎn)足其需求。 對于H.264標準,目前市場(chǎng)上已經(jīng)有多家廠(chǎng)商提供H.264芯片和機頂盒,產(chǎn)品開(kāi)始成熟,內容也逐漸豐富,而且因為采用了多項提高圖像質(zhì)量和增加壓縮比的技術(shù)措施,在不影響視頻效果的情況下能夠比MPEG-4節約39%的碼率,因而占用帶寬較低。例如要達到標清的播放質(zhì)量,MPEG-4編碼需要1.5~2Mbit/s的碼率,而H.264只需要1.2~1.5Mbit/s碼率即可;對于高清圖像質(zhì)量,MPEG-4編碼的視頻碼率需要 6~8Mbit/s,而H.264只需要4~6Mbit/s。因此采用H.264可以大大節約網(wǎng)絡(luò )帶寬,減少網(wǎng)絡(luò )改造的壓力,且在帶寬相同的情況下能夠覆蓋更多的用戶(hù)。同時(shí),由于H.264是由ITU-T和ISO/IEC聯(lián)合制定的,所以對解碼兼容性有著(zhù)明確的定義,具有較強的抗誤碼能力,容易獲得穩定的圖像,適用于丟包率高、干擾嚴重的信道傳輸。不過(guò)H.264的算法復雜度較高,系統開(kāi)銷(xiāo)也比較大。 AVS是近幾年才提出的視頻標準,產(chǎn)業(yè)化進(jìn)程落后于H.264。但是AVS的編碼效率與H.264相當,而算法復雜度比H.264明顯低,其編碼復雜度相當于H.264的30%;解碼復雜度相當于H.264的70%,軟硬件實(shí)現成本都低于H.264;同時(shí)由于我國掌握主要知識產(chǎn)權,專(zhuān)利授權模式簡(jiǎn)單,專(zhuān)利費用低,因此可以預見(jiàn)AVS標準將會(huì )是支撐國家數字音視頻產(chǎn)業(yè)發(fā)展的重要標準。 3.2 專(zhuān)利費用對比 如果采用國外的技術(shù)標準,不得不面臨高昂的專(zhuān)利費用的問(wèn)題。3種標準對應的專(zhuān)利費用如表2所示: 表2 3種標準的專(zhuān)利費用 可以看出在專(zhuān)利費方面AVS占有絕對的優(yōu)勢。MPEG-4和H.264不僅要收軟硬件的專(zhuān)利費,而且還要收取節目點(diǎn)播費用等,如果按照這兩種標準的專(zhuān)利收費標準,中國龐大用戶(hù)群將給運營(yíng)商帶來(lái)每年數以?xún)|計的巨大專(zhuān)利費負擔;而AVS只收取1元人民幣的象征性費用,對于運營(yíng)商來(lái)講非常具有吸引力。 3.3 應用情況對比 從目前的應用情況來(lái)看,MPEG-4和H.264在中國市場(chǎng)具有一定的發(fā)展優(yōu)勢,在中國電信和中國網(wǎng)通已經(jīng)開(kāi)展的IPTV試驗及商用網(wǎng)中, MPEG4和H.264同時(shí)存在,例如中國電信在上海截止目前已經(jīng)有15萬(wàn)左右的IPTV用戶(hù),使用的是H.264編碼標準;廣東電信的IPTV商用網(wǎng)也將實(shí)現MPEG4向H.264標準的整體平移。中國網(wǎng)通現已開(kāi)展了基于A(yíng)VS標準的IPTV試驗。由于A(yíng)VS推出較晚,還處于上下游產(chǎn)業(yè)鏈的完善階段,在市場(chǎng)的推廣和開(kāi)拓方面還有待加強,真正商用有待驗證其圖像質(zhì)量、商用情況是否滿(mǎn)足商用要求和產(chǎn)業(yè)鏈的逐漸成熟。目前3種標準常見(jiàn)的應用場(chǎng)景列舉如表3: 表3 3種標準的應用場(chǎng)景 3.4 三種編碼標準的選擇 由上面的對比可以看出,3種編碼標準在性能、設備成本、產(chǎn)業(yè)化程度及專(zhuān)利費用方面都各有千秋,具體選擇哪種視頻編碼標準還需綜合考慮各方面因素。對于IPTV產(chǎn)業(yè)來(lái)說(shuō),H.264得到了電信運營(yíng)商及設備提供商的支持,目前已經(jīng)逐漸占據市場(chǎng)主流的地位,而AVS憑借低廉的專(zhuān)利費優(yōu)勢,長(cháng)遠來(lái)說(shuō)對運營(yíng)商更具誘惑力,同時(shí)又得到了中國政府的支持,今后的應用前景將比較樂(lè )觀(guān)。 4、結束語(yǔ) 本文討論了目前國內IPTV產(chǎn)業(yè)中主要采用的3種編碼標準MPEG-4、H.264及AVS。通過(guò)介紹和對比這3種標準,可以看出 H.264/AVS是目前主流的選擇。當然事物都在不斷發(fā)展,音視頻編解碼技術(shù)也處于不斷演進(jìn)的過(guò)程中,因此多種編碼標準在相當長(cháng)的時(shí)間內還將繼續共存。今后的IPTV舞臺上,編碼標準將花落誰(shuí)家,讓我們拭目以待。 |