高清語(yǔ)音技術(shù)及其在手機和藍牙耳機中的實(shí)現

發(fā)布時(shí)間:2011-11-8 11:54    發(fā)布者:李寬
關(guān)鍵詞: 高清語(yǔ)音 , 音頻
作者:CSR公司Jacek Spiewla

高清語(yǔ)音也被稱(chēng)為寬帶語(yǔ)音,是一種能為蜂窩網(wǎng)絡(luò )、移動(dòng)電話(huà)和無(wú)線(xiàn)耳機傳輸高清、自然語(yǔ)音質(zhì)量的音頻技術(shù)。與傳統的窄帶電話(huà)相比,高清語(yǔ)音很大程度上提高了語(yǔ)音質(zhì)量,減少了聽(tīng)覺(jué)負擔。

通信產(chǎn)業(yè)鏈上的所有網(wǎng)絡(luò )和設備都需支持高清語(yǔ)音才能體現出該技術(shù)的優(yōu)點(diǎn)。到2011年6月為止,18個(gè)國家運營(yíng)的20種蜂窩網(wǎng)絡(luò ),以及33家領(lǐng)先的手機品牌都已支持高清語(yǔ)音。通過(guò)部署自適應多速率寬帶(AMR-WB)語(yǔ)音編碼,GSM, WCDMA(UMTS)和LTE蜂窩網(wǎng)絡(luò )中已經(jīng)引入了高清語(yǔ)音。此外, 通過(guò)使用改良的子帶編碼(mSBC)語(yǔ)音編解碼技術(shù),無(wú)線(xiàn)藍牙耳機也開(kāi)始支持高清語(yǔ)音,將免提通話(huà)與高語(yǔ)音質(zhì)量結合在了一起。

高清語(yǔ)音的優(yōu)點(diǎn)同樣可以在現有網(wǎng)絡(luò )中體現出來(lái)。隨著(zhù)窄帶網(wǎng)絡(luò )和設備向高清語(yǔ)音過(guò)渡,一種名為帶寬擴展(BWE)的語(yǔ)音處理技術(shù)可以用來(lái)在接收終端設備上模擬類(lèi)似于高清語(yǔ)音的通話(huà)質(zhì)量,為不支持高清語(yǔ)音的設備提供了一個(gè)折中的解決方案。

從窄帶到高清語(yǔ)音

傳統電話(huà)系統的帶寬被限制在大約300Hz到3.4kHz的音頻頻率范圍內(圖表1),這一范圍通常被稱(chēng)為窄帶語(yǔ)音。盡管現在的電話(huà)系統是數字式的,但其還是傳承了與傳統模擬系統相同的帶寬。從語(yǔ)音質(zhì)量的角度來(lái)看,窄帶語(yǔ)音缺乏自然語(yǔ)音保真度,常常被形容為單薄和模糊不清。盡管如此,窄帶頻率范圍內完整語(yǔ)句的語(yǔ)音辨別度大概是99%。


圖1:窄帶和寬帶語(yǔ)音的帶寬特點(diǎn)。

高清語(yǔ)音在采樣頻率為16kHz時(shí)音頻帶寬大約為50Hz至7kHz,因此與窄帶語(yǔ)音相比具有更清晰的語(yǔ)音信號。雖然寬帶語(yǔ)音并沒(méi)有顯著(zhù)提高語(yǔ)音清晰度,但是窄帶范圍之外的3.4kHz至7kHz提高了單詞中的摩擦音(例如f、s和th) 的識別度。寬帶語(yǔ)音能夠提供更加自然真實(shí)的語(yǔ)音,在主觀(guān)音頻質(zhì)量方面比窄帶語(yǔ)音有了顯著(zhù)的提高。高清語(yǔ)音擴展出的50Hz至300Hz的低頻降低了窄帶語(yǔ)音尖細的特點(diǎn),而擴展出的高頻則提高了發(fā)音清晰度。

在主觀(guān)語(yǔ)音質(zhì)量聽(tīng)力測試中,寬帶語(yǔ)音在平均意見(jiàn)得分(MOS)中得到4.5分,而窄帶語(yǔ)音則為3.2分(1分為質(zhì)量差,5分為優(yōu)秀)。寬帶語(yǔ)音質(zhì)量的提高減少了聽(tīng)力負擔和聽(tīng)者的疲勞,特別是當聽(tīng)者處于嘈雜的環(huán)境下。移動(dòng)網(wǎng)絡(luò )運營(yíng)商O(píng)range在其網(wǎng)站上提供了一個(gè)音頻樣本作為高清語(yǔ)音優(yōu)點(diǎn)的例證。2010年6月Orange公司所做的另一項調查進(jìn)一步向終端用戶(hù)證明了高清語(yǔ)音的價(jià)值:

* 96%的客戶(hù)對高清語(yǔ)音通話(huà)表示滿(mǎn)意;

* 86%的測試者表示,兼容高清語(yǔ)音將是他們未來(lái)購買(mǎi)手機時(shí)的一個(gè)選擇標準;

* 76%的測試者愿意更換手機以獲得高清語(yǔ)音功能。

此外,2006年愛(ài)立信和T-Mobile進(jìn)行的用戶(hù)試用調查也證實(shí)了高清語(yǔ)音的優(yōu)點(diǎn)。在150個(gè)抽樣用戶(hù)中,超過(guò)70%的人認為使用了高清語(yǔ)音手機后通話(huà)質(zhì)量更好,在嘈雜的環(huán)境中對話(huà)質(zhì)量有所提高。

使用高清語(yǔ)音需要語(yǔ)音通信系統中的所有環(huán)節都支持寬帶語(yǔ)音頻率范圍(圖2)。采用高清語(yǔ)音技術(shù)的關(guān)鍵是在蜂窩網(wǎng)絡(luò )和手持電話(huà)中協(xié)同部署AMR-WB編解碼。做為一種寬帶語(yǔ)音編碼,AMR-WB的有效音頻帶寬是窄帶編碼AMR-NB的兩倍。要完成一個(gè)高清語(yǔ)音通話(huà),基站和手持電話(huà)之間協(xié)同傳輸以AMR-WB編碼的語(yǔ)音,在這一過(guò)程中沒(méi)有進(jìn)行語(yǔ)音修改或從終端到終端的轉換編碼。如果高清語(yǔ)音連接無(wú)法實(shí)現,系統就會(huì )取而代之使用窄帶AMR-NB編碼。


圖2:寬帶語(yǔ)音編解碼在一個(gè)簡(jiǎn)單的端到端無(wú)線(xiàn)語(yǔ)音通信系統中的應用。

擴展語(yǔ)音帶寬

可以預計,在引入高清語(yǔ)音的過(guò)程中,通信系統中的某些環(huán)節會(huì )因無(wú)法支持而將語(yǔ)音轉換為窄帶頻率,這實(shí)際上是在降低語(yǔ)音質(zhì)量,增加聽(tīng)力負擔。人工帶寬擴展(BWE)通過(guò)在通信系統的終端環(huán)節為窄帶語(yǔ)音信號加入人工生成的語(yǔ)音內容,彌補在傳輸過(guò)程中損失的高頻和低頻語(yǔ)音內容(圖3)。通過(guò)這種方法,BWE將高清語(yǔ)音的優(yōu)勢拓展到了窄帶和過(guò)渡的混合帶寬的語(yǔ)音通信系統中。


圖3:藍牙耳機通信系統中的人工帶寬擴展(BWE)。

BWE算法使用產(chǎn)生語(yǔ)音的聲源過(guò)濾模型來(lái)估算和產(chǎn)生擴展頻率范圍內的語(yǔ)音內容。根據該模型,語(yǔ)音是由一個(gè)聲源(例如聲帶)再加上一個(gè)模擬聲道的模型產(chǎn)生的。BWE算法根據窄帶語(yǔ)音估算出一個(gè)寬帶聲源模型,然后利用該模型的參數估算出其丟失的寬帶頻率內容。在實(shí)際應用中,BWE獨立于源編碼和發(fā)送路徑處理過(guò)程的,因此它可以與傳統的窄帶和混合帶寬的電話(huà)網(wǎng)絡(luò )共存。

BWE主要應用于藍牙耳機和免提設備。在這些設備的接收終端上,窄帶CVSD編碼語(yǔ)音信號首先進(jìn)行解碼,然后經(jīng)過(guò)BWE的處理產(chǎn)生給受話(huà)方的擴展帶寬語(yǔ)音信號。BWE也可以應用在高清語(yǔ)音電話(huà)網(wǎng)絡(luò )上,將語(yǔ)音信號擴展到帶寬為14kHz的超寬帶(SWB)頻率范圍。

高清語(yǔ)音和音效增強

將高清語(yǔ)音和音效增強處理方法(如噪聲抑制(NS),回聲消除(AEC) )結合在一起可以改善在噪聲環(huán)境下的語(yǔ)音清晰度,并可以提高整體通話(huà)質(zhì)量。噪聲抑制技術(shù)能夠分析摻雜了噪音的對話(huà),并清除噪音,增加語(yǔ)音辨別度。噪聲抑制算法通過(guò)大量頻點(diǎn)估算出噪聲功率譜密度,然后將噪聲從對話(huà)出抽取出來(lái)。與窄帶的處理相比,寬帶噪聲抑制在計算噪聲頻譜時(shí)包含了更多的頻點(diǎn)數據來(lái)壓縮擴展頻率范圍內的噪聲。除噪聲抑制外,回聲消除處理方法能消除發(fā)話(huà)者和麥克風(fēng)之間的聲音耦合所產(chǎn)生的回音信號;芈曄墓ぷ髟硎菑柠溈孙L(fēng)接收到的信號中分離出一個(gè)經(jīng)過(guò)過(guò)濾和延遲的副本;芈曄夹g(shù)能夠計算出寬帶語(yǔ)音中的自適應過(guò)濾系數。

藍牙耳機中的高清語(yǔ)音

由于當前藍牙耳機已經(jīng)成為免提移動(dòng)通話(huà)的流行配置,因此它們能夠兼容高清語(yǔ)音是十分重要的。這一功能已經(jīng)通過(guò)藍牙mSBC語(yǔ)音編解碼器變?yōu)楝F實(shí)。

藍牙高級音頻分發(fā)模型(A2DP)規定使用子帶編碼(SBC)為強制音頻編解碼系統,以保證手持電話(huà)和耳機間的互操作性。SBC是一種低復雜度的編解碼技術(shù),壓縮比率適中,支持16kHz, 32kHz, 44.1kHz和48kHz的采樣率,也因此成為藍牙高清語(yǔ)音的當然之選。對于16kHz的寬帶語(yǔ)音而言,SBC能以64kbps數據速率對其進(jìn)行4:1的壓縮。但是,當SBC編碼幀通過(guò)藍牙傳輸時(shí),它可能與底層藍牙數據包不相匹配。因此,mSBC編解碼技術(shù)被開(kāi)發(fā)用于匹配SBC和藍牙數據包,并于2011年5月被定義為 Bluetooth Hands-Free Profile 1.6中的強制編解碼方式。

在編解碼性能方面,mSBC可與ITU-T G.722相媲美,這一寬帶語(yǔ)音編解碼系統通常被用來(lái)作為新編解碼系統的質(zhì)量評判參考。一般來(lái)說(shuō),mSBC在無(wú)差錯語(yǔ)音信號方面的客觀(guān)音頻質(zhì)量得分比G.722更高。mSBC編碼系統也在多重編碼/解碼通道方面保持了比G.722更高的平均語(yǔ)音質(zhì)量水平。

小結

與傳統窄帶語(yǔ)音傳輸相比,高清語(yǔ)音提供了十分優(yōu)秀的語(yǔ)音質(zhì)量,減少了在嘈雜環(huán)境中的聽(tīng)力負擔。在聽(tīng)力測試和用戶(hù)試用中,高清語(yǔ)音都表現出了顯著(zhù)優(yōu)勢?梢酝ㄟ^(guò)在蜂窩網(wǎng)絡(luò )和手持電話(huà)中部署AMR-WB語(yǔ)音編解碼系統、在藍牙耳機中部署mSBC語(yǔ)音編解碼系統來(lái)實(shí)現高清語(yǔ)音。此外,手持電話(huà)和耳機中采用噪聲抑制和回音消除等語(yǔ)音處理算法能夠使高清語(yǔ)音體驗更佳。隨著(zhù)網(wǎng)絡(luò )運營(yíng)商和設備生產(chǎn)商逐漸將高清語(yǔ)音引入消費市場(chǎng),藍牙耳機上的帶寬擴展處理方法能夠將高清語(yǔ)音的優(yōu)點(diǎn)帶給窄帶和混合帶寬的蜂窩網(wǎng)絡(luò )用戶(hù)。
本文地址:http://selenalain.com/thread-78931-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页