Linux下ColdFire 片內SRAM的應用程序優(yōu)化設計

發(fā)布時(shí)間:2010-1-27 15:49    發(fā)布者:李寬
關(guān)鍵詞: ColdFire , linux , SRAM , 設計 , 應用程序
本文以MP3解碼器為例,介紹了一種在嵌入式Linux系統下配置使用處理器片內SRAM的應用方案,有效提高了代碼的解碼效率,降低了執行功耗。該方案不論在性能還是成本上都得到了很大改善。

1 硬件平臺和軟件架構

硬件平臺采用Freescale公司的MCF5329EVB開(kāi)發(fā)板。終端硬件包括ColdFire5329處理器、32 KB的片內SRAM、1 800×600矩陣LCD顯示屏、9×3陣列矩陣鍵盤(pán)、I2S音頻解碼芯片、64 MB的SDRAM、10/100M以太網(wǎng)接口,以及3個(gè)UART接口。軟件構架如圖1所示,主要包括MP3解碼器、音頻驅動(dòng)、鍵盤(pán)驅動(dòng)和用戶(hù)圖形界面 (GUI)等模塊。采用μClinux作為操作系統。μClinux針對嵌入式應用的特點(diǎn)作了較大的簡(jiǎn)化和修改,支持多種文件系統和多任務(wù)處理,而且具有相對完整的網(wǎng)絡(luò )體系協(xié)議,因而特別適合嵌入式應用。



2 MP3解碼算法分析

本文選用MP3解碼程序作為方案驗證代碼。MPEG-1/2 Audio Layer 3是專(zhuān)門(mén)針對音樂(lè )和語(yǔ)音數據設計的有損壓縮算法。該算法的解碼過(guò)程比較復雜,主要包括反向修正離散余弦變換(IMDCT)、逆量化、Huffman解碼、子帶綜合等功能模塊。讀入一段MP3數據后,首先要檢測數據流中的同步字,以確定一幀數據的開(kāi)始;然后提取幀頭信息,特別是解碼所需要的一些參數,同時(shí)分離出幀邊信息和主數據;之后對邊信息數據解碼得到Huffman解碼信息和逆量化信息,再經(jīng)過(guò)重新排序、立體聲處理、反混疊處理、IMDCT變換和子帶綜合濾波器組后,就可以得到PCM輸出。



MP3解碼流程如圖2所示。大致分為兩個(gè)階段,即數據流控制階段和數值計算階段。數據流控制階段包括幀同步、邊帶信息解碼和Huffman解壓縮等過(guò)程。其中,Huffman解壓縮是對編碼數據進(jìn)行操作,其他過(guò)程則是對幀控制部分進(jìn)行操作。

3 基于片內SRAM的優(yōu)化設計方案

3.1 方案分析

SRAM指令執行速度要比DRAM快得多。Cold-Fire5329處理器內部集成了32 KB的SRAM,本設計方案將充分利用處理器片內SRAM來(lái)對解碼程序進(jìn)行優(yōu)化。首先對源代碼中的主要解碼函數進(jìn)行分析,如表1所列?梢钥吹津寗(dòng)寫(xiě)函數 (write)、子帶綜合(MPEGSUB_synthesis)、反向修正離散余弦變換(imdct_I)和快速離散余弦變換(fast_dct)對處理器資源消耗較大,幾乎占用80%的解碼時(shí)間。根據分析結果,分別把音頻驅動(dòng)程序和上述解碼函數放進(jìn)SRAM中執行,以提高流媒體解碼器的執行速度,降低其對處理器資源的消耗。



3.2 配置音頻驅動(dòng)程序到片內SRAM中執行

Linux操作系統把內核和運行在其上的應用程序分成兩個(gè)管理層次,也就是常說(shuō)的“內核態(tài)”和“用戶(hù)態(tài)”。內核態(tài)具有較高的應用權限,可以控制處理器內存的映射和分配方式。音頻驅動(dòng)程序是系統內核的重要組成部分,工作在內核態(tài),實(shí)現不斷從用戶(hù)空間解碼文件中讀取音頻信息,以及驅動(dòng)音頻芯片播放聲音等相關(guān)功能。通過(guò)修改μClinux-2.6內核代碼,可以將音頻驅動(dòng)程序配置到片內SRAM中執行,主要通過(guò)修改系統鏈接文件來(lái)實(shí)現。系統鏈接文件用于將輸入文件根據一定的規則合并成一個(gè)輸出文件,并對符號與地址進(jìn)行綁定。

為了在修改內核代碼的同時(shí)不影響系統其他文件的正常運行,要在內核鏈接腳本中添加新的段區定義(.sramcode),指定該段區鏈接加載地址為處理器片內SRAM,并在.sramcode段區內定義代碼段(.sramtext)和數據段(.sramdata),分別用于存儲驅動(dòng)中的代碼和數據。對齊方式采用ALIGN(4),因為對32位微處理器來(lái)說(shuō),該對齊方式將有效減少處理器執行周期,提高執行效率。然后,使用2個(gè)指針 _lsramcode和_lsramcodeend分別指向,sramcode段區的段首和段尾,具體實(shí)現如下:




完成對操作系統鏈接文件的修改之后,使用宏定義在音頻驅動(dòng)程序中把相關(guān)函數和數據分別指定鏈接到,sramcode代碼段和數據段,并由 copy函數把相關(guān)函數復制到SRAM中執行。編譯、鏈接完成后,可以在系統內核存儲映射文件Sys-tem.map中查看驅動(dòng)函數和數據在內存中的地址。圖3顯示了音頻驅動(dòng)函數在處理器片內SRAM中的映射地址。



3.3 配置實(shí)時(shí)數據和函數到片內SRAM中執行

把用戶(hù)空間的實(shí)時(shí)數據和函數放置到片內SRAM中執行,由于處理器可以直接從片內SRAM中存取數據和指令,減少了處理器存取數據和指令的周期,提高了程序的執行效率。首先,放置實(shí)時(shí)數據到處理器片內SRAM中。通過(guò)S_malloc和S_free函數來(lái)實(shí)現:S_malloc用來(lái)申請處理器內存空間,S_free用來(lái)對這一申請的空間進(jìn)行釋放。為了靈活使用定義的S_malloc和S_free函數,需要定義一個(gè)結構體和地址指針:



然后,通過(guò)動(dòng)態(tài)內存分配方式可以把MP3解碼程序中的實(shí)時(shí)數據放入處理器內存中執行。加載函數到SRAM中與加載實(shí)時(shí)數據不同,需要通過(guò)指針和枚舉變量來(lái)實(shí)現。首先通過(guò)一個(gè)宏定義設置每個(gè)函數大小為4 KB,并使用枚舉變量為函數分配處理器片內SRAM執行的起始地址。



SRAMFUNC2=SRAM_BIG_FUNC1+BIG_FUNC_SIZE,…};

在定義完函數運行時(shí)加載的存儲地址之后,把MP3解碼程序中的MPEGSUB_synthesis和imdct_1等函數通過(guò)字符串拷貝的方式復制到處理器片內SRAM中執行,經(jīng)過(guò)編譯、鏈接這些函數在執行時(shí)將會(huì )加載到相應的SRAM單元塊中。這樣就減少了處理器執行解碼函數所需的時(shí)間,提高了程序的執行效率。

4 性能測試與分析

為了驗證基于處理器片內SRAM的優(yōu)化設計方案,我們在MCF5329EVB開(kāi)發(fā)板上對經(jīng)該方案優(yōu)化過(guò)的MP3解碼器進(jìn)行了驗證和測試。

首先,進(jìn)行功能測試,應用MPEG組織推薦的測試碼流(128 kb/s,44.1 kHz)。選用一段音頻test.mp3,分別用標準浮點(diǎn)解碼器和本文設計的音頻解碼器進(jìn)行本地解碼測試,并對其解碼波形進(jìn)行比較分析。從圖4的波形比較可以看到,經(jīng)過(guò)本方案優(yōu)化設計的解碼器解碼波形與標準浮點(diǎn)解碼器基本無(wú)差別。經(jīng)人耳測試,無(wú)法辨別出兩者解碼輸出的差別。所以,從功能上講本文設計的基于片內SRAM的應用程序優(yōu)化方案是可行的。



其次,進(jìn)行性能測試。在測試平臺上分別對優(yōu)化前后解碼器的MIPS消耗數和空間消耗量進(jìn)行比較分析,如表2所列。



優(yōu)化前,解碼器MIPS消耗數為68 MIPS@240MHz;優(yōu)化后,解碼器MIPS消耗數為39.2 MIPS@240 MHz。在硬件條件允許的情況下,消耗的內存雖然有一定的增加,但是經(jīng)過(guò)本文方案優(yōu)化后,解碼效率得到了很大的提高。

結語(yǔ)

本文提出了在嵌入式Linux操作系統下基于處理器片內SRAM的應用程序優(yōu)化設計方案。以MP3解碼器為例,通過(guò)從配置音頻驅動(dòng)程序、實(shí)時(shí)數據和函數到處理器片內SRAM中執行來(lái)對解碼器進(jìn)行優(yōu)化設計,并在ColdFire5329開(kāi)發(fā)平臺上成功實(shí)現該方案。優(yōu)化后的MP3播放器不僅解碼效率高,而且音質(zhì)好,完全可以在中低端處理器上實(shí)現實(shí)時(shí)播放,使低性能CPU處理復雜應用程序成為可能。該方案有效地提高了應用程序的執行效率,降低了功耗,對嵌入式Linux應用產(chǎn)品開(kāi)發(fā)有著(zhù)重要參考價(jià)值。

參考文獻

1. MCF5329 ColdFire Integrated Microcontroller Reference Manual[DB/OL].[2009-06].http://www.freescale.com.cn.
2. MCF5329-10 Fire Engine Hardware Specification[DB/OL].[2009-06].http://www.freescale.com.cn/.
3. 韋東山.嵌入式Linux應用開(kāi)發(fā)完全手冊[M].北京:人民郵電出版社,2008.
4. Benix Samuel,Jhunwala.Real time implementation and optimization of MP3 decoder on DSP[C].Electrical and Computer Conference,Canadian,2008:699-702.
5. 葉曉舟,鄧峰.基于定點(diǎn)DSP的MP3解碼算法優(yōu)化與實(shí)現[J].計算機工程與應用,2007(23):94-96.

作者:電子科技大學(xué) 聶飛 閻波 郭志勇  來(lái)源:《單片機與嵌入式系統應用》 2009(11)
本文地址:http://selenalain.com/thread-8060-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)在線(xiàn)工具

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页