μC/OS-Ⅱ就緒表算法在A(yíng)RM架構上的改動(dòng)

發(fā)布時(shí)間:2010-3-24 12:36    發(fā)布者:李寬
關(guān)鍵詞: arm , 架構 , 就緒 , 算法
引言

μc/Os-Ⅱ的就緒表設置、清除、查找算法,是高效的、跨平臺的程序。它使用了兩個(gè)查找數組OSMapTbl[8]和 OSUnMapTbl[256],以提高查找就緒表的速度,盡快獲取就緒任務(wù)的最高優(yōu)先級。

Cortex-M3是ARM公司較新的一種架構版本,主要應用在單片機領(lǐng)域;谒a(chǎn)的32位芯片日益增多;cortex-M3只支持Thumb-2指令集,在效能和代碼密度間能取得更佳的表現。

1 在A(yíng)RM上改動(dòng)算法的因由利弊

由于就緒表操作是在關(guān)中斷狀態(tài)下運行的,其執行影響到系統的中斷響應時(shí)間,因此就緒表操作算法的效率是衡量實(shí)時(shí)操作系統優(yōu)劣的基準之一。

在Cortex-M3所用的指令集中,一些指令功能不可小覷,如前導零計數clz、字內位反轉rbit、位清除bic。其中的clz和bic為 μc/Os就緒表的高優(yōu)先級獲取算法指出了另一條道路。

(1)改動(dòng)后的優(yōu)勢

①節省存儲空間。不再使用查找數組OSMapTbl[8]和OSUnMapTbl[256]。設立這兩個(gè)數組的目的,是為了提高查找就緒表的效率。

②提升查找效率。clz是單周期指令,使用帶移位的加法指令,大幅縮短運算時(shí)間。

③增加了μc/Os-Ⅱ支持的任務(wù)數量,從64提升到了1 024(2.84版支持的任務(wù)數量已經(jīng)到了256,不過(guò)效率有所下降)。

(2)存在的不足

①Realview MDK(這里使用的是3.20版及其指令模擬器)尚不支持在C語(yǔ)言程序中使用Thumb-2指令內聯(lián)匯編。使用內嵌匯編函數時(shí),函數的調用(跳轉返回)降低了執行效率。

②C語(yǔ)言對clz指令的支持尚有不足,故新算法跨平臺性差。但鑒于A(yíng)RM芯片應用廣泛,指令又被ARM9之后的芯片廣泛兼容,所以應用空間還算廣闊。

2 μc/Os-Ⅱ就緒表算法介紹與具體改動(dòng)

μc/Os-Ⅱ就緒表是一個(gè)數組,數組元素一位的值(1或0)對應了一個(gè)任務(wù)就緒與否,該位在數組中的位置表示任務(wù)的優(yōu)先級。當需要調度已就緒的最高優(yōu)先級任務(wù)運行時(shí),就在就緒表中查找該任務(wù)。

2.1  μc/Os-Ⅱ就緒表算法簡(jiǎn)介

一種解決方法是,對數組各項依次判斷是否為0:若>O,進(jìn)入該項查找最小權的置1位位置;若=0,優(yōu)先級加一個(gè)基數,查下一項,直至查到該優(yōu)先級。




μc/Os-Ⅱ技高一籌,設置了一個(gè)對就緒表各項判斷是否為0的變量,稱(chēng)之為就緒表組。就緒表組一位為0或1,對應就緒表一項的值是否為0。通過(guò)查找就緒表組最小權位的置1位位置,就確定了對應首個(gè)>0的就緒表項的下標,從而避免了循環(huán),大幅度提高了效率。

2.2改動(dòng)方式與源碼

clz算法接受了μc/Os-Ⅱ的思路,再通過(guò)使用clz指令來(lái)進(jìn)行優(yōu)化。不同的是,clz是從右往左查,二進(jìn)制的高權位對應高優(yōu)先級,而 μc/Os-Ⅱ優(yōu)先級以值小為高。

考慮到有時(shí)用不到很多任務(wù),這時(shí)用數組作就緒表不免浪費。因此當任務(wù)總數小于32時(shí),就用32位無(wú)符號整數變量作就緒表。注意,此時(shí)就緒表組變量 OSRdyGrp被當作就緒表使用。

常量OS_LES_TSK表示是否使用較小任務(wù)數,0表示使用最多32個(gè)任務(wù),1表示使用最多1 024個(gè)任務(wù)。

常量RdySt是將32位整數的最高權位置1,以便移位使用。

2.3  C語(yǔ)言實(shí)現

以下算法利用內嵌clz指令的函數編寫(xiě),實(shí)現了指定優(yōu)先級任務(wù)在就緒表的設置、清除,在就緒表中查找就緒任務(wù)的最高優(yōu)先級。

程序中的bx r14,有些資料上要求必須寫(xiě),不過(guò)查看反匯編代碼,編譯程序已經(jīng)給加上了?磥(lái)是編譯程序已升級,會(huì )不會(huì )出錯要看使用的編譯器,建議還是按規范寫(xiě)上。由于內嵌函數調用返回耗時(shí),查找算法未能充分發(fā)揮,需改進(jìn)編譯后的匯編代碼以實(shí)現更高的效率,或使用匯編代碼重寫(xiě)這部分程序。

2.4  THUMB-2匯編指令實(shí)現

用匯編語(yǔ)言寫(xiě)程序時(shí)的技巧:在最高優(yōu)先級任務(wù)的設置、清除函數中,C語(yǔ)言運算符“︱=”對等匯編指令“orr”,“&=~”對等匯編指令“bic。這兩條指令都可以進(jìn)行預移位操作,大幅提高執行效率?梢圆榭捶磪R編源碼,看C編譯器是否利用了這一便利。

在查找函數中,可以省去C語(yǔ)言程序中的內嵌匯編調用,減少冗余指令。示意偽代碼如下:

ldr rO,  =OsRdyGrp;加載就緒表組變量OSRdyGrp地址



可以看出,除了數據加載指令外,查找的核心算法僅3條指令(使用<32個(gè)任務(wù)時(shí),僅1條指令)。不過(guò)在實(shí)際設計算法的時(shí)候,還需要考慮指令流水線(xiàn)停頓,方能達到最佳的效果。

2.5  μC/OS-Ⅱ2.84版相關(guān)源碼介紹

以下是翻譯整理后的μC/OS-Ⅱ優(yōu)先級查找算法源碼(2.84版),較長(cháng)的注釋是添加的算法說(shuō)明。




clz最高優(yōu)先級查找算法,與μC/OS-Ⅱ的新算法有所不同:返回的結果分別是8位、16位整數。這是因為8位已經(jīng)不能表示>255的值;過(guò)程中clz算法更多地使用16或32位整數,以充分利用芯片性能。

3 適用范圍

等待任務(wù)列表使用了與就緒表操作相似的過(guò)程,注意要同時(shí)更改其數據類(lèi)型和算法。算法雖然是在Cortex—M3上執行的,但適用于A(yíng)RM9及其以后芯片。支持ARM指令集的芯片,可以在C語(yǔ)言中使用內嵌匯編,不必再編寫(xiě)匯編查找函數。

本文所敘述的算法適用于下述兩種情況。

①使用μC/OS-Ⅱ系統:

◆要求更多的任務(wù)優(yōu)先級;
◆要求產(chǎn)品性能優(yōu)越或是時(shí)間關(guān)鍵的應用,想進(jìn)一步提高效率;
◆學(xué)習、研究或希望優(yōu)化μC/OS-Ⅱ以擴展其應用范圍。

②未使用μC/OS-Ⅱ系統:

◆移植改造其他操作系統的就緒表算法;
◆編寫(xiě)新操作系統或執行調度程序;
◆編程愛(ài)好者借鑒、改進(jìn)編程方法。

結語(yǔ)

Cortex-M3推出時(shí),筆者就認定它是單片機過(guò)渡到ARM的有力工具,其小存儲量使得它更適合用小型實(shí)時(shí)系統。在學(xué)習μC/OS-Ⅱ的過(guò)程中,發(fā)現其就緒表操作算法經(jīng)過(guò)改動(dòng)或許更好,于是就做了本文所述的試驗。

作者:防災科技學(xué)院 張元偉
來(lái)源:?jiǎn)纹瑱C與嵌入式系統應用 2009(4)
本文地址:http://selenalain.com/thread-9816-1-1.html     【打印本頁(yè)】

本站部分文章為轉載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀(guān)點(diǎn)和對其真實(shí)性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問(wèn)題,我們將根據著(zhù)作權人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復 返回頂部 返回列表
午夜高清国产拍精品福利|亚洲色精品88色婷婷七月丁香|91久久精品无码一区|99久久国语露脸精品|动漫卡通亚洲综合专区48页