一、Linux device driver 的概念 系統調用是操作系統內核和應用程序之間的接口,設備驅動(dòng)程序是操作系統內核和機器硬件之間的接口。設備驅動(dòng)程序為應用程序屏蔽了硬件的細節,這樣在應用程序看來(lái),硬件設備只是一個(gè)設備文件,應用程序可以象操作普通文件一樣對硬件設備進(jìn)行操作。設備驅動(dòng)程序是內核的一部分,它完成以下的功能: 1. 對設備初始化和釋放。 2. 把數據從內核傳送到硬件和從硬件讀取數據。 3. 讀取應用程序傳送給設備文件的數據和回送應用程序請求的數據。 4. 檢測和處理設備出現的錯誤。 在Linux操作系統下有三類(lèi)主要的設備文件類(lèi)型,一是字符設備,二是塊設備,三是網(wǎng)絡(luò )設備。字符設備和塊設備的主要區別是:在對字符設備發(fā)出讀/寫(xiě)請求時(shí),實(shí)際的硬件I/O一般就緊接著(zhù)發(fā)生了,塊設備則不然,它利用一塊系統內存作緩沖區,當用戶(hù)進(jìn)程對設備請求能滿(mǎn)足用戶(hù)的要求,就返回請求的數據,如果不能,就調用請求函數來(lái)進(jìn)行實(shí)際的I/O操作。塊設備是主要針對磁盤(pán)等慢速設備設計的,以免耗費過(guò)多的CPU時(shí)間來(lái)等待。 已經(jīng)提到,用戶(hù)進(jìn)程是通過(guò)設備文件來(lái)與實(shí)際的硬件打交道。每個(gè)設備文件都都有其文件屬性(c/b),表示是字符設備還是塊設備?另外每個(gè)文件都有兩個(gè)設備號,第一個(gè)是主設備號,標識驅動(dòng)程序,第二個(gè)是從設備號,標識使用同一個(gè)設備驅動(dòng)程序的不同的硬件設備,比如有兩個(gè)軟盤(pán),就可以用從設備號來(lái)區分他們。設備文件的的主設備號必須與設備驅動(dòng)程序在登記時(shí)申請的主設備號一致,否則用戶(hù)進(jìn)程將無(wú)法訪(fǎng)問(wèn)到驅動(dòng)程序。 最后必須提到的是,在用戶(hù)進(jìn)程調用驅動(dòng)程序時(shí),系統進(jìn)入核心態(tài),這時(shí)不再是搶先式調度。也就是說(shuō),系統必須在你的驅動(dòng)程序的子函數返回后才能進(jìn)行其他的工作。如果你的驅動(dòng)程序陷入死循環(huán),不幸的是你只有重新啟動(dòng)機器了,然后就是漫長(cháng)的fsck。 二、實(shí)例剖析 我們來(lái)寫(xiě)一個(gè)最簡(jiǎn)單的字符設備驅動(dòng)程序。雖然它什么也不做,但是通過(guò)它可以了解Linux的設備驅動(dòng)程序的工作原理。把下面的C代碼輸入機器,你就會(huì )獲得一個(gè)真正的設備驅動(dòng)程序。 view plain copy 1. #define __NO_VERSION__ 2. #include 3. #include 4. char kernel_version [] = UTS_RELEASE; 這一段定義了一些版本信息,雖然用處不是很大,但也必不可少。Johnsonm說(shuō)所有的驅動(dòng)程序的開(kāi)頭都要包含 由于用戶(hù)進(jìn)程是通過(guò)設備文件同硬件打交道,對設備文件的操作方式不外乎就是一些系統調用,如 open,read,write,close…, 注意,不是fopen, fread,但是如何把系統調用和驅動(dòng)程序關(guān)聯(lián)起來(lái)呢?這需要了解一個(gè)非常關(guān)鍵的數據結構: [cpp] view plain copy 1. struct file_operations 2. { 3. int (*seek) (struct inode * ,struct file *, off_t ,int); 4. int (*read) (struct inode * ,struct file *, char ,int); 5. int (*write) (struct inode * ,struct file *, off_t ,int); 6. int (*readdir) (struct inode * ,struct file *, struct dirent * ,int); 7. int (*select) (struct inode * ,struct file *, int ,select_table *); 8. int (*ioctl) (struct inode * ,struct file *, unsined int ,unsigned long); 9. int (*mmap) (struct inode * ,struct file *, struct vm_area_struct *); 10. int (*open) (struct inode * ,struct file *); 11. int (*release) (struct inode * ,struct file *); 12. int (*fsync) (struct inode * ,struct file *); 13. int (*fasync) (struct inode * ,struct file *,int); 14. int (*check_media_change) (struct inode * ,struct file *); 15. int (*revalidate) (dev_t dev); 16. } 這個(gè)結構的每一個(gè)成員的名字都對應著(zhù)一個(gè)系統調用。用戶(hù)進(jìn)程利用系統調用在對設備文件進(jìn)行諸如read/write操作時(shí),系統調用通過(guò)設備文件的主設備號找到相應的設備驅動(dòng)程序,然后讀取這個(gè)數據結構相應的函數指針,接著(zhù)把控制權交給該函數。這是linux的設備驅動(dòng)程序工作的基本原理。既然是這樣,則編寫(xiě)設備驅動(dòng)程序的主要工作就是編寫(xiě)子函數,并填充file_operations的各個(gè)域。 下面就開(kāi)始寫(xiě)子程序。 [cpp] view plain copy 1. #include 2. #include 3. #include 4. #include 5. #include 6. unsigned int test_major = 0; 7. static int read_test(struct inode *node,struct file *file,char *buf,int count) 8. { 9. int left; 10. if (verify_area(VERIFY_WRITE,buf,count) == -EFAULT ) 11. return -EFAULT; 12. for(left = count ; left > 0 ; left--) 13. { 14. __put_user(1,buf,1); 15. buf++; 16. } 17. return count; 18. } 這個(gè)函數是為read調用準備的。當調用read時(shí),read_test()被調用,它把用戶(hù)的緩沖區全部寫(xiě)1。buf 是read調用的一個(gè)參數。它是用戶(hù)進(jìn)程空間的一個(gè)地址。但是在read_test被調用時(shí),系統進(jìn)入核心態(tài)。所以不能使用buf這個(gè)地址,必須用__put_user(),這是kernel提供的一個(gè)函數,用于向用戶(hù)傳送數據。另外還有很多類(lèi)似功能的函數。請參考,在向用戶(hù)空間拷貝數據之前,必須驗證buf是否可用。這就用到函數verify_area。 [cpp] view plain copy 1. static int write_tibet(struct inode *inode,struct file *file,const char *buf,int count) 2. { 3. return count; 4. } 5. 6. static int open_tibet(struct inode *inode,struct file *file ) 7. { 8. MOD_INC_USE_COUNT; 9. return 0; 10. } 11. 12. static void release_tibet(struct inode *inode,struct file *file ) 13. { 14. MOD_DEC_USE_COUNT; 15. } 這幾個(gè)函數都是空操作。實(shí)際調用發(fā)生時(shí)什么也不做,他們僅僅為下面的結構提供函數指針。 [cpp] view plain copy 1. struct file_operations test_fops = { 2. NULL, 3. read_test, 4. write_test, 5. NULL, /* test_readdir */ 6. NULL, 7. NULL, /* test_ioctl */ 8. NULL, /* test_mmap */ 9. open_test, 10. release_test, 11. NULL, /* test_fsync */ 12. NULL, /* test_fasync */ 13. /* nothing more, fill with NULLs */ 14. }; 設備驅動(dòng)程序的主體可以說(shuō)是寫(xiě)好了,現在要把驅動(dòng)程序嵌入內核。驅動(dòng)程序可以按照兩種方式編譯:一種是編譯進(jìn)kernel,另一種是編譯成模塊(modules),如果編譯進(jìn)內核的話(huà),會(huì )增加內核的大小,還要改動(dòng)內核的源文件,而且不能動(dòng)態(tài)的卸載,不利于調試,所以推薦使用模塊方式。 [cpp] view plain copy 1. int init_module(void) 2. { 3. int result; 4. result = register_chrdev(0, "test", &test_fops); 5. if (result < 0) { 6. printk(KERN_INFO "test: can't get major number\n"); 7. return result; 8. } 9. if (test_major == 0) test_major = result; /* dynamic */ 10. return 0; 11. } 在用insmod命令將編譯好的模塊調入內存時(shí),init_module 函數被調用。在這里,init_module只做了一件事,就是向系統的字符設備表登記了一個(gè)字符設備。 register_chrdev需要三個(gè)參數,參數一是希望獲得的設備號,如果是零的話(huà),系統將選擇一個(gè)沒(méi)有被占用的設備號返回。參數二是設備文件名,參數三用來(lái)登記驅動(dòng)程序實(shí)際執行操作的函數的指針。 如果登記成功,返回設備的主設備號,不成功,返回一個(gè)負值。 [cpp] view plain copy 1. void cleanup_module(void) 2. { 3. unregister_chrdev(test_major,"test"); 4. } 在用rmmod卸載模塊時(shí),cleanup_module函數被調用,它釋放字符設備test在系統字符設備表中占有的表項。 一個(gè)極其簡(jiǎn)單的字符設備可以說(shuō)寫(xiě)好了,文件名就叫test.c吧。 下面編譯 : [cpp] view plain copy 1. $ gcc -O2 -DMODULE -D__KERNEL__ -c test.c 得到文件test.o就是一個(gè)設備驅動(dòng)程序。 如果設備驅動(dòng)程序有多個(gè)文件,把每個(gè)文件按上面的命令行編譯,然后 : [cpp] view plain copy 1. ld -r file1.o file2.o -o modulename。 驅動(dòng)程序已經(jīng)編譯好了,現在把它安裝到系統中去: [cpp] view plain copy 1. $ insmod –f test.o 如果安裝成功,在/proc/devices文件中就可以看到設備test,并可以看到它的主設備號。要卸載的話(huà),運行 : [cpp] view plain copy 1. $ rmmod test 下一步要創(chuàng )建設備文件: [cpp] view plain copy 1. mknod /dev/test c major minor c 是指字符設備,major是主設備號,就是在/proc/devices里看到的。 用shell命令 : [cpp] view plain copy 1. $ cat /proc/devices 就可以獲得主設備號,可以把上面的命令行加入你的shell script中去。 minor是從設備號,設置成0就可以了。 我們現在可以通過(guò)設備文件來(lái)訪(fǎng)問(wèn)我們的驅動(dòng)程序,寫(xiě)一個(gè)小小的測試程序: [cpp] view plain copy 1. #include 2. #include 3. #include 4. #include 5. main() 6. { 7. int testdev; 8. int i; 9. char buf[10]; 10. testdev = open("/dev/test",O_RDWR); 11. if ( testdev == -1 ) 12. { 13. printf("Cann't open file \n"); 14. exit(0); 15. } 16. read(testdev,buf,10); 17. for (i = 0; i < 10;i++) 18. printf("%d\n",buf); 19. close(testdev); 20. } 編譯運行,看看是不是打印出全1 ? 以上只是一個(gè)簡(jiǎn)單的演示。真正實(shí)用的驅動(dòng)程序要復雜的多,要處理如中斷,DMA,I/O port等問(wèn)題。這些才是真正的難點(diǎn)。請看下節,實(shí)際情況的處理。 三、設備驅動(dòng)程序中的一些具體問(wèn)題 1. I/O Port 和硬件打交道離不開(kāi)I/O Port,老的ISA設備經(jīng)常是占用實(shí)際的I/O端口,在linux下,操作系統沒(méi)有對I/O口屏蔽,也就是說(shuō),任何驅動(dòng)程序都可對任意的I/O口操作,這樣就很容易引起混亂。每個(gè)驅動(dòng)程序應該自己避免誤用端口。 有兩個(gè)重要的kernel函數可以保證驅動(dòng)程序做到這一點(diǎn)。 1)check_region(int io_port, int off_set) 這個(gè)函數察看系統的I/O表,看是否有別的驅動(dòng)程序占用某一段I/O口。 參數1:io端口的基地址。 參數2:io端口占用的范圍。 返回值:0 沒(méi)有占用, 非0,已經(jīng)被占用。 2)request_region(int io_port, int off_set,char *devname) 如果這段I/O端口沒(méi)有被占用,在我們的驅動(dòng)程序中就可以使用它。在使用之前,必須向系統登記,以防止被其他程序占用。登記后,在/proc/ioports文件中可以看到你登記的io口。 參數1:io端口的基地址。 參數2:io端口占用的范圍。 參數3:使用這段io地址的設備名。 在對I/O口登記后,就可以放心地用inb(), outb()之類(lèi)的函來(lái)訪(fǎng)問(wèn)了。 在一些pci設備中,I/O端口被映射到一段內存中去,要訪(fǎng)問(wèn)這些端口就相當于訪(fǎng)問(wèn)一段內存。經(jīng)常性的,我們要獲得一塊內存的物理地址。 2. 內存操作 在設備驅動(dòng)程序中動(dòng)態(tài)開(kāi)辟內存,不是用malloc,而是kmalloc,或者用get_free_pages直接申請頁(yè)。釋放內存用的是kfree,或free_pages。 請注意,kmalloc等函數返回的是物理地址! 注意,kmalloc最大只能開(kāi)辟128k-16,16個(gè)字節是被頁(yè)描述符結構占用了。 內存映射的I/O口,寄存器或者是硬件設備的RAM(如顯存)一般占用F0000000以上的地址空間。在驅動(dòng)程序中不能直接訪(fǎng)問(wèn),要通過(guò)kernel函數vremap獲得重新映射以后的地址。 另外,很多硬件需要一塊比較大的連續內存用作DMA傳送。這塊程序需要一直駐留在內存,不能被交換到文件中去。但是kmalloc最多只能開(kāi)辟128k的內存。 這可以通過(guò)犧牲一些系統內存的方法來(lái)解決。 3. 中斷處理 同處理I/O端口一樣,要使用一個(gè)中斷,必須先向系統登記。 [cpp] view plain copy 1. int request_irq(unsigned int irq ,void(*handle)(int,void *,struct pt_regs *), 2. unsigned int long flags, const char *device); irq: 是要申請的中斷。 handle:中斷處理函數指針。 flags:SA_INTERRUPT 請求一個(gè)快速中斷,0 正常中斷。 device:設備名。 如果登記成功,返回0,這時(shí)在/proc/interrupts文件中可以看你請求的中斷。 4.一些常見(jiàn)的問(wèn)題 對硬件操作,有時(shí)時(shí)序很重要。但是如果用C語(yǔ)言寫(xiě)一些低級的硬件操作的話(huà),gcc往往會(huì )對你的程序進(jìn)行優(yōu)化,這樣時(shí)序會(huì )發(fā)生錯誤。如果用匯編寫(xiě)呢,gcc同樣會(huì )對匯編代碼進(jìn)行優(yōu)化,除非用volatile關(guān)鍵字修飾。最保險的辦法是禁止優(yōu)化。這當然只能對一部分你自己編寫(xiě)的代碼。如果對所有的代碼都不優(yōu)化,你會(huì )發(fā)現驅動(dòng)程序根本無(wú)法裝載。這是因為在編譯驅動(dòng)程序時(shí)要用到gcc的一些擴展特性,而這些擴展特性必須在加了優(yōu)化選項之后才能體現出來(lái)。 以下課程可免費試聽(tīng)C語(yǔ)言、電子、PCB、STM32、Linux、FPGA、JAVA、安卓等。 想學(xué)習的你和我聯(lián)系預約就可以免費聽(tīng)課了。 宋工企鵝號:3524-6590-88 Tel/WX:173--1795--1908 ![]() |