驱动程序的必要基础

1. 休眠与唤醒

1.1 使用示例

使用休眠-唤醒机制来编写按键驱动程序：

APP 调用 read 等函数试图读取数据，比如读取按键；
APP 进入内核态，也就是调用驱动中的对应函数，发现有数据则复制到用户空间并马上返回；
如果 APP 在内核态，也就是在驱动程序中发现没有数据，则 APP 休眠，进程/线程状态改为非 Running；
当有数据时，比如当按下按键时，驱动程序的中断服务程序被调用，它会记录数据、将 APP 的进程/线程状态修改为 Running；
调度器调度 APP 继续运行它的内核态代码，也就是驱动程序中的函数，复制数据到用户空间并马上返回。

如下图所示：

1.2 内核函数

参考内核源码：include\linux\wait.h

1.2.1 休眠函数

函数	说明
wait_event_interruptible(wq, condition)	休眠，直到 condition 为真；休眠期间是可被打断的，可以被信号打断
wait_event(wq, condition)	休眠，直到 condition 为真；退出的唯一条件是 condition 为真，信号也不好使
wait_event_interruptible_timeout(wq, condition, timeout)	休眠，直到 condition 为真或超时；休眠期间是可被打断的，可以被信号打断
wait_event_timeout(wq, condition, timeout)	休眠，直到 condition 为真；退出的唯一条件是 condition 为真，信号也不好使

wq 是指 waitqueue，等待队列，休眠时除了把程序状态改为非 RUNNING 之外，还要把进程/进程放入 wq 中，以后中断服务程序要从 wq 中把它取出来唤醒。声明等待队列头的源码如下：

#define __WAIT_QUEUE_HEAD_INITIALIZER(name) {				\
	.lock		= __SPIN_LOCK_UNLOCKED(name.lock),		\
	.task_list	= { &(name).task_list, &(name).task_list } }

#define DECLARE_WAIT_QUEUE_HEAD(name) \
	wait_queue_head_t name = __WAIT_QUEUE_HEAD_INITIALIZER(name)

只需要调用宏 DECLARE_WAIT_QUEUE_HEAD 就可以将一个变量修饰为等待队列头

condition 可以是一个变量，也可以是任何表达式。表示“一直等待，直到 condition 为 TRUE ”。

1.2.2 唤醒函数

函数	说明
wake_up_interruptible(x)	唤醒 x 队列中状态为“TASK_INTERRUPTIBLE”的线程，只唤醒其中的一个线程
wake_up_interruptible_nr(x, nr)	唤醒 x 队列中状态为“TASK_INTERRUPTIBLE”的线程，只唤醒其中的 nr 个线程
wake_up_interruptible_all(x)	唤醒 x 队列中状态为“TASK_INTERRUPTIBLE”的线程，唤醒其中的所有线程
wake_up(x)	唤醒 x 队列中状态为 “ TASK_INTERRUPTIBLE ”或 “TASK_UNINTERRUPTIBLE”的线程，只唤醒其中的一个线程
wake_up_nr(x, nr)	唤醒 x 队列中状态为“TASK_INTERRUPTIBLE ”或 “TASK_UNINTERRUPTIBLE”的线程，只唤醒其中 nr 个线程
wake_up_all(x)	唤醒 x 队列中状态为 “ TASK_INTERRUPTIBLE ”或 “TASK_UNINTERRUPTIBLE”的线程，唤醒其中的所有线程

1.3 使用休眠-唤醒机制编写按键驱动

主要步骤如下图：

代码：

内核模块init/exit，platform_driver 的 probe/remove，中断的声明和注册，都和之前类似，主要代码是 file_operations 中的操作：

static DECLARE_WAIT_QUEUE_HEAD(gpio_key_wait);   // 声明等待队列头

static irqreturn_t gpio_key_isr(int irq, void *dev_id)
{
	struct gpio_key *gpio_key = dev_id;
	int val, key;
	
	val = gpiod_get_value(gpio_key->gpiod);
	printk("key %d %d\n", gpio_key->gpio, val);
	key = (gpio_key->gpio << 8) | val;
	put_key(key);
	wake_up_interruptible(&gpio_key_wait);   // 有数据，唤醒休眠进程/线程
	
	return IRQ_HANDLED;
}

static ssize_t gpio_key_drv_read (struct file *file, char __user *buf, size_t size, loff_t *offset)
{
	int err, key;
	wait_event_interruptible(gpio_key_wait, !is_key_buf_empty());  //根据队列是否空，决定是否进入休眠状态，并将进程/线程放入等待队列中
	key = get_key();
	err = copy_to_user(buf, &key, 4);
	return 4;
}

static struct file_operations gpio_key_drv = {
	.owner	 = THIS_MODULE,
	.read    = gpio_key_drv_read,
};

代码中使用 put_key,get_key 等函数封装了循环队列，用以保存 APP 程序未运行时的按键数据。APP 程序仅需要打开设备文件之后，一直读取即可。

2. POLL 机制

2.1 使用示例

使用 POLL 机制来编写按键驱动程序：

APP 不知道驱动程序中是否有数据，可以先调用 poll 函数查询一下，poll 函数可以传入超时时间
APP 进入内核态，调用驱动程序的 poll 函数，如果有数据则立刻返回；否则就休眠一段时间。
当有数据时，比如当按下按键时，驱动程序的中断服务程序被调用，它会记录数据、唤醒 APP；或者当超时时间到了之后，内核也会唤醒 APP
APP 根据 poll 函数的返回值就可以知道是否有数据，如果有数据就调用 read 得到数据

如下图所示：

注意事项：

内核函数 sys_poll 封装了实现 poll 机制的步骤，仅需要用户将线程放入等待队列，并返回判断条件 event 的状态即可
通过上图中 sys_poll 的伪代码示例，用户提供的 drv_poll 可能会被调用两次，使用内核函数 poll_wait 把线程挂入队列，如果线程已经在队列里了，它就不会再次挂入，避免重复挂入相同的线程。

2.2 应用编程

APP 可以调用 poll 或者 select 函数，这 2 个函数的作用是一致的。poll/select 函数可以监测多个文件，可以监测多种事件：

宏	值	描述
POLLIN	0x0001	表示可读数据，即文件描述符有数据可读
POLLPRI	0x0002	表示有紧急数据可读，通常用于表示带外（out-of-band）数据的到达
POLLOUT	0x0004	表示可写数据，即文件描述符可以接受写入数据
POLLERR	0x0008	表示发生错误，文件描述符处于错误状态
POLLHUP	0x0010	表示挂起，即文件描述符被挂起连接
POLLNVAL	0x0020	表示文件描述符非法，即未打开的文件描述符
POLLRDNORM	0x0040	等同于 POLLIN
POLLRDBAND	0x0080	Priority band data can be read，有优先级较较高的“band data”可读
POLLWRNORM	0x0100	等同于 POLLOUT
POLLWRBAND	0x0200	Priority data may be written

系统调用：

#include <poll.h>
struct pollfd {
    int   fd;         /* file descriptor */
    short events;     /* requested events */
    short revents;    /* returned events */
};

int poll(struct pollfd *fds, nfds_t nfds, int timeout);

返回值：
- 成功返回正数，表示就绪的文件描述符的数量，每个就绪的文件描述符的具体就绪事件则通过revents 字段来表示。内核中 poll 机制的实现主要是对所有传入文件调用驱动提供的 file_operations.poll 函数；循环调用一边之后，如果存在产生事件的文件则直接返回，否则进入休眠（APP 中可根据返回数量来循环检查是哪些文件产生相应事件）；当超时时间到或者中断唤醒后进行第二轮循环调用。
- 返回0表示调用超时，并且没有准备好任何文件描述符。
- 出现错误时，返回 -1
events 表示请求的事件，revents 表示返回的事件：
1
2
3
mask = f.file->f_op->poll(f.file, pwait);
/* Mask out unneeded events. */
mask &= pollfd->events | POLLERR | POLLHUP;
内核中会将 file_operations.poll 函数返回的事件 mask 和请求的事件 events相与，POLLERR | POLLHUP 是两个严重事件，所以无论 APP有没有请求，只要这两个事件发生就一定会返回

主要代码：

struct pollfd fds[1];
int timeout_ms = 5000;
int ret;

fds[0].fd = fd;
fds[0].events = POLLIN;

ret = poll(fds, 1, timeout_ms);
if ((ret == 1) && (fds[0].revents & POLLIN))
{
    read(fd, &val, 4);
    printf("get button : 0x%x\n", val);
}
else
{
    printf("timeout\n");
}

2.3 驱动编程

实现 poll 机制，只需要在 file_operations.poll 函数中做两件事情：

将线程放入等待队列（调用 poll_wait 函数可以自动将线程放入，并且不会重复放入）
返回正确的 POLL 事件 （事件列表如 2.2 节，如果没有任何事件发生，则返回 0 ）

代码如下：

static unsigned int gpio_key_drv_poll(struct file *fp, poll_table * wait)
{
	printk("%s %s line %d\n", __FILE__, __FUNCTION__, __LINE__);
	poll_wait(fp, &gpio_key_wait, wait);
	return is_key_buf_empty() ? 0 : POLLIN | POLLRDNORM;
}

static struct file_operations gpio_key_drv = {
	.owner	 = THIS_MODULE,
	.read    = gpio_key_drv_read,
	.poll    = gpio_key_drv_poll,
};

其余部分与 1.3 节中的代码一致。

注：(POLLIN | POLLRDNORM) 或 (POLLOUT | POLLWRNORM) 一般一起返回，之所以需要加上 POLLRDNORM 和 POLLWRNORM 是为了兼容某些 APP

3.异步通知

使用 POLL 机制来编写按键驱动程序：

APP 使用 signal 函数注册信号量对应的处理函数，并打开自己的设备文件。
APP 调用 fcntl 将自己的进程号写入内核文件系统，然后调用 fcntl 为设备文件添加 FASYNC 标志位；此后，APP可以处理其他工作，直到收到驱动发送的信号。
驱动应提供 file_operations.fasync函数，当设备文件 Flag 内的 FASYNC标志位变化时，会导致驱动程序的 fasync 函数被调用
faync 函数需要调用内核函数 faync_helper ，它会根据 FASYNC 的值设置 button_async->fa_file=filp or NULL ，filp 结构体中包含之前 APP 写入的进程号
当触发按键中断之后，可以在中断中提供 kill_fasync 函数发信号
APP 收到信号之后，自动调用信号处理函数，可以在处理函数中调用 read 函数读取按键

如下图所示：

3.1 应用编程

系统调用-signal ：

#include <signal.h>
typedef void (*sighandler_t)(int);

sighandler_t signal(int signum, sighandler_t handler);

主要代码：

// 信号处理函数
static void sig_func(int sig)
{
	int val;
	read(fd, &val, 4);
	printf("get button : 0x%x\n", val);
}


{
    // 1.注册信号处理函数
 	signal(SIGIO, sig_func);
    // 2.打开设备文件 
    fd = open(argv[1], O_RDWR);
    if (fd == -1)    return -1;
    // 3.在内核sys_fasync函数中写入pid
    fcntl(fd, F_SETOWN, getpid());
    // 4.为设备文件添加 FASYNC 位
    flags = fcntl(fd, F_GETFL);
    fcntl(fd, F_SETFL, flags | FASYNC);
    // 5.处理其他事务
    while (1)
    {
        printf("www.100ask.net \n");
        sleep(2);
    }

    close(fd);   
}

3.2 驱动编程

可参考 1.3 节，为了实现异步通知机制，仅需要提供file_operations.fasync函数，并在中断函数中调用 kill_fasync函数发送信号进行通知：

struct fasync_struct *button_fasync;
static int gpio_key_drv_fasync(int fd, struct file *file, int on)
{
    // fasync_helper 会分配构造 button_fasync，fasync_struct 结构体中包含 PID
	if (fasync_helper(fd, file, on, &button_fasync) >= 0)
		return 0;
	else
		return -EIO;
}

static irqreturn_t gpio_key_isr(int irq, void *dev_id)
{
	struct gpio_key *gpio_key = dev_id;
	int val;
	int key;
	
	val = gpiod_get_value(gpio_key->gpiod);
	printk("key %d %d\n", gpio_key->gpio, val);
	key = (gpio_key->gpio << 8) | val;
	put_key(key);
	// 发送IO信号，发送IO信号的原因是 POLL_IN 有数据可读
	kill_fasync(&button_fasync, SIGIO, POLL_IN);
	return IRQ_HANDLED;
}

4.阻塞和非阻塞

APP 可以基于 POLL 机制进行休眠，也可以在调用 open 函数时传入 O_NONBLOCK 表示使用非阻塞模式打开文件（默认是阻塞方式）。POLL 机制的实现需要驱动程序支持，而以非阻塞方式打开文件，同样需要：

对于普通文件、块设备文件，O_NONBLOCK 不起作用。

对于字符设备文件，O_NONBLOCK 起作用的前提是驱动程序针对该标志位做了对应处理。

在内核的文件系统层会为设备文件创建一个 struct file 结构体，该结构体中的成员 f_flags 表示设备文件的标志，对于 APP 可以在 open 时以相应的标志打开文件，也可以通过 fcntl 函数来设置设备文件的标志位：

fd = open(argv[1], O_RDWR | O_NONBLOCK);   

flags = fcntl(fd, F_GETFL);
fcntl(fd, F_SETFL, flags & ~O_NONBLOCK);

对于驱动程序可以通过判断 f_flags 是否含有 O_NONBLOCK 标志位，并进行相应操作：

1	if (file->f_flags & O_NONBLOCK)

4.1 应用程序

fd = open(argv[1], O_RDWR | O_NONBLOCK);
if (read(fd, &val, 4) == 4)    printf("get button: 0x%x\n", val);
else                           printf("get button: -1\n");

flags = fcntl(fd, F_GETFL);
fcntl(fd, F_SETFL, flags & ~O_NONBLOCK);
if (read(fd, &val, 4) == 4)    printf("get button: 0x%x\n", val);
else                           printf("while get button: -1\n");

4.2 驱动程序

static ssize_t gpio_key_drv_read (struct file *file, char __user *buf, size_t size, loff_t *offset)
{
	int err, key;
    // 没有数据且不阻塞时返回错误的一种
	if (is_key_buf_empty() && (file->f_flags & O_NONBLOCK))
		return -EAGAIN;
	// 阻塞方式，则根据有无数据来决定是否休眠
	wait_event_interruptible(gpio_key_wait, !is_key_buf_empty());
	key = get_key();
	err = copy_to_user(buf, &key, 4);
	
	return 4;
}

5.定时器

按键操作中存在机械抖动，如果硬件设计中没有电容去抖动的话，那么就需要我们在软件设计上延时一段时间来等待抖动过去，在按键稳定之后再读取电平。实现延时的选择自然就是定时器了。

5.1 定时器的内核函数

参考内核源码：include\linux\timer.h

设置定时器

setup_timer(timer, fn, data)

#define setup_timer(timer, fn, data)					\
	__setup_timer((timer), (fn), (data), 0)
	
#define __setup_timer(_timer, _fn, _data, _flags)			\
	do {								\
		__init_timer((_timer), (_flags));			\
		(_timer)->function = (_fn);				\
		(_timer)->data = (_data);				\
	} while (0)

#define __init_timer(_timer, _flags)					\
	init_timer_key((_timer), (_flags), NULL, NULL)
    
    
void init_timer_key(struct timer_list *timer, unsigned int flags,
		    const char *name, struct lock_class_key *key)
{
    debug_init(timer);
	do_init_timer(timer, flags, name, key);
}

设置定时器，主要是初始化 timer_list 结构体，设置其中的处理函数和传入参数，可将地址作为数据传入。

struct timer_list 结构体内容如下：

struct timer_list {
	/*
	 * All fields that change during normal runtime grouped to the
	 * same cacheline
	 */
	struct hlist_node	entry;
	unsigned long		expires;
	void			(*function)(unsigned long);
	unsigned long		data;
	u32			flags;
}

向内核添加定时器
1
void add_timer(struct timer_list *timer)
调用之前需要设置超时时间 expires；当超时时间到达时，内核会调用函数 timer->function(timer->data)
修改超时时间
1
int mod_timer(struct timer_list *timer, unsigned long expires)
等价于del_timer(timer); timer->expires = expires; add_timer(timer); 但更加高效；

当修改一个非运行的定时器时返回 0 ，反之返回1

删除定时器

1	int del_timer(struct timer_list *timer)

5.2 定时器的时间单位

编译内核时，可以在内核源码根目录下用“ls -a”看到一个隐藏文件，它就是内核配置文件。打开后可以看到如下这项：

1	CONFIG_HZ=100

这表示内核每秒中会发生 100 次系统滴答中断(tick)，这就像人类的心跳一样，这是 Linux 系统的心跳。每发生一次 tick 中断，全局变量 jiffies 就会累加 1

因此，设置超时时间的方式：

1 2	timer.expires = jiffies + xxx; // xxx 表示多少个滴答后超时，也就是 xxx10ms timer.expires = jiffies + 2HZ; // HZ 等于 CONFIG_HZ，2*HZ 就相当于 2 秒

5.3 使用定时器编写按键驱动

编程的思路，如下：

初始化定时器并设置超时时间为INF，然后添加定时器
当触发按键中断后，修改超时时间为当前时间的 10ms 后
当定时器软中断触发后，在读取稳定的电平，从而判断按键的状态

为了独立监测每一个按键，我们在按键结构体中为每一个按键都分配一个 struct timer_list：

struct gpio_key{
	int gpio;
	struct gpio_desc *gpiod;
	int flag;
	int irq;
	struct timer_list key_timer;
};

在 probe 函数中初始化每一个按键的定时器，在 remove 函数中删除定时器：

setup_timer(&gpio_keys_100ask[i].key_timer, key_timer_expire, &gpio_keys_100ask[i]);
gpio_keys_100ask[i].key_timer.expires = ~0;
add_timer(&gpio_keys_100ask[i].key_timer);

del_timer(&gpio_keys_100ask[i].key_timer);

在按键中断处理函数中，修改定时器的超时时间：

static irqreturn_t gpio_key_isr(int irq, void *dev_id)
{
	struct gpio_key *gpio_key = dev_id;
	printk("gpio_key_isr key %d irq happened\n", gpio_key->gpio);
	mod_timer(&gpio_key->key_timer, jiffies + HZ/100);
	return IRQ_HANDLED;
}

在定时器软中断处理函数中，读取电平：

static void key_timer_expire(unsigned long data)
{
	struct gpio_key *gpio_key = data;
	int val, key;
	val = gpiod_get_value(gpio_key->gpiod);
	printk("key_timer_expire key %d %d\n", gpio_key->gpio, val);
	key = (gpio_key->gpio << 8) | val;
	put_key(key);
	wake_up_interruptible(&gpio_key_wait);
	kill_fasync(&button_fasync, SIGIO, POLL_IN);
}

6.中断下半部 tasklet

使用软中断 tasklet 实现中断下半部的方式通常用来处理相对不复杂的任务（复杂耗时的会使用工作队列线程化的处理），tasklet 的具体实现机制参见“异常和中断”的第 2.1.3 节。

6.1 tasklet 的内核函数

参见内核源码：include\linux\interrupt.h

中断下半部使用结构体 tasklet_struct 来表示：

struct tasklet_struct
{
	struct tasklet_struct *next;
	unsigned long state;
	atomic_t count;
	void (*func)(unsigned long);
	unsigned long data;
};

state 有两位：
- bit0 表示 TASKLET_STATE_SCHED：
  
  等于 1 时表示已经执行了 tasklet_schedule 已经把该 tasklet 放入队列了。
  
  tasklet_schedule 会判断该位，如果已经等于 1 那么它就不会再次把 tasklet 放入队列。
- bit1 表示 TASKLET_STATE_RUN：
  
  等于 1 时，表示正在运行 tasklet 中的 func 函数；函数执行完后内核会把该位清 0。
其中的 count 表示该 tasklet 是否使能：等于 0 表示使能了，非 0 表示被禁止了。对于 count 非 0 的 tasklet，里面的 func 函数不会被执行。

定义结构体 tasklet_struct

#define DECLARE_TASKLET(name, func, data) \
struct tasklet_struct name = { NULL, 0, ATOMIC_INIT(0), func, data }

#define DECLARE_TASKLET_DISABLED(name, func, data) \
struct tasklet_struct name = { NULL, 0, ATOMIC_INIT(1), func, data }

extern void tasklet_init(struct tasklet_struct *t, void (*func)(unsigned long), unsigned long data);

使用 DECLARE_TASKLET 定义的 tasklet 结构体，它是使能的
使用 DECLARE_TASKLET_DISABLED 定义的 tasklet 结构体，它是禁止的；使用之前要先调用 tasklet_enable 使能它
使用 tasklet_init 定义的结构体也是使能的

使能/失能 tasklet

1 2	static inline void tasklet_enable(struct tasklet_struct t); static inline void tasklet_disable(struct tasklet_struct t);

tasklet_enable 把 count 减 1
tasklet_disable 把 count 加 1

调度 tasklet
1
static inline void tasklet_schedule(struct tasklet_struct *t);
- 把 tasklet 放入链表，并且设置它的 TASKLET_STATE_SCHED 状态为 1。
kill tasklet
1
extern void tasklet_kill(struct tasklet_struct *t);
- 如果一个 tasklet 已被放入链表且未被调度，则 tasklet_kill 会将它的 TASKLET_STATE_SCHED 状态清 0
- 如果一个 tasklet 已被调度，tasklet_kill 会等待它执行完华，再它的 TASKLET_STATE_SCHED 状态清 0

6.2 为驱动程序添加 tasklet

在按键驱动中，并没有多少复杂耗时的操作，不过我们可以象征性的将一些操作放入到 tasklet 的处理函数中。

在 probe 函数中初始化每一个按键的 tasklet 结构体，在 remove 函数中 kill 掉 tasklet 结构体：

1
2
3

tasklet_init(&gpio_keys_100ask[i].tasklet, key_tasklet_func, &gpio_keys_100ask[i]);

tasklet_kill(&gpio_keys_100ask[i].tasklet);

在按键中断结束时，调度 tasklet：

static irqreturn_t gpio_key_isr(int irq, void *dev_id)
{
	struct gpio_key *gpio_key = dev_id;
	tasklet_schedule(&gpio_key->tasklet);
	mod_timer(&gpio_key->key_timer, jiffies + HZ/100);
	return IRQ_HANDLED;
}

tasklet 的处理函数：

static void key_tasklet_func(unsigned long data)
{
	struct gpio_key *gpio_key = data;
	int val;

	val = gpiod_get_value(gpio_key->gpiod);
	printk("key_tasklet_func key %d %d\n", gpio_key->gpio, val);
}

7. 工作队列

前面讲的定时器、下半部 tasklet 都属于软中断，都是在中断上下文中执行的，无法休眠。这些更耗时的工作放在定时器或是下半部中，会使得系统很卡，因此可以使用线程来处理这些耗时的工作，从而解决系统卡顿的问题，因为线程可以休眠。

对于耗时而不是非常耗时的逻辑，我们并不需要自己去创建线程，可以使用“工作队列” (workqueue)。我们只需要将“工作”放入“工作队列”中，当对应的内核线程被调度时就会取出“工作”，执行处理函数。

在多 CPU 的系统下，一个工作队列可以有多个内核线程，可以在一定程度上缓解这个问题。

缺点：多个工作是在某个内核线程中依次执行的，前面的工作执行很慢，会使得后面的工作不能及时响应。所以对于非常复杂耗时的工作，可以为其单独开一个线程。

7.1 工作队列的内核函数

参考内核源码：include\linux\workqueue.h

work_struct 结构体的定义如下：

struct work_struct {
	atomic_long_t data;
	struct list_head entry;
	work_func_t func;
#ifdef CONFIG_LOCKDEP
	struct lockdep_map lockdep_map;
#endif
};

定义 work
1
2
3
4
5
#define DECLARE_WORK(n, f) \
struct work_struct n = __WORK_INITIALIZER(n, f)

#define DECLARE_DELAYED_WORK(n, f) \
struct delayed_work n = __DELAYED_WORK_INITIALIZER(n, f, 0)
- 第 1 个宏是用来定义一个 work_struct 结构体，要指定它的函数
- 第 2 个宏用来定义一个 delayed_work 结构体，也要指定它的函数。区别在于要让它运行时，可以指定某段时间之后再执行。
上面用来直接声明工作队列结构体，如果想要在代码中初始化 work_struct 结构体，可以使用：
1
#define INIT_WORK(_work, _func)
使用 work
1
2
3
4
static inline bool schedule_work(struct work_struct *work)
{
return queue_work(system_wq, work);
}
调用 schedule_work 时，就会把 work_struct 结构体放入队列中，并唤醒对应的内核线程。内核线程就会从队列里把 work_struct 结构体取出来，执行里面的函数

返回 false 表示 work 已经在工作队列中，否则返回 true

其他函数

函数	说明
create_workqueue	在 Linux 系统中已经有了现成的 `system_wq` 等工作队列，你当然也可以自己调用 create_workqueue 创建工作队列；对于 SMP 系统，这个工作队列会有多个内核线程与它对应，创建工作队列时，内核会帮这个工作队列创建多个内核线程
create_singlethread_workqueue	如果想只有一个内核线程与工作队列对应，可以用本函数创建工作队列，创建工作队列时，内核会帮这个工作队列创建一个内核线程
destroy_workqueue	销毁工作队列
schedule_work	调度执行一个具体的 work，执行的 work 将会被挂入 Linux 系统提供的工作队列
schedule_delayed_work	延迟一定时间去执行一个具体的任务，功能与 schedule_work 类似，多了一个延迟时间
queue_work	跟 schedule_work 类似，schedule_work 是在系统默认的工作队列上执行一个 work， queue_work 需要自己指定工作队列
queue_delayed_work	跟 schedule_delayed_work 类似，schedule_delayed_work 是在系统默认的工作队列上执行一个 work，queue_delayed_work 需要自己指定工作队列
flush_work	等待一个 work 执行完毕，如果这个 work 已经被放入队列，那么本函数等它执行完毕，并且返回 true；如果这个 work 已经执行完毕才调用本函数，那么直接返回 false
flush_delayed_work	等待一个 delayed_work 执行完毕，如果这个 delayed_work 已经被放入队列，那么本函数等它执行完毕，并且返回 true；如果这个 delayed_work 已经执行完毕才调用本函数，那么直接返回 false

7.2 为驱动程序添加工作队列

在按键驱动中，并没有多少复杂耗时的操作，不过我们可以象征性的将一些操作放入到工作队列的处理函数中。

在 probe 函数中初始化每一个按键的 work_struct 结构体：

1	INIT_WORK(&gpio_keys_100ask[i].work, key_work_func);

在按键中断结束时，调度 work：

static irqreturn_t gpio_key_isr(int irq, void *dev_id)
{
	struct gpio_key *gpio_key = dev_id;
	tasklet_schedule(&gpio_key->tasklet);
	mod_timer(&gpio_key->key_timer, jiffies + HZ/100);
    schedule_work(&gpio_key->work);
    return IRQ_HANDLED;
}

work 的处理函数：

#include <asm/current.h>

static void key_work_func(struct work_struct *work)
{
    // 调用宏 container_of，由 work 的指针反推出 gpio_key 结构体的指针
	struct gpio_key *gpio_key = container_of(work, struct gpio_key, work);
	int val;

	val = gpiod_get_value(gpio_key->gpiod);
    // 打印进程的名称和pid号
	printk("key_work_func: the process is %s pid %d\n",current->comm, current->pid);
	printk("key_work_func key %d %d\n", gpio_key->gpio, val);
}

8.中断的线程化处理

复杂、耗时的事情，尽量使用内核线程来处理。中断的处理仍然可以认为分为上半部、下半部。上半部用来处理紧急的事情，下半部用一个内核线程来处理。

8.1 使用内核线程实现中断下半部

在按键驱动中，并没有多少复杂耗时的操作，不过我们可以象征性的将一些操作放入到工作队列的处理函数中。

在 probe 函数中注册使用内核线程实现下半部的中断，并在 remove 函数中释放：

1
2
3

err = request_threaded_irq(gpio_keys_100ask[i].irq, gpio_key_isr, gpio_key_thread_func, IRQF_TRIGGER_RISING | IRQF_TRIGGER_FALLING, "100ask_gpio_key", &gpio_keys_100ask[i]);

free_irq(gpio_keys_100ask[i].irq, &gpio_keys_100ask[i]);

中断上半部和下半部的代码：

static irqreturn_t gpio_key_isr(int irq, void *dev_id)
{
	struct gpio_key *gpio_key = dev_id;
	tasklet_schedule(&gpio_key->tasklet);
	mod_timer(&gpio_key->key_timer, jiffies + HZ/50);
	schedule_work(&gpio_key->work);
	return IRQ_WAKE_THREAD;
}

static irqreturn_t gpio_key_thread_func(int irq, void *data)
{
	struct gpio_key *gpio_key = data;
	int val;
	val = gpiod_get_value(gpio_key->gpiod);
	printk("gpio_key_thread_func: the process is %s pid %d\n",current->comm, current->pid);	
	printk("gpio_key_thread_func key %d %d\n", gpio_key->gpio, val);
	return IRQ_HANDLED;
}

8.2 内核线程的机制

在 request_threaded_irq 函数中，肯定会创建一个内核线程，以下为关键代码：

int request_threaded_irq(unsigned int irq, irq_handler_t handler,
			 irq_handler_t thread_fn, unsigned long irqflags,
			 const char *devname, void *dev_id)
{
	// 分配、设置一个 irqaction 结构体
	action = kzalloc(sizeof(struct irqaction), GFP_KERNEL);
	if (!action)
		return -ENOMEM;

	action->handler = handler;
	action->thread_fn = thread_fn;
	action->flags = irqflags;
	action->name = devname;
	action->dev_id = dev_id;

	retval = __setup_irq(irq, desc, action); // 进一步处理
}

在该函数中分配了一个 irqaction 结构体，并在 __setup_irq 函数中进一步处理，截取重要代码如下：

static int
__setup_irq(unsigned int irq, struct irq_desc *desc, struct irqaction *new)
{
    if (new->thread_fn && !nested) { 		
        ret = setup_irq_thread(new, irq, false);
}

如果 thread_fn 不为空，则调用 setup_irq_thread 函数来创建一个内核线程，截取代码如下：

static int
setup_irq_thread(struct irqaction *new, unsigned int irq, bool secondary)
{
    if (!secondary) {
        t = kthread_create(irq_thread, new, "irq/%d-%s", irq,
                           new->name);
    } else {
        t = kthread_create(irq_thread, new, "irq/%d-s-%s", irq,
                           new->name);
        param.sched_priority -= 1;
    }

    new->thread = t;
}

最后将创建的内核线程付给 thread 成员

再来分析中断的执行中是如何唤醒上面创建的内核线程的，并执行 thread_fn 函数的。

在 kernel\irq\handle.c 中，截取部分代码如下：

irqreturn_t __handle_irq_event_percpu(struct irq_desc *desc, unsigned int *flags)
{
	irqreturn_t retval = IRQ_NONE;
	unsigned int irq = desc->irq_data.irq;
	struct irqaction *action;

	for_each_action_of_desc(desc, action) {
		irqreturn_t res;

		trace_irq_handler_entry(irq, action);
		res = action->handler(irq, action->dev_id);   // 调用中断上半部分的处理函数
		trace_irq_handler_exit(irq, action, res);

		if (WARN_ONCE(!irqs_disabled(),"irq %u handler %pF enabled interrupts\n",
			      irq, action->handler))
			local_irq_disable();

		switch (res) {
		case IRQ_WAKE_THREAD:     // 需要唤醒 thread 线程的返回值
			/*
			 * Catch drivers which return WAKE_THREAD but
			 * did not set up a thread function
			 */
			if (unlikely(!action->thread_fn)) {
				warn_no_thread(irq, action);
				break;
			}

			__irq_wake_thread(desc, action);   // 唤醒 action->thread 

			/* Fall through to add to randomness */
		case IRQ_HANDLED:       // 中断正常处理的返回值
			*flags |= action->flags;
			break;

		default:
			break;
		}
}

thread 线程的处理函数为 irq_thread，在 kernel\irq\handle.c 中：

static int irq_thread(void *data)
{
	while (!irq_wait_for_interrupt(action)) {   // 1. 休眠等待中断
		irqreturn_t action_ret;

		irq_thread_check_affinity(desc, action);

		action_ret = handler_fn(desc, action);   // 2. 执行 thread_fn
		if (action_ret == IRQ_HANDLED)
			atomic_inc(&desc->threads_handled);
		if (action_ret == IRQ_WAKE_THREAD)
			irq_wake_secondary(desc, action);

		wake_threads_waitq(desc);                // 3. 唤醒等待 thread_fn 的线程
	}
}

整体流程如下图：

可能由程序在等待 thread_fn 函数被执行，irq_thread 函数最后会调用 wake_threads_waitq 唤醒：

static void wake_threads_waitq(struct irq_desc *desc)
{
	if (atomic_dec_and_test(&desc->threads_active))
		wake_up(&desc->wait_for_threads);
}

wait_for_threads 是 wait_queue_head_t 类型，等待队列头内都是休眠的线程。

可以调用 synchronize_irq 来等待 thread_fn 被执行，synchronize_irq 的定义如下：

/**
 *	synchronize_irq - wait for pending IRQ handlers (on other CPUs)
 *	@irq: interrupt number to wait for
 *
 *	This function waits for any pending IRQ handlers for this interrupt
 *	to complete before returning. If you use this function while
 *	holding a resource the IRQ handler may need you will deadlock.
 *
 *	This function may be called - with care - from IRQ context.
 */
void synchronize_irq(unsigned int irq)