x86eth中断
1. 网卡多队列
CPU在运行的时候遇到的一些事件, 这些事件有可能是线性程序本身出现的,那也有可能是在CPU的外部 甚至是整个系统的外部出现的事件。那么 这时就要求CPU强行中止现在正在运行的程序。 并且从一个新的存储器区域启动相应的程序去处理这些事件。 还有一点也很重要,就是在处理完这些事件之后,CPU需要恢复到原来的程序继续运行。 那这些事件就被称为中断或者异常。
将CPU运行程序所引发的特殊的事件称为软件中断, 而把外部的这些输入输出设备产生的事件称为升歼硬件中断。
X86系统采用中断机制协同处理CPU与其他设备工作。长久以来网卡的中断默认由cpu0处理,态租在大量小包的网络环境下可能出现cpu0负载高,而其他cpu空闲。后来出现网卡多队列技术解决这个问题。
当网卡收到数据包时会产生中断,通知内核有新数据包,然后内核调用中断处理程序进行响应,把数据包从网卡缓存拷贝到内存,因为网卡缓存大小有限,如果不及时拷出数据,后续数据包将会因为缓存溢出被丢弃,因此这一工作需要立即完成。剩下的处理和操作数据包的工作就会交给软中断。高负载的网卡是软中断产生的大户,很容易形成瓶颈。
可以通过显示/proc/interrupts来显示中断信息:
从图可以看到"124"、"125"分别为eth2-TxRx-0和eth2-TxRx-1的中断号。
如果有24个CPU的话,那么将会存在24个这样的中断号,从eth2-TxRx-0到eth2-TxRx-23。
每一个中断号表示一个网卡的工作队列,在有24个CPU的机器里,每个网卡需要存在24个网络队列。
通过将中断号绑定到多CPU并没有真正实现中断的分配。支持RSS的网卡,通过多队列技术,每个队列对应一个中断号,通过对每个中断的绑定,可以实现网卡中断在cpu多核上的分配。
中断亲和力是指将一个或多个中断源绑定到特定的 CPU 核心上运行。
/proc/irq/[irq_num]/smp_affinity_list :该文件存放的是CPU列表(十进制)。注意,CPU核心个数用表示编号从0开始,如cpu0,cpu1等
根据上图所示,124号帆笑兆中断为网卡eth2的第一个网络队列的中断号。我们将它绑定到CPU0上。
echo 0 >/proc/irq/124/smp_affinity_list
根据上面信息可以从/proc/interrupts获取CPU中断号信息,来写脚本实现自动绑定。
使用top命令,然后输入 1 。
其中 0.0%si 表示当前的软中断(software interrupt)的使用率。