原创分析Linux中Spinlock在ARM及X86平台上的实现

 2010-3-24 11:16  1497 4 4 分类: MCU/ 嵌入式

作者：刘洪涛,华清远见嵌入式学院讲师。

本文主要以2.6.22.6内核分析Linux中spinlock在ARM及X86平台上的实现（不同版本的内核实现形式会有一些差异，但原理大致相同）。此处默认大家已经熟悉了spinlock的使用，重点解释容易引起迷惑的体系结构相关的实现部分。

一、spin_lock(lock)的实现

/***include/linux/spinlock.h中***/

#if defined(CONFIG_SMP) || defined(CONFIG_DEBUG_SPINLOCK)
        //如果配置了SMP或配置自旋锁调试功能
        # include <linux/spinlock_api_smp.h>
        #else //如果是单处理器且不配置自旋锁调试功能
        # include <linux/spinlock_api_up.h>
        #endif
        ……
        #define spin_lock(lock) _spin_lock(lock)

1、如果是单处理器

/****include/linux/spinlock_api_up.h****/

#define _spin_lock(lock) __LOCK(lock)
#define __LOCK(lock) \
do { preempt_disable(); __acquire(lock); (void)(lock); } while (0)

    （1）preempt_disable()：禁止抢占
            （2）__acquire(lock)：在include/linux/compiler.h中有定义
        #ifdef __CHECKER__
        ……
        # define __acquire(x) __context__(x,1)
        # define __release(x) __context__(x,-1)
        #else
        ……
        # define __acquires(x)
        # define __releases(x)

这是一对用于sparse对代码检测的相互关联的函数定义，第一句表示要增加变量x的计数，增加量为1，第二句则正好相反，这个是用来函数编译的过程中。如果在代码中出现了不平衡的状况，那么在Sparse的检测中就会报警。如果要使用Sparse检测功能就需要安装sparse工具（参考相关安装方法），然后编译内核

#make zImage C="1" (C=1，只检测新编译的文件，C=2是查所有文件)
Sparse会定义__CHECKER__，如果你没有使用sparse工具，__acquire(lock)则定义为空

（3）(void)(lock)：通过插入一个变量本身的求值表达式，使编译器不再报警，如：“variable 'lock' is defined but never used”。这种求值不会影响运行时的速度。

2、如果配置了SMP

/****include/linux/spinlock_api_smp.h中****/

void __lockfunc _spin_lock(spinlock_t *lock) __acquires(lock);

/***kernel/spinlock.c***/

void __lockfunc _spin_lock(spinlock_t *lock)
        {
                preempt_disable();
                //关闭抢占
                spin_acquire(&lock->dep_map, 0, 0, _RET_IP_);
                //自旋锁调试用，在没有定义自旋锁调试的时候是空函数
                _raw_spin_lock(lock);
        }

/***include/linux/spinlock.h***/

#ifdef CONFIG_DEBUG_SPINLOCK
        extern void _raw_spin_lock(spinlock_t *lock);//在lib/spinlock_debug.c中实现
        #else //smp情况
        # define _raw_spin_lock(lock) __raw_spin_lock(&(lock)->raw_lock)

3、__raw_spin_lock在ARM处理器上的实现

/******include/asm-arm/spinlock_types.h***/

typedef struct {
volatile unsigned int lock;
} raw_spinlock_t;

#define __RAW_SPIN_LOCK_UNLOCKED { 0 }

/******include/asm-arm/spinlock.h***/

#if __LINUX_ARM_ARCH__ < 6
        #error SMP not supported on pre-ARMv6 CPUs //ARMv6后，才有多核ARM处理器
        #endif
        ……
        static inline void __raw_spin_lock(raw_spinlock_t *lock)
        {
                unsigned long tmp;
                __asm__ __volatile__(
        "1: ldrex        %0, [%1]\n"
        //取lock->lock放在 tmp里，并且设置&lock->lock这个内存地址为独占访问
        "        teq %0, #0\n"
        //测试lock_lock是否为0，影响标志位z
        #ifdef CONFIG_CPU_32v6K
        "        wfene\n"
        #endif
        "        strexeq %0, %2, [%1]\n"
        //如果lock_lock是0，并且是独占访问这个内存，就向lock->lock里写入1，并向tmp返回0，同时清除独占标记
        "        teqeq %0, #0\n"
        //如果lock_lock是0，并且strexeq返回了0，表示加锁成功，返回
        " bne 1b"
        //如果上面的条件(1：lock->lock里不为0，2：strexeq失败)有一个符合，就在原地打转
                : "=&r" (tmp) //%0：输出放在tmp里，可以是任意寄存器
                : "r" (&lock->lock), "r" (1)
        //%1：取&lock->lock放在任意寄存器，%2：任意寄存器放入1
                : "cc"); //状态寄存器可能会改变
                smp_mb();
        }

上述代码关键在于LDREX和STREX指令的应用。DREX和STREX指令是在V6以后才出现的，代替了V6以前的swp指令。可以让bus监控LDREX和STREX指令之间有无其它CPU和DMA来存取过这个地址，若有的话STREX指令的第一个寄存器里设置为1（动作失败），若没有，指令的第一个寄存器里设置为0（动作成功）。

不仅是自旋锁用到LDREX和STREX指令，信号量的实现也是利用LDREX和STREX指令来实现的。

4、__raw_spin_lock在X86处理器上的实现

/******include/asm-i386/spinlock_types.h***/

typedef struct {
                unsigned int slock;
        } raw_spinlock_t;
        #define __RAW_SPIN_LOCK_UNLOCKED { 1 }

/******include/asm-i386/spinlock.h***/

static inline void __raw_spin_lock(raw_spinlock_t *lock)
        {
                asm volatile("\n1:\t"
                        LOCK_PREFIX " ; decb %0\n\t"
                // lock->slock减1
                        "jns 3f\n"
                //如果不为负.跳转到3f.3f后面没有任何指令，即为退出
                        "2:\t"
                        "rep;nop\n\t"
                //重复执行nop.nop是x86的小延迟函数
                        "cmpb $0,%0\n\t"
                        "jle 2b\n\t"
                //如果lock->slock不大于0，跳转到标号2，即继续重复执行nop
                        "jmp 1b\n"
                //如果lock->slock大于0，跳转到标号1，重新判断锁的slock成员
                        "3:\n\t"
                        : "+m" (lock->slock) : : "memory");
                }

在多处理器环境中 LOCK_PREFIX 实际被定义为 “lock”前缀。x86 处理器使用“lock”前缀的方式提供了在指令执行期间对总线加锁的手段。芯片上有一条引线 LOCK，如果在一条汇编指令(ADD, ADC, AND, BTC, BTR, BTS, CMPXCHG, CMPXCH8B, DEC, INC, NEG, NOT, OR, SBB, SUB, XOR, XADD, XCHG)前加上“lock” 前缀，经过汇编后的机器代码就使得处理器执行该指令时把引线 LOCK 的电位拉低，从而把总线锁住，这样其它处理器或使用DMA的外设暂时无法通过同一总线访问内存。

jns 汇编指令检查 EFLAGS 寄存器的 SF(符号)位，如果为 0，说明 slock 原来的值为 1，则线程获得锁，然后跳到标签 3 的位置结束本次函数调用。如果 SF 位为 1，说明 slock 原来的值为 0 或负数，锁已被占用。那么线程转到标签 2 处不断测试 slock 与 0 的大小关系，假如 slock 小于或等于 0，跳转到标签 2 的位置继续忙等待；假如 slock 大于 0，说明锁已被释放，则跳转到标签 1 的位置重新申请锁。

二、spin_unlock(lock)的实现

/***include/linux/spinlock.h***/

#if defined(CONFIG_DEBUG_SPINLOCK) || defined(CONFIG_PREEMPT) || \
                !defined(CONFIG_SMP)
        # define spin_unlock(lock)                _spin_unlock(lock)
        ……
        #else
        # define spin_unlock(lock) \
                do {__raw_spin_unlock(&(lock)->raw_lock); __release(lock); } while (0)

1、如果是单处理器

/****include/linux/spinlock_api_up.h****/

#define _spin_unlock(lock)                __UNLOCK(lock)
        #define __UNLOCK(lock) \
                do { preempt_enable(); __release(lock); (void)(lock); } while (0)

完成前文的获取锁的逆过程

2、如果配置了SMP

# define spin_unlock(lock) \
do {__raw_spin_unlock(&(lock)->raw_lock); __release(lock); } while (0)

3、__raw_spin_unlock在ARM处理器上的实现

/******include/asm-arm/spinlock.h***/

static inline void __raw_spin_unlock(raw_spinlock_t *lock)
        {
                smp_mb();
                __asm__ __volatile__(
        "         str %1, [%0]\n" // 向lock->lock里写0，解锁
        #ifdef CONFIG_CPU_32v6K
        "         mcr p15, 0, %1, c7, c10, 4\n" /* DSB */
        "         sev"
        #endif
                :
                : "r" (&lock->lock), "r" (0) //%0取&lock->lock放在任意寄存器，%1：任意寄存器放入0
                : "cc");
        }

__raw_spin_unlock只是简单的给lock->lock里写0。

4、__raw_spin_unlock在X86处理器上的实现

/***include/asm-i386/spinlock.h***/

static inline void __raw_spin_unlock(raw_spinlock_t *lock)
        {
                asm volatile("movb $1,%0" : "+m" (lock->slock) :: "memory");
        }

__raw_spin_unlock 函数仅仅执行一条汇编指令：将lock-> slock 置为 1。

写原创有奖励！2025面包板原创奖励正在进行中