C语言在函数调用时,栈是如何变化的?
转自:https://blog.csdn.net/u012332571/article/details/108018375


做系统分析的话你肯定遇到过一些crash, oops等棘手问题,一般大家都会用 gdb, objdump 或者 addr2line等工具分析 pc 位置来定位出错的地方。但是这些分析工具背后的本质原理就不见得理解深刻了,而且有的时候面对一系列 backtrace 或者 stack 日志处于懵逼的状态

今天和大家一起看下面对 crash 日志的时候,如何利用 stack 来分析其变化的来龙去脉。

Arm指令集介绍
崇尚简单粗暴的介绍方式,我们直接来看各个寄存器的大体用法,详细用法可百度,不,谷歌。
  1.    r0-r3 用作传入函数参数,传出函数返回值。在子程序调用之间,可以将 r0-r3 用于任何用途。被调用函数在返回之前不必恢复 r0-r3。---如果调用函数需要再次使用 r0-r3 的内容,则它必须保留这些内容。
  2.    r4-r11 被用来存放函数的局部变量。如果被调用函数使用了这些寄存器,它在返回之前必须恢复这些寄存器的值。r11 是栈帧指针 fp
  3.    r12 是内部调用暂时寄存器 ip。它在过程链接胶合代码(例如,交互操作胶合代码)中用于此角色。在过程调用之间,可以将它用于任何用途。被调用函数在返回之前不必恢复 r12。
  4.    寄存器 r13 是栈指针 sp。它不能用于任何其它用途。sp 中存放的值在退出被调用函数时必须与进入时的值相同。
  5.    寄存器 r14 是链接寄存器 lr。如果您保存了返回地址,则可以在调用之间将 r14 用于其它用途,程序返回时要恢复
  6.    寄存器 r15 是程序计数器 pc。它不能用于任何其它用途。

演示代码
假如现在你已经掌握了 arm 指令的用法,即便没有掌握也没关系,“书到用时回头翻”。这里以一段简单的 c 语言为例:
  

  • #include <stdio.h>





  • int m = 8;





  • int fun(int a,int b)


  • {


  •     int c = 0;


  •     c = a + b;


  •     return c;


  • }


  • int main()


  • {


  •     int i = 4;


  •     int j = 5;


  •     m = fun(i, j);


  •     return 0;


  • }


编译一下,然后反汇编:

  • $ arm-linux-gnueabi-gcc main.c -o main





  • $ arm-linux-gnueabi-objdump -D -D main






  • 00010400 <fun>:


  •    10400:       e52db004        push    {fp}            ; (str fp, [sp, #-4]!)


  •    10404:       e28db000        add     fp, sp, #0


  •    10408:       e24dd014        sub     sp, sp, #20


  •    1040c:       e50b0010        str     r0, [fp, #-16]


  •    10410:       e50b1014        str     r1, [fp, #-20]  ; 0xffffffec


  •    10414:       e3a03000        mov     r3, #0


  •    10418:       e50b3008        str     r3, [fp, #-8]


  •    1041c:       e51b2010        ldr     r2, [fp, #-16]


  •    10420:       e51b3014        ldr     r3, [fp, #-20]  ; 0xffffffec


  •    10424:       e0823003        add     r3, r2, r3


  •    10428:       e50b3008        str     r3, [fp, #-8]


  •    1042c:       e51b3008        ldr     r3, [fp, #-8]


  •    10430:       e1a00003        mov     r0, r3


  •    10434:       e24bd000        sub     sp, fp, #0


  •    10438:       e49db004        pop     {fp}            ; (ldr fp, [sp], #4)


  •    1043c:       e12fff1e        bx      lr





  • 00010440 <main>:


  •    10440:       e92d4800        push    {fp, lr}


  •    10444:       e28db004        add     fp, sp, #4


  •    10448:       e24dd008        sub     sp, sp, #8


  •    1044c:       e3a03004        mov     r3, #4


  •    10450:       e50b300c        str     r3, [fp, #-12]


  •    10454:       e3a03005        mov     r3, #5


  •    10458:       e50b3008        str     r3, [fp, #-8]


  •    1045c:       e51b1008        ldr     r1, [fp, #-8]


  •    10460:       e51b000c        ldr     r0, [fp, #-12]


  •    10464:       ebffffe5        bl      10400 <fun>


  •    10468:       e1a02000        mov     r2, r0


  •    1046c:       e59f3010        ldr     r3, [pc, #16]   ; 10484 <main+0x44>


  •    10470:       e5832000        str     r2, [r3]


  •    10474:       e3a03000        mov     r3, #0


  •    10478:       e1a00003        mov     r0, r3


  •    1047c:       e24bd004        sub     sp, fp, #4


  •    10480:       e8bd8800        pop     {fp, pc}


  •    10484:       00021024        andeq   r1, r2, r4, lsr #32



【裸机思维】转载旁注:
注意:认真从上面的汇编代码观察,你会发现:

  • 在调用函数时,编译器使用 r0和r1来传递头两个形参

  • 在从函数返回时,编译器使用 r0 来保存函数的返回值


这一过程是符合AAPCS(Arm 架构程序调用规约)的要求的。实际上,AAPCS规定:

  • 函数的前4个形参,如果每一个的尺寸都小于等于32bit,则每一个形参单独占用一个通用寄存器;这前四个形参固定通过 r0 ~ r3 来传递;

  • 超出4个形参的部分,使用stack来传递;

  • 函数的返回值如果其尺寸小于等于32bit,则使用r0来传递;

我们来看上面汇编的节选:

  • ldr     r1, [fp, #-8]     ;把实参赋值给 r1


  • ldr     r0, [fp, #-12]    ;把实参赋值给 r0


  • bl      10400 <fun>       ; 调用目标函数(函数会通过r0和r1获取参数)


  • mov     r2, r0            ;函数会把返回值保存在r0中,这里是读取返回值到r2


后面的图解其实更接近C语言函数调用的理论模型——Arm的AAPCS实际上是C语言理论模型的一种本地化优化——不同硬件架构可能会有不同的本地化优化,但万变不离其宗这也是本文最精华的部分

图解栈的变化过程
如何能让读者接受吸收的更快,我一直觉得按照学习效率来讲的话顺序应该是视频,图文,文字。反正我是比较喜欢视频类的教学。这里给大家画下栈变化的过程是什么样子的。这里的图是结合上面的代码来画的,希望有助于读者的理解。

1.程序在内存分布区域
format,png.jpg

2.全局变量m赋值
format,png.jpg
3.保存进入main之前的栈底, fp-sp之间是当前函数栈

format,png.jpg


4.函数main的栈已经准备好了

format,png.jpg

5.i入栈
format,png.jpg

6.j入栈
format,png.jpg


7.准备函数fun的调用, 形参反向入栈 先形参b入栈
format,png.jpg

8.形参a入栈
format,png.jpg

9.留空一个地址作为fun返回值, 待后面返回时填入
format,png.jpg
10.fun返回地址入栈, 通常是main函数当前pc指针的下一个
format,png.jpg

11.main函数的栈底地址入栈
format,png.jpg

12.pc指针跳转fun代码
format,png.jpg

13.c入栈
format,png.jpg

14.可以看到函数fun的数据 形参a,b 在上一层函数的栈中. 一部分在自己的栈上. 此步取值到加法器中进行加法运算,再赋值给c
format,png.jpg

15.c赋给返回值,填入上面的留空位置
format,png.jpg

16.栈底恢复上一层
format,png.jpg

17.lr赋值给pc, 实现了跳转
format,png.jpg

18.返回值赋值给全局变量m
format,png.jpg

19.前面函数调用的形参已经无用,回滚sp

format,png.jpg

20.函数返回,清理main的栈空间
format,png.jpg
总结
这么多图有没有看花?相信到这里你已经了解了栈背后的来龙去脉,下一篇我们一起根据实际的 stack 错误案例剖析错误的可能性。