原创 你的变量究竟存储在哪里?

2010-1-22 15:04 2728 6 6 分类: MCU/ 嵌入式


http://http://blog.csdn.net/normalnotebook/archive/2006/06/08/781397.aspx <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />


c语言变量存储问题


在函数体中定义的变量通常是在栈上,用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上。


在函数外部定义的变量(全局变量或静态外部变量)和在函数内部定义的static变量,其生存期就是程序运行的全过程,这些变量被存储在数据段(datasegment)中。


在函数内部定义的auto变量(没有用关键字static定义的变量)的生存期从程序开始执行其所在的程序块代码时开始,到程序离开该程序块时为止。作为函数参数的变量只在调用该函数期间存在。这些变量被存储在栈(stack)中。


 


你的变量究竟存储在什么地方?


作者:杨小华


我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。


如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。


       在计算机系统中,目标文件通常有三种形式:


1.可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。


2.可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行


3.共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库


一个典型的可重定位目标文件如下图所示:


 


高地址



节头部表


.strtab


.line


.debug


.rel.data


.rel.text


.symtab


.bss


.data 3


.rodata


.text 1


ELF


0


1典型的ELF可重定位目标文件(数字代表索引)


夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:





含义


.text


已编译程序的机器代码


.rodata


只读数据,如pintfswitch语句中的字符串和常量值


.data


已初始化的全局变量


.bss


未初始化的全局变量


.symtab


符号表,存放在程序中被定义和引用的函数和全局变量的信息


.rel.text


当链接器把这个目标文件和其他文件结合时,.text节中的信息需修改


.rel.data


被模块定义和引用的任何全局变量的信息


.debug


一个调试符号表。


.line


原始C程序的行号和.text节中机器指令之间的映射


.strtab


一个字符串表,其内容包含.systab.debug节中的符号表


对于static类型的变量,gcc编译器在.data.bss中为每个定义分配空间,并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆(heap)中,局部变量都存储在栈(stack)中。


 


下面我们以实际的例子来分析变量的存储:




#include<stdio.h>


#include<string.h>


#include<stdlib.h>


 


int z = 9;


int a;


static int b =10;


static int c;


void swap(int* x,int* y)


{


int temp;


temp=*x;


*x=*y;


*y=temp;


}  


 


int main()


{


int x="4",y=5;


swap(&x,&y);


printf(“x=%d,y=%d,z=%d,w=%d\n”,x,y,z,b);


return 0;


}   


 


根据以上题目和理论知识,我们可以推断出:




变量


存储区域


a


.bss


b


.data


c


.bss


x


stack


y


stack


temp


stack


z


.data


swap


.text


main


.text


x=……


.rodata


 


我们将从   汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码: 




.file "var.c"


.globl z


.data     #数据段
.align    4


.type     z,     @object


.size     z,     4


z:


.long     9


.align    4


.type     b,     @object


.size     b,     4


b:


.long     10


.text     #代码段


.globl    swap


.type     swap,  @function


swap:


pushl     %ebp


movl      %esp,      %ebp


subl      $4,        %esp


movl      8(%ebp),   %eax


movl      (%eax),    %eax


movl      %eax,      -4(%ebp)


movl      8(%ebp),   %edx


movl      12(%ebp), %eax


movl      (%eax),    %eax


movl      %eax,      (%edx)


movl      12(%ebp), %edx


movl       -4(%ebp), %eax


movl      %eax,      (%edx)


leave


ret


.size swap, .-swap


.section   .rodata     #只读段


.LC0:


.string   "x=%d,y=%d,z=%d,w=%d\n"


.text     #代码段


.globl     main


.type      main, @function


main:


pushl     %ebp


movl      %esp,      %ebp


subl      $40,       %esp


andl      $-16,      %esp


movl      $0,        %eax


subl      %eax,      %esp


movl      $4,        -4(%ebp)


movl      $5,        -8(%ebp)


leal      -8(%ebp), %eax


movl      %eax,      4(%esp)


leal      -4(%ebp), %eax


movl      %eax,      (%esp)


call      swap


movl      b,         %eax


movl      %eax,      16(%esp)


movl      z,         %eax


movl      %eax,      12(%esp)


movl      -8(%ebp),  %eax


movl      %eax,      8(%esp)


movl      -4(%ebp),  %eax


movl      %eax,      4(%esp)


movl      $.LC0,     (%esp)


call      printf


movl      $0,        %eax


leave


ret


.size main, .-main


.comm    a,4,4


.local       c


.comm    c,4,4


.section   .note.GNU-stack,"",@progbits


.ident      "GCC: (GNU) <?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />3.3.5 (Debian 1:3.3.5-13)"


通过以上汇编代码可以发现,zb.data段,mainswap.text段,ac.bss段,x,y,tempstack中,printf函数所打印的字符串在.rodata中。


下面我们在通过符号表来解释变量的存储。


每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:


1. 由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap


2. 由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。


3. 只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的bc


该程序所对应的符号表如图所示:点击看大图


<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />


2符号表


首先,我们解释上图中各字段的含义:




字段名


含义


Num


序号


Value


符号地址。


可重定位目标文件:距定义目标文件的节的起始位置的偏移


可执行目标文件:一个绝对运行的地址


Size


目标的大小


Type


要么是数据,要么是函数,或各个节的表目


Bind


符号是全局的还是本地的


Vis


目前还没有查到资料,待以后改正


Ndx


通过索引来表示每个节


ABS:不该被重定位的符号


UND:代表未定义的符号(在其他地方定义)


COM:未初始化的数据目标


Name


指向符号的名字


对于变量bzNdx索引为3,我们观察图1,不难发现索引3对应的是.data段。变量c对应的索引为4.bss段),变量a对应的索引是COM,最终当该程序被链接时,它将做为一个.bss目标分配。我们从反汇编代码中,对于变量ac都是.comm(反汇编代码中以“.”开头的行,是指导汇编器和链接器运行的命令):




        ……


       .comm    a,4,4


       .local       c


       .comm    c,4,4


       ……


注意:a所对应的BindGLOBAL,即为全局变量,虽然变量c也在.bss段中,但Bind却是LOCAL,则为本地变量。.data段中的变量bc也是类似的情况。swapmain都在索引1所对应的.text段中。由于printf是在库中所定义的,所以索引为UND


符号表中不包含对应于本地非静态程序变量中的任何符号。这些符号是在栈中被管理的,所以符号表中没有出现x,y,temp符号。


相信大家读完这篇文章以后,再也用不着对类似的题目胆战心惊了。

PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
6
关闭 站长推荐上一条 /3 下一条