 

用户176125

文章：62 阅读：154693 评论：7 赞：347

 好友  私信个人主页

文章 62
原创 0
阅读 154693
评论 7
赞 347

原创你的变量究竟存储在哪里？

 2010-1-22 15:04  2851 6 6 分类: MCU/ 嵌入式

http://http://blog.csdn.net/normalnotebook/archive/2006/06/08/781397.aspx <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

c语言变量存储问题

在函数体中定义的变量通常是在栈上，用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上。

在函数外部定义的变量(全局变量或静态外部变量)和在函数内部定义的static变量，其生存期就是程序运行的全过程，这些变量被存储在数据段(datasegment)中。

在函数内部定义的auto变量(没有用关键字static定义的变量)的生存期从程序开始执行其所在的程序块代码时开始，到程序离开该程序块时为止。作为函数参数的变量只在调用该函数期间存在。这些变量被存储在栈(stack)中。

你的变量究竟存储在什么地方？

作者：杨小华

我相信大家都有过这样的经历，在面试过程中，考官通常会给你一道题目，然后问你某个变量存储在什么地方，在内存中是如何存储的等等一系列问题。不仅仅是在面试中，学校里面的考试也会碰到同样的问题。

如果你还不知道答案，请接着往下看。接下来，我们将在Linux操作系统上，以GCC编译器为例来讲解变量的存储。

在计算机系统中，目标文件通常有三种形式：

1.可重定位的目标文件：包含二进制代码和数据，与其他可重定位目标文件合并起来，创建一个可执行目标文件。

2.可执行的目标文件：包含二进制代码和数据，其形式可以被直接拷贝到存储器中并执行

3.共享目标文件：一种特殊的可重定位目标文件，即我们通常所说的动（静）态链接库

一个典型的可重定位目标文件如下图所示：

高地址

节头部表

.strtab

.line

.debug

.rel.data

.rel.text

.symtab

.bss

.data （3）

.rodata

.text （1）

ELF头

图 1典型的ELF可重定位目标文件（数字代表索引）

夹在ELF头和节头部表之间的都是节（section），各个节的意思如下：

节

含义

.text

已编译程序的机器代码

.rodata

只读数据，如pintf和switch语句中的字符串和常量值

.data

已初始化的全局变量

.bss

未初始化的全局变量

.symtab

符号表，存放在程序中被定义和引用的函数和全局变量的信息

.rel.text

当链接器把这个目标文件和其他文件结合时，.text节中的信息需修改

.rel.data

被模块定义和引用的任何全局变量的信息

.debug

一个调试符号表。

.line

原始C程序的行号和.text节中机器指令之间的映射

.strtab

一个字符串表，其内容包含.systab和.debug节中的符号表

对于static类型的变量，gcc编译器在.data和.bss中为每个定义分配空间，并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆（heap）中，局部变量都存储在栈（stack）中。

下面我们以实际的例子来分析变量的存储：

#include<stdio.h>

#include<string.h>

#include<stdlib.h>

int z = 9;

int a;

static int b =10;

static int c;

void swap(int* x,int* y)

{

int temp;

temp=*x;

*x=*y;

*y=temp;

}

int main()

{

int x="4",y=5;

swap(&x,&y);

printf(“x=%d,y=%d,z=%d,w=%d\n”,x,y,z,b);

return 0;

}

根据以上题目和理论知识，我们可以推断出：

变量

存储区域

.bss

.data

.bss

stack

temp

stack

.data

swap

.text

main

.text

x=……

.rodata

我们将从汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码：

.file "var.c"

.globl z

.data #数据段
.align 4

.type z, @object

.size z, 4

.long 9

.align 4

.type b, @object

.size b, 4

.long 10

.text #代码段

.globl swap

.type swap, @function

swap:

pushl %ebp

movl %esp, %ebp

subl $4, %esp

movl 8(%ebp), %eax

movl (%eax), %eax

movl %eax, -4(%ebp)

movl 8(%ebp), %edx

movl 12(%ebp), %eax

movl (%eax), %eax

movl %eax, (%edx)

movl 12(%ebp), %edx

movl -4(%ebp), %eax

movl %eax, (%edx)

leave

ret

.size swap, .-swap

.section .rodata #只读段

.LC0:

.string "x=%d,y=%d,z=%d,w=%d\n"

.text #代码段

.globl main

.type main, @function

main:

pushl %ebp

movl %esp, %ebp

subl $40, %esp

andl $-16, %esp

movl $0, %eax

subl %eax, %esp

movl $4, -4(%ebp)

movl $5, -8(%ebp)

leal -8(%ebp), %eax

movl %eax, 4(%esp)

leal -4(%ebp), %eax

movl %eax, (%esp)

call swap

movl b, %eax

movl %eax, 16(%esp)

movl z, %eax

movl %eax, 12(%esp)

movl -8(%ebp), %eax

movl %eax, 8(%esp)

movl -4(%ebp), %eax

movl %eax, 4(%esp)

movl $.LC0, (%esp)

call printf

movl $0, %eax

leave

ret

.size main, .-main

.comm a,4,4

.local c

.comm c,4,4

.section .note.GNU-stack,"",@progbits

.ident "GCC: (GNU) <?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />3.3.5 (Debian 1:3.3.5-13)"

通过以上汇编代码可以发现，z和b在.data段，main和swap在.text段，a和c在.bss段，x,y,temp在stack中，printf函数所打印的字符串在.rodata中。

下面我们在通过符号表来解释变量的存储。

每个可重定位目标文件都有一个符号表，它包含该文件所定义和引用的符号的信息。在链接器的上下文中，有三种不同的符号：

1. 由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量，如程序中的a,z,swap。

2. 由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。

3. 只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。

该程序所对应的符号表如图所示：

<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />

图 2符号表

首先，我们解释上图中各字段的含义：

字段名

含义

Num

序号

Value

符号地址。

可重定位目标文件：距定义目标文件的节的起始位置的偏移

可执行目标文件：一个绝对运行的地址

Size

目标的大小

Type

要么是数据，要么是函数，或各个节的表目

Bind

符号是全局的还是本地的

Vis

目前还没有查到资料，待以后改正

Ndx

通过索引来表示每个节

ABS：不该被重定位的符号

UND：代表未定义的符号（在其他地方定义）

COM：未初始化的数据目标

Name

指向符号的名字

对于变量b和z，Ndx索引为3，我们观察图1，不难发现索引3对应的是.data段。变量c对应的索引为4（.bss段），变量a对应的索引是COM，最终当该程序被链接时，它将做为一个.bss目标分配。我们从反汇编代码中，对于变量a和c都是.comm（反汇编代码中以“.”开头的行，是指导汇编器和链接器运行的命令）：