高效的C编程之:C编译器及其优化(上)
21ic 2025-07-08

本章将帮助读者在ARM处理器上编写高效的C代码。本章涉及的一些技术不仅适用于ARM处理器,也适用于其他RISC处理器。本章首先从ARM编译器及其优化入手,讲解C编译器在优化代码时所碰到的一些问题。理解这些问题,将有助于编写出在提高执行速度和减少代码尺寸方面更高效的C源代码。

本章假定读者熟悉C语言,并且有一些汇编语言编程方面的知识。有关ARM编程的详细信息,请参阅本书的相关章节。

14.1C编译器及其优化

本章主要讲解C编译器在代码优化时遇到的一些问题。要编写高效的C语言源代码,必须了解C编译器对什么形式的代码有所改动,编译器涉及的处理器结构的限制,以及一些特殊的C编译器的限制。

14.1.1为编译器选择处理器结构

在编译C源文件时,必须为编译器指定正确的处理器类型。这样可以使编译的代码最大限度地利用处理器的硬件结构,如对半字加载(HalfwordLoad)、存储指令(StoreInstructions)和指令调度(InstructionScheduling)的支持。所以编译程序时,应该尽量准确地告诉编译器该代码是运行在什么类型的处理器上。有些处理器类型编译器是不能直接支持,如SA-1100,这时可以使用与该类型处理器为同一指令集的基本处理器,比如对于SA-100,可以使用StrongARM。

注意

指定目标处理器可能使代码与其他ARM处理器不兼容。例如,编译时指定了ARMv6体系结构的代码,可能不能运行在ARM920T的处理器上(如果代码中使用了ARMv6体系结构中特有的指令)。

选择处理器类型可以使用--cpuname编译选项。该选项生成用于特定ARM处理器或体系结构的代码。


如果name是处理器名称。

·输入名称必须和ARM数据表中所示严格一致,例如ARM7TDMI。该选项不接受通配符字符。有效值是任何ARM6或更高版本的ARM处理器。

·选择处理器操作会选择适当的体系结构、浮点单元(FPU)以及存储结构。

·某些--cpu选择暗含--fpu选择。例如,当使用--arm选项编译时,--cpuARM1136JF-S暗含--fpuvfpv2。隐式FPU只覆盖命令行上出现在--cpu选项前面的显式--fpu选项。如果没有指定--fpu选项和--cpu选项,则使用--fpusoftvfp。

14.1.2调试选项

如果在编译C源程序时,设置了调试选项,这将很大程度地影响最终代码的大小和执行效率。因为带调试信息的代码映像,为了能够在调试程序时正确地显示变量或设置断点,包含很多冗余的代码和数据。所以如果想最大限度地提供程序执行效率、减少代码尺寸,就要在编译源文件时,去除编译器的调试选项。

以下选项指定调试表生成方法。

·-g(--debug):该选项启用生成当前编译的调试表。无论是否使用-g选项,编译器都生成的代码是相同的。惟一差别是调试表的存在与否。编译器是否对代码进行优化是由-O选项指定调的。默认情况下,使用-g选项等价于使用:-g-dwarf2--debug_macros。

注意

编译程序时,只使用-g选项而没有使用优化选项,编译器会提示警告信息。

·--no_debug:该选项禁止生成当前编译的调试表。这是默认选项。

·--no_debug_macros:当与-g一起使用时,该选项禁止生成预处理程序宏定义的调试表条目(Entry)。这会减小调试映像的大小。-gt-p是-gtp的同义字。

--debug_macros当与-g一起使用时,该选项启用生成预处理程序宏定义的调试表条目。这是默认选项,会增加调试映像的大小。一些调试程序忽略预处理程序条目。

14.1.3优化选项

使用-Onum选择编译器的优化级别。优化级别分别为。

·-O0:除一些简单的代码编号之外,关闭所有优化。使用该编译选项可以提供最直接的优化信息。

·-O1:关闭严重影响调试效果的优化功能。使用该编译选项,编译器会移除程序中未使用到的内联函数和静态函数。如果与--debug一起使用,该选项可以在较好的代码密度下,给出最佳调试视图。

·-O2:生成充分优化代码。如果与--debug一起使用,调试效果可能不令人满意,因为目标代码到源代码的映射可能因为代码优化而发生变化。

如果不生成调试表,这是默认优化级别。

·-O3:最高优化级别。使用该优化级别,使生成的代码在时间和空间上寻求平衡。该选项常和-Ospace和-Otime配合使用。

·-O3–Otime:使用该选项编译的代码比-O2–Otime选项编译的代码,在执行速度上要快,但占用的空间也更大。

·-O3-Ospace:产生的代码比使用-O2-Ospace选项产生的代码尺寸小,但执行效率可能会差。

如果要使编译的代码更侧重于代码的尺寸或执行效率(两者往往不可兼得),可以使用下面的编译选项。

·-Ospace:指示编译程序执行优化,以延长执行时间为代价减小映像大小。例如,由外部函数调用代替内联函数。如果代码大小比性能更重要,则使用该选项。这是编译器的默认设置。

·-Otime:指示编译程序执行优化,以增大映像大小为代价缩短执行时间。如果执行时间比代码大小更重要,则使用该选项。例如,它编译:

while(expression)body;

为:

if(expression){

dobody;

while(expression);

}

如果既不指定-Otime也不指定-Ospace,则编译器默认使用-Ospace。可使用-Otime编译代码中对时间要求严格的部分,使用-Ospace编译其余部分。但不能在同一编译程序调用中同时指定-Otime和-Ospace。

14.1.4AAPCS选项

ARM结构过程调用标准AAPCS(ProcedureCallStandardfortheARMArchitecture)是ARM体系结构二进制接口ABI(ApplicationBinaryInterfacefortheARMArchitecture【BSABI】)标准的一部分。使用该标准可以很方便的执行C和汇编语言的相互调用。

编译程序时,使用--apcs选项可以指定所使用得AAPCS标准的版本。如果没有指定--apcs或--cpu选项,则编译器使用下面默认编译选项。

--apcs/noswst/nointer/noropi/norwpi--cpuARM7TDMI--fpusoftvfp

有关AAPCS的详细信息,请参加ARM相关文档。

14.1.5编译选项对代码生成影响示例

本节举例说明编译器的优化选项如何影响代码生成。

1.使用-O0选项

下面的例子显示了即使使用-O0编译选项对代码进行编译时,有些冗余代码还是会被编译器自动清除。

intf(int*p)

{

return(*p==*p);

}

使用armcc-c-O0对源程序进行编译,生成的汇编代码如下所示。

f

MOVr1,r0

MOVr0,#1

MOVpc,lr

通过上面的例子可以看到,编译出的最终代码中没有加载(Load)指针P的值,变量*p被编译器优化掉了。如果不想让编译器对变量*p做优化,可以使用“volatile”对变量进行声明。下面的例子,显示了将变量声明为“volatile”类型后,使用armcc编译(-O2的优化级别)后的结果。

f

LDRr1,[r0]

LDRr0,[r0]

CMPr1,r0

MOVNEr0,#0

MOVEQr0,#1

MOVpc,lr

另外,编译的代码中的“MOVr1,r0”并没有实际意义,只是为了方便调试程序时设置断点使用。

声明: 本文转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们及时删除。(联系我们,邮箱:evan.li@aspencore.com )
0
评论
  • 【7.24 深圳】2025国际AI+IoT生态发展大会/2025全球 MCU及嵌入式技术论坛


  • 相关技术文库
  • C语言
  • 编程
  • 软件开发
  • 程序
  • 51单片机数码管显示跑马灯程序源代码讲解

    基于51单片机学习板。用S1键作为控制跑马灯的方向按键,S5键作为控制跑马灯方向的加速度按键,S9键作为控制跑马灯方向的减速度按键,S13键作为控制跑马灯方向的启动或者暂停按键。记得把输出线P0.4一直输出低电平,...

    昨天
  • 基于ARM的智能家居控制通信控制站的设计与实现

    0 引言 物体信息化是现代社会信息化建设的“催化剂”和“增倍器”。只有走集成整合信息技术以及信息数据之路,企业的信息化建设才能真正发挥作用,才能进一步推动信息建设上水平。现代物体信息化的发展,直接刺激了新生...

    前天
  • ARM中打印函数print 的几种实现方法

    1利用C库函数printf。 步骤: 1)首先需要包含头文件stdio.h。 2)然后定义文件句柄。实际上就是一个int型变量封装在结构体中。 struct__FILE{inthandle;}; 3)定义FILE__stdout;FILE即为__FILE,通过stdio.h宏定义。...

    前天
  • 有关C51的编程规范

    简介:编程首要是要考虑程序的可行性,然后是可读性、可移植性、健壮性以及可测试性。这是总则。但是很多人忽略了可读性、可移植性和健壮性(可调试的方法可能歌不相同),这是不对的。 下面就来说说有关C51的编程规...

    07-08
  • 光立方程序编写步骤

    基于51单片机的4*4*4光立方程序实现原理及程序代码。LED光立方的复位电路、时钟电路、每层LED灯电路控制逻辑,系统总原理图,工作流程及相关C语言源码实现。希望能够对你学习了解LED光立方程序编写及LED立方实体制...

    07-04
  • 封装继承多态

    封装: 封装是实现面向对象程序设计的第一步,封装就是将数据或函数等集合在一个个的单元中(我们称之为类)。被封装的对象通常被称为抽象数据类型。 封装的意义: 封装的意义在于保护或者防止代码(数据)被我们无意中...

    07-04
  • 封装是什么意思?

    即隐藏对象的属性和实现细节,仅对外公开接口,控制在程序中属性的读和修改的访问级别;将抽象得到的数据和行为(或功能)相结合,形成一个有机的整体,也就是将数据与操作数据的源代码进行有机的结合,形成“类”,其中...

    07-04
  • 超声波模块测距51程序_单片机超声波测距c语言

    超声波检测原理 超声波测距的程序流程图 程序如下: //超声波模块程序 //超声波模块程序 //Trig = P2^0 //Echo = P3^2 #include #define uchar unsigned char #define uint unsigned int // void delay(uint z) {...

    07-01
  • 大佬带你看嵌入式系统,嵌入式系统该学习什么?

    嵌入式系统是当今的热门系统之一,在诸多领域,嵌入式系统都有所应用。为增进大家对嵌入式系统的认识,小编将为大家介绍嵌入式系统是一个什么样的专业,以及学习嵌入式系统该学习哪些内容。如果你对嵌入式系统具有...

    06-27
  • c51单片机编程要点总结

    c51单片机编程要点总结 1、头文件:#include (我用的是 STC 89C54RD+) 2、预定义:sbit LED = P1^0// 定义 P1 口的 0 位为 LED 注:“P1^0”这个写法,与 A51 不同(A51 是 P1.0),P1 是一组端口,端口号范围 0~7 注2...

    06-25
  • C语言基础知识点汇总

    总结C语言基础知识点

    06-23
下载排行榜
更多
评测报告
更多
广告