原创 C语言编程修炼之优化篇

2007-3-9 16:18 4018 4 6 分类: MCU/ 嵌入式

C语言编程优化篇:

 

1、选择合适的算法和数据结构


应该熟悉算法语言,知道各种算法的优缺点,具体资料请参见相应的参考资料,有
很多计算机书籍上都有介绍。将比较慢的顺序查找法用较快的二分查找或乱序查找
法代替,插入排序或冒泡排序法用快速排序、合并排序或根排序代替,都可以大大
提高程序执行的效率。.选择一种合适的数据结构也很重要,比如你在一堆随机存
放的数中使用了大量的插入和删除指令,那使用链表要快得多。
数组与指针语句具有十分密码的关系,一般来说,指针比较灵活简洁,而数组则比
较直观,容易理解。对于大部分的编译器,使用指针比使用数组生成的代码更短,
执行效率更高。但是在Keil中则相反,使用数组比使用的指针生成的代码更短。。


2、使用尽量小的数据类型


能够使用字符型(char)定义的变量,就不要使用整型(int)变量来定义;能够使用
整型变量定义的变量就不要用长整型(long int),能不使用浮点型(float)变量就
不要使用浮点型变量。当然,在定义变量后不要超过变量的作用范围,如果超过变
量的范围赋值,C编译器并不报错,但程序运行结果却错了,而且这样的错误很难
发现。
在ICCAVR中,可以在Options中设定使用printf参数,尽量使用基本型参数(%c、
%d、%x、%X、%u和%s格式说明符),少用长整型参数(%ld、%lu、%lx和%lX格式说明
符),至于浮点型的参数(%f)则尽量不要使用,其它C编译器也一样。在其它条件不
变的情况下,使用%f参数,会使生成的代码的数量增加很多,执行速度降低。

 

3、使用自加、自减指令


通常使用自加、自减指令和复合赋值表达式(如a-=1及a+=1等)都能够生成高质量的
程序代码,编译器通常都能够生成inc和dec之类的指令,而使用a=a+1或a=a-1之类
的指令,有很多C编译器都会生成二到三个字节的指令。在AVR单片适用的ICCAVR、
GCCAVR、IAR等C编译器以上几种书写方式生成的代码是一样的,也能够生成高质量
的inc和dec之类的的代码。

 

4、减少运算的强度


可以使用运算量小但功能相同的表达式替换原来复杂的的表达式。如下:


(1)、求余运算。


    a="a"%8;
可以改为:
    a="a"&7;
说明:位操作只需一个指令周期即可完成,而大部分的C编译器的“%”运算均是调
用子程序来完成,代码长、执行速度慢。通常,只要求是求2n方的余数,均可使用
位操作的方法来代替。

 

(2)、平方运算


    a="pow"(a,2.0);
可以改为:
    a="a"*a;
说明:在有内置硬件乘法器的单片机中(如51系列),乘法运算比求平方运算快得多
,因为浮点数的求平方是通过调用子程序来实现的,在自带硬件乘法器的AVR单片
机中,如ATMega163中,乘法运算只需2个时钟周期就可以完成。既使是在没有内置
硬件乘法器的AVR单片机中,乘法运算的子程序比平方运算的子程序代码短,执行
速度快。
如果是求3次方,如:
    a="pow"(a,3.0);
更改为:
    a="a"*a*a;
则效率的改善更明显。

 

(3)、用移位实现乘除法运算


    a="a"*4;
    b="b/4";
可以改为:
    a="a"<<2;
    b="b">>2;
说明:通常如果需要乘以或除以2n,都可以用移位的方法代替。在ICCAVR中,如果
乘以2n,都可以生成左移的代码,而乘以其它的整数或除以任何数,均调用乘除法
子程序。用移位的方法得到代码比调用乘除法子程序生成的代码效率高。实际上,
只要是乘以或除以一个整数,均可以用移位的方法得到结果,如:
    a="a"*9
可以改为:
    a=(a<<3)+a

 

5、循环


(1)、循环语
对于一些不需要循环变量参加运算的任务可以把它们放到循环外面,这里的任务包
括表达式、函数的调用、指针运算、数组访问等,应该将没有必要执行多次的操作
全部集合在一起,放到一个init的初始化程序中进行。

 

(2)、延时函数:


通常使用的延时函数均采用自加的形式:
    void delay (void)
    {
unsigned int i;
    for (i=0;i<1000;i++)
    ;
    }
将其改为自减延时函数:
    void delay (void)
    {
unsigned int i;
        for (i=1000;i>0;i--)
    ;
    }
两个函数的延时效果相似,但几乎所有的C编译对后一种函数生成的代码均比前一
种代码少1~3个字节,因为几乎所有的MCU均有为0转移的指令,采用后一种方式能
够生成这类指令。
在使用while循环时也一样,使用自减指令控制循环会比使用自加指令控制循环生
成的代码更少1~3个字母。
但是在循环中有通过循环变量“i”读写数组的指令时,使用预减循环时有可能使
数组超界,要引起注意。

 

(3)while循环和do…while循环


用while循环时有以下两种循环形式:
unsigned int i;
    i="0";
    while (i<1000)
    {
        i++;
   //用户程序
    }
或:
unsigned int i;
    i="1000";
    do
    i--;
    //用户程序
    while (i>0);
在这两种循环中,使用do…while循环编译后生成的代码的长度短于while循环。

 

6、查表


在程序中一般不进行非常复杂的运算,如浮点数的乘除及开方等,以及一些复杂的
数学模型的插补运算,对这些即消耗时间又消费资源的运算,应尽量使用查表的方
式,并且将数据表置于程序存储区。如果直接生成所需的表比较困难,也尽量在启
了,减少了程序执行过程中重复计算的工作量。

 

 

7.使用宏定义


  在C语言中,宏是产生内嵌代码的唯一方法。对于嵌入式系统而言,为了能达到性能要求,宏是一种很好的代替函数的方法。


  写一个"标准"宏MIN ,这个宏输入两个参数并返回较小的一个:


  错误做法:


#define MIN(A,B)  ( A <= B ? A : B )


  正确做法:


#define MIN(A,B) ((A)<= (B) ? (A) : (B) )


  对于宏,我们需要知道三点:


  (1)宏定义"像"函数;


  (2)宏定义不是函数,因而需要括上所有"参数";


  (3)宏定义可能产生副作用。


  下面的代码:


least = MIN(*p++, b);


  将被替换为:


( (*p++) <= (b) ?(*p++)b) )


  发生的事情无法预料。


  因而不要给宏定义传入有副作用的"参数"。


8.使用寄存器变量


  当对一个变量频繁被读写时,需要反复访问内存,从而花费大量的存取时间。为此,C语言提供了一种变量,即寄存器变量。这种变量存放在CPU的寄存器中,使用时,不需要访问内存,而直接从寄存器中读写,从而提高效率。寄存器变量的说明符是register。对于循环次数较多的循环控制变量及循环体内反复使用的变量均可定义为寄存器变量,而循环计数是应用寄存器变量的最好候选者。


  (1) 只有局部自动变量和形参才可以定义为寄存器变量。因为寄存器变量属于动态存储方式,凡需要采用静态存储方式的量都不能定义为寄存器变量,包括:模块间全局变量、模块内全局变量、局部static变量;


  (2) register是一个"建议"型关键字,意指程序建议该变量放在寄存器中,但最终该变量可能因为条件不满足并未成为寄存器变量,而是被放在了存储器中,但编译器中并不报错(在C++语言中有另一个"建议"型关键字:inline)。


  下面是一个采用寄存器变量的例子:


/* 求1+2+3+….+n的值 */
WORD Addition(BYTE n)
{
 register i,s=0;
 for(i=1;i<=n;i++)
 
 return s;
}


  本程序循环n次,i和s都被频繁使用,因此可定义为寄存器变量。


9.内嵌汇编


  程序中对时间要求苛刻的部分可以用内嵌汇编来重写,以带来速度上的显著提高。但是,开发和测试汇编代码是一件辛苦的工作,它将花费更长的时间,因而要慎重选择要用汇编的部分。


  在程序中,存在一个80-20原则,即20%的程序消耗了80%的运行时间,因而我们要改进效率,最主要是考虑改进那20%的代码。


        嵌入式C程序中主要使用在线汇编,即在C程序中直接插入_asm{ }内嵌汇编语句:


/* 把两个输入参数的值相加,结果存放到另外一个全局变量中 */
int result;
void Add(long a, long *b)
{
 _asm
 {
  MOV AX, a
  MOV BX, b
  ADD AX, [BX]
  MOV result, AX
 }
}


10.利用硬件特性


  首先要明白CPU对各种存储器的访问速度,基本上是:


CPU内部RAM > 外部同步RAM > 外部异步RAM > FLASH/ROM


  对于程序代码,已经被烧录在FLASH或ROM中,我们可以让CPU直接从其中读取代码执行,但通常这不是一个好办法,我们最好在系统启动后将FLASH或ROM中的目标代码拷贝入RAM中后再执行以提高取指令速度;


  对于UART等设备,其内部有一定容量的接收BUFFER,我们应尽量在BUFFER被占满后再向CPU提出中断。例如计算机终端在向目标机通过RS-232传递数据时,不宜设置UART只接收到一个BYTE就向CPU提中断,从而无谓浪费中断处理时间;


  如果对某设备能采取DMA方式读取,就采用DMA读取,DMA读取方式在读取目标中包含的存储信息较大时效率较高,其数据传输的基本单位是块,而所传输的数据是从设备直接送入内存的(或者相反)。DMA方式较之中断驱动方式,减少了CPU 对外设的干预,进一步提高了CPU与外设的并行操作程度。


11.活用位操作


  使用C语言的位操作可以减少除法和取模的运算。在计算机程序中数据的位是可以操作的最小数据单位,理论上可以用"位运算"来完成所有的运算和操作,因而,灵活的位操作可以有效地提高程序运行的效率。举例如下:


/* 方法1 */
int i,j;
i = 879 / 16;
j = 562 % 32;
/* 方法2 */
int i,j;
i = 879 >> 4;
j = 562 - (562 >> 5 << 5);


  对于以2的指数次方为"*"、"/"或"%"因子的数学运算,转化为移位运算"<< >>"通常可以提高算法效率。因为乘除运算指令周期通常比移位运算大。


  C语言位运算除了可以提高运算效率外,在嵌入式系统的编程中,它的另一个最典型的应用,而且十分广泛地正在被使用着的是位间的与(&)、或(|)、非(~)操作,这跟嵌入式系统的编程特点有很大关系。我们通常要对硬件寄存器进行位设置,譬如,我们通过将AM186ER型80186处理器的中断屏蔽控制寄存器的第低6位设置为0(开中断2),最通用的做法是:


#define INT_I2_MASK 0x0040
wTemp = inword(INT_MASK);
outword(INT_MASK, wTemp &~INT_I2_MASK);


而将该位设置为1的做法是:


#define INT_I2_MASK 0x0040
wTemp = inword(INT_MASK);
outword(INT_MASK, wTemp | INT_I2_MASK);


判断该位是否为1的做法是:


#define INT_I2_MASK 0x0040
wTemp = inword(INT_MASK);
if(wTemp & INT_I2_MASK)
{
… /* 该位为1 */
}


12、其它


比如使用在线汇编及将字符串和一些常量保存在程序存储器中,均有利于优化


 

上述方法在嵌入式系统的编程中是非常常见的,我们需要牢固掌握。


总结


  在性能优化方面永远注意80-20准备,不要优化程序中开销不大的那80%,这是劳而无功的。


  宏定义是C语言中实现类似函数功能而又不具函数调用和返回开销的较好方法,但宏在本质上不是函数,因而要防止宏展开后出现不可预料的结果,对宏的定义和使用要慎而处之。很遗憾,标准C至今没有包括C++中inline函数的功能,inline函数兼具无调用开销和安全的优点。


  使用寄存器变量、内嵌汇编和活用位操作也是提高程序效率的有效方法。


  除了编程上的技巧外,为提高系统的运行效率,我们通常也需要最大可能地利用各种硬件设备自身的特点来减小其运转开销,例如减小中断次数、利用DMA传输方式等。


 


                                     孙福朋  于  2006.6.18   整理

PARTNER CONTENT

文章评论2条评论)

登录后参与讨论

用户508170 2007-3-30 22:44

东西很好,如果能做成word供下载就好了老兄。

用户1279035 2007-3-14 10:12

兄台:为什么这样说呢?不知道你有何意见?
相关推荐阅读
用户1279035 2007-03-16 17:04
步进电机的控制原理及其单片机控制实现
                        步进电机的控制原理及其单片机控制实现摘要:采用8051单片机来控制步进电机,给出了步进电机的控制原理及其单片机控制的具体实现方法。关键词:步进电机;单片...
用户1279035 2007-03-09 17:24
51单片机模拟串口的三种方法
51单片机模拟串口的三种方法随着单片机的使用日益频繁,用其作前置机进行采集和通信也常见于各种应用,一般是利用前置机采集各种终端数据后进行处理、存储,再主动或被动上报给管理站。这种情况下下,采集会需要一...
用户1279035 2007-03-09 17:13
KeilC51高级编程
第一节 绝对地址访问C51提供了三种访问绝对地址的方法:1. 绝对宏:在程序中,用“#include”即可使用其中定义的宏来访问绝对地址,包括:CBYTE、XBYTE、PWORD、DBYTE、CWOR...
用户1279035 2007-03-09 16:43
C语言嵌入式系统编程修炼吐
屏幕操作 现在要解决的问题是,嵌入式系统中经常要使用的并非是完整的汉字库,往往只是需要提供数量有限的汉字供必要的显示功能。例如,一个微波炉的LCD上没有必要提供显示"电子邮件"的功能;一个提供汉字显示...
用户1279035 2007-03-09 16:40
C语言嵌入式系统编程修炼
同于一般形式的软件编程,嵌入式系统编程建立在特定的硬件平台上,势必要求其编程语言具备较强的硬件直接操作能力。无疑,汇编语言具备这样的特质。但是,归因于汇编语言开发过程的复杂性,它并不是嵌入式系统开发的...
用户1279035 2007-03-09 16:37
C语言嵌入式系统编程修炼[整理]
C语言嵌入式系统编程修炼数据指针  在嵌入式系统的编程中,常常要求在特定的内存单元读写内容,汇编有对应的MOV指令,而除C/C++以外的其它编程语言基本没有直接访问绝对地址的能力。在嵌入式系统的实际调...
EE直播间
更多
我要评论
2
4
关闭 站长推荐上一条 /3 下一条