原创 RVDS——ARM系统开发的首选工具

 2008-7-23 23:38  5307 18 19 分类: MCU/ 嵌入式

昨天一个新同事过来找我，问我安装RVDS没有，我说去年的时候用过别人安装的，但是自己没有安装过，于是就过去帮他看看，嘿嘿，由于License太少，所以安装不是那么顺利，但是总有应对的方法，最后修改mac后成功了，去年也只是在应用els的时候用到了，但是自己没有怎么真正调试过，学习了解下。

ARM公司开发的编译工具从诞生一刻起，就成为业界针对ARM处理器最有效率的工具，因为它是总结了无数经验技巧，由ARM处理器的开发者ARM公司推出的开发工具。而许多前人的经验技巧就隐藏在编译器的某个角落里，等待着你去发现并加以利用。
本文就将与大家分享一些鲜为人知，但却可能使你大吃一惊的ARM编译、链接工具使用方法。

1.系统高效的关键字
    自从可编程的处理器出现之后，软件程序员就没有停止过对代码优化、代码高效的追求。在当今世界，电子产品领域每天都在更新，竞争异常激烈，单纯地追求系统能够正常运行、得到正确的结果，是远远不够的。现实要求系统开发人员在产品中实现最优化的代码。那么“高效”的具体含义是什么呢？站在开发者的角度，可以简单地归纳为以下几点：代码执行速度、代码密度、系统吞吐量和系统的功耗。毫无疑问，这4点正是衡量一个产品是否成功所需的关键字，而且这四者之间还有很多相互影响或者相互促进的联系。
    RVDS是ARM公司继SDT与ADS1.2之后主推的新一代开发工具，目前最高版本是3.0。它由RealView编译器（RVCT）、RealView汇编器（armasm）、RealView链接器（armlinker），以及RealView调试器（RVDebugger）组成。值得一提的是，在以上所提到的关键字中，有很多（如代码密度的提升、代码执行速度的提高）都可以由ARM开发工具RVDS自动实现，而不需要软件开发人员花费过多的时间手动优化高级语言代码。这也正是RVDS的优势所在。
    由于很多嵌入式软件工程师都对ARM的开发工具RVDS非常熟悉，很多OEM厂商都在使用ARM
    RVDS作为主要开发工具进行产品开发。所以本文将重点介绍ARM
RVDS工具的简单内部工作机理，这部分内容常常会被忽略，而掌握了这些内容很可能会帮助我们编写出更高效的代码。

2.使用RVDS编译器实现高效代码
   RVCT是RVDS的编译工具，它可以提供多种优化级别，帮助开发人员完成代码密度与代码执行速度上的不同层次优化。此外，RVCT的很多编译特性还可以帮助开发人员进一步提升代码效率。
   2.1 RVCT的优化级别与优化方向
    提到RVCT就不能不提armcc的4个优化级别和2个编译选项，分别是-O1、-O2、-O3、-O4，以及-Otime、-Ospace。-Ospace和-Otime负责提供代码优化的大方向，告知编译器编译任务的主要目标是代码密度（-Ospace）还是代码性能（-Otime）；而-O1、-O2、-O3、-O4则分别代表4种逐次递进的不同优化级别。
（1）Ospace还是Otime？
    显然代码密度与代码执行速度在很多情况下是一对矛盾体。以下面的代码为例。例1中左右两段代码可以完成相同的任务，但是左边的有较高的代码密度，右边的则有较高的执行速度。因为当expr = 0且标志循环结束时，右边的代码可以顺序执行下去；而左边代码必须先跳转至循环体首部判断expr的值，随后再跳转至循环体尾，继续执行下一条指令。
   例1 代码执行速度与代码密度的对比。
      　　while (expr) {if (expr) do {
      　　　　　　do
      　　　　body;{ body; }
      　　　　　　while (expr);
      　　　　}　　}
    那么什么时候使用Otime，什么时候使用Ospace呢？这需要开发人员根据系统实际需求来决定，最好是在两者之间找到一个合适的平衡点，而不是单纯地追求高速度或者小尺寸。也就是针对不同的代码模块根据其特性分别使用不同的编译选项。
    此外，RVCT编译器支持很多非常有用的编译选项，如--no_inline（取消所有代码的内联函数）、--split_ldm（限制LDM/STM指令的最大操作寄存器数目）、--split_sections（将每个函数，而不是源文件，作为一个编译单元进行操作）等。
    编译器的所有这一切都可以严格满足开发者的要求，帮助开发人员得到系统真正需要的优化过的代码。
   （2）O3还是O2？
    老的开发工具(如ADS1.2)中，只有3种递进的代码优化级别。对应3种编译选项，即-O0（Minimum optimization）、-O1（Restricted optimization）和-O2（High optimization ）。使用-O0编译选项时，RVCT编译器只对代码进行最基本的优化操作，编译结束后用户得到的代码与用户手写源代码之间的差距很小。这种特性的主要作用是方便用户在程序开发阶段的调试工作，避免由于优化而产生的调试屏障。此外，很多资深软件工程师偏向于手写优化代码，在这种情况下，由于代码已经被优化过，可以使用-O0编译选项以减小RVCT的工作量，节省编译链接的时间。
    -O1与-O2则是相对于-O0更加高级别的编译优化选项。前者提供有限的优化，后者可对代码进行较大程度的优化改进操作。RVDS中新增加了-O3（Maximum optimization）编译选项，它可以最大程度地发挥RVCT编译器的优势，将代码编译成最优。-O3与-O2都是较高级别的编译优化选项，但-O3的主要优势有以下几点。当用户使用O3选项时：
   编译器会自动对代码进行髙阶标量优化，即编译器根据代码特点，针对循环、指针等进行髙阶优化；编译器会把尽可能多的函数编译为内联（inline）函数；multifile compilation功能被自动使能。
   （3）对于循环与指针的髙阶优化
     当编译选项为-O3
    -Otime时，RVCT会根据代码的具体情况，针对循环、指针等部分进行髙阶优化，如循环解开、融合、位置调整、指针优化等。以例2的函数为例。
    例2 一段简单的C循环函数，在循环中含有数组指针调用。
      CodeA
      void increment(int *restrict b, int *restrict c) {
      　　int i;
      　　for (i=0; i<100; i++) {
      　　　　c=b + 1;
      　　}
      }
      CodeB
      　　void increment(int *b, int *c) {
      　　　　int i;
      　　　　int *pb, *pc;
      　　　　int b3, b4;
      　　　　pb=b-1; pc="c-1";
      　　　　b3=pb[1];
      　　　　for (i = (100 / 2); i != 0; i--) {
      　　　　　　b4 = *(pb += 2);
      　　　　　　pc[1] = b3 + 1;
      　　　　　　b3 = pb[1];
      　　　　　　*(pc += 2) = b4 + 1;
      　　　　}
      　　}
   仔细观察可以发现，CodeA与CodeB可以实现同样的功能，即将数组b的每个成员加1赋值给数组c的对应成员。但是与CodeA相比，CodeB具有更高的执行速度。主要体现在：
① 循环100次变成了循环50次，减少了跳转次数；
② 数组变成了指针，减少了每次计算数组偏移量的指令；
③ 微调了不同代码操作的执行顺序，减少了流水线stall的情况
④ 循环从++循环变成了--循环，可以使用ARM指令的条件位，为每次循环减少了一条判断指令。
    很多程序员就是通过手写不同的C代码，提高了代码执行效率。在RVDS中，使用-O3 -Otime编译选项，RVCT会自动帮助程序员进行这些髙阶标量优化，即直接将CodeA优化成以前由CodeB才能得到的汇编代码。虽然优化之后函数的代码尺寸大于原先的函数，但是执行速度也大大提高。经过统计，使用EEMBC benchmarking，-O3编译选项编译得到的最终代码平均性能相对于O1可以有10％的提升，而总体代码尺寸只增加了1%。

2.2 multifile compilation
     按照传统的编译方式，先把各个C或C++文件单独编译成.obj文件，再将这些目标文件链接在一起。虽然在编译单独的C或C++文件时，编译器会充分发挥其优化特性；但此时编译器无法关注到大量的C或C++文件接口之间可以优化的部分。所以在传统的编译结果里，还有许多优化的余地。如何才能让编译器同时关注和编译所有的源代码呢？
     multifile compilation是RVDS一个较新的特性，它可以帮助开发人员将所有的源文件作为一个compilation unit进行编译，并最终生成一个大的目标文件。mutifile compilation给软件开发人员带来的直接优势有以下几点：
     ① 增大了inline的可能性。由于inline只能发生在一个compilation unit中，所以在没有使用mutifile compilation时，inline只能发生在一个源文件范围内。multifile compilation将一个compilation unit扩大到了所有源文件的范围上，所以直接增加了inline发生的几率。
     ② 增大了基地址与函数间优化的可能性。同inline一样，所有的基地址与函数间的优化也必须在一个compilation unit中，随着conpilation unit的扩大这种优化的可能性也增加了。
     ③ 降低了scatter file的复杂性。

还在网上搜到了一篇英文参考手册：

写原创有奖励！2025面包板原创奖励正在进行中

最新发表 推荐阅读 明星博主 原创博文 年度排行 博文排行博文评论 FPGA/CPLD MCU/ 嵌入式模拟电源/新能源测试测量通信智能手机处理器与DSP PCB 汽车电子消费电子智能硬件物联网软件与OS 采购与分销供应链管理工程师职场 EDA/ IP/ 设计与制造无人机机器人/ AI 医疗电子工业电子管理


 写博文

 点赞（18）

 收藏

分享到： 
 

上一篇：手记

下一篇： [转]散兵游勇难承IC产业梦想大量公司倒闭

PARTNER CONTENT

换一换> 更多>

案例分享 | 高效节能，性能卓越！汉高三防漆为电动汽车充电系统披上"隐形铠甲"

汉高 2025-03-21

文章评论（1条评论）
登录后参与讨论

您需要登录后才可以评论登录 | 立即注册

用户377235 2012-6-12 22:35

ky

回复

用户1483969 2009-4-5 10:08

分享了

回复

ilove314_323192455 2009-2-23 22:28

下载后按下面的顺序命名，然后解压

回复

用户1378728 2009-2-23 21:28

楼主大人，分卷不够，无法解压啊！

回复

ilove314_323192455 2008-5-23 22:50

呵呵，这个东西要下功夫才学得好，多想多练，理论实践都要有

回复

用户1417739 2008-5-23 13:32

谢了.我也是个爱好者.但是水平不怎么的.刚学呢.

回复

查看更多评论

相关推荐阅读

用户1268540 2010-09-16 22:32

[转]使用MVTools低功耗验证经验分享

Browse > Home / 信息中心 / SNUG / 2010论文集 / 使用MVTools低功耗验证经验分享使用MVTools低功耗验证经验分享王福君 fujun_wang@pa...

用户1268540 2009-12-16 22:56

在VMM验证环境中使用ESL模型

在VMM验证环境中使用ESL模型Using ESL model in VMM verification environment王志鹏, 徐争HiSilicon Technologies Co., Lt...

用户1268540 2009-12-16 22:54

基于VMM的寄存器抽象层验证

本文介绍了Synopsys公司推出的基于VMM的寄存器抽象层验证技术和方案，简称RAL（Register Abstraction Layer）。该技术是Synopsys针对芯片验证中如何简便、高效地完...

用户1268540 2009-03-29 20:33

VCS + Debussy 仿真的大概过程

1、调用debussy dump wave的函数；2、先加上debussy命令用VCS编译；3、再用debussy编译一遍工程；（2和3可以合在一起）4、最后自动打开工程波形。在仿真文件的顶层中加入如...

用户1268540 2009-03-18 21:59

[转]VMM验证方法在AXI总线系统中的实现

片验证越来越像是软件而不是硬件工作，这点已逐渐成为业界的共识。本文以软件工程的视角切入，分析中科院计算所某片上系统(SoC)项目的验证平台，同时也介绍当前较为流行的验证方法，即以专门的验证语言结合商用...

用户1268540 2009-01-10 23:03

串行RapidIO: 高性能嵌入式互连技术(图)

行RapidIO（SRIO）针对高性能嵌入式系统芯片间和板间互连而设计，是未来十几年中嵌入式系统互连的最佳选择之一。与传统嵌入互连方式的比较图1展示了RapidIO互连在嵌入式系统中的应用。随着高性能...

用户1268540

文章：48 阅读：147661 评论：12 赞：659

 好友  私信个人主页

文章 48

原创 0

阅读 147661

评论 12

赞 659

最新评论更多

写的好，学习了，好产品

开发工匠 ... 评论博文 2025-4-11

芯原发布高效的VC9000D_LCEVC视频解码器， ...

eeNick : 多谢分享破除迷信欧美日的技术，改为虚心学习并赶上，提高国货品质而努力，才对得起世界工业第一大国的称号，做好 ...

bruce小肥羊 ... 评论博文 2025-4-10

超低谐波失真的电容测试数据大公开（原创） ...

开发工匠 : 写的好，学民门牌号参考，大师之作，很实用。不敢称大师，工匠也不好（小日本的工匠精神已经成为了躬匠和死板的 ...

bruce小肥羊 ... 评论博文 2025-4-10

超低谐波失真的电容测试数据大公开（原创） ...

最新博文

Wi-Fi 7来了，和Wi-Fi 6相比有哪些区 ...

[完结14章]Vue3.5+Electron+大模型跨 ...

微软、谷歌、阿里云围剿下的亚马逊AWS ...

资料下载

本周热帖

车规级功率半导体技术现状、挑战与发 ...

IGBT图解

如何使用英飞凌IGBT7设计高性能伺服驱 ...

C#+WPF+Opencv模块化开发视觉对位运动 ...

电源工程师技术培训-初级

联发科IoT新料G520(MT8371)/G720(MT83 ...

CV8788对比Lattice HDMI TX芯片！性能 ...

【拆解】拆解一款定制10000mAh充电宝- ...

MDD超快恢复二极管在高频开关电源中的 ...

光耦：光与电的联系

最新资讯

芯语最新

只要三个分立器件，就能将PWM连接至开 ...

在月亮上造电池？可以将成本降低99% ...

再反制！中国对美加征关税税率提高至1 ...

从自愿离职到强制裁员，谷歌再裁数百 ...

再反制！中国对美国商品加征关税提升 ...

热稳定DRAM 外围晶体管技术

光学计算的演变

超11GWh！亿纬锂能等3企又签储能大单 ...

引领储能革新？精控能源出击ESIE2025 ...

AI含量拉满！TOP25+储能企业竞逐 ...

EE直播间
更多

利用高性能源表和强大的软件，实现半导体参数的测试和分析直播时间： 04月17日 10:00

在线研讨会
更多

多物理场仿真在半导体制程中的应用

迈来芯新一代经济型热成像技术：赋能电力电子过热保护与智能应用温度监控

ADI 应用于电池管理系统 (BMS) 的电芯监测解决方案

利用氮化镓技术打造高效电机驱动——人形机器人、无人机与电动汽车应用

热门推荐

汽车用卸负载电阻低价方案
多物理场仿真在半导体制程中的应用
工程师必看：B2900隐藏的15个超频测试模式
汽车照明系统的“智慧大脑”，竟然是它？》

我要评论

 1

 18



 分享到微信

 分享到微博

 分享到QQ

 点击右上角，分享到朋友圈我知道啦

请使用浏览器分享功能我知道啦

关闭站长推荐 /3

2025第1期拆解活动：赢示波器、运动相机、热像仪等！

示波器、影石运动全景相机、大疆无人机、高清红外热成像仪；树莓派5等等

【在线研讨会】多物理场仿真在半导体工艺中的应用

聚焦 COMSOL 仿真软件在半导体制程中的广泛应用，内容涵盖晶圆制备、光刻、沉积、刻蚀、离子注入、热处理，以及平坦化等前道工艺过程中各种多物理场现象的模拟和分析。

泰克示波器五折来袭！

泰克限时五折！全球示波器用户狂欢，软件升级超值优惠，速抢！

原创 RVDS——ARM系统开发的首选工具

文章评论（1条评论）

用户377235 2012-6-12 22:35

用户1483969 2009-4-5 10:08

ilove314_323192455 2009-2-23 22:28

用户1378728 2009-2-23 21:28

ilove314_323192455 2008-5-23 22:50

用户1417739 2008-5-23 13:32