MCU性能分析新思路
eetrendMcu 2023-01-20

当前的生活节奏越来越快,对计算处理器的要求也越来越高。即使是有摩尔定律的限制,人们仍然希望在单个芯片中塞入尽可能多的晶体管。尽管现在的MCU动不动就可以跑到几十上百兆,比如NXP高能效的LPC54100系列已破100MHz大关,通用型的LPC54600系列飚到210MHz,i.MX RT1050跨界处理器甚至飞到了怪兽级的600MHz,可是在当下应付图像处理和机器学习等计算大户时,仍然免不了出现“卡”的窘境。这个时候,如果能清楚地知道最消耗性能的具体函数,就有机会制定优化性能的策略。这也是圈子里常说的“profiling”(性能分析)。

有些价格相当昂贵的专业软硬件开发工具,都会提到它们有多么超强的profiling能力,这仿佛让人觉得profiling是有钱人才能玩得起,难道作为广大工程师我们就只能缩手缩脚吗?其实不然,在软件上想一点变通的办法,使用最便宜的仿真器,就完全可以在极小的开销下,做到好用够用的强大profiling利器,丑小鸭秒变金凤凰。

性能分析新思路

下面要介绍的方法的基本思想,就是密集地定期采集PC寄存器的值,从它的概率分布上估计最占CPU的函数。采集得越久,就越接近真实情况(大数定率)。

其原理是,在Cortex-M系MCU进入中断/异常时,会自动把被打断的位置(PC)存储在堆栈中。这样我们可以用汇编写一小段入口程序,读取出入栈的PC数值,作为参数传递给处理程序的C程序主体,在主体中统计PC样本的规律。只要采集了足够久的样本,在概率论的大数定理支持下,咱们就有信心估计程序中PC最常出现的位置,也就是最占CPU时间的函数。

为了贯彻这个思想,需要准备的只有:

1.工具链产生的 .map文件。无论是KEIL, IAR, GCC,在成功构建程序后,都会产生一个map文件来记录各函数和变量的位置。从采集的PC位置,查map文件判定是什么函数。

2.系统中有一个定期产生中断的时基。常见的就是SysTick定时器的周期中断,别的timer也可以。这个中断需要优先级比较高。

3.扩写定时器中断服务程序,按照前面的思路,加入这个屌丝神器。

这样,我们就可以把占CPU最多的计算型函数请到VIP区,它们与CPU有绿色快速通道,加速它们的执行。其实这个VIP区也是分等级的,从小V到大V,特权待遇相差还是明显的,小编今后再专开一文介绍不同VIP的特权。

要想让这个思路能可靠工作,还有几个关键的小坑不要踩:

1.PC最常在的位置并非一定就是最计算密集的位置。比如,程序中经常会出现等候外设寄存器的情况,CPU几万几亿遍地查看一个外设标志。这类IO忙等的代码即使放在大V区,也无济于事。

2.定时器中断的优先级不够高。如果有高优先级的中断服务程序占用了大量CPU时间,定时器中断就没有机会采集到它们,反而是在这些中断返回时定时器中断才得到服务,结果反而冤枉了被高优先级中断给打断的位置。

3.某个函数的工作频率与相位恰好和定时器中断产生“共振”,经常有机会在进入定时器中断的前夕在这个函数中,也会误以为这个函数是最占CPU时间的。这个情况一般是罕见的。

4.CPU负载比较轻,结果大量PC都采集到idle函数中。可能有小伙伴要问了,CPU都这么咸(闲)了,还淡操什么心?这个其实要以发展的眼光来看。比如,有可能随着功能集成的增加CPU终将有不堪重负的时候,或者系统负载不均匀而表现出明显的峰谷性,又可能希望让CPU尽管做完事好进低功耗模式。 

声明: 本文转载自其它媒体或授权刊载,目的在于信息传递,并不代表本站赞同其观点和对其真实性负责,如有新闻稿件和图片作品的内容、版权以及其它问题的,请联系我们及时删除。(联系我们,邮箱:evan.li@aspencore.com )
0
评论
  • 【7.24 深圳】2025国际AI+IoT生态发展大会/2025全球 MCU及嵌入式技术论坛


  • 相关技术文库
  • 单片机
  • 嵌入式
  • MCU
  • STM
  • 3AT89C51单片机引脚说明及引脚图

    AT89C51是一种带4K字节闪烁可编程可擦除只读存储器的低电压,高性能CMOS8位微处理器,俗称单片机。该器件采用ATMEL高密度非易失存储器制造技术制造,与工业标准的MCS-51指令集和输出管脚相兼容。由于将多功能8位CPU...

    昨天
  • 51单片机对LCD1602液晶的驱动设计

    51单片机——LCD1602 1、1602液晶读写时序 (1)、读状态 RS=L,R/W=H,E=H。(判断忙完毕后释放总线) (2)、读数据 RS=H,R/W=H,E=H。 (3)、写指令 RS=L,R/W=L,D0~D7=指令码,E=高脉冲 (4)、写数据 RS=H,R/W=L,D0~D...

    昨天
  • 单片机串口如何接收不定长数据的?

    我们在使用其他STM32的单片机的时候,会发现有些困难,会发现常用的方法并不能用,在还没有接收完数据的时候,就解决不了。于是,只能用通用的方法来解决了。 这个通用的方法,其实原理和使用IDLE的原理一样:...

    昨天
  • ARM处理器的选型原则

    鉴于ARM微处理器的众多优点,随着国内外嵌入式应用领域的逐步发展,ARM微处理器必然会获得广泛的重视和应用。但是,由于ARM微处理器有多达十几种的内核结构,几十个芯片生产厂家,以及千变万化的内部功能配置组合,...

    前天
  • 有哪些低功耗设计方法?单片机系统低功耗设计要点介绍

    功耗,已经是一个老生常谈的话题了。对于功耗,大家多多少少有所了解。目前,很多产品的宣传里便带有低功耗噱头。为增进大家对功耗的认识,本文将基于两点介绍功耗:1.低功耗主要设计方法,2.单片机系统低功耗设计...

    前天
  • 8位32位MCU如何选择?如何选择合适的MCU?

    MCU,对于普通人而言,是一个高大上的存在。但是,在工业中,MCU确实常见产品。为增进大家对MCU的认识,本文将基于两点介绍MCU:1.8位MCU和32位MCU如何选择?2.如何选择合适的MCU。如果你对MCU具有兴趣,不妨继续往...

    07-09
  • ARM开发:一 ARM微处理器概述

    1.1ARM-Advanced RISC Machines ARM(Advanced RISC Machines),既可以认为是一个公司的名字,也可以认为是对一类微处理器的通称,还可以认为是一种技术的名字。 1991年ARM公司成立于英国剑桥,主要出售芯片设计技术...

    07-08
  • 分析C51单片机的一些误区和注意事项

    简介:常看见初学者要求使用_at_,这是一种谬误,把C当作ASM看待了。在C中变量的定位是编译器的事情,初学者只要定义变量和变量的作 用域,编译器就把一个固定地址给这个变量。怎么取得这个变量的地址?要用指针。 1) C...

    07-08
  • 51单片机几个延时程序

    简介:51单片机几个精确延时程序:在精确延时的计算当中,最容易让人忽略的是计算循环外的那部分延时,在对时间要求不高的场合,这部分对程序不会造成影响. 一. 500ms延时子程序(晶振12MHz,一个机器周期1us.) 程...

    07-08
  • 总结单片机软件抗干扰的几种办法

    简介:在提高硬件系统抗干扰能力的同时,软件抗干扰以其设计灵活、节省硬件资源、可靠性好越来越受到重视。下面以MCS-51单片机系统为例,对微机系统软件抗干扰方法进行研究。 1、软件抗干扰方法的研究 在工程实践中...

    07-08
  • 基于C51单片机实现汽车座椅自动控制系统的软硬件设计

    引言 随着人们生活水平的提高,对汽车座椅的舒适性要求也越来越高,要求对汽车座椅地调节能够更加简单、方便、快捷。目前,汽车座椅位置的调节多采用基于手动调节方式的机械和电动控制两种方式。汽车座椅位置的调节...

    07-02
  • MCS51单片机程序设计时堆栈的计算方法解析

    用C语言进行MCS51系列单片机程序设计是单片机开发和应用的必然趋势。Keil公司的C51编译器支持经典8051和8051派生产品的版本,通称为Cx51。应该说,Cx51是C语言在MCS51单片机上的扩展,既有C语言的共性,又有它自己...

    07-02
下载排行榜
更多
评测报告
更多
广告