原创 MCU需要改进

2008-10-23 20:13 1997 6 7 分类: MCU/ 嵌入式

长久以来,计算机系统的抗干扰一直是人们关心的重要问题,因为计算机用得越来越广,可靠性越来越重要,而抗干扰本身就是可靠性的重要组成部分。为了汽车、飞机、卫星、反应堆的安全,人们在抗干扰问题上花费了大量精力与金钱,尽管已经取得了长足的进展,但在性价比上远不能满足要求,以致高抗干扰的要求只是在高技术领域才加以考虑。本文讨论了干扰对错误的形成机制,提出了对MCU改进的建议。这个建议如果实施,不仅有利于高技术领域的应用,也会惠及一般的民用领域。


1 干扰源的讨论
很久以前,还在“8031+2764+14433”的年代,我们做了一批过程监控仪表,用于灭菌过程F0的监控,遇到了强烈的干扰问题。灭菌过程约30 min,由电触点压力表控制进气电磁阀,间接控制温度。F0是一个温度函数的积分值,可以反映灭菌的效果,它综合考虑了温度波动的影响。当时采取了一些抗干扰措施,例如,硬件上对信号线屏蔽,信号滤波;软件上的智能滤波,程序复执,程序分段保护,数据后备,端口等重复初始化,ROM的定时校验和检验,多种出错报警,出错时重新热启动(可使问题有所缓和,但偶然会有判为ROM校验和错而停机的情况出现)。由于当时F0只是用作参考,问题尚不严重,如要掩盖,也可以用热启动代替停机;但很快F0要作为产品工艺参数,用记录纸备案,于是就重新设计了监控仪。新的监控仪用89C51+14433,再加上光耦和T15617 D/A转换器,将温度和F0变为模拟量后送到双笔记录仪,实现产品工艺过程的记录与存档。硬件上,光耦隔离后部分是D/A和模拟电路,软件在原有基础上添加与T15617有关的串行通信部分。T15617的串行通信类似I2C,由CS、DIN和SCLK三条线构成,SCLK数据位时钟可达到25 ns,速度很高。用于计算的周期是6 s,仪表用定点算法配以查表,所以留出了充足的时间做许多抗干扰的工作。在D/A用的串行通信中甚至考虑了多次重复发送的子程序,希望减少通信错误的影响;但结果却很坏,记录纸上是一片墨带。由于不知道通信对错,很可能最后一次传送就是错的,于是不得不重新处理抗干扰问题。
经查干扰主要发生在电磁阀动作的时候,由于不可能在现场为每一个简单的小表制作一个良好的地线,一般的市售电源滤波器件根本不起作用。现场用的是220 V交流电磁阀,无法设计缓冲线路。分析认为,电磁阀断开时会在电源上产生很大的反向电压。交流电源的示波器受到干扰,在无法看清干扰的情况下,就用数字万用表观察,可以观察到1 300 V以上的读数。考虑到数字万用表输入的滤波效果,真正的峰值还要大,因此推想,高频的干扰穿越了变压器绕组间电容,造成变压器次级交流电压瞬间反向。尽管反向波幅的衰减很大,但因方向已改变,整流二极管来不及响应,已不供电,而滤波的电解电容器动态上来不及反应,也不供电,造成稳压前直流电源瞬间下降。同时它通过整流二极管,78L15、78L05等低频器件到达二组隔离的电源,造成直流电源跌落。循此思路,发现TI5617的SCLK可能出现不正确的时钟信号,造成数据传送的错误。TI5617的读数发生在SCLK的下降沿,说明书上强调,在非传送时减少馈通应使SCLK=LOW,为节省电流消耗,SCLK是从光耦的基极输出的。因此若光耦次级电源跌落,确实会造成SCLK下降而误读。然后我们在基极电阻(20 kΩ)上并联0.1μF电容,在光耦次级电源上串接高频二极管,以防0.1μF电容器通过光耦反向放电。采取此措施后,记录曲线不再有墨带。对本应用而言,干扰问题初步解决,但仍不彻底。干扰得到解决本身证实了分析是正确的——来自电源的干扰有可能进到直流电源部分。
国际标准ISO7637是针对汽车电子领域电源的传导干扰问题的。它规定有#1、#2a/b、#3a/b、#4、#5a/b等多种测试波形,反映实际应用中会遇到的情形。其中,关断感性负载(例如雨刮器的马达)引起的电压升高,在12 V系统中可达50 V,虽有瞬间超过元器件耐压而引起损伤的可能性,但不会直接引起误动作。而在波形#1中,关断感性负载(例如电动座椅的马达和座椅的加热系统)产生的脉冲,在电源为12 V的系统中1 μs可达到一100 V,衰减到10%的时间为2 ms。在波形#3a中,电源为12 V的系统里5 ns可达到-138 V,回到0 V的时间大约为100 ns。这些是典型数据,实际上电源线不是匹配的传输线,干扰波还要来回反射,情况更为复杂。在这些场合,也可能发生直流电源的跌落干扰。
空间的幅射干扰也是经常遇到的问题,例如在太空或反应堆附近,电子器件会受到重离子的轰击而产生故障;又如在空港区或大电流、高电压区域,电子器件也会受到强电磁辐射而发生故障。在这些场合,干扰也会引起MCU的基本门电路工作失误。


2 Watchdog不能解决软件可靠性问题
Vcc的跌落会引起MCU的误动作。MCU里每一个读/写操作都是由门电路实现的,门的开关依赖于门的阈值和信号的时序。电源跌落时阈值发生变化,振荡器产生的信号时序也会变形。下面以8051单片机为例,考察如果干扰发生在执行指令“MOV dirl,dir2”时会产生什么后果。假定错误发生在指令的第1字节,最坏的情形是每个bit都反转,而最大的概率是只有一个bit发生反转。一个bit发生反转的情况如表1所列。


200891119132226577801.jpg


从表1可见,一个bit的变化完全改变了指令的意义,程序流或数据产生不可预测的变化。例如,表中的跳转部分(bit 0,2或5发生变化)可能不转入死循环,不引起Watchdog动作,也有可能跳到非正常指令处,直至死循环。表中非跳转指令则有可能改变累加器(bit 0,1,3,4,6或7发生变化),数据RAM(bit 1,3,6或7发生变化)或状态寄存器(bit 0,1,3,4,6或7发生变化)。如果错误发生在指令的第2或第3字节,数据的源或目的地址就错了。因此,即使Watchdog没动作,也不表示程序运行正常。对8051其他指令作分析可得到类似的结果。由此可见,Watchdog至多保证系统不死机,却有可能掩盖了数据的错误。
F0设计中,在关键点大量采用了“MOV dirl,tmp’,“MOV tmp,dir2”的形式将数据从dirl送到dir2,而不采用“MOV A,@R1”类指令,以减小对原始数据破坏的可能性,从而为程序复执创造条件。例如在备份数据Treh到Tbkh时,先将Treh送tmp1,然后将数据由tmp1送到备份Tbkh,再校验Tbkh与Treh是否一样。若不一样,就重作备份。采用的部分程序如下:


200891119132234377802.jpg


其中“MOV A,tmp1”仍有破坏tmp1的可能性,但tmp1是Treh的拷贝,坏了可重做;“XRL A,Treh'’有可能破坏Treh,但已无法作其他选择。
在硬件抗干扰方面,有许多专用的电源监控芯片,如TL7705等,但是它们只适合在较慢的电源扰动下使用。对于直流电源的跌落干扰,MCU根本来不及作现场的保护工作,所以它不是解决快速干扰问题的办法。
在F0中使用的办法也不尽完善,一般单片机线路中还有很多外围线路,例如F0中的光耦,3个光耦同时导通时要消耗约50 mA的电流,它们形成的动态电阻很小,发生电源跌落时,并联于MCU的解耦电容对此电阻放电,无法保证MCU正常工作的额定电压。如在MCU电源中串接高频二极管,就会引起额外的电源消耗,在低功耗的应用中也会形成新的缺点。有些功能强大的MCU本身功耗就大,容许的电源变化范围小,能否依靠解耦电容对抗电源跌落还需要检验。综上所述,软件解决办法不彻底,硬件解决办法也有很多缺点与限制。



3 MCU要增加的功能
由于干扰而使指令出错的问题不是watchdog能解决的,特别是造成源数据错时,程序复执也不能纠正错误的结果。程序设计者要在现成的指令体系中找到对源数据危害性概率最小的指令不容易。即使找到,也不能保证指令在有多bit跳变时源数据不错。另外,有些指令错误也可能破坏其他处的数据。利用破坏数据概率最小的指令设计程序也不是好办法,它既耗ROM空间,又费运行时间。
增大指令的Hamming距离可以改善这一情况。例如,给指令增加一到数位校验位,一旦指令通不过校验,就不执行,并重新取指。这样,问题就有可能在产生后果前解决。就目前MCU的设计与生产水平而言,在技术与成本上这种增加不会有很大困难。虽然这一办法在添加的校验位有限时仍会有一定出错概率,但这种概率可以小到能接受的程度。
为了更为可靠,作校验的线路可有某种冗余。连续重取指可能反映有其他故障,应通过某种方式通知应用层。为了不打扰程序设计者,这些指令的添加位应该在写入ROM时自动生成,这样就不会产生与现有产品的兼容性问题。
在早期的MCU应用中,Watchdog是外置的,后来都集成到MCU里面去了。如果实现上述功能,MCU的抗干扰能力会更强,Watchdog可能就不需要了。软件的可靠性分析就可以将程序走飞和数据的完整性问题分割出来加以处理,软件部分更专注于逻辑分析,意义深远。

PARTNER CONTENT

文章评论1条评论)

登录后参与讨论

用户1090342 2008-10-23 21:13

这个思路是好的,但只考虑了弥补取指过程被干扰的问题,却忽略了其它重要部件被干扰的问题,如ALU、数据存取、输入输出模块以及其它片内资源。 所以总体上来讲,这个提案只能减少受干扰的范围但不能根本解决问题。取指电路只占MCU中所有电路的很小一个部分,只解决一个点而不是一个面,与一个点都不解决分别不大。

wang1jin 2007-12-23 15:28

哈哈.不错.顶一下.
相关推荐阅读
burkett2011_327610014 2010-11-21 15:19
RT-Thread 国产嵌入式操作系统
RT-Thread是一国内开源的实时嵌入式操作系统,所有代码遵循GNU GPLv2许可证发布。首先RT-Thread是一个实时操作系统核心,完全符合实时系统的特征,做到了硬实时的要求。这个核心同时也是...
burkett2011_327610014 2010-08-12 19:46
EDN换礼,圈圈的书和学习套件已经收到,支持EDN
圈圈的书和学习套件已经收到,EDN速度真快,谢谢EDN,谢谢huangna!...
burkett2011_327610014 2009-11-15 20:15
一名25岁的董事长给大学生的忠告
一、读大学,究竟读什么?   大学生和非大学生最主要的区别绝对不在于是否掌握了一门专业技能……一个经过独立思考而坚持错误观点的人比一个不假思索而接受正确观点的人更值得肯定……草木可以在校园年复一年地生...
burkett2011_327610014 2009-11-15 20:13
电子信息专业学生,出来之后要干什么呢?
如果从工程师和研究生的专业方向来看,电子信息专业的方向大概有1)数字电子线路方向。从事单片机(8位的8051系列、32位的ARM系列等等)、FPGA(CPLD)、数字逻辑电路、微机接口(串口、并口、U...
burkett2011_327610014 2009-11-08 11:26
ARM微处理器运行模式
  ARM微处理器支持7种运行模式,分别为:        用户模式(usr):ARM处理器正常的程序执行状态;        快速中断模式(fiq):用于高速数据传输或通道管理;        外部...
burkett2011_327610014 2009-11-07 22:15
可以让你少奋斗10年的工作经验
 0推荐第一:不要认为停留在心灵的舒适区域内是可以原谅的。      每个人都有一个舒适区域,在这个区域内是很自我的,不愿意被打扰,不愿意被push,不愿意和陌生的面孔交谈,不愿意被人指责,不愿意按照...
我要评论
1
6
关闭 站长推荐上一条 /3 下一条