可靠性是一门发展中的学问,行业的发展主推动力是迫切的应用需求,现在可靠性工程设计在认识上如日中天,如火如荼,恰似《天龙八部》中,为萧远山/慕容复疗伤的扫地老僧慨叹的,“二位施主热衷于各种功法,却对旁边的佛经佛法熟视无睹,但凡武功到境界,必于佛法中求解”[K1] 。产品可靠性的功夫进展亦如是,功法和佛法需并行。可靠性的佛法是思想和数学基础,功法是可靠性设计技术。本文的主题就集中在可靠性的基础数学以及应用数学推进产品可靠性的设计、管理的提升。<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />
MTBF/失效率/可靠度
可靠性最常见的指标是MTBF(平均无故障间隔时间),它的通俗表述可以用个理想测试来精确确定一批产品的MTBF值,即将该批产品投入使用,当该批产品全部出现故障以后(假如第1个产品的故障时间为t1,第2个产品的故障时间为t2,第n个产品的故障时间为tn),计算发生故障的平均时间MTBF=(t1+t2+…+tn)/n。对不可维修的产品,用MTTF(Mean Time To Fail)替代MTBF(Mean Time Between Failure),望文生义,既然不可维修,比如子弹、导弹等只要启动就不可能再修复的就只计算其可靠工作的时间,两个参数的计算方法没有本质区别,只是MTBF对一个产品要统计多次数据,MTTF对一个产品只有一次。MTBF越大,说明产品的可靠性越高。
也经常见到MTBF==1/λ这个公式,但都会有一个附加条件,当被测器件或设备的寿命呈指数分布时本公式适用,电子元器件的寿命符合指数分布,网上的文章在其它方面很少提及,事实上系统、机械结构、塑料件等的寿命不符合指数分布,这时候MTBF≠1/λ了,那如何确定呢?下面给出一个普适的基础公式和一个可靠度失效率关系公式,
<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />
式中R(t)是设备的可靠度,λ(t)是失效率,它是时间的函数。这是可靠性评估中用到的最基础的两个公式。如果我们做军品、与国外大公司做外贸(尤其是大型设备合同或工程性合同)时候,这两个公式几乎是避不开的。我们日常经常认为没用,但客户的要求是绕不过去的独木桥。就像原子弹/氢弹,谁会觉得会与我们的日常生活有关,核能电力将是新世纪最被寄予厚望的清洁能源。可靠性指标亦如是,不是没用,是作用太大了。我们要有勇气尝试着认识它、利用它,它将成为产品可靠性评价与提升的明日之星。
可靠性测试度量方法
为了测得产品的可靠度(也就是为了测出产品的MTBF),需要拿出一定的样品,做较长时间的运行测试,找出每个样品的失效时间,根据上面公式计算出MTBF,样品数量越多,结果就越准确。但理想的测试实际上是不可能的,因为对这种测试而言,要等到最后一个样品出现故障,需要的测试时间长得无法想象,要所有样品都出现故障,需要的成本高得无法想象。
因此为了测试可靠性,出现了HALT的可靠性测试方法,通过加强测试应力,使缺陷迅速显现;即:使产品承受较大的环境应力(如高温80度+摇摆震动复合测试条件),经过专家大量长时间的统计,找到了一些增加应力的方法,转化成一些测试的项目。如果产品经过这些项目的测试,依然没有明显的缺陷,就说明产品的可靠性至少可以达到某一水平,经过换算可以计算出MTBF(因产品能通过这些测试,并无明显缺陷出现,说明未达到产品的极限能力,所以此时对应的MTBF是产品的最小值)。使产品经历一个“天上方一日,地上已千年”的过程,恶劣条件下的1天等同于常规环境下的1月甚至更多,这种方式就可以使故障再现时间大大缩短,可根据产品的具体应力指标进行分析和设计实验。
可靠性设计流程对比
可靠性设计管理过程有两种程序,一是自上而下的可靠性预计和分配方法、二是自下而上的可靠性设计方法,对小企业,一般用后者比较适用,对较大的项目,一般用前者。如果企业在飞速发展,可以逐步往预计和分配上靠,就像家庭里对孩子的期望,每个家庭都在为孩子上大学攒钱,虽然他现在只上小学,虽然每天我们辅导他仅用到一元一次方程的低级知识。同理,摒弃预计与分配单纯鼓吹设计方法的提法,也是不负责任的,现在的一些其他行业的学者经常弄些“不惊人死不休”的言语,鼓吹特别极端的思想,目的是引起世人注意,那是他们的经营自我的方法,但作为用户和受众则要理智,世界是中庸的,总是在平衡附近摆动,过去阶段的可靠性偏预计和分配了,今天也不必矫枉过正,完全否定也是要不得的。
可靠性定量指标
为了定量分配、估计和评价产品的可靠性,建立产品的可靠性模型是一种直观的、有效的方法。可靠性模型包括可靠性方框图和可靠性数学模型。产品典型的可靠性模型有串联模型和并联模型(这个主题比较常用,在我的《电子工程专辑》博客文章《可靠性综述》和rdcoo.chinardm.com博客文章《可靠性设计在医疗仪器中的应用》中有所提及),还有些复杂的模型,但都基于串并联的基础进行组合。注意:产品的可靠性框图表示产品中各单元之间的功能逻辑关系,产品原理图表示产品各单元的物理关系,两者不能混淆如,某振荡器由电感和电容器组成,从原理上看两者是并联关系,但从可靠性关系上看,两者只要其中一个发生故障,振荡器都不能工作,因此是串联模型。
整机失效率的估算公式:λs=λ0 * K1 * K2 * K3 * K4 * K5 * N;λs整机失效率;λ0元器件平均失效率(1~3)*10-5;K1降额因子(1~10)*10-2;K2老练筛选效果因子0.1~0.5;K3环境因子(试验室0.5~1、室内1.1~10、陆地固定5~10、车载13~30、舰船载10~22、机载50~80);K4机械结构因子1.5~2.5;K5制造工艺因子1.5~3.5;N元器件个数。
开展可靠性工作一定要有指标,有了具体的量化指标,就有了设计改进和研究的方向,就有了阶段性的参考指南,这是一个管理问题。指标分两种,一种是按照可靠性标准和规范来的,这样国际间企业合作、采购等都有共同的可靠性专业语言;一种指标是自创的技术考核指标,也可以划入质量管理指标,比如首次后装机无故障平均运行时间不少于**小时、零件加工首次入检合格率等等。一切实用为主,对产品的稳步质量提升有参考价值就行。比如对电容器的电压负荷率、功率电阻的降额余量。
用户618590 2008-1-5 13:48