tag 标签: 可靠性设计

相关帖子
相关博文
  • 热度 14
    2018-6-6 16:20
    1906 次阅读|
    0 个评论
    嵌入式软件可靠性设计的一些理解
    0.前言 设备的可靠性涉及多个方面:稳定的硬件、优秀的软件架构、严格的测试以及市场和时间的检验等等。这里着重谈一下作者自己对嵌入式软件可靠性设计的一些理解,通过一定的技巧和方法提高软件可靠性。这里所说的嵌入式设备,是指使用单片机、ARM7、Cortex-M0,M3之类为核心的测控或工控系统。 嵌入式软件可靠性设计应该从防错、判错和容错三方面进行考虑. 此外,还需理解自己所使用的编译器特性。 此文属抛砖引玉. 1.防错 良好的软件架构、清晰的代码结构、掌握硬件、深入理解C语言是防错的要点,这里只谈一下C语言。 “人的思维和经验积累对软件可靠性有很大影响" 。C语言诡异且有种种陷阱和缺陷,需要程序员多年历练才能达到较为完善的地步。“软件的质量是由程序员的质量以及他们相互之间的协作决定的”。因此,作者认为防错的重点是要考虑人的因素。 “深入一门语言编程,不要浮于表面”。软件的可靠性,与你理解的语言深度密切相关,嵌入式C更是如此。除了语言, 作者认为嵌入式开发还必须深入理解编译器 。 本节将对C语言的陷阱和缺陷做初步探讨。 1.1 处处皆陷阱 最初开始编程时,除了英文标点被误写成中文标点外,可能被大家普遍遇到的是将比较运算符==误写成赋值运算符=,代码如下所示: if (x= 5 ) { … } 这里本意是比较变量x是否等于常量5,但是误将’==’写成了’=’,if语句恒为真。 如果在逻辑判断表达式中出现赋值运算符,现在的大多数编译器会给出警告信息。 并非所有程序员都会注意到这类警告,因此有经验的程序员使用下面的代码来避免此类错误: if ( 5 ==x) { … } 将常量放在变量x的左边,即使程序员误将’==’写成了’=’,编译器会产生一个任谁也不能无视的语法错误信息: 不可给常量赋值! +=与=+、-=与=-也是容易写混的。复合赋值运算符(+=、*=等等)虽然可以使表达式更加简洁并有可能产生更高效的机器代码,但某些复合赋值运算符也会给程序带来隐含Bug,如下所示代码: tmp=+ 1 ; 该代码本意是想表达tmp=tmp+1,但是将复合赋值运算符+=误写成=+:将正整数常量1赋值给变量tmp。 编译器会欣然接受这类代码,连警告都不会产生。 如果你能在调试阶段就发现这个Bug,你真应该庆祝一下,否则这很可能会成为一个重大隐含Bug,且不易被察觉。 -=与=-也是同样道理。与之类似的还有逻辑与&&和位与&、逻辑或||和位或|、逻辑非!和位取反~。此外字母l和数字1、字母O和数字0也易混淆,这种情况可借助编译器来纠正。 很多的软件BUG自于输入错误。在Google上搜索的时候,有些结果列表项中带有一条警告,表明Google认为它带有恶意代码。如果你在2009年1月31日一大早使用Google搜索的话,你就会看到,在那天早晨55分钟的时间内,Google的搜索结果标明每个站点对你的PC都是有害的。这涉及到整个Internet上的所有站点,包括Google自己的所有站点和服务。Google的恶意软件检测功能通过在一个已知攻击者的列表上查找站点,从而识别出危险站点。在1月31日早晨,对这个列表的更新意外地包含了一条斜杠(“/”)。所有的URL都包含一条斜杠,并且,反恶意软件功能把这条斜杠理解为所有的URL都是可疑的,因此,它愉快地对搜索结果中的每个站点都添加一条警告。很少见到如此简单的一个输入错误带来的结果如此奇怪且影响如此广泛,但程序就是这样,容不得一丝疏忽。 数组常常也是引起程序不稳定的重要因素, C语言数组的迷惑性与数组下标从0开始密不可分 ,你可以定义int a ,但是你绝不可以使用数组元素a ,除非你自己明确知道在做什么。 switch…case语句可以很方便的实现多分支结构,但要 注意在合适的位置添加break关键字。 程序员往往容易漏加break从而引起顺序执行多个case语句,这也许是C的一个缺陷之处。对于switch…case语句,从概率论上说,绝大多数程序一次只需执行一个匹配的case语句,而每一个这样的case语句后都必须跟一个break。去复杂化大概率事件,这多少有些不合常情。 break关键字用于跳出最近的那层循环语句或者switch语句,但程序员往往不够重视这一点。 1990年1月15日,AT&T电话网络位于纽约的一台交换机当机并且重启,引起它邻近交换机瘫痪,由此及彼,一个连着一个,很快,114台交换机每六秒当机重启一次,六万人九小时内不能打长途电话。当时的解决方式:工程师重装了以前的软件版本。事后的事故调查发现,这是break关键字误用造成的。《C专家编程》提供了一个简化版的问题源码: networkcode() { switch (line){ case THING1: doit1(); break ; case THING2: if (x==STUFF){ do_first_stuff(); if (y==OTHER_STUFF) break ; do_later_stuff(); } /*代码的意图是跳转到这里……*/ initialize_modes_pointer(); break ; default : processing(); } /*……但事实上跳到了这里。*/ use_modes_pointer(); /*致使modes_pointer未初始化*/ } 那个程序员希望从if语句跳出,但他却忘记了break关键字实际上跳出最近的那层循环语句或者switch语句。现在它跳出了switch语句,执行了use_modes_pointer()函数。但必要的初始化工作并未完成,为将来程序的失败埋下了伏笔。 将一个整形常量赋值给变量,代码如下所示: int a= 34 , b= 034 ; 变量a和b相等吗?答案是不相等的。我们知道,16进制常量以’0x’为前缀,10进制常量不需要前缀, 那么8进制呢?它与10进制和16进制表示方法都不相通,它以数字’0’为前缀 ,这多少有点奇葩:三种进制的表示方法完全不相通。如果8进制也像16进制那样以数字和字母表示前缀的话,或许更有利于减少软件Bug,毕竟你使用8进制的次数可能都不会有误使用的次数多!下面展示一个误用8进制的例子,最后一个数组元素赋值错误: a =106; /*十进制数106*/ a =112; /*十进制数112*/ a =052; /*实际为十进制数42,本意为十进制52*/ 指针的加减运算是特殊的。 下面的代码运行在32位ARM架构上,执行之后,a和p的值分别是多少? int a=1; int *p=( int *)0x00001000; a=a+1; p=p+1; 对于a的值很容判断出结果为2,但是p的结果却是0x00001004。指针p加1后,p的值增加了4,这是为什么呢?原因是指针做加减运算时是以指针的数据类型为单位。p+1实际上是p+1*sizeof(int)。不理解这一点,在使用指针直接操作数据时极易犯错。比如下面对连续RAM初始化零操作代码: unsigned int *pRAMaddr; //定义地址指针变量 for (pRAMaddr=StartAddr;pRAMaddr
  • 热度 27
    2015-3-17 01:04
    1601 次阅读|
    8 个评论
    1、可靠性和功能安全的联系     可靠性是指无故障工作的能力,是反映系统性能的一个重要指标。         系统的可靠性越高,发生故障的可能性就越小。     系统不可靠性,会导致系统不安全。       在防止故障发生上,可靠性和安全性是一致的。   2、可靠性与功能安全的区别     两者的着眼点不同:     可靠性着眼于维持系统的功能,实现系统的目标,侧重于研究故障发生以前的系统状态;     功能安全着眼于防止事故发生,避免人员伤亡和财产损失,侧重于故障发生后对系统的影响。   3、可靠性与功能安全的关系     我更喜欢比喻成“基础”和“上层建筑”的关系:               或者“作家”和“批评家”的关系:     先要有作家写出书,批评家才能据此书进行批评。     批评家站在独立的立场上,多数是要批评的。虽然批评家批评得条条是道,但批评家未必能写出比该作 家更好的书。   4、可靠性设计     引述百度百科的解释,电子产品可靠性设计技术包括许多内容,主要有:     可靠性分配     可靠性预计     冗余设计     参数漂移设计     FTA     FMEA     效应和致命度分析     元件器件的优选和筛选     应力-强度分析     降额设计     热设计     潜在回路分析     电磁兼容     设计评审     等       可以看到可靠性设计有些内容与功能安全是重合的,比如可靠性预计。     也就是说功能安全将原有可靠性中涉及安全性的设计独立出来,加以完善。   5、浅谈继电器的可靠性     细究起继电器的可靠性来,继电器也可以很复杂地。     不光要关注集成电路IC,也要关注继电器。“木桶原理”的故事还是要常记在心中。     以下仅整理小部分继电器特性进行介绍,真的是浅谈呀,管中窥豹!   5.1 继电器线圈的续流方式对触点寿命的影响     继电器可以认为是用“小电流的线圈端”来实现控制“大电流的触点端”,类似“弱电控制强电”、“四两拨千斤”的意味。          那么问题来了,西方发明的东西一般都是”有一利必有一弊“。在线圈端,不同的续流方式会造成触点端弹跳的加剧,进而影响触点的寿命。     线圈端使用二极管续流,将极大地减少触点端的寿命。   5.2  继电器触点端的A熔      继电器触点被硫化或氧化后,会在触点表面形成额外的材料层,这些材料会使触点接触电阻变大,造成继电器性能下降。     在长期使用中,需要破坏这些材料层,破坏方式有机械破坏、电气破坏、热力破坏。         车用继电器常见的是电气破坏,即一定的击穿电压和电流,称作A熔。     实际中,一般要求击穿电压3Vdc,触点电流10mA。   5.3 继电器触点的负载电流     当触点端断开不同类型负载时,会产生不同的电弧,负载电流就得按照一定的限值曲线进行评估(如Curve I、Curve II)。       在Curve I或Curve II的基础上,为了进一步提高可靠性、降低失效率,还得进行降额设计。            5.4 继电器参数变化     三次设计是在20世纪70年代由日本质量管理专家田口玄一提出的,包括系统设计(第一次设计)、参数设计(第二次设计)和容差设计(第三次设计)。     在设计时,需要关注继电器参数的变化。          细究起来,与环境温度、触点电流、是否上次刚刚通电、个体差异等因素有关。            结尾:          既然继电器是”四两拨千斤“,笑话据此展开。         蚂蚁在看电影,忽然大象坐到了它前面,挡住了整个屏幕。蚂蚁很生气的跑到大象的前排座位上,坐了一会,转过头来恶狠狠地对大象说:“被我挡住屏幕,你很不爽吧!”         一只蚂蚁在路上看见一头大象,蚂蚁钻进土里,只有一只腿露在外面。   小兔子看见不解的问:“为什么把腿露在外面?”   蚂蚁说:“嘘!别出声,绊他一跤!”    附录: 序     1)文章题目起得吓人,但正文却“食之无味”,仅“管中窥豹/盲人摸象/坐井观天”地推测汽车电子研   发工作;     2)正文按照标号1/2/3/4,以符合研发工程师强迫症的习惯;     3)行文追求朴素/简洁/凌厉的大实话和心里话,以符合研发工程师“外表朴素/内心艳丽/敏于行/讷于   言”的特质;     4)结尾模仿相声的结尾(称作“攒底”),戛然而止,并鞠躬下台。
  • 热度 12
    2012-8-24 13:35
    854 次阅读|
    0 个评论
    可靠性设计评审 1 .开展可靠性设计评审的必要性 所谓可靠性设计评审,即是在产品设计过程中的一定阶段或在设计基本完成时,组织有关方面的专业技术 人员,对可靠性设计工作进行审查和评定。它是以集体的智慧来弥补设计者的不足,使设计的方案和内容 更臻于合理和完善。因此,它既是可靠性设计过程一项必要的管理内容,又是进一步提高可靠性的一项有 效而又经济的措施。 2. 评审方法 (1)评审人员 可靠性设计怦审通常采用由评审小组集体评审的方法。评审小组应由总工程师、产品设计师、可靠性工程 师、质量师、工艺师、部品工程师、经销员、成本核算员、计划员和标准化人员等组成。他们的任务见表 11.2。 表11.2 参加者        人数        任 务 总工程师        l名        主持会议、参加怦审、作出裁定。 可靠性师        1~2名        参加评审、整理评审报告。 质量师        l名        参加评审、介绍样机试验情况。 工艺师        1~2名        参加评审、介绍产品可生产性情况 部品师        l名        参加评审、介绍新选用零件认定情况 设计师        若干名        参加评审、汇报设计过程、解答问题。 经销员        l名        参加评审、反映用户使用意见及要求。 计划员        l名        参加评审、介绍没计计划进度情况 标准化员        l名        参加评审、介绍该产品标准化情况。 经济员        l名        参加评审、 介绍研制费用,产品成本。 车间代表        l名        参加评审、介绍试制或试生产情况。 (2)评审程序 ①初审在总体方案制订阶段进行,主要是对总体方案、关键元器件试验、初步的预计和分配进行评审。 ②复审在样机设计阶段进行,主要对元器件的应力分析及预计,失效模式、影响及致命度分析和样机试验 情况进行评审。 ③终审(I ) 在设计定型阶段进行,主要对设计修改后的结果,故障分析和改进措施,各项规定的测试 和试验结果进行评审。 ④终审(II) 在生产定型阶段进行,主要对生产可行性,生产过程中质量保证措施的建立,以及试生产 产品的各项试验情况进行评审。 在每一个评审阶段,有关部门应向评审小组提供该阶段应具备的相应文件、资料、报告或实物等。 (3)评审内容和评审结果的处理 明确评审的内容和要求,对评审小组成员和产品设计师来说,都是十分重要的。对不同的产品应有不同的 内容和要求。 对评审结果可用两种方法加以评定:一是定性的评定,就是用评审通过与否来评定,这种评定一般适用于 初审和复审阶段;二是定量的评定,它是对评审内容逐行进行评分,然后得出评审总得分,再根据总得分 的高低评出优、良、中、差四个等级。被评为优、良的产品给予通过,准予定型;被评为中的产品,应对 某些单项分较低的项目作出改进之后给予通过并准予定型;而对被评为差的产品怦审未被通过,不予定型 。不管被评定哪一个等级,凡评审中提出必须改进的问题,设计师均应认真对待,提出措施限期改进。
  • 热度 19
    2012-8-24 13:34
    930 次阅读|
    0 个评论
    可靠性设计的一些内容 一、可靠性评价分析技术的应用    由于设计阶段对产品的可靠性将起到奠基作用,故在设计过程中,应不断对产品的可靠性进行定性和 定量的评价分析)以便及时了解产品的可靠性指标是否有了保证,所采取的各种可靠性设计措施是否有效 ,有效程度如何,设计中是否还存在薄弱环节和潜在缺陷,产品在今后使用中可能会发生什么样的故障, 以及故障一旦发生时,其影响和危害程度如何等等。弄清以上问题将有助于及时发现缺陷,及时改进设计 ,防止“带病”投产,保证预定的可靠性指标得到满足。 下面介绍几种主要的评价分析技术的应用: 1 .可靠性预计与分配 可靠性预计是在设计阶段,根据设计中所选用的电路程式、元器件、可靠性结构模型、工作环境、工作应 力以及过去积累的统计数据,推测产品可能达到的可靠性水平。预计的目的不是在于了解在什么时候将发 生什么样的失效,而是在于从设计开始就采取措施以防止失效的发生,并用定量的方法评价可靠性设计的 效果。   可靠性分配是将可靠性指标或预计所能达到的目标值加以分解,用科学的方法,合理分配给分系统、设 备、部件直至各元器件和每一个连接点、焊接点,以保证可靠性既定目标得以实现。通过分配,不仅可以 层层落实设计指标,还可发现设计的薄弱环节和尚能挖掘的潜力。 可靠性预计的方法一般有相似设备法 、相似电路法。有源器件法、元器件计数法及元器件应力分析法等,它们分别适用于不同的设计阶段:当 产品处于方论证阶段时,可用相似设备法、相似电路法、有源器件法等快速预计法进行可行性预计,以评 价设计方案的可行性;   当产品处于旱期的详细设计阶段时,可用元器件计数法进行初步设计预计,以了解元器件的初步选择是 否恰当,并为可靠性分配打下预计的基础,而当产品处于详细设计阶段的中期和后期,可用元器件应力分 析法进行详细的设计预计,以便及时发现设计的薄弱环节或潜在能力,及时改进设计,以期达到优化设计 的目的。 下面就三种预计方法作一些简略的介绍: (1)有源器件法 所谓有源器件法,即按设备为完成规定功能所需的串联有源器件的数目预计设备失效的方法。预计公式为 λs = N* K (11.1) 式中:λs --设备的预计失效率; N--串联有源器件的数目; K ---各种设备中每个有源器件的失效率。 (2) 元器件计数法 所谓元器件计数法就是根据组成设备的各类元器件的通用失效率及其使用数量,来预计设备失效率的方法 。 (3)元器件应力分析法预计 元器件应力分析法预计是考虑了温度、电应力、环境条件、元器件选用及电路等情况对元器件失效率的影 响,先预计各个元器件在上述诸因素影响下的失效率,然后再预计设备总的失效率的一种方法。除微电子 器件外,绝大多数电子元器件的工作失效率预计公式为: λp= λb(πE•πQ……πn) (11. 3) 式中:λp -- 元器件的工作失效率; λb -- 元器件的基本失效率; πE -- 环境修正系数; πQ -- 元器件质量修正系数; πn -- 考虑其它附加影响的修正系数。 在进行应力分析法可靠性预计时,需要对每个元器件给出失效率和各修正系数的数值。为此,我国电子产 品可靠性数据交换网编制了我国的《电子设备可靠性预计手册》,并且已经列入军用标准GJB299一87,可 以作为我国电子设备可靠性预计的依据。进行可靠性预计时,尤其是进行应力分析法预计时,要进行大量 繁杂的计算,最宜于采用计算机辅助分析和计算。 可靠性分配一般分为两大类,一类是无约束条件,单 纯从可靠性指标出发进行分配;另一类是有约束条件,即以体积、重量、成本等为约束条件进行最优化可 靠性分配。 等分法即是平均分配法,适用于由完全相同的单元电路构成的串联系统、分配公式为: λi= λs/m (11.4)   式中:λi--第i分系统的失效率; λs--系统的失效率; m -- 分系统的数目。 AGREE分配法是由美国电子设备可靠性顾问团提出的一种分配方法。它考虑了组成系统的每个单元的复杂 度和重要度。这种分配的基本观点是:越是复杂的单元越容易失效,分配给它的失效率应该大一些。越是 重要的单元越不希望它失效,故分配给它的失效率应该小一些。亦即分配时每个单元的失效率应该是加权 的,加权因子C应该与单元的复杂度成正比,与单元的重要度成反比,于是AGREE方法的分配公式为: λi=(ni×T×λs)/(N×Wi×ti) (11.5) 式中:ni--第i单元的元器件数; N--系统的元器件总数,ni/N表示第i单元的复杂度; Wi--第i单元的重要度; T--系统的任务周期; ti--第i单元在任务周期内的工作时间; λs--系统的失效率。   2.失效模式、效应与危害度分析 失效模式、效应与危害度分析简称FMEC。它是一种广泛适用于电子、电器以及机械设备的可靠性评价分析 技术。是通过对所设计的系统的各组成单元可能发生的各种失效模式对系统功能的影响及其危害程度的分 析,尽早发现问题、及时采取对策、改进设计,以保证产品的可靠性。 失效模式是指元器件、零部件或产品失效的表现形式。失效模式一般是能被观察到的一种失效现象。 各种失效模式对设备或系统产生的后果及其严重程度称之为效应及严酷度。效应又分为局部效应和最终效 应。 表11.1 列出了常用严酷度等级及其损坏概率。根据等级及损坏概率, 表11.1 等 级        程 度        损坏概率 IV        可能导致系统功能全部丧失,给系统和周围环境造成重大损失, 或(和)造成人身伤亡事故。        1 III        可能导致系统功能全部丧失,从而给系统和环境造成重大破坏, 但不造成人身伤亡事故。        0.5 II        导致系统功能下降,但对系统和人不会造成损害事故。        0.1 I        导致系统功能下降,但对系统和环境不造成损害,对人员无害。        0 不仅可以定性地判别哪些失效模式危害度最高,而且还可以进一步足量地计算每种失效模式的危害度。  3.失效树分析 失效树分析简称FTA。FTA 也是一种广泛适用于电子、电器以及机械设备的可靠性评价分析技术。它是在 系统设计过程中通过对系统可能造成失效的各种因素(包括硬件、软件 、环境、人为因素等)进行分析 ,画出逻辑框图(即失效树),从而确定系统失效原因的各种可能组合方式及其发生概率,进而计算出系 统的失效概率,以便采取相应的纠正措施,提高系统的可靠性。失效树分析可以是定行的,也可以是定量 的。 顾名思义,失效树,就是一种树状的逻辑因果关系图。它是一系列事件符号和逻辑门符号,描述系统中各 种事件之间的因果关系。逻辑门的输入事件是输出事件的“因”,而输出事件是输入事件的“果”。它由 顶事件、中间事件、底事件和逻辑或门 、逻辑 与门等符号组成。 失效树分析法的一般步骤如下: (1) 了解系统,确定顶事件: (2) 建造失效树,并加以简化和规范化; (3) 定性分析:确定失效树的最小割集; (4) 收集定量分析用的数据,如底事件的失效概率、失效率、维修率等; (5) 定量分析:计算顶事件的发生概率和系统可靠度、评价顶事件的严重性与危害度, 计算底事件和最小 割集的重要度等 ; 6) 确定薄弱环节和关键元部件。改进系统的可靠性、安全性; (7) 进行技术经济分析,作方案比较与决策等。 4.可靠性增长试验 各项可靠性设计技术应用后,电子产品所达到的可靠性预计值还是纸面上的。按照设计方案研制出来的样 机,其可靠性初始值往往只有设计时已达到的预计值的10~30%。这是由于所设计的产品总会存在着事先 意想不到的初期设计缺陷、工程缺陷以及制造上的各种缺陷,设计时所选用的元器件也可能不完全合适。 缺陷虽不一定是故障,但它的存在及发展迟早能引起故障,故在可靠性工程中,除了应用前面所述FMECA 和FTA等分析方法,还必须采用可靠性增长试验的方法,也即是给样机施加一定的应力。强迫暴露设计缺 陷,使缺陷变成故障,并对故障进行仔细分析,找出故障机理,通过进行再设计,来系统地、永久地消除 故障机理,阻止同样的故障再度出现。这个试验一分析一改进(简称TAA F)的过程,就是可靠性增长过 程或称为可靠性增长试验过程。这个过程每每进行一次,样机的可靠性就增值一次,经过多次反复,直到 实现设计的固有可靠性。 可靠性增长试验既适用于设计研制和生产定型阶段,也适用于批量生产阶段。但重点是在设计研制和生产 定型之前进行,因为那时的产品尚处于可以再设计阶段,比起投入批量生产以后的产品,在设计上作出修 改的困难程度和所需费用都将小得多。 为了在可靠性增长试验活动中能严密地、有效地监控和跟踪可靠性的变动情况,有必要把可靠性增长定量 化。由于可靠性增长活动是对产品不断进行试验和采取积极的改进活动,因此,反映产品质量的母体水平 也在不断变动之中,所以可靠性增长的定量化需要应用变动母体的统计分析方法,这就是可靠性增长的数 学模型。它是一个作为时间函数的数学公式来表示增长过程中产品的可靠度,用以往各次增长试验的数据 (可以来自不同母体),拟合出可靠性增长的数学模型,用以表达产品的增长规律,估计当前的可靠性水 平,预测以后可能达到的可靠性水平,所以它是增长试验的重要工具。目前已提出的有10余种可靠性增长 模型。 产品的可靠性增长程度取决于通过增长试验是否能把设计和制造中的潜在缺陷暴露出来,以及对这些缺陷 的分析和改进程度。 二、可靠性设计程序 为了使可靠性设计工作的基本要求、基本内容在设计过程中能有计划、有步骤地落实下去,便于随时进行 检查、监督和控制,有必要把可靠性设计的任务和内容编写成工作程序,作为设计阶段的一项质量保证措 施。 它分为调查研究、总体方案的确定、设计研制、设计定型和生产定型五个阶段:在调查研究阶段, 主要是在收集资料的基础上确定可靠性指标;在总体方案确定阶段,则要确定应采取的可靠性设计措施, 并进行可靠性预计和分配;在设计研制阶段,主要是应用专门的可靠性设计技术进行专题可靠性设计;而 在定型阶段,主要是进行可靠性增长试验和鉴定试验。  
  • 热度 12
    2012-8-24 13:33
    981 次阅读|
    0 个评论
    可靠性设计 作者: 心碎了无痕      可靠性设计     可靠性管理是在一定的时间和费用条件基础上,根据用户要求,为了生产出具有规定的可靠性要求的产品,在设计、研制、制造、使用和维修即产品整个寿命期内,所进行的一切组织、计划、协调、控制等综合管理工作。   其中首要的环节就是可靠性设计,它决定了产品的内在可2靠性(即固有可靠性)。研制与生产过程则是实行可靠性控制,保证产品内在可靠性的实现。因为产品在使用时,各种因素影响着产品的可靠性,故又把产品在使用过程中对可靠性的要求称之为使用可靠性。   据美国贝尔电话实验室和海洋电子实验室统计,产品故障因设计方面问题引起的占40%以上,是影响产品内在可靠性的主要因素。见下图所示。       我国也曾对影响某电子设备故障的因素进行分析、统计,起初获得的统计数据如下图所示。   但是,通过进一步分析,该电子设备在元器件、生产测试和使用、维护方面产生故障的原因中,还有一些原因是由于设计技术不当而引起的,如结构设计工艺性不强导致了生产制造差错;电路设计不当引起元器件超负荷使用;选用的元器件不能满足整机使用的环境条件;可靠性设计不当,又会出现使用维修故障等。这样,其故障因素分类就改变为下图所示。   由此可见,决定产品可靠性的首要环节就是可靠性设计。 一、可靠性设计的工作程序   可靠性设计的一般工作程序如图所示。 二、可靠性设计的基本内容   可靠性设计的主要任务就是通过可靠性预测、分析、试验和改进等可靠性活动,把可靠性要求设计到产品文件与图纸中去行成产品的内在可靠性。   可靠性设计是整个产品设计工作中的一个重要组成部分,它与广项功能设计相辅相成,通过功能设计可初步确定产品的功能与结构,运用可靠性设计,对产品的可靠性进行分析、评价和改进,使产品功能设计更趋于完善。   具体地说,可靠性设计的基本工作内容一般依产品设计内容分为产品系统设计和产品零部件设计两大部分。   设计内容 可靠性设计的具体项目   产品(系统)设计  根据功能、成本和时间限制决定产品系统可靠性要求           确定产品系统的工作环境条件           制定产品系统可靠性规范           确定对产品包装、运输、使用、保管等方面可靠性要求           编制生产制造过程中可靠性控制计划           确定产品系统的维修难易程度及安全性等方面基本要求 零部件设计     规定零部件可靠性要求           规定零部件技术性能指标           确定可靠性试验方法与要求           列出具有高可靠性及低可靠性的零部件清单           确定零部件失效率要求值           确定所选部件的寿命和非周久性部件的检查及其互换标准           确定重要零部件的获得、使用和试验方法           设计零部件的安全系数           采用标准设计方式           进行安全设计           确定冲击、振动、缓冲框架、减震装置的寿命           预测可靠性和更改设计           分析典型部件的失效覆式,明确其所引起的影响           审查零部件的可靠性           进行零部件的寿命试验和破坏性试验,并把各种试验结果           和指标相比较,进行必要的设计更改           对软件的可靠性进行设计、试验和审查 三、可靠性设计的基本方法   由于产品种类及其系统的复杂程度不同,可靠性的设计方法也应有所不同,一般常用的可靠性设计方法有可靠性预测、可靠性试验、可靠性分析、可靠性分配与可靠性评审或鉴定。 1.可靠性预测   可靠性预测是对产品系统可能达到的可靠性水平,利用其结构、功能、环境及相互关系的信息进行定量分析估计的一种方法。 (1)目的   在可靠性设计中应用可靠性预测的主要目的是:   ①为设计决策提供科学合理的依据。如对不同设计方案的选择,元器件、零部件质量等级的确定,新技术、新材料的采用及设计是否需要改进等;   ②根据预测结果,编制可靠性关键件清单,为生产过程质量控制提供依据;   ③为可靠性试验方案设计提供依据;   ④为产品系统的可靠性指标分配提供依据和顺序;   ⑤对产品使用、维护提供信息等。   此外,可靠性预测还可作为不能直接进行可靠性验证的大型产品系统的可靠性估计。   由于可靠性预测是根据已知的数据、过去的经验和知识对新产品系统的设计进行分析,因此,数据和信息来源的科学性、准确性和适用性以及分析方法的可行性就成为可靠性预测的关键。   可靠性预测一般在设计初期就开始,而且越早进行效果越好,并随着产品设计、研制工作的展开逐步深入,不断完善。   在产品方案论证阶段,可靠性预测只限于了解产品系统大体情况,并根据相似产品系统的已知信息进行一般性预测。   在初步设计阶段,有了产品初步草图和零部件一览表,则可进行初步的可靠性预测。   而到技术设计阶段,则根据已确定的元器件、零部件进行具体、详细的可靠性预测。   (2)步骤   可靠性预测一般按下述十个步骤进行:   ①确定质量目标。对产品系统的设计、研制目的、用途、功能、性能参数等进行明确的规定。当然,这些规定将随着设计、研制工作的进展而不断精确与完善。   ②拟定使用模型。对产品系统交付使用到最后报废的整个使用过程,其经历的环境及有关事件,如运输、贮存、试验检查、运行操作和维修等拟定工作模型。   ③建立产品结构。以图解形式,形象地表明产品系统中各单元组成情况,如用可靠性方框图、事故(或故障)树、状态图或它们的结合来表述产品可靠性结构模型。   ④推导数学模型。根据产品的结构模型和单元的可靠性特征量,经过一系列假设、简化、近似运算,推导出系统数学模型。这个数学模型可以是一组数字表达式,也可以是一组状态矩阵。   ⑤确定单元功能。单元是组成系统的一个功能级别,可以是组件、部件或元器件,它们具有一定的可靠性量值,在可靠性框图中是一个独立方块,必须—一确定。   ⑥确定环境系数。通过产品系统在使用期中所经历的工作环境条件应力分析,确定环境系数。   ⑦确定系统应力。根据产品工作方式和工作应力分析,确定除额系数、应用系数和工作/天工作的时间比。   ⑧假定失效分布。根据系统中各个单元的寿命特征,使用相应的失效分布。未知失效分布时,可先假定并在取得数据后核实、修正。   ⑨计算失效率。根据选定的质量等级、环境应力、工作应力和失效分布,计算单元的工作失效率和贮存失效率。   ⑩计算产品可靠性。把各单元失效率数据作为输入,利用产品系统的可靠性数字模型,计算出产品系统的可靠性数值。   在上述可靠性预测过程中,常应用元器件应力分析法、相似产品法、有源元件计数法、元件计数法和数学模型法等具体方法。  
相关资源