原创 日常技术中的可靠性

2007-12-3 22:12 2131 9 14 分类: 消费电子

一提到可靠性,凡是接触过人都能从嘴里迸出一堆概念,容错性设计、热设计、裕度设计等等,但对于一个做基础工作的管理者和工程师来说,这些简直是一些非常正确的废话,可靠性这么阳春白雪的东西怎样与现实的下里巴人结合呢?生活中有哪些细节的可靠性设计方法和可靠性知识点呢?

我以一个经历讲给大家听,这个事情是我对可靠性认识的起源。我在航天系统工作的时候,曾经师从一位老专家(未征得本人同意,在此用Q代替)做技术工作,教我一个关于产品可靠性设计的核心理念,就是在细节上进行可靠性设计。

Q专家带我做一个项目,初出茅庐的我用了3天时间完成了电路原理图,Q专家居然用了两周,在这段时间里,我除了看其他的书就是暗自嘀咕,“这老人就是该退出江湖了,也不知道啥意思,老拖”,两周之后,老先生武断的否决了我的电路,强制我把他的原理图布成pcb板。虽然老大不情愿,我还是很认真地完成了,布线的过程中,也是满腹怨言可没敢说出口,因为电路上和我的设计好像没太大区别。

后来我遇到一个具体问题,如下图,LM3244个运放单元,在这里作为驱动芯片使用,为D1-D8的指示灯提供电流(前面的电路省略了),我的设计方案如下图,其中M标注的发光二极管表示模式指示灯,用D标注的发光二极管表示治疗时间指示灯;但Q专家死活让我执行他的设计,我嘴上没说,就是暗暗地去找我俩设计的不同点,发现设计思路也没什么区别,都用LM324,电阻值也一样,唯一不同的是他的设计是把M1M2M3M4换了个位置,其他完全一样,我是百思不得其解,反复计算也确认限流电阻都能保证运放能工作在允许值内,最后请教Q专家,他的解释是D1M1按照常规设计思路,肯定是比较常用的模式和比较常用的工作时间,我们会根据被经常用到的程度,安排发光管的位置和表示含义,前面的用到的会比较多,这一点我很赞同,所以会出现一个问题D1/D2M1/M2都是常用的,D3/D4M3/M4都比较不常用,两个324芯片的工作时间就不一样了,假设在100小时的工作时间里,1号芯片工作了98小时,2号只工作了2小时,且持续的工作电流也差别很大,1号会因长期工作老化,2号又留了太大的裕度,如果以此计算机器的寿命,1号芯片的寿命相比较2号,就成了影响机器寿命的那块最短的木板。我无语,嘴上嘟囔“那能有多大影响呀”,但心里只有自己知道,我就是那汤锅里煮熟的一只鸭子。

图没贴进来,欲了解细节,请链接“rdcoo.chinardm.com

没几天又发生了一件事情,开始组装联调一台样机,一个电源插座,220V三芯,零线、火线、地线,我随意就把它装了上去(如下图),Q专家又要求我改了,要求零线、火线在上面,地线在下面,我还是不明白,又去请教,答案是电源线的焊点通过的电流较大会发热,也许会焊接不牢,导致火线脱落,保护接地的焊点在下面,火线万一脱落后可能会掉到上面去,这样就保护了机器,也保护了操作者使用者,如果地线在上面,火线怎么着都不会飞上去的。还告诉我火线零线的焊点一定要用热缩绝缘套管,地线一定不要用绝缘套管。我嘟囔了一句,与上次不同的是,这次被他听到了,“成年累月的这种事能发生上一次吗?”,然后是给我一顿说,原话不记得了,大意是“如果本机型生产10年共1000台,每台被人操作或使用过500次,在10年里只要有一次这样的隐患能因为这个设计被避免的话就值得,况且又不增加什么成本,对于设计是来说这个概率很小,但对一个将来遭遇不幸的人或家庭来说,这就是100%的灾难”。哇,上纲上线了。后来缘分偏浅,没能更多地聆听老人家的教诲,导致今日才疏学浅追悔莫及。

曾经听到别的同事对老人家的一句评语,“老Q设计的机器两年没发生过一起因为主机故障的维修”(附带补充一句,主机以外是别人设计的),我想这个评价应该是对可靠性设计水平的最佳评语,老专家的设计里不知道蕴藏着多少这样的魔鬼般的细节和创意设计。

几年来我一直在研究,想找到并总结出一套完整的方法来,将这些老人的技术精髓加以提炼,为大家的可靠性设计提供参考,但一直未能如愿。一年前,一位航天可靠性老专家过世,我的一位同学整理老先生的遗物,发现了一本《可靠性设计原则1000条》复印本,都是一些比较基础而且比较实用的设计技巧,后面章节将把本人学习和应用的体会逐步发布出来,需要的同行可以继续关注。

PARTNER CONTENT

文章评论5条评论)

登录后参与讨论

用户1678053 2014-10-30 10:03

看看

用户1602177 2014-10-29 16:47

感谢分享

wuyeqing_363494696 2013-1-12 07:45

理由嘛,就是写得好嘛

wuyeqing_363494696 2013-1-12 07:44

那个网站规模小,后来没做起来,所有者就不咋维护了。我也就逐渐放弃了那块阵地

用户1406868 2013-1-10 15:02

rdcoo.chinardm.com的网站进不去了,是不是时间长被删了啊.

用户1009869 2010-5-31 10:00

合抱之木,适于毫末。有道理!

用户1119887 2008-5-7 11:47

談到可靠性, 在R&D的过程裡从 F0到F5, 应该已走完全程, 因此在 sample run 和 pilot run后検视产品的可靠性, 是防止大批量生产前免除错误的重奌工作. 简単的说 "R&D精心设计的产品是产品价値, 而大批量生产是产品价銭", 兩者任务完全不同.

工程师常高估产品价值, 卻忽略产品价銭, 前者靠工艺能力, 后者靠系统管理, 企业就存活在 "有系统的工艺管理", 简称 "可靠性".

相关推荐阅读
武晔卿 2017-05-13 06:38
接地线缆的选型错误
无论是Ⅰ类设备(有PE保护接地Earth),还是Ⅱ类设备(浮地或整机浮地但有内部的金属板充作保护公共地使用的),常见一些与EMC与可靠性的接地线错误应用,因此导致EMI干扰,该泄放的高频干扰泄放不掉而...
武晔卿 2017-03-17 07:43
电磁兼容设计整改三要素分析:电压容限、高频特性、回流路径
深入浅出抓本质 电磁兼容公益讲座 讲解内容: l 打静电时会复位重启,复位端、地线端、电源端发生了什么?——电压容限 l 浪涌发生时,有防雷防护,为什么后面电路仍然坏?为什么有起火? ——失效机理 l...
武晔卿 2017-02-23 14:11
一个工程师风花雪月的事
一位新毕业研究生电子工程师A的故事。 研究生三年,小A一直暗恋本校另外系的一个女生,但又怯怯地不敢表白。做毕业论文的时候,在实验室里,心绪烦乱,幻想着她羞涩一笑中牵她手的样子,不由得偷笑出来。但一想到...
武晔卿 2016-06-29 10:42
对开关管损坏做失效分析的一种方法
        电路板工作中不可能不发生芯片或半导体器件的损坏,损坏后,要想从器件的尸体上发现其死因,并能知晓导致其死伤的应力和作用路径,自然就可以很容易的...
武晔卿 2016-06-29 10:31
电路及元器件故障探查及原因分析方法
        电路板上器件故障之后,哪里坏掉了?坏到了什么程度?怎么坏的?会因其隐蔽性而难以查找具体故障点,也因为对故障原因故障机理不清楚而导致无从下手,或者只能用倒推法,用逐个实验的方式,将各...
武晔卿 2016-05-03 07:51
如何排查电子产品在用户现场偶发的故障?
工作中,不少朋友,几乎每位工程师,都遇到过电子产品在用户现场偶尔发生故障,如死机、复位、数据传输错误等。维修工程师在现场跟踪排查时,故障又不会再现,拿回实验室,怎么试验又都是好的。使人陷入一种无从...
EE直播间
更多
我要评论
5
9
关闭 站长推荐上一条 /3 下一条