因为设置及测量核心电压值都在设计范围内,一度导致此问题无解。在引入六西格玛理念后,困难迎刃而解。天行健六西格玛顾问总结具体解决方案如下。
(1)定义变量。变量包括温度变量、路径阻抗变量、启动过程BOOT电压变量和启动正常后kernel 电压变量。
(2)测量。按设定变量针对进行数据测量。
(3)分析。经过数据整理,绘制相关性分布图,找出强力相关项:温度与发生故障率成强正相关性;路径阻抗与发生故障率成强正相关性。启动过程BOOT电压和启动正常后kernel电压未发现相关性。
设定温度为高温80℃,去除线路上的元器件直连,排除2个强相关项,调查核电压规律,发现2个核电压过低都会引发此问题。
最后回溯阻抗变量和温度变量,调查发现,线路滤波磁珠元件阻抗参数容差较大。另外在高温下,磁珠阻抗会进一步变大,造成路径阻抗过高。
(4)改进。得到上述结论后,经过分析整理我们关注的关键点有以下两点。
①滤波电路(主因磁珠)在不同的电流条件,温度条件下表现阻抗偏差很大,与上述2个条件成强正相关性,磁珠物料阻抗参数存在个体偏差。
② SOC核心在不同核心主频策略下表现耐受力不同,在满负荷、锁1GHz主频耐受力最差。温度条件下成强正相关性。
最终我们形成了以下结论。
(1)SOC及磁珠特性同时偏下限时,会出现卡机问题(UBOOT/kernel阶段均有概率出现)。
(2)UBOOT阶段实验数据表明故障SOC不满足规格要求。
(3)SOC对核电压精度要求极高,低于测定值会偶发卡机,高于规格值会影响寿命,因此对路径阻抗稳定性要求极高。
然后我们测定分析路径阻抗(包含滤波电路)的温度偏差数据、收集采样SOC芯片,分析滤波磁珠个体差异数据,最后咨询厂商重新核定SOC核电规格容限。
制定设置方案:UBOOT=1.300V,kernel=1.375V。经历了1万次的自动化台架测试后,成功导入量产,解决了这个疑难问题。
(4)控制。问题解决后,我们复盘了问题处理的全过程,从中发现有益的部分,从而改善我们疑难问题处理的流程,实现组织能力持续改善提升。加入DFMA库,针对后续项目前期进行针对性的风险评估。总结形成硬件经验教训文件,并全部门开展经验分享培训,提高整体硬件部门技术能力。