偏最小二乘回归分析偏最小二乘回归分析在均匀设计试验 建模分析中的应用
唐启义 (浙江大学农业与生物技术学院 杭州)
摘要 本文分析了目前应用一般的最小二乘法建立均匀试验数据的二次多项式回 归模型时存在的局限性,提出了应用偏最小二乘法(Partial least-square,PLS)建立 二次多项式回归模型的技术, 并已在作者开发的统计分析软件(DPS 数据处理系统) 中实现。然后以一实例对 PLS 的回归建模过程进行了介绍。作者认为,PLS 回归 分析建模技术将为均匀设计的更广泛应用提供有力的技术支持。 关键词 偏最小二乘法,均匀设计,回归分析,模型优化
引言 回归分析是均匀设计数据分析的主要手段。由于均匀设计的出发点是建立多 因素寻优模型,这样,如考虑多因素互作、模型最优化的的实际需要,最基本的 要求是根据均匀设计试验结果建立二次多项式回归模型。若试验设计有 m 个因素
x1 , L , x m , 当观察指标为 y 时,其二次多项式回归模型为 y = β 0 + ∑ β i xi + ∑ β ii xi2 + ∑ β ij xi x j + ε
i =1 i =1 i
其中β0,βI,βii 和βij 为回归系数,ε为随机误差。从上述回归模型可以看到,除了 常数项β0 以外,方程有 m(m+3)/2 项,若使回归系数的估计有可能,必要条件为 试验次数 n>1+m(m+3)/2。当 m 较大时,通常不能满足这个必要条件。目前通常的 做法是采用逐步回归分析技术,从二次多项式方程中选择方差贡献显着的因素或 因素组合,删除不显着(重要)的因素或因素组合,建立含部分变量的回归方程 模型。 但是,从实际操作、应用来看,有几个问题:一是分析时,多数自变量是组合 变量,它们之间存在有严重的多重共线性,这会使得分析结果很不稳定,以致有 时,某个因素是否选入对回归方程产生很大的影响,使……