考虑一种情况,其中许多不同的因素(称为预测变量或自变量)相互作用以确定结果(称为标准或因变量)。根据因素的不同,可能会取得不同的结果。例如,房屋销售价格(标准)可能由许多因素(预测因素)决定,如房屋位置、建造年份、当地住房市场状况、房屋状况等。

多重回归用于建立一个模型,使我们能够研究这种相互作用。基于多重回归的模型将使用数据构建一个基于自变量预测结果的函数。例如,该模型是使用列出各种情况下结果的一组真实数据建立的。然后,该模型可用于预测给定一组自变量的结果,或找出现有数据与模型的拟合程度以及是否存在任何异常值。

精益生产与六西格玛 (80).jpg


为什么我们需要多重回归?

多重回归可用于多种领域。例如,人力资源专业人员可以根据员工的经验、工作领域、能力等各种因素收集员工的薪酬数据。然后,他们可以根据这些数据构建一个模型,并在自己的公司中使用该模型来设定薪酬,以检查自己的员工是否适合该模型。某些员工或团体的薪酬是否高于正常水平?比正常情况少?

类似地,不同的研究人员可能使用多重回归来找出特定结果的最佳预测因素。例如,需要哪些自变量来最适合所看到的结果。一所学校的考试成绩如何,是什么因素造成的?影响供应链生产率的因素有哪些?

假设和限制

多重回归仅在特定条件下才有效。该技术的基础是以下假设,这些假设必须正确才能使模型正常工作。

1.如果方程是线性的,变量之间的关系必须是线性的。非线性关系需要其他形式的回归。

2.偏离线路的分布必须为“正态”分布。

3.一个好的模型预测是一种关系,而不是原因。一个好模型的存在并不意味着自变量导致结果,只是因为它们的存在表明结果可能是由于相关性造成的。

4.变量的“独立性”。假设预测变量是独立的。如果它们相互依赖性很强,模型就不会很好。

天行健六西格玛顾问:在其局限性范围内,多重回归是一种适用于大量实际情况的良好技术,并被广泛用于构建简单易用的模型。这些可用于分析商业、医学、工程等广泛领域的数据。