研究中心

Minitab DOE输出中如何判断回归模型的预测能力

众所周知,在Minitab的DOE数据分析结果中,我们会通过R-sq、R-sq(adj)等去判断回归模型总体的有效性,同时通过其他相应指标去判断回归模型系数的有效性。现实中,实验数据里可能有一些数据属于异常数据(特殊点),这些数据有时会对模型本身产生较强的影响。这种情况下得到的模型,有可能R-sq、R-sq(adj)等统计量尚佳,但实际上由于异常数据的存在,模型的预测能力会很有限。那么,我们该如何识别是否存在这种情况呢?

Press和R-sq(预测):

Minitab中引入了另外两个统计量来解决上述问题:Press和R-Sq(预测)。其中Press是预测误差平方和的统计量,它与SSE比较相似。而R-Sq(预测)与R-sq也比较相似:R2=1-SSE/SST,而R-Sq(预测)=1-Press/SST。

Press_R-Sq

Press通常比SSE大,如果大的不多,则表明数据点中特殊点不多,或异常点影响不大。类似地,R-Sq(预测)通常比R-Sq小,如果小得不多,则表明数据点中特殊点不多,或异常点影响不大。

因此,在判断回归模型预测能力时,我们常常选择Press和R-Sq(预测)做为回归模型预测能力的衡量指标:如果Press和SSE相差不大,R-Sq和R-Sq(预测)相差不大,则表明模型的预测能力较好,反之,则很可能我们还需要进一步优化模型。

minitab_regression