例 用1974-1987年数据建立天津市粮食需求模型如下:
表1 变量 y,x1,x2,x3,x4,x5的数据 年 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
y 98.45 100.70 102.80 133.95 140.13 143.11 146.15 144.60 148.94 158.55 169.68 162.14 170.09 178.69
x1 560.2 603.11 668.05 715.47 724.27 736.13 748.91 760.32 774.92 785.30 795.50 804.80 814.94 828.73
x2 153.20 190.00 240.30 301.12 361.00 420.00 491.76 501.00 529.20 552.72 771.16 811.80 988.43 1094.65
x3 6.53 9.12 8.10 10.10 10.93 11.85 12.28 13.50 15.29 18.10 19.61 17.22 18.60 23.53
x4 1.23 1.30 1.80 2.09 2.39 3.90 5.13 5.47 6.09 7.97 10.18 11.79 11.54 11.68
x5 1.89 2.03 2.71 3.00 3.29 5.24 6.83 8.36 10.07 12.57 15.12 18.25 20.59 23.37
资料来源:《天津统计年鉴》1988.
设回归模型:
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+ε
利用spss统计软件进行线性回归(点选Statistics选项框中Collinearity共线性诊断选项),设显著性水平0.05,输出结果如下:
ANOVAbModel1Sum ofSquares8592.686261.7188854.404df5813Mean Square1718.53732.715F52.531Sig..000aRegressionResidualTotala. Predictors: (Constant), X5, X1, X3, X4, X2
b. Dependent Variable: Y
从回归方程的P检验结果看出Sig=0,整体通过显著性检验。
CoefficientsaUnstandardizedCoefficientsBStd. Error-3.49730.007.125.059.074.0382.6781.2573.4532.451-4.4912.215StandardizedCoefficientsBeta.380.823.508.537-1.263Collinearity StatisticsToleranceVIF.115.021.065.025.0108.71648.41115.41839.281105.035Model1(Constant)X1X2X3X4X5t-.1172.1191.9452.1301.409-2.028Sig..910.067.088.066.196.077a. Dependent Variable: Y 从输出结果看,在0.05的显著性水平下,βi的t统计量单独对因变量y都无显著性影响(P
值都大于0.05)。其中方差扩大因子VIF5=105.035,VIF2=48.411,VIF4 =39.281远大于10(VIFj=1/(1-R2j),R2j表示了自变量xj与其余p-1个自变量的线性相关的程度,R2j越接近1,VIFj也就越大,一般大于10时,就说明xj就与其余自变量存在共线性),因此X2,X4,X5存在多重共线性。为了建立正确的回归模型,现在采用逐步回归的方法进行线性回归分析,取显著性水平α进=0.05,α出=0.1。输出结果为:
Model SummaryModel12R.962a.977bR Square.925.954AdjustedR Square.919.946Std. Error ofthe Estimate7.446966.08867a. Predictors: (Constant), X1b. Predictors: (Constant), X1, X3 新模型2剔除了存在多重共线性的X2,X4,X5,得到回归方程为: Ŷ=-39.795+0.212X1+1.909X3 标准化回归方程为:Ŷ *=0.642X1+0.362X3
ANOVAcModel1Sum ofSquares8188.917665.4878854.4048446.613407.7918854.404df1121321113Mean Square8188.91755.4574223.30737.072F147.662Sig..000a2RegressionResidualTotalRegressionResidualTotal113.922.000ba. Predictors: (Constant), X1b. Predictors: (Constant), X1, X3c. Dependent Variable: Y 样本决定系数为R2=0.977,调整样本决定系数Ra2=0.954,拟合优度仍然很高。
CoefficientsaUnstandardizedCoefficientsBStd. Error-90.92119.329.317.026-39.79525.016.212.0451.909.724StandardizedCoefficientsBeta.962.642.362Collinearity StatisticsToleranceVIF1.000.222.2221.0004.5134.513Model12(Constant)X1(Constant)X1X3t-4.70412.152-1.5914.6702.637Sig..001.000.140.001.023a. Dependent Variable: Y 再看上表,自变量X1,X3的方差扩大因子都是4.513,小于10,认为回归方程已经不存在多重共线性。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务