您好,欢迎来到筏尚旅游网。
搜索
您的当前位置:首页利用Mathcad进行多元线性回归分析-Read

利用Mathcad进行多元线性回归分析-Read

来源:筏尚旅游网
2 利用Mathcad2000进行多元线性回归分析

【例】同Excel2000例。

第一步,输入数据或从Excel调入数据(图1)。

图1 录入或调入的数据

第二步,建立自变量矩阵Mx和因变量矩阵My。

⑴ 定义矩阵。输入“Mx:=”,然后在Matrix工具栏中选择矩阵符号(图2)并单击,弹出一个Insert Matrix(插入矩阵)对话框(图3),设Rows(行)数为18——与样本数或时间序列长度对应;设Columns(列)数为3——与自变量个数一致。点击OK确定,便会生成一个由Mx定义的自变量矩阵。用类似的方法生成一个由My定义的因变量矩阵(图4)。

图2 Matrix工具栏中矩阵符号的位置 图3 Insert Matrix对话框

1

MxMy图4 变量矩阵



⑵ 粘贴数据。在数据表中选中全部的自变量,点右键,选择Copy Selection(图5)。然后选中矩阵Mx中的全部点位,粘贴(Paste)(图6),即可生成矩阵自变量Mx;用类似的方法不难生成因变量矩阵My(图7)。

图5 选中自变量的全部数据作拷贝选择

2

图6 将从数据表中拷贝的自变量粘贴进来

Mx58.0528.16.8359.1533.0212.2663.8335.2312.8765.3624.9411.6567.2632.9512.8766.9230.3510.867.7938.710.9375.67.9914.7180.57.1817.5679.0258.7320.3280.5259.8518.6786.88.5725.3495.4870.9725.06109.7181.29.69126.594.0143.86138.103.2348.9160.56119.3360.9857.8227.0514.My图7 自变量和因变量矩阵

3.43.883.93.223.763.594.034.344.654.785.045.596.017.0310.0310.8312.9

3.09 3

⑶ 数据拟合。借助回归命令regress、提取子矩阵命令submatrix和矢量元素数目命令length等即可方便地给出回归系数(图8)。据此可以建立回归模型如下: y0.055x10.004016x20.091x31.004

zregress(MxMy1)0.05534.01610coeffssubmatrixz(3length(z)100)coeffs0.0911.004CoefficientsIntercept-1.004403477工业产值x10.0553253农业产值x2-0.00401固定资产投资x30.090694268 

图8 回归结果及其与Excel2000结果的对照

⑷ 模型检验。

① 计算相关系数。定义回归系数a1、a2、a3及b,然后用pre表示预测模型(这种方法较之直接利用回归结果计算准确)。借助均值命令mean容易算出回归平方和SSr和总平方和SSt,然后根据公式

RSSr SSt容易算出复相关系数:Rx,y0.994(图9)。进而定义变量x1、x2、x3、y,利用相关系数命令容易求出简单相关系数:Rx1,y0.9,Rx2,y0.965,Rx3,y0.987。

a1a2coeffsa3b2prea1x1a2x2a3x3bSSt(ymean(y))17SSr(premean(y))2riSSrir0.994SSti017i0

x2data1x3data2ydata3x1data0corr(x1y)0.9corr(x2y)0.965corr(x3y)0.987图9 复相关系数和简单相关系数的计算过程

4

计算偏相关系数稍微复杂一点。在变量较多的情况下,用公式计算偏相关系数很麻烦,比较便捷的方式是借助相关矩阵进行运算(图10)。计算公式为

Rxjycjycjjcyy

这里Rxjy为第j个自变量与因变量y的偏相关系数,c为相关系数矩阵的逆矩阵中对应的元素。定义了数组以后(图9),在Mathcad的工作表中定义一个相关系数矩阵RM如下:

RMcorr(x1x1)corr(x1x2)corr(x1x3)corr(x1y)键入RM,回车,立即得到相关系数矩阵 corr(x2x1)corr(x2x2)corr(x2x3)corr(x2y)corr(x3x1)corr(x3x2)corr(x3x3)corr(x3y)corr(yx1)corr(yx2)corr(yx3)corr(yy)

10.9790.9760.90.97910.9520.965RM0.9760.95210.9870.90.9650.9871

这个矩阵中在可以读到任意两个变量之间的简单相关系数,自变量与因变量之间的简

单相关系数从最后一列可以读出,列为表格便是 工业产值x1 农业 产值x2 固定资产投资x3 运输业产值y 工业产值x1 农业产值x2 固定资产投资x3 运输业产值y 1 0.979 0.976 0.9 0.979 1 0.952 0.965 0.976 0.952 1 0.987 0.9 0.965 0.987 1

再键入RM-1,得到RM的逆矩阵 1RM列为表格便是 工业产值x1 农业产值x2 固定资产投资x3 运输业产值y 76.961 0.8620.01140.17140.53250.8263.51340.53287.91 27.124.1250.0113.51376.96127.10.86250.826工业产值x1 农业 产值x2 -27.1 24.125 固定资产投资x3 0.862 0.011 40.171 运输业产值y -50.826 3.513 -40.532 87.91

由于矩阵是对称的,上标只给出了上三角。对于x1与y的偏相关系数,我们有c1y50.826,c1176.961,cyy87.91,根据上述公式可知

5

Rx1yc1yc11cyyc2yc22cyy50.82676.961*87.913.5130.618

类似地,可以求得x2、x3与y的偏相关系数如下

Rx2y24.125*87.910.076

Rx3yc3yc33cyy40.53240.171*87.91

0.682

图10 偏相关系数的计算过程

从简单相关系数看来,农业产值与运输业产值的相关性虽然较低,但还看不出多重共线性,但偏相关系数却给出Rx2y0.076,这表明:第一,农业产值与运输业产值的相关性很低(绝对值小);第二,相关系数的符号与实例不符(负号),这意味着农业发展了,运输业反而降低了,这是不符合实际情况的。因此,应该剔除第二个自变量,重新进行多元线性回归。

② 计算标准误差

标准误差的计算公式为

6

s1ˆi)2 (yiynk1i017reypreSte在图9所示的结果下面,根据上面公式容易计算标准误差,过程如下:

1831irei2sStes0.336可见标准误差约为s0.336(准确值为0.3326)。

③ 计算F值

F值的计算公式为

Fˆ(yiiy)2

ks2式中k3为自变量个数,s0.336为标准误差。在标准误差的计算过程下面,F值的计

算过程如下(图11):

图11 F值的计算过程

容易得到F402.046。由于四舍五入之故,这个数值不够准确,较准确的数值应为F405.5799。

7

④ 计算t值

计算t值的方法可能超出了大家目前的知识范围,不过线性代数知识过关的同学不难掌握。t值的计算公式为

tbibi sbi式中bi为自变量xi的回归系数,sbi的计算公式为sbicii*s,这里cii为正规方程系数矩阵C的逆矩阵中的i行i列元素。矩阵C中的第i行第j列元素可表示为

sij(xkixi)(xkjxj)

k式中k为样本的序号。在Mathcad工作表中,在图9、图11所示的结果下面,t值的详细计算过程如下(图12)。检验分析从略。

图12 t值的计算过程

⑤ 计算DW值

借助Mathcad计算DW值的方法与一元线性回归过程完全一样,此不赘述。

8

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务