【例子】 以全国31个省市的经济指标为例,进行主成分分析 第一步:录入或调入数据(图
1)。
省份 1 国內生产|脣民辛肖夷 固定资产|职工工资 货物周转|泮费价格 繭品零售 工业产值 S144.0Q 1394.02505.0513 373.911730 9 920.11 0 272O.K01 345 E501.00 342.911520 0 2 3 2849.5) 1250.046 704 0 4339.00 2033.30 11520 4 2 1092.40 1250 S7 290 0 4721.0717.311S.90 6 B32.S6 00 1307.090 250.20 4134.00 7B1 70 0 117.65 137170 0 115.10 0 2793.30 2397 3 337.90 4911.06 辽宁 7 吉林 7 11^.20 DO1872.0 9 320.40 4430.000 497 115.20 0 B 黒龙江 2014.50 2334.05 435.70 4145.040 624.0115.10 3 2462.50 5343. 3 995.40 S279.00 207.40 9 118.70 7 5155.2□□ 1926 8 1434.95 0 5943.00 1025.50 115.90 0 10 5 3524.700 2249. 0 B619.D0 1006.39 7 115.60 11 9 2003.5□□ 12.00 474.00 4E09.D40 908.3114.SO 12 8 2160.50 2320 0 563 0 5357.00 G09.313 115.20 14 2 1205.10D 1182.097 2E2.E0 4211.00 411.70 115.9Q 15 ili^- 1 6002.30 1527.04 1229 55 0 5145.00 11X.E0 0 117 0 670 0 4344.01574.4EO 11560 20 16 河隔 4 300274 0 103J.U17 2391.4U 1527.035 671.60 4665.00 S4S.0120.090 18 湖南 2 219570 0 1406.03 422.60 4797.00 1011.B0 0 119.00 6250.00 19 5381.70 2699.01 1639.33 65E.90 114.00 0 1314.00 3S2.50 5105.□0 536.0113.40 20 广西L 2 1606.15 0 1014.09 198.3□ 5340.00 232.10 3B4.17 113.50 21 0 3534.D0 ■261.05 822 0 45.00 902.3118.50 22 0 630.07 0 942 00 150.04 0 4475. 0 301.10 23 121.40 0 310.40 24 1206.61261 334.0DO5149.0121.30 S 55.96 00 T1D.D0 17 87 0 7382.00 Q 25 4.20 I17.3D 26 1000.0O 1208 300 0 4396 00 500.9119.0Q 27 甘h 3 553.35 00 1007.027 114.E93.00 507.00 119.B0 20 i446.nn 1 47 7G 0 6763.00 61.SO 0 118.0166.31 音矿 B 0 5073.029 169.76 1355.001 sa 121.30 117 0 0 14S9.D30 S34.57 37S 0 534S.00 339.010 119 0 0 S5 0 0 70 0 图 1原始数据(未经标准化) rw 112.6343.4noeo 3 532.5115.S1 1234.311560 5 697.2116.65 419.3114 9 1940.5114.25 762.4114.37 1240 113.037 12.9114.35 2026.6113. 91E 112.759 824.1114.44 433.6115.97 571.0114 4 2207,5114 9 1367.9llhoU 2 1220.7115.52 B43.8111.63 1396 116.435 5 111.397 .33 117.01431.8117.21 324 119.172 716.5114.95 5.57 117.0600.9ne.50 8 466.711E39 105.9115.30 114.4116.70 426.76 第二步:打开“因子分析”对话框。
沿着主菜单的“ Analyzef Data Reductionf Factor \"的路径(图2)打开因子分析 选项框(图
3) o
圍全国3。亍省市区复济塩展的指标-SPSS Data Editor File Edit View Data Transform Andyze Graphs Utiities Reports Descriptive Statistics ► Window Help ► G^IQISI 囿 1 I “I s| 三6 : Compare Means ► 省份 1 2 3 4 5 6 国內生产 1394.E General Linear Model ► Carrelate Regression Data Reduction ► ► ► ► £ 1 6 职工工资 8144.00 6501.00 Factor.,. I 业京 夭津 920.1 匚 lassiF^ 2849.河北 1 山西 : EI 1092.4 832.E Scale Nonparametric Tests ► Multiple Response ► ► 3 9 辽宁 2793.3^ 4134.00 4911^00] 图2打开因子分析对话框的路径 图3因子分析选项框
第三步:选项设置。
首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变 量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入 (图4)。因无特殊需要,故不必理会“
Value…\"栏。下面逐项设置。
2£|
Variables:
国內生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值Seleolion Variable: 1 Value.*, Descrip1 Ives... Extraction... Rotation... | Scores... 1 Options... 图4将变量移到变量栏以后
1. 设置 Descriptives 选项。
单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。
Factor Analysis: -Statistics
fy Univariate descriptives W Initial soliution
Correlation Matrix 两 Coefficients 厂 Significance levels [/ Determinant
厂 KMO and Bartlett's
—Inverse
厂 H^preduced
—Anti-image
test of sphericity
图5描述选项框
在Statistics栏中选中Uni variate descriptives复选项,则输出结果中将会给出原始数 据的抽样均值、方差和样本数目(这一栏结果可供检验参考)
项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)
;选中Initial solution复选
。
在Correlation Matrix栏中,选中 Coefficients复选项,则会给出原始变量的相关系 数矩阵(分析时可参考);选中Determinant复选项,则会给出相关系数矩阵的行列式, 如果希望在
Excel中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项 一般不用,但在特殊情况
下可以用到(本例不选)
。
设置完成以后,单击 Continue按钮完成设置(图5)。
2. 设置 Extraction 选项。
打开Extraction对话框(图6)。因子提取方法主要有
7种,在Method栏中可以看
到,系统默认的提取方法是 主成分:-:--),因此对此栏不作变动, 就是认可了主成分分析方法。
在Analyze栏中,选中Correlation matirx复选项,则因子分析基于数据的相关系数 矩阵进行分析;如果选中 Covarianee matrix复选项,则因子分析基于数据的协方差矩阵 进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选 其一即可。
在Display栏中,选中Un rotated factor solutio n (非旋转因子解)复选项,则在分析 结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样; 对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。
选中Scree Plot (“山麓”图),则在分析结果中给出特征根按大小分布的折线图 形
如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。
在Extract栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征 根(Eigenvalues)的数值,系统默认的是■ c =1。我们知道,在主成分分析中,主成分 得分的方差就是对应的特征根数值。如果默认
(
'c ~ 1,则所有方差大于等于1的主成分
'c值降低,例如 -c值,例如取
将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将 取’c =0.9 ;如果认为最后的提取的主成分数量偏多,则可以提高
■c =1.1。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值 的设定,要在
反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临
界值(如取,c =0.8),这样提取的主成分将会偏多,根据初次分析的结果,在第二 轮分析过程中可以调整特征根的大小。
第二种方法是直接指定主成分的数目即因子数目,这要选中 过变量数目。本例有
Number of factors复选
8,不得
项。主成分的数目选多少合适?开始我们并不十分清楚。因此,首次不妨将数值设大一 些,但不能超
8个变量,因此,最大的主成分提取数目为
超过此数。在我们第一轮分析中,采用系统默认的方法提取主成分。
图6提取对话框
需要注意的是:主成分计算是利用迭代(Iterati ons)方法,系统默认的迭代次数是 25次。但是,当数据量较大时,25次迭代是不够的,需要改为 50次、100次乃至更多 对于本例而言,变量较少,25次迭代足够,故无需改动。
设置完成以后,单击 Continue按钮完成设置(图6)。
3. 设置Scores设置
选中Save as variables栏,则分析结果中给出标准化的主成分得分(在数据表的后 面)。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回 归” (Regressi on)法即可。
Factor A P Save as variables Method
■* Regression r Bartlett
厂 Anderson-Rubin
Help |
臣 Display factor score coefficient matrix
图7因子得分对话框
选中Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵 及其相关矩阵。
设置完成以后,单击 Continue按钮完成设置(图7 )。
4. 其它。
对于主成分分析而言,旋转项( 况下,Option项可以不必理会。
全部设置完成以后,点击 OK确定,SPSS很快给出计算结果(图8)。
Rotation )可以不必设置;对于数据没有缺失的情
\"73
Factor Analysis
Descriptive StaU$tfi££ 国匹主产 Mean std. Deviation igsx.Dga 1474.30603 Anah^i^ N 日口 民民消费 固敢产 职工工费 货愉周转 消楚价需 商品零售 工业产值 1745.933 511=5083 57a633 666.KI0 117.2967 114.9D67 862.9930 051.193 432,008 1310.21805 agsegg 2.02531 1.09808 534.5672& 30 30 30 30 30 30 日口
Correktion Matrix* 居民消费 1.000 &7 ・951 ・191 ■C17 固定宦产 .951 „426 1.D00 -431 -.260 叫3S9 ,792 职工工进 .191 .71B .^00 1.000 -.356 -.135 -.539 .104 岳韧周转 .617 消费倚格 -.273 -.235 -.280 商品零售 -.2 -<999 .业产恒 J74 .363 .792 104 -699
Correlator! 国內生产 居民消费 固定蚩产 职工I资 苗物周转 消费价咯 商品零售 工业产倍 a. Determinant ■ 1.133E-CH .267 1.Q0D .426 .710 -.151 -451 .431 -.356 1.000 -.253 -.35S -.539 ^.273 -.2 .874 .235 -.593 .363 -253 1.000 .763 ■血 .659 -.125 1.000 -.192 -.192 1.000 图8主成分分析的结果
第四步,结果解读。
在因子分析结果(Output)中,首先给出的 应的变量的算术平均值,计算公式为
Descriptive Statistics,第一列 Mean对
_ 1 n Xj = — ' Xj
n —
第二列Std. Deviation对应的是样本标准差,计算公式为
—
n
1 珂十' (Xij -Xj)2]1/2
n T g
第三列Analysis N对应是样本数目。这一组数据在分析过程中可作参考。
Descriptive Statistics Mea n 国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 商品零售 工业产值 1921.093 1745.933 511.5083 57.633 666.1400 117.2867 114.9067 862.9980 Std. Deviation 1474.80603 861.193 402.888 1310.21805 459.96699 2.02531 1.808 584.58726 An alysis N 30 30 30 30 30 30 30 30
接下来是Correlation
Matrix(相关系数矩阵),一般而言,相关系数高的变量,大
多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的 因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从 计算相关系数矩阵的特征根开始的。相关系数阵下面的Determi nan t=1.133E-0.4是相关 矩阵的行列式值,根据关系式d eth
( _ R) = 0可知,det(入)=det( R),从而 Determi nan t=1.133E-0.4= 入*於花犷疋忌*胪方。
这一点在后面将会得到验证。
Correlation Matrix a 国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 商品零售
工业 产消费 价值 国内 生产 居民 消费 固定 资产 职工 工资 货物 周转 格 商品 零售 .267 .951 .191 .617 -.273 -.2 .874 1.000 .267 .951 .191 .617 -.273 -.2 1.000 .426 .718 -.151 -.235 -.593 .363 .426 1.000 .400 .431 -.280 -.359 .792 .718 .400 1.000 -.356 -.135 -.539 .104 -.151 .431 -.356 1.000 -.253 .022 .659 -.235 -.280 -.135 -.253 1.000 .763 -.125 -.593 -.359 -.539 .022 .763 1.000 -.192 .363 .792 .104 .659 -.125 -.192 1.000 工业产值 .874 a. Determi nant = 1.133E-04 在Communalities(公因子方差)中,给出了因子载荷阵的 初始公因子方差 (Initial ) 和提取公因子方差(Extraction ),后面将会看到它们的含义。
Commu nalities
国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 商品零售 工业产值 In itial 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 Extractio n .945 .800 .902 .875 .857 .957 .929 .903
Extractio n Method: Prin cipal Comp onent An alysis.
在Total Variance Explained( 全部解释方差)表的 Initial Eigenvalues
(初始特
征根)中,给出了按顺序排列的主成分得分的方差
(Total),在数值上等于相关系数矩
% of
m=刀入=8,故第一个特征根的
(Cumulative %)。在Extraction
阵的各个特征根 人因此可以直接根据特征根计算每一个主成分的方差百分比(
Variance )。由于全部特征根的总和等于变量数目,即有
类推。然后可以算出方差累计值
足?>1,这一点我们在 图6所示的对话框中进行了限定。
Total V aria nee Expla ined In itial Eige nvalues Comp onent 1 2 3 4 5 6 7 Total 3.755 2.197 1.215 .402 .213 .138 6.5E-02 % of Varia nee 46.939 27.459 15.186 5.031 2.660 1.724 .818 Cumulative % 46.939 : 74.398 .584 94.615 97.275 98.999 99.817 方差百分比为入/m=3.755/8=46.939 ,第二个特征根的百分比为;2/m=2.197/8= 27.459, ,其余依此
Sums of Squared Loadings,给出了从左边栏目中提取的三个主成分及有关参数,提取的 原则是满
Extracti on Sums of Squared Load ings Total 3.755 2.197 1.215 % of Varia nee 46.939 27.459 15.186 Cumulative % 46.939 74.398 .584 1.5E-02 .183 8 100.000 Extraction Method: Principal Component Analysis. Scree Plot
epavnepE
Comp onent Number
图8特征根数值衰减折线图(山麓图)
主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特
征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据 成分数
?值决定主
目的准则有三:
i只取41的特征根对应的主成分
从Total Varia nee Explai ned 的。
表中可见,第一、第二和第三个主成分对应的
?值都
大于1,这意味着这三个主成分得分的方差都大于
1。本例正是根据这条准则提取主成分
ii累计百分比达到80%~85%以上的 道对应的主成分
在Total Variance Expla in ed
表可以看出,前三个主成分对应的
值累计百分比达
到.584%,这暗示只要选取三个主成分,信息量就够了。
iii根据特征根变化的突变点决定主成分的数量
从特征根分布的折线图(Scree Plot)上可以看到,第4个M直是一个明显的折点,这 暗示选取的主成分数目应有 p< 4 (图8)。那么,究竟是3个还是4个呢?根据前面两条 准则,选3个大致合适(但小有问题)。
在Component Matrix (成分矩阵)中,给出了主成分载荷矩阵,每一列载荷值都显 示了各个变量与有关主成分的相关系数。以第一列为例,
0.885实际上是国内生产总值
(GDP)与第一个主成分的相关系数。 将标准化的GDP数据与第一主成分得分进行回归, 决定系数R2=0.783 (图9),容易算出R=0.885,这正是GDP在第一个主成分上的载荷。
Comp onent Matrix a Comp onent 国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 商品零售 1 .885 .607 .912 .466 .486 -.509 2 .384 -.598 .161 -.722 .738 .252 .594 .427 3 .121 .271 .212 .368 -.275 .797 .438 .211 -.620 工业产值 .823 Extractio n Method: Pr in cipal Comp onent An alysis. a. 3 comp onents extracted.
下面将主成分载荷矩阵拷贝到 Excel上面作进一步的处理:计算公因子方差和方差
贡献。首先求行平方和,例如,第一行的平方和为
h12=0.88492+0.38362+0.12092=0.9449
这是公因子方差。然后求列平方和,例如,第一列的平方和为
&2=0.88492+0.60672+ …+0.82272=3.7551
这便是方差贡献(图10)。在ExceI中有一个计算平方和的命令 sumsq,可以方便地算出 一组数据的平方和。显然,列平方和即方差贡献。事实上,有如下关系成立: 相关系数矩阵的特征根=方差贡献=主成分得分的方差 至于行平方和,显然与前面 公因子方差(Communalities )表中的Extraction列对应的数 据一样。如果我们将8个主成分全部提取,则主成分载荷的行平方和都等于
1 (图11),
即有hi=1, s= 4。到此可以明白:在 Communalities中,Initial对应的是初始公因子方差, 实际上是全部主成分的公因子方差; Extraction对应的是提取的主成分的公因子方差,我 们提取了 3个主成分,故计算公因子方差时只考虑 3个主成分。
国内生产总值
图9国内生产总值(GDP的与第一主成分的相关关系(标准化数据) 5 6 7 8 9 10 11 12 13 14 15
A B C D I E 公因子方差 第一主成分第二主成分第三主成分 国内生产 0. 884900 0. 383619 0.120886 居艮消费 0. 606719 -0. 598177 0. 271313 固定资产 0. 911687 0.161106 0. 211997 职工工资 0. 466222 -0. 722410 0. 367938 货物周转 0. 485831 0. 738275 -0. 275252 帶费价格 -0. 508563 0. 251909 0. 796633 商品零售 -0. 6195 0. 594375 0. 437555 T业产值 0. 822729 0. i26737 0. 210970 方差贡献 3.755133 2.196704 E2145 特征根 3. 755133 2.196704 1.2145 图10主成分方差与方差贡献 Comp onent Matrix a
0. 944824 0. 799534 0. 902071 0. 874617 0. 856845 0. 956718 0. 928627 0. 903496 7. 166733 7.166733 7 2.420E-02 5.525E-02 8.113E-02 -7.62E-02 6.855E-02 .107 -9.23E-02 -.157 8 9.192E-02 1.317E-02 -7.36E-02 3.949E-03 -6.02E-03 2.435E-03 1.634E-03 -2.30E-02 国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 1 .885 .607 .912 .466 .486 -.509 2 .384 -.598 .161 -.722 .738 .252 3 .121 .271 .212 .368 -.275 .797 4 -.203 .409 -.270 -.1 .212 .072 Comp onent 5 6 -6.87E-02 1.143E-02 -7.61E-02 -7.71E-02 .304 .305 2.716E-02 .157 8.271E-02 -1.E-02 2.2E-02 -.161 .247 -.137 商品零售 -.620 .594 .438 -.027 3.531E-02 工业产值 .823 .427 .211 .209 -9.38E-02 Extract on Method: Prin cipal Comp onent An alysis. a. 8 comp onents extracted.
A
1
2 国内生产
3 居民消费 4 固定资产 5 职工工资 6 货物周转
B
1
C 2
D 3
E
4
F
5
G
6
H
7
I
8
J
公因千方差
0. 8849 0. 3836 0.1209 -0. 2032 -0.0687 0. 0114 0. 024=2 0. 0919 0. 6067 -0,593 0. 2713 0. 4085 7 0761 0.1568 0, 0552 0.0132 0. 9117 1G1L 0. 212 -0. 2705 -0. 0771 0. 0827 6 0811 -(■, 074 0. 4662 -0.722 0. 3679-0. 1635 0. 30421 -0,016 -0.076 0. 0039 0. 4858 0.7383 -0.275 0. 21184 0. 30502 0. 0225 0. 06S5 -0. 006 -6 509 0. 2519 0. 7966 0. 07176 0. 02716 -0.161 0.1071 0.0024 -0. 62 0.5944 0. 4376 -0. 0267 0. 03531 0. 2468 0. 8227 0. 4267 0. 211 0. 20S88 -0. 0938 -0, 137
-0. 092 -0.157
0. 0016 -0. 023
1
1
1 I 1
1
7 消费价格
S 商品零售 9 工业产值 10 方差夷献 11 特征棍
1 1 1
1
3. 7551 2.1967 L 2149 0. 40244 0. 212S 0.13S 0. 06 0. 0146 3. 7551 2.1967 1. 2149 0.40244 0. 2128 0.13S 0. 06 0.0146
图11全部主成分的公因子方差和方差贡献
8 1 1.133E-04
提取主成分的原则上要求公因子方差的各个数值尽可能接近, 极小,当公因子方差完全相等时,它们的方差为 的时候,居民消费的公因子方差偏小,这暗示提取 义可以得到理解。
在图11中,将最后一行的特征根全部乘到一起,得 最后说明 ComponentScore Coefficient
亦即要求它们的方差
0,这就达到完美状态。实际应用中,
3个主成分,居民消费方
只要公因子方差数值彼此接近(不相差太远)就行了。从上面给出的结果可以看出:提 取3个主成分面的信息可能有较多的损失。至于方差贡献,反映对应主成分的重要程度,这一点从方 差的统计学意
0.0001133,这正是相关系数矩
product )。
阵的行列式数值(在Excel中,求一组数据的乘积之和的命令是
Matrix (成分得分系数矩阵)和 Component
Score Covaria nee Matrix (成分得分协方差矩阵),前者是主成分得分系数,后者是
主成分得分的协方差即相关系数。从 间彼此正交即垂直。
Comp onent Score Covaria nee Matrix 可以看出,
0 (j工k)或1 (j=k),这意味着主成分之
表中的数据当成主成分得分或因 入=3.755,第二列数值分别除以
标准化主成分得分之间的协方差即相关系数为
初学者常将Component Score Coefficient Matrix
子得分,这是误会。成分得分系数矩阵的数值是主成分载荷除以相应的特征根得到的结 果。在
Component Matrix表中,将第一列数据分别除以 Coefficient
沪2.197,…,立即得到 ComponentScore Coefficient ;反过来,如果将 ComponentScore
Matrix表中的各列数据分别乘以 入=3.755 , \"2.197,…,则可将其还原为
主成分载荷即Component Matrix中的数据。
Comp onent Score Coefficie nt Matrix Comp onent 国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 商品零售 1 .236 .162 .243 .124 .129 -.135 -.165 2 .175: -.272 .073 -.329 .336 .115 .271 3 .100 .223 .174 .303 -.227 .656 .360 工业产值 .219 .194 .174 Extractio n Method: Pr in cipal Comp onent An alysis. Comp onent Scores.
Component Scor e Covarianee Matr ix Comp onent 1 1 2 3 1.000 .000 .000 2 .000 1.000 .000 3 .000 .000 1.000
Extractio n Method: Pr in cipal Comp onent An alysis. Comp onent Scores.
实际上,主成分得分在原始数据所在的 SPSS!前数据栏中给出,不过给出的都是标 准化的主成分得分(图12a);将各个主成分乘以相应的\" 用卩特征根的二次方根可以将其 还原为未经标准化的主成分得分。
得分1 | .42743 .33935 70055 -5102B -03667 86S22 -19958 .27330 1 990 1 84235 .97196 .22957 .21602 -.71726 1 S01 .52742 -.14599 -.21177 得分2 -1.52320 -1 78001 1.58632 .26259 .48824 .66619 -28604 .22055 -2.21132 ,05093 - 32761 .08007 -.62016 .20176 1.39467 1,44744 .97727 .71673 -.67419 得分3 得分一 .260 .66940 1 38130 「得分二] 得分三 -2.29500 -2.68230 2.39050 .39530 73500 .90940 -.43140 .34440 -3.33120 1.28340 -.49320 .12060 -.93470 .B70 -1 19310 -1 33560 -.58090 -.38730 -.63430 -1.23100 *72120 2.93080 39160 .22900 -1.400 I-.66840 -.53750 .55590) -.99620 1.16510 .25970 ,09560 .37720) -2.45010 .86720 1.24320 1.92380 .01630 .46820 70690 .26810 -.49550 1 03760 .49020 -1 062 -1.19211 -51B33 - 34594 -.56565 -1 09746 -288 2.61563 ,34924 .20459 *1.687 -.59561 -47953 .49539 -.85361 1.03843 .23108 j .08630 .33602) -2.18402 .77269 1.10800 171494 .01475 .41703 .62990) .23914 -44176 .92508 -1 OOEOO -1,950 1 69230 -39310 .53920 3.25260 3.63230 1 91620 .45300 .42600 -1.41400 (30360 2J 0290 2.18140 1,47290 1.08010 -1.31600 3.05200 1.04000 -.28010 -.41760 4.69350 -1.16990 -57230 .570 -2.85180 -2.05520 -2.05120 -1..80830 -2.15300 -2.38790 -2.19880 -1 75310 -.59311 -.29055 .29371 -1.44632 -1.04217 -1..04023 -.91716 -1.091 -1.21110 -1.11530
.25733 -1.444 1.33351 .391 .48771 1.36153 .47657 .11265 -.72568 -.67162 -.02915 .38760 -2.32800 2.00990 .59680 73470 -2.05220 71770 16930 -1..09420 -1.01280 -.04430 - 805 a.标准化的主成分得分
b. 非标准化的主成分得分
图12两种主成分得分
计算标准化主成分得分的协方差或相关系数,结果与 Matrix表中的给出的结果一致(见 图13)
Component Score Covarianee
第一因子 第二因子 1 第三因子 第一因子 第二因子 第三因子
0.00000 0.00000 1 0.00000 1 图13主成分(得分)之间的相关系数矩阵 第五步,计算结果分析。
从ComponentMatrix即主成分载荷表中可以看出,国内生产总值、固定资产投资和 工业产值在第一主成分上载荷较大,亦即与第一主成分的相关系数较高;职工工资和货 物周转量在第二主成分上的载荷绝对值较大,
主成分上的载荷较大,即相关程度较高。
因此可将主成分命名如下: 第一主成分:投入一产出主成分; 第二主成分:工资—物流主成分; 第三主成分:消费价格主成分。
问题在于:一方面,居民消费和商品零售价格指数的归类比较含混;另一方面,主 成分的命名结构不清。因此,有必要作进一步的因子分析。
Comp onent Matrix a 即负相关程度较高;消费价格指数在第三
Comp onent 国内生产 居民消费 固定资产 职工工资 货物周转 消费价格 商品零售 1 .885 .607 - .912 .466 .486 -.509 -.620 - 2 .384 -.598 J .161 -.722 -.722 .252 .594 J .427 3 .121 .271 .212 .368 -.275 .797 .438 .211 工业产值 .823 Extractio n Method: Pr in cipal Comp onent An alysis. a. 3 comp onents extracted.
至于因子旋转之类,留待“因子分析”部分说明;计算结果的系统分析不属于软件 操作范围,预备课堂讲解。
【说明】本人计算机是双系统,现在常用的 WinMe系统出了毛病,SPSS10.0在 Wi nMe系统 中;故这次改用本人 Win2000系统中的 SPSS11.0。对于因子分析之类 ,SPSS11.0与
SPSS10.0基本没有什么差别。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务