1、 主成分分析:主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为
少数几个综合指标。它是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。 2、 复相关系数:一个要素或变量同时与几个要素或变量之间的相关关系,它是度量
复相关程度的指标,它可利用单相关系数和偏相关系数求得。复相关系数越大,表明要素或变量之间的线性相关程度越密切。
3、组合设计:是利用正交表安排多因素试验、分析试验结果的一种设计方法。它从多因素
试验的全部水平中挑选部分有代表性的水平组合进行试验,通过对这部分试验结果的分析了解全面试验的情况,找出最优水平组合。
3、 通径系数:表示各条通径对于改变Y反应量相对重要性的统计数。
4、 λ:任意两个处理在同一区组中同时出现的次数或两个处理在同一区组中相遇的次数。
二、问答题
1、.裂区设计,随机区组设计。 采用大田试验时,应该采用多因素试验结果的统计分析中的裂区试验的统计分析。具体按下列步骤进行: ① 结果整理
② 分别计算主区部分和副区部分的平方和和自由度 ③ 列出方差分析表,进行F检验
④ 多重比较(包括1.主区因素各水平间的比较2.副区因素各水平间的比较3.处理间的比较
---包括同一因素下不同水平间的比较和全部处理间的相互比较) ⑤ 试验结论
采用盆栽试验时,应该采用多因素试验结果的统计分析中的多因素随机区组试验的统计分析。具体按下列步骤进行: ① 结果整理
② 自由度和平方和的分解
③ 列出方差分析表,进行F检验
④ 多重比较(包括因素间的比较和水平间的比较,以及不同水平组合间的比较和简单效应
的检验四个步骤) ⑤ 试验结论
2、主成分分析的步骤:(1)计算相关系数矩阵(2)计算特征值与特征向量
(3)计算主成分贡献率及累计贡献率(4)计算主成分载荷
主成分分析与因子分析的联系:多变量大样本分析中,变量间存在共线性,增加了分析的复杂性。若分别分析各个指标,分析有可能是孤立的,而不是综合的;盲目地减少指标又有可能损失很多信息,得出错误结论。欲采用较少指标,反映原资料大部分信息,可采用主成分分析和因子分析。
三、试验设计题
因素水平编码表如下:
编码值 γ 1 0 -1 -γ 组合设计表如下: A 2 1 0 -1 -2 B 2 1 0 -1 -2 C 2 1 0 -1 -2 D 2 1 0 -1 -2 No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 A 1 1 1 1 1 1 1 1 -1 -1 -1 -1 -1 -1 -1 -1 -2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 B 1 1 1 1 -1 -1 -1 -1 1 1 1 1 -1 -1 -1 -1 0 0 -2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 1 1 -1 -1 0 0 0 0 -2 2 0 0 0 0 0 0 0 0 0 0 0 0 0 0 D 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 1 -1 0 0 0 0 0 0 -2 2 0 0 0 0 0 0 0 0 0 0 0 0
四、统计题
1、用excel分析得到XY散点图和趋势线
7507006506005505004504000510图1fig 1152025
得出拟合回归方程
Y=468.2857+33.0071*X1-1.2411*X1*X1 可以由上式得出极值为x=13.3时,y=693
2、用DPS列表得
A1 A1 A1 A2 A2 A2 A3 A3 A3
计算出方差分析表随机模型
B1 B2 B3 B1 B2 B3 B1 B2 B3
均 方 7422.056 2695.056 42.4722 2497.944
376 386 355 455 476 433 480 496 446 434 458 413 356 366 333 465 474 425
F0.05 F0.01
3.592 6.112 3.592 6.112 2.945
变异来源 平方和 自由度
A因素间 14844.11 2 B因素间 5390.111 2 AxB 169.88 4 误 差 22481.5 9 总变异 42885.61 17 F 值
174.751** 63.455** 0.017
由方差分析表可以看出,A,B因素种间、AB互作效应均未达到显著水平,不明显。
处理
8 7 9 2 5 4 1 3 6
各个处理间差异不明显。 3、
均值
485 472.5 435.5 422 421 405.5 405 384 383
5%显著水平 a a a a a a a a a 1%极显著水平 A A A A A A A A A
方差来源 平方和 df 均方 回归 6.2608 20 0.313 剩余 7.911 15 0.5274 误差 2.3024 9 0.2558 总和 14.1718 35 F值
2.59355** F0.05
1.878375023 F0.01
2.444809874
计算回归方程得
Y1=11.511-0.139X1+0.0767X2-0.0583X3+0.123X4+0.0192X5-0.177X1^2+0.086X2^2+0.0977X3^2-0.0635X4^2-0.0335X5^2+0.106X1X2+0.0275X1X3+0.191X1X4-0.100X1X5+0.140X2X3-0.0738X2X4+0.168X2X5-0.268X3X4-0.181X3X5+0.04X4X5
实验设计的结构矩阵是一个正交矩阵,它消除了偏回归系数间的相关性,对其进行F检验,其中X5、X5^2、X4X5、X1X3不显著,从原回归方程中剔除,以增强稳定性,提高预测效果,
进行第二次方差分析得:
Y2=11.488-0.139X1+0.0767X2-0.0583X3+0.123X4-0.177X1*X1+0.0865X2*X2+0.0977X3*X3-0.0635X4*X4+0.106X1*X2+0.191X1*X4-0.1X1*X5+0.140X2*X3-0.0738X2*X4+0.168X2*X5-0.268X3*X4-0.181X3*X5
式中Y为甜瓜的含糖量值,方程Y2达到10%的显著水平(F值为0.9178),相关系数r为0.6603
4、1)计算X,S,R,CV
8.9.669.659.7411.3413.791 1 1 3 6 7 3.3.103.433.28
s 3.163 4.168 6.025 4.842 8 7 7 5 4.005 5.041 ma20.118.4
x 14.3 20.13 20.13 20.13 3 22.5 22.4 7 22.57 22.57
X 10.412 11.179 12.968 10.074 min
3.93 3.63 4.43 4.3 4.13 4.7 4.6
18.014.3
R 10.37 16 16.5 16.2 16.5 7 18.1 4 17.87 17.97 CV 30.4 37.3 46.5 48.1 41.1 32.2 35.6 33.7 35.3 36.5
2)做多元回归分析
方差分析表
3.93 4.13 3.63
方差来源 回 归 剩 余 总 的
平方和 1241.044 218.5883 1459.633 df 11 37 48 均方 F值 F0.05 F0.01 112.8222 19.0972** 2.058734093 2.769817 5.9078 30.409
通过对数据做线性回归,得到回归方程:
ˆ=-2.6052-0.7441X1+0.6265X2+0.3172X3-0.2671X4-0.2878X5+0.4986X6+0.1536X7+0.1077yX8+0.6961X9+0.2909X10+0.31X11
3)进行逐步回归,建立最优方程
变量 b0 b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11
回归系数 标准系数 偏相关 -2.6052 0.6265 0.3172
0.4735 0.3466
0.4520 0.2733
-0.7441 -0.4269 -0.3275
标准误
t值
p-值
t0.05
t0.01
6.9185 -0.3766 0.3578 -2.0795 0.2061 0.1861
3.0401 1.7044
0.7087 2.0261924 2.71087 0.0448 2.0261924 2.71087 0.0044 2.0261924 2.71087 0.0969 2.0261924 2.71087 0.1357 2.0261924 2.71087 0.1214 2.0261924 2.71087 0.0523 2.0261924 2.71087 0.5539 2.0261924 2.71087 0.5994 2.0261924 2.71087 0.0001 2.0261924 2.71087 0.2759 2.0261924 2.71087 0.0102 2.0261924 2.71087
-0.2671 -0.2345 -0.2465 -0.2878 -0.1852 -0.2556 0.4986 0.1536 0.1077 0.6961 0.2909 0.31
0.2809 0.0958 0.01 0.5056 0.2659 0.3813
0.3172 0.0991 0.0880 0.6079 0.1814 0.4116
0.1750 -1.52 0.1814 -1.58 0.2484 0.2571 0.2032 0.1516 0.2629 0.1344
2.0070 0.5976 0.5299 4.5933 1.1065 2.7096
由t检验可以剔除次要变量,筛选得到最优方程
r(y,X2)= r(y,X7)= r(y,X9)= r(y,X11)=
偏相关 t检验值 p-值
0.4223 3.09 0.0034 0.558 4.4607 0.0001 0.7052 6.5975 0.0001
0.7594
7.7431
0.0001
最优方程是
ˆ=-7.6285+0.3697X 2+0.6236X 7+0.7793X 9+0.5840X11 y
4)作通径分析 通径系数
因子 X2 X7 X9 X11 直接 0.2794 0.3887 0.566 0.6116 →X2
-0.1174 -0.1245 -0.1035 →X7 →X9 -0.1633 -0.2522 0.2886 0.1982
-0.0303 0.0244
决定系数=0.78179 剩余通径系数=0.46713
通过作通径分析可知,因素X11对Y值的直接作用最大;交互作用主要以负作用为主, X2
→X9对Y值负作用最大 ;X7→X9对Y值正作用最大 。
试验结论:49个小麦品种的生育期(y)与不同时段的平均温度(xi)的关系中, X11对小
麦品种的生育期(y)直接作用最大,各因素交互作用主要以负作用为主,不同时段
的平均温度X2→X9对小麦品种的生育期(y)负作用最大;不同时段的平均温度X7→X9对小麦品种的生育期(y)正作用最大。
5 正交设计方差分析表(随机区组模型):
变异来源 平方和 自由度 区组 0.4808 第1列 47.2583 第2列 4.86 第3列 0.1667 第4列 0.4267 第5列 0. 误差 1.2258 总和 .9583
字母标记表示结果
2 3 1 1 1 1 14
均方
0.2404 15.7528
4.86 0.1667 0.4267 0. 0.0876 F值
179.9094** 55.5051** 1.9035 4.8729 6.1672 p-值
0.0001 0.0001 0.13 0.0445 0.0263
处理
8 7 6 5 4 3 2 1 均值 18.4667 17.7 17.4667 16.7667 16.0667 15.5667 15.1667 13.5333
5%显著水平 a b b c d de e f 1%极显著水平 A AB BC CD DE EF F G
实验结论,小区试验中,重复1和2的组内差异最大,均达到0.01显著水平,处理8的平均小区产量最高,与除处理7的其他处理间均达到0.01水平极显著差异
6、用DPS进行双重筛选逐步回归分析,将变量值分为3组 第一组:
在临界值Fx=2.00, Fy=1.98的条件下,可建立如下回归方程(组)
因变量 Y1
x1
常数项a 相关系数 p值 剩余标准差S
0.0991 17.1724 0.5317 0.0001 1.4306
Y1=17.1724+0.0991X1
第二组:
在临界值Fx=2.00, Fy=1.98的条件下,可建立如下回归方程(组)
因变量 Y2 Y4
常数项
x2 a
0.4138 39.4255 -0.2449 .042 相关系剩余标准差数 p值 S 0.3431 0.0158 6.3126 0.0684 0.04 19.9002
Y2=39.4255+0.4138X2
Y4=.042-0.2449X2
第三组:
在临界值Fx=2.00, Fy=1.98的条件下,可建立如下回归方程(组)
因变量 Y3
常数项相关系剩余标
x1 x3 a 数 p值 准差S 0.7967 -0.9177 21.4247 0.2998 0.1146 11.4829
Y3=21.4247+0.7967X1-0.9177X3
实验结果说明,小麦的产量性状中,小麦数(Y1)主要受孕穗期(X1)的影响,小花数(Y2)和结实率(Y4)受相同因素的影响,影响因素为抽穗期(X2),小麦的实粒数(Y3)主要受小麦孕穗期(X1)和开花期(X3)的影响
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务