(限时:45分钟)
【选题明细表】
知识点、方法 线性回归方程 相关系数 性检验 可线性化的非线性回归分析 题号 1 3 2 4 1.(2018·广西教育质量诊断性联考)已知某企业近3年的前7个月的月利润(单位:百万元)如折线图所示:
(1)试问这3年的前7个月中哪个月的月平均利润最高? (2)通过计算判断这3年的前7个月的总利润的发展趋势;
(3)试以第3年的前4个月的数据(如表),用线性回归的拟合模式估测第3年8月份的利润. 月份x 利润y(单位:百万元) 1 4 2 4 3 6 4 6 相关公式:==,=-.
解:(1)由折线图可知5月和6月的月平均利润最高.
(2)第1年前7个月的总利润为1+2+3+5+6+7+4=28(百万元), 第2年前7个月的总利润为2+5+5+4+5+5+5=31(百万元), 第3年前7个月的总利润为4+4+6+6+7+6+8=41(百万元), 所以这3年的前7个月的总利润呈上升趋势. (3)因为=2.5,=5,
=1+2+3+4=30,
2
2
2
2
xiyi=1×4+2×4+3×6+4×6=,
所以=
所以=5-2.5×0.8=3,
=0.8,
1
所以=0.8x+3,
当x=8时,=0.8×8+3=9.4(百万元),所以估计8月份的利润为 940万元.
2.(2018·宝安中学、潮阳一中、桂城中学、南海中学、普宁二中、中山一中、仲元中考)某淘宝店经过对“十一”假期的消费情况进行统计,发现在金额不超过1 000元的消费者中男女之比约为1∶4,该店按此比例抽取了100名消费者进行进一步分析,得到下表. 女性消费情况: 消费 金额/元 人数 男性消费情况: 消费 金额/元 人数 (0,200) 2 [200, 400) 3 [400, 600) 10 [600, 800) 3 [800, 1 000] 2 (0,200) 5 [200, 400) 10 [400, 600) 15 [600, 800) 47 [800, 1 000] 3 若消费金额不低于600元的消费者称为“网购达人”、低于600元的消费者称为“非网购达人”.
(1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?
(2)根据以上统计数据填写如下2×2列联表,并回答能否在犯错误的概率不超过0.005的前提下认为“是否为′网购达人′与性别有关”. “网购达人” “非网购达人” 合计 女性 男性 合计 附:K=
P(K≥k0) k0 22
,其中n=a+b+c+d.
0.10 2.706 0.05 3.841 0.025 5.024 0.010 6.635 0.005 7.879 解:(1)女性消费的平均数为900×3)=582.5(元).
(100×5+300×10+500×15+700×47+
男性消费的平均数为(100×2+300×3+500×10+700×3+900×2)
=500(元).
虽然女性消费者的平均消费水平较高,但“女网购达人”的平均消费水平(为712元)低于“男网购达人”的平均消费水平(为780元),所以平均消费水平高的一方“网购达人”出手不一定更阔绰.
(2)2×2列联表如表: “网购达人”
女性 50 男性 5 合计 55 2
“非网购达人” 合计 30 80 15 20 45 100 K=
2
≈9.091,
因为9.091>7.879,
所以在犯错误的概率不超过0.005的前提下可以认为“是否为′网购达人′与性别有关”. 3.(2018·南昌市重点中学模拟)水稻苗经过一个培育周期的生长,达到8 cm左右最适宜播种,过高或过低都会影响后期的生长.为了监控水稻苗的培育过程,检验员从经过了一个培育周期的水稻苗中随机依序抽取20株,并测量其株高(单位:cm),数据如表. 次序 株高 次序 株高 1 7.98 11 8.00 2 8.01 12 8.41 3 8.00 13 7.75 4 8.03 14 8.38 5 7.99 15 7.72 6 7.83 16 7.69 7 7.99 17 8.04 8 8.28 18 8.29 9 7.05 19 7.82 10 7.69 20 8.05 其中,=xi=7.95,s==≈0.294,≈
25.788,(xi-)(i-10.5)=1.38,xi为抽取的第i株水稻苗的株高,i= 1,2,…,20.
(1)求xi与i(i=1,2,…,20)的相关系数r,并判断抽取的20株水稻苗的株高是否与抽取次序有关(若|r|<0.25,则可以认为水稻苗的株高与抽取次序无关);
(2)把株高在(-3s,+3s)之外的水稻苗称为异常苗.监控部门要求,如果在抽取的水稻田中出现了异常苗,就认定这个培育周期的培育环境出现了异常情况,需要对培育环境进行检查和修正.
①从抽检的结果看,是否需要对培育环境进行检查?请说明理由;
②剔除异常苗的株高,用余下的数据估计总体的均值和标准差(精确到0.01).
附:相关系数r=,≈2.236,≈0.06.
解:(1)xi与i(i=1,2,…,20)的相关系数r=≈
≈0.04.由于|r|<0.25,故可以认为水稻苗的株高与抽取次序无关.
(2)①由于=7.95,s≈0.294,(-3s,+3s)即(7.068,8.832),由样本数据可以看出,第9棵株高为7.05 cm的水稻苗为异常苗,因此需要对培育环境进行检查和修正.
3
②剔除(-3s,+3s)之外的数据j7.05,剩下数据的样本平均数为8.00,因此总体的均值的估计值为8.00.
≈20×0.294+20×7.95≈1 265.779.
2
2
×(20×7.95-7.05)≈
剔除7.05,剩下数据的样本方差为×(1 265.779-7.05-19×8.00)≈0.004,因此总体的
22
标准差的估计值为≈0.06.
4.在试验中得到变量y与x的数据如表: x y 0.066 7 39.4 0.038 8 42.9 0.033 3 41.0 0.027 3 43.1 0.022 5 49.2 由经验知识知,y与之间具有线性相关关系,试求y与x之间的回归方程.当x=0.038时,预测y的值.(回归方程系数及结果保留两位小数)
参考公式:==-.
=,
参考数据:xi=0.188 6,yi=215.6,=151.8,
()=5 101.56,
2
=6 6.76.
解:令u=,则ui=151.8,所以=30.36.
因为yi=215.6,所以=43.12,
又uiyi==6 6.76,
=()=5 101.56,
2
4
所以==
≈0.29.
所以=-
=43.12-0.29×30.36≈34.32,
所以=34.32+0.29u.
所以所求回归曲线方程为=34.32+,
所以当x=0.038时,y的预测值为41.95.
5
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务