第22卷第4期 长春大学学报 Vo1.22 No.4 Apr.2012 2012年4月 JOURNAL OF CHANGCHUN UNIVERSITY 拟合优度检验在教学中的应用及Matlab实现 刘泽显 ,莫达隆。,冯祖针 (1.贺州学院数学系,广西贺州542800;2.红河学院数学学院,云南蒙自661100) 摘要:采用X 拟合优度检验对119名学生的考试成绩进行假设检验,得到在显著性水平0.01下它服从正态分 布,并对教学提出一些建议。 关键词:x。拟合优度检验;极大似然估计;正态分布 中图分类号:0212 文献标志码:A 文章编号:1009—3907(2012)04—0419—04 0 引 言 在数理统计中,统计推断,如参数估计和参数的假设检验,都是在总体分布已知的基础上进行的。而在 实际应用中,对总体的分布知之甚少,因此首先要研究总体分布的性质。一般来说,总体的精确分布很复杂 也很难确定,甚至它根本不服从什么分布,在这种情况下只能寻找总体的极限分布或用已知的分布去近似 它。通常的做法是采用拟合优度检验对样本数据进行假设检验。到目前为止,拟合优度检验的方法很多,发 展也比较成熟,拟合优度检验统计量大体可分为 检型、基于经验分布的EDF型和条件积分变换型,以及 针对常用分布(例如正态分布、指数分布,均匀分布等等),体现分布特征的检验统计量¨J。在这些拟合优度 检验方法中 拟合优度检验法是最重要也是最常用的拟合优度检验方法之一。本文采用 拟合优度检验 法对贺州学院某专业1 19名学生的概率论与数理统计考试成绩进行假设检验,得到在给定的显著性水平下 它服从正态分布,并对教学给出一些建议。 1 拟合优度检验法的基本步骤 (1)抽样。从总体 中抽出样本置, …, 。抽样的方法有很多,例如简单随机抽样法、分层随机抽 样法、比估计法和系统样本法等 J。本文采用的是简单随机抽样法,即抽样所得样本置, …, 独立同分 布,且与总体 有共同的分布 。 (2)判断总体 分布的类型,建立原假设。判断方法主要有两种:第一种是经验判断法。例如某一电子 元件的寿命有可能服从指数分布;某一地区人们的智商有可能服从的是正态分布;某一地区在一天内邮递遗 失的信件数有可能服从泊松分布等等。当然,这种判断方法要求研究者对研究对象的性质和特征有一定的 了解。第二种是频率直方图判断法。样本容量较大时,频率直方图的外廓曲线与总体 的概率密度函数曲 线比较接近…。根据此原理,作出样本的频率直方图,观察它与哪些已知分布的概率密度函数曲线比较接 近,然后判断其可能服从什么分布。若它与几种分布的概率密度函数曲线都很接近,则要进行多个假设检验 用似然比检验法来择优 J。建立原假设风,原假设分为两种类型:(a)简单假设:Ho:F=Fo,其中 不含未 知参数。(b)复合假设: :F∈Fo( , ),其中0是一个参数标量或参数向量,Fo( , )形式确定,但0含有未 知参数,如在正态分布族Ⅳ( , ),0=( , )未知,在指数分布族中E(0)中,0未知,等等。0的未知参数 可用不同的参数估计方法来估计,比较常用的是极大似然估计法 和最小距离估计法 , J。 (3)选择检验统计量。分布拟合检验中不同方法的关键区别在于选择不同的检验统计量。先把总体 的样本空间分成 互不相交的子集(或区间)S ,Js ,…,s ,其中n (i=1,2,…, )表示样本 , …, 落人 k 5 的个数,且∑n = ,其中n为样本容量,P :P{ ∈S }(i=1,2,…, )表示 落人s 的概率。样本容量较 收稿日期:2012.02—17 基金项目:广西高等学校科研资助项目(200103YB141);贺州学院院级科研立项项目(2011ZRKY13) 作者简介:刘泽显(1984一),男,广西昭平人,助教,硕士,主要从事最优化理论与方法方面研究; 莫达隆(1970一),男,广两蒙山人,副教授,主要从事数理统计与时间序列方面的研究。 42O 长春大学学报 第22卷 大时,由大数定理可知,风成立时,詈与p (i=1,2,…,后)的值应该比较接近 。若 与P (i:1,2,…,Ji})的 值很大则认为日0不成立。为了更好地度量了理论分布与总体经验分布之间的偏差,1900年K.Pearson提出 了 统计量 =囊 ,并且证明K.Pears。n定理:当Ho为真时, z检验统计量的极限分布为自由 度为k—l或k—r一1的 分布。证明参考 J。 (4)计算拒绝域。对于给定的显著性水平 ,计算拒绝域R={ I > 一 (k一1)}或R={ l > 一 (k—r一1)},其中r表示未知参数的个数。 (5)决策。若检验统计量的观察值没有落人拒绝域,则总体分布与假设的分布差异不显著,因此在此显 著性水平下总体服从假设的分布,否则它不服从。 2应用实例 本文应用x 拟合优度检验法对贺州学院某专业119名学生的概率论与数理统计考试成绩进行假设检 验,并给出它的Matlab实现 ]。贺州学院某专业l19名学生的概率论与数理统计考试成绩见表1。 (1)判断总体分布的类型,建立成原假设。作学生考试成绩的频率直方图,如图1所示: 图1学生考试成绩的频率直方图 其主要程序为:[M N]=ecdf(score—Stu); ecdfhist(M,N,Cen_Inter); 观察频率直方图发现,它两头低中间比较高,与正态分布的概率密度函数的图形接近,因此假设总体服 从的是正态分布N(pu,or )。建立复合假设H。:F=N( , ),其中 和盯 的极大似然估计分别为:mean— Stu=sum(score_Stu)/num _Stu :vax_Stu=sum(score_Stu)/num_Stu—mean Stu ; 表1贺州学院某专业119名学生的概率论与数理统计考试成绩 83 84 65 85 56 82 74 4 661 77 82 72 87 63 73 74 63 84 80 80 85 87 79 70 78 72 79 67 86 88 58 80 76 54 70 80 82 66 79 84 83 81 71 91 88 46 64 70 56 66 76 74 72 89 85 75 77 92 86 82 76 77 87 63 90 83 74 98 76 90 75 74 79 87 91 76 74 81 76 84 90 86 83 79 94 67 84 66 84 84 76 83 67 90 80 84 74 82 85 (2)将考试成绩分区间并整理区间。根据考试成绩,将考试成绩分成11个区间,整理分区,使得每个区 间的理论频数npi 5,结果见表1,主要程序为: while i<= j%根据正态分布的特点,从区间左右两边交替地进行合并。 S:0;%先从左边开始 if expectnum(i)<5&&i<=ceil(1/2 length(expectnum)) ’第4期 刘泽显,等:x 拟合优度检验在教学中的应用及Matlab实现421 s=expectnum(i); while s<5&&i<:ceil(1/2 length(expectnum)) i=i+1;S:S+expectnum(i); end indexl=[indexl,i];i=i+1; elseif i<=ceil(1/2;l:length(expectnum)) indexl:[indexl,i];i=i+1; end if expectnum(j)<5&&j> 1/2 length(expectnum) %然后马上从右边开始 S=expectnum(j); while S<5&&j>1/2 length(expectnum) j=j一1;S=s+expeetnum(j); end indexr=[j,indexr];j=j一1; elseif j> 1/2%length(expectnum) indexr=[j,indexr];j=J一1; end end indexr=indexr(2:end)一1;index=[indexl,indexr]; (3)计算其检验统计量的观察值,主要程序如下: val—Chi:sum((aetnum—num Stu. expectpro). ./(Bum—Stu.{expeetpro)); 结果为:val—Chi:8.4133 (4)计算拒绝域,主要程序如下: va~Cri=chi2inv(1一alpha,length(inter)一1—2—1); 结果为:va~Cri=13.2767;因此拒绝域为:R:{x I x >13.2767}; (5)决策。通过比较发现检验统计量的观察值没有落人拒绝域,因此接受原假设,即在显著性水平0. 01下总体服从正态分布N(77.1261,9.1503 )。 表2分区的结果和整理后分区的结果 区间 频数 频率 概率 理论频数 整理后的区间 整理后的理论频数 (一 ,50) 1 0.0o84 0.0o22 0.2583 [50,55) 2 0.0168 0.0078 0.93l1 [一 ,65) l2.0365 [55,6O) 3 0.0252 O.O259 3.0789 [60,65) 7 0.0588 0.0653 7.7682 [65,70) 14 O.1176 0.1257 14.9573 [65,70) 14.9573 [70,8O) 26 0.2185 0.2072 24.6561 [75,8O) 24.6561 [80,85) 27 0.2269 0.1774 21.1105 [8O,85) 21.1lo5 [85,90) 15 O.I26l 0.I159 l3.7962 [85,90) l3.79I62 [90,95) 5 0.0420 0.0578 6.88l3 [90,十∞) 10.4624 [95,+∞) l O.0o84 0.030l 3.58ll 3 结语 通过以上讨论可知,此专业119名学生的概率论与数理统计考试成绩服从正态分布N(77.1261, 9.1503。)。根据正态分布的特点可知,此专业大部分学生处于平均水平附近,只有少数学生成绩特别优秀或 422 长春大学学报 第22卷 者比较差。结合平均分77.1261得到,此专业大部分学生能比较好地掌握所学的知识,少数学生能掌握得特 别好或特别差,这在教学中属于正常现象。同时也可知,这些考试试题难度适中,能较大程度反映了学生掌 握知识的情况。而结合方差9.1503 得,此专业学生的成绩相差在一定范围内的差异比较大,即学生的所学 知识掌握程度有比较大的差异,至于什么原因,还有待进一步调查研究,在教学中要重视这个问题。 参考文献: [1]杨振海,程维虎,张军舰.拟合优度检验[M].北京:科学出版社,2011. [2]R.Lyman 0tt,Micheal T.Longneeker.AnIntroductionto StatisticalMethodsAnd DataAnalysis6 [M].Stamford,Connecticut:Cengage Leam- ing,2010. [3] 费鹤良.分布拟合优度检验方法综述[J].上海师范学院学报(自然科学版),1982(2):129—142. [4] Durbin,J_Weak convergence ofthe sample distirbution function when parametem arc estimated[J].Ann.Statist,1973,l(2):279—290. [5] MichaelGenz,ErichHaeusler.Empiircal processeswith estimated p ̄ametem under auxiliaryinformation[J].Journal ofComputational and Applied Mathematics,2006,186(1):191—216. fowitz,J.The minimum distance me ̄od[J].The Annals of Ma ̄ematical Statistics,1957,28(1):75—88. [6] Wol[7] Michael D.Weber,Lawrence M.Leemis,Rex K.Kincaid.Minimum Kolmogorov—Smimov test statistic p ̄ameter estimates[J1.Journal of Statistical Computation and Simulation,2006,76(3):195—206. [8] 陈希孺.数理统计引论[M].北京:科学出版社,1981. [9] 张德丰,等.MATLAB概率与数理统计分析[M].北京:机械工业出版社,2010.责任编辑:程艳艳 Application of X2 Goodness of Fit Test in Teaching and Matlab Implementation LIU Ze—xian ,MO Da—long ,FENG Zu.zhen2 (1.Department of Mathematics,Hezhou University,Hezhou 542800,China) (2.College of Mathematics,Honghe University,Mengzi 661 100,China) Abstract:× goodness of ift test is used to do a hypothesis test on 1 19 students’examination scores,showing that it obeys the normal distribution under the signiifcance level of 0.01.Based on this,it provides some suggestions on teaching. Keywords:X goodness of ift test;maximum likelihood estimation;normal distribution (上接第418页) E】i【istence of SolutiOn fl0r a Class of Two.Point Boundary Value Problem of Second Order Integal-differential Equations NI Jin—bo,GAO Juan (College of Science,Anhui University of Science and Technology,Huainan 232001,China) Abstract:This paper discusses the existence of solution for a class of two—point boundary value problem of second order integral—differ- ential equations.By using lower and upper solutions method and Schander fixed point theorem,it obtains the suficientf conditions for the existence of solution under weaker conditions. Keywords:integral・diferentil equataion;two—point boundary value;upper and lower solutions;Schander fixed—point theorem