首页 公文范文 统计学经典理论

统计学经典理论汇编(三篇)

发布时间:2023-09-18 16:30:43

绪论:一篇引人入胜的统计学经典理论,需要建立在充分的资料搜集和文献研究之上。搜杂志网为您汇编了三篇范文,供您参考和学习。

统计学经典理论

篇1

摘 要:目的 分析医学硕士研究生学位论文中数理统计应用情况. 方法 随机抽取2000/2001年100位河南医科大学应届医学硕士学位论文初稿,对其中数理统计应用情况进行统计分析. 结果 论文中采用单因素设计者占94.0%,多因素设计占6.0%,应用正确率为96.6%;论文中使用经典基本数理统计方法为97.9%,统计学方法的正确应用率为75.7%;应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误. 结论 应加强硕士学位论文的数理统计设计和审查工作.

Keywords:medical master graduates;thesis;statistics;in-vestigation

Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.

0 引言

数理统计的应用正确与否是论文科学性的重要标志.近年在医学学术期刊(包括国内著名的核心期刊)上发表的论著,数理统计方面还存在问题,甚至导出错误的结论[1-4] .数理统计作为一门应用学科已成为医学硕士研究生学位课程的主要内容之一,越来越受到硕士研究生的重视.为了解医学硕士生学位论文中数理统计的应用情况,为课题的统计设计和论文审查提供科学依据,为教学改革提供参考,作者随机抽取河南医科大学应届硕士学位论文100篇,对其数理统计应用情况进行分析.

1 材料和方法

2000/2001年河南医科大学共有医学硕士研究毕业生222人,应用随机数表随机抽取100名硕士研究生学位论文的初稿作为研究对象,对实验设计类型、使用的统计学分析方法及使用的统计学工具,存在的问题等进行调查.结果推断利用SAS(6.12)统计分析系统进行分析.

2 结果

2.1 实验设计类型 硕士学位论文中采用单因素设计的比重较大,占94.0%,统计学设计正确率较高(Tab1).

2.2 统计学方法 论文中使用经典的基本统计学方法的占绝对多数,为97.9%(856/874),统计学方法的正确应用率为75.7%,且不同的统计学方法之间的正确应用率存在着差别.应用参数统计方法者518次,应用正确者357次,正确应用率为68.9%;应用非参数统计方法者346次,应用正确者305次,正确应用率为88.1%.对参数统计方法的正确应用率低于非参数统计方法(χ2 =35.8,P

表1 硕士论文的实验设计类型及正确应用情况 略

表2 论文中应用的统计学方法分布及正确应用情况 略

表3 获取结果时使用的计算工具 略

2.3 数理统计问题 论文中存在的问题在参数统计与非参数统计中的构成不同,应用参数统计时出现的问题是未进行使用条件判断者159次,未正确应用统计方法者9次,推断结论有误者19次;而应用非参数统计时出现问题是未进行使用条件判断者8次,未正确应用统计方法者14次,推断结论有误者21次(两者相比χ2 =48.31,P

3 讨论

在硕士研究生的基础理论教学中,开设数理统计学的主要目的是为了指导研究生正确地应用统计学的原理与方法,解决医学研究中如何科学地进行科研资料的搜集、整理和分析推断问题.传统的经典的和基本的统计学理论与方法仍然是当前硕士研究生进 行科研工作的统计学方面的主要工具.论文中采用的完全随机、配对及配伍等单因素设计的比重较大占94.0%,多因素设计占的比重较少为6.0%,总的来说,其统计学设计的正确率是比较高的.说明学生对统计学设计理论比较重视并能正确应用.论文中使用经典的基本统计学方法占绝对多数为97.9%(856/874),主要为t检验、F检验、χ2 检验及秩和检验等,这与这些方法成熟、简单明了且实用性极强有很大关系,而近些年来新发展的比较前沿的统计学分析方法[5-12] ,由于对设计要求严格,使用过程复杂,非专业人员在短时间内难以掌握而实际应用较少.这提示在今后的研究生教学过程中,除应继续进行基础部分内容的学习外,还应加强新的统计学方法和使用条件的教学力度.

论文中以基本的经典的统计学方法为主,但实际应用时的正确应用率仅为75.7%,且不同的统计学方法之间的正确应用率存在着差别,对参数统计方法的正确应用率低于非参数统计方法.经进一步分析,应用参数统计时出现的主要问题是未进行适用条件判断,而应用非参数统计时出现的主要问题则是推断结论有误.作为一门应用学科,数理统计学有着其独特的逻辑性,概念多、公式多且连贯性强,众多的公式和分析方法既有联系又有区别,同时有着严格的适用条件.传统的教材编写和教学重点是统计学方法的计算技巧,其结果容易将学生引导到仅注重学习统计计算方法上,忽略了各种方法的适用条件和对资料的综合分析.所以t检验、F检验等经典的统计方法虽看似简单,但要正确应用到实际工作中,对学生来说仍有相当难度.秩和检验等非参数统计由于其适用条件较参数统计宽松,使得其正确应用率高于参数检验,而并非学生对非参数检验掌握的比参数检验更好.

随着计算机技术和统计软件的完善与普及,各种复杂的统计计算不必再用手工计算.本次研究表明大部分人(91.0%)通过应用著名的统计分析软件SPSS及SAS获取结果,这些结果比手工计算的更准确、更规范,所以各种统计方法的计算过程大可不必细致介绍,而要重点介绍各种数理统计方法的使用条件,加强资料分析实践,提高硕士生解决实际问题的能力.

参考文献

[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.

[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.

[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.

[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.

[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.

[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.

[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.

[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.

[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.

篇2

【Abstract】 Objective To discuss differences between classical and Bayesian testing thoughts.Methods First these two thoughts are summarized’and then they are compared through an example.Results It is pointed out that these two thoughts are united on Bayes’s Theorem’that they are equal on given occasions’and that Bayesian testing approaches have more advantages than classical approaches in using prior information’indicating the hazard of testing’considering the loss’and dealing with the problem of multi-hypotheses.Conclusion Great attention should be paid to Bayesian theory.

【Key words】 hypothesis test Classical school Bayesian school

假设检验问题是统计学的传统问题,对于该问题,经典统计学派与贝叶斯学派有不同的处理思想。目前,经典统计方法占据着统计学的主导地位,但是,贝叶斯方法正在国外迅速发展并得到日益广泛的应用,我们有必要给以足够的重视。本文结合一个例子,对两大学派的假设检验思想进行初步比较,以揭示两种思想的区别与联系,并着重探讨贝叶斯方法的优势。

两种假设检验思想

一、经典统计学派的假设检验思想

经典统计学派运用反证的思想进行推断,即:在认定一次实验中小概率事件不会出现的前提下,若观察到的事件是H0为真时不合理的小概率事件,则拒绝H0。

上述思想可以用如下决策函数表示:

其中x代表样本信息。Φ(x)取值为0时即为通常的“拒绝H0”。

二、贝叶斯学派的假设检验思想

贝叶斯学派直接讨论H0和H1的后验概率,依据后验概率的大小进行推断。

其基本的解决方案是:在先验分布π下,有决策函数

Φ(x)取值为0时即“拒绝H0”。很明显,它选择了后验概率较大的假设。

三、两种思想的联系与分歧

在经典统计学中,参数被看作未知常数,不存在参数空间,因而不存在H0和H1的概率,给出的是P(x|H0真),其中x代表样本信息。在贝叶斯方法中,参数被看成随机变量,在参数空间内直接讨论样本x下H0和H1的后验概率,给出的是P(H0真|x)和P(H0不真|x)。

事实上,两个学派的方法在一定程度上统一于贝叶斯公式。

由贝叶斯公式容易得到:

因此,当P(H0)=P(H1),即H0与H1居于平等地位时,经典学派与贝叶斯学派的结果是一致的。

然而,H0与H1地位往往不一致,H0常居于将被否定的位置,因而上述一致性并不总能成立。贝叶斯学派对此进行了深入的探讨,他们的结果很有意义。

对于正态分布前提下的单侧检验:X~N(θ,1),H0:θ≤0 H1:θ>0,经典方法得到的P值与贝叶斯方法在无信息先验分布下的后验概率相等,此结论可以推广到正态分布前提下其他类似的单侧检验。

对于形如H0:θ=0,H1:θ>0,(或H1:θ<0)的单侧检验,情况则不同,与下述的双侧检验有类似结果。

对于形如H0∶θ=0, H1:θ≠0的双侧检验,经典方法得到的P值与贝叶斯方法的后验概率大不相同。在Berger和Sellke 1987年对正态分布前提下二者的比较研究中,当经典方法得到的P在0.01~0.1之间时,贝叶斯方法得到H0为真的后验概率大于P,因而此时拒绝H0所承担的实际风险大于P,而这个区间对于经典方法下结论是非常重要的。Hwang和Pematle 1994年提出,对这类双侧检验,类似结果始终存在,因而P值应该由其他判断标准来替代。但他们还没有找到这种标准。

两种思想的应用

下面我们通过一个例子对两种假设检验思想进行一些比较。

例:以随机变量θ代表某人群中个体的智商真值,θi为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为μ,则第i个个体在一次智商测验中的得分可以表示为:xij=θi+eij=μ+ei+eij,其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄儿童的智商真值θ~N(μ’τ2),其中μ=100’τ=15,个体智商测验得分Xi~N(θi’σ2),其中σ=10。现在一名该年龄儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平(即θi>100)?(2)若取θi在(a’b)为正常,问该儿童智商是否属于正常? 转贴于

一、用经典统计方法解答

对第一问,设H0:θi≤100 H1:θi>100,按照经典统计学方法,若H0成立,则有:

因此,α水平下的拒绝域为{x:x>100+σ・u1-α}

已知σi=10,若取α=0.05,有u0.95=1.645,100+10×1.645=116.45。

现有x=115,因此,在0.05水平尚不能认为该儿童智商高于平均水平。

对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。

二、用贝叶斯方法解答

在贝叶斯学派中,当θi未知时,将其看作随机变量,与θ具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。

根据贝叶斯理论,若X~N(θ,σ2),其中σ2已知,θ未知,但已知θ的先验分布是N(μ,τ2),其中μ和τ2均已知,则给定x后θ的后验分布为N(μ(x)’ρ-1,)其中(证明参见文献[1])。

由此得到,本例中该儿童智商θi的后验分布为N(110.38,69.23)。

对第一问,同样设H0:θi≤100 H1:θi>100,查正态分布表可以得到:

P(H0:θi≤100|x=115)=0.106,

P(H1:θi>100|x=115)=0.894

根据风险最小原则拒绝H0,接受H1。

对第二问,设H0:a<θi<b H1:θi<a或θi>b,查正态分布表可以分别得到P{H0:a<θi<b|x=115}和P{H1:θi<a或θi>b|x=115},类似第一问,依据风险最小原则作出推断。

讨 论

由上述分析和例子,我们可以看出,用贝叶斯方法处理假设检验问题至少在下述几方面具有明显优势。

一、先验信息利用的充分性和风险的直观性

从前述问题的处理,我们清楚地看到,经典方法只使用了Xi的已有信息(贝叶斯学派称之为先验信息),而贝叶斯方法则同时利用了Xi和θ的先验信息。因而在第二问的解决上,贝叶斯方法较经典方法少进行一次假设检验。

在贝叶斯方法中,由于导出了样本x下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。

二、可以将后续问题纳入考虑范围

如果推断错误在后续问题的解决过程中会造成一定损失,贝叶斯方法在进行推断时可将这一损失考虑在内。如:

在假设H0∶θ∈Θ0,H1∶θ∈Θ1(Θ0、Θ1是参数空间内两个互补子集)下,有:

Φ等于0,1分别代表拒绝、接受H0,a0、a1分别代表了第一、第二类错误造成的损失,这时,贝叶斯方法给出如下决策函数:

由于可以将假设检验结果带来的损失纳入检验考虑的范畴之内,因而对问题的回答更接近实用。

三、多重假设的处理不存在困难

对多重假设,如将前例第二问改为:若θi∈(a’b)为智力正常,θi<a为智力低下,θi≥b为智力超常,问该儿童智力属何种类型?

篇3

关键词:

大数据;统计学;教学改革

一、引言

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。大数据具有以下的鲜明特点:第一个特征是数据量大。第二个特征是数据类型繁多,多类型的数据对数据的处理能力提出了更高的要求。第三个特征是数据价值密度相对较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。第四个特征是处理速度快,时效性要求高,这是大数据区分于传统数据挖掘最显著的特征。统计学专业是与数据分析处理联系最为紧密的学科之一。大数据时代的到来不仅为统计学专业的发展带来的前所未有的机遇,同时也带来了巨大挑战。传统的统计学专业已不再适应大数据时代的信息爆发式增长的要求,这就要求我们应该对统计学专业进行重新定位,并在此基础上调整相关课程,改革传统的教学手段以及完善教学评价体系,以适应大数据时代的到来。

二、统计学专业改革的建议

(一)人才培养目标的重新定位如果说以往的统计学专业是以培养简单的“应用型”人才为目标,那么随着大数据时代的到来,社会不仅仅需要会应用基础统计知识处理相关领域的问题的单一的应用型人才,而是对人才提出了更高的要求:大数据时代下的统计学专业的人才除了应该具备基础的数据收集,处理和分析的能力之外,还应该了解相关应用领域的背景知识,而且应具备很强的自我学习能力,以适应大数据时代数据量大,总类繁多,时效性高等发展特点。因此,统计学人才培养目标应该重新作出调整,应该以培养全新的“复合型”统计人才为新的目标。

(二)课程设置的调整随着人才培养目标的重新定位,随之而来的就是应该对不再适应时展要求的课程进行必要的调整。首先,大数据的分析和处理与以往的经典分析方法有很大不同,以往的统计分析方法主要是建立在抽样基础之上,而大数据时代信息处理迅速,信息获得途径广泛,而且信息价值密度低,这就要求数据处理时,可以以全体作为样本,而不是进行抽样;分析时必须考虑所有数据而不是剔除所谓的异常数据。因此,以往的经典统计分析方法已不再适应大数据的处理和分析,必须适当的调整经典分析方法的课程设置,增加新的适用于大数据分析的课程。其次,随着数据量的爆发式增长,所有的统计工作对计算机的依赖程度越来越高,这就要求统计学专业的学生不仅掌握统计学专业的基础知识,同时应该熟练掌握计算机专业知识相关知识,因此,在课程安排时,应注意计算机相关课程的适当增加。基于上述原因,可以考虑增加如下课程:机器学习,模拟算法,数据挖掘,R语言软件分析等课程,同时适当降低传统分析方法课程的学时比重。此外,为了使学生能够对相关应用领域的背景知识有所了解,可适当增设与应用领域相关的通识课程。

(三)教学模式与手段的创新以往的教学模式,通常是以课堂教学,掌握书本经典理论为主。虽然,传统教学手段有着学生理论基础扎实等诸多优点,但是同时也存才学生过于偏重理论知识的掌握,动手能力不足,理论与实践脱节等缺点。随着社会的发展,尤其统计学专业自身具有鲜明的应用专业特点。只采用传统的教学模式和手段显然不再适合大数据时代的需要;同时,随着大数据时代的到来,多媒体手段日益丰富多彩,为传统教学的创新提供了必要的支持。因此,为了适应大数据时代人才的要求,必须改革传统的教学手段和模式,在传统教学基础上,加大实验教学的比重,在传统教学外,增加社会实践环节,引入微课慕课,翻转课堂等全新教学模式,以提高学生的学习兴趣,锻炼学生理论应用于实践的能力,从而为以后使用大数据时代的工作打下坚实的基础。

(四)教学评价体系的完善传统的教学评价体系,通常是采用书面考核的方式对学生的学习进行评价,随着时代的发着,单纯的笔试评价不足以衡量学生的全面能力,最后导致出现高分低能的情况的出现。为了适应大数据时代对人才多方面能力的需求,必须对传统的考核评价体系做出适当的调整,以评价学生的多方面能力,尤其是动手能力,学习能力和应用相关理论处理实际问题的能力。具体可以采用多种考核方法相结合的方式。如:增加平时的考核力度,增加实践项目的考核,通过布置适当的项目论文,采用答辩的形式,以锻炼学生适应以后工作,独立分析解决问题的能力。此外,传统教学评价体系通常是单方面的,只有对学生成绩的评价,为了适应大数据时代的到来,全面提高教学质量,可采取双向教学评价体系,如:增加学生对教学环节的评价体系。以及教师间同行间的评价体系等。

友情链接