首页 > 文章中心 > 统计分析

统计分析

统计分析

统计分析范文第1篇

随着人类社会的进步和发展,信息内容来源广泛且信息量大,现代社会统计学中的统计和分析离不开计算机的辅助,社会生产生活的各个领域均和计算机、互联网密切相关,计算机逐渐变得智能化、数据化和高效化,人们可以通过计算机统计分析解决生产、科学等方面的难题,计算机统计分析对数据的处理远比人工迅速、准确。在未来的社会生产当中,计算机统计分析将大显身手,为了顺应时代潮流,我们应深入探究计算机统计分析。

【关键词】

计算机;统计分析;软件

统计分析和计算机、互联网的相互结合给我们的生活生产带来了很大的便利,统计学通常是以足够大量的社会情形做统计研究的,计算机统计分析的飞快发展是非常符合社会发展趋势的,为了更便利更准确的处理各类数据,人们一直在对其进行深层次的探究,并且将这项技术方法很好的运用到了科学、社会、医学等各个行业,现在人们可以利用计算机统计分析技术快速的对所需数据进行处理得出结果,是人类科学历史上的一大飞跃,其发展脚步不容阻挡。

1计算机与统计分析现代化

1.1计算机与统计学现代化统计学主要是通过数据搜集、整理工作将信息归纳分类,给社会经济等问题提供解决方案的数理依据和基础,统计分析在社会经济问题研究中可以起到很大的作用,在社会经济飞快发展的过程中,各行各业对信息的需求量越来越大,对各类数据问题处理的渴求度也不断上升,互联网更是将信息网络化,这些的实现都需要统计学的介入而且在其中发挥重要作用,但是现代社会信息数据的繁琐量大都不是传统统计学能够做得到的,这时计算机和统计学的有机结合成就了信息网络化的大数据时代。统计学现代化的实现必须要依靠计算机这一现代化计算工具的协助,现如今计算机统计已经被广泛普及和利用,与时展进步的趋势相吻合。

1.2计算机与数据分析处理传统的人工处理分析数据早已不能满足社会发展的需求,通过其与计算机的相互结合,很大程度上节省了分析工作的时间精力,同时降低了数据分析处理过程中的错误几率。不仅如此,可以进行多样化、标准化的数据分析,更加人性化;伴随人类社会的发展,人们对数据结果的要求愈加严格,这无形之中促进了计算机数据分析技术的进步,推进了数据分析技术普及各行各业的发展历程。

2计算机与统计分析

2.1计算机统计分析的一般方法很多的数据分析流程软件在国际社会上是相互通用的,SPSS,SAS等就是比较典型的统计分析软件,这些软件已经慢慢地在我们国家的经济、教育、医疗等行业之间普及,不同的统计分析软件表面上有些不同,但本质的分析处理方法不尽相同,步骤如下:(1)录入数据信息;(2)预先处理和编辑信息数据;(3)分析处理计算;(4)得出结果并保存。要进行计算机统计分析首先要进行信息库、数据库的建立,建立之前先进行数据分类以便信息录入,使其进入数据库中,有利于分析和解决,录入工作人员可以通过一系列计算机的功能应用将数据整理并分类,计算机分析处理的计算是统计分析的关键所在,统计分析得出的结果可由图像或文字表达出来,举个例子:图形分析水平较高的软件有SPSS等。计算机统计分析的最终目的是为了得到正确的剖析结果和分析解释,这是重点同时也是难点,有待我们去创新提高。

2.2计算机在统计分析中的重要作用新形势下,社会生产经济的发展异常迅速,大数据的时代已经到来,信息量的急增,内容复杂程度的增加传统的统计分析效率早已满足不了社会发展需求,在这场计算机和统计分析的结合中,人们的生产生活发生了翻天覆地的变化,计算机起到了至关重要的作用。第一,计算机取代了传统的统计分析员,符合社会生产快速发展的需要,在数据量庞大、信息极度复杂的情况下,计算机的超强计算能力真是如鱼得水,协助统计分析促进了人类社会的进步。打个比方,投资者想要进行理财投资,想要挣钱的几率大一些,这时他就完全可以借助计算机进行统计分析,能够很快很准确的得出结果,很大程度的提高了理财挣钱的几率。

2.3数据统计分析中计算机的应用计算机被运用到数据统计分析当中去主要是因为其强大的计算能力,人们只需要告诉计算机要统计什么信息或者什么数据,需要哪个方面的分析结果,需要怎样的数据处理结果,这些都是简单易于操作的问题,而最难的计算部分则由计算机这个“超强大脑”来解决,这不仅节约了大量时间,还能减少错误的出现。我国的计算机技术在国际上不是很先进,我国自主研发的一些计算机统计分析软件规模小、漏洞多,还要继续努力研发编程出可以与西方发达国家相媲美的统计分析流程软件;另外还得加强操作人员的实际操作能力,选择适合自己的统计分析软件进行数据分析处理,这是由于每个人对不同软件的操作实践程度不同造成的,比如:EXCEL和SAS软件的不同,也就有不同的操作员利用它来做同一件事,计算机的统计分析。

3如何利用计算机做好统计分析

做好计算机的统计分析工作属实不容易,首先,学习统计、分析原理知识,加强对分析处理原理理解,将基本分析流程掌握透彻,注重各个分析处理过程中的细节部分;其次,软件的选择也很重要,软件的理解掌握程度因人而论,在软件选择使用过程中,可以从入门到深入,逐步利用计算机做好统计分析。

4结语

在未来的日子里,计算机统计分析会更加深入的渗透到我们的生产生活中来,计算机和统计分析是密不可分的;另外,我们国家的软件开发水平还达不到国际尖端水平,规模性、完整性和规范性都还有很大的提升空间,让我们一起为我国的计算机统计分析事业努力钻研,创新进步。

参考文献

[1]杨坚白.统计分析的意义和特点[J].统计工作通讯,1956(10).

[2]杜慎仲.统计分析中存在的问题及对策浅议[J].发展研究,2002(03).

[3]乔丽丽.统计信息与计算机信息处理[J].机械管理开发,1997(04).

统计分析范文第2篇

【关键词】统计体制;统计数据;质量;影响

一、我国统计体制概述

改革开放以后,人们逐渐对统计数据的质量有了进一步认知,20世纪我们主要以国际标准作为统计数据的现行标准,其实这并不正确,随着时代的发展,我们的统计体制改革更新,对数据质量的精确度要求越来越高,并且在此期间不断总结分析统计工作中出现的问题。目前国际公认的统计数据质量标准主要是准确性、实用性与时效性。

随着我国经济体制转型,政府统计工作压力增大,当前如何提升统计数据质量是重要课题,保证统计数据质量的前提是有合理的统计管理体制,我国政府统计体制是由综合统计体制及部门统计体系构成的整体,实行的是自上而下的管理体制,总的来看属于混合性统计体制。随着国家经济建设飞速发展,我国社会主义特色统计体制在不断改革变化,随着法制建设的推进,我国统计体制开始逐步正规化、法制化,《统计法》的出台给统计体制的健康发展指明方向;接着调查体系不断完善,为了适应国家经济建设发展趋势,满足国家对统计工作的需求,调查方法开始从全面调查向非全面调查转变,此举减少工作人员压力,随机统计得到广泛应用;慢慢的我国统计体制区域开放,体制的发展与完善,引导统计体制从封闭中走出,社会各界的认可与参与导致统计体制服务范围越来越广,形式也趋于多样化;最后随着国家统计体制与国际结果,统计工作对外交流越来越多,本着取长补短的宗旨,我国统计工作得到长足发展。

二、我国统计体制普遍存在问题

首先统计组织体系尚待健全。我们知道各级政府调查机构实行的管理方式为“垂直领导”,地方级政府与调查机构为同级,这样统计局就出现了双重领导,直接导致调查机构权利变大,统计机构与调查组关系处理不好就会影响工作,与此同时,各级调查机构也存在被垂直架空的现象,通过垂直领导,调查机构的人力物力财力等还受政府管理,还需要以政府的意志为先。

其次统计机构之间协调性不够。我们知道各级政府内部均有统计机构,相互间协调叉,由于各专业处室之间存在不同的统计方法,也有不同的调查方法和数据处理,这就导致调查数据出现偏差,对国民经济核算产生影响同时也让专业统计数据衔接出现困难。值得一提的是,政府有综合统计与部门统计,随着双轨制的出台,综合统计与部门统计不能很好的协调,不同政府机构之间交叉重叠现象严重,影响统计工作进行。

第三统计制度待完善。目前我们的普查并没有作为各类调查提供数据,对此开发利用也不充分,由于普查频繁,抽样调查主体作用发挥不够,抽样调查无法完全满足多级管理技术要求,因此还有待进一步提高。

第四统计指标体系待提升。随着社会信息化进程加快,目前的统计指标体系已经趋于老旧,不适应社会发展需求,也无法及时满足社会活动需求,也就是说,总量和速度的指标多,结构和效益的指标少,反经济发展的指标变多,反应和谐社会的指标变少,不科学。

最后统计信息网络待健全。网络时代给数据搜集带来便利,但信息交换和共享的数据库建设却相对滞后,系统信息化水平还是偏低,缺乏对信息资源的挖掘,从这个角度看,分析交工数据的能力便宜,目前统计部门缺乏专业人员,部分新兴技术还需完善并做好与统计调查的结合。

三、目前我国统计体制对统计数据质量的影响分析

1.政府的独立性不高,对数据质量有影响。

统计体制是经济体制的组成部分,目前我国政府中的统计机构所需的经费等通常由政府决定,统计机构缺乏独立性,业务发展受限。统计数据是绩效评价的依据,通常统计机构在开展工作过程中很容易受到来自政府机构的干扰、干预或阻力,这样调查的公平性受到影响,统计数据的准确性也受到影响。

2.统计职能发挥不利,影响统计数据。

可塑性是衡量统计数据价值的指标,随着统计数据的变化,可塑性能反映很多问题,当可塑性提高时,数据利用率与使用价值也随之提高,当下我国政府统计职能发挥有限,这就直接影响数据可塑性,主要表现在几个方面,首先政府负责收集、整合、数据,分析能力匮乏,这就影响了数据的利用率,例如我们经常在宏观经济统计分析中提及的国内生产总值,除却价格因素对国内生产总值的影响,研究对分析结论很有促进作用。我们知道政府统计机构重视数据来源,数据应用过程中出现错误的几率很小,因此对解决问题有利。

3.统计报表不合理,影响数据准确性。

根据调查发现,我国全面统计报表有不合理性,指标太多,且相对复杂,填报过程面临很大难度,调查人员由于是无偿提供数据,数据的准确性、全面性受到影响,目前随着市场经济不断变化,大环境下很可能发生个人利益与集体利益的冲突,填报真实准确的数据会耗费更多的财力及人力,很可能导致调查人员草草结束工作,编造假数据的现象时有存在,极大影响统计报表真实性。

4.统计手段单一影响数据完整性。

自改革开放后,我国经济发生巨大变化,统计方面也得到创新发展,综合来看,统计体制仍然没能满足社会经济发展需求,尤其在创新领域,统计量化不够具体,甚至部分区域还存在空白,可见政府统计缺乏科学的手段,没有查到相应的数据资料,统计数据完整性势必受到影响。

四、改善统计体制对数据质量影响的策略建议

1.完善调查方法,科学构建指标体系。

为了进一步满足社会经济发展需求,统计调查方法与指标体系需要进一步完善创新,此时我们可以采取科学的统计调查方法,比如分析某些社会经济问题时,我们往往会提到居民收入,这些数据可以通过统计年检进行查询,但,很多年检中根本无法体现隐性收入,因此指标准确性无法保证。为了改善这一问题,我们应不断改善目标体系,完善调查方法,政府出台支持政策,从资金等方面做出更多的投入。

2.优化报表中的指标内容。

传统报表中指标相对繁琐,应给予清理。在指标的设置之初,目的是满足经营决策需求,更要满足宏观角色需求,对于与国计民生息息相关的指标,不能修改,其他指标改为有偿服务,对于国家必备但对决策没有价值的统计数据,调查机构可以选用抽样调查方法搜集。

3.制定完善的管理考核体系。

统计数据是考评的主要依据,政绩评价与目标管理考核两个体系的数据缺乏准确性会影响考核结果,对此政府统计机构应遵循一定的原则,科学完善两种体系,首先确保考核目标能够实现,且防止弄虚作假,其次政府统计部门要提升数据质量的公开与透明,将部分重要的数据分析和核算方法公布给大家,进一步提升数据的可塑性。

4.强化政府统计职能。

优化与扩充政府统计职能需要分析与合并相关数据,政府统计机构承担的分析工作主要有两个方面,其一承担分析工作的成本较高,统计机构分析社会经济现象,分析工具复杂特殊,例如我们熟知的计量模型,这类统计分析成本之高显而易见,因此此类工作只有政府提供的技术与人力、财力能够胜任。其二承担大部分群众感兴趣并会影响宏观决策的分析工作,由于政府具有权威性,统计分析结论更可信,因此政府承担此类统计分析工作最合适。

参考文献:

[1]李先锋.DZ市政府统计数据质量影响因素研究[J].兰州大学学报.2013.02.

[2]李娟.中国统计数据质量离职研究与实践历程[J].现代经济信息,2015.10.

统计分析范文第3篇

一、据报表数据分析

1、人口出生及自然增长情况年度全乡共出生婴儿154人,人口出生12.10‰,期末总人口为12773人与去年同期相比全乡出生人口增加86人,人口出生率增加1.33‰,全乡共死亡88人,死亡率为6.91‰,与去年同期相比死亡人数增加15人,死亡率增加1.13‰,全乡自然增长率5.18‰,自然增长人数66人。2、生育情况⑴从孩次结构来看:1至12月全乡一孩出生87人,二孩出生66人,多孩出生1人,多孩出生率0.65‰,与去年同期相比,一孩出生增加14人,二孩出生增加3人。⑵从计内计外比例来看:在出生人数中,计划内出生149人,比去年同期增加16人,政策符合率为96.75%,比去年同期下降1.04%,计划外出生5人,比去年增加2人。⑶从出生性别比及构成看:在1至12月出生婴儿中,男孩63人,女孩91人,总性别比为69.23:100。其中一男孩出生32人,一女孩出生55人,一孩出生性别比58.18:100,二男孩出生30人,二女孩出生36人,二孩出生性别比为83.33:100。3、育龄妇女结构和女性初婚情,12月底,全乡育龄妇女总数3194人,占总人口比重25.01%;已婚妇女2779人,占总人口比重21.75%,占育龄妇女的87.01%。已婚妇女中,一孩妇女1038人,占已婚妇女的37.35%。二孩人数1496人,占已婚育龄妇女的53.83%,无孩人数117人,占已婚育龄妇女的0.064.多孩128人占已婚育龄妇女的0.046%。年度全乡女性初婚51人,比去年下降26人,其中早婚39人,早婚率为76.47;晚婚12人,晚婚率为23.53%,4.、避孕节育情况⑴总体节育情况:到12底综合节育率为90.50%。

二、存在问题由报表数据看,存在以下四个方面的问题:

1、人口出生率偏低,存在漏报现象。在计生专项清理那么大的工作力度下,我乡统计报表中往年出生漏报人数仍上报了14人,每年上报的往年出生漏报人数都不少,这说明人口出生上报不实,存在漏报现象。2、存在已婚育龄妇女漏档现象,无孩妇女漏档较突出。已婚育龄妇女漏档突出表现在隐性婚姻中,近年来,由于外出务工人员逐渐增加、人们思想观念的转变及计生政策的修改,外出务工的未婚男女间非法同居现象增多,往往一个人出去,两个人或三个人回来的现象越来越多,计生系统掌握情况的只是在未婚青年阶段或一孩妇女(二孩妇女)阶段,无孩妇女(一孩妇女)阶段时根本不在我们的管理视线,从而导致已婚育龄妇女漏档。3、出生人流比低。三个月一次的孕检,有的已婚育龄妇女在两次孕检之间发现意外妊娠而采取了补救措施,我们计生系统不掌握,或由于补救措施不到位、工作力度不大从而造成了人流比偏低。从实际工作来看,存在着:1、计生队伍不稳定,人心思走的现象。计生系统独特的工作性质,决定了它是天下第一难事,因而要求从事这项工作的人必须要付出很多。但在实际工作中,计生工作者付出的和得到的反差较大让人难以接受,工作中遇到的困难和问题也非其它工作可比。一直以来特别是近几年来,随着政策的变化,工作难度的加大及种种因素,计生工作者想脱离计生系统的越来越多,造成了计生队伍的不稳定。2、群众的维权意识增强,工作难度加大。新的计生政策要求以人为本,以优质服务来推动工作,但由于地区限制及历史原因,我们地区群众的生育意愿和现行生育政策之间还有一定的差距。随着群众文化水平的提高,对计生政策的了解越来越深,维权意识增强,计生工作者在工作中稍有不慎,就会引起群众维权事件的发生。

统计分析范文第4篇

【关键词】统计分析方法;应用;检验体系;共性问题;现实意义

中图分类号:C8 文献标识码:A 文章编号:

前言

随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。

二、多元统计分析方法的主要应用

统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。

聚类分析

它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与其它类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定市场营销战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过市场调查,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。

判别分析

判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。

主成分分析

主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。

因子分析

因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。

三、构建多元统计分析方法检验体系的必要性

(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量

多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。

(二)多元统计分析统计检验体系的基础理论

多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。

(三)关于统计检验体系

将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:

a.主成分分析统计检验体系

b.因子分析统计检验体裂引

c.系统聚类分析统计检验体系

d.判别分析统计检验体裂

e.对应分析统计检验体系

f.典型相关分析统计检验体系

四、多元统计分析方法应用中需要注意的几个共性问题

1.关于原始数据变量的总体分布问题。

对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。

样本容量问题。

进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。

原始变量之间的相关性以及非线性关系问题。

多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。

数据处理问题。

多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。

五、结束语

在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。

【参考文献】

[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.

[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.

统计分析范文第5篇

关键词:贝叶斯;经典统计;统计思想;统计方法

一、引言

经典统计学派和贝叶斯统计学派是在统计学的历史上逐渐发展起来的两大主要学派。贝叶斯方法是由英国学者Bayes在其论文中首先提出来的,并在和经典学派的争论中逐渐发展起来,目前被越来越多的统计工作者所研究和广泛应用。经典统计在发展成熟的同时也逐渐暴露出了一些问题,而不少学者对两个统计学派的比较研究中发现,二者在其基本思想以及统计推断时不尽相同,与此同时,二者也都有自己的优点与缺点。正确理解这些不同,对于我们今后正确地运用统计方法分析实际问题起着举足轻重的作用。因此,本文对这两种统计方法的基本思想作了对比,分析了各自的优势及缺点,并说明了他们在用于统计推断时表现的差别,有助于我们进一步理解这两种基本的统计分析方法。

二、基本思想的对比

1.区别一

经典统计学认为概率必须符合科学的要求,是“客观的”,这可以用大量重复试验之后的频率去解释,而不能主观臆断。而贝叶斯统计认为一些事件的概率在大量重复试验中去获得是不现实的,而我们可以根据对此事件的了解和积累的经验做出此事件发生可能性的判断。

2.区别二

经典学派很注重利用已经出现的样本观察值,没观察到的样本不予考虑。贝叶斯学派很注重先验信息的收集、挖掘和加工,使他们数量化成先验分布,参加到统计推断中,以此提高统计推断的质量。

3.区别三

经典统计中把样本看作来自具有一定概率分布的总体,而总体中的参数是普通的未知变量;相反,贝叶斯统计把任何一个未知的参数都看作是随机变量,都有不确定性,用一个概率分布去描述这个未知的参数,在统计推断中只利用已经出现的数据,即样本信息,这就是贝叶斯统计中的“条件观点”。

4.区别四

经典统计学派判断方法是让检验统计量与临界值进行比较。贝叶斯的判断方法是在获得后验分布之后,可分别计算原假设H0和备择假设H1的后验概率。

5.总结

贝叶斯统计学派与经典统计学派在很多问题上都有分歧但是它们最根本的分歧是:第一,是否利用先验信息。由于产品的设计、生产都有一定的继承性,这样就存在许多相关产品的信息以及先验信息可以利用,贝叶斯统计学派认为利用这些先验信息不仅可以减少样本容量,而且在很多情况还可以提高统计精度;而经典统计学派忽略了这些信息。第二,是否将参数e看成随机变量。贝叶斯统计学派的最基本的观点是任一未知量e都可以看成随机变量,可以用一个概率分布去描述,这个分布就是先验分布。因为任一未知量都具有不确定性,而在表述不确定性时,概率与概率分布是最好的语言;相反,经典统计学派却把未知量e就简单看成一个未知参数,来对它进行统计推断。

三、两种统计方法的优缺点

1.贝叶斯统计的优点与缺点

贝叶斯统计以从经验中学习为目标,将历史信息与样本似然函数结合在一起,使之形成一套比经典统计更加灵活,更加直观,更加易于理解的统计方法,在计量模型中正在受到越来越广泛的应用。特别是在小样本的情况下,点估计和区间估计可以有比经典统计更加精确的结果;其次,在用贝叶斯后验分布进行推断后,可以将第一类、第二类错误所造成的损失考虑在内,因而比经典统计更加实用;另外,在处理多余参数的问题上,贝叶斯统计可以直接在后验密度中将多余的参数积分掉,这又比经典统计方法方便得多。

贝叶斯统计在很多方面比经典统计有明显的优势,然而,仍然有许多本身存在的问题和缺陷制约和阻碍着它的发展。例如,先验分布的确定是近几十年来研究的主要问题;其次,我们一般只知道后验分布的核,计算后验密度函数的推导与计算具有非常大的难度,也没有可以广泛应用各种模型的软件和程序。

2.经典统计的优点及缺点

经典统计学作为统计学的根基,有着它自身所无法比拟的优点。首先,它用于推断过程的数据是样本数据,排除经常很难量化的先验知识。其次,它对于方法的评估有一系列的准则。只要可能,就能找到最优方法。

但与此同时,它的缺点也比较显著:首先,在小样本的情况下,点估计和区间估计没有贝叶斯的结果精确;其次,它不能将第一类、第二类错误所造成的损失考虑在内;最后,在处理多余参数的问题上,没有贝叶斯统计方法方便。

3.总结

贝叶斯统计学派与经典统计学派虽然有很大区别,但是它们各有优缺点,各有其适用的范围,我们要具体问题具体分析,以获得一种更适合解决实际问题的方法。而且,在很多情况下,二者得出的结论在形式上是相同的。

四、两种统计方法在统计推断时的差别

1.在点估计与区间估计方面的区别

贝叶斯定理是贝叶斯统计学的理论基础,函数p(x|θ)集中了总体信息和样本信息,被称为似然函数,它是未知参数θ的函数。在经典统计中同样承认似然函数,在这一点的理解上,经典学派和贝叶斯学派的观点是一样的。我们强调似然函数是θ的函数,而样本x在似然函数中是一组观察值,使似然函数值达到最大的θ值有比其他θ值更大的说服力,此θ值即为经典统计中的最大似然估计而我们可以证明,在贝叶斯统计中,当在“无信息”的条件下,θ的最大后验估计就是经典统计中的最大似然估计。在上述情况下,我们可以认为,经典统计中的最大似然估计是贝叶斯统计中的最大后验估计的特例。而在贝叶斯统计中,我们可以看出,在有合理的先验信息时,贝叶斯统计可以利用更多的信息,以达到更好的估计效果。

在置信区间的解释和处理上,贝叶斯统计具有含意清晰,处理方便的特点,而经典统计则经常被统计工作者所误用而受到批评。

2.在假设检验方面的区别

经典统计学中,因参数被认为是常数,因而不存在H0和H1的概率大小,其判定标准是若H0为真时,小概率事件发生,则拒绝原假设H0。即判定的是P(x|H0为真),x是样本向量。而在贝叶斯统计中,可以直接求得在样本X给定的条件下,参数的后验概率,因而得出H0和H1和后验概率,即判定的是P(H0为真| x)和P(H0为假|x)。这是两种检验方法间的根本区别。

在贝叶斯统计的检验中,先验信息的分布和参数的变化可以引起拒绝域的变化,而贝叶斯统计在后验均值估计中的最基本特征是伸缩性。

贝叶斯统计在检验问题中的一个优势在于多重检验问题,这是经典统计所办不到的。例如:在一次企业对两种生产方法的比较检验中,我们将假设设为:H0:θ=0;H1:θ0,H0表示两种方法无显著差别,H1表示方法一优于方法二,H2表示方法二优于方法一。贝叶斯统计在后验概率中计算H1和H2的概率,而经典统计方法则很难去处理此类

问题。

五、实例分析

下面我们通过一个例子对两种思想进行一些比较。例:以随机变量θ代表某人群中个体的智商真值,θ i为第i个个体的智商真值,随机变量Xi代表第i个个体的智商测验得分,若该人群的期望智商为υ,则第i个个体在一次智商测验中的得分可以表示为:Xij=υ+ei+eij其中ei为第i个个体的自然变异,eij为第i个个体第j次测量的测量误差。根据以往积累的资料,已知在某年龄的儿童的智商真值θ~N(100,225),个体智商测验得分x~N(θ*,100)。现在一名该年龄的儿童智商测验得分为115,问:(1)该儿童智商真值是否高于同龄儿童的平均水平?(2)若取θ*在(a,b)为正常,问该儿童智商是否属于正常?

1.用经典统计方法解答

对第一问,建立检验问题:H0:θ*100,按照经典统计学方法,若取。α=0.05,则拒绝域为{x:x>=116.45}尚不能认为该儿童智商高于平均水平。

对第二问,经典方法需要进行两次分别针对a、b的单侧检验。过程与第一问相似,这里不再叙述。

2.用贝叶斯方法解答

在贝叶斯学派中,当θ i未知时,将其看作随机变量,与0具有相同的分布,这是贝叶斯学派与经典学派的一个重大区别。根据贝叶斯理论,θ的先验分布是N(100,225),测验结果x*~N(0,100),儿童智商的后验分布为正态分布N(110.38,69.23)。

对第一问,同样设H0:0‘100,查正态分布表可以得到P(H0lX=115)=0,106,P(H1lx=115)=0,894,根据风险最小原则拒绝H0,接受H1。

对第二问,设H0:a

由此可以看出:按贝叶斯的观点,多重假设检验的情形并不比两个假设的检验更困难,因为它只需要多算几个后验概率即可;它同时利用了样本和

的先验信息,且由于导出了样本x下的后验分布,可以对风险给出正面的回答,因而较经典方法下的间接判断更直观。