首页 > 文章中心 > 多元统计学

多元统计学范文精选

多元统计学

多元统计学范文第1篇

多元统计分析,是指一种综合性质的分析方法,通过对不同研究对象和目标关联性的分析,统计出之间的规律,在现代统计学中被广泛的运用.多元统计分析被分为很多种,包括了多重回归分析、聚类分析、对应分析等等,本文中详细列举的是其中较为重要的几类.MATLAB软件是一种高科技高效能的计算系统,由MATHWORKS公司研制开发,自诞生以来便在众多领域得到广泛运用,它具有丰富的功能,除了最基本的数值分析和计算外,还有绘图和图像处理、仿真与通信等,当然其最大的特点是简单快捷易操作,这就使得其在多元统计分析教学中的应用成为必然.

二、MATLAB软件的应用意义

MATLAB是一款功能十分强大的软件系统,它在多元统计分析中的运用具有十分重要的意义,首先因为其效率极高的计算能力,能够处理海量且关系复杂的数字信息,所以提高了多元统计分析的工作效率,能够更快的完成任务;其次因为其具备图形处理能力,可以实现可视的编程与计算,并通过交互界面使得使用者更容易操作;最后是丰富的辅助工具使得多元系统分析更加快捷方便.

三、具体应用

(一)判别分析教学中的应用判别分析,顾名思义就是对研究目标的类型归属的一种分析法.因为在实际的经济科研活动和日常生产生活中,要根据信息资料分析一种现象或行为的种类问题十分普遍,所以这种分析方法是被广泛运用的,比如在医学领域,要根据身体指标传达的信息来分析是否患病以及患的是什么病;比如在经济领域,地区发展要根据当地的人口、土地和资源等信息来分析发展方向.MATLAB软件在其中的应用,是通过使用命令classify来实现的,其软件调用的格式是classify(sample,group,training)=[err.class],其中输入参数sample为待判样品,training为训练样品;group为训练样本的分类变量,输出参数class为待判样品的分类结果,err为误判率的估计.

(二)聚类分析教学中的应用聚类分析,可以从其字面意思看出,就是对研究目标进行归类集合的一种分析方法,所以这种分析方法又叫作群分析.它通过对信息资料的分析,对各个对象的内在含义和外部联系作出判断,将相似的对象集合为群.在实际生活中,这也是一种常见的分析方法,比如在生物科学中,常常通过对动植物的外部共同特征和内部基因进行分析,划分出物种.在MATLAB软件中,要实现聚类分析,可以采用两种方法,一种是动态聚类,一种是系统聚类.

(三)主成分分析教学中的应用在实际问题研究中,为了全面系统地分析问题,通常需要考虑大量的影响因素.这些因素一般称为指标,在多元统计分析中也称为变量.因为每个变量都在不同程度上反映了所研究问题的某些信息,并且彼此之间有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠,这会增加分析问题的复杂性和计算量.主成分分析是将多个相关变量综合成几个不相关变量的一种多元统计分析方法.其目的在于简化数据结构,并揭示变量间的关系.每个主成分都是初始变量的线性组合,所有的主成分间相互正交,因而没有冗余信息,可以有效地来处理变量间的相关关系,为解决多指标的综合评价提供了一种有效的手段.

四、结语

多元统计学范文第2篇

数据预处理和统计方法使用Epidata3.1建立数据库录入数据,采用SPSS18.0统计软件包进行统计分析。运用频数分析的方法对各个症状、体征出现的频次、频率进行分析,在此基础上排序,并筛选出现频率>5%的症状进行系统聚类,考虑到变量比较分散,聚类方法选择最远距离法(Furthestneigh-bor),距离测度方法选择积矩相关(Pearsoncorre1ation)。聚类后对包含症状、特征信息比较多的类别进行因子分析(经检验KMO值>0.5,才做因子分析),并根据特征根>1的情况提取出公因子。将提取出的公因子再次进行聚类分析,并根据临床专业知识进行解释。

结果

原发性高血压中医证候、体征频数分析首先对129项症状、体征变量进行预处理,原则是据专业知识对表达相同含义的指标进行合并,如失眠和多梦合并为新症状失眠多梦,合并后的症状、体征共有86项目。频率分析结果显示773例患者出现的总频次例次,四诊指标出现频率>5%的共有55个。

中医证候(症状、体征)主因子的第一次聚类分析因“眩晕、头痛”是高血压病病名诊断层面上的症状描述,可见于各个中医证型的高血压病中,故根据专业知识剔除这两个症状,对剩余53个症状、体征等四诊信息进行系统聚类分析,笔者尝试聚为3~6类,由于3类过于集中,而聚6类四诊指标又比较分散,最后根据专业意见,认为聚为4类比较符合实际,根据聚类的主症进行中医辨证,聚类后第1类可以辨证为肝阳上亢型,第2类辨证为血瘀型,第3类辨证为气虚型,但第4类包含变量过多,因此考虑对其做探索性因子分析。聚类分析结果。见表1。2.3对聚类结果的探索性因子分析将表1中第4类包含的所有指标作探索性因子分析,迭代25次得到因子负荷矩阵。经KMO值为0.63,Bartlett’s检验P<0.001,满足因子分析要求。提取特征根>1.0的公因子共11个,累积贡献率为53.05%。因子分析并经方差最大正交旋转后,因子包含的主症及载荷系数(≥0.5)表达的四诊指标。.4中医证候(症状、体征)主因子的第2次聚类分析对11个主因子进行标准化变换(Z-scores),计算因子得分,根据各症状的因子得分再次进行系统聚类分析,最后根据专业判断,聚为2类比较符合实际,取每个公因子中载荷系数>0.5的症状作为该因子的症状指标,最后根据聚类出的主症进行中医辨证。见表2。本次调查的原发性高血压病人最终可以辨证为:肝阳上亢证、血瘀证、气虚证、肾虚、脾虚痰阻5型。

讨论

多元统计学范文第3篇

医用多元统计分析属于应用性的方法学科,课程性质要求学生在学习多元统计方法之后,要具备将各种多元统计分析方法应用到医疗卫生领域数据中的能力。培养学生的实践能力,仅从理论授课上下功夫提高学生实践能力是远远不够的,必须在理论授课、实验教学和课程考核等各个教学环节中都不脱离实践能力培养的主线。在理论课上讲授的内容一般包括原理方面的知识和如何分析实际数据两个方面。提高学生实践能力要求教学过程中淡化数学原理方面的知识,而将重点放置在如何分析实际数据上,即该多元统计分析方法使用的前提条件是什么,如何使用该方法以及分析结果如何解读,在具体研究的医学问题中此结果具有什么样的意义。尽管在现代教学方法中有体验式教学的渗入,但相对于实验课的实际体验来讲,学生对于数据何时采用、如何采用某种多元统计分析方法,还是保持在似乎知道,但又不完全明确的模糊阶段。很多原理方面的知识,尽管不是重点,但也需要学生了解一下,才能有助于把握整体脉络、合理应用,通过实验课的亲身体验,能直观观察到相对模糊的原理知识得到验证的过程,从而心服口服地从心底接受没有经过手工计算而呈现的分析结果。并且多元统计分析的实验课本身就是让学生去体验各多元统计分析方法怎样应用于实际数据的过程,从而使学生实践能力大大提高。一般课程考试比较侧重理论原理的考核,而医用多元统计分析授课的目的就是给学生讲授多元统计方法应用于医药卫生领域数据的实践过程,学习课程之后学生必须具备这种实践能力,否则就根本没有实现开设这门课程的初衷,没有达到教学目的。因此,课程考试也应侧重在学生实践能力的考核上。课程考核一般有试卷考核、平时实验成绩和上机考核三种形式,而以试卷考核的形式居多。对于医用多元统计分析课程,平时实验成绩考核和上机考核也应该是必须选择的考核形式,除此以外,在试卷考核中也可通过适当的题型体现对学生实践能力的考查。比如,将多元数据分析的结果展示在试卷上,让学生回答此分析结果对于研究目的反映出什么;或者指出研究目的,让学生回答选用何种多元统计分析方法,为何选用这种方法;或者从展现的结果让学生判断是否适用某种多元统计分析方法等多种题型来考查学生的实践能力。通过考核反馈出实践能力欠缺的部分,从而给予相应的应对措施。

2通过教学软件提高教学效率多元统计分析

建模一般都要经过逆矩阵、相关系数矩阵的计算,求解特征根与特征向量等过程,这些过程没有扎实的数学功底是根本不可能完成的。即便能完成这些运算,但也是相当耗时的过程。就运算相对简单的多元统计分析方法而言,如果采用人工计算器计算的话,也需要大约五个学时的时间才能完成,复杂的多元统计方法需要学时数就更多了。假定学校能够安排充分的学时数,学生也必须有足够的能力和耐心去完成这些运算。可见,统计软件和多元统计分析方法教学的结合是非常必要的。目前,常用的统计分析软件有SAS、SPSS和STATA。对于医学专业本科生和研究生的统计分析要求来讲,简单掌握每个软件基本功能就可以满足数据分析的需求,但对统计学专业的研究生而言,一般需要用到可编写程序的SAS软件,并且要深入学习,进行数据的模型拟合分析。各医学院校可根据自己的办学条件、师资力量、教材的情况、授课对象等因素综合考虑本院校采用医用多元统计分析的软件。借助软件在很短的时间能完成模型的建立、模型拟合检验等分析过程,通过分析结果中呈现的模型建立中间步骤,了解矩阵运算,求解特征根与特征向量的信息,把握前因后果、各步骤间的相互关系,大量时间的节余可用在多元统计分析方法的专业应用上。

3通过适宜教材激发学习兴趣多元统计分析

原理部分的繁琐复杂性对该课程的学习形成很大阻碍,且原理部分又不是医学专业学生学习的重点,这提示了教材选择的重要性。合适的教材不应该花费很大的篇幅在理论推导和模型建立的过程上,否则只会增加学生对该课程的畏惧心理。教材应当侧重于多元统计方法的应用部分,应用部分和学生专业的相关性越强,就越容易激发学生学习兴趣。上文中提到学习医用多元统计分析教学要结合统计分析软件,因此,教材中最好在每个多元统计方法的介绍之后都安排一个章节,说明这种多元统计方法通过统计分析软件如何实现,以及软件运行结果如何解读。医学各专业学生一般都未经过系统的统计软件的学习,因此,教材中软件相关内容的安排就尤其重要,不仅要有这样的章节,而且要通俗易懂,适合医学专业学生的初次统计软件学习,在每一种多元分析方法数据集的录入、软件实现的步骤、一些常用选择项的介绍、软件运行结果的每个部分的解读以及结合专业知识后的结论等各个方面都要有详尽的解释。医学可以划分成很多不同的专业,如公共卫生、医药和临床专业等,就公共卫生专业又可以进一步详细划分成劳动卫生、儿少卫生和营养等专业。目前的医用多元统计分析教材没有具体针对各个专业的多元统计分析教材,能选择到和医学专业接近的教材充其量也就是医用多元分析的教材了,因此,通过教材提高学习的积极性还是存在一定的局限性,但这种局限可以通过案例教学来弥补。在授课过程中,授课教师可能通过案例式教学,选择和授课学生专业休戚相关的例子来进行讲解,就格外能吸引学生的注意力。

4通过教学设计引导学生主动学习多媒体技术

在教学中的应用极大优化了教学过程。随着多媒体技术的发展,教学过程中“传统的PPT教学”逐渐形成新的多媒体教学形式——微课件。微课件是指使用多媒体技术在五分钟内就一个知识点进行针对性讲解的一段视频或音频。基于教学设计,微课件可用于难点讲解、内容小结等各个环节。如在教学导入阶段,教师根据新课知识点设计新颖的问题,通过简短的视频的形式展现。微课件以视频的形式吸引学生的注意力的同时,将教学问题引入,让学生带着问题去听完一堂课,从而起到引导学生主动学习、增强听课效果的作用。布置课后作业也是一种很好的引导学生主动学习的途径。以往教学中教师一般也布置作业,但布置的作业大多是多元分析方法基本思想和原则之类的思考题。笔者在教学实践中,将课后布置作业题目设定为“收集适用本次理论课医用多元分析方法的自己专业相关数据,并预计数据分析后可能的结果”。学生在收集数据的过程中,就必须去主动思考这种多元统计分析方法的基本思想、适用原则等问题,并且会进一步产生通过软件分析此数据的欲望。在实习课上,除了教师规定的实习题目之外,学生一般都会主动完成自己专业数据的分析,和教师探讨此数据分析的结果和对专业的指导意义。

5总结

多元统计学范文第4篇

一、大数据及其意义

大部分传统的统计方法只适合分析单个计算机存储的数据。而目前大数据的环境包括以下要素。1.流数据:数据快速地不断涌来,现有存储设备和计算能力难以应付这种数据流(比如欧洲高能粒子对撞机所产生的数据,每秒钟可以达到500TB)。2.磁盘存储限制:数据已不能完全存储在内存中,需要硬盘存储。3.分布存储状态:数据分布存储在多个计算机中。4.多线条状态:数据存储在一个计算机中,多个处理器共享内存。大数据的发展就是对数据产生的机制进行探索,将所产生的数据转变为人们所需要的知识,进而对相关政策的制定产生影响。这个过程是一个漫长的过程。一个小孩子随着年龄的增长可能会掌握更多的单词,但是根据一个孩子的年龄确定他掌握的单词多少则并不科学。进一步来说,大数据有记录保存自然与社会现状的功能。现在大家收集着海量数据,尽管他们还不清楚如何分析大量的数据,但是他们相信需要保存现今社会经济高速发展的过程,期待着今后能够分析和解释这段历史。还有些人将百岁老人的血液和其他各种生物的标本等存放在冰箱里,他们认为当今的技术还不足以测试和分析这些资源,期待今后更先进的测试技术能够做到。大数据就如同自然和社会的血液那样记录着社会的现状和发展过程。17世纪望远镜以及显微镜的发明使人类看到了以前从来没有看到过的宇宙空间和微生物,扩大了人类对自然的基本认识。大数据就像“望眼镜”和“显微镜”那样,使得人们能够通过数据来观察和分析自然、经济、社会的现象。借助于互联网数据,可以及时了解疾病的疫情、科学的动态、社会的动态。谷歌借助频繁检索的词条能及时判断流感从哪传播,哪些人可能已经感染了流感。大数据将形成自然和人文社会的历史长河,不但能用于探索当代的科学问题,将来也可以用于研究人们食用转基因食品对子孙后代的影响等追踪研究问题,为未来留下当前的历史资料。

二、大数据带来的变革

时代的进步有赖于大数据的发展,大数据的发展给时代变革增加了更多的不确定性。就当前研究来看,数据的搜集很大程度上依靠所研究问题的出现来推动其向前发展。不过在不久的将来,随着大数据时代的到来,人们对于问题的研究将会由“数据”来驱动。例如,如果我们想去某地旅行或出差,会首先查询目的地的交通情况、天气情况以及住宿情况等信息,但是将来我们可以根据所查询的数据信息来决定所要去的目的地。在古希腊时代,当时的哲学家无所不知,号称百科全书,到了文艺复兴时代,随着学科的不断细化,不同学科出现了各自的专家。随着大数据时代的到来,大百科全书式的人物将有可能再次出现,而不同领域的专家的权威性将被逐步消弱,随着大数据的不断发展,很有可能会逐渐将学科专家消亡掉。例如,随着计算机专家和统计学家对数据的搜集越来越多并且处理能力不断增强,他们将逐步成为生命科学方面的专家。再比如,如果我们掌握了足够数量的相关专业书籍和日文译本,就算我们对日文一无所知,我们也可以采取有效的方法将所需要的中文翻译成为日文,因为我们有很多非常可靠的翻译软件,如谷歌翻译软件等。大数据已经在各个领域和学科得到了应用,例如医疗领域,大数据可以指导人们健康饮食,适时进行身体检查,并且确定检查项目,帮助医生对患者进行疾病诊断等。

三、大数据时代统计学专业教学现状

随着科技的不断发展和进步,人们获取信息和数据的途径也发生了很大的变化,电子商务的发展和各种多媒体信息技术的飞速发展和应用,给传统的统计学应用和教学带来了机遇的同时也带来了非常大的挑战。一方面,由于各种信息和数据的不断涌入,人们在被动搜集着各种数据。统计学的教学也需要不断探索新的模式。另一方面,人们在被动接受数据的同时也在主动搜集数据信息,不同学科有不同的数据需要。例如经济学领域的专家每天都在搜集各自的调查数据和观察数据,而自然科学领域的专家学者则不仅搜集宏观天文数据,还在搜集微观基因数据。不同的人们搜集数据的方法也各不相同,有的在实验室通过试验进行数据搜集,有的人则通过网络进行数据搜集和研究。对于当前大数据给统计学带来的挑战,美国科学院“大数据分析委员会”给出了分析,他们认为这些挑战在于对不同格式和结构的数据的处理方面、对于数据来源的追踪方面、对于共享数据的安全性问题和完整性问题方面、对于样本异质性和偏倚性处理方面、在对问题进行处理时的决策和分析方面以及对分布式和并行式在开发时的算法方面的问题等。国内相关部门也对这一问题进行了研讨,最早一次是2012年5月在香山召开的“大数据科学与工程”会议,第二次是在2013年5月召开的对于大数据原理以及发展前景的探讨会,并同时制定了相关的科研计划。但关于大数据背景下统计学专业教学的探索还非常稀缺。

四、统计学专业课程改革

针对以上所述大数据时代的特点和变革意义以及目前统计学专业教学的现状,本文进行了相应的初步探索。

(一)改革的总体思路

将现有的统计学顶级杂志或著名文献中的成熟的大数据分析方法逐步凝练,形成教学内容;将使用R软件中的函数包实现这些大数据分析方法。

(二)改革的具体内容

1.在《数据挖掘原理与方法》课程中引入大数据分析方法及其R语言的代码实现。2.在《非参数统计》课程中引入多元非参数统计方法(诸如多元符号、多元秩、多元符号秩等)、非参数回归模型、半参数回归模型及其R语言的代码实现。3.在《回归分析》课程中引入回归树、boosting回归、bagging回归、随机森林回归等用来处理大数据的回归方法、高维回归变量选择方法(比如LASSO回归、动态LASSO回归等)及其R语言的代码实现。4.在《多元统计分析》课程中引入高维统计分析方法及其R语言的代码实现。5.在工科《概率论与数理统计》课程中引入R语言的代码实现。

(三)改革的主要创新点

多元统计学范文第5篇

关键词:大数据;经济统计;专业建设

当前,大数据已经渗透到社会、经济、政治以及文化等众多领域。大数据在给各行各业带来了新的历史发展机遇的同时,也将给各行各业带来新的挑战。显然,对高等教育来讲也同样如此。相应的,对直接服务于经济统计人才培养的经济统计学专业建设来讲,迫切需要回答的问题是,在新形势下,专业建设遇到新的挑战又将是怎样的呢?进一步的,为了积极应对新的挑战又需要对旧的培养模式进行怎样的修正和改进呢?从现有的文献资料看,虽然学术界已经积累了大量与(经济)统计学专业建设相关的研究成果(如庞皓,1991;曾五一,1999;曾五一和尚卫平,1999;曾五一等,2010;朱宇兵,2009等),但基于大数据背景对这些问题较为深入的研究还比较缺乏,本研究则可以视为是对此进行弥补的一个努力尝试。

1经济统计学专业建设的发展现状

从某种意义上讲,经济统计学是一个新的专业。2012年10月,教育部颁布了《普通高等学校本科专业目录(2012年)》。在新专业目录中,除保留统计学为理学类一级学科(包括统计学和应用统计学两个二级学科)之外,在经济学类的经济学一级学科下增设经济统计学。正是在这样的背景下,目前我国高校经济统计学专业的开设一般有两种情况,一种是新专业目录颁布后新设立的,如中央财经大学、对外经济贸易大学、西南政法大学以及中南民族大学等;一种则是由原来的统计学专业更名而来的,如中南财经政法大学、天津财经大学、江西财经大学、南京财经大学以及中央民族大学等。从发展历史过程看,经济统计学并非是一个全新的专业,而是由以前的统计学专业发展而来。在1998年9月国家教育部颁布的《普通高等学校本科专业目录和专业介绍》中,统计学被列为理学类一级学科,但可选择授予经济学或理学学位。在这种背景下,根据具体的办学条件和偏好,各高校采用了不同的教育模式,一类是强调各类统计学所具有的共性。它肯定统计学的“理学性质”,按照理学类学科的特点设置课程。另一类则是强调各类统计学的个性,如财经类院校统计学专业(曾五一等,2010)。前者的数量较少,它是将统计学作为应用数学的一个分支来看待,所开设课程主要是数学和各种数理统计方法。后者数量占有绝大的比重,其专业方向包括国民经济统计、经济统计、管理统计、金融证券统计等(李宝瑜,2004)。从我国统计学学科建设的发展过程看,其特征主要表现为两个转变,即从起初的侧重理论培养向当前的强调实际应用转变以及从起初的主要服务政府部门向当前的主要服务社会企业组织转变。由于新专业目录颁布时间还很短,经济统计学专业还没有建立起新的培养模式,主要还是其前身———(经济学方向的)统计学——培养模式的一种延续。从我们掌握的资料看,目前各高校经济统计学专业的培养方案还主要是参照1998年《普通高等学校本科专业介绍》制定的,其培养目标是所谓的“复合型人才”,即具有坚实的经济理论基础,既懂数理统计方法、又懂经济统计方法,并能熟练掌握现代计算手段的经济统计人才(曾五一等,2010)。这种人才既是统计人才又是经济管理人才,不仅能胜任基层企业和政府部门的日常统计业务,而且能从事市场调查、经济预测、信息分析和其他经济管理工作。相应的,在具体的课程体系构建和安排上,各高校大都贯彻了“大统计”的学科观点,遵循“厚基础、宽口径、重应用”的复合型人才培养原则(向书坚和平卫英,2010),即在强调较为完整系统地介绍统计学主要理论和分析方法的同时,还强调其与经济学其他学科的密切联系,按照经济类学科的特点设置课程。也就是说,经济统计学专业的课程设置具有显著的二元性特征。从各高校的具体设置看,统计学方面的课程一般有数学基础课、概率论、数理统计、运筹学、随机过程、回归分析、时间序列分析、多元统计分析、抽样调查、非参数统计、统计预测与决策等;而经济学方面的课程一般则有微观经济学、宏观经济学、会计学、国际经济学以及与专业方向(如国民经济统计、财务会计统计、金融证券统计等)有关的课程。此外,和其他专业一样,经济统计学也重视学生应用和创新能力的培养,特别强调本专业的毕业生应该具有熟练地采集数据和应用计算机分析、处理数据的能力。因此,Excel、SAS、SPSS等常用软件的学习和训练也通常以实验课的形式被纳入到课程体系中。但是,要注意的是,我国各高校在制定或修订经济统计学培养方案时,有意或无意地忽视了当前随互联网技术日新月异带来的大数据海量涌现。而由于大数据和传统数据存在显著的差异,各高校现有的经济统计培养模式可能需要做出重大调整。

2大数据带来的挑战

大数据之所以在众多领域里引起关注,其根本的原因在于大数据蕴含着巨大的潜在价值。相对于传统的标准化数据,大数据不仅体量庞大、产生速率极快,而且也更为全面(甚至是整体数据)。因此,大数据的分析结果也更接近真实。换句话说,大数据分析往往意味着人们能够从这些全面的数据中获取新的洞察力,从而更有可能创造出新的价值,进而带来更大的发展。大数据蕴含的巨大潜在价值,势必将打破现有的数据边界,使大数据逐渐成为经济统计分析的主要对象。由于大数据与传统的标准数据存在显著的差异,对未来的经济统计工作而言,大数据势必将带来新的问题或挑战。简要地说,大数据带来新的问题或挑战主要来自于两个方面,即:

(1)数据来源问题。与传统数据主要来源于抽样调查或组织内部不同,大数据是互联网高速发展的产物。随着科技环境的巨变———个人电脑的全球普及,移动智能终端的盛行,物联网和社交网络的爆炸式发展,以及数以千万计的联网传感器节点在交通、汽车、工业、公用事业和零售部门等的广泛分布,这些都让数据的生产和收集的途径更为多元、更为广泛。不过,需要特别注意的是,由于其蕴含的巨大潜在价值,大数据已经成为了可以与物质和人力资本相提并论的重要生产要素和组织资产。相应的,对各类逐利组织(尤其是企业)来说,不仅需要考虑如何收集到大量的有效信息,同时也希望这些信息为其独自所占有,如最近阿里巴巴封杀微信、京东,断绝与社交网络新浪微博的账号合作。这种电商行业“封杀”现象的出现,其理由看似是如这些企业所宣称的那样为了保护公司的信息安全,但背后的根源其实是担心自身的内部商业信息通过互联网泄漏,担心用户流量的命脉被他人掌握。因此,在大数据时代,如何解决数据的封闭性问题将是经济统计工作数据收集面临的一个重要挑战。此外,对经济统计人才来讲,由于数据不再仅仅是标准结构的,资料收集新技术的开发和掌握也成为一种迫切的需要。

(2)数据分析问题。由于数据更多的是半结构化或非结构化的,传统的经济统计分析工具和方法可能不再有效。就大数据分析而言,经济统计工作需要解决的问题是如何从体量庞大且杂乱无章的各类数据中挖掘有效信息以创造新的知识和新的价值。在以前,数据很大程度上是指“数字”,如业务量、营业收入额、利润额、工业企业产值、固定资产投资、GDP等,都是一个个数字或者是可以进行编码的简单文本。而在大数据时代,人们不再是隐藏在终端和网络后面的隐形者,购物、社交、游戏、阅读、出行等信息都变成数据被收集到各种各样的储存设备中。而数据也不再是单纯的“数字”,还包括文本、图片、音频、视频等多种格式,其涵括的内容也更为丰富,如博客、微博、通话录音、位置信息、交易信息、点评信息、互动信息等。也就是说,数据不再只是结构化的,更多是广泛存在于社交网络、物联网、电子商务等之中的半结构化数据和非结构化数据。随着数据越来越大,越来越复杂,增长越来越快,要想建立和保持竞争优势需要对数据进行实时、有效的分析。而由于数据更多的是以半结构化和非结构化形式出现,过去传统的数据分析技术可能无法实现实时监测和分析。

3应对措施及建议

从个人服务到商业运营,从医疗卫生到公共教育,从城市交通到公共管理,大数据已开始撼动世界的方方面面。在带来新的发展机遇的同时,大数据时代也向包括经济统计在内的众多领域提出了众多挑战,需要做好充足的准备及应对。具体到与人才培养息息相关的经济统计学专业建设,我们认为需要从以下几个方面做出必要的变革:

(1)树立市场意识,避免人才培养与现实需求脱节。从目前的实际情况看,我国高校经济统计人才培养与市场需求之间或多或少存在一定程度的“学”“用”脱节,还没有全面实现学以致用。一方面,以企业为主的各类组织对经济统计人才需求非常急迫,如最近一份针对近千家企业和从业人员的调查显示,97.9%的企业认为数据分析对电商运营很重要,超过半数的企业表示数据分析能力欠缺,同时有近60%的企业希望专业数据分析人才加入,并愿意为此支付更高薪资;①另一方面,无论是课程体系还是教学内容以及教学方式,现有模式基本上是以传统数据为对象的。换句话说,在现有培养方式下,学生掌握的数理统计和经济统计方法可能无法满足大数据的分析需要,如传统的统计分组、频数分布等数据整理方法显然难以完全适用于图片、音频、视频等非结构化数据。因此,要真正做到“厚基础、宽口径、重应用”,则需要根据经济发展的需求设置教学计划、更新落后的教育内容、采纳现代化的教学手段,需要注意与其他学科之间进行充分的交流与融合,跟上当代社会科学的杂交化、整体化趋势发展的步伐。

(2)经济、统计与IT相融合,优化课程体系。在大数据的洪流中,数据分析是否能够带来新的洞察力、创造新的知识和价值,取决于从业人员是否掌握大数据收集、管理、分析和开发的相关特定工具。从我国高校经济统计学专业课程体系看,专业课程设置主要包括经济类基础课程与专业主干课程两大基本模块。虽然各高校都强调遵循“厚基础、宽口径、重应用”的复合型经济统计人才培养原则,也主张将理论方法的教学与计算机软件紧密结合起来(如“统计学导论”选用Excel,“应用多元统计分析”选用SPSS,“计量经济学”选用Eviews等软件作为计算工具),但在大数据的开发和应用日益成为新潮流、新趋势的背景下,仍然很少看到有高校在经济统计学专业中开设独立的、专门涉及大数据技术的相关课程。因此,根据现实人才需求的新变化以及大数据技术的不断进步和升级,我们应该对经济统计学专业的课程体系进行必要的调整,即根据大数据分析的内在需要,在经济学和统计学相关课程之外把大数据技术相关的课程纳入到现有体系之中,实现“经济、统计与IT”三方面内容的平衡和融合。在大数据时代,虽然经济统计所包括的主要工作仍然是数据收集和数据分析等,但是其内容却发生了翻天覆地的变化。如收集数据不再依赖于随机采样,而是需要利用多个数据库来接收发自客户端的数据,并导入到一个集中的大型分布式数据库。相应的,数据存储和预处理以及数据挖掘和分析也都是以分布式数据库为工作对象的。考虑到本科教育的基本要求与技术的实际发展水平以及通用性等,在Hadoop、NoSQL、HDFS等目前较为常用的大型数据分析软件和工具中,我们建议至少增设Hadoop方面相关的课程。

(3)与时俱进,加强师资队伍培养。能否把本专业的学生培养成为复合型的应用人才,取决于是否拥有一支高素质的教师队伍。随着大数据及其应用成为一种新的潮流和趋势,经济统计的专业教师团队建设也需要做出相应的调整和变革。从教师队伍的结构看,由于经济统计学专业发展的过程使然,目前我国各高校该专业的专业教师以具有经济学或统计学学科教育背景的教师为主,而具有信息技术教育背景的教师还非常稀少。由于大数据及其应用需要融合经济、统计以及IT等多个领域的理论、方法和工具,因此对经济统计专业建设而言,当前最为迫切的是,需要建设一支教育背景涵盖上述三个领域的结构合理的教师队伍。而实现的途径无非是两种:一方面是在全校范围内进行挖潜,重新组合和配置教师资源以优化经济统计专业教师团队;另一方面则是实施“请进来”战略,加大力度引进海内外优秀人才。在内部挖潜和外部引进的同时,专业教师团队建设还应该努力创造一个良好的人才成长环境,鼓励教师积极“走出去”,到国内外高水平大学进修和学习,鼓励教师不断以新的知识充实、提高自己,以此来不断提高本专业的教师质量和水平.

参考文献

[1]李宝瑜.统计学一级学科建设中的若干问题[J].统计研究,2004(8).

[2]庞皓.经济统计学课程体系改革的方向[J].统计研究,1991(1).

[3]向书坚,平卫英.30年来我国财经类院校统计学专业本科课程设置的历史回顾与展望[J].统计研究,2010(1).

[4]曾五一.关于经济管理类统计学专业课程体系设置的几点意见[J].统计教育,1999(8).

[5]曾五一,尚卫平.关于经济统计学若干问题的思考[J].统计研究,1999(11).

[6]曾五一,肖红叶,庞皓,朱建平.经济管理类统计学专业教学体系的改革与创新[J].统计研究,2010(2).