统计法试题范文第1篇
1 我国现行的统计法律规范的表现形式主要包括( )。
A 统计法律、统计行政法规、统计行政规章
B 统计法律、统计行政法规。地方性统计法规
C 统计法律,统计行政法规,地方性统计法规、统计行政规章
D 统计法律、统计行政法规、地方性统计法规、统计行政规章和统计制度
2,( )比《统计法实施细则》法律效力高。
A 《中华人民共和国统计法》 B 《全国农业普查条例》
C 《关于加强统计工作的决定》 D 《统计执法检查规定》
3 如实,按时向政府统计机构和统计人员提供统计资料是统计调查对象的( )。
A 权利 B 权益 C 义务 D 责任
4 县级以上各级人民政府设立()的统计机构,负责组织领导和协调本行政区域内的统计工作。
A 独立 B 独立或附属于政府某个部门之下
C 附属于政府某个部门之下 D 半独立
5 政府统计调查包括国家统计调查、( )和地方统计调查。
A 部门统计调查B涉外统计调查
C 民间统计调查D企事业统计调查
6 经国务院批准的周期性普查项目,每5年进行一次的是( )。
A 人口普查B经济普查C农业普查D,污染源普查
7 政府统计调查表的法定标识包括( )。
A 表号、批准或者备案文号、有效期限B表号、批准或者备案机关、有效期限C,表号,制表机关、批准或者备案文号,有效期限D表号、制表机关、批准或者备案机关、批准或者备案文号、有效期限
8 统计人员依法进行政府统计调查活动时,向统计调查对象出示的有效证件包括( )。
A 统计调查证 B 统计调查证、临时统计调查证
C 统计调查证、临时统计调查证、普查员证、普查指导员证
D 统计调查证,临时统计调查证、普查员证、普查指导员证,政府统计机构颁发的工作证
9 统计资料实行()公布制度。
A 经常 B 选择 C 定期 D 及时
10 部门和企事业单位提供的统计资料,由( )审核,签署或者盖章后上报。
A 其主管部门的统计机构或统计负责人B 本部门、本单位领导人或统计负责人C 本部门、本单位所在地人民政府统计机构或统计负责人D 其主管部门的统计机构
11 属于私人、家庭的单项调查资料( )。
A 可以对外提供B 不可对外提供 C 经主管部门批准,可以对外提供 D 非经本人同意,不得泄露
12 统计职业道德的核心内容是( )。
A 具备统计专业知识B保守国家秘密统计资料C 对统计调查对象的商业秘密和私人家庭的单项调查资料保密D 坚持实事求是
13 统计调查对象中,( )必须取得统计从业资格,持有统计从业资格证书。
A 法定代表人 B 统计负责人 C 会计人员
D 承担经常性政府统计调查任务的人员
14 统计从业资格认定工作的实施机关是( )。
A 国家统计局 B 省级人民政府统计机构
C 地市级统计局 D 县级人民政府统计机构
15 某企业在规定的期限内没有报送统计报表,经《统计报表催报通知单》催报,在催报单规定的期限内报送了统计报表,该企业的行为属于( )的行为。
A 迟报统计资料 B 屡次迟报统计资料
C 拒报统计资料 D 补报统计资料
16 坚持统计行政处罚与统计违法行为相适应的原则,是指( )原则。
A 处罚法定B 处罚告知 C 处罚公平公正 D 过罚相当
17 实施统计执法检查的主体是( )。
A 县级以上人民政府统计局法规检查机构
B 各级纪检监察部门
C 国家统计局及其派出的调查队、县级以上人民政府统计机构D 县级以上各级人民政府法制工作机构
18 按照《统计执法检查规定》,统计执法检查机关对法人或者其他组织作出( )元以上罚款的行政处罚决定前,应当告知当事人有要求举行听证的权利。
A 5000 B 10000 C 20000 D 30000
19 统计执法检查中,被处罚单位在收到处罚决定书后,既不在法定期限内申请复议或向人民法院提讼,又拒不执行处罚决定的,查处机关可以( )。
A 强制执行 B 依法提请人民法院强制执行
C D 与相对人协商解决
20 统计行政诉讼是( )对统计行政案件依法进行审理并做出裁决的活动。
A 统计部门 B 法制部门 C 监察部门 D 人民法院
二,多项选择题(每题有2个或2个以上正确答案,请将正确选项的代表字母填写在题干中的括号内,多选。错选、漏选、未选均不得分;15道题,每题2分,共30分)
1 统计法的基本原则有( )( )( )( )( )。
A 保障统计工作统一性原则B统计调查对象依法履行义务原则C 统计机构依法履行职责原则D 维护统计调查对象合法权益原则E,保障统计信息社会共享原则
2 ( )( )( )( )( )属于统计行政法规。
A 《中华人民共和国统计法》 B 《中华人民共和国统计法实施细则》 C 《全国经济普查条例》 D 《关于工资总额组成的规定》 E 《统计执法检查规定》
3 下列各项正确的是( )( )( )( )( )。
A 国家建立集中统一的统计系统,实行统一领导、分级负责的统计管理体制 B 国务院设立国家统计局,负责组织领导和协调全国统计工作 C 国家统计局派出调查队,承担国家统计局布置的各项调查任务,依法独立开展统计调查,独立上报统计资料 D 县级人民政府根据统计任务的需要,设立统计机构或者配备统计人员
E 企业事业组织根据统计任务的需要,设立统计机构或者在有关机构中设置统计人员
4 根据《中华人民共和国统计法》的规定。统计调查对象包括( )( )( )( )( )。
A 国家机关 B 社会团体 C 企业事业组织 D 个体工商户
E 基层群众性自治组织和公民
5 根据《中华人民共和国统计法》的规定,凡通过( )( )( )( )( )能够取得统计数据的,不得制发全面统计报表。
A 民间统计 B 抽样调查 C 重点调查
D 典型调查 E 行政记录
6 根据《中华人民共和国统计法》的规定,统计机构和统计人员对( )( )( )( )( )负有保密义务。
A 属于国家秘密的统计资料 B 属于私人的单项调查资料
C 属于家庭的单项调查资料 D 属于统计调查对象的商业秘密 E 属于社会团体的单项资料
7 统计机构和统计人员依照统计法规定,独立行使( )( )( )( )( )的职权,不受侵犯。
A 统计调查 B 统计分析 C 统计报告
D 统计咨询 E 统计监督
8 统计行政处罚的种类包括( )( )( )( )( )。
A 罚款 B 警告 C 没收违法所得
D 责令停产停业 E 责令改正
9 统计机构、统计人员违反《中华人民共和国统计法》规定,( )( )( )( )( )造成损害的,要依法承担民事责任。
A 泄露私人、家庭单项调查资料 B 利用统计调查窃取国家秘密 C 泄露统计调查对象商业秘密 D 利用统计调查进行欺诈活动 E 利用统计调查损害社会公共利益
10 统计执法检查( )( )( )( )( )。
A 属于行政执法活动 B 由国家依法授权的机关进行
C 属于统计调查活动 D 由执法人员自主决定开展
E 被检查对象有义务配合
11 政府统计具有( )( )( )( )( )的功能。
A 决策 B 信息 C 咨询 D 监督 E 认识
12 统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的( )( )( )( )( )等为补充,收集整理基本统计资料。
A 统计月报 B 统计分析 C 统计报表
D 重点调查 E 综合分析
13 《统计资料保密办法》规定,属于国家秘密的统计资料分为( )( )( )( )( )。
A 绝密级 B 机密级 C 秘密级 D 保密级 E 一般秘密级
14 下列各项属于统计专业职务的包括( )( )( )( )( )。
A 总统计师 B 高级统计师 C 统计师
D 助理统计师 E 统计员
15 ( )( )( )( )( )可能引起统计行政诉讼。
A 统计执法机关的行政处罚行为 B 统计执法机关的行政不作为行为 C 行政处分 D 统计执法机关的其他具体行政行为E 通报批评
参考答案
一、单项选择题
1 C 2 A 3 C 4 A 5 A 6 B 7 D 8 D9 C 10 B 11 D 12 D 13 D 14 B 15 A 16 D17 C 18 C 19 B 20 D
二、多项选择题
1 ABCDE 2 BCD 3 ABCE 4 ABCDE 5 BCE
统计法试题范文第2篇
关键词:统计分析 试验设计 教学改革 教学效果
试验设计与统计分析是面向林学、生物科学、生物技术、食品科学等专业的一门重要专业基础课程。该课程将概率论与数理统计的原理和方法运用于生产与科学试验,重点解决如何根据试验目的和要求科学设计试验,并对试验结果正确地进行统计分析,以获得有效试验信息等问题,具有很强的实用性。随着现代科学的不断发展,试验设计与统计分析已成为自然科学研究方法论领域一个比较成熟的学科,是相关专业科学领域研究和实际工作必不可少的工具。该课程的学习能够提高学生的知识运用水平及动手能力,培养学生解决实际问题的能力,为从事各类相关工作奠定基础。
试验设计与统计分析课程要求有一定的数理统计基础,教学中理论公式较多,采用传统的教学方法学生容易感觉枯燥;且重理论、轻实践的现象也影响了实际的教学效果。笔者结合多年课程教学的实践经历,变革课程内容,改进教学方法、教学手段及考核办法等,提高教学效果,促进学生动手能力和实践能力培养。
1 教学内容的优化与更新
试验设计与统计分析课程由理论教学和实践教学两部分组成,是一门应用性和实践性都很强的专业基础课。从减少学生学习负担出发,该课程已经压缩到32学时,这就更要求我们对教学内容精挑细选,提高教学的效果。
在理论教学中要顺应农林和生物科学高速发展和多学科交叉的趋势,根据农林与生物类专业的教学基本要求和学生毕业后要从事的主要工作,重点讲授试验设计和统计分析的基本原理和常用方法。
在教学内容上,结合目前试验设计方法的发展和应用现状,适当删减某些已不常用的设计方法,如对比法试验设计、间比法试验设计等。增加某些使用广泛、应用较多的设计方法授课内容和深度,如正交设计等。
从教学组织安排上,在试验设计基础知识、基本原理讲授完成后,按照具体试验设计方法讲授,分别引导学生掌握某种试验设计的设计方法、统计分析方法,了解该试验设计方法的优缺点和应用。在每1~2种试验设计和统计分析方法的课堂讲授完成之后,上一次讨论课,以生产科研中的实际问题为范例,引导学生积极分析、讨论,以深刻理解和体会某个具体试验设计方法的试验布置、应用及其优缺点。给出科研实践工作中得到的真实试验数据,让学生进行统计分析并对结果进行分析和讨论,从而深入理解某种试验设计方法的应用。
2 教学方法与手段的改革
在讲授基本原理时,为了突出本课程应用性强的特点,从科研工作中遇到的实际问题进行课堂讨论的方法入手,而不是从公式的数学推导开始,以提高学生参与的积极性。例如,在讲授试验设计原则时,举例:5个品种栽培试验,每个品种各12棵树,试将这些树种在一片试验田里。课堂上,请所有学生在纸上画出这60棵树的布置图,同时请4~6名学生到黑板上把自己的想法画出来。把学生的布置图分类总结后,通过一步步引导,得出试验设计的三大原则。进而结合公式推导,从理论上阐明三原则的作用。学生听得有趣、容易理解、记忆深刻。
在授课过程中,要充分利用多媒体教学手段。现代多媒体教学具有信息量大、形象直观等特点,不仅能减少教师在课堂上板书和复杂的画图工作,还能利用多媒体演示统计软件处理案例,有利于充分调动学生的求知欲和积极性[1,2],在本课程课时少的实际情况下,尤其要充分利用好这个工具。在现有课件的基础上,增加新的内容和实例,使课件更加丰富、生动,便于理解,同时注意和科研、生产实践紧密结合,使授课内容更贴近实际应用,有利于培养学生的实践能力。但是在实际应用中要特别注意,多媒体只是一种教学手段,引入多媒体教学并不意味着完全放弃传统的板书教学。该课程理论抽象且数学公式比较多,有很多公式需要推导。用PPT推导公式效果不好,学生难以跟上播放速度。教师利用板书在黑板上推导,推导公式的过程能够吸引学生跟着思考,加深印象和理解。只有将多媒体教学和传统教学方法结合,发挥各自优越性,才能达到更好的教学效果。
在课堂教学中,根据各章教学内容及要求,采取“启发式”和“讨论式”结合的教学模式,可以充分发挥学生的主体作用,以达到更好的教学效果[3]。在最常用的试验设计方法章节的教学过程中,我们专门安排了一定的课时用于讨论,充分发挥讨论环节的作用。收集科研工作中的典型案例,同时鼓励学生提出自己参与科研实践中遇到的相关问题,引导学生积极分析、讨论,以深刻理解和体会某个具体试验设计方法的试验布置、应用及其优缺点。给出科研实践工作中的具体试验数据,让学生进行统计分析并对结果进行分析和讨论。更好地达到提高学生知识运用水平及动手能力的目的,提高学生发现问题、分析问题和解决问题的能力。采用提问、答疑等多种教学方法,加强教师与学生的互动,调动学生的学习积极性,也有利于教师掌握学生情况。对学生容易混淆的问题,如准确性和精确性、随机模型和固定模型的区别等进行提问,加深学生对这些重要概念的理解,达到巩固知识的目的。
理论联系实际教学模式的应用。教学中,依托教师科研项目,密切联系相关学科与课程,鼓励学生在所参与的科研实践中运用学习到的试验设计和统计分析方法;鼓励学生将学到的试验设计方法,应用到大学生科研立项和“大学生挑战杯实验”等实际项目中。同时,学生所接触的其他实验性课程本身就有需要进行试验设计的内容,例如他们将所学试验设计方法应用到遗传学实验课中的多倍体诱导实验的设计和育种学实验课中花粉萌发的实验等。为了拓宽学生的知识面,我们还推荐学生查阅相关期刊,如《遗传学报》《林业科学》《食品科学》等发表的最新研究文献,学习和分析这些试验过程中所使用的试验设计和统计分析方法。课题组还收集了相关的书籍、论文和网站等作为课外读物,提供给学生广泛阅读。在教学过程中,提供合适的科研实例,鼓励学生用不同的设计方法进行试验方案设计和试验数据处理并进行综合对比分析,直观地理解由于采用不同的设计方法,可能会得到不同的试验结论,从而深刻理解试验设计方法的重要性,起到了很好的效果。
3 实践教学改革
试验设计与统计分析课程属方法论课程,该课程将概率论与数理统计的原理和方法运用于科学试验,重点解决如何根据试验目的和要求科学设计试验,并对试验结果进行统计分析,以获得有效试验信息等问题,具有很强的实用性。传统的教学方法仅仅限于教师课堂讲授基本理论、基本原理和基本方法等内容,缺乏学生实践环节,因此学生对理论知识往往死记硬背,在今后的学习和工作中遇到相关问题不能灵活运用。因此在课程教学中,必须注重理论与实际相结合,通过对科研实践和其他相关课程学习中遇到的试验设计及统计分析案例进行深入分析和讨论,提高学生的知识运用水平及动手能力,提高发现问题、分析问题和解决问题的能力,真正体会到本课程在生产和科研实践中的应用。同时,实践问题的解决还可以引发学生学习的兴趣,增强他们的专业自信心。注重理论与实际相结合,从以下3个方面获得教学案例:(1)给出科研工作中典型的试验设计案例和试验数据;(2)学生所参与科研实践中遇到的试验设计问题;(3)学生在其他相关课程中遇到的试验设计问题和案例。
随着计算机的普及,涌现出大量统计软件,把人们从繁重的计算中解放出来。因此,对常用的试验设计方法和数据处理,通过Excel和SPSS等统计软件进行运算和分析,课程相关的各种统计分析软件得到了开发和应用。将以上案例分类整理后应用于讨论课,通过对案例的深入分析和讨论,能够提高学生的知识运用水平及动手能力,提高学生发现问题、分析问题和解决问题的能力,让学生真正体会到本课程在生产和科研实践中的应用。通过生动的专业案例学习,可以避免课程学习中机械记忆冗长的数学公式,增加学生的学习兴趣,培养学生试验统计学思维。
4 教材建设
有关试验设计与统计分析的书籍非常多,但每本教材都有其应用的背景和专业,针对林业院校的教科书较少,现有的教材多偏重于理论知识和数理统计原理方面的介绍,缺乏试验设计应用性的阐述。1995年出版的《林业试验设计》是当时林业院校的第一本试验设计课程教材,该书也已经成为全国林业院校使用的主要教材。历经多年的教学实践,并且随着试验设计与统计分析学科的发展,需要我们对原有的教材进行补充和修正以适应现代课程教学的需要。我们在现有教材基础上编写了《林业试验设计》第二版,将第三章《简单试验设计》进行了缩减,去掉现代试验设计中不用的部分,同时删去了原来第九章《格子设计》的内容。补充和更新了“回归设计”的相关内容,并增加了一章《常用统计分析软件在试验设计中的应用》,目前已完成初稿,将在2013年出版。
5 转变考核方式
考试在教学过程中具有指挥棒的作用,考试方法是教学方法的重要组成部分,从考试切入可以有效撬动教学方法改革[4]。传统的考核方式多以闭卷考试为主,本课程采用开卷考试与平时成绩相结合的考核方式,其中期末考试占总成绩50%,实践成绩(包括研讨部分)占20%,平时作业和小测验占30%,实现从过分关注结果到更多地引入过程要素的转变,促使学生平时坚持参与学习,避免平时不学习期末考试前突击复习,死记硬背应付考试的现象。共设计实践(包括研讨)4次,课后作业6次,阶段性测验(考核)4次,记入平时成绩。对作业或考核成绩不理想的学生,允许提出重做或重新考核,有利于减少作业抄袭现象,同时使教师及时了解学生的学习情况。对于教师而言,这样的设计需要更多的投入,需要精心为所有重要内容设计考题,巩固学生对相关知识和方法的理解并测试他们的掌握程度,从而动态地调整教学进度。
6 结束语
试验设计与统计分析是重要的工具课,通过对试验设计与统计分析课程教学内容的调整和更新,加强了常用试验设计方法在整个课程中的比重,增加了软件分析范例;课程教学中注重案例的分析和讨论,加强实践环节的学习,极大地激发学生积极探索与主动学习的热情,取得了良好的教学效果。达到了培养学生的专业水平,提高分析问题和解决问题能力的目的。
参考文献
[1] 李玉阁.生物统计学课程教学初探[J].生物学杂志,2006,23(5):52-54,61.
[2] 王新国.高校多媒体教学准入制探究[J].中国现代教育装备,2012(13):23-25.
统计法试题范文第3篇
关键词: 命题质量 定量分析 质量评价
一、命题定量分析的准备工作
启动SPSS19.0中文版,选择“变量视图”中,在名称下输入学号、题目1―12、总分等命题基本情况项目。在类型标记中,将学号定义为名义,将题目1―12定义为度量,小数根据实际情况设定,其他项保留默认设置。选择“数据视图”标签,在各行内输入学生的各题得分和总分数据(图2)。
图1 定义变量设定图
图2 数据输入图
二、命题的定量分析
(一)描述性统计量分析
用以描述考试总体情况的各分数统称为描述性统计量。在SPSS中,点击“分析―描述分析―频率”。将“总分”等变量名称选入待计算变量框中,在“统计”中选择要计算的统计量,选中均值、极值、标准差、中位数等项,最后输出结果(表3)。
表3 有效数据的得分描述性统计
(二)试题的正态分布预期
在学生群体足够大时,学生的能力呈正态分布。处于能力尖端和尾端的学生数量少,处于能力中端的学生数量多。在考试命题适宜,教学状况正常,学生水平相当,试卷评阅严谨的前提下,一份合格的试题,所反映出的学生成绩应呈现正态分布的特点。为研究试题能否体现学生能力的正态分布,可在SPSS软件中点击“分析―描述分析―频率”,在“频率”对话框中选择“图表”,点选绘制“总分”的直方图并标变化曲线(图4)。
图4 学生总分的直方―变化曲线图
若学生总分的直方―变化曲线图能呈现正态分布,那么,可进一步探究命制试题的正态分布预期。可利用单个样本K-S校验测查给定数据与正态分布间的显著差异。在SPSS中,点击“分析―非参数检验”,对“总分”进行单个样本K-S检验(表5)。
表5 试题总分的单样本Kolmogorov-Smirnov检验
(三)难度
试题的难度(P)是测验题目难易程度的统计量。试卷难度等于试卷内各题的平均难度。要观测命题试卷难度,应先测量命题试卷内各题难度。试题计分方法不同,难度计算方法不同。
二分法计分(选择题、判断题)题目的难度统计。对于二分法计分的题目,答案只有对与错两种可能的结果(即答对得分,答错不得分)。此类题目难度通常用通过率(P)表示。其中,P=1―R/N(其中R为答对该题的人数,N为答题总人数)。由此,可在SPSS中,运用“转换―计算变量”方法,在“计算变量”对话框中输入公式,直接算出二分法题目难度(表6)。
表6 二分法计分题目难度值
非二分法计分(主观题、论述题)题目的难度统计。对于非二分法计分的题目,难度(P)可以通过公式P=1―X/W(X为该题目均分值,W为该题满分值)计算。可采用“计算变量”方法直接输入公式,算出非二分法题目难度(表7)。
表7 非二分法题目难度值
全卷难度值(P)等于卷内各题难度平均值,采用SPSS“计算变量”可得p=0.4。
(四)区分度
区分度是反映试题区别学生水平和能力的统计量。在实际统计时,常以考试总分作为考生的实际水平,而把某题的得分与学生总分之间的相关系数作为该题的区分度。
客观题的区分度统计,可把客观题得分视为等间距测度的连续变量,采用Spearman等级相关分析统计区分度。主观题的区分度统计,可把主观题成绩视为非等间距测度的连续变量,采用Pearson相关分析。在SPSS中,点击“分析―相关―双相关”。先选择客观题各题分数和总分采用Pearson相关分析(1-6),再选择主观题(7-12(2))各题分数和总分采用Spearman相关系数分析,得到结果合成(表8)。
表8 各题区分度汇总表
(五)信度
信度是衡量一次考试可靠性、稳定性的统计量。信度代表着试题的可靠性,其取值在0至1之间。信度越高,可靠性越好,但容易造成成绩标准差过大。一般采用SPSS中克伦巴赫系数(Alpha模型)计算命题试卷一致性信度系数。在SPSS中,点击“分析―度量―可靠性分析”。在可靠性分析对话框中,选择试卷各题得分数据。点击“统计量”,选择“如果项已删除则进行度量”,结果如下(表9-10):
表9 信度统计值表
表10 删除变量后项目统计值表
(六)效度
效度是指测试结果的准确性与有效性程度的统计量,即一个测验能够测量学生水平的程度[2]。可采用效标效度法测量试题的效度。将学生的平时成绩作为效度分析的校标,利用皮尔森相关系数法计算命题测试分数与校标之间的相关系数,结果即为试题效度(表11)。
图表11 命制试题得分与平时成绩间皮尔逊相关系数分析
三、命题质量评价
第一,描述性统计量分析。由表3可知,命题平均成绩为32.54分(满分49分),最高分45分,最低分12分,标准差为6.94。平均分、标准差数值适当,极值差距较大,体现了学生个体之间对题目的理解差异大。由此可见,试卷命题中,部分题目可能表意不清,引发部分学生无从下手作答的情况。此卷应注意题干的表达,使学生清晰了解题目意图。
第二,正态分布预期分析。由图4可知,学生总分变化曲线呈正态分布曲线样式,因而命制试题具有正态分布预期。由表5进一步分析K-S检验中的各数值可知,Z值为0.493,sig(双侧P值)=0.851>0.05,由sig(渐进显著性)>0.05,可得给定数据与正态分布没有显著性差异,即总分数据符合正态分布要求。
第二,试题难度分析。一般认为,命题难度在0.4至0.7之间为宜,难度值小于0.4的题目难度较小,难度值大于0.7的题目较大。一般认为,最好的试题难度应接近于中等难度(即p=0.5)。因此,本命制试题全试卷具有中等偏下的难度(p=0.4)。这份命制试题如果运用在终结性考核中,用以检测学生在群体中知识掌握水平,作为合格水平测验,则效果较好。但作为过程性考核,则其难度水平较低,需适当加大难度。由表6、7可知,T9、T1难度过小,建议予以删改。T6、T3难度过大,应进一步结合课程评价标准加以研究,检验是否超纲。
第三,区分度分析。一般认为区分度在0.4以上的题目,鉴别能力优秀;区分度在0.3至0.39间的题目,鉴别能力良好;区分度在0.39以下的题目,应进行删改。由表8可知,全卷区分度总体水平适宜,能够区分学生掌握知识程度的优劣。但T1、T3、T4、T6四题区分度较低(
第四,信度分析。从表9可知,本次考试的信度为0.455。普遍而言,学校测验采用试卷信度应达到0.5以上。本命题试卷达不到可信要求,为提高本卷信度,本卷应进行修改。从表10可知,删除T1后全卷信度提升至5.0,故可考虑对T1进行替换。同时,目前本卷题量共12题,题目数量较少,可考虑通过适当增加题量的方法,提高全卷信度。
第五,效度分析。从表11可知,全卷效度值为0.837,在0.01的显著性水平下,sig.值(显著性)为0.000,表明学生完成命制试题的得分与学生平时的成绩两者间呈显著的相关关系。命制试题具有较高的效度。
参考文献:
统计法试题范文第4篇
关键词:网络考试;计算机;考试管理
考试是高等教育教学活动过程中的一个重要环节,对于实现教育教学的最终目标具有积极且重要的推动作用。而随着计算机技术的不断发展,特别是计算机网络交互技术的快速进步和日趋完善,网络计算机考试的易操作性、易管理性和流程规范性等特点使高等教育传统考试正面临着一场改革。网络计算机考试取代传统考试是未来高等教育考试的发展趋势,而考试管理模式也必须随之进行改进。
1 网络计算机考试的概念
网络计算机考试是指以电脑智能化题库、网络报名系统、计算机考试运行系统、计算机试卷自动分配评卷系统和考试网络系统为依托,学生按照考试指引自助上机答题的电子化考试[1]。它主要由以下几部分组成:
1.1 试题数据库
建设试题库是计算机考试的最基本条件,大型题库建设,应从知识点分布状态、体型、难易度、题目表达方式等方面进行考虑,确保计算机随机抽题对每个考生来说是合理、难易程度是一样的,同时要求试题库题量大、知识点覆盖面广、随机抽取试题知识点不应有重复。题库在使用一段时间后,应不断补充,使题库具有良好的备用状态,为计算机考试提供有力的保障[2]。
1.2 考试报名系统
报名系统是计算机考试系统重要的组成部分,报考生的相关信息及相关考试要求都是由报名系统收集,分类,筛选并汇总导入考试系统的。考生通过网络或指定客户端的计算机往考试系统服务器输入考生相关信息及考生的考试要求,报名系统就能自动完成身份资料存档,考试资质筛选,报考科目分类等相关考务工作,并将数据自动导入考试系统。
1.3 考试运行系统
考试系统是计算机考试的最主要组成部分,是考生在计算机上进行考试答题的操作系统。考试系统的界面要求界面外观简洁、耐看,界面操作简单、易用,系统运行过程中稳定、容错性高,避免误操作造成的考试无法进行;还要求系统对考试出现的电脑死机,网络中断等造成考试中断的突况具有一定的应急预案,避免造成考试过程中出现突况以致前面的考试数据丢失。
1.4 考试评阅系统
考试评阅系统是计算机考试充分体现其优越性的组成部分,是考生在计算机上答题完毕试卷加密存入试卷库后,从试卷库中分类,分段;然后自动评阅客观题并将主观题不记名地随机分配给阅卷老师的系统。计算机考试阅卷的高效率性及高公平性就体现在此,评阅系统能将大量客观题快速评分,其准确度和效率是人工阅卷不可比拟的;而需要人工阅卷的主观题,系统也能将其分类分段,随机到分配给各个阅卷老师系统上,既保证了阅卷的公平公正性也提高了老师的阅卷效率。
2 与传统考试相比,网络计算机考试的优越性
2.1 题库的灵活性
与传统考试由教师人工出题相比,计算机考试试卷由题库随机自动生成有2点优越性。一是试题库的出现,解决了教学系统教考无法彻底分离的困扰。在参照相关的教学大纲或行业标准后,考生考核将不受指定应试教材限制,不受教师的个人教学习惯和出题习惯困扰。考生对应这种计算机考试只需针对相关大纲和标准进行自主学习,成为学习的主体,达到学习的目的,从而也提高了考试的信度与效度。二是计算机试题库有着灵活的试卷构造方式。考试系统提供了多种的试卷抽取方式,可从题库中抽取一个特定类型的指定数量的试题,也可从题库中的多个类型,不同方面的试题,可以灵活应对考试大纲的要求。
2.2 报名的简易性
与传统考试的人工报名相比,计算机考试的报名一般都在网络上由报名系统完成。传统考试的考生报名资料登记,报名资格审核等报名工作都需要人工完成,资料量庞杂而且容易出错;而计算机考试的报名系统可以让报考生自主在网络上进入报名系统报名,考生资料录入和考试资格审核都可以由报名系统自动完成,最多再进行少许人工复核即可,这样可以节约大量的人力和时间,大大提高工作效率。
2.3 测试的全面性
与传统测试的试题类型相比,计算机考试由于多媒体技术的应用,使传统考试只能涵盖的听力和笔试题类型在计算机考试上得以扩充,可以实现听力,叙述,读写以及远程面试等听说读写全方位的测试形式。尤其是一些关于英语类或专业技术类考试方面,计算机考试可以实现口语测试、远程面试及计算机模拟实际操作等考试形式,这样更能测试出考生的个人实际知识水平,避免了考生靠死记硬背教科书来应付考试的情况。
2.4 阅卷的简易性和公正性
与传统测试的阅卷方法相比,计算机考试的阅卷更具有公平和效率。传统考试靠人工来进行试卷的汇总、分类、评阅及登分等工作,不仅效率不高,而且各个环节都有可能出现人为错误或分数不够公正的情况。计算机考试的评阅试卷是在考生完成考试后就由系统自动加密存入,一般的考试系统权限是无法取出或修改的;而且需要老师评阅的主观题部分,也是由评卷系统将一个考生的考题分为几大部分,不记名地随机分配到阅卷老师的系统上的;一旦试卷评阅完毕,系统立刻自动计算出分数结果;过程中几乎没有可以人工操作影响考生成绩的机会。这样就大大提高了考试结果的客观性和公正性。
3 计算机考试的不足和考试管理的改进方法
统计法试题范文第5篇
关键词:可用性;可用性测试;测试方法;测试过程
在软件系统开发的过程中,软件可用性的测试是必不可少的一环。可用性是从人的角度来看软件系统是否易用、高效,使人感到满意。可用性测试一般来讲就是要测试软件的可用性是否达到了用户的要求[1]149。
近年来,IT产业发展迅速。然而,在IT产品特别是软件产品的开发中,往往只重视技术创新而对人的因素考虑不足,导致很多产品存在着不同程度的可用性问题。据统计[2],在英国,80%的软件缺陷是由于不能有效满足用户需求,而其中60%是由于存在着可用性问题。具有良好可用性的软件产品可以减少用户的操作错误,减少人员培训和系统维护的费用,提高用户的生产效率和满意程度,从而提高产品的市场竞争力。
可用性测试的研究早在90年代初就已经兴起,经过十几年的发展,已经诞生了很多有效的可用性测试方法。目前这一领域的关键问题是如何设计合理的测试过程,选择实用的测试方法,使得测试高效率、低代价。
本文后续章节将首先介绍各种可用性测试方法,然后根据我们所开展的工作,给出一种比较合理实用的可用性测试过程,最后进行总结和展望。
1可用性测试方法
可用性测试的方法大致可以分为4类,用户模型法、用户调查法、专家评审法和观察法。
1.1用户模型法
用户模型法[1]150[3]通常是用数学模型来模拟人机交互的过程。这种方法把人机交互的过程看作是解决问题的过程,它认为人使用软件系统时是有目的的,而每一个大目的可以被细分为许多小目的。为了完成每个小目的,又有不同的动作和方法可供选择。每一个细小的过程都可以计算完成的时间,这样,整个模型可以用来预测用户完成任务的时间。因为数学建模相对来说比较复杂,所以这种方法在工业界一般比较少用。
1.2用户调查法
用户调查法[1]196-206[4]包括问卷调查法和用户采访法。问卷调查和用户采访可以在用户使用完软件之后,调查用户的满意度和发现软件的可用性问题。
用户问卷调查所收集的数据可以用来进行统计分析。问卷本身需要认真的设计,避免可能的误导问题,保证所收集的数据有高的可信度。用户问卷的使用过程大致可以分为用户要求分析、问卷设计、问卷施行及结果分析。
用户采访一般在试验结束以后,问试验参加者一些相关的问题,也可以让试验参加者随意谈谈使用软件的一些主观感受。
1.3专家评审法
专家评审法[1]176-195[5]是由可用性专家来评估软件系统的可用性。根据评审专家使用原则的不同,可分为启发评估法、步进评估法和设计准则评估法。
启发评估法是让专家来评估软件是否符合某些可用性原则。可用性原则要简单、通用、有启发性。
步进评估法通常由专家来模拟用户初次使用软件时人机交互的过程,在这个过程中发现潜在的可用性问题。比较适用于没有任何用户培训的系统,比如为大众设计的网站。
设计准则评估法用来评估系统的设计是否符合设计准则。设计准则通常是为满足公司或设计团体特殊需要而制定的、一般性的用户界面设计规范。比如保持界面简洁,提供明确的路径,不要让用户费力等。
1.4观察法
观察法[1]151-165[6]就是观察用户使用软件的方法,包括用户测试法和使用记录法。用户测试一般在实验室里进行;使用记录法是观察用户的使用记录,通过分析这些记录可以发现一些可用性问题。
用户测试有两种,一种是用于发现可用性问题的正式的可用性测试。通常选择6~10个有代表性的用户参加,完成几个符合实际的测试任务,通过对用户完成任务过程的观察,确定设计中的可用性问题。另一种是在软件开发阶段使用快速改良测试评估。整个试验分为几轮小的试验,在两轮试验之间,可用性工程师快速地报告试验结果并提出改进意见,设计人员根据这些意见改进设计,下一轮试验使用改进后的设计。
使用记录法就是分析试验过程中记录的数据,以进一步发现软件系统存在的可用性问题。试验过程中具体要记录哪些数据,要根据不同试验而定。
2可用性测试过程
合理实用的可用性测试过程,能够在低代价的情况下,高效率地进行,发现尽可能多的可用性问题。 我们一直致力于可用性测试方面的研究,经过长期的实践工作,总结出一套比较合理实用的可用性测试过程。一个软件产品开发出来之后,首先进行专家评审,将这个过程发现的可用性问题解决好之后,进行实际的用户测试,测试完毕,进行问卷调查和用户采访,最后对整个记录的数据进行统计分析,找出存在的可用性问题。
2.1专家评审
进行专家评审的时候,首先采取启发评估法。让几个评审人员根据一些通用的可用性原则和自己的经验来发现系统内潜在的可用性问题。在评审人员的选择方面,我们通常选择既具有可用性知识又具有和被测系统相关专业知识的“双重专家”,据试验统计,这样的双重专家比只有可用性知识的专家平均多发现大约20%的可用性问题[7]。评审人员的人数一般在5人左右,有试验表明[1]176,5个评审人员可以找到大约75%的可用性问题。每个评审人员评估后会提供一份独立的报告,描述发现的可用性问题,问题的严重性以及改进的建议。将所有评审人员的报告综合得到最后的报告,根据这份报告,改进软件产品。
然后采取步进评估法,由评审人员模拟初次使用系统的用户,真实地感受直接使用系统时可能会遇到的问题。在进行步进评估时,评审人员可以进行简单的评估记录,也可以对可用性问题进行更详细的描述,并且估计其危害性和发生频率,帮助设计人员更好地解决相应的问题。
2.2用户测试
经过专家评审,并将发现的可用性问题解决以后,进行实际的用户测试。用户测试是可用性测试过程中最关键的一步,也是发现可用性问题最重要最直接的方法。用户测试涉及到很多方面的问题,下面逐一论述。
2.2.1可用性实验室
用户测试可以在实验室进行,也可以现场进行。但现场测试很费时,而且难以控制,所以,一般都选择在实验室进行。
正规的可用性实验室要由两个房间组成:实验室和观察室。实验室和观察室之间有一面隔音、单向透光的玻璃墙,当实验室开着灯,而观察室灯光比较暗的时候,从实验室看过去是一面不透光的镜子,从观察室看过去则像一个普通的玻璃窗。实验室的计算机(被试机)配备麦克风和摄像头,观察室的计算机(主试机)可以同步监测被测机的屏幕,进行录音和录像,并能记录相关的试验数据。如图1所示。
2.2.2试验的参加者
试验参加者应该代表被测系统的现有和潜在的可能用户。因此,在选择试验参加者的时候,要考虑如下几个因素:
1) 专业知识、计算机经验及对被测系统的熟悉程度。
有些系统是给计算机专业人士设计的,为这种系统的可用性试验选择参加者时,对专业知识的要求较高。有些系统是为普通用户设计的,则对参加者没有很强的专业知识要求。
计算机经验也是一个考虑因素,如果参与者的计算机知识过于贫乏,可用性测试就会变成学习如何使用计算机,会影响测试结果。
对被测系统没有用过或者很少用的属于新用户,比较熟悉的属于熟练用户,还有一些用户介于两者之间可称为半熟练用户。一般选择测试参加者的时候,这3类用户都要占据一定的比例。新用户可以发现软件可学性方面的问题,熟练或半熟练用户可发现软件易用性、效率和用户满意度等方面的问题。
2) 参加者的人数。
在进行正式的可用性试验时,一般需要6~10个参加者。可用性试验的目的是发现可用性问题,发现所有可能存在的可用性问题的可能性可以用以下公式计算[1]153:
P=1-(1-λ)n
其中,n是参加者的个数,λ是一个参加者发现任何一个问题的可能性。Nielsen和Landauer统计发现,λ大约是31%。所以,一个有6个人参加的试验,大约会发现89%的可用性问题。
(3) 其他因素。
试验参加者的性别、年龄、教育水平、工作类型等因素也需要考虑。一般的软件测试,应该尽量使男女比例保持平衡,各个年龄段保持一定比例。有些涉及性别和年龄的软件系统要特殊考虑。
2.2.3试验任务设计
设计试验任务时,应该让试验参加者觉得易于理解,另外只提供给参加者完成任务所需要的信息,以免信息过多引起混淆。任务应该是有意义的,以一定的逻辑顺序展现给用户,同时还要控制每个任务的完成时间,不能让用户把所有的时间都花费在一个任务上。
2.2.4试验数据收集
在试验过程中可以收集的数据通常有两类,一类是客观可测量的数据,如参加者完成任务所需要的时间,参加者完成任务时犯错误的次数等,这些需要设计相关的数据结构来记录;另一类是参加者的主观感受,如对产品的满意度、评价等,用户对产品的满意度可以通过后续的问卷调查获得,对产品的主观定性评价可以通过后续的用户采访获得,也可以通过有声思考[8](think aloud)的方法来收集。
有声思考是指试验参加者在人机交互的同时不断的进行发声的思考,比如描述自己对系统的了解,为什么采取某个行动,期待的后果是什么等等。有声思考的优点是简单易用,能够了解参加者对系统的理解。缺点是可能会影响参加者完成任务的时间,或者导致出现错误。
另外,试验过程中有同步的录音和录像。录音是记录试验参加者在试验过程中进行有声思考的相关信息,录像是记录试验参加者在试验过程中的脸部表情。
2.2.5知情告知书
为了保护试验参加者的权利,也为了保护研究机构或者公司的利益,通常,在试验开始的时候要求参加者在一份知情告知书上签字。知情告知书没有严格的格式限制,但应该解释清楚试验的目的,参加者的权利,试验相关设备的使用方法,以及告诉参加者试验过程中需要进行笔录、录音和录像的目的,还应该知会参加者有关测试产品的信息需要保密等。
2.3问卷调查
为了测试用户的满意度,在试验参加者完成试验任务后,进行问卷调查。为了方便用户使用和便于试验结束后进行数据分析,我们将问卷调查直接放到主试机上,并在被试机上提供访问链接给用户,点击即可进行问卷的填写,即通过网络的方式进行。
问卷调查所收集的数据可用于进行统计分析,因此问卷本身需要认真的设计,使问卷简单、易读、容易理解,保证所收集的数据有高的可信度。
2.3.1问题的类型
最常见的问题有3种:事实型、意见型和态度型。
事实型的问题是关于公开的、可以观察到的信息的问题。如用户的受教育程度,使用计算机的年数等。
意见型问题是有关用户对系统的看法的问题。这种问题回答时只需给出感受的强烈程度。如是否喜欢某一个软件,更乐意使用哪个软件等。
态度型问题将用户的注意力集中在他们的内部,集中在他们对事物内在的反映。用户满意度问题通常就是态度型问题,反映了用户在使用了某系统后的感受。如用户喜爱的程度,用户对学习使用该系统的难易程度的感受等。
在一个问卷中,通常可以先通过事实型问题了解用户的背景,然后给出一些意见型和态度型问题来了解用户的感受。
2.3.2问题的形式
常见的问题形式有清单、李克特(Likert)量表及开放式的问题[1]199。
清单式的问题给用户几个事先安排的答案,让用户选择其中一个或多个答案。如:
您使用过多少类型的菜单?
没用过12 34 4种以上
李克特量表形式的问题允许用户用不同的程度来回答问题。这种问题的答案是一个两极化的量表。通常低端代表否定的答案,高端代表肯定的答案。如:
您对使用鱼眼菜单的感受是:
困难 1 2 3 4 5 6 7容易
量表的阶数一般是1到3,1到7或1到9。
开放式问题是指用户用自己的话来回答问题。这样可以直接感受到参加者对系统使用的满意度。
2.3.3常见的可用性问卷调查
在学术论文中常常提到的可用性问卷有:用户交互满意度问卷[9](Questionnaire for User Interaction Satisfaction, QUIS),软件可用性测量目录[10](Software Usability Measurement Inventory, SUMI),计算机系统可用性问卷[11](Computer System Usability Questionnaire, CSUQ)。在设计问卷的时候,这些都可以作为很好的参考标准。
2.4用户采访
用户采访是在试验参加者完成所有任务,填写完问卷调查之后进行的。用户采访没有特别严格的形式,可以由参加者自己简单描绘一下使用系统的一些感受,对系统的一些修改意见等,也可以由工作人员设计一些相关问题,对参加者进行提问。
2.5试验数据分析
用户测试、问卷调查、用户采访结束后,我们会得到很多试验数据,合理分析这些试验数据,就会发现很多的可用性问题。
2.5.1统计试验记录
进行用户测试的时候,应该设计相关的数据结构,来记录测试过程中的相关数据。比如我们在进行各种菜单使用情况测试的时候,会记录每个用户使用每种菜单完成任务的时间,用户点击任务是否正确等。对得到的这些数据进行数理统计,就可以方便地比较各种菜单的性能。常用的数理统计有下面几种(假设经过n次试验得到一组数据X1X2…Xn):
(1) 均值:
(2) 标准方差:
(3) 分布。
均值和方差只是简单地给出了我们所收集数据的平均值以及个体的偏差。但有时候我们想知道我们的设计是否达到了预计的要求,这时就要用到相关的分布函数。分布函数有很多种,如t分布,F分布,χ2分布等。请参阅相关的数理统计书籍,在此不再赘述。
2.5.2统计问卷结果
在设计调查问卷的时候,也需要设计一些相关的数据结构,来对问卷的结果进行统计。这里能够进行量化统计的,是李克特量表式的问题,每个用户对每个问题,都会选择一个具体的数值,对所有用户对同一个问题选择的数值,进行相关的数理统计,比如均值和方差,通过这些统计的数值,我们可以清楚地看到用户对系统使用的满意度情况。
2.5.3统计开放式问题
我们这里所说的开放式问题既包括问卷里面所涉及到的开放式问题,也包括用户采访的一些问题。开放式问题没有办法进行量化统计,只能通过问题答案来进行分析总结用户对系统的相关评价。
2.5.4回放录音录像
必要时可以通过回放录音录像来观察用户进行测试过程中的表情、状态和有声思考的情形,以从中发现某些可用性问题。
2.5.5总结问题
最后,对用上述各种方式分析得到的数据进行总结,汇总系统所存在的各种可用性问题,提交系统设计者,进行修正。
3结语
本文综述了各种可用性测试方法,并根据我们的经验,给出了一个比较合理实用的完整的可用性测试过程。在软件产业飞速发展并直接影响着人们生活的今天,计算机及相关专业的学生不能仅局限于可以写程序实现某个软件系统,而且要保证所实现的软件系统是正确并有应用价值的,因此,教会学生如何对自己设计实现的软件系统进行可用性测试,是一个必然的选择。当然,对于学生实现的某些简单的软件系统,不必使用上述完整的可用性测试过程,可以根据系统的特点选择其中的某个测试环节,比如可以只进行用户采访,或者只进行问卷调查等。
参考文献:
[1] 董建明. 以用户为中心的设计和评估[M]. 2版. 北京:清华大学出版社,2007.
[2] Bevan N. Tutorial 1:Industry Standard Usability Tests[R]. Interact’99 Conference,Edinburgh,1999.
[3] Mie Nørgaard,Rune T. Høegh. Evaluating UsabilityCUsing Models of Argumentation to Improve Persuasiveness of Usability Feedback,DIS2008[C]. Landon: University College Landon,2008:212-221.
[4] West Ryan,Lehman Katherine. Automated Summative Usability Studies: An Empirical Evaluation[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems,April 22-27,2006. New York:ACM,2006:631-639.
[5] Tasha Hollingsed,David G.Novick. Usability Inspection Methods after 15 Years of Research and Practice[C]// Proceedings of the 25th Annual ACM International Conference on Design of Communication,2006. New York: ACM,2007:249-255.
[6] Jakob Nielson. Usability Inspection Methods[C]//Conference on Human Factors in Computing Systems 1994. New York: ACM,1994:413-414.
[7] Patrick W. Jordan. Usability Evaluation in Industry[M]. Landon: CRC Press,1996:169-178.
[8] Virzi R A,Sorce J F,Herbert L B. A. A Comparison of Three Usability Evaluation Methods:Heuristic,Think-aloud,and Performance Testing[C]// Proceedings of the Human factors and Ergonomics Society 37 th Annual Meeting,1993. CA:The Society,1993:309-313.
[9] Shneiderman B. Designing the User Interface: Strategies for Effective Human Computer Interaction[M]. 2nd ed. Reading MA: Addison-Wesley,1992.
[10] Kirakowski J,Corbett M. SUMI: The Software Usability Measurement Inventory[J]. British Journal of Educational Technology,1993,24(3):210-212.
[11] Lewis J R. IBM Computer Usability Satisfaction Questionaires: Psychometric Evaluation and Instructons for Use[J]. International Joural of Human-Computer Interaction,1995,7(1):57-58.
A Feasible Usability Test Process
ZHANG Li-xia, LIANG Hua-kun, FU Yi, SONG Hong-zhi
(Research Center of Human Computer Interaction, South China Agricultural University, Guangzhou 510642, China)