首页 > 文章中心 > 考试成绩分析总结

考试成绩分析总结

考试成绩分析总结

考试成绩分析总结范文第1篇

一、引言

考核是检验教学质量最重要的手段之一,试卷的质量和学生考试成绩是衡量教学质量的主要方法。通过对试卷分析,可以反馈学生学习情况,评估教学效果,为进一步推进教学改革、提高教学质量提供参考。[1]

虽然目前许多高校在教学评价方面都呼吁评价形式的多样化,但试卷测试仍然是最主要的方法,因此试卷质量分析成为高校教师教学过程中的一个必备环节。目前多数学科如数学和医学专业已经重视试卷成绩和试题质量分析,[2-7]]对世界自然地理的课程与教学改革方面进行研究较少,[8-10]贺丹君等从评价体系上对地理课程进行定性分析和评价,未对试卷质量进行定量分析。[11]然而,《世界自然地理》是高等院校地理专业的必修课程之一,它最能体现地理学的综合性、区域性和人地相关性,具有其它地理学分支学科不可比拟的优势,所以对《世界自然地理》试卷成绩进行定量分析,评价试卷的优劣是很有必要的。本文对2007级地理科学专业57名学生的世界自然地理期末考试成绩进行分析,评判试卷对学生学习情况的反映能力,旨在为今后的考试命题和教学改革提供参考依据。

二、数据来源与研究方法

1. 数据来源

2007级地理科学本文由收集整理专业的本科生共57名学生的世界自然地理期末考试试卷。试卷由任课教师命题,试卷评判严格按照评分标准和标准答案进行,由任课教师评分。试卷卷面分值满分为100分,包括4种题型,26道小题:第一题单项选择题包含15道小题,占总题目数的57.69%,共15分;第二题简答题包含5道小题,占总题目数的19.23%,共40分;第三题填图题包含4道小题,40个空,占总题目数的15.38%,共20分;第四题论述题包含2道小题,占总题目数的7.69%,共25分。

2. 方法

试卷分析主要是指通过收集一定量的原始数据,按照设定的评价指标,运用测量学和统计学的理论,通过计算各种统计量数和绘制统计图表,对试卷进行定量分析和评价。[12]可以针对某一门课程,比较学生各成绩段的比例,分析学生成绩的分布是否合理,与试卷内容是否相关等。评价指标可以从教学大纲、命题、试题数量比例等方面来设定。

试卷质量的统计分析是运用数理统计描述和统计推断的方法,对试卷的数量特征和数量关系进行分析和判断。[12]根据《教育测量学》的介绍,[13]本文主要选取难度、区分度两个指标对试卷质量进行统计分析。

(1)难度。试题的难度是衡量试题难易程度的指标。[13]

在编制试题时,难度分布从易到难,逐步增加难度,这样有利于考生水平的正常发挥。试题的难度即考生对该题的通过率或得分率,对于答对得1分、答错或不答得0分的试题,难度(p)就是答对(或通过)试题的人数与考生总数之比:

(1)

式中,r为答对该题的人数,n为考生总数。

对于满分量大于1分的试题,难度则是考生对该题的平均得分与该题的满分之比:

(2)

式中, 为考生对该题的平均得分, 为该题的满分。p值越大,试题越容易。因为百分制以60分为及格,通常情况下,把平均难度控制在0.45~0.75之间比较合适。[13]试题难度的评价标准见表1。

表1 试题难度的评价标准

(2)区分度。题目区分度是指检验题目对其学业水平不同的考生的区分程度或鉴别能力,它是学生掌握知识水平和能力差异的指标。[14]通过考试,学习好的学生得到高分,学习差的学生得到低分,则说明试题的区分度高;如果学生中好、中、差三个层次的考试成绩处于同一个分数段中,就反映不出学生学习水平,那么这样的试题区分度就低。所以一般采用比较方便的两端分组法来计算试题的区分度。所谓两端分组法,即当测试成绩成正态分布时,将考试总分进行排序,然后选出得分最高的27%列为高分组,将得分最低的27%列为低分组。区分度计算公式如下:

,其中i=1,2,3,……n (3)

式中, 和 分别表示全体考生中的高分组和低分组中第i题的平均分; 表示第i 题的满分值。d≥0.40为优秀;0.30≤d<0.40为良好;0.20≤d<0.30为尚可,需改进;d<0.20为劣,需淘汰或修改。[15]试题区分度的评价标准具体见表2。

表2 试题区分度的评价标准

3. 结果分析

从2007级地理科学专业世界自然地理期末考试的成绩分布来看,试卷满分为100分,客观题总分为35,主观题总分为65,学生考试的平均成绩为68.35,最高分为91,最低分40.5,标准差10.10,及格率为80.7%,不及格率为19.3%。

一是课程成绩分布情况分析。

(1)试卷总成绩分布:2007级地理科学班的57名学生,有39名学生成绩分布在60~79分内,占68.42%;有6名学生成绩分布在80~89分内,占10.53%;有10名学生成绩分布在50~59分内,占17.54%;仅1名学生成绩高于90分和低于40分,各占1.75%,见表3。通过绘制成绩分布直方图可以看出,该班期末成绩总体呈正态分布,见图1。教育统计学统计规律表明:学生的智力水平,包括学习能力,实际动手能力等呈正态分布。考试成绩分布应基本服从正态分布,这样才能真实反映学生的实际,也能够说明试卷设计是合理和具有科学依据和实际意义的。[15]本试卷总成绩呈正态分布,说明试卷总体设计合理、可靠、科学。

转贴于

表3 《世界自然地理》期末考试总成绩分布情况

图1 《世界自然地理》期末考试成绩分布图

(2)试卷各大题成绩分布。该试卷共四个大题,因为各题总分不一样,所以把各大题以100分为基准,对分数段进行折合计算,具体各分数段的人数和比例见表4。通过对各大题绘制直方图可以看出,单选题、填图题成绩分布呈偏正态分布,简答题成绩呈偏态分布,但是没有单选题和填图题严重,大体还呈正态分布,这看出就大题而言,单选和填图题设计过于简单,不能很好反应学生的学习能力,但是单选和填图属于识记类知识类型,本来就不好区分学生层次,所以总体看来还是符合实际的;简答和论述题成绩大致呈正态分布,能较好地体现学生学习效果的差异和智力水平,设计很好,见图2。

二是难度、区分度分析。从总成绩看,试卷难度为0.680,试卷区分度为0.402,表明整卷难度适中,区分度好,总体来说试卷质量优良。在各大题中,难度都适中,区分度除了单项选择题为0.29,试题尚可,须进一步改进外,其它三道大题都为优良。结合2007级地理专业的学生为理科生的专业背景,地理基础知识相对薄弱的实际情况,可以看出该试卷的论述题等反映综合能力的试题偏难,但区分度较好,适合考核学生的实际学习水平,有利于提高学生考试的有效性程度,见表5。

三、结论及建议

通过结果分析可以看出,该试卷整体的命题结构好,学生总成绩和大部分大题成绩呈正态分布,试题难度适中,除了选择题之外,其他题型区分度很好。建议以后命题要严格按照教学文件规定的要求,不断完善命题工作,特别是选择题的要加强命题的难度和区分度,同时应该从新课改的理念出发,不断改进命题工作,让考试在教学过程中发挥其应有的积极作用。

1. 试卷构成

整卷共四道大题,26道小题,客观题和主观题的比例为7:13;客观题主要考核学生对世界自然地理的基本概念及基本知识的掌握与理解的程度,而主观题则是考核学生归纳总结、分析、理解和应用知识的能力。本试卷考试内容覆盖面较广,基本涵盖教学大纲要求的大部分教学知识点,符合教学大纲的要求。该试卷试题综合了教学大纲的多个知识点,适当增加了一定的难度和深度。试卷结构记忆类占20%,理解类占40%,简单类占15%,综合应用类占25%;试卷各类题型所占的比例均符合教学要求,难度适中则反映出本课程的基本知识点、重点和难点。

2. 考试成绩分布

由于2007地科班属于理科生,没有高中地理知识的基础,所以本次试卷的命题不但注重学生综合分析能力的提升,同时也关注学生的地理基础知识,因此试题大约有70%是考察学生综合思维能力和分析能力的,涉及知识范围较广,其目的是提高学生对所学课堂内容进行总结提炼及实际应用,也设计有30%左右的基本知识题,如选择和填图题。从总成绩来看,该卷的成绩分布是呈正态分布,反映出绝大多数学生对考查综合能力的试题还是比较适应的,其分值大部分集中在60~80分,见图1;从各大题成绩来看,简答和论述题成绩基本呈正态分布,试卷能很好区分学生层次和体现他们各自的能力水平,能很好达到测验目的,但是单选、填图题的成绩分布呈偏正态,虽然这两大题属于识记型,但是作为试卷设计,还是应该从科学性测验出发,更好体现学生水平为原则,所以在以后的命题中,会更加注重这两部分题目的科学性和实践性。综合以上分析表明,本次考试基本反映出学生对世界自然地理知识学习的实际水平,同时也说明命题者对试题难度等因素掌握得较好。

3. 试题的难度与区分度

难度和区分度都是判断试题质量的重要指标,用于衡量考生能力的程度。通过一次考试将不同程度和不同能力的学生区别开来。难度系数(p)是反映试题难易程度的重要参数,难度系数越小,说明试题难度越大。一般认为试题的难度系数应控制在0.45~0.75之间比较合适。[10]本次试卷的平均难度系数为0.68,四个大题的难度分别为(单选题0.72,简答题0.70,填图题0.71,论述题0.62),不管是从整个试卷来看还是从各大题来看,本套考卷所有类型试题的难度系数在0.62~0.72之间,根据表1(试题难度的评价标准)来看,试题难易程度适中,比较合理,能区分学生能力。

区分度(d)是衡量试题质量的另一重要因素,是评价试题质量、筛选试题的主要指标,d值越大,区分效果越好。一般认为,d≥0.4,区分度极好;0.3≤d≤0.39,区分度良好;d≤0.19,区分度极差;所以试题区分度≥0.20即为可用试题,而区分度≤0.19的试题应该被淘汰。世界自然地理是地理学的一门基础主干课程,有其特殊性,概念多,需要记忆的知识多,尤其记忆各大洲的山脉、河流、湖泊容易记错,各周的地理位置不易描述,而且该级的学生是理科生出生,地理基础知识掌握有待提高,诸多因素使命题者难以把握试卷的难易程度及区分度。在本试卷中,整卷区分度为0.402,各大题中,除了单选题的区分度<0.30(为0.29)外,简答题、填图题和论述题的区分度均>0.40(分别为0.53、0.48和0.52),而且简答题、论述题的区分度非常好(d>0.5)。通过试卷分析表明,本套试题的区分度、易难度良好,其分析结果为命题者今后的命题工作提供了参考依据。但今后对单选题和绘图题的区分度还需要进一步加以改进,判断题应淘汰或注意完善该题型的区分度。

4. 今后命题工作的导向

考试成绩分析总结范文第2篇

[关键词] 助理全科医师;试卷分析;信度;难度系数;区别度

[中图分类号] R-4 [文献标识码] C [文章编号] 1673-9701(2017)02-0125-03

Brief introduction to commonly used indicators of assistant general practitioner's examination paper

ZHANG Donghai1 ZHAO Liuzhuang2 GANG Jun3 XU Deying4 LIU Shuang3 MA Xiuhua2

1.Department of Gastroenterology, Daxing Hospital, Capital Medical University, Beijing 102600, China; 2.Office of Hospital, Daxing Hospital, Capital Medical University, Beijing 102600, China; 3.Department of Science and Education, Daxing Hospital, Capital Medical University, Beijing 102600, China; 4.General Practice and Continuing Education of Capital Medical Unicersity School, Beijing 100069, China

[Abstract] Eight indicators are used in evaluating examination quality, including reliability, validity, difficulty, discrimination testing and average marks, standard deviation, score distribution, grade. Commonly used methods for the above indexes which are suitable for general graduation examination paper analysis would be introduced briefly.

[Key words] Assistant general practitioners; Examination paper analysis; Reliability; Difficulty coefficient; Difference degree

试卷分析是针对大量的成绩数据进行统计、计算、分析,进而得出科学结论的过程。试卷分析属于“教育测量学”的范畴。通过试卷分析可能提炼出诸多对考试质量进行评价的数据,此时试卷就不是单纯地“考试”,而是变(升华)为“试卷分析”。通过试卷分析所得到的比较科学的分析结果,可以进一步展开对教学活动评价,了解教学质量以及学生的学习质量(如对知识的掌握程度)等[1-7]。评价考试质量常用8个指标,包括涉及试卷的信度以及效度、难度、区分度,还包括平均分数以及标准差、分数分布状态、成绩[8-10]。对于上述指标进行分析的方法学较多、有的较为繁杂。我们曾做过相应试卷分析工作[11,12],现结合工作体会将适合结业试卷分析的一般常用方法做一简介。

1 主要涉及试卷质量指标(信度、效度、难度、区分度)的一般分析方法[8,13-14]

1.1 试卷试题难度分析的常用具体方法

难度系数(P)通常是指试卷以及试题的难易程度,可以反映或评价大部分学生对该试题或试卷知识点的掌握程度。难度系数分析应该包括试题难度系数与试卷难度系数两部分,仅进行试卷难度系数分析不易找出具体问题(即总成绩可能掩盖具体得分点)。

1.1.1 试卷总体难度分析的常用方法 试卷整体难度一般以0.6~0.8为宜。方法1:难度系数(P)=试卷的平均得分÷该试卷的满分值。如:试卷平均分为75分,该试卷满分为100分,则P=0.75。该方法较为粗糙,故较少采用。方法2:试卷难度系数(P)=(考试成绩前27%学生的得分之和+考试成绩后27%学生的得分之和)/两组总人数满分之和(考试成绩前27%学生指考试成绩排名在前27%的学生,将这些学生的成绩相加即为得分之和;考试成绩排名在后27%的学员以此类推)。

1.1.2 试题难度系数(P)常用计算公式 方法1:难度系数=试题的平均得分÷该题的满分值。方法2:难度系数=该题的总得分÷该题的满分值。满分值是指:参加考试人数×该题卷面的分值。如果所有试题均采用1分制(即:满分100分,试题100道,每道1分;不采用扣分制),则该题得满分值就是参考人数。所得结果也是该题的答题正确率。此时用方法2就较为方便。

1.2 区别度分析的具体方法学

区别度(D)是指能够区分考试(测验)成绩好的学生和考试(测验)成绩差的学生的指标,一般通过计算高分数段和低分数段学生的难度系数而得出。要同时分析试题区别度数与试卷区别度,单独分析试卷区别度易于掩盖试题的区别指数,误导选用试题。区别度越高,区分能力越强。但是,在结业考试中允许D=0的试题出现。一般以

1.3 试卷信度分析的具体方法学

试卷信度(α)评价该试卷检测结果的可靠程度、可重复性的指标,即为评价被测者在测试中的实际测量值与真实能力是否一致性的指标。最好的试卷信度应该在0.9以上,若低于0.7以下则不甚可靠。计算方法如下。

1.3.1 克朗巴赫公式[Cronbach系数(α)] (α)= 试题数/试题数-1×[(所有被测者第i题的方差-所有被测者总分的方差)/所有被测者第i题的方差]。该方法适用于非选择题以及多值计分题(即:试卷试题的类型较多、各题分值不同,如包括多选题、是非题、问答题等)。计算过程较为复杂,需要每道试题计算后得出结果,该方法应用较多。

1.3.2 库德-理查逊信度(简化)公式 适合用于每题1分的选择题(即试题计分为1分或0分的试题)。信度系数=[n(s-1)2-X(n-X)]/[(n-1)s2](计算较为简单)。(n为卷面满分成绩,X为平均总分,s为标准差)[11]。该方法最大的好处是不需要逐题计算通过率。

1.3.3 库德-理查逊信度(简化)公式的进一步简化 计算较为简单。此公式适用于所有试题为每题1分选择题的试卷。信度系数=[K/(K-1)]{1-[X(K-X)/Ks2]}。K为测题的数目,X为平均总分,s为标准差)[5]。

1.3.4 相关系数(R)计算[10] 该方法计算较为复杂。具体公式可以参考相关文献。

1.4 试卷效度分析

效度用于评判测量的正确性、有效性(反映测量到的与所要测量的二者之间的符合程度)[5,6,8,14-15]。如果将测验总分看作是内部效标,则该测题的区分度也就是该测题的效度(即内部效标的效度)[5,6,8,14]。所以,如果仅分析试卷本身只要有区别度即可。因此,在多数的研究中没有计算“效度”[1,3,7,11]。其他获得效度的方法如下。

1.4.1 相关系数(R)计算 基本方法是通过计算两门性质相近学科、或同一学科前后两次考试成绩的相关系数(R)来评价此次考试成绩的有效性。

1.4.2 百分一致法 按考试成绩将学生分为高、中、低3组,用各个试题中高、低分组之差除以相应的满分,即可得出此题的效度值。这实际上雷同于“区分度计算”方式,仅适应于本试卷的检测[16]。

1.5 试题难度系数(P)与区别度(D)之间的关系

P值越大则说明试题难度越小(内容为多数学生掌握),P值越小说明试题难度越大(多数学生未掌握),此两种情况试卷或试题的区别度均较差;要有较好的区别度,试题难度应适中。

较易试题的难度系数≥0.7;0.4

2 主要体现学生成绩的分析指标(成绩、平均分数、标准差、分布状态)[5,6,10,13,14]

2.1 成绩

即考生试卷的总得分。这是基本原始数据,是所有数据分析的基础数据,必须仔细输入。

2.2 平均分数

是最直观的集中量数。一般认为平均分数的最佳数值为75(百分制)。

2.3 标准差(s)

例如,甲班与乙班的考试平均分数相近但分数分布差异明显,则不能说两个班级的成绩相近。此时不仅要考虑到平均分数,还要计算分数的离散程度(简单可以理解为“分数分布情况”,学术名称――差异量数)。常用的差异量数有多种,经常采用的差异量数是标准差。计算公式可以在统计学教材查找到。计算标准差,理论上讲学生人数越多越好。一般认为:标准差≤10即能符合要求。标准差过大说明全班分数差异过大,需要教师予以注意;但过小则信度下降,区别度下降,标准差也可用于信度计算。

2.4 分布状态

简单理解就是看整个班级(年级)学生的成绩分布情况。一般要求是正态分布,结业考试可以允许一定的正偏态分布,但绝不能完全一边倒。一般习惯是利用成绩分布曲线分析学生的考试成绩(纵坐标为学生人数,横坐标为分数),可以直观的下结论(定性分析);如果要进行定量分析,则需进一步计算偏态量数及峰态量数[10]。

试卷分析的方法学较多,本文仅介绍较为简单、易于掌握的部分。利用试卷分析结果,可以评价教学效果,但其评价的基础是要有高质量的“试卷”(难易程度适当、知识点掌握的较好),这同样涉及教与学两方面的努力。试卷分析仅仅是手段而已,也可称为是教育测量的工具。在进行试卷分析的准备过程中,首先要编制适合测试对象的“试卷”:编制试卷则要根据测验目的进行,最基本的是要依据测验功能决定是进行能力倾向测验(学生的潜在能力如何?)是学业成绩测验(考察学生经过教育教学过程后学业成绩的掌握情况,也称“考试”)。进一步,则要根据培养目标进行分数解释,如果是“目标参照性测验”则其及格就是最基本的教学要求水平参照点,分数愈高说明达标的完满程度愈高;如果是“常模参照性测验”,即测验目的是鉴别性测验(优选,如高考),则测验的难度就要适当增加以利于选拔。结业测验一般是“目标参照性测验”,本文介绍的简便方法学适用于“目标参照性测验”。

研究结业考核标准与模式是不断探讨的课题[17],结业试卷分析不仅可以评价本次考核内容的学生掌握情况、教师教学效果,同时也可以评价不同教学单位在教授同一课程时其间教学效果的差异性[18]。“3+2”助理全科医师培训[19-21]是一项新的工作,我们在其中的《临床综合课程》教学实践、教学管理中,纳入试卷分析体系作为评价整体教学水平、发现不同教学单位教学差异点的手段之一[8,9],取得了较好的效果,不仅了解了教学效果,同时也为提出新的教学思路提供启发点,为集体备课提供了具体依据。因此,掌握试卷分析方法学,既是教师的基本功(特别是高校教师),也是教学管理部门应该熟悉的管理内容与管理技术。

[参考文献]

[1] 张正祥,刘国庆,王廷慧,等. 延安大学医学院药理学试卷分析[J]. 中华医学教育杂志,2008,28(4):120-122.

[2] 孙敏,王锦帆,祖勤,等. 医学生学习中期评估测试实效分析[J]. 中华医学教育杂志,2013,33(4):617-620.

[3] 卢燕,王培玉,刘宝花. 北京大学医学部八年制疾病预防医学期末考试试卷分析[J]. 中华医学教育杂志,2013, 33(5):791-793.

[4] 和永祥,王渊,徐俊丽,等. 内科学考试试卷分析与评价[J].西北医学教育,2006,14(3):304-305.

[5] 王孝玲,教育测量(高等师范院校教材)(第2版)[M]. 上海:华东师范大学出版社,2005:1-188.

[6] 黄颖,林端宜. 试卷分析研究现状综述[J]. 西北医学教育,2005,13(1):39-40.

[7] 宋青,蔡景一. 试卷考核质量评价[J]. 中国高等医学教育,2006,(11):30-31.

[8] 高卫红,任俊峰. 利用教育统计学原理进行考试质量分析方法初探[J]. 武警医学院学报,2004,13(3):214-218.

[9] 田考聪,彭斌. 试卷质量定量分析系统中的几个参数及其应用[J]. 医学教育探索,2004,3(4):52-54.

[10] 张玲玲,梅忠义. 对学生成绩评价指标体系中一些问题的思考,合肥工业大学学报(社会科学版),2006,20(2):19-21.

[11] 马秀华,张东海,黄东明,等. “3+2”助理全科医师培训《临床综合课程》结业试卷评价及相关因素分析[J]. 中国医学教育技术,2015,29(2):213-217.

[12] 马秀华,张东海,徐德颖,等. “3+2”助理全科医师培训中《临床综合课程》结业试卷分析评价[J]. 中华医学教育探索杂志,2016,15(5):445-450.

[13] 彭斌. 试卷质量定量分析系统中的几个参数及其应用[J].中华医学教育探索,2004,3(4):52-54.

[14] 刘新平,刘存侠. 教育统计与测评导论(第1版)[M]. 北京:科学出版社,2003:133-156.

[15] 史宏灿,龚卫娟,郑英,等. 以国家执业医师资格考试为参照的临床医学教学改革思考[J]. 中华医学教育探索杂志,2016,15(5):459-464.

[16] 陈欣,戴社教,赵暹,等. 不同类型试题对医学影像学考试评价的效能分析[J]. 中华医学教育探索杂志,2016, 15(5):455-458.

[17] 赵丽莉,李崭,黄艳. “3+2”培训项目结业考核标准与模式的研究[J]. 继续医学教育,2015,29(11):4-5.

[18] 张东海,马秀华,赵留庄,等. 通过临床综合课程结业试卷分析不同教学单位教学效果的差异[J]. 卫生职业教育,2016,34(12):101-103.

[19] 黄艳,线福华,赵丽莉,等. “3+2”助理全科医师培养模式的探索与实践[J]. 中华医学教育杂志,2014,34(2):31-33.

[20] 张东海,马秀华,黄东明,等. “3+2”助理全科医师培训首轮课程施后的思考[J]. 中华医学教育探索杂志,2015,14(8):837-840.

考试成绩分析总结范文第3篇

一旦考试后,成绩出来了,也就有了两极分化,当然成绩好了,学生会很高兴,家长和教师都会表扬的;而成绩差的学生就会感觉到来自教师和家长的压力,有时候这压力是无形的。我就接触过一个学生,他考试成绩差了,自己已经感到很内疚了。虽然家长鼓励他,教师也没说什么,但他总觉得有压力。其实,对于学生来说,一套试卷上总有一两道难题可能不会做;也有自己觉得会的知识点做错的;也有可能是学生没有发挥好,没有做好,成绩就下降了。因此,教师要客观地看待学生的考试成绩,重要的是通过评析试卷来发现自己教学中的问题,不断提高教学效率。对于成绩突出的学生,教师应给予鼓励和表扬,进而对其提出更高的目标要求,充分发挥他们的数学学习潜能,促使其在数学的广阔天地间自由地翱翔;对于成绩差的学生,通过试卷分析,找出失分的原因,进行数学解题思想的培养,挖掘他们的学习潜力,提高他们学习数学的积极性和主动性。

二、试卷评析的过程与学生掌握知识之间的关系

不论怎样的考试,学生在考试结束后,都有一种对考试结果的期待。这时的学生积极等待答案,对试卷中不确定的答案有一种期盼。在这样的状态下,如果教师能及时抓住时机进行讲评,学生的印象会很深刻,掌握知识也更牢固。

(一)考试后及时批阅试卷很多学校都很重视考试后的试卷批阅工作,总是在考试结束后及时组织教师进行试卷批阅。试卷评析是一项细致的工作,教师需要把试卷上学生出现的问题详细地进行分类归纳,哪些知识点是易错的,哪些知识点是学生没有掌握的。教师一定要做好试卷的分类统计工作,为后面的讲评服务。要严格杜绝一些教师认为试卷讲评就是对答案的做法,这样的讲评是对学生不负责任,对学生的成绩提高没有好处。

(二)教师要重视讲评过程,把握讲评策略平时的考试是对学生一个阶段的学习的总结,教师在讲评试卷时,应讲究策略,重视讲评的过程。特别是对于一些典型的题目,教师要在试卷分析时就做足功课。我总是在讲评试卷前,把学生在典型题目的第几步出现的错误都非常详细地记录下来,是学生没有记住公式,还是不会做,或者是粗心大意做错了,把这些问题一一罗列出来,在讲评时对共性的问题重点指出来,对于个性问题课下再单独指出来,通过讲评试卷,提高学生综合运用知识的能力。教师还要给学生讲解应试的技巧,寻找解题的规律,通过不断练习来提高学生的解题速度,全面提高学生的学习能力。在试卷中出现了错误,说明学生对某个知识点掌握得不足,教师在评析试卷时要找出学生在数学知识上存在的不足,同时帮助学生分析在解题方法和解题思路上存在的缺陷,尤其需要注意的是易错题,或者是同一个知识点多次出现错误,通过对试卷的讲解,要让学生查漏补缺,巩固知识。一次考试就是一次总结,总结就会有反思,有反思就会有提高,这样形成良性循环,使学生的综合能力得到提高。

三、教师要客观对待学生的成绩

考试成绩分析总结范文第4篇

[关键词]SPSS;期末考试成绩;统计分析

1 引言

统计分析软件――SPSS(Statistical Package for the Social sci,ence)的中文译名为社会科学统计软件包,它是世界著名的、优秀的统计分析软件之一。SPSS是一个具有综合性的专业统计分析和数据管理系统。SPSS数据管理和分析功能强大,界面友好,操作简单,有灵活的变量变换和文件交换系统,多种统计图表的结果输出,并具有与Microsoft Office软件兼容等特点,在社会学、医学、心理学、人文学、生物学、教育学等领域已取得了深入的应用。它操作简便、好学易懂、简单实用,是学术界经常使用的计量软件。SPSS的主要功能为:回归及相关分析、聚类与判别分析、主成分分析及因子分析等十几个大类。下文将以某班学生的期末考试成绩为样本,简单分析了一下SPSS在学术研究中的具体应用案例。

2 数据来源和数据录入

笔者通过运用统计分析软件SPSS,对某班30名同学的一次期末考试成绩进行了统计分析,各项成绩包括大学体育、程序设计语言、成绩设计语言SJ、思想和中国特色社会主义理论体系概论、大学英语、档案学概论、信息系统管理和总分8项,统计数据如表1所示。将存在于excel中的表1,通过“文件”“打开”“数据”“文件类型”选择excel一选中表某班同学期末考试成绩所在的excel文件一点击“打开”,便可将excel中的数据导入SPSS。

3 数据分析

3.1 描述性分析

3.1.1 频数

在数据视图中进行以下操作:点击菜单栏中的“分析”“描述统计”“频率”将7门课程及总分项添加到变量中,选中“图表”中的“直方图”并勾选“带正态曲线”后点击“继续”,勾选“显示频率表格”项,点击“确定”共出现8个直方图,图1是其中一个。由图1可分析,大学体育成绩的均值为89.03分,取得89-91分的同学占8人,得分在80分以下的2位同学需加强此方面的锻炼。大学体育成绩呈正态分布,标准差为5.411,反映出此体育教师的评分较合理。

3.1.2 平均数与标准差

在数据视图中进行以下操作:点击菜单栏中的“分析”“描述统计”“描述”在“描述性”对话框中添加7门课程和总分项到“变量”,勾选“将标准化得分另存为变量”,点击选项中的“均值”、“标准差”、“最大值”、“最小值”后点击“继续”,单击“确定”所得结果如表2:

由表1可知,大学英语中的极小值为55分,存在挂课现象,该同学必须重修,来年选课时应及时通知该同学重修。程序设计语言和大学英语的均值达不到70分,英语和计算机是当代大学生必备的两个技能,我班需实施一些措施来提高同学们的英语和计算机水平。程序设计语言的标准差高达10.189分,极大值94分,同学们可以向计算机水平高的2009409035等同学请教。

3.1.3 分组求平均值

分组求平均值是对数据分组描述,可以输出分组数据的均值、标准差、极值等,即对数据进行多层分类汇总。点击菜单栏中的“分析”“比较均值”“均值”在“均值”对话框中,将“总分”添加到“因变量列表”、“大学体育”添加到“自变量列表”,点击确定。结果为表2:

随着体育成绩的逐步提高,总成绩均值出现了高低起伏不定的趋势,这说明体育成绩和总分之间没有必然的联系。加强体质锻炼不会影响自己的学习成绩,因此多运动不应成为成绩不佳的借口。作为当今社会的一名大学生,只是学习好是不行的。学习固然重要,但大学作为与社会接触的桥梁,素质拓展活动也不可缺少。同学们应努力提升自己的综合素质,力图使自己成为一名四有新人,德智体美各方面全部发展。

3.1.4 数据探测

点击菜单栏中的“分析”“描述统计”“探索”在弹出的“探索”对话框中,将“总分”添加到“因变量列表”、“档案学概论”和“信息系统管理”添加到“因子列表”,选择“绘制”中的“茎叶图”后单击“继续”,选择“输出”中的“图”,最后点击“确定”生成如图2所示的两张箱线图:

图2中的两幅图呈现出同一个趋势,即数据点分布在左下角和右上角的对角线附近。也就是说,无论是档案学概论的成绩还是信息系统管理的成绩,都与总分是正相关的关系。换句话讲,一般情况下,专业课成绩高的同学,总分也就越高。由此可见专业课的重要性,在日常的学习中,同学们应把专业课放在首要位置。

3.2 聚类分析

聚类分析是根据一批样本的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品(或指标)聚合为一类。类聚分析是研究“物以类聚”的一种方法。

现将全班30人按总分分为三类,以直观、简明的方式统计每个同学在学习成绩上所处的位置,具体操作步骤如下:点击菜单栏中的“分析”“分类”“系统聚类”一在弹出的对话框中,将“总分”添加到“变量”、“学号”添加到“标注个案”,分群为“个案”,输出勾选“图”,在“绘制”中勾选“树状图”,然后继续一单击“确定,最后生成树状图。

3.3 多维尺度分析

多维尺度分析技术是一种探索性数据分析技术,可以将含有多个变量的大型数据压缩到一个低维空间,形成一个直观的空间图形,以空间中的点表示变量之间的潜在规律性联系。

通过SPSS统计软件“度量”功能中的“多维尺度”分析功能。可以分析七门课程之间的潜在规律性联系,具体操作步骤如下:“分析”“度量”“多维尺度”在“多维尺度”对话框中,将七门课程添加到“变量”,数据为距离数据选择“正对称”,“模型”中度量水平为“序数”、条件性为“矩阵”、维数均为“2”,选项中的输出选择“组图”点击“确定”,生成图3。通过图3可以看出七门课程之间的潜在性规律,如程序设计语言和大学英语被划分在第二象限,其中的潜在性规律可能有很多,比如均分都比较低等。通过此图也可以验证上文的一些结论。

3.4 相关分析

相关分析是研究一个变量与另一个变量间的相互关系。研究变量间相互关系的性质和紧密程度。换句话讲,相关分析的任务是对相关关系给予定量的描述。

4 结语

成绩分析是教育系统的有机组成部分,对考试成绩的分析测量和评价应当是每个教师和同学必备的能力。SPSS在考试数据统计分析中应用广泛,本文结合具体数据,从描述性分析、聚类分析、多维尺度分析和相关分析四个方面介绍了使用SPSS进行统计分析的一般方法和步骤,并提出一些实际存在的问题和建议。通过分析该班同学的期末考试成绩,笔者更加深入地了解了同学们的学习现状,相信此次统计分析结果会为该班提供很好的借鉴,同时也希望能为年轻的科研人员提供一种研究思路。

参考文献

[1]杨晓秋,图书馆读者满意度调查问卷的SPSS设计[J],农业图书情报学刊,2 008(20):171-174

[2]杨晓明,SPSS在教育统计中的应用[M],北京:高等教育出版社,2004

[3]赵守盈,吕红云,多维尺度分析技术的特点及几个基础问题[J],评价与测量,2010(4):13-19

[4]曹玲,杨静,夏严,国内竞争情报领域研究论文的共词聚类分析[J],情报科学,2011(28):923-930

[5]李延波,房红芳,SPSS统计软件在大学英语考试成绩分析中的应用[J],考试研究,2011(20):1-3

[6]崔永红,李学民,运用SPSS对专业基础课与专业课成绩分析[J],科教研究,2011(14):34-36

[7]潘小燕,统计分析软件在大学英语教学测试效果评估中的英语[J],科教文汇,2011(3):112-113

考试成绩分析总结范文第5篇

关键词:SPSS;统计;难度;区分度;信度;效度

中图分类号:G642文献标识码:A文章编号:1009-3044(2017)17-0121-03

试卷作为考试的一个重要载体,是测评学生学习成绩的工具,是教学质量检验的重要手段,因而教学质量评估管理中越来越重视试卷分析,试卷质量的分析结果客观地向教与学双方提供了反馈信息,进而实现评价教育目的的实现、教学效果的好坏等一系列质量要素,今后,应该成为教学工作中重要的常规环节之一。

1SPSS软件简介

SPSS软件是StatisticalPackagefortheSocialsciences英文名称的首字母缩写,即“社会科学统计软件包”,它是目前世界上常用的三大统计分析软件(SAS、SPSS及SYSTAT)之一,是世界上最早采用图形菜单驱动界面的统计软件,其界面友好、功能强大和操作简便,能方便地从其他数据库中读入数据。

SPSS是一款功能强大的教育统计软件,既可以进行基本数据的统计分析,还可以进行各种推断和检验统计。

2试卷质量分析应用实例

下面数据以安徽大学公共基础课程—《程序设计基础VB》的期末考试成绩为样本,利用SPSS软件分析说明考试质量分析的模式和各项指标。

2.1试卷基本结构

本试卷(满分100分),由两部分组成:客观性试题与主观性试题,其中客观性试题共A分,占X%,主观性试题共B分,占Y%。具体情况见表1。

填写试卷基本结构可以发现,题量尚可,试卷题型不够丰富,填空题可以细化为一般填空和程序计算填空,客观性试题一般强调知识点考察,常见类型为:单项选择题、多项选择题、判断题和简单填空题,而主观性试题则根据学科的不同,一般设有复杂填空题、简答题、问答题、论述题和计算题等题型。

2.2考试分析指标的定量分析

2.2.1成绩数据的录入与处理

1)定义变量并输入数据

这是直接方法。启动SPSS软件后会启动Statistics数据编辑器界面,通过單击VariableView标签进人变量名编辑窗口,在Name(名称)下注明学号、姓名、各题型、总分、平时成绩和班级代码。其中,各题型、总分、平时成绩和班级代码均设置为:Numeric(数值)类型,Decimals(小数点长度)定义为0,其余各项使用默认。

第二步,选择数据视图,开始输入数据:从第一行第一列起直接输入相关数据,这样,每行输入一个学生的记录,各列输入数据为一个某种题型的成绩,最后一列是班级代码等。

最后保存扩展名为sav格式的数据文件。

2)直接导人外部数据,更改数据类型

为了更好地对数据进行共享,SPSS还可以快速打开和编辑其他格式的文件,可直接导入操作的数据文件包括:MicrosoftExcel文件(*.xls)、SAS、dBase、Stata等格式。

具体的操作步骤为:依次单击FileOpenData,此时要在文件类型下拉菜单中选择AllFiles,在出现的全部文件列表中找到关联文件双击,在弹出对话框内选中其中的Read复选框(此项设置为把表格中的第一行作为变量名导人,否则第一行将作为数据导入),单击OK按钮后会打开DataEditor界面,就能显示出刚才导人的Excel文件内容。随后,也可依次单击FileOpenSave(Saveas),将当前数据存为其他格式的文件,比如sav格式,方便下次使用。

本文实例数据先对考试系统自动生成的xls文件格式进行数据导入,然后对变量属性作了适当修改,如图1、2所示。

2.2.2成绩统计的基本描述性分析指标

成绩统计分析的基本描述性指标主要有:学生总数、实考人数、最高分、最低分、各等级的人数分布及百分比、均值与标准差、成绩分布图等,相应的描述性统计量包括最小值(Mini-mllm)、最大值(Maximum)、频数(Frequency)、均值(Mean)、标准差(Std.)、偏度(Skewness)和峰度(Kurtosis)等。这些指标均要求按班级对试卷成绩及总评成绩进行分析。其中,均值用来描述数据集中趋势,标准差强调数据的变异性,即数据的差异量数,进而反映数据全貌。而对称、偏斜及分布陡缓程度等数据分布的结构形态及特征则由频数、偏度和峰度用来描述。

1)卷面成绩的集中和离散数据统计

打开录入后的数据表,依次单击AnalyzeDescriptiveSta-tisticsFrequencies,出现频数对话框,导入要建立频数分布表和直方图的项目,同时选上Minimum、Maximum、Mean、Std.devi-ation、Skewness和Kurtosis等参数,得到表1。

依次单击菜单AnalyzeDescriptiveStatisficsFre-quenciesChartsHisto-gramsWithnormalcurve,显示出分数段分布图和直方图。直方图如图3所示。

一般而言,学生成绩标准差在满分的5%-10%以内属于正常。从图表中得到的统计值可以发现:①本次考试的两个班的离散程度均较大,表明学生成绩离散度太大,可能是试题的问题,也有可能是学生水平的两极分化比较严重;②学生成绩基本呈正态分布;③考生总分偏度值为-0.138和-0.648,依据偏度在数据分析中的意义,本次测试数据显示:考生所得总分相对集中于平均分左侧,即大部分考生成绩小于平均分值;④在峰度的计算中,计算结果σ<0,可知在学生成绩的正态分布图有比正态分布更长的尾部,不过盯为较小负值说明,考生成绩在平均分附近的集中度虽低于标准正态曲线,但也差别不大;⑤标准差1≥10,差异较大。但是结合对总分的直方图的观察,可以发现:低分段考生的成绩与平均分的差距较大,这是造成即使大多数考生的总分集中于平均分附近,最后标准差数值仍较大的主要原因。

2)难度指标分析P

对于课程考试来讲,保持合适难度是保证试卷质量的前提。

观测得出:总试题难度大概在0.6-0.8之间,难度值中等偏低,试题适中,相对较难。

3)区分度指标分析D

区分度(Discrimination)是指测验题目对学业水平不同的学生的区分程度或鉴别能力。区分度作为评价试题质量、筛选试题的主要指标与依据,是测验是否有效的“指示器”。该指标对于选拔性考试如高考,竞赛尤为重要。具有良好区分度的测验,实际水平高的被试应得高分,水平低的被试应得低分。区分度与难度有一定关系。

在工具软件环境下,我们一般求出总分与每个试题得分间的积差相关系数作为试题的区分度,可以采用皮尔逊(Pearson)相关分析来对试题进行分析,步骤为:AnalyzeCorrelateBi-variate,在弹出的BivariateCorrelations对话框中选择各种题型和总分进人Variables,然后在CorrelationCoefficients中点击Spearman,完成后得到了各个题目的区分度。如表5所示:

从表中数据看出,由于三种题型的Sig.(2-tailed):p=0.000<α=0.01,相关系数值达到了0.01显著性水平,表示试题的区分功能显著。

4)信度指标分析

信度(Reliabilitv)用来反映考生稳定水平可靠性,即测验能否真实反映学生水平程度的数量化指标,是测验的必要条件。常用的有重测信度、复本信度、同质性信度、荷伊特信度和评分者信度等。

因为影响测验水平的因素有很多,导致信度的计算方法也不同,实际使用何种信度要依据考试目的和性质而定,从而选择其中一种或几种。

由于高等教育测验中绝大多数混合了客观题和主观题,所以SPSS软件中一般采用克隆巴赫(Cronbach)α系数计算信度,取值0.5左右即可达标。这种计算方法是由Cronbach于1951年提出的,不要求測验题目必须是记分型也能计算任何测验的内部一致性系数。

在工具软件环境下,依次运行:AnalysisScaleReli-abilityAnalysis,出现对话框,从中选择所有题型和总分,在Items框的Model项目中单击选择Alpha模型,并选中Scaleifitemdeleted复选框,计算出该试卷的信度系数Alpha=0.757。如表6所示:

通常Cronbach仅系数的值在0和l之间。如果Alpha系数不超过0.6,一般认为内部一致信度不足;达到0.7-0.8时表示量表具有相当的信度,达0.8-0.9时说明量表信度非常好。对上机测试来说,信度Alpha=0.757相对信度较高;一般来说,增加试题的数量;保持所有试题的难度接近正态分布;努力提高试题的区分度;严格监考和按评分标准给分均可以提高信度。

5)效度分析

效度(Validity)是指试卷准确地测量了考试目的的欲测内容的多少,多大程度上效检了所要测定的功能或达到其测量目的。

具体地讲,就是覆盖面和权重在教学大纲范围内的完成情况,体现考试能力水平和反映教学大纲完成的情况有效程度。

公认的效度分类方法是将效度分为内容效度、结构效度、构想效度和效标关联效度。确定使用何种效度要根据测验目的而定。常用的效度检验方法是:效标关联效度法,这种方法首先是寻求一种可靠的效标,然后求出测试结果与效标的相关系数,该相关系数则为效标关联效度。

在工具软件环境下,依次单击:AnalyzeCorrelateBi-variate,选择总分和平时成绩字段,随后在相关系数(Correla-tionCoefficients)中选择Pearson,计算数据如表7所示。

2.3试卷质量控制的定性综合分析

1)结合统计数据,进行定性评价

对试卷质量分析时的定性评价应有如下几个方面内容:一是题量和题型;二是试卷语言的表述是否明确和准确(如参考答案是否正确,试卷内容是否有重复或是对后继题目有提示等,专有名词表述是否准确,选择答案设计是否均衡、排列是否科学,);三是试卷内容的难易度;四是试卷的内容效度—覆盖面问题;五是教学重点的突出程度。

2)结合教学实践,进行教学反思

建立一个长久稳定的指标体系。通过长期分析这些指标,可以更好地客观地指导我们的教学改革。

检验课程设置的合理性。这些可以通过多因素变量的综合横向和纵向比较。比如同一课程不同专业的学生的成绩是否有差异,进而分专业更合理地优化我们的课程安排。再比如通过长期比较同一课程不同授课教师的成绩数据,可以分析出教师之间的差异,进而去了解他们授课方法的不同之处,取长补短,促进教师的经验交流和快速成长。