首页 > 文章中心 > 考试考差总结

考试考差总结

考试考差总结

考试考差总结范文第1篇

关键词 作答时长 难度 高考 理科综合 生物

中图分类号 G633.91 文献标识码 B

1 引言

高考作为选拔性考试,其试题难度是考生、家长、学校和教育主管部门都非常关注的问题,也是命题人员关注的焦点问题之一。“难度”是考试中使用最为广泛的教育测量概念,是试题分析的重要指标之一,其含义指考生或被试者完成试题或任务时的困难程度。定量刻画试题难度的量数,称为难度系数或难度值,经典测量理论框架下在数值上等于代表性考生群体在试题上的通过率。

难度主要受考生对试题内容的熟悉程度、考查行为目标的层次、情景材料的信息量、试题的形式和时间等多方面因素的影响。时间在此指给定考试时长或考生作答时长。一般情况下,在给定考试时长内,试题包含的信息量和考生思维量将对考生的作答表现产生影响;反之,在试题包含的信息量和考生思维量一定的情况下,作答时长也会对考生作答表现产生影响。此外,给定时长与考生自主分配的作答时长并不总是一致。同一试题可能由于分配时间的不同,导致通过率发生变化。在理想状态下,试题包含的信息量和考生思维量应与给定考试时长相匹配,现实考试情境下的给定时长是否恰当亟待研究,考生作答时长的分配对其作答表现的影响也值得深入探讨。

高考(北京卷)理科综合能力测试(以下简称理综)总分为300分,考试时长为150 min,试卷包括物理、化学、生物三科试题,其中物理占120分,化学占100分,生物占80分。考试时长为三科共用,考生可以自由分配150 min的时间。150 min在三个科目间的分配应与科目总分值成正比,即物理60 min、化学50 min、生物40 min。考生按照上述分配作答时长是否恰当,适当延长或缩短某一学科的作答时长对其表现有何影响。本研究以生物学科为例,研究作答时长对考生作答表现的影响。

2 研究方法

2.1 测试对象

测试对象为已学完全部高中生物课程的高三理科学生,共452人。样本选自北京地区的两所中学,X校学生平均成绩好于全市平均成绩,279人;Y校学生平均成绩与全市平均成绩相当,173人。

2.2 测试方法

2.2.1 测试材料

以2011年高考(北京卷)理综生物全部试题作为测试卷,满分80分,其中客观题共30分,包含5道选择题,每题6分;主观题50分,包含3道非选择题,分值分别为18分、16分和16分。

2.2.2 实验设计

本研究为3×2两因素准实验设计,因素一为作答时长,三个水平:基本时长、不足时长和充足时长。因素二为学校,两个水平:学校X和学校Y。

2.2.3 预试

为确定标准作答时长,在Y校(成绩相当于全市平均水平)选取一个普通班(40名学生)进行预试,记录从答题开始到90%考生正常完成全部试题所用时长。测得标准作答时长为40 min。

2.2.4 正式测试

按班级期末生物平均成绩,将两所学校的考生分为A、B、C三组,三组考生的总体水平大致相当。A组:要求该组考生在基本作答时长条件下,即40分钟内作答试卷。B组:要求该组考生在70%的基本时长,即28分钟内作答试卷,时间结束立刻回收答题卡,即B组在不足作答时长下完成测试。测试C组:要求该组考生作答试卷至90%考生正常答完,考试结束,回收全部答题卡并记录时间,即C组考生在充足作答时长下完成测试。

2.2.5 阅卷

对所有测试组进行统一阅卷。阅卷前对所有阅卷员进行正式培训,统一阅卷标准,阅卷结束后得到考生各题得分。

2.3 数据分析

用SPSS 19.0软件对测试数据进行描述性统计分析和多因素方差分析。

3 研究结果与分析

3.1 答题用时

在测试中测得X校C组作答用时约48分钟,Y校C组作答用时为50分钟,此即为考生回答试题所需要的充足作答时长。在高考中,按照分值比例,考生在生物试题上分配的作答时长应为40分钟,试卷的思维量应与40分钟的时长相匹配。但出于保密的需要,高考试题在考前无法进行预试,试卷的思维量是由命题者估算出的。本研究经测试得到的标准作答时长约为40分钟,这在一定程度上说明,2011年高考(北京卷)理综生物试题总思维量与等分值比例的作答时长是基本匹配的。

3.2 全卷得分结果与分析

各组考生全卷得分情况详见表1。由表1可知,两所学校测试B组(不足时长)的得分在三组间均为最低,测试C组(充足时长)的得分均为最高。以全卷总分为因变量,组别和学校为自变量进行统计分析,结果表明,组别的主效应是显著的(F(2,446)=5.807,p=0.003),学校的主效应也是显著的(F(1,446)=51.462,p=0.000)。组别和学校的交互作用不显著(p=0.718),即不同学校间,不同时长条件下差异趋势是一致的,差异趋势详见图1。

因为本研究主要探讨时长的效应,也因为组别和学校的交互作用不显著,为了简化结果的解释,故在进一步的分析中只保留组别变量进行单因素方差分析,结果表明组别的效应显著(F(2,449)=4.894,p=0.008),即在不同作答时长条件下,考生全卷总得分差异显著。对三组数据做进一步的对比分析,以A组为参照组,进行有计划的比较。结果显示,A组和B组差异显著(t=1.967,df=449,p=0.050);A组和C组差异不显著(p=0.425)。这说明,当考生作答时长由不足时长变为基本时长时,全卷得分有显著提高,但由基本时长变为充足时长时,全卷得分无显著提高。这进一步说明,2011年高考(北京卷)理综生物试题总思维量与40分钟的作答时长是较为匹配的。

3.3 客观题得分结果与分析

以客观题得分为因变量,组别为自变量进行方差分析,结果与对全卷得分的分析结果基本一致。以客观题得分为因变量,分析组别的影响,发现组别间差异显著(F(2,449)=4.263,p=0.015),即在不同作答时长条件下,考生客观题得分差异显著。对三组数据做进一步的对比分析,以A组为参照组,进行有计划的比较,结果显示,A组和B组差异显著(t=2.008,df=449,p=0.045),A组和C组差异不显著(p=0.185)。说明,当考生作答时长由不足时长变为基本时长时,客观题得分有显著提高,但由基本时长变为充足时长时,客观题得分无显著提高。

3.4 主观题得分结果与分析

以主观题得分为因变量,组别和学校为自变量进行方差分析,结果与对全卷得分的分析结果基本一致。以主观题得分为因变量,分析组别的影响,发现组别的效应显著(F(2,449)=3.124,p=0.045)。以组别A为对照组,进行有计划比较,结果与以全卷得分为因变量的结果也完全一致,即A组和B组差异显著(t=1.967,df=449,p=0.050),A组和C组差异不显著(p=0.425)。说明,当考生作答时长由不足时长变为基本时长时,主观题得分有显著提高,但由基本时长变为充足时长时,主观题得分无显著提高。

3.5 主观题各题得分结果与分析

3.5.1 第6题得分结果与分析

以第6题(高考试卷中第29题)得分为因变量,分析组别的影响,发现组别的效应边缘显著(F(2,449)=2.598,p=0.076)。以组别A为对照组,进行有计划的比较,结果发现:A组和B组得分差异显著(t=2.100,df=449,p=0.036),A组和C组得分差异不显著(p=0.891)。说明,当考生作答时长由不足时长变为基本时长时,该题得分有显著提高,但由基本时长变为充足时长时,该题得分无显著提高。

3.5.2 第7题得分结果与分析

以第7题(高考试卷中第30题)得分为因变量,分析组别的影响,发现组别的效应显著(F(2,449)=3.166,p=0.043)。以组别A为对照组,进行有计划的比较,结果发现:A组和B组得分差异显著(t=2.188,df=449,p=0.029),A组和C组得分差异不显著(p=0.659)。说明,当考生作答时长由不足时长变为基本时长时,此题得分有显著提高,但由基本时长变为充足时长时,得分无显著提高。

3.5.3 第8题得分结果与分析

以第8题(高考试卷中第31题)得分为因变量,分析组别的影响,发现组别的效应不显著(p=0.254)。这一结果说明增加或缩短答题时长对该题得分的影响并不显著。

第8题的分析结果与第6、7题的分析结果不同,得到这一结果应与试题的难度有关,第8题难度系数为0.66,属于中等偏易试题,试题相对比较容易,答题思维量与信息量相对较少,考生用于思考的时间相对较短,作答时间对考生得分的影响较小。第7题的难度系数为0.41,属于较难的试题,试题的信息量和答题思维量均相对较大,考生必须仔细阅读试题内容并将文字转换成模型进行思考,在解答试题时,由于本题的解题思维链也相对较长,考生用于思考的时间也较长,所以考生得分受作答时间的影响较大。第6题难度系数为0.60,难度适中,试题思维量和信息量不是很大,所以考生得分受作答时间的影响为边缘显著。

在对本测试的预期中,作答时长对考生表现的影响,除了与试题难度有关外,还应与试题的位置有关。通常情况下,对于试卷中按照有序排列的一系列试题,考生应该按照由前到后的顺序作答。这样,如果在时间有限的条件下,相较于位置靠后的试题,位置靠前的试题分配到的时间应该更为充足,而位置靠后的试题在时间从不足变为适当或充足时,考生表现应该获得明显的增益。本研究的结果并未显示出如上的规律,原因可能有三,本测试共有8道试题,有限的试题数使得这种位置效应并未显示;位置效应的影响要弱于试题难度的影响,考生对较难试题的深入思考导致表现的增益掩盖了试题的位置效应;分配给考生的作答时间,无论是不足、标准还是充分,实际上都满足了考生基本完成试题的时间,也说明试题总的思维量和给定时长是较为匹配的。

在作答时长变长后,考生在较难试题上的表现获得了明显的增益,而不是在位置靠后的试题上。这也提示我们,考生在回答试题的时候是运用了一定的答题策略的。因为该测试卷中试题的难度并不是按照试题顺序单调递增,即位置最靠后的试题并不是最难的。考生能够在接触试题时就鉴别出试题的大致难易程度,并合理的调配时间作答,而不是一直按照试题顺序作答,毫无变通。

4 结论与建议

2011年高考(北京卷)理科综合能力测试生物试题总体思维量的设置较为合理。考生用约40分钟的时长进行答题的得分效果最佳,若缩短作答时长至28分钟,考生得分将明显降低,若延长作答时长至48分钟以上,考生的得分并无明显提高。在高考时,建议考生根据自身情况对答题时间进行合理分配,制定好自己的答题策略,以便更好地发挥出自己应有的水平。

参考文献:

[1] 孙恒,李金波.高考试题难度的预估研究[J].教育理论与实践,2008,10:3-5.

[2] 毛竞飞.高考命题中试题难度预测方法探索[J].教育科学,2008,24(6):22-26.

考试考差总结范文第2篇

关键词 SPSS软件 学业成绩 高职学生

随着我国高等职业教育的发展,为了保证高等职业教育的质量,有必要对高等职业院校的教学工作进行全面评估。其中,学生学业成绩的评价是教学质量评价的一项主要内容。本文结合高职学生学业成绩的评估工作,应用SPSS软件进行分析,得出学生学业成绩总体情况,得到试题的难度、区分度、信度等,还有学业成绩的差异性与相关性,使教师、高职学生得到学生学业成绩的评价反馈,在某种程度上促进教学质量的提高。

1 研究对象与方法

随机选取某高职院校学生100名,其中,男生73名,女生27名。试卷来源GXGZY高职学生电工应用技术考试。数据管理与分析采用SPSS软件。通过软件测量得出学业成绩的一般信息,进一步对试题的效度、信度、难度、区分度等进行分析,对不同班级、性别、民族等的考生成绩进行差异性检验。

2 研究结果

2.1 考试题目的题型结构及分值分布

试题共四大题。第一大题为判断题,共10小题,共20分。第二大题为填空题,共6小题,共30分。第三大题是选择题,共四小题,共12分。第四大题是计算题,共3小题,共38分。

2.2 学业成绩描述统计

学业成绩的基本描述统计量包括极小值、极大值、均值、标准差、偏度和峰度等。均值代表数据的集中趋势。数据的离散程度可用标准差描述,标准差越大说明数据间的差异越大。偏度和峰度用来描述数据分布是否对称,偏斜程度如何,分布陡缓程度等。①

在SPSS中可以进行以下操作:分析描述统计描述总体考试成绩选择到变量框中单击选项选择描述统计量确定。统计结果输出,统计量100,极小值19,极大值97,均值59.98,标准差18.419,偏度-0.005,峰度-0.880。同时可以输出频数分布图,看看成绩分布情况。操作步骤:分析描述统计频率成绩选择到变量框中单击图表选择直方图,带正态曲线继续确定。从偏度、峰度以及频数分布图可得,总体成绩基本符合正态分布,说明这份试卷达到了检测学生学习水平的目的。

2.3 考题的难度

难度是指全体被测对象对该题目的失分率。计算公式:难度系数P=1-(考生在该题目所得分数的平均值/该题目满分值)。样本总体平均值59.98,各大题难度系数分别为:0.24、0.42、0.37、0.48;标准差分别为:2.953、7.319、2.677、10.854。一般认为难度范围应在0.3-0.8之间比较恰当,仅有第一题难度小于0.3,为判断题,题目都比较简单,只要学生掌握基本知识,仔细判断就可以得高分。计算题最难,排在最后合适。选择题难度排第二,应该排第二,让试卷题目的难度成递增趋势较好。从试卷总体来看,总分难度系数为0.4,难度略偏容易。

2.4 考题的区分度

区分度是指考题对考生实际水平的鉴别能力,是把考生区别开来的统计量。在SPSS中可以进行以下操作:分析相关双变量把学生某题成绩与总分选择入变量框中选择相关系数Pearson确定。得到各大题的区分度分别为:0.468、0.811、0.543、0.889。一般来说,难度大的题目,区分度较高;难度低的题目,很多学生做对,区分度必然低。从以上可以看出。

每大题与总分的相关系数较高,在0.01的显著性水平上相关。从上述数据分析可见,试题的区分度比较理想,且主观题的区分度优于客观题,这与主观题灵活的评分方式有关。

3 研究讨论与发现

3.1 考试的效度

效度是指考试的有效程度。把学生的平时成绩作为效度分析的效标,利用积差相关法求效标效度(Pearson法)。在SPSS中可以进行以下操作:分析相关双变量把学生平时成绩与考试总分选择入变量框中选择相关系数Pearson确定。得到本次考试总分与平时成绩的相关系数为0.966。说明平时成绩好的学生这次考试也好,平时成绩差的学生这次考试成绩也差,因此本次考试反映了学生的真实能力,符合要求。这与考题的区分度较高的测量结果一致,表明试题的质量较好。

3.2 考试的信度

信度是衡量一次考试的可靠性、稳定性的统计指标。在SPSS中可以进行以下操作:分析度量可靠性分析把分析量选入框中统计量选择同类相关系数确定。结果本次考试的信度为:0.765。一般来说,学校教师自编试卷的信度要求0.6以上,则本次考试卷子符合要求。这与考题的区分度较高的测量结果一致,表明试题的质量较高。但是信度没有达到0.8,影响信度的因素可能和评分、题量等有关。

从试卷的题型和分值比例可见,客观题分值不到主观题的一半,可能影响试卷的信度。从以上统计结果表明,主观题的区分度比客观题的高,证明高职电工应用技术考试中主观题的命题效果较好。另外,这次题目量较少,不少考生提前交卷,这也是影响信度的原因。再有,题目的知识覆盖面不够宽,这也是影响信度的原因。

3.3 班级差异性

在不很了解两个样本总体分布的情况下,一般用两个独立样本非参数检验,样本数大于30为大样本,用Kolmogorov-Smirnov 检验。用SPSS进行1班、2班学业成绩间均值的差异性检验。基本步骤:分析非参数检验两独立样本总分选择到检验变量列表中班级选择到分组变量框中定义组输入1与2继续选择检验类型确定。分析结果,1班46人,2班54人;K-S Z值为2.022,相伴概率为0.001<%Z=0.05,可以认为应该拒绝零假设H0,认为1班与2班学生的学业成绩均值存在显著差异。另外,在描述统计表明,1班的均值明显比2班高,差异显著,有高度的统计价值。

3.4 文理科学生成绩差异性

用以上方法可得到,高考文科考生与理科考生的差异性。分析结果:理科63人,文科37人;K-S Z值为1.914,相伴概率为0.001<%Z=0.05,认为高考理科与文科学生的学业成绩均值存在显著差异。另外,在描述统计表明,理科的均值明显比文科的高,差异显著,有较高的统计价值。

3.5 汉族与少数民族学生成绩差异性

用Kolmogorov-Smirnov 检验,基本步骤同上。分析结果:汉族60人,少数民族40人;最大绝对值差为0.100,最大正差为0.100,最大负差为-0.092,得到的K-S Z值为0.490,相伴概率为0.970>%Z=0.05,则不能拒绝零假设H0,认为汉族与少数民族学生的学业成绩均值无显著差异。

3.6 男女差异性检验

样本数小于30为小样本,用Mann-Whitney 检验。②分析结果:男生73人,女生27人;Z值为-0.074,相伴概率为0.941>%Z=0.05,则不能拒绝零假设H0,认为男女学生的学业成绩总体分布无显著差异。

4 结束语

4.1 试题方面

试卷的区分度、效度、信度较高,成绩频数基本趋于正态分布。题型多样,客观题与主观题比例基本合理;题量还可以加大一些,特别是加大主观题的量;知识覆盖面还可以加宽一些;今后按照题目的难度逐渐递增排列,以增加试卷的科学性;大多数学生两个小时完成为合适,重点考核学生基础知识、分析问题和解决问题的能力。

4.2 差异性检验

由班级差异性检验,推论1班、2班成绩存在显著性差异。产生原因可能与学习风气、试题难易等有关,还有待进一步研究。由高考文理科学生成绩差异性检验,推论文科生与理科生成绩存在显著性差异,产生原因可能与学生的数理基础有关。由不同民族学生成绩差异性检验无差异性,说明考试成绩与民族无关。由男女学生差异性检验无差异性,说明学生考试成绩与性别无关。

4.3 相关性分析

通过效度分析发现,学生学业成绩与平时成绩正相关。说明平时成绩的好坏直接影响学生的学业成绩。可能学生的学业成绩还与其它因素有关,如学习策略、生源地、家庭情况等,还有待进一步研究。

考试考差总结范文第3篇

内经选读课程是培养中医药专门人才,提高中医药文化素质的重要课程,是中医学专业本科的必修课程,也是最重要的基础课程。学生对《内经选读》这门课程的掌握程度直接关系到中医学人才培养的质量。高等医学院校必修课程的考试是对学生知识的理解和掌握程度重要测评工具,试卷质量和学生的考试成绩是衡量教与学质量的主要手段和方法。通过对内经选读试卷进行质量分析,不仅可以反映学生对这门课程掌握的真实水平,还可以评价试题质量、发现教学中存在的问题,为完善试题库建设、改进教学方式、提高教学水平提供指导。

1资料与方法

1.1一般资料 采用中国中医药出版社出版的全国中医药行业高等教育“十二五”规划教材(第九版),选取我校中医学专业2012级中医3班内经选读期末考试试卷为研究对象。参加考试人数60人,共60份有效试卷,考试采用的是终结性评价。试卷包括5类题型,试卷结构如表1。试题由专业授课教师根据学科培养方案、课程教学大纲命题。试卷的评判依据命题教师制定的标准答案及评分标准,严格按照标准完成阅卷。

1.2统计学方法 利用EXCEL2003将60份试卷按每个学生的学号、姓名、各题的得分及总分情况双份输入,并经仔细核查与修订。然后将表格中数据导入到SPSS19.0软件,在数据视图中定义变量名分别为学号、姓名、单选题、多选题、填空题、默写原文题、论述题、总分,在变量视图中检查数据类型,学号和姓名定义为字符型,长度为8;各题得分和总分定义为数值型,长度为8,小数点后长度为0。然后进行统计描述和统计推断,通过计算难度、区分度和信度进行试卷质量分析。

2结果

2.1成绩基本统计描述 考试成绩的基本统计描述指标选择均值、中值、标准差、偏度、峰度、极大值和极小值等统计量。输出描述统计结果如表2和图1。平均分为72.8,标准差为13.173,标准差值较大,说明学生个体之间存在较大的差异。

2.2正态检验 考试成绩一般要求符合正态分布,若不符合正态分布,说明考试结果不理想,出现低分数段人数太多(正偏态分布〉或高分数段人数太多(负偏态分布)两种情况。从成绩分布的直方图可以初步判断,学生的考试成绩近似服从正态分布,进一步用单样本K-S检验来判断,检验结果显示sig值为0.796,大于0.05,可以认为学生成绩呈正态分布。

2.3难度分析 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数。计算公式为P=1—x/w(P为难度系数,x为某题得分的平均分数均值,w为该题的满分。难度系数P值越小表明试题越容易,难度系数P值越大表明试题越难,最小值为最大值为1。一般认为,试题的难度系数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右。在数据视图中,将表1中各类型试题的满分、总分和表2中各类型试题的均值、总分的均值直接录入,并定义变量名为“满分”和“均值”。然后点击转换-变量计算,在目标变量中输入难度系数P,在数学表达式中输入公式1-均值/满分,计算出各个试题和试卷的难度系数。结果如表3。

由表3可以看出,多选题难度系数最大,为最难题型;默写原文题难度系数最小,为最易题型。整个试卷难度系数为0.27<0.3,说明难度偏小,试题较易。提示应该适当增加试题难度,特别是单选题、默写原文题和论述题。

2.3区分度分析 区分度(D)是指试题对学生实际水平的鉴别能力,是一种区别学生成绩优劣的统计指标,一般与试题的难度系数一起来分析。对试卷进行区分度分析时,常以考试总分作为学生的实际能力水平,学生在某题的得分与总分的相关系数作为该题的区分度。对于客观题来说,一般使用Spearman相关分析;对于主观题来说,一般使用Pearson相关分析。这些分析在中都有相应菜单命令。整个试卷的区分度由各题的区分度求加权算术均数。一般要求试题的区分度在0.3以上。区分度在-1至1之间。D≥0.4时,说明该题目的区分度很好;D≤0.2时,说明该题目的区分性很差。D值为负数时,说明试题或答案有问题。本次考试的区分度结果如表4。

由表4可以看出,本试卷各题型的区分度较高,整个试卷的区分度为0.636,能区分出学生之间的实际水平差异。结合前面的难度系数分析,提示成绩较低的学生要加强学习的自觉性。

2.5信度分析 信度是指测验结果的一致性、稳定性及可靠性。试卷的信度分析可以反映试卷测试结果是否代表学生的真实水平。信度系数取值范围为0-1,其值越大,信度越高,表示该测验的结果愈一致、稳定与可靠。试卷信度分析可以采用SPSS中的可靠性分析,选用ɑ模型。本次考试的试卷信度为0.734,说明试卷的信度较高,较真实的反映了该班学生的学习状况和实际水平。

3结论与建议

考试考差总结范文第4篇

(海军大连舰艇学院 基础部, 辽宁 大连 116018)

摘 要:针对目前公共计算机课程成绩考核与评价方法中存在的弊端,把公共计算机课程成绩评价与标准分制度有机结合,应用数理统计学理论与方法,深入探讨计算标准分时应该考虑的各种因素及具体实施措施,提出适合公共计算机课程的标准化成绩评价算法,对学生学习过程进行监控,尽量客观地反映学生的真实学习效果,形成客观公平的考核评价模式。

关键词 :平时成绩;标准分;评价方法;算法

第一作者简介:徐东,男,讲师,研究方向为模式识别与人工智能、计算机教育,xudong_1992@163.com。

0 引 言

在新的历史条件下,为了适应经济社会发展,高等院校必须全面实施素质教育,深化教育领域综合改革,以便进一步提高教育质量和毕业生素质。在教育改革中,要大力加强对学生学习过程的监控与考核,这对学生的综合素质和创新能力培养可以产生积极作用。

高校的公共计算机课程属于多专业、多班次、分散师资的通识基础教育,现行成绩评价方法与新的人才培养需求不相适应,存在诸多不利因素。如何既能对学生的学习过程实施有效监控,又能统一标准,实现对学生成绩客观、公平、公正、公开的评价,是目前急需解决的关键问题。

1 课程成绩评价策略现状分析

现代教育评价强调定性与定量的结合。目前,世界通用的两种考核评分制度一是原始分制度,二是标准分制度。标准分制度是世界公认的、各国广泛采用的比较科学的考试成绩评价方式,其主要着眼于团体中考生个体成绩的区分,目的在于将个人考试的成绩与他人作比较,明确个体在团体中的位置,以便对考生进行层次划分、排序[1-2]。

目前流行的标准分算法大多直接建立在单次考试原始分基础之上,对于平时成绩在总成绩中占比较大的情况,如果平时成绩的评价标准不统一,随意性大,作为基础的原始分不够公平和客观,则这种标准分方法的有效性也会大打折扣。

1.1 任课教师的个性化差异会影响平时成绩评定

公共计算机课程覆盖面广,开课专业和授课教师多,学生基础各异,水平参差不齐。对于同一门课,不同的教师在平时成绩的评判标准上会有个性化差异,有的教师标准严格,有的则相对宽松,这种人为因素的存在使得平时成绩不能完全反映在统一考核标准下学生真实的学习效果。

1.2 阶段性测试的有效性会影响平时成绩评定

期中考试和阶段测验时,监考的标准通常可能比期末考试宽松,学生在考试过程中的诚信度、考试成绩的真实性会因此受到影响,从而也影响了评价结果的客观和公平。

1.3 平时成绩在总成绩中所占比例太小

现行课程成绩评价体系中,平时成绩大多只占总成绩的20%以下,期末考试成绩占总成绩的80%以上,平时成绩所占比例太小,对实施标准化评价不利。

1.4 成绩分布的不合理性对成绩评价的影响

通常,平时成绩普遍偏高,造成这种现象的主要原因是在给定学生平时成绩时,没有科学划定学生成绩分布,合理的成绩分析曲线应该是符合正态分布的。如果使单个班次内的单科成绩分析曲线达到正态分布标准,则要求任课教师在给定学生平时成绩时把握一定的宏观性。

2 基于标准分的平时成绩评价方案

为了解决平时成绩客观性、公平性的问题,笔者所在团队进行了多年探索,通过相关任课教师在计算机软件类课程教学中的实践,找到了一种适合公共计算机课程的成绩评价办法,这种方法采用平时成绩与期末考试成绩先分离再统筹的方式。平时成绩可以监控学生各阶段的学习效果,应该在总成绩中占有更大的比重,与此对应,更重要的是要推进平时成绩评定的标准化,这样才能真正达到平时成绩评定的客观性、公平性。期末考试在相同时间,全院集中采用闭卷笔试的形式进行,这种组织形式在一定程度上保障了成绩取得的客观、公平,对考试成绩一般只需做分数的正态化修正,但由于单次考试的成绩存在偶然性,不足以反映学生的真实学业水平,必须将平时成绩与期末考试进行有机结合以修正这些误差。

平时成绩的标准化修正依据经正态化修正后的期末考试成绩曲线完成,尽量将每个学生的学习成绩误差率降至最低。经过实践验证,本方法基本达到既定要求,较公正、客观地反映了学生的公共计算机课程学业水平。

2.1 期末总成绩评定标准

公共计算机课程大多具有理论加实践的特性,平时成绩与期末考试成绩理想的比例设置为5:5是合理的,考虑到成绩评定改革应稳中求进,教师在实施方案中可设置为3:7的比例,平时成绩与期末考试成绩均以标准分体现。其中,笔试使用网络题库随机抽题,网络题库中的试题类型已经过多年实践检验,试题难度、知识点分布、题量等均能达到考核要求且试题逐年更新,保证实效性。期末考试成绩按70%的比例记录并进行正态化修正,再加上30%的平时成绩标准分,作为学生的期末总成绩。

2.2 平时成绩各子环节

以C语言程序设计课程为例,平时成绩包括期中考试成绩、两次阶段性测试成绩、随堂作业成绩、课堂表现成绩、上机实验成绩。其中,期中考试采取集中闭卷形式,占总成绩的10%;阶段性测试成绩占5%,由任课教师组织;平时作业成绩、课堂表现成绩、上机实验成绩各占5%,以上各部分组成平时成绩,占期末总成绩的30%。

2.3 标准化的计算机课程成绩评价公平性原则

为最大限度地体现成绩评定的公平性,教师在平时成绩评定时应主要把握成绩评定的阶段和原则。

1)任课教师个人给定平时成绩阶段。

(1)教师以原始分记录学生平时成绩。

(2)在授课任务分配中做到同一教师承担的同一门课程的学生来自不同院系、专业,这样做是因为不同专业的学生在学习态度、认知水平等方面会存在差异,教师在成绩评定的过程中会看到这种差异,不容易形成惯性,从而使平时成绩的评定更客观、公平。

(3)作业收缴次数、上机实验和课堂表现的考核次数及给分标准可在教研室的指导下由任课教师自行确定,最终按指定比例计入期末总成绩。

2)教学小组综合评定阶段。

该阶段的目的有两个,一要确定班次间的差异程度;二要确定班次内的成绩分布特性,给出每名学生的平时成绩标准分。

(1)教学小组首先根据学生的期末考试(笔试)成绩获得正态分布函数的方差与平均值,然后根据此函数对期末考试成绩进行正态化修正,得到具有可比性的标准化期末考试成绩。

(2)认真核对全部期末考试标准分,再按班生成班级内部的正态分布曲线,下发给各任课教师,作为该班次的平时成绩分布曲线标准,初步确定班次内部的优秀、一般、及格、不及格的比例,各任课教师在计算完成后上报教学小组。

(3)教学小组研讨班次间差异程度,集体决定每个班次的最高成绩及不及格率等;以1个教学队由3个教学班组成为例,为同一教师分配分属于不同教学队的授课任务。授课教师根据授课时发现的实际问题,给出各班次间的差异程度,通过集体研讨确定教学队之间的实际表现差异程度并排序,确定每个教学班中的最高分,修正各班次平时成绩的正态分布曲线,减少主观因素对成绩评定的影响,最终确定每名学生的平时成绩标准分。

3)合并期末总成绩。

按平时标准分成绩占30%、期末闭卷考试标准分成绩占70%的比例原则进行带权相加,相加后按T=75+αZ方式再次修正各学生的标准分,将修正后的标准分合并记入学生的总成绩,完成成绩评价。

3 评价体系结构算法

3.1 用于计算标准分的公式

以C语言课程为例,设共有n个考生参加期末考试(通常将0分考生、缺考考生同等对待,不计入考试人数)。

已知:参加考试人数为n,每个考生的原始分(卷面得分)Xi ( i = 1, 2, , n 。Xi是第i个考生的得分),则标准分数(Z分数)的计算公式为:

式中,是全部考生原始分的平均值(即μ),σ是标准差。

通过上面公式,将标准差σ及平均分(即μ)带入以下公式,可获得标准的正态分布函数,计算其相对应的概率密度。

在标准正态分布函数基础上,利用下面积分公式求得各区间面积,即计算各分数段区间分布。

,m<n且m , n均小于等于x的最大值 。 (4)

根据式(1)中的Z 分数,做以下变换,可以获得具有实际意义的标准分y :

y = αZ+β (5)

其中, y为实际标准分,α、β均为常数,根据需要取值,如α取12、β取60,我们就得到了平均分为60、标准差是12的标准分数。

在计算总成绩时,使用下面公式:

T = A×30% + B×70% (6)

3.2 算法原理与过程

1)计算期末考试成绩的标准分。

(1)利用式(2)获得全部考生原始分的标准差σ及平均分(即μ)。

(2)利用式(1)获得全部考生的标准分数(Z分数)。Z分数是原始分数与平均分之差除以原始分数的标准差所得的商,无单位。如果原始分数大于平均分,则Z值为正;小于则Z值为负;如果原始分数等于平均分则Z值为零[3]。

计算获得的Z标准分一般都有小数位,而且可能出现负值,为了方便实际应用,还要对Z分数进行线性变换:根据式(2)中求得的标准差σ及平均分(即μ)和变换的式(5)确定每名学生的期末考试成绩标准分,并记录及存档。

经过以上步骤后获得的期末考试成绩标准分分布函数将作为平时成绩的标准化修正依据。

2)确定各班次内部概率分布函数。

一个教学班一般有30人左右,从统计学角度看,个别学生的突发情况对全班总体学业成绩影响不大。式(1)中确定每名学生的期末考试成绩标准分,根据式(2),在各任课班次内部确定局部标准差σ及平均分(即μ),再次生成班级内的正态分布概率密度函数(式(3)),以此函数作为班级内部的平时成绩正态分布曲线图。事实证明,该方法可以较为客观地体现各班次间的差异程度。

3)初步确定各班次内部各分数等级比例。

根据式(2)中确定的各班次内部平时成绩正态分布曲线函数,利用积分式(4),计算[0,60)、[60,75)、[75,90)、[90,100]各分数段在相对应概率密度函数上的面积,即获得各分数段的人数比例,以此作为基本参考比例,尤其是不及格人数和比例,将结果上报教学小组。

4)教学小组集中讨论,确定各班次内部概率分布函数。

由于平时成绩在评定和记录时会受到教师个人主观因素的影响,为尽量避免因此造成的不公平现象,对教师上报的平时成绩分布曲线用相关公式进行调整和修正,通常以调整μ值修正该班次的平时成绩平均分,调整标准差σ修正各分数段人数比例。

5)分别计算各学生平时成绩的标准分。

用上一步骤获得的修正后的μ和σ为各班计算平时成绩标准分的基准参数,利用式(5)获得每名学生的平时成绩标准分并记录归档。

6)确定学生的总分标准分。

(1)根据式(6)计算每名学生的综合分,其中A 为平时成绩标准分,B为期末考试成绩标准分。公式中默认平时成绩和期末考试成绩的标准分均以百分制计算。

(2)用式(5)计算总成绩的标准分。

在公共计算机课程成绩评价过程中,通常β取值75,α取值9或10,这更加符合此类课程评分中的传统习惯且可计算性及正态分布性均很强,这是我们所希望的理想结果。

4 应用实例与分析

一次难度适中、组织严密、可信度高的考试中,学生成绩应接近正态分布。通常如果学生的成绩分布曲线符合正态分布要求,则说明本次考试基本达到了教学要求;如果考试成绩呈现正偏态或负偏态分布,则说明考题总体难度偏低或偏高,不利于综合评价,需要进行正态化修正。

在笔者讨论的方案实施中,期末考试成绩标准分是在原始分数基础上,通过计算原始分数的标准差σ及平均分 (即μ)获得的,使用这些数据一是可以真实反映各教学班次间的差异,二是可以减少在计算总成绩标准分时出现计算误差。

按文中方法计算求得的平时成绩标准分见表1。为简单起见,只列出一个教学班次的部分学生平时成绩标准分,该分数客观地反映了学生的过程学习状态。

如上文所述,计算总成绩时, β值取为75分,各分数段分布情况见表2。从计算结果看,转换后的标准分更符合标准的正态分布,并且可以通过不同的α值调整优秀率、不及格率等不同分数段的分布,更有利于课程成绩评价。

5 结 语

基于标准分的公共计算机课程成绩评价方法在实现了对学生学习过程有效监控的同时,使学习成绩的评定能比较客观地反映不同专业、不同班级、班级内部学生在学习过程中的真实表现,更好地体现了公平、公正、公开原则,对提高学生的信息化综合能力素质起到积极作用。今后,我们还会在对该评价方法进一步完善的同时,探索其在其他相关课程成绩评价中的调整和应用实践。

参考文献:

[1] 熊茂芳. 课堂教学评价数据标准分处理的探讨[J]. 现代教育科学, 2003(6): 95-97.

[2] 翁洁静. 标准分制度在成绩统计过程中的应用[J]. 晋城职业技术学院学报, 2009(4): 27-29.

考试考差总结范文第5篇

没想到时间过得这么快,期中考试都已经过去好久了。又到了做总结的时候。

按照惯例,先从语文开始。语文这次考的比较不理想,光选择题就扣了十几分,这一下就跟别人差了好多。对答案的时候仔细想想,其实如果能在考试的时候多认真些的话就不会错选那种考察细致的题。默写这次倒是一个都没错,我也希望自己能继续保持。而且以后背的东西越来越多了,得及时巩固复习以前的背诵篇目才可以。阅读和作文也是扣得比较惨烈的部分。在阅读方面,我对于答题技巧掌握的不是太牢固,总是所答非所问或者语无伦次。而作文也是,衔接和材料选择的方面可能就不是太恰当。也是经过老师的试卷讲评之后才发觉过来。实在是不该考的这么差。

然后是数学。数学考的也不理想。光选择填空就扣了小二十分。拿下答题卡仔细看了几遍才知道自己错了多么不改错的题。而且小题分一个就五分,错几个和别人的差距就拉大了。后面的大题也是答的不怎么好。最不该错的几何证明题又因为过程不完整而扣了几分。这也反映出我在平时上课的听讲和课下的应用还应该多下功夫才行。

英语算是这次考试中我最满意的一科了。但是偏偏错了几个弱智的题——听力题和单词形式。这些都是高考场上最忌讳错的题,我却每次考试都错那么几个。这样一来就丢了很多不该丢的分。阅读也得更注重文章的细节才可以,不能一意孤行。再说说作文,这个该靠平时的语言积累,我这次作文写的不是特好,为了用英语提分,作文写的好是必不可少的关键。

物理这次只能说算是班级的中不溜,既不特好也不是特差。选择题这次做的比之前要好些。但是后面的实验题和计算大题也是扣分中比较多的部分。我觉得实验题和计算题考的除了是公式的运用和实验原理、实验图之外,也是考细节的——比如作图的时候就要注意原点是否都是从零开始之类的。这次错了也是给我敲个警钟。

化学是考的最差的。身为理科实验班的一员……考成这样真的很惭愧。平时课上都觉得自己听明白了,可是不多做题、不多复习也是没用的。选择题错的那叫一个惨。最简单的题还错了一堆,实在是对不起老师和自己。这次的成绩也证明了化学是我的弱项,我也应该把更多的精力投入到化学的学习中来,不懂就问,多做题,多复习。

生物是新的科目,这次也算是比较正式的生物考试了。选择题的难题部分错了一两个我觉得考的就是关于知识迁移的能力,而前面的题错的也全是概念题。可能选择题大家都考的差不了多少,但是后面的50个填空题就是一点一点拉开差距的了。虽然一个一分,但是错起来也是扣得很惨。比如说错别字。说明我还得更加重课下复习才行。希望下次生物能考得好些,最少作为一个新的科目来说。

最后是三个副科——历史、地理和政治。之前我跪求及格的那种。但是在老师们跟我们讲了会考的重要性之后,我觉得及格是远远不够的。不仅是身为实验班的一员,也是为了以后的高考着想,怎么着也得冲刺优秀吧。