首页 > 文章中心 > 正文

教育学中的数据挖掘技术研究

教育学中的数据挖掘技术研究

1数据挖掘在教育学领域的应用

1.1数据电子化

要让数据电子化,首先要搭建适用的网络平台,网络平台的搭建分为2个过程。如果需要收集数据,则需要搭建一个面向对象的网络平台。在对大学生社会体系和人际关系的研究中,采用的是在WEB上自动收集量表数据,首先将量表转换为汇编语言编写的网页,再采用将量表转换后的电子版网页与数据库中的表相连接,这样,只要被试登录指定网站,就可以在网上完成量表的填写,数据则直接存入数据库中。数据库管理系统使用的是SQLServer2000,在网络成瘾和注意关系偏向的研究中,也采用了同样的方法。如果对现有的数据进行分析,则可以略过数据收集这个步骤,直接将数据输入数据处理软件中。在对于青少年同伴关系的研究中,创建了一个数据仓库来存放现有数据,选用SQLServer2000作为数据仓库的构建平台。由于青少年同伴关系的研究中的维度不是太多,维度层次也不复杂,出于对查询效率和使用者是否容易理解的角度考虑,决定使用星型结构来创建数据仓库,青少年同伴关系研究的星型结构。最后一种方法是直接将数据输入SPSS中,这种方法这样需要大量人力物力,而且效率难以提高,存在误录的可能。

1.2数据挖掘分析

将数据转换为需要的电子文本格式以后,进行简单的数据处理。在剔除了部分缺失或者明显错误的数据后,就可以进行数据挖掘工作了。数据挖掘的常用算法为关联规则挖掘、决策树算法和聚类挖掘算法。在此选用关联规则挖掘算法做详细说明,在大学生社会网络和人际关系研究中,选取被试人际关系满意度为例进行关联规则挖掘。表1被试人际关系满意度关联规则挖掘关联规则挖掘的步骤如下:

①选择数据根据关联规则挖掘的目标,选择如上表所示的属性,通过下面的sql语句选择数据,并将jibenxinxi表和zongjie表通过学号连接起来。select性别,是否独生子女,你对自己的人际关系满意吗,你对自己与父母的关系满意吗,你对自己与同伴的关系满意吗,你对自己与老师的关系满意吗,你认为比较了解你的人会对你的人际关系给出一个怎样的评价,你对自己人际关系的关注程度fromjibenxinxia,zongjiebwherea.学号=b.学号;

②保存选择的数据:首先将第一步选择的数据插入到一张表中,sql语句如下:insertintoguanlianguize1select性别,是否独生子女,你对自己的人际关系满意吗,你对自己与父母的关系满意吗,你对自己与同伴的关系满意吗,你对自己与老师的关系满意吗,你认为比较了解你的人会对你的人际关系给出一个怎样的评价,你对自己人际关系的关注程度fromjibenxinxia,zongjiebwherea.学号=b.学号;

③构造满足关联规则挖掘的事务数据库在guanlianguize1表中增加一个属性item,通过下面的sql语句给item赋值。注意各属性的数据挖掘映射代码如上表所示。新建表social_guanlian_1作为数据挖掘的事务数据库,导入item。Insertintosocial_guanlian_1(item)selectitemfromguanlianguize1以上关联规则挖掘的结果,结果表明:对自己图人际关系评价较高的大学生,同时对自己人际关系的满意度也较高。对自己人际关系评价较低的大学生,同时对自己人际关系的满意度也较低。对人际关系关注程度较低的同学,人际关系满意度也较低。这些数据之间是互相有关联的,因此呼吁大学生多关注人际关系和人际交往的法则,有利于他们及早的认识到自己在人际交往方面的不足,为以后步入社会,创造更大的社会价值打好基础。除此以外,对于教育学中的很多课题,例如青少年同伴关系的研究,网络成瘾与注意偏向关系的研究,学生成绩的分析等等都可以用数据挖掘来进行科学的数据分析,数据挖掘技术在教育学领域正发挥着越来越大的作用。

2结束语

随着信息化时代的不断发展,很多研究人员围绕教育学从不同侧面不同领域进行研究,在这个过程中必然会积累大量的科学数据,这就急切需要应用计算机手段进行系统的数据整合,有利于更深层次的分析所得数据。数据挖掘技术应用于教育学领域内的分析必将有广阔的前景,可以作为未来的教育学的研究方向进行进一步的推广。

作者:张晔柏毅单位:东南大学学习科学研究中心