数据挖掘技术在高校成绩管理中的应用的方向探
中图分类号TP392 文献标识码A 文章编号 1674-6708(2013)83-0184-02
在高校教育领域,就当前阶段数据挖掘还是一种较新的技术。如何在高校的学生成绩管理中合理的利用数据挖掘技术,对存放了大量学生的信息的数据库中的数据进行挖掘处理,从而提取出可以对教师的教和学生的学都起到积极促进作用的关键性规律,获得更加良好的教学效果是我们目前高校的教育工作者面临的一大急需解决的有价值的问题。随着数据挖掘技术的成熟,它的应用领域也在不断的扩展,被关注程度也不断提高,很多高校已经投入大量的人力物力在这项研究工作上,并逐渐的将其研究成果应用于日常的教学及管理工作中。比如,将其应用在学生信息的管理、学生的各门课的成绩分析和考试系统、教育教学的评估工作等,这些应用都将对提高高校的教学和管理水平等各方面都起到十分显著的的指导作用[1]。
1 当前很多高校学生的成绩管理面临的问题
目前大部分高校教务管理系统是采用联机的事务处理系统对学生成绩进行管理,成绩数据只能简单地存储于数据库中,而对数据的处理也停留在单纯的数据查询和插入修改等功能上,仅有的对成绩的分析可能也只是求总和、平均值、均方差和合格率等之类的统计。教务管理系统中的数据单纯的保存了相关数据信息而没有能够挖掘出这些数据背后所隐藏的可能有用信息——例如学生每门课程取得的成绩的可能原因、每门课程的诸多知识点之间以及课程和课程之间的联系。庞大的数据库里数据和数据之间存在着很多的关联,我们如何充分利用这些数据关联,为高校教育教学决策者提供一定的决策依据,从而科学的指导教学,提高高校的教学及管理水平,进一步提高办学效益和水平,是目前高校需要去面对和解决的问题。
2 利用数据挖掘技术管理学生成绩
数据挖掘技术就是从大量的、有噪声的、不完全的、随机的、模糊的应用数据中来提取隐藏在其中的潜在并且十分有用的信息过程[2]。利用数据挖掘对存储在高校成绩数据库中的学生成绩数据信息进行全面的深层次的分析和挖掘,达到全面地分析成绩数据的优劣及产生原因、各种因素之间隐含的内在联系的目的。挖掘分析这些数据所隐藏的有用信息,找到对指导教师教学和学生学习有用的知识,帮助高校管理者对未来高校的发展进步的决策。由此可见,数据挖掘技术一定会在教师提高教学质量、学生增加学习效率和学校强化管理水平等方面起到至关重要的引导作用[3]。
第一,使用计算机对高校学生成绩进行信息管理相对于传统管理方法有着十分明显优势:在现代的互联网时代,信息的管理早已经超越传统概念,使用计算机存储量大且成本低,可以长久保存,同时对信息的检索更迅速也更方便,结果的可靠性也是传统管理方法不可比拟的,这些也正是高校管理正规化和教育单位的科学化所必需的。
第二,学生成绩管理系统对于任何一个教育单位来说都是一个不可或缺的组成部分。它对于高校的管理者的办学思路的抉择来说是至关重要的。高校的成绩管理系统不仅应该做到为用户提供方便快捷的查询手段还用改能够提供充分的信息量以满足不同用户的不同查询需求。学生可以通过这个系统方便的查找自己到各门课的考试成绩及其他的教学相关信息;教师也能够通过系统提供的查询和分析工具非常准确的掌握学生的成绩变化,及时获取教学效果反馈信息,改进教学方式方法等;对高校的管理者来说,运用了最新的数据挖掘技术的学生成绩管理系统也可以让他们更及时快捷的从海量的数据中找到有用的信息,从而为不断提高高校的办学质量和管理水平提供保障。
3 学生成绩管理系统的设计
3.1数据挖掘的过程
数据挖掘是一个多阶段的复杂过程,如图1所示直接数据目标数据净化数据数据源知识数据选择清理与集成数据转换数据挖掘模式评价数据预处理数据挖掘解释和评价。
主要分为以下六个主要步骤[4]:
1)确定数据源。数据源的确立是整个系统的基础,是挖掘结果准确的保证。对学生成绩信息进行数据挖掘时,面向对象是各类不同的学生,例如教务处要挖掘的信息是面向全校学生的成绩,从而掌握全校学生的学习情况,而每个系所要掌握的学生的学习情况是针对本系的学生来说的,所以要挖掘的对象也只是每个系学生的成绩信息。他们面向对象和数据挖掘的目的都是不同的;
2)选定模型。为所挖掘的问题选择恰当的数据挖掘方法,并且针对该挖掘方法选择几种或是一种的算法。选择何种算法将直接影响挖掘信息的质量;
3)采集数据。这个阶段在整个开发过程中将会占用开发者大部分的工作量和时间。因为开发者需要收集在以往的教学实践中的数据信息,这些信息中,有些数据他们可以以直接的方式获得,而有些数据可能需要对学生以问卷调查等形式获得。
4)数据预处理。开发者在这一步需要将收集到的大量的不同的数据预处理,使其为一个分析数据模型;数据预处理是数据挖掘很重要的一步,数据只有经过预处理才能提高挖掘对象的质量;
5)数据挖掘。算法在这一步得到具体的实现,开发者将对经过预处理的数据信息进行挖掘;
6)解释和评价。分析和验证上一步的挖掘结果,并从中找到有价值的信息,将其集成到教师的教学环节和学生的学习环节中去,使教师和学生可利用所得信息改进教和学的策略,指导学生进一步更好的学习。
3.2数据挖掘的方法
在实际应用中需要根据对信息的实际需求选择恰当的挖掘算法。通过对几种常用的数据挖掘方法进行比较和分析,本文选择了以下两种适合的算法:关联分析方法以及决策树分类方法。
1)关联分析
利用关联分析对数据进行挖掘的目的就是挖掘出隐含在数据之间的关系。首先给定一组或一个记录的集合,然后,通过分析此记录集合从而推导出信息之间的相关性[5]。一个适用于关联规则的最有说服力的例子就是“90%客户在购买黄油和面包的同时也会选择购买牛奶”,即:规则“购买黄油和面包也会同时购买牛奶”的信息可信度高达90%。在大型的数据库系统中,类似的关联规则会产生很多,因此需要开发者进行筛选。一般来说,我们会采用 “可信度”和“支持度”这两个闽值去淘汰一些没有太多实际意义的规则。
关联规则算法主要
有以下两个步骤:第一步要求开发者查找出所有的频繁项集。频繁项集就是指其支持度大于或是等于最小支持度的那些项目集。第二步是指由频繁项集所产生的强关联规则,即所产生的以上规则一定要满足最小置信度和最小支持度[6]。
在实际教学中应用关联分析的数据挖掘方法对学生成绩信息进行分析和处理,研究课程的开设先后关系以及各门课程的成绩相关性,分析的结果将对一些课程的教与学提供很多有用的信息,使高校的教学工作迈上一个新的台阶。
2)决策树算法对学生成绩的分析
决策树算法是以实例为基础的归纳学习算法,用来形成数据挖掘的预测模型和分类器,同时可以对大量未知数据进行预测或分类、数据的预处理以及数据挖掘等。通常包括两部分:树的生成和树的剪枝[7]。
使用决策树算法来提取分类规则时,规则使用以“if——then”的形式表示。决策树算法和其他算法相比具有以下的优势:处理速度较快;从结果上来说,分类准确率也更相近,算法更容易转换为SQL语句。
4 结论
利用数据挖掘技术进行高校学生的成绩、心理分析和德育评估、教学及管理决策、教学质量评估等,能够为学生、教师以及教学管理人员等用户提供相应的数据信息支持,对教务管理和教学过程有着极为重要的指导意义,同时也为高校教与学、管理与决策的服务提供了一种新的思路。
参考文献
[1]刘春阳,数据挖掘技术在高校成绩管理中的应用研究,学位论文大连交通大学,2009.
[2]an, Proeess of Knowledge Diseovery in Databases.A Human一eentered APProaeh.1996:37-58.
[3]刘军.决策树分类算法的研究及其在教学分析中的应用[D].河海大学,2006.
[4]邓景毅.关联规则数据挖掘综述[J].电脑学习,2006(3):2-3.
[5]赵辉.数据挖掘技术在学生成绩分析中的研究及应用,学位论文,大连海事大学,2007.
[6]康艳霞.数据挖掘技术在学生成绩分析中的应用研究,学位论文,华东师范大学,2009:9-10.
[7]曲萍.数据挖掘技术在高校学生成绩管理中的应用研究.网络与信息,2010.