CN105677854A - 基于粗糙集的学生单科成绩决策分析方法及分析器 - Google Patents

基于粗糙集的学生单科成绩决策分析方法及分析器 Download PDF

Info

Publication number
CN105677854A
CN105677854A CN201610008715.0A CN201610008715A CN105677854A CN 105677854 A CN105677854 A CN 105677854A CN 201610008715 A CN201610008715 A CN 201610008715A CN 105677854 A CN105677854 A CN 105677854A
Authority
CN
China
Prior art keywords
attribute
decision
student
achievement
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610008715.0A
Other languages
English (en)
Inventor
姚晟
黄冬
陈海斌
蔡京京
林联浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN201610008715.0A priority Critical patent/CN105677854A/zh
Publication of CN105677854A publication Critical patent/CN105677854A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Fuzzy Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于粗糙集理论对学生的单科成绩进行决策分析方法以及分析器。以研究学生单科成绩的决策分析为出发点,分析研究所获得的有关科目学生的成绩,首先建立学生单科成绩决策各条件属性的评价指标,然后对有关数据进行数值化和离散化处理,形成决策信息系统,应用基于属性重要性的数据约简算法对决策信息系统进行属性约简和规则提取,建立学生单科成绩决策分析模式。授课老师获取新的学生测评结果后,输入本成绩分析系统,即可得到学生对应的等级。本发明可以有效提高高校成绩评定准确性、减轻教师重复工作量以提高工作效率。

Description

基于粗糙集的学生单科成绩决策分析方法及分析器
技术领域
本发明属于计算机应用技术领域,特别涉及一种基于基于粗糙集的学生单科成绩决策分析方法及分析器。
背景技术
系统的软件结构好坏,不仅影响着系统的效率、安全性、可维护性,更影响系统使用的方便性及可靠性。近年来,随着计算机技术与网络技术突飞猛进的发展,各高校纷纷开始建立新的教务管理信息系统,在这些系统的设计中,系统平台计算模式的选择是系统设计人员遇到的主要问题。
当今投入使用的计算机网络模式主要有二种:客户机/服务模式(Client/Server,简称C/S)和Web浏览器/服务器模式(Browser/Server,简称B/S)。针对学生单科成绩决策分析系统内容复杂、数据庞大、功能全面、涉及繁多、管理面广等特点,系统平台模式主要考虑B/S模式。这种模式都采用数据集中、管理分散的运行方式,符合网络技术的发展趋势。
B/S(Browser/Server)结构即浏览器和服务器结构,是建立在广域网的基础上的。它是随着Internet技术的兴起,对C/S结构的一种变化或者改进的结构。在这种结构下,用户工作界面是通过WWW浏览器来实现,极少部分事务逻辑在前端(Browser)实现,但是主要事务逻辑在服务器端(Server)实现,形成所谓三层3-tier结构。这样就大大简化了客户端电脑载荷,减轻了系统维护与升级的成本和工作量,降低了用户的总体成本(TCO)。以目前的技术看,局域网建立B/S结构的网络应用,并通过Internet/Intranet模式下数据库应用,相对易于把握、成本也是较低的。它是一次性到位的开发,能实现不同的人员,从不同的地点,以不同的接入方式(比如LAN,WAN,Internet/Intranet等)访问和操作共同的数据库;它能有效地保护数据平台和管理访问权限,服务器数据库也很安全。特别是在JAVA这样的跨平台语言出现之后,B/S架构管理软件更是方便、快捷、高效。B/S模式:B/S模式层次结构如图2-4所示。处于第一层的是客户端,处于第二层的是应用服务层,由一台或多台服务器组成,该层具有良好的可扩充性,可以随着应用的需要增加服务器的数目。处于第三层的是数据层,由数据库系统组成。
粗糙集理论是处理模糊和不确定知识的一种薪新的数学工具,粗糙集理论是建立在分类机制的基础上的,它将分类理解为在特定空间上的等价关系,而等价关系构成了对该空间的划分。粗糙集理论将知识理解为对数据的划分,每一被划分的集合称为概念。粗糙集理论的主要思想是利用已知的知识库,将不精确或不确定的知识用已知的知识库中的知识来(近似)刻画。
粗糙集理论虽然仅有三十一年的发展历程却已逐渐成为数据挖掘领域的研究热点之一,基于粗糙集理论的属性约简和规则提取算法具有十分重要的研究意义。粗糙集理论还可以被应用到对高校学生的学习成绩的分析等方面的研究。
在当代的应试教育中,成绩好坏仍然是衡量学生是否掌握所学知识的一个标准。现在教学的课程分为理论、实验、课程设计三大板块,传统的成绩分析通常采用数理统计法,只是单调地进行考试分、平时分等方面的分析,占用固定百分比的方式,然而测定学生本课程成绩的影响因素有很多,如平时考勤、书面作业完成情况、实验试题完成情况等,这些细节因素都会影响学生的最终成绩,传统的取均值的方式会导致数据产生较大误差,这不利于对该门课程的教学进行高效改进。而将粗糙集理论应用于学生单科成绩测评,利用粗糙集强大的数据分析、处理、加工能力,以及约简等算法找出影响学生成绩的关键因素,对微小的影响因素进行模糊处理,并开发出相应测评系统,提高学生成绩测评的科学性与准确性。
发明内容
本发明的目的是针对现有学生成绩评分方式的缺陷,提供一种基于粗糙集理论对学生的单科成绩进行决策分析方法以及分析器。
为了实现上述目的,本发明采用下述技术方案:一种基于粗糙集的学生单科成绩决策分析方法,其特征在于包括以下步骤:
(1)根据学科情况构建基于粗糙集理论的学生单科各项成绩评价指标体系;
(2)利用数据约简算法对成绩评价指标体系进行属性约简和规则提取;
(3)将新学生的成绩基础数据输入成绩决策系统,对比成绩评价指标体系与已提取的决策规则,快速得到对应的成绩等级。
所述步骤1中成绩评价指标体系的构建具体采用以下步骤:结合课程实际情况,选取若干项成绩评定的主要因素,设置差异化评价级别,选取的因素作为条件属性,成绩评级作为决策属性。
所述步骤2具体包括以下步骤:在构建的成绩评价指标体系中输入采集的学生成绩数据,提取条件属性;用语言值评语集的数值化和连续数值的离散化方法,对数据实施数值化和离散化;应用数据约简算法对处理后的数据实施属性约简,删除不必要的冗余属性,生成决策信息系统;再从约简后的决策信息系统中得到决策规则。
所述步骤2中的数据约简算法是定义一个信息系统(U,AT,F),U为对象集,U={x1,x2,……,xn},U的每个元素xi称为一个对象;AT为属性集,其中每个元素称为一个属性;F为U与AT之间的关系集,F={f1:U->V1},V1为a1的值域;
如果AT=C∪D,则信息系统(U,AT,F)为决策信息系统,其中C为条件属性集,D为决策属性集;
基于属性重要程度的约简:
设(U,AT,F)是一个信息系统,DB是U上的优势关系,如果满足以下条件:
(1)DB=DA
( 2 ) - - - ∀ a ∈ A , D B ≠ D B - a ;
则称集合B是(U,AT,F)的一个属性约简;
假设C和D分别表示条件属性集和决策属性集,属性子集关于D的重要程度可定义为:δCD(C′)=γC(D)-γC-C′(D),,其中γC(D)=|posC(D)|/|U|;
当C‘={a}时,属性a∈C关于D的重要程度定义为:
δCD(a)=γC(D)-γC-{a}(D),
设δCD(a)是属性a∈C关于D的重要程度,δCD(b)是属性b∈C关于D的重要程度,若
(1)δCD(a)>δCD(b),则属性a∈C比属性b∈C关于D的重要性大;
(2)δCD(a)<δCD(b),则属性a∈C比属性b∈C关于D的重要性小;
(3)δCD(a)=δCD(b),则属性a∈C和属性b∈C关于D同等重要;
若α(0<α<1)为某一给定的阈值,δCD(a)是属性a∈C关于D的重要程度,若
(1)δCD(a)>α,则属性a∈C关于D的重要性大,是重要属性;
(2)δCD(a)≤α,则属性a∈C关于D的重要性小,是冗余属性。
一种基于粗糙集的学生单科成绩决策分析方法的分析器,其特征在于包括:成绩评价模块、基础数据采集模块、预处理模块、分析模块和成绩决策模块;
其中所述成绩评价模块用于选取不同学科成绩评定的主要因素,设置差异化评价级别,选取的因素作为条件属性,成绩评级作为决策属性,构建基于粗糙集理论的学生单科各项成绩评价指标体系;
所述基础数据采集模块用于采集各学科学生各项成绩数据,并提取条件属性;
所述预处理模块用于将采集的评成绩数据进行数值化和连续数值的离散化处理;
所述分析模块用于应用数据约简算法对处理后的数据实施属性约简,删除不必要的冗余属性,生成决策信息系统;再从约简后的决策信息系统中得到决策规则;
所述成绩决策模块用于输入新学生的成绩基础数据,对比成绩评价指标体系与已提取的决策规则,得到对应的成绩等级。
本发明旨在提高高校成绩评定准确性、减轻教师重复工作量以提高工作效率。本发明有以下两点有益效果。
(1)提高单科成绩评定精确性:本发明核心是粗糙集数据挖掘算法。信息约简以及在约简基础上的决策支持是基于粗糙集理论的重要应用方面。在粗糙集理论中,知识是基于对对象分类的能力,分类的过程是将相差不大的对象分为一类。它们的关系是不可分辨关系,也称等价关系,而约简则是能保证决策分类质量的最小属性集合。在信息约简基础上的决策支持可以辅助教师对学生成绩评价作出更为科学、更为合理、更为精确的决策。
(2)减少成绩评定工作量,提高教师工作效率:本发明的系统实现了可视化,交互界面简洁清晰。用户只需输入数据,决策分析由系统完成,大大缩减了成绩评定的工作量与时间,提高了教师工作效率。
附图说明
图1是本发明基于粗糙集的学生单科成绩决策分析方法的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
本发明基于粗糙集的学生单科成绩决策分析方法的流程图见图1。
以计算机学院课程为例,认为学生单科成绩决策由学生的“实验课”、“理论课”、“课程设计”三个方面决定,以这三个方面作为条件属性输入,通过粗糙集约简算法和规则提取,所得结果经过分析得到对决策属性产生影响的条件属性,从而删除冗余信息,形成精简的规则以便作出快速、准确的决策。
学生单科成绩决策由学生的“实验课”、“理论课”、“课程设计”三个方面决定,以下则是通过分析研究构建的学生成绩各条件属性的评价指标(见表1)。
表1
数据的采集和预处理
数据来源于某班数据结构课学生各项成绩与指标。授课教师根据学生平时各项任务与作业完成情况评价,数据较为客观,真实可靠。
根据以上采集到的数据,通过对学生的各方面情况作全面认真的分析研究,提出了13个条件属性,生成学生测评信息表,如表2所示.表中各个参数的含义为:
U={1,2,3,...,n}为论域,代表所测评的学生集合;C={a1,a2,a3,...,a12,a13}为条件属性,其中a1代表实验报告,a2代表实验课缺勤次数,a3代表实验必做题完成情况,a4代表选做题完成情况,a5代表理论课缺勤次数,a6代表期中测验成绩,a7代表课堂提问回答情况,a8代表复习提问回答情况,a9代表作业完成情况a10代表预习提问回答情况,代表a11课程设计选题难度,a12课程设计个人完成量占比,a13课题整体完成情况。D为决策属性,表示综合成绩,用A、B、C、D四个等级来表示。
表2学生测评信息表
采用语言值评语集的数值化和连续数值的离散化方法,对表实施数值化和离散化后,随机抽取部分样本,得到如表3的决策信息系统。
表3决策信息系统
U a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 a11 a12 a13 D
1 3 3 3 3 3 3 2 2 3 2 2 2 2 3
2 3 3 3 3 3 1 2 2 3 2 2 2 2 3
3 1 2 1 2 1 0 2 1 2 0 1 1 2 1
4 0 0 0 0 0 0 1 1 3 0 0 0 1 1
5 3 3 3 3 3 0 2 2 3 2 2 2 2 25 -->
6 1 2 1 2 1 0 2 1 2 0 1 2 2 1
7 3 3 2 3 3 1 2 2 3 2 2 2 2 2
8 1 2 1 2 1 0 2 1 2 0 1 0 2 1
9 1 2 1 2 1 0 2 1 2 0 1 3 2 1
10 0 0 0 0 0 0 1 1 0 0 0 0 1 0
11 1 2 0 2 1 0 2 1 2 0 1 0 2 1
12 3 3 3 3 3 2 2 2 3 2 2 2 2 3
13 0 0 0 0 0 0 1 1 0 0 0 1 1 0
14 1 2 1 2 2 0 2 1 2 0 1 0 2 2
15 1 2 0 2 2 0 2 1 2 0 1 0 2 1
属性约减与规则提取:
根据以上表3所示的决策信息系统,应用AI数据约简算法实施属性约简,删除不必要的冗余属性。由于阈值取值范围在阈值0≤α≤1,α取值越大,对结果的选择越严格,得到的属性就越少;阈值α取值越小,对结果的选择越宽松,得到的属性就越多。为了获得较理想的测评效果,经反复测算,对该问题我们首先设定阈值α=0.1,计算每个属性的重要程度如下:
U={1,2,3,...,15},C={a1,a2,a3,...,a12,a13},D={3,2,1,0},
U/C={{1},{2},{3},...,{15}},U/D={{1,2,12},{5,7,9,14},{3,4,6,8,11,15},{10,13}},
posc(D)={1,2,3,...,15},γc{D}=|poscD|/|U|=15/15=1,
U/(C-{a1})={{1},{2,7},{3},{4},{5},{6},{8,11},{9},{10},{12},{13},{14,15}},
posc-{a1}(D)={1,3,4,5,6,8,9,10,11,12,13},
U/(C-{a2})={{1},{2},{3},{4},{5},{6},{7},{8,14},{9},{10},{11,15},{12},{13}},
posc-{a2}(D)={1,2,3,4,5,6,7,9,10,11,12,13,15},
U/(C-{a3})={{1},{2},{3},{4,10},{5},{6},{7},{8},{9},{11},{12},{13},{14},{15}},
posc-{a3}(D)={1,2,3,5,6,7,8,9,11,12,13,14,15},
U/(C-{a4})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a4}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a5})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a5}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a6})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a6}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a7})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a7}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a8})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a8}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a9})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a9}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a10})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a10}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a11})={{1},{2},{3},{4},{5},{6},{7},{8},{9},{10},{11},{12},{13},{14},{15}},
posc-{a11}(D)={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15},
U/(C-{a12})={{1},{2},{3,6,8,9},{4},{5},{7},{10,13},{11},{12},{14},{15}},
posc-{a12}(D)={1,2,4,5,7,10,11,12,13,14,15},
U/(C-{a13})={{1,2,5,12},{3},{4},{6},{7},{8},{9},{10},{11},{13},{14},{15}},
posc-{a13}(D)={3,4,6,7,8,9,10,11,13,14,15},
γc-{a1}(D)=|posc-{a1}D|/|U|=11/15,
所以:
δCD(a1)=γc(D)-γc-{a1}(D)=1-11/15=4/15.
类推可得:
δCD(a2)=γc(D)-γc-{a2}(D)=1-13/15=2/15.
δCD(a3)=γc(D)-γc-{a3}(D)=1-13/15=2/15.
δCD(a4)=γc(D)-γc-{a4}(D)=1-1=0.
δCD(a5)=γc(D)-γc-{a5}(D)=1-1=0.
δCD(a6)=γc(D)-γc-{a6}(D)=1-1=0.
δCD(a7)=γc(D)-γc-{a7}(D)=1-1=0.
δCD(a8)=γc(D)-γc-{a8}(D)=1-1=0.
δCD(a9)=γc(D)-γc-{a9}(D)=1-1=0.
δCD(a10)=γc(D)-γc-{a10}(D)=1-1=0.
δCD(a11)=γc(D)-γc-{a11}(D)=1-1=0.
δCD(a12)=γc(D)-γc-{a12}(D)=1-11/15=4/15.
δCD(a13)=γc(D)-γc-{a13}(D)=1-11/15=4/15.
由此可得:
δCD(a1)=δCD(a12)=δCD(a13)>δCD(a2)=δCD(a3)>α,
并且
δCD(a4)=δCD(a5)=δCD(a6)=δCD(a7)=δCD(a8)=δCD(a9)=δCD(a10)=δCD(a11)=0<α,通过以上对各个属性的重要程度的计算和比较知道,在所有13个综合能力属性中,只有5个属性:a3,a5,a6,a9,a12是重要属性,而其他8个属性是冗余属性;其中a3,a6,a12的重要程度最大,且都等于4/15,即学生的综合成绩测评中,“实验必做题完成情况”、“理论课其中测验成绩”和“课程设计个人完成量”最为重要,而a5“理论课缺勤情况”和a9“课后作业完成情况”排在第二重要档次.其他属性虽然对学生成绩测评有着一定的影响,但在对学生的综合成绩的测评中并不处在突出位置,在具体对学生的综合成绩测评时,为了更科学和更有效,可认为它们并不重要,因此是冗余属性.把冗余属性删除后得到的决策信息系统如表4所示。
表4约简后的决策信息系统
U a3 a5 a6 a9 a12 D
1 3 3 3 3 2 3
2 3 3 1 3 2 3
3 1 1 0 2 1 1
4 0 0 0 3 0 1
5 3 3 0 3 2 2
6 1 1 0 2 2 1
7 2 3 1 3 2 2
8 1 1 0 2 0 1
9 1 1 0 2 3 2
10 0 0 0 0 0 0
11 0 1 0 2 0 1
12 3 3 2 3 2 3
13 0 0 0 0 1 0
14 1 2 0 2 0 2
15 0 2 0 2 0 1
从约简后的决策信息系统中得到决策规则:
规则1(a3=3)∧(a5=3)∧(a6=1)∧(a9=3)∧(a12=2)=>D=3;
规则2(a3=3)∧(a5=3)∧(a6=0)∧(a9=3)∧(a12=2)=>D=2
规则3(a3=2)∧(a5=3)∧(a6=1)∧(a9=3)∧(a12=2)=>D=2
规则4(a3=1)∧(a5=2∨(a12=3)∧(a9=2)=>D=2
规则5(a3=1)∧(a5=1)∧(a6=0)∧(a9=2)∧(a12=0)=>D=1
规则6(a3=0)∧(a5=0)∧(a6=0)∧(a9=3)∧(a12=0)=>D=1
规则7(a3=0)∧(a5=1)∧(a6=0)∧(a9=2)∧(a12=0)=>D=1
规则8(a3=0)∧(a5=0)∧(a6=0)∧(a9=0)=>D=0
规则1说明:实验课必做题完成情况在90分及以上,理论课无缺勤,课后作业完成情况优秀,同时要在课程设计中个人完成等额量,在期中测验上达到70分及以上,综合测评成绩为优秀。
规则2说明:实验课必做题完成情况在90分及以上,理论课无缺勤,课后作业完成情况优秀,同时要在课程设计中个人完成等额量,在期中测验上达到70分及以上,但期中测验只有70分以下,综合测评成绩只能评定为良好。
规则3说明:实验课必做题完成情况在80-89分之间,理论课无缺勤,课后作业完成情况优秀,同时要在课程设计中个人完成等额量,在期中测验上达到70分及以上,综合测评成绩为良好。
规则4说明:实验课必做题完成情况在70-79分之间,理论课缺勤一次或者在课程设计中个人完成超额量,课后作业完成情况良好,综合能力测评成绩同样评定为良好。
规则5说明:实验课必做题完成情况在70-79分之间,理论课缺勤两次,但课后作业完成情况良好,在课程设计中未曾参与,在期中测验上只有70分以下,综合测评成绩评定为一般。
规则6说明:实验课必做题完成情况在70分以下,理论课缺勤次数最多,但课后作业完成情况优秀,在课程设计中未参与,在期中测验上只有70分以下,综合测评成绩评定为一般。
规则7说明:实验课必做题完成情况在70分以下,理论课缺勤两次,同时但课后作业完成情况良好,在课程设计中未曾参与,在期中测验上只有70分以下,综合测评成绩评定为一般。
规则8说明:实验课必做题完成情况在70分以下,理论课缺勤次数达到最多,期中测评还没有达到70分,课后作业完成质量差,综合测评成绩评定为差。
采集实验数据,完成系统测试。
为了更清楚地了解上述建立的测评模式的测评效果,把本课程部分学生期末考试成绩结果以及用建立的测评模式的测评结果对照如表5。
表5测评结果与期末考试结果对照表
基于粗糙集的学生单科成绩决策分析器包括:成绩评价模块、基础数据采集模块、预处理模块、分析模块和成绩决策模块。
成绩评价模块用于选取不同学科成绩评定的主要因素,设置差异化评价级别,选取的因素作为条件属性,成绩评级作为决策属性,构建基于粗糙集理论的学生单科各项成绩评价指标体系。
基础数据采集模块用于采集各学科学生各项成绩数据,并提取条件属性。
预处理模块用于将采集的评成绩数据进行数值化和连续数值的离散化处理。
分析模块用于应用数据约简算法对处理后的数据实施属性约简,删除不必要的冗余属性,生成决策信息系统;再从约简后的决策信息系统中得到决策规则。
成绩决策模块用于输入新学生的成绩基础数据,对比成绩评价指标体系与已提取的决策规则,得到对应的成绩等级。
以上所述,仅是本发明的较佳实施例而已,并非对本发明做任何形式的限制。凡是依据本发明的技术和方法实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明的技术和方法方案的范围内。

Claims (5)

1.一种基于粗糙集的学生单科成绩决策分析方法,其特征在于包括以下步骤:
(1)根据学科情况构建基于粗糙集理论的学生单科各项成绩评价指标体系;
(2)利用数据约简算法对成绩评价指标体系进行属性约简和规则提取;
(3)将新学生的成绩基础数据输入成绩决策系统,对比成绩评价指标体系与已提取的决策规则,快速得到对应的成绩等级。
2.根据权利要求1所述的分析方法,其特征在于:所述步骤1中成绩评价指标体系的构建具体采用以下步骤:结合课程实际情况,选取若干项成绩评定的主要因素,设置差异化评价级别,选取的因素作为条件属性,成绩评级作为决策属性。
3.根据权利要求2所述的分析方法,其特征在于:所述步骤2具体包括以下步骤:在构建的成绩评价指标体系中输入采集的学生成绩数据,提取条件属性;用语言值评语集的数值化和连续数值的离散化方法,对数据实施数值化和离散化;应用数据约简算法对处理后的数据实施属性约简,删除不必要的冗余属性,生成决策信息系统;再从约简后的决策信息系统中得到决策规则。
4.根据权利要求3所述的分析方法,其特征在于:所述步骤2中的数据约简算法是定义一个信息系统(U,AT,F),U为对象集,U={x1,x2,……,xn},U的每个元素xi称为一个对象;AT为属性集,其中每个元素称为一个属性;F为U与AT之间的关系集,F={f1:U->V1},V1为a1的值域;
如果则信息系统(U,AT,F)为决策信息系统,其中C为条件属性集,D为决策属性集;
基于属性重要程度的约简:
设(U,AT,F)是一个信息系统,DB是U上的优势关系,如果满足以下条件:
(1)DB=DA
( 2 ) - - - &ForAll; a &Element; A , D B &NotEqual; D B - a ;
则称集合B是(U,AT,F)的一个属性约简;
假设C和D分别表示条件属性集和决策属性集,属性子集关于D的重要程度可定义为:δCD(C′)=γC(D)-γC-C′(D),,其中γC(D)=|posC(D)|/|U|;
当C‘={a}时,属性a∈C关于D的重要程度定义为:
δCD(a)=γC(D)-γC-{a}(D),
设δCD(a)是属性a∈C关于D的重要程度,δCD(b)是属性b∈C关于D的重要程度,若
(1)δCD(a)>δCD(b),则属性a∈C比属性b∈C关于D的重要性大;
(2)δCD(a)<δCD(b),则属性a∈C比属性b∈C关于D的重要性小;
(3)δCD(a)=δCD(b),则属性a∈C和属性b∈C关于D同等重要;
若α(0<α<1)为某一给定的阈值,δCD(a)是属性a∈C关于D的重要程度,若
(1)δCD(a)>α,则属性a∈C关于D的重要性大,是重要属性;
(2)δCD(a)≤α,则属性a∈C关于D的重要性小,是冗余属性。
5.一种基于粗糙集的学生单科成绩决策分析方法的分析器,其特征在于包括:成绩评价模块、基础数据采集模块、预处理模块、分析模块和成绩决策模块;
其中所述成绩评价模块用于选取不同学科成绩评定的主要因素,设置差异化评价级别,选取的因素作为条件属性,成绩评级作为决策属性,构建基于粗糙集理论的学生单科各项成绩评价指标体系;
所述基础数据采集模块用于采集各学科学生各项成绩数据,并提取条件属性;
所述预处理模块用于将采集的评成绩数据进行数值化和连续数值的离散化处理;
所述分析模块用于应用数据约简算法对处理后的数据实施属性约简,删除不必要的冗余属性,生成决策信息系统;再从约简后的决策信息系统中得到决策规则;
所述成绩决策模块用于输入新学生的成绩基础数据,对比成绩评价指标体系与已提取的决策规则,得到对应的成绩等级。
CN201610008715.0A 2016-01-04 2016-01-04 基于粗糙集的学生单科成绩决策分析方法及分析器 Pending CN105677854A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610008715.0A CN105677854A (zh) 2016-01-04 2016-01-04 基于粗糙集的学生单科成绩决策分析方法及分析器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610008715.0A CN105677854A (zh) 2016-01-04 2016-01-04 基于粗糙集的学生单科成绩决策分析方法及分析器

Publications (1)

Publication Number Publication Date
CN105677854A true CN105677854A (zh) 2016-06-15

Family

ID=56299391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610008715.0A Pending CN105677854A (zh) 2016-01-04 2016-01-04 基于粗糙集的学生单科成绩决策分析方法及分析器

Country Status (1)

Country Link
CN (1) CN105677854A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127634A (zh) * 2016-06-20 2016-11-16 山东师范大学 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
CN108549987A (zh) * 2018-04-18 2018-09-18 河南理工大学 一种基于有向环分析的课程考核方法
CN113094359A (zh) * 2021-02-24 2021-07-09 华南师范大学 基于决策规则的考试数据预处理方法、系统、装置及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105854A (zh) * 2007-08-23 2008-01-16 上海交通大学 基于决策树的远程教育环境中学生情况在线检测方法
CN101216998A (zh) * 2008-01-11 2008-07-09 浙江工业大学 基于模糊粗糙集的证据理论城市交通流信息融合方法
US20080168436A1 (en) * 2006-02-24 2008-07-10 International Business Machines Corporation System and method for matching multi-node software system provisioning requirements and capabilities using rough set theory
CN101430309A (zh) * 2008-11-14 2009-05-13 西安建筑科技大学 基于粗糙集—rbf神经网络的环境质量评价方法
CN101819604A (zh) * 2010-05-24 2010-09-01 天津大学 基于概率粗糙集的决策树生成方法
CN102609470A (zh) * 2012-01-16 2012-07-25 华南师范大学 一种基于区间平均值的模糊粗糙单调数据挖掘方法
CN103646118A (zh) * 2013-12-27 2014-03-19 重庆绿色智能技术研究院 置信优势关系粗糙集模型及属性约简方法
CN104331532A (zh) * 2014-09-12 2015-02-04 广东电网公司江门供电局 基于粗糙集-云模型的电力变压器状态评价的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080168436A1 (en) * 2006-02-24 2008-07-10 International Business Machines Corporation System and method for matching multi-node software system provisioning requirements and capabilities using rough set theory
CN101105854A (zh) * 2007-08-23 2008-01-16 上海交通大学 基于决策树的远程教育环境中学生情况在线检测方法
CN101216998A (zh) * 2008-01-11 2008-07-09 浙江工业大学 基于模糊粗糙集的证据理论城市交通流信息融合方法
CN101430309A (zh) * 2008-11-14 2009-05-13 西安建筑科技大学 基于粗糙集—rbf神经网络的环境质量评价方法
CN101819604A (zh) * 2010-05-24 2010-09-01 天津大学 基于概率粗糙集的决策树生成方法
CN102609470A (zh) * 2012-01-16 2012-07-25 华南师范大学 一种基于区间平均值的模糊粗糙单调数据挖掘方法
CN103646118A (zh) * 2013-12-27 2014-03-19 重庆绿色智能技术研究院 置信优势关系粗糙集模型及属性约简方法
CN104331532A (zh) * 2014-09-12 2015-02-04 广东电网公司江门供电局 基于粗糙集-云模型的电力变压器状态评价的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
胡玉荣: "基于粗糙集理论的数据挖掘技术在高校学生成绩分析中的应用", 《荆门职业技术学院学报》 *
黄昱: "基于粗糙集理论的学生成绩分析", 《硅谷》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127634A (zh) * 2016-06-20 2016-11-16 山东师范大学 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
CN106127634B (zh) * 2016-06-20 2022-02-08 山东师范大学 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统
CN108549987A (zh) * 2018-04-18 2018-09-18 河南理工大学 一种基于有向环分析的课程考核方法
CN108549987B (zh) * 2018-04-18 2021-09-03 河南理工大学 一种基于有向环分析的课程考核方法
CN113094359A (zh) * 2021-02-24 2021-07-09 华南师范大学 基于决策规则的考试数据预处理方法、系统、装置及介质

Similar Documents

Publication Publication Date Title
Kitchenham et al. Evidence-based software engineering and systematic reviews
Sheu et al. Testing the choice model of social cognitive career theory across Holland themes: A meta-analytic path analysis
Theobald et al. Beyond linear regression: A reference for analyzing common data types in discipline based education research
Obsie et al. Prediction of student academic performance using neural network, linear regression and support vector regression: a case study
DE102014103281A1 (de) Verknüpfen unterschiedlicher typerzwingungskomponenten zum beurteilen eines latenten typs
Badawy et al. Exploring and measuring the key performance indicators in higher education institutions
Aljaloud et al. A deep learning model to predict Student learning outcomes in LMS using CNN and LSTM
Esomonu et al. Assessment Big Data in Nigeria: Identification, Generation and Processing in the Opinion of the Experts.
CN117522222A (zh) 一种基于大数据的教育测评软件实现方法
CN105677854A (zh) 基于粗糙集的学生单科成绩决策分析方法及分析器
Zen et al. Using Latent Semantic Analysis for automated grading programming assignments
CN117726485B (zh) 一种基于大数据的智适应教育学习方法及系统
Cox et al. Power to detect moderated effects in studies with three-level partially nested data
Wu et al. Toward effective automated content analysis via crowdsourcing
Zhao et al. On-line teaching appraisal system of vocational education based on convolutional neural network and big data platform
Georgiev et al. Semantic analysis of engineering design conversations
Ogunkunle et al. A data mining based optimization of selecting learning material in an intelligent tutoring system for advancing STEM education
Zhang et al. [Retracted] Design and Implementation of an Online Learning Behavior Evaluation System Based on Data Mining
Nteere et al. Influence of selected factors on students’ attitude towards physics in public secondary schools
London et al. Board# 90: Toward a shared meaning of the “impact” of engineering education research: Initial findings of a mixed methods study
Liu Predictive application of postgraduate English web-based hybrid teaching based on association rule algorithm
Beckedorf et al. Analyzing high volumes of German court decisions in an interdisciplinary class of law and computer science students
Li Design and Implementation of Student Management System Based on Internet Big Data
Bihui Design and implementation of mathematical MOOC based on BP Neural Network Algorithm
Wang The Application of Big Data Fuzzy K-means Clustering in Evaluating English Teaching Ability

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160615

RJ01 Rejection of invention patent application after publication