CN104239533A - 基于相关性的教务数据矩阵加权正负模式挖掘方法及系统 - Google Patents

基于相关性的教务数据矩阵加权正负模式挖掘方法及系统 Download PDF

Info

Publication number
CN104239533A
CN104239533A CN201410484486.0A CN201410484486A CN104239533A CN 104239533 A CN104239533 A CN 104239533A CN 201410484486 A CN201410484486 A CN 201410484486A CN 104239533 A CN104239533 A CN 104239533A
Authority
CN
China
Prior art keywords
subject
negative
item
item collection
frequent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410484486.0A
Other languages
English (en)
Inventor
黄名选
韦吉锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GUANGXI COLLEGE OF EDUCATION
Original Assignee
GUANGXI COLLEGE OF EDUCATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGXI COLLEGE OF EDUCATION filed Critical GUANGXI COLLEGE OF EDUCATION
Priority to CN201410484486.0A priority Critical patent/CN104239533A/zh
Publication of CN104239533A publication Critical patent/CN104239533A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于相关性的教务数据矩阵加权正负模式挖掘方法及系统,利用教务数据预处理模块进行教务数据预处理;利用科目候选项集生成模块产生科目候选项集;利用科目频繁项集和负项集产生模块根据项集支持期望得到科目负项集,计算候选项集支持度,与最小支持度阈值比较,得到矩阵加权科目频繁项集和负项集;利用科目正负关联规则产生模块生成科目频繁项集和负项集的全部真子集,计算项集相关性和置信度,与最小置信度阈值比较得到矩阵加权科目正负关联规则模式;利用科目正负关联模式显示模块将科目正负关联规则模式显示给用户。本发明运用于教务信息管理系统,能挖掘出与实际更接近的科目关联规则模式,为教学改革和教务管理、决策提供科学依据。

Description

基于相关性的教务数据矩阵加权正负模式挖掘方法及系统
技术领域
本发明属于教育数据挖掘领域,具体是一种基于相关性的教务数据矩阵加权正负模式挖掘方法及其挖掘系统,适用于教务数据科目正负关联模式发现,在教育信息化数据分析以及教育数据模式挖掘有重要的应用价值和广阔的应用前景,其模式可为教学改革和教育管理、决策提供科学的依据。
背景技术
现有关联规则模式挖掘研究及其在教育信息化领域中的应用研究主要集中在以下几个方面。
(1)正负关联模式挖掘方法研究:这是传统的关联模式挖掘方法,其典型方法有Apriori方法(R.Agrawal,T.Imielinski,A.Swami. Mining association rules between sets of items in large database[C]//Proceeding of 1993 ACM SIGMOD International Conference on Management of Data, Washington D.C.,1993, (5): 207-216.)、以及Wu等提出的基于PR模型的正负关联规则挖掘方法(Xindong Wu, Chengqi Zhang, and Shichao Zhang. Efficient Mining of Both Positive and Negative Association Rules[J].ACM Transactions on Information Systems, 2004,22(3): 381–405.)。近年来,传统关联模式挖掘技术在教育信息化领域中的应用得到很多关注和研究。Borkar采用传统的关联模式挖掘技术对学生信息数据、教师教学数据等进行挖掘或分类,挖掘出有趣的课程关联规则模式。通过模式分析,预测学生后续学业成绩和毕业情况,分析优秀教师的教学素养,给出提高教师教学素养能力的建议(S.Borkar, K.Rajeswari. Predicting Students Academic Performance Using Education Data Mining[J]. International Journal of Computer Science and Mobile Computing(IJCSMC), July 2013, 2(7):273 – 279)。传统关联模式挖掘方法的缺陷是:没有考虑项目之间存在着不同的重要性(即项目之间具有不同的权值)。
(2)加权正负关联模式挖掘方法:针对传统关联模式挖掘存在的缺陷,加权正负关联模式挖掘方法引入了项目权值,以体现项目之间具有不同的重要性。其典型方法有MINWAL算法(C. H. Cai, A.Da, W. C. Fu,et al. Mining Association Rules with Weighted Items [C]//Proceedings of IEEE International database Engineering and Application Symposiums, 1998: 68-77.)和Jiang等提出的加权正负关联规则挖掘算法(He Jiang,Yuanyuan Zhao. Mining Positive and Negative Association Rules with Weighted Items[C]//Proceedings of DCABES2008,China,2008: 450-454.)。2012年以来,加权关联模式挖掘在教育信息化领域中的应用开始得到关注和研究(陈世保,徐峰,吴国凤.基于难度系数的加权关联规则在试卷评估中的应用[J]. 井冈山大学学报(自然科学版),2013,34(1):70-74.;刘建炜,张颖.基于加权关联规则算法的学生成绩数据挖掘研究[J]. 福建教育学院学报,2012(3):123-125.)。加权关联模式挖掘的缺陷是:只考虑项目之间存在不同的权值,没有考虑项目在各个事务记录中也具有不同权值的情况。
(3)矩阵加权关联模式挖掘方法:矩阵加权数据指的是其项目权值随着事务记录不同而变化的一类数据,也称完全加权数据。现有加权关联模式挖掘技术不能用于矩阵加权关联模式的挖掘。2003年以来,矩阵加权关联模式挖掘方法被提出(谭义红,林亚平.向量空间模型中完全加权关联规则的挖掘[J].计算机工程与应用,2003(13):208-211;黄名选,严小卫,张师超.基于矩阵加权关联规则挖掘的伪相关反馈查询扩展[J].软件学报,2009,20(7):1854-1865.),但是这些挖掘算法不能解决矩阵加权负关联模式的挖掘问题。针对该问题,本发明提出一种基于相关性的教务数据矩阵加权正负模式挖掘方法及其挖掘系统。该发明方法考虑了项目之间具有的不同重要性以及项目在事务数据库中的权值,从教育信息化数据中挖掘科目频繁项集和负项集,在支持度-置信度-相关性架构下从这些科目项集中挖掘教育数据矩阵加权科目正负关联模式。其科目正负关联规则模式可为教学改革和教育管理、决策提供科学的依据,在教育信息化教务数据分析与挖掘领域具有重要的应用价值和广阔的应用前景。
发明内容
本发明的目的在于,针对教务数据科目正负关联模式挖掘进行深入探索,提出一种基于相关性的教务数据矩阵加权正负模式挖掘方法及其挖掘系统,应用于教育数据挖掘领域,为教务数据科目正负关联模式挖掘与分析提供新的发现方法,通过科目正负关联规则模式分析发现教育领域潜在的教育、教学规律和教育发展趋势,提高教师教学质量和学生的学习效果。
本发明所采取的技术方案是:一种基于相关性的教务数据矩阵加权正负模式挖掘方法,包括如下步骤:
(1)教务数据预处理:对于待处理的教务数据,提取学生课程信息及其成绩,将课程当作项目,课程成绩当作项目权值,课程权值规范化为0至1之间,构建学生记录数据库和科目项目库。
(2)挖掘教务数据矩阵加权科目频繁1-项集和负1-项集:从科目项目库中提取科目候选1-项集C 1,累加C 1的项集权值w(C 1),计算其支持度mwepsup(C 1),与最小支持度阈值ms比较,从C 1中挖掘矩阵加权科目频繁1-项集L 1和负1-项集N 1L 1加入科目频繁项集集合ciPISN 1加入科目负项集集合ciNIS。候选1-项集C 1支持度mwepsup(C 1)公式如下:
其中,n为学生记录数据库的记录总数。
(3)挖掘有趣的矩阵加权科目频繁i-项集Li 和负i-项集Ni (所述的i≥2),包括以下(3.1) 步至(3.6) 步:
(3.1) 通过科目i-项集支持期望得到教务数据矩阵加权科目负i-项集Ni 。具体方法如下:
矩阵加权科目(i-1)-项集的i-项集支持期望IISE(Ci -1, i)与其科目(i-1)-项集Ci -1的项集权值w(Ci -1)比较,可得到科目负i-项集,并加入科目负项集集合ciNIS中,即若科目(i-1)-项集的项集权值w(Ci -1)小于其i-项集支持期望项集支持期望IISE(Ci -1, i),即w(Ci -1)<IISE(Ci -1, i),则该科目(i-1)-项集的后续i-项集Ci 为矩阵加权科目负项集。科目(i-1)-项集的i-项集支持期望IISE(Ci -1, i)的计算公式为:
IISE(Ci -1, i)=n×i×ms-sc(Ci -1wr (Ci -1)
其中,sc(Ci -1)为科目候选项集Ci -1在学生记录数据库中的项集频度,wr (Ci -1)为在不属于Ci -1项目集合的其他项目中权值最大的项目权值。
(3.2)由其项集权值w(Ci -1)不小于其i-项集支持期望IISE(Ci -1, i)的科目候选(i-1)_项集Ci -1进行Apriori连接生成科目候选i-项集Ci 。科目(i-1)-项集的i-项集支持期望IISE(Ci -1, i)的计算公式同(3.1)的。
(3.3) 若科目候选i_项集Ci 不为空集,则转入如下(3.3)步,否则,退出(3)步,转入(4)步。
(3.4)计算科目候选i_项集Ci 的项集权值w(Ci )及其矩阵加权支持度mwepsup(Ci )。mwepsup(Ci )计算公式如下:
(3.5)项集支持度mwepsup(Ci )与最小支持度阈值ms比较,若mwepsup(Ci )≥ms,得到矩阵加权科目频繁i-项集,加入科目频繁项集集合ciPIS,若mwepsup(Ci )<ms,得到矩阵加权科目负i-项集,加入科目负项集集合ciNIS
(3.6) 计算候选i-项集的(i+1)-项集支持期望IISE(Ci , i+1)。IISE(Ci , i+1)的计算公式为:
IISE(Ci , i+1)=n×(i+1)×ms-sc(Ci wr (Ci )
其中,sc(Ci )为科目候选项集Ci 在学生记录数据库中的项集频度,wr (Ci )为在不属于Ci 项目集合的其他项目中权值最大的项目权值。
(3.7) 变量i加1后,继续循环(3.1)步至(3.7)步,直到Ci 为空集即退出(3)步,转入(4)步。
(4)从科目频繁项集集合ciPIS中挖掘矩阵加权科目强正负关联规则模式包括以下(4.1) 步至(4.6) 步:
(4.1)对于科目频繁项集集合ciPIS中的矩阵加权科目频繁项集Li ,将Li 的所有真子集找出。
(4.2)对于Li 的真子集集合中的取出两个真子集I1 I2 ,若I1 I2 的支持度不小于最小支持度阈值ms时,即mwepsup(I1 )≥msmwepsup(I2 )≥ms,并且I1 I2= I1 I2=Li ,则计算矩阵加权科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )。mwepsup(I1 )、mwepsup(I2 )和矩阵加权科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )的计算公式如下:
,其中,i1 i2 I1 I2 的项目个数,即项集维数。
(4.3) 若科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )>1,并且I1 I2 和﹁I1 →﹁I2 的置信度不小于最小置信度阈值mc,即mwepconf(I1 I2 )≥mcmwepconf(﹁I1 →﹁I2 )≥mc,则挖掘出矩阵加权科目强关联规则I1 I2 和强负关联规则﹁I1 →﹁I2 I1 I2 和﹁I1 →﹁I2 的置信度mwepconf(I1 I2 )和mwepconf(﹁I1 →﹁I2 )的计算公式如下:
(4.4) 若科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )<1,并且I1 →﹁I2 和﹁I1 I2 的置信度不小于最小置信度阈值mc,即mwepconf(I1 I2 )≥mcmwepconf(﹁I1 →﹁I2 )≥mc,则挖掘出矩阵加权科目强负关联规则I1 →﹁I2 和﹁I1 I2 mwepconf(I1 I2 )和mwepconf(﹁I1 →﹁I2 )的计算公式如下:
(4.5) 继续(4.2)步骤,当科目频繁项集Li 的真子集集合中每个真子集都被取出一次,而且仅能取出一次,则转入步骤(4.6)步;
(4.6) 继续(4.1)步骤,当科目频繁项集集合中每个频繁项集Li 都被取出一次,而且仅能取出一次,则(4)步运行结束,转入(5)步;
5 从矩阵加权科目负项集集合ciNIS中挖掘有效的矩阵加权科目负关联规则模式包括以下(5.1) 步至(5.6) 步:
(5.1)对于科目负项集集合ciNIS中的科目负项集Ni ,求出Ni 的所有真子集。
(5.2)对于Ni 的真子集集合中任意两个真子集I1 I2 ,若I1 I2 的支持度大于或等于最小支持度阈值ms时,即mwepsup(I1 )≥msmwepsup(I2 )≥ms,并且I1 I2= I1 I2=Ni ,则计算矩阵加权科目负项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )。mwepsup(I1 )、mwepsup(I2 )和完全加权课程频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )的计算公式同(4.2)的。
(5.3) 若科目负项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )>1,并且﹁I1 →﹁I2 的置信度不小于最小置信度阈值mc,则挖掘出矩阵加权科目强负关联规则﹁I1 →﹁I2 mwepconf(﹁I1 →﹁I2 )的计算公式同(4.3)的。
(5.4) 若科目负项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )<1,并且I1 →﹁I2 和﹁I1 I2 的置信度不小于最小置信度阈值mc,则挖掘出矩阵加权科目强负关联规则I1 →﹁I2 和﹁I1 I2 mwepconf(I1 →﹁I2 )和mwepconf(﹁I1 I2 )的计算公式同(4.4)的。
(5.5) 继续(5.2)步骤,当科目负项集Ni 的真子集集合中每个真子集都被取出一次,而且仅能取出一次,则转入步骤(5.6)步;
(5.6) 继续(5.1)步骤,当科目频繁项集集合中每个负项集Ni 都被取出一次,而且仅能取出一次,则(5)步运行结束;
至此,基于相关性的教务数据矩阵加权科目正负模式挖掘结束。所述的ms为最小支持度阈值,mc为最小置信度阈值。
一种适用于上述基于相关性的教务数据矩阵加权正负模式挖掘方法的挖掘系统,其特征在于,包括以下5个模块:
教务数据预处理模块:该模块对教务数据进行预处理,提取学生科目信息及其成绩,将学生的科目成绩权值规范化为0至1之间后构建学生记录数据库和科目项目库。
科目候选项集生成模块:该模块从学生记录数据库和科目项目库挖掘矩阵加权科目候选1-项集,从i-项集(i≥2)起,科目候选(i-1)-项集通过Apriori连接生成矩阵加权科目候选i-项集。
科目频繁项集和负项集产生模块:该模块首先通过科目i-项集支持期望得到教务数据矩阵加权科目负i-项集,然后累加科目候选i_项集Ci 的项集权值,计算其支持度,若其支持度不小于最小支持度阈值,则得到矩阵加权科目频繁i_项集,加入科目频繁项集集合,否则,得到矩阵加权科目负i-项集,加入科目负项集集合。
科目正负关联规则产生模块:该模块生成科目频繁项集和负项集的真子集,计算科目关联规则前件和后件的相关性和置信度,根据其相关性的值以及最小置信度阈值,从矩阵加权科目频繁项集和负项集中挖掘矩阵加权科目强正负关联规则模式。
科目正负关联模式显示模块:该模块将矩阵加权科目正负关联规则模式显示给用户,供教务人员分析和使用。
所述的科目频繁项集和负项集产生模块包括以下2个模块:
矩阵加权科目频繁项集产生模块:该模块累加科目候选i_项集Ci 的项集权值,计算其支持度,将其支持度不小于最小支持度阈值的矩阵加权科目频繁i_项集加入科目频繁项集集合。
矩阵加权科目负项集生成模块:该模块首先通过科目i-项集支持期望得到教务数据矩阵加权科目负i-项集,同时计算候选i-项集的(i+1)-项集支持期望,然后将其支持度小于最小支持度阈值的矩阵加权科目负项集加入科目负项集集合。
所述的科目正负关联规则产生模块包括以下3个模块:
科目频繁项集和负项集的真子集生成集模:该模块主要生成科目频繁项集和负项集的真子集,为挖掘关联规则做准备。
矩阵加权科目强正关联规则模式生成模块:该模块计算来自科目频繁项集中的关联规则前项和后项的相关性和置信度,根据其相关性的值以及最小置信度阈值,从矩阵加权科目频繁项集中挖掘矩阵加权科目强正关联规则模式。
矩阵加权科目强负关联规则模式生成模块:该模块计算自科目负项集中的关联规则前项和后项的相关性和置信度,根据其相关性的值以及最小置信度阈值,从矩阵加权科目负项集中挖掘矩阵加权科目强负关联规则模式。
所述的挖掘系统中的支持度阈值,置信度阈值,由用户输入。
与现有技术相比,本发明具有以下有益效果:
(1)本发明提出一种新的基于相关性的教务数据矩阵加权正负模式挖掘方法及其挖掘系统。该发明方法的掘出的矩阵加权科目频繁项集和科目正负关联规则数量都比对比算法的少,说明其无效的科目频繁项集和关联规则减少了,同时,该发明方法比对比方法能挖掘出更多的负项集。
(2)本发明方法从科目频繁项集和科目负项集中挖掘科目正负关联规则效率得到了很好的提升,其挖掘时间比对比方法的低得多。
(3)以真实的高校课程考试成绩作为本发明实验数据测试集,将本发明与现有的无加权模式挖掘方法进行实验比较和分析,实验结果表明,与基于项集频度挖掘的对比方法不同,本发明方法是基于学生成绩权值的挖掘,能挖掘出客观反映教学效果的矩阵加权课程关联模式,通过模式分析后得到的教育、教学模式应该更客观、更合理,更接近现实情况。该发明运用于高校教务管理系统,可以扩展教务管理功能,其科目关联模式可以有助于教师改善和调整教学方法,提高教学质量,同时,可以帮助学生提高学习效果。
附图说明
图1是本发明所述的基于相关性的教务数据矩阵加权正负模式挖掘方法的框图。
图2是本发明所述的基于相关性的教务数据矩阵加权正负模式挖掘方法的整体流程图。
图3是本发明所述的基于相关性的教务数据矩阵加权正负模式挖掘系统的结构框图。
图4是本发明所述的科目频繁项集和负项集产生模块的结构框图。
图5是本发明所述的科目正负关联规则产生模块的结构框图。
具体实施方式
为了更好地说明本发明的技术方案,下面将本发明涉及的教育数据模型和相关的概念介绍如下:
一、基本概念
以教育信息化中课程考试成绩数据为例,把每个科目当作项目,将每个科目的考试成绩当作项目权值,每个学生记录看作事务记录。设SD={s1,s2, , sn }是教育信息化学生数据库(SD: StudentDatabase), si (1≦in)表示SD中的第i个学生(student)记录,subject={c1,c2, ,cm }表示SD中学生所选修的科目 (subject)项集, cj (1≦jm)表示SD中第j个科目项目,r[si ][cj ] (1≦in, 1≦jm))表示SD中第j门科目cj 在学生记录si 中的考试成绩(result)权值,如果科目cj 没有被学生选修,即cj Ïsi ,则cj 在该学生记录si 的成绩权值r[si ][cj ] =0。
对于学生数据库SD,设I1 ={ c 1 ,c2, ,cm 1 }(m1<m),I2 ={ c 1 ,c2, ,cm 2 }(m2<m),I1 subjectI2 subjectI1 I2= ,参照传统的支持度和置信度概念,给出如下基本定义。
定义1 (教育信息化数据矩阵加权模式支持度 : matrix weighted education patterns support, mwepsup) 参照文献(谭义红,林亚平.向量空间模型中完全加权关联规则的挖掘[J].计算机工程与应用,2003(13):208-211.)的完全加权支持度定义,给出教育信息化数据矩阵加权项集I支持度mwepsup(I)的计算公式如式(1)所示。
(1)
其中,是项集I在学生数据库SD中的权值总和。k为项集I的项目个数,nSD的事务记录总数。
教育信息化矩阵加权数据负关联模式的支持度计算如公式(2)至(5)所示:
(2)
(3)
(4)
(5)
定义2 (教育信息化数据矩阵加权模式置信度: matrix weighted education patterns confidence, mwepconf ):教育信息化数据矩阵加权模式置信度的计算如公式(6)到公式(9):
(6)
(7)
(8)
(9)
定义3 (教育信息化数据矩阵加权强正负关联模式):有趣的教育信息化数据矩阵加权强正负关联模式(I1 I2 I1 →﹁I2 ,﹁I1 I2 ,﹁I1 →﹁I2 )是指I1 I2 的支持度不小于最小支持度阈值msI1 I2 I1 →﹁I2 ,﹁I1 I2 ,﹁I1 →﹁I2 的支持度和置信度分别都不小于ms和最小置信度阈值mc
定义 4 i-项集支持期望(IISE(Ci -1, i)) 矩阵加权科目(i-1)-项集的i-项集支持期望IISE(Ci -1, i)是指包含科目项集Ci -1的i项集频繁的权值估计值。根据IISE(Ci -1, i),可以预测包含Ci -1的后续i _项集的频繁性。
IISE(Ci -1, i)的计算公式为:
IISE(Ci -1, i)=n×i×ms-sc(Ci -1wr (Ci -1)
其中,sc(Ci -1)为科目候选项集Ci -1在学生数据库中的项集频度,wr (Ci -1)为在不属于Ci -1项目集合的其他项目中权值最大的项目权值。
定义5 教育数据矩阵加权项集相关性( ciCorr(I1 ,I2 )): 教育数据矩阵加权项集(I1 ,I2 )相关性(ciCorr(I1 ,I2 ))是用来衡量两个矩阵加权项集I1 I2 的相关联情况,如正相关、负相关以及无相关等,其计算如式(10)所示。
(10)
下面通过具体实施例对本发明的技术方案做进一步的说明。
具体实施例中本发明采取的挖掘方法和系统如图1-图5所示。
实例:表1是一个科目项目库实例,表2是学生选修科目的学生信息库实例,即有5个科目项目和5个学生信息记录以及各个科目项目的成绩权值,其中成绩权值已经进行规范化处理,使之在0到1之间,没有选修的课程成绩为0,满分的课程成绩为1。
采用本发明挖掘方法对该科目信息数据实例挖掘矩阵加权科目正负关联模式,其挖掘过程如下(ms=0. 50,mc=0.55):
1. 挖掘矩阵加权科目频繁1_项集L 1和负1-项集N 1,如表1所示,其中n=5。
表3:
C 1 w(C 1) mwepsup(C 1) sc(C 1) wr (C 1) IISE(C 1, 2)
(i1 ) 2.83 0.566 4 0.95 =5×2×0.5-4×0.95=1.2
(i2 ) 3.35 0.67 4 0.95 =5×2×0.5-4×0.95=1.2
(i3 ) 3.13 0.626 4 0.95 =5×2×0.5-4×0.95=1.2
(i4 ) 2.3 0.46 4 0.95 =5×2×0.5-4×0.95=1.2
(i5 ) 3.48 0.695 4 0.95 =5×2×0.5-4×0.95=1.2
由表3可知,L1 ={(i1 ), (i2 ), (i3 ), (i5 )},N1 ={(i4 ) }
科目频繁项集集合ciPIS={(i1 ), (i2 ), (i3 ), (i5 )}。科目负项集集合ciNIS={(i4 ) }
2. 挖掘矩阵加权课程频繁k_项集Lk 和负k-项集Nk ,所述的k≥2。
k=2:
(1) 由其项集权值w(C 1)不小于其2-项集支持期望IISE(C 1, 2)的科目候选1_项集C 1进行Apriori连接,生成课程候选2_项集C 2,如表4所示。
表4:
C 2 w(C2 ) mwepsup(C2 ) sc(C 2) wr (C 2) IISE(C 2, 3)
(i1 , i2 ) 4.93 0.493 3 0.95 =5×3×0.5-3×0.95=4.65
(i1 , i3 ) 4.29 0.429 3 0.95 =5×3×0.5-3×0.95=4.65
(i1 , i4 ) 3.61 0.361 3 0.95 =5×3×0.5-3×0.95=4.65
(i1 , i5 ) 4.64 0.464 3 0.95 =5×3×0.5-3×0.95=4.65
(i2 , i3 ) 5.27 0.527 3 0.86 =5×3×0.5-3×0.86=4.92
(i2 , i4 ) 4.39 0.439 3 0.95 =5×3×0.5-3×0.95=4.65
(i2 , i5 ) 5.0 0.5 3 0.95 =5×3×0.5-3×0.95=4.65
(i3 , i4 ) 4.09 0.409 3 0.95 =5×3×0.5-3×0.95=4.65
(i3 , i5 ) 4.84 0.484 3 0.95 =5×3×0.5-3×0.95=4.65
(i4 , i5 ) 4.21 0.421 3 0.95 =5×3×0.5-3×0.95=4.65
由表4可得:
﹡矩阵加权科目频繁2-项集L2 有:(i2 , i3 ),(i2 , i5 ),即L2 ={ (i2 , i3 ) , (i2 , i5 ) }, ciPIS={(i1 ), (i2 ), (i3 ), (i5 ), (i2 , i3 ) , (i2 , i5 )}
﹡矩阵加权课程负2-项集N2 有:(i1 , i2 ),(i1 , i3 ),(i1 , i4 ),(i1 , i5 ),(i2 , i4 ),(i3 , i4 ),(i3 , i5 ),(i4 , i5 ),即N2 ={(i1 , i2 ),(i1 , i3 ),(i1 , i4 ),(i1 , i5 ),(i2 , i4 ),(i3 , i4 ),(i3 , i5 ),(i4 , i5 )},ciNIS={(i4 ) , (i1 , i2 ),(i1 , i3 ),(i1 , i4 ),(i1 , i5 ),(i2 , i4 ),(i3 , i4 ),(i3 , i5 ),(i4 , i5 )}。
k=3:
﹡通过科目3-项集支持期望IISE(C 2, 3)得到教务数据矩阵加权科目负3-项集N3 。从表4可得,其w(C2 )< IISE(C 2, 3)的矩阵加权科目候选2-项集有:(i1 , i3 ), (i1 , i4 ), (i1 , i5 ), (i2 , i4 ), (i3 , i4 ), (i4 , i5 ),这些项集的后续3-项集都是负项集,N3 ={(i1 , i3 , i4 ), (i1 , i3 , i5 ), (i2 , i4 , i5 ), (i3 , i4 , i5 ) },ciNIS={(i4 ) , (i1 , i2 ) , (i1 , i3 ) , (i1 , i4 ) , (i1 , i5 ) , (i2 , i4 ) , (i3 , i4 ) , (i3 , i5 ) , (i4 , i5 ), (i1 , i3 , i4 ), (i1 , i3 , i5 ), (i2 , i4 , i5 ), (i3 , i4 , i5 )}
﹡由其项集权值w(C 2)不小于其3-项集支持期望IISE(C 2, 3)的课程候选2-项集进行Apriori连接生成课程候选3_项集C3 ,由表4可得,C3 ={ (i2 , i3 , i5 ) },如表5所示,
表5:
C 3 w(C3 ) mwepsup(C3 ) sc(C 3) wr (C 3) IISE(C 3, 4)
(i2 , i3 , i5 ) 5.15 0.343 2 0.81 =5×4×0.5-2×0.81=8.38
由表5可得:
﹡矩阵加权科目频繁3-项集L3 为空集。
﹡矩阵加权科目负3-项集N3 有: (i2 , i3 , i5 ),即,N3 ={ (i2 , i3 , i5 )},ciNIS={(i4 ) , (i1 , i2 ) , (i1 , i3 ) , (i1 , i4 ) , (i1 , i5 ) , (i2 , i4 ) , (i3 , i4 ) , (i3 , i5 ) , (i4 , i5 ), (i1 , i3 , i4 ), (i1 , i3 , i5 ), (i2 , i4 , i5 ), (i3 , i4 , i5 ), (i2 , i3 , i5 )}
k=4:
﹡由表5可得,其w(C3 )<IISE(C 3, 4)的矩阵加权科目候选3-项集有:(i2 , i3 , i5 ),这些项集没有后续4-项集,N4 为空集。
C4 为空集,挖掘矩阵加权科目频繁k_项集Lk 和负k-项集Nk 结束,转入如下3步骤。
﹡最终挖掘项集结果为:ciPIS={(i1 ), (i2 ), (i3 ), (i5 ), (i2 , i3 ) , (i2 , i5 )},ciNIS={(i4 ) , (i1 , i2 ) , (i1 , i3 ) , (i1 , i4 ) , (i1 , i5 ) , (i2 , i4 ) , (i3 , i4 ) , (i3 , i5 ) , (i4 , i5 ), (i1 , i3 , i4 ), (i1 , i3 , i5 ), (i2 , i4 , i5 ), (i3 , i4 , i5 ), (i2 , i3 , i5 )}。
3. 从科目频繁项集集合ciPIS中挖掘矩阵加权科目正负关联规则模式。
ciPIS中科目频繁项集(i2 , i5 )为例,给出矩阵加权科目正负关联规则模式挖掘过程如下:
科目频繁项集(i2 , i5 )的真子集集合为{( i2 ), (i5 ) },设I1 =( i2 ),I2 =(i5 )。
mwepsup(I1 )= 0.67≥msmwepsup(I2 )= 0.695≥msmwepsup(I1 ,I2 )= 0.5
由于ciCorr(I1 ,I2 )>1,所以,
mwepsup(﹁I 1,﹁I 2)=1–0.67 –0.695+0.5=0.135
故能挖掘出矩阵加权科目强关联规则I1 I2 ,即( i2 )→(i5 ),或者,
综上所述,对于科目频繁项集(i2 , i5 ),可以挖掘出矩阵加权科目正关联规则模式 ( i2 )→(i5 )(ms=0. 50,mc=0.55)。
4. 从科目负项集集合ciNIS中挖掘矩阵加权科目负关联规则模式。
ciNIS中科目负项集(i1 , i3 , i4 )和(i2 , i3 , i5 )为例,给出矩阵加权课程强负关联规则模式挖掘过程如下:
﹡负项集(i1 , i3 , i4 )的真子集集合为{( i1 ), ( i3 ), (i4 ), (i1 ,i3 ), (i1 ,i4 ), ( i3 , i4 ) }。
(1)设I1 =( i1 ),I2 = (i3 , i4 ),
mwepsup(I1 )= 0.566>msmwepsup(I2 )= 0.409<ms,所以挖掘不出课程关联规则。
(2)设I1 =( i3 ),I2 = (i1 ,i4 ),
mwepsup(I1 )= 0.626>msmwepsup(I2 )= 0.361<ms,所以挖掘不出课程关联规则。
(3)设I1 =( i4 ),I2 = (i1 ,i3 ),
mwepsup(I1 )= 0.46<msmwepsup(I2 )= 0.429<ms,所以挖掘不出课程关联规则。
﹡负项集(i2 , i3 , i5 )的真子集集合为{( i2 ), ( i3 ), (i5 ), (i2 ,i3 ), (i2 ,i5 ), ( i3 , i5 ) }。
(1)设I1 =( i2 ),I2 = (i3 , i5 ),
mwepsup(I1 )= 0.67>msmwepsup(I2 )= 0.484<ms,所以挖掘不出课程关联规则。
(2)设I1 =( i3 ),I2 = (i2 ,i5 ),
mwepsup(I1 )= 0.626>msmwepsup(I2 )= 0.5=msmwepsup(I1 ,I2 )= 0.343,所以,
由于ciCorr(I1 ,I2 )>1,所以,
mwepsup(﹁I 1,﹁I 2)=1–0.626 –0.5+0.343=0.217
故能挖掘出矩阵加权科目强关联规则﹁I1 →﹁I2 ,即﹁(i3 )→﹁(i2 ,i5 )。
(3)设I1 =( i5 ),I2 = (i2 ,i3 ),
mwepsup(I1 )= 0.695>msmwepsup(I2 )= 0.527>msmwepsup(I1 ,I2 )= 0.343,所以,
由于ciCorr(I1 ,I2 )<1,所以,
故能挖掘出矩阵加权科目强关联规则﹁I1 I2 ,即﹁(i5 )→(i2 ,i3 )。
综上所述,对于课程负项集(i2 , i3 , i5 ),可以挖掘出矩阵加权科目强负关联规则﹁(i5 )→(i2 ,i3 ) (ms=0. 50,mc=0.55)。
下面通过实验对本发明的有益效果做进一步说明。
为了验证本发明方法的有效性,将高校教务真实的课程考试成绩数据为实验数据测试集。选择历届毕业生在校学习的课程考试成绩数据作为本文实验数据测试集,共1500位学生数据,121门科目。实验数据作如下的预处理:①为了使科目项目权值在0到1之间,将科目成绩都除以100;②对科目项目名称统一编号,如英语语法用I1表示,英语语音用I2表示,等等。
选择经典无加权正负关联规则挖掘方法(WU Xin-dong, ZHANG Cheng-qi and ZHANG Shi-chao. Efficient mining of both positive and negative association rules[J]. ACM Transactions on Information Systems, 2004,22(3): 381–405.)(记为PNAR_Mining方法)为实验对比方法,编写实验源程序,分别从支持度阈值变化和置信度阈值变化两种情况对本发明和对比方法的挖掘性能进行实验对比和分析。
实验 1 :频繁项集和负项集模式的数量比较
支持度阈值变化的情况下两种方法挖掘出的教育信息化数据科目频繁项集和负项集模式数量比较如表6所示。
表6在不同支持度阈值下频繁项集和负项集数量比较
(mc=0.6,项目总数=50)
实验 2 :正负关联规则模式数量比较
(1)支持度阈值变化情况下两种方法挖掘出的教育信息化数据科目正负关联规则模式(I1 I2 和﹁I1 →﹁I2 )数量比较如表7所示。
表7在不同支持度阈值下其正负关联规则数量比较
(mc =0.6,项目总数=50)
(2)置信度阈值变化情况下两种方法挖掘出的教育信息化数据科目正负关联规则模式(I1 I2 和﹁I1 →﹁I2 )数量比较如表8所示。
表8 在不同置信度阈值下正负关联规则数量比较
(ms=0.2,项目总数=50)
实验 3 :挖掘时间效率比较
(1)支持度阈值变化情况下科目项集(即频繁项集和负项集)模式挖掘时间比较。在测试集中,项目总数为10,不同支持度阈值下2种方法挖掘科目项集的时间比较如表9所示。
表9 在不同支持度阈值下项集挖掘时间(秒)比较
(mc =0.6,项目总数=10)
ms PNAR_Mining 本发明
0.1 1465.928 1411.204
0.2 1464.239 1394.125
0.3 90.630 1389.953
0.4 89.615 1398.876
0.5 90.474 1390.922
合计 3200.886 6985.08
(2)置信度阈值变化情况下正负关联规则模式挖掘时间比较。在测试集中,支持度为0.2,项目总数为50,不同置信度阈值下2种方法的正负关联规则挖掘时间比较如表10所示。
表10 在不同置信度阈值下正负关联规则挖掘时间(秒)比较
(ms =0.2,项目总数=50)
mc PNAR_Mining 本发明
0.2 6120.49 572.489
0.3 1809.196 569.923
0.4 6030.356 559.564
0.5 6055.202 543.316
0.6 1792.426 521.232
0.7 1919.359 497.841
0.8 3048.415 475.683
0.9 2968.621 470.324
合计 29744.065 4210.372
综上所述,本发明方法是有效的,与现有无加权正负关联模式挖掘方法比较,具有以下特点:
(1)本发明方法挖掘出的矩阵加权科目频繁项集和正负关联规则数量都比对比方法的少,说明其无效的科目频繁项集和科目关联规则减少了,同时,本发明方法比对比方法能挖掘出更多的负项集;
(2)本发明方法的挖掘时间比对比方法的低得多。
(3)对比方法会挖掘出较多无效的、不合理的关联模式,特别是能挖掘出形如I1 →﹁I2 和﹁I1 I2 的负关联模式,这类负模式在科目关联模式分析中应该是不合理的无效模式,因为这类科目关联负模式(I1 →﹁I2 和﹁I1 I2 )在实际科目关联分析中没有意义。在整个实验中,没有发现本发明方法能挖掘出这类负模式。

Claims (5)

1.一种基于相关性的教务数据矩阵加权正负模式挖掘方法,其特征在于,包括如下步骤:
(1)教务数据预处理:对于待处理的教务数据,提取学生课程信息及其成绩,将课程当作项目,课程成绩当作项目权值,课程权值规范化为0至1之间,构建学生记录数据库和科目项目库;
(2)挖掘教务数据矩阵加权科目频繁1-项集和负1-项集:从科目项目库中提取科目候选1-项集C 1,累加C 1的项集权值,计算其支持度mwepsup(C 1),与最小支持度阈值ms比较,从C 1中挖掘矩阵加权科目频繁1-项集L 1和负1-项集N 1L 1加入科目频繁项集集合ciPISN 1加入科目负项集集合ciNIS;
(3) 挖掘有趣的矩阵加权科目频繁i-项集Li 和负i-项集Ni (所述的i≥2),包括以下(3.1) 步至(3.6) 步:
(3.1) 通过科目i-项集支持期望得到教务数据矩阵加权科目负i-项集Ni
(3.2)由其项集权值w(Ci -1)不小于其i-项集支持期望IISE(Ci -1, i)的科目候选(i-1)_项集Ci -1进行Apriori连接生成科目候选i-项集Ci ;
(3.3) 若科目候选i_项集Ci 不为空集,则转入如下(3.3)步,否则,退出(3)步,转入(4)步;
(3.4) 计算科目候选i_项集Ci 的项集权值及其矩阵加权支持度;
(3.5) 项集支持度与最小支持度阈值比较,得到矩阵加权科目频繁i-项集和负i-项集,频繁i-项集加入科目频繁项集集合,负i-项集加入科目负项集集合;
(3.6) 计算候选i-项集的(i+1)-项集支持期望;
(3.7) 变量i加1后,继续循环(3.1)步至(3.7)步,直到Ci 为空集即退出(3)步,转入(4)步;
(4)从科目频繁项集集合中挖掘矩阵加权科目强正负关联规则模式包括以下(4.1) 步至(4.6) 步:
(4.1) 对于科目频繁项集集合中的矩阵加权科目频繁项集Li ,将Li 的所有真子集找出;
(4.2) 对于Li 的真子集集合中的取出两个真子集I1 I2 ,若I1 I2 的支持度不小于最小支持度阈值ms时,即mwepsup(I1 )≥msmwepsup(I2 )≥ms,并且I1 I2= I1 I2=Li ,则计算矩阵加权科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 );
(4.3) 若科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )>1,并且I1 I2 和﹁I1 →﹁I2 的置信度不小于最小置信度阈值mc,则挖掘出矩阵加权科目强关联规则I1 I2 和强负关联规则﹁I1 →﹁I2
(4.4) 若科目频繁项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )<1,并且I1 →﹁I2 和﹁I1 I2 的置信度不小于最小置信度阈值mc,则挖掘出矩阵加权科目强负关联规则I1 →﹁I2 和﹁I1 I2
(4.5) 继续(4.2)步骤,当科目频繁项集Li 的真子集集合中每个真子集都被取出一次,而且仅能取出一次,则转入步骤(4.6)步;
(4.6) 继续(4.1)步骤,当科目频繁项集集合中每个频繁项集Li 都被取出一次,而且仅能取出一次,则(4)步运行结束,转入(5)步;
(5 从矩阵加权科目负项集集合中挖掘有效的矩阵加权科目负关联规则模式包括以下(5.1) 步至(5.6) 步:
(5.1) 对于科目负项集集合中的科目负项集Ni ,求出Ni 的所有真子集;
(5.2) 对于Ni 的真子集集合中任意两个真子集I1 I2 ,若I1 I2 的支持度大于或等于最小支持度阈值ms时,即mwepsup(I1 )≥msmwepsup(I2 )≥ms,并且I1 I2= I1 I2=Ni ,则计算矩阵加权科目负项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 );
(5.3) 若科目负项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )>1,并且﹁I1 →﹁I2 的置信度不小于最小置信度阈值mc,则挖掘出矩阵加权科目强负关联规则﹁I1 →﹁I2
(5.4) 若科目负项集(I1 ,I2 )的相关性ciCorr(I1 ,I2 )<1,并且I1 →﹁I2 和﹁I1 I2 的置信度不小于最小置信度阈值mc,则挖掘出矩阵加权科目强负关联规则I1 →﹁I2 和﹁I1 I2
(5.5) 继续(5.2)步骤,当科目负项集Ni 的真子集集合中每个真子集都被取出一次,而且仅能取出一次,则转入步骤(5.6)步;
(5.6) 继续(5.1)步骤,当科目频繁项集集合中每个负项集Ni 都被取出一次,而且仅能取出一次,则(5)步运行结束;
至此,基于相关性的教务数据矩阵加权科目正负模式挖掘结束;
所述的ms为最小支持度阈值,mc为最小置信度阈值。
2.一种适用于权利要求1所述的基于相关性的教务数据矩阵加权正负模式挖掘系统,其特征在于,包括以下5个模块:
教务数据预处理模块:该模块对教务数据进行预处理,提取学生科目信息及其成绩,将学生的科目成绩权值规范化为0至1之间后构建学生记录数据库和科目项目库;
科目候选项集生成模块:该模块从学生记录数据库和科目项目库挖掘矩阵加权科目候选1-项集,从i-项集(i≥2)起,科目候选(i-1)-项集通过Apriori连接生成矩阵加权科目候选i-项集;
科目频繁项集和负项集产生模块:该模块首先通过科目i-项集支持期望得到教务数据矩阵加权科目负i-项集,然后累加科目候选i_项集Ci 的项集权值,计算其支持度,若其支持度不小于最小支持度阈值,则得到矩阵加权科目频繁i_项集,加入科目频繁项集集合,否则,得到矩阵加权科目负i-项集,加入科目负项集集合;
科目正负关联规则产生模块:该模块生成科目频繁项集和负项集的真子集,计算科目关联规则前件和后件的相关性和置信度,根据其相关性的值以及最小置信度阈值,从矩阵加权科目频繁项集和负项集中挖掘矩阵加权科目强正负关联规则模式;
科目正负关联模式显示模块:该模块将矩阵加权科目正负关联规则模式显示给用户,供教务人员分析和使用。
3.根据权利要求2所述的挖掘系统,其特征在于,所述的科目频繁项集和负项集产生模块包括以下2个模块:
矩阵加权科目频繁项集产生模块:该模块累加科目候选i_项集Ci 的项集权值,计算其支持度,将其支持度不小于最小支持度阈值的矩阵加权科目频繁i_项集加入科目频繁项集集合;
矩阵加权科目负项集生成模块:该模块首先通过科目i-项集支持期望得到教务数据矩阵加权科目负i-项集,同时计算候选i-项集的(i+1)-项集支持期望,然后将其支持度小于最小支持度阈值的矩阵加权科目负项集加入科目负项集集合。
4.根据权利要求2所述的挖掘系统,其特征在于,所述的科目正负关联规则产生模块包括以下3个模块:
科目频繁项集和负项集的真子集生成集模:该模块主要生成科目频繁项集和负项集的真子集,为挖掘关联规则做准备;
矩阵加权科目强正关联规则模式生成模块:该模块计算来自科目频繁项集中的关联规则前项和后项的相关性和置信度,根据其相关性的值以及最小置信度阈值,从矩阵加权科目频繁项集中挖掘矩阵加权科目强正关联规则模式;
矩阵加权科目强负关联规则模式生成模块:该模块计算自科目负项集中的关联规则前项和后项的相关性和置信度,根据其相关性的值以及最小置信度阈值,从矩阵加权科目负项集中挖掘矩阵加权科目强负关联规则模式。
5.根据权利要求2-4中任一项所述的挖掘系统,其特征在于,所述的挖掘系统中的支持度阈值,置信度阈值,由用户输入。
CN201410484486.0A 2014-09-22 2014-09-22 基于相关性的教务数据矩阵加权正负模式挖掘方法及系统 Pending CN104239533A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410484486.0A CN104239533A (zh) 2014-09-22 2014-09-22 基于相关性的教务数据矩阵加权正负模式挖掘方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410484486.0A CN104239533A (zh) 2014-09-22 2014-09-22 基于相关性的教务数据矩阵加权正负模式挖掘方法及系统

Publications (1)

Publication Number Publication Date
CN104239533A true CN104239533A (zh) 2014-12-24

Family

ID=52227592

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410484486.0A Pending CN104239533A (zh) 2014-09-22 2014-09-22 基于相关性的教务数据矩阵加权正负模式挖掘方法及系统

Country Status (1)

Country Link
CN (1) CN104239533A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868314A (zh) * 2016-03-25 2016-08-17 齐鲁工业大学 一种多支持度下的加权负序列模式数据挖掘方法
CN109214455A (zh) * 2018-09-05 2019-01-15 北京国网富达科技发展有限责任公司 油色谱数据与台账数据的相关性确定方法及系统
CN109299282A (zh) * 2018-08-16 2019-02-01 山东女子学院 基于文本分析及关联规则挖掘的概念图自动生成方法
CN109471885A (zh) * 2018-09-30 2019-03-15 齐鲁工业大学 基于加权正负序列模式的数据分析方法及系统
CN109657875A (zh) * 2018-12-29 2019-04-19 三盟科技股份有限公司 基于大数据环境下的成绩预测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279570A (zh) * 2013-06-19 2013-09-04 广西教育学院 一种面向文本数据库的矩阵加权负模式挖掘方法
CN103955542A (zh) * 2014-05-20 2014-07-30 广西教育学院 文本词间完全加权正负关联模式挖掘方法及其挖掘系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103279570A (zh) * 2013-06-19 2013-09-04 广西教育学院 一种面向文本数据库的矩阵加权负模式挖掘方法
CN103955542A (zh) * 2014-05-20 2014-07-30 广西教育学院 文本词间完全加权正负关联模式挖掘方法及其挖掘系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
余如 等: "教育信息化中课程考试成绩数据关联模式的发现", 《计算机与现代化》 *
黄名选: "基于负关联规则与频繁项集挖掘的信息检索系统", 《现在图书情报技术》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868314A (zh) * 2016-03-25 2016-08-17 齐鲁工业大学 一种多支持度下的加权负序列模式数据挖掘方法
CN109299282A (zh) * 2018-08-16 2019-02-01 山东女子学院 基于文本分析及关联规则挖掘的概念图自动生成方法
CN109214455A (zh) * 2018-09-05 2019-01-15 北京国网富达科技发展有限责任公司 油色谱数据与台账数据的相关性确定方法及系统
CN109471885A (zh) * 2018-09-30 2019-03-15 齐鲁工业大学 基于加权正负序列模式的数据分析方法及系统
CN109471885B (zh) * 2018-09-30 2022-05-31 齐鲁工业大学 基于加权正负序列模式的数据分析方法及系统
CN109657875A (zh) * 2018-12-29 2019-04-19 三盟科技股份有限公司 基于大数据环境下的成绩预测方法及系统

Similar Documents

Publication Publication Date Title
Yu et al. LSTM-EFG for wind power forecasting based on sequential correlation features
Sun et al. Using Bayesian deep learning to capture uncertainty for residential net load forecasting
Chang Towards data analysis for weather cloud computing
Zhu et al. Gaussian mixture model coupled recurrent neural networks for wind speed interval forecast
CN104239533A (zh) 基于相关性的教务数据矩阵加权正负模式挖掘方法及系统
Feng et al. Modeling non-linear displacement time series of geo-materials using evolutionary support vector machines
CN104217013A (zh) 基于项加权和项集关联度的课程正负模式挖掘方法及系统
Lee CARBayes version 6.1. 1: An R Package for Spatial Areal Unit Modelling with Conditional Autoregressive Priors
Zhang et al. An automated bug triage approach: A concept profile and social network based developer recommendation
Kobayashi et al. Bayesian analysis of quantile regression for censored dynamic panel data
Chen et al. An objective method for partitioning the entire flood season into multiple sub-seasons
Abidoye et al. Effects of environmental and turbine parameters on energy gains from wind farm system: Artificial neural network simulations
CN104317794A (zh) 基于动态项权值的中文特征词关联模式挖掘方法及其系统
CN103970651A (zh) 基于组件安全属性的软件体系结构安全性评估方法
Huang et al. Grouped spatial autoregressive model
Hu et al. Data Customization-based Multiobjective Optimization Pruning Framework for Remote Sensing Scene Classification
CN104239430A (zh) 基于项权值变化的教育数据关联规则挖掘方法及其系统
Yu et al. Structural modal parameter identification based on 2D spectral analysis
Rodríguez-Gómez et al. A novel clustering based method for characterizing household electricity consumption profiles
CN104182528B (zh) 基于偏序模式的教育信息化课程关联模式发现方法及系统
Chen et al. Transient voltage stability assessment of renewable energy grid based on residual SDE-Net
CN104239536A (zh) 基于互信息的完全加权课程正负关联模式挖掘方法及系统
Kurniawan et al. Sustainable development for smart city education based on features and parameters assessment modelling slope one algorithm
Jiang et al. Mobile Base Station Traffic Prediction Based on Traffic Data Analysis [J]
Du et al. Model averaging based on rank

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141224