CN107578181A - 基于统计频率和关联规则的异常学生挖掘方法 - Google Patents

基于统计频率和关联规则的异常学生挖掘方法 Download PDF

Info

Publication number
CN107578181A
CN107578181A CN201710834420.3A CN201710834420A CN107578181A CN 107578181 A CN107578181 A CN 107578181A CN 201710834420 A CN201710834420 A CN 201710834420A CN 107578181 A CN107578181 A CN 107578181A
Authority
CN
China
Prior art keywords
student
abnormal
students
data
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710834420.3A
Other languages
English (en)
Inventor
邓晓衡
郑静益
沈海澜
龙芳
黄戎
陈凌驰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201710834420.3A priority Critical patent/CN107578181A/zh
Publication of CN107578181A publication Critical patent/CN107578181A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于统计频率和关联规则的异常学生挖掘方法,包括构建学生‑成绩矩阵;得到学生‑课程异常矩阵;划分出全局型异常学生;获得学生各课程成绩之间的关联关系;对所有学生的异常科目进行分组合并;划分出偏科型异常学生;对学生进行分类,从而挖掘得到最终的异常学生。本发明提出了一种新的算法,通过统计频率计算学生全部已修科目的考试成绩异常总量,设置合理阈值划分全局型异常学生,有效的降低噪声影响;通过关联规则表达课程的相关性,计算学生出现问题的科目的关联规则信息熵,从而描述学生的偏科程度,能够更加准确的划分出偏科型异常学生。

Description

基于统计频率和关联规则的异常学生挖掘方法
技术领域
本发明具体涉及一种基于统计频率和关联规则的异常学生挖掘方法。
背景技术
随着国家经济技术的发展和人们生活水平的提高,教育已经成为我国发展的重中之重。近些年信息化和网络化建设的浪潮遍及了各个行业,激增的数据量在各大应用系统中不断积淀。面对海量的数据,虽然数据库可以进行一些常规的数据查询和统计功能,但是却无法进行更深层次的数据分析与挖掘,存储如此巨量的数据甚至会直接影响数据库的性能和正常运行。为了应对“信息爆炸而知识贫乏”的状态,数据挖掘的平台技术和方法不断涌现。现今使用的最多的大数据存储平台是Hadoop的组件HDFS和基于内存的计算框架Spark。
异常学生挖掘是根据已完成学业的学生的各科考试成绩挖掘出存在各种不同学业问题的学生。标记出存在问题的异常学生后,通过一卡通数据可以分析这些异常学生平时的生活习惯,如消费情况、图书馆借阅情况和门禁记录等,进而通过数据刻画异常学生的生活情况,并以此来分析当前在校学生的生活数据,对预测可能存在学业问题的学生作出提醒。随着高校的扩招和一卡通系统数据的积累,学校的教务系统中沉淀了海量已毕业学生的学生成绩数据。当前的高校学生学业成绩管理通常由辅导员人工完成,只是对学生的挂科情况进行提醒和处理,具有极大地滞后性,如果能综合已毕业学生的数据,分析存在学业问题的学生的日常行为模式,将其建立模型,用于分析当前在校学生日常行为,就可以在其出现学业问题之前予以提醒和纠正,而高校对于已经毕业的学生数据,没有进行细致的分类,很难从成绩数据中看出哪些学生曾经存在过学业问题。面对这一情况,相关数据挖掘技术在这方面的应用就不断出现,其中,比较常用的就是使用离群点检测算法,挖掘和大多数学生相比存在明显异常的学生,并以此来引导制定教学方案、对学生进行预警,目的是能够提高教学质量降低留级退学情况的发生。
现如今常用的离群点检测算法包括基于统计的离群点检测方法、基于距离的离群点检测方法、基于密度的离群点检测方法、基于聚类的离群点检测方法和基于偏移的离群点检测方法,这些方法作为通用的离群点挖掘方法,除了各自存在的缺陷之外,最大的问题是不能有针对性的对特定的场景进行高效的挖掘,大学学生从成绩来看中大致存在两类不同的异常学生,一类是全局型异常学生,该类学生大部分课程成绩均不理想,另一类是偏科型异常学生,对于特定类型的课程存在问题,除了这两类离群点外,还存在大量的噪声数据(学生考试中发挥失常等因素导致成绩数据不能准确反映学生实际水平),严重影响算法的准确性。
发明内容
本发明目的在于提供一种预测准确、预测效果好、算法简单可靠的基于统计频率和关联规则的异常学生挖掘方法。
本发明提供的这种基于统计频率和关联规则的异常学生挖掘方法,包括如下步骤:
S1.获取待分析学生的成绩数据,并构建学生-成绩矩阵X;矩阵中的元素Xij表示学生i在课程j中的成绩;
S2.根据步骤S1建立的学生-成绩矩阵X,针对每一列数据Xj进行数据清洗后得到矩阵X',并统计X'中每一列数据Xj'中的离群点数据并进行标记,从而得到学生-课程异常矩阵A;
S3.根据步骤S2中得到的学生-课程异常矩阵A,统计每个学生存在的异常科目占其所修科目的比重,并与事先设定的第一阈值进行比较,从而划分出全局型异常学生;
S4.对往届学生的成绩数据进行关联规则挖掘,从而获得学生各课程成绩之间的关联关系;
S5.根据步骤S4得到的各课程成绩之间的关联关系,对所有学生的异常科目进行分组合并;
S6.对步骤S5得到的分组合并后的学生的异常科目集合,计算其关联规则信息熵,并与事先设定的第二阈值进行比较,从而划分出偏科型异常学生;
S7.根据步骤S3和步骤S6得到的全局型异常学生和偏科型异常学生,采用专家经验法对学生进行分类,从而挖掘得到最终的异常学生。
步骤S1所述的构建学生-成绩矩阵X,具体为采用如下步骤构建矩阵:
1)搭建大数据存储框架HDFS存储学生的考试成绩;
2)搭建大数据内存计算框架Spark,通过SparkSQL对数据进行清洗,从而得到学生-成绩矩阵X。
所述的通过SparkSQL对数据进行清洗,具体为去掉分数字段出现的字符数据、大于100和小于0的数值型数据,以及学生ID无法关联到学籍表的学生的数据。
步骤S2所述的构建学生-课程异常矩阵A,具体为采用如下步骤构建矩阵:
(1)获取往届学生存储在教务数据库中的各个课程成绩,并求取每门课程J的均值μJ和方差σJ;且课程J的学生分数XJ大致服从正态分布(μJJ);
(2)设置每门课程的阈值λJ,对于学生-成绩矩阵X中的每一列数据,采用如下公式计算异常因子Lij
并构造和学生-成绩矩阵X结构相同的学生-异常信息矩阵A,A中的元素为Lij
(3)利用SparkSQL将原始的矩阵数据存储两份:一份存储到HDFS上方便后续的计算,一份存储到数据库中,方便后续查询。
步骤S3所述的划分出全局型异常学生,具体为采用如下步骤进行划分:
A.根据得到的学生-异常信息矩阵A,按照如下算式计算学生I的异常科目比例GI
式中N为所有科目的数量;||XI||表示学生所有已修科目的总数;
B.设置阈值G,若GI>G,则将学生I标记为全局型异常学生。
步骤S4所述的获得学生各课程成绩之间的关联关系,具体为采用如下步骤获取关联关系:
a.利用scala编写基于Spark的CS_Apriori算法程序;
b.设置合理的最小支持度和最小置信度,利用CS_Apriori算法程序,以HDFS中的数据集为输入,挖掘课程的关联规则;
c.将挖掘得到的关联规则保存在HDFS上,便于后续的计算。
步骤S5所述的对所有学生的异常科目进行分组合并,具体为采用如下规则进行分组合并:
根据学生-异常信息矩阵A,对于学生I,获取满足LIj=1的课程j的集合PI,PI即为学生I所有存在异常问题的课程的集合;将PI中的科目进行分类,属于同一条关联规则的课程,将其归为同一类;若PI中存在某些课程隶属于两个不同的关联规则,而这两个关联规则存在交集,则规定这些课程也归为同一类;通过课程的归类将PI划分为{R1,R2,…,RK}的形式。
步骤S6所述的划分出偏科型异常学生,具体我采用如下规则进行划分:
Ⅰ.采用如下公式计算学生I的偏科异常量EI
式中表示PI的纯度,纯度越小则说明PI中的课程类别越集中,||PI||表示PI的长度,用于防止出现只有极少课程异常,从而导致纯度很高的情况;EI为PI根据关联规则划分子集后计算而得的关联规则熵值和PI长度的倒数加权求和;
Ⅱ.事先设置第二阈值E,若EI<E,则认定学生I为偏科型异常学生。
本发明提供的这种基于统计频率和关联规则的异常学生挖掘方法,提出了一种新的基于统计频率和关联规则信息熵的离群点检测算法,通过统计频率计算学生全部已修科目的考试成绩异常总量,设置合理阈值划分全局型异常学生,有效的降低噪声影响;通过关联规则表达课程的相关性,计算学生出现问题的科目的关联规则信息熵,从而描述学生的偏科程度,较准确的划分出偏科型异常学生;本发明方法在挖掘效果上较通用的离群点检测算法有明显的提升,将其应用至异常学生检测模型中,对学校和个人都具有重要意义;而且,本发明方法预测准确、预测效果好、算法简单可靠。
附图说明
图1为本发明方法的方法流程图。
具体实施方式
如图1所示为本发明方法的方法流程图:本发明提供的这种基于统计频率和关联规则的异常学生挖掘方法,包括如下步骤:
S1.获取待分析学生的成绩数据,并构建学生-成绩矩阵X;矩阵中的元素Xij表示学生i在课程j中的成绩;具体为采用如下步骤构建矩阵:
1)搭建大数据存储框架HDFS存储学生的考试成绩;对于学生而言,修过的科目则有相应的成绩值,未修的科目则为空;
2)搭建大数据内存计算框架Spark,通过SparkSQL对数据进行清洗,从而得到学生-成绩矩阵X;在数据清洗时,具体为去掉分数字段出现的字符数据、大于100和小于0的数值型数据,以及学生ID无法关联到学籍表的学生的数据;
学生-成绩矩阵X中,Xij表示学生i在课程j中的得分,0≤i<n,0≤j<N,n为学生总数,N为课程总数,Xij为空表示学生i未修课程j;
S2.根据步骤S1建立的学生-成绩矩阵X,针对每一列数据Xj进行数据清洗后得到矩阵X',并统计X'中每一列数据Xj'中的离群点数据并进行标记,从而得到学生-课程异常矩阵A;具体为采用如下步骤构建矩阵:
(1)获取往届学生存储在教务数据库中的各个课程成绩,并求取每门课程的均值μJ和方差σJ;且课程J的学生分数XJ大致服从正态分布(μJJ);
(2)设置每门课程的阈值λJ,对于学生-成绩矩阵X中的每一列数据,采用如下公式计算异常因子Lij
并构造和学生-成绩矩阵X结构相同的学生-异常信息矩阵A,A中的元素为Lij;Lij为0表示学生i的课程j学习成绩正常,Lij为1表示学生i的课程j的学习成绩异常;Lij为空表示学生i未修课程j;
(3)利用SparkSQL将原始的矩阵数据存储两份:一份存储到HDFS上方便后续的计算,一份存储到数据库中,方便后续查询;
S3.根据步骤S2中得到的学生-课程异常矩阵A,统计每个学生存在的异常科目占其所修科目的比重,并与事先设定的第一阈值进行比较,从而划分出全局型异常学生;具体为采用如下步骤进行划分:
A.根据得到的学生-异常信息矩阵A,按照如下算式计算学生I的异常科目比例GI
式中N为所有科目的数量;||XI||表示学生所有已修科目的总数;
B.设置阈值G,若GI>G,则将学生I标记为全局型异常学生;
S4.对往届学生的成绩数据进行关联规则挖掘,从而获得学生各课程成绩之间的关联关系;具体为采用如下步骤获取关联关系:
a.利用scala编写基于Spark的CS_Apriori算法程序;
b.设置合理的最小支持度和最小置信度,利用CS_Apriori算法程序,以HDFS中的数据集为输入,挖掘课程的关联规则;
c.将挖掘得到的关联规则保存在HDFS上,便于后续的计算;
具体的,上述的关联关系算法可以采用专利申请号201710224459.3中的算法;
S5.根据步骤S4得到的各课程成绩之间的关联关系,对所有学生的异常科目进行分组合并;具体为采用如下规则进行分组合并:
根据学生-异常信息矩阵A,对于学生I,获取满足LIj=1的课程j的集合PI,PI即为学生I所有存在异常问题的课程的集合;将PI中的科目进行分类,属于同一条关联规则的课程,将其归为同一类;若PI中存在某些课程隶属于两个不同的关联规则,而这两个关联规则存在交集,则规定这些课程也归为同一类;通过课程的归类将PI划分为{R1,R2,…,RK}的形式;
S6.对步骤S5得到的分组合并后的学生的异常科目集合,计算其关联规则信息熵,并与事先设定的第二阈值进行比较,从而划分出偏科型异常学生;具体我采用如下规则进行划分:
Ⅰ.采用如下公式计算学生I的偏科异常量EI
式中表示PI的纯度,纯度越小则说明PI中的课程类别越集中,||PI||表示PI的长度,用于防止出现只有极少课程异常,从而导致纯度很高的情况;EI为PI根据关联规则划分子集后计算而得的关联规则熵值和PI长度的倒数加权求和;
Ⅱ.事先设置第二阈值E,若EI<E,则认定学生I为偏科型异常学生;
S7.根据步骤S3和步骤S6得到的全局型异常学生和偏科型异常学生,采用专家经验法对学生进行分类,从而挖掘得到最终的异常学生;采用专家经验法进行划分时,对个别既被标记为全局型异常学生,又被标记为偏科型异常学生进行具体分析,采用专家经验对该学生进行具体分类,从而保证每个学生都最多只有一个标记。
通过上述的步骤,从而完成学校内所有学生的异常状态挖掘。

Claims (8)

1.一种基于统计频率和关联规则的异常学生挖掘方法,包括如下步骤:
S1.获取待分析学生的成绩数据,并构建学生-成绩矩阵X;矩阵中的元素Xij表示学生i在课程j中的成绩;
S2.根据步骤S1建立的学生-成绩矩阵X,针对每一列数据Xj进行数据清洗后得到矩阵X',并统计X'中每一列数据Xj'中的离群点数据并进行标记,从而得到学生-课程异常矩阵A;
S3.根据步骤S2中得到的学生-课程异常矩阵A,统计每个学生存在的异常科目占其所修科目的比重,并与事先设定的第一阈值进行比较,从而划分出全局型异常学生;
S4.对往届学生的成绩数据进行关联规则挖掘,从而获得学生各课程成绩之间的关联关系;
S5.根据步骤S4得到的各课程成绩之间的关联关系,对所有学生的异常科目进行分组合并;
S6.对步骤S5得到的分组合并后的学生的异常科目集合,计算其关联规则信息熵,并与事先设定的第二阈值进行比较,从而划分出偏科型异常学生;
S7.根据步骤S3和步骤S6得到的全局型异常学生和偏科型异常学生,采用专家经验法对学生进行分类,从而挖掘得到最终的异常学生。
2.根据权利要求1所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于步骤S1所述的构建学生-成绩矩阵X,具体为采用如下步骤构建矩阵:
1)搭建大数据存储框架HDFS存储学生的考试成绩;
2)搭建大数据内存计算框架Spark,通过SparkSQL对数据进行清洗,从而得到学生-成绩矩阵X。
3.根据权利要求2所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于所述的通过SparkSQL对数据进行清洗,具体为去掉分数字段出现的字符数据、大于100和小于0的数值型数据,以及学生ID无法关联到学籍表的学生的数据。
4.根据权利要求3所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于步骤S2所述的构建学生-课程异常矩阵A,具体为采用如下步骤构建矩阵:
(1)获取往届学生存储在教务数据库中的各个课程成绩,并求取每门课程的均值μJ和方差σJ;且课程J的学生分数XJ服从正态分布(μJJ);
(2)设置每门课程的阈值λJ,对于学生-成绩矩阵X中的每一列数据,采用如下公式计算异常因子Lij
<mrow> <msub> <mi>L</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>,</mo> <mfrac> <mrow> <msub> <mi>&amp;mu;</mi> <mi>J</mi> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> <msub> <mi>&amp;sigma;</mi> <mi>J</mi> </msub> </mfrac> <mo>&gt;</mo> <msub> <mi>&amp;lambda;</mi> <mi>J</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>,</mo> <mfrac> <mrow> <msub> <mi>&amp;mu;</mi> <mi>J</mi> </msub> <mo>-</mo> <msub> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow> <msub> <mi>&amp;sigma;</mi> <mi>J</mi> </msub> </mfrac> <mo>&amp;le;</mo> <msub> <mi>&amp;lambda;</mi> <mi>J</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
并构造和学生-成绩矩阵X结构相同的学生-异常信息矩阵A,A中的元素为Lij
(3)利用SparkSQL将原始的矩阵数据存储两份:一份存储到HDFS上方便后续的计算,一份存储到数据库中,方便后续查询。
5.根据权利要求4所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于步骤S3所述的划分出全局型异常学生,具体为采用如下步骤进行划分:
A.根据得到的学生-异常信息矩阵A,按照如下算式计算学生I的异常科目比例GI
<mrow> <msub> <mi>G</mi> <mi>I</mi> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>L</mi> <mrow> <mi>I</mi> <mi>j</mi> </mrow> </msub> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>X</mi> <mi>I</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> </mrow>
式中N为所有科目的数量;||XI||表示学生所有已修科目的总数;
B.设置阈值G,若GI>G,则将学生I标记为全局型异常学生。
6.根据权利要求5所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于步骤S4所述的获得学生各课程成绩之间的关联关系,具体为采用如下步骤获取关联关系:
a.利用scala编写基于Spark的CS_Apriori算法程序;
b.设置合理的最小支持度和最小置信度,利用CS_Apriori算法程序,以HDFS中的数据集为输入,挖掘课程的关联规则;
c.将挖掘得到的关联规则保存在HDFS上,便于后续的计算。
7.根据权利要求6所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于步骤S5所述的对所有学生的异常科目进行分组合并,具体为采用如下规则进行分组合并:
根据学生-异常信息矩阵A,对于学生I,获取满足LIj=1的课程j的集合PI,PI即为学生I所有存在异常问题的课程的集合;将PI中的科目进行分类,属于同一条关联规则的课程,将其归为同一类;若PI中存在某些课程隶属于两个不同的关联规则,而这两个关联规则存在交集,则规定这些课程也归为同一类;通过课程的归类将PI划分为{R1,R2,…,RK}的形式。
8.根据权利要求7所述的基于统计频率和关联规则的异常学生挖掘方法,其特征在于步骤S6所述的划分出偏科型异常学生,具体我采用如下规则进行划分:
Ⅰ.采用如下公式计算学生I的偏科异常量EI
<mrow> <msub> <mi>E</mi> <mi>I</mi> </msub> <mo>=</mo> <mo>-</mo> <mi>&amp;alpha;</mi> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mfrac> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>R</mi> <mi>k</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>P</mi> <mi>I</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>R</mi> <mi>k</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>P</mi> <mi>I</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>+</mo> <mi>&amp;beta;</mi> <mfrac> <mn>1</mn> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>P</mi> <mi>I</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> </mrow>
式中表示PI的纯度,纯度越小则说明PI中的课程类别越集中,||PI||表示PI的长度,用于防止出现只有极少课程异常,从而导致纯度很高的情况;EI为PI根据关联规则划分子集后计算而得的关联规则熵值和PI长度的倒数加权求和;
Ⅱ.事先设置第二阈值E,若EI<E,则认定学生I为偏科型异常学生。
CN201710834420.3A 2017-09-15 2017-09-15 基于统计频率和关联规则的异常学生挖掘方法 Pending CN107578181A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710834420.3A CN107578181A (zh) 2017-09-15 2017-09-15 基于统计频率和关联规则的异常学生挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710834420.3A CN107578181A (zh) 2017-09-15 2017-09-15 基于统计频率和关联规则的异常学生挖掘方法

Publications (1)

Publication Number Publication Date
CN107578181A true CN107578181A (zh) 2018-01-12

Family

ID=61033197

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710834420.3A Pending CN107578181A (zh) 2017-09-15 2017-09-15 基于统计频率和关联规则的异常学生挖掘方法

Country Status (1)

Country Link
CN (1) CN107578181A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149884A (zh) * 2020-09-07 2020-12-29 南京莱斯网信技术研究院有限公司 一种面向大规模学员的学业预警监测方法
CN112488181A (zh) * 2020-11-26 2021-03-12 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149884A (zh) * 2020-09-07 2020-12-29 南京莱斯网信技术研究院有限公司 一种面向大规模学员的学业预警监测方法
CN112488181A (zh) * 2020-11-26 2021-03-12 哈尔滨工程大学 一种基于MIDS-Tree的服务故障高响应匹配方法

Similar Documents

Publication Publication Date Title
McPherson Statistics in scientific investigation: its basis, application, and interpretation
Johnson et al. Ordinal data modeling
van der Vaart et al. An introduction to mathematical statistics
US7065524B1 (en) Identification and correction of confounders in a statistical analysis
CN109325888A (zh) 一种基于人工神经网络的学生行为预测方法
CN107578181A (zh) 基于统计频率和关联规则的异常学生挖掘方法
Sujarwoto Small family norms and family well-being in Indonesia, 2006–2014
Vasani et al. Classification and performance evaluation using data mining algorithms
CN113420946B (zh) 一种新闻媒体的评价方法
CN112836137A (zh) 人物网络支持度计算系统及方法、终端、设备、存储介质
Guarino et al. Comparing and assessing the consequences of two different approaches to measuring school effectiveness
Aulia et al. Comparison Performance of K-Medoids and K-Means Algorithms In Clustering Community Education Levels
Penkova Method of wellbeing estimation in territory management
Lichteblau et al. Do parties perceive their voter potentials correctly? Reconsidering the spatial logic of electoral competition
Inyang et al. Visual association analytics approach to predictive modelling of students’ academic performance
CN111126812A (zh) 综合学习能力监测方法、装置、电子设备和存储介质
Kelderman Loglinear multidimensional item response models for polytomously scored items
Smetanin et al. Misclassification bias in computational social science: a simulation approach for assessing the impact of classification errors on social indicators research
Swarnalatha et al. Mining Educational Data for students' placement prediction using Sum of difference method
Gross et al. The restriction of range problem and nonignorable selection processes.
Yu et al. Data mining technology in the analysis of college students’ psychological problems
CN113222255A (zh) 一种合同履约表现量化及短期违约预测的方法及装置
Tsygankov et al. On the Possibility of Developing a System for Predicting Students Academic Performance Using Machine Learning Methods
Kavya et al. Student Personality Analysis In Blended Mode Using Big Five
US11386368B1 (en) Method for matching students with teachers to achieve optimal student outcomes

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180112