CN108241625B - 预测学生成绩变化趋势的方法及系统 - Google Patents
预测学生成绩变化趋势的方法及系统 Download PDFInfo
- Publication number
- CN108241625B CN108241625B CN201611205391.6A CN201611205391A CN108241625B CN 108241625 B CN108241625 B CN 108241625B CN 201611205391 A CN201611205391 A CN 201611205391A CN 108241625 B CN108241625 B CN 108241625B
- Authority
- CN
- China
- Prior art keywords
- student
- prediction
- trend
- change trend
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000012549 training Methods 0.000 claims description 35
- 238000012360 testing method Methods 0.000 claims description 25
- 230000001174 ascending effect Effects 0.000 claims description 22
- 230000004927 fusion Effects 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000007619 statistical method Methods 0.000 claims description 14
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 3
- 238000007418 data mining Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 46
- 238000007477 logistic regression Methods 0.000 description 15
- 238000010276 construction Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 3
- 241000425347 Phyla <beetle> Species 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Educational Administration (AREA)
- Educational Technology (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Fuzzy Systems (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种预测学生成绩变化趋势的方法及系统,该方法包括:预先构建学生成绩变化趋势预测模型,所述模型包括;基于一次历史数据的预测模型,以及基于多次历史数据的预测模型;获取用于预测学生成绩变化趋势的历史数据;基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。利用本发明,即使在历史数据量相对较少的情况下,也能得到准确的预测结果。
Description
技术领域
本发明涉及数据挖掘技术领域,具体涉及一种预测学生成绩变化趋势的方法及系统。
背景技术
近年来,随着计算机技术和教育信息化的不断推进发展,计算机和人工智能技术已经逐步应用于日常的教育教学各项活动中。学生成绩变化趋势预测可以有效地指导学生的学习,如将时间花费在最有可能提升和能提升最明显的地方,以达到学习过程中事半功倍的效果。
现有的学生成绩变化趋势预测多是基于大量的历史考试成绩进行统计分析得到,比如较为常见的一种方法是:根据学生的大量历史考试成绩,分析出该学生的成绩分布图,进而得到成绩均值等信息,然后基于近期的考试成绩状态,预测下一次成绩的变化趋势。
现有的学生成绩变化趋势预测方法,需要基于大量的历史数据,才可能得到相对可靠的预测结果,然而受于现阶段电子信息化教育还未真正普及,在教学过程中产生的数据信息,如历史考试成绩等,还未能实现及时公开、共享等限制,难以获取大量的历史数据,在这种情况下采用现有学生成绩变化趋势预测的方法,其预测准确性也难以保障。
发明内容
本发明实施例提供一种预测学生成绩变化趋势的方法及系统,以提高预测结果的准确性,并提高方案的适应性。
为此,本发明提供如下技术方案:
一种预测学生成绩变化趋势的方法,包括:
预先构建学生成绩变化趋势预测模型,所述模型包括:基于一次历史数据的预测模型,以及基于多次历史数据的预测模型;
获取用于预测学生成绩变化趋势的历史数据;
基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。
优选地,所述构建学生成绩变化趋势预测模型包括:
收集学生历史考试数据,所述学生历史考试数据为两次或两次以上历史考试数据;
对所述历史考试数据进行预处理;
基于预处理后的历史考试数据,得到初始的学生成绩变化趋势;
基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型。
优选地,所述对所述历史考试数据进行预处理包括:
针对每一科目,根据该科目的所有学生成绩,将每个学生该科目的绝对成绩分数转化为相对成绩分数。
优选地,所述基于预处理后的历史考试数据,得到初始的学生成绩变化趋势包括:
依据所述历史考试数据的时间顺序,获取最近两次历史考试数据;
如果最近一次的学生成绩高于前一次的学生成绩,则确定初始的学生成绩变化趋势为上升趋势,否则确定初始的学生成绩变化趋势为保持或者下降。
优选地,所述基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型包括:
确定预测函数;
训练得到所述预测函数中的参数。
优选地,所述学生成绩变化趋势预测模型为线性回归模型;
所述基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果包括:
基于所述历史数据,根据预先构建的预测模型预测学生成绩变化趋势,得到对应的预测函数值;
如果所述预测函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
优选地,所述方法还包括:
基于所述历史数据,利用统计方法预测学生成绩变化趋势;
融合基于预测模型得到的预测结果和基于统计方法得到的预测结果,得到最终预测结果。
优选地,所述学生成绩变化趋势预测模型包括:多种不同类型的预测模型;
所述基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果包括:
基于所述历史数据,分别根据所述不同类型的预测模型,得到对应不同类型的预测模型的预测函数值;
对得到的所有预测函数值进行融合,得到融合函数值;
如果所述融合函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
一种预测学生成绩变化趋势的系统,包括:
预测模型构建模块,用于预先构建学生成绩变化趋势预测模型,所述模型包括:基于一次历史数据的预测模型,以及基于多次历史数据的预测模型;
历史数据获取模块,用于获取用于预测学生成绩变化趋势的历史数据;
预测模块,用于基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。
优选地,所述预测模型构建模块包括:
数据收集单元,用于收集学生历史考试数据,所述学生历史考试数据为两次或两次以上历史考试数据;
预处理单元,用于对所述历史考试数据进行预处理;
初始数据确定单元,用于基于预处理后的历史考试数据,得到初始的学生成绩变化趋势;
训练单元,用于基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型。
优选地,所述预处理单元,具体用于针对每一科目,根据该科目的所有学生成绩,将每个学生该科目的绝对成绩分数转化为相对成绩分数。
优选地,所述初始数据确定单元包括:
排序子单元,用于依据所述历史考试数据的时间顺序,获取最近两次历史考试数据;
判断子单元,用于在最近一次的学生成绩高于前一次的学生成绩时,确定初始的学生成绩变化趋势为上升趋势,否则确定初始的学生成绩变化趋势为保持或者下降。
优选地,所述训练单元包括:
预测函数确定子单元,用于确定预测函数;
参数训练子单元,用于训练得到所述预测函数中的参数。
优选地,所述学生成绩变化趋势预测模型为线性回归模型;
所述预测模块,具体用于基于所述历史数据,根据预先构建的预测模型,得到对应的预测函数值;如果所述预测函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
优选地,所述系统还包括:
统计模块,用于基于所述历史数据,利用统计方法预测学生成绩变化趋势;
融合模块,用于融合基于预测模型得到的预测结果和基于统计方法得到的预测结果,得到最终预测结果。
优选地,所述学生成绩变化趋势预测模型包括:多种不同类型的预测模型;
所述预测模块,具体用于基于所述历史数据,分别根据所述不同类型的预测模型,得到对应不同类型的预测模型的预测函数值;对得到的所有预测函数值进行融合,得到融合函数值;如果所述融合函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
本发明实施例提供的预测学生成绩变化趋势的方法及系统,采用基于模型的方式,利用学生成绩的历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,解决了传统成绩变化趋势预测方法存在的针对较少历史数据无法做出较为准确预测的问题。本发明方案不仅适用于有大量历史数据的情况,同样适用于历史数据量相对较少的情况,均能得到准确的预测结果。
进一步地,本发明方案还可以分别基于不同预测模型进行预测,然后将基于不同预测模型得到的预测结果进行融合,得到最终的学生成绩变化趋势预测结果;进一步地,本发明方案还可以分别采用基于模型和统计的方法进行预测,并对预测得到的预测结果进行融合,得到最终的学生成绩变化趋势预测结果;从而可以满足不同应用的需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例中构建学生成绩变化趋势预测模型的流程图;
图2是本发明实施例预测学生成绩变化趋势的方法的一种流程图;
图3是本发明实施例预测学生成绩变化趋势的方法的另一种流程图;
图4是本发明实施例预测学生成绩变化趋势的系统的一种结构示意图;
图5是本发明系统中预测模型构建模块的一种具体结构示意图;
图6是本发明实施例预测学生成绩变化趋势的系统的另一种结构示意。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例提供的预测学生成绩变化趋势的方法及系统,预先构建学生成绩变化趋势预测模型,所述学生成绩变化趋势预测模型包括:基于一次历史数据的预测模型,以及基于多次历史数据的预测模型。利用所述预测模型及学生成绩的历史数据对学生成绩变化趋势进行预测,得到预测结果。
所述学生成绩变化趋势预测模型是线性回归模型,如逻辑回归模型、岭回归模型等。下面以逻辑回归模型为例,说明预测模型的具体构建过程。
如图1所示,是本发明实施例中构建学生成绩变化趋势预测模型的流程图,包括以下步骤:
步骤101,收集学生历史考试数据。
所述历史考试数据优选为近期的历史考试(一般为全学科)数据,受到实际教育环境的影响,历史考试数据经常难于收集,因而在本发明实施例中,分别构建基于一次历史数据的预测模型以及基于多次历史数据的预测模型。其中,基于一次历史数据的预测模型构建时需要两次历史数据;而基于N(N>2)次历史数据的预测模型构建时,需要N+1次历史数据。
因此,相应的学生历史考试数据可以是两次历史考试数据,也可以是两次以上历史考试数据。
步骤102,对所述历史考试数据进行预处理。
对历史考试数据的预处理,主要是指将绝对成绩分数转化为相对成绩分数。在同一次考试中,学生的考试成绩有一定的可比性,但在不同的考试中,由于题目难度(不同考试试题难度不同)和试卷类型(如一模物理总分100分,二模、三模物理总分110分)等原因使得学生的绝对考试分数可比性不强。因而在数据使用之前,对收集的学生历史考试数据进行预处理,将学生考试的绝对成绩分数转化为相对成绩分数。具体地,可以针对每一科目,根据该科目的所有学生成绩,将每个学生该科目的绝对成绩分数转化为相对成绩分数,可以采用以下公式:
其中,zik表示学生i在科目k的相对成绩分数,xik表示学生i在科目k的绝对成绩分数,μk表示科目k所有学生成绩的均值,σk为科目k所有学生成绩的方差。
步骤103,基于预处理后的历史考试数据,得到初始的学生成绩变化趋势。
针对基于一次历史数据的预测模型的构建,需要两次历史考试数据,即第一次考试成绩和第二次考试成绩。对于这种情况,可以通过比较第一次和第二次考试成绩,如果第二次考试成绩高于第一次考试成绩,则确定初始的学生成绩变化趋势为上升趋势,记为初始变化趋势yik=0,否则确定初始的学生成绩变化趋势为保持或者下降,记为初始变化趋势yik=1。
针对基于多次历史数据的预测模型的构建,需要两次以上历史考试数据,比如,以2次为例,此时有三个历史数据,分别为第一次考试成绩、第二次考试成绩以及第三次考试成绩,通过比较第二次考试成绩和第三次考试成绩得到初始变化趋势:如果第三次成绩高于第二次成绩,则确定初始的学生成绩变化趋势为上升趋势,记为初始变化趋势yik=0,否则确定初始的学生成绩变化趋势为保持或者下降,记为初始变化趋势yik=1。
步骤104,基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型。
所述学生成绩变化趋势预测模型为线性回归模型,比如逻辑回归模型或岭回归模型等,具体地,可以利用梯度下降法、牛顿迭代法等算法训练得到模型的参数。
下面以逻辑回归模型为例,采用梯度下降法分别针对基于一次历史数据的预测模型以及基于多次历史数据的预测模型,说明其训练过程。
1)基于一次历史数据的预测模型
该模型的预测函数为:
其中,θk表示除科目k之外的其他所有科目对科目k的影响系数;zi为第一次考试学生i的成绩向量,如果科目包括语文、英语、数学、生物、化学、物理这6门,那么zi为一个长度为7的向量,长度7分别表示训练截距的单位向量1和6门科目的成绩;T表示转置。
梯度下降公式:
其中,α表示梯度下降的步长。
基于学科k所有学生的历史考试成绩,以及所有学生的初始成绩变化趋势,迭代训练得到科目k受其他科目的影响系数θk。
同理,对于其他学科,同样可以训练出学科影响系数θk。
2)基于多次历史数据的预测模型
以基于2次历史数据的学生成绩变化趋势预测为例,预测模型的训练方法基本同于基于一次历史数据的预测模型训练方法,唯一的差别只在于:在模型迭代时,某个学科学生的成绩向量不是一次考试的成绩,而是多次考试的成绩,以3次历史考试成绩为例,模型训练阶段,zi为第一次和第二次考试,学生i的成绩向量,如果科目包括语文、英语、数学、生物、化学、物理这6门,那么zi为一个长度为13的向量,长度13分别表示训练截距的单位向量1、第一次考试6门科目的成绩、第二次考试6门科目的成绩。
需要说明的是,其它形式的线性回归模型如岭回归模型的构建过程与上述逻辑回归模型的构建过程类似,只是模型的预测函数不同。在此不再一一举例说明。
基于上述预测模型,本发明实施例预测学生成绩变化趋势的方法利用学生成绩的历史数据及所述预测模型,预测学生成绩变化趋势,不论是否有大量历史数据,均能得到较准确的预测结果。
如图2所示,是本发明实施例预测学生成绩变化趋势的方法的一种流程图,包括以下步骤:
步骤201,预先构建学生成绩变化趋势预测模型。
所述学生成绩变化趋势预测模型具体可以是线性回归模型,比如逻辑回归模型、岭回归模型等。需要说明的是,在实际应用中,可以构建一种模型,也可以分别构建多种不同的模型。
步骤202,获取用于预测学生成绩变化趋势的历史数据。
由于预先构建了基于一次历史数据的预测模型及基于多次历史数据的预测模型,因而所述用于预测学生成绩变化趋势的历史数据可以是待预测学生上一次考试的数据,也可以是包含上一次历史考试的多次考试数据。
步骤203,基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。
相应地,进行学生成绩变化趋势预测时,得到对应该模型的预测函数值,再根据预先设定的变化趋势阈值,判断学生成绩变化趋势。具体地,如果所述预测函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。所述变化趋势阈值可以是通过大量实验和/或经验得到,如取阈值为0.5。
本发明实施例提供的预测学生成绩变化趋势的方法,采用基于模型的方式,利用学生成绩的历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,解决了传统成绩变化趋势预测方法存在的针对较少历史数据无法做出较为准确预测的问题。本发明方案不仅适用于有大量历史数据的情况,同样适用于历史数据量相对较少的情况,均能得到准确的预测结果。
前面提到,在构建学生成绩变化趋势预测模型时,可以构建一种模型,也可以分别构建多种不同的模型。
如果预测模型有多种,则可以分别得到对应各模型的预测函数值,然后再对这些函数值进行融合,得到最终融合结果。比如,同时构建有逻辑回归模型和岭回归模型,则基于所述历史数据,分别根据预先构建的逻辑回归模型和岭回归模型,得到对应的第一预测函数值和第二预测函数值;然后对所述第一预测函数值和所述第二预测函数值进行融合(比如可以采用线性加权方法融合),得到融合函数值;如果所述融合函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
进一步地,在实际应用中,也可以同时采用基于模型的方法及基于统计的方法预测学生成绩变化趋势,然后对不同方法得到的预测结果进行融合,得到最终预测结果。
如图3所示,是本发明实施例预测学生成绩变化趋势的方法的另一种流程图,包括以下步骤:
步骤301,预先构建学生成绩变化趋势预测模型。
具体可以是逻辑回归模型和/或岭回归模型等线性回归模型。需要说明的是,在实际应用中,可以构建一种模型,也可以分别构建多种不同的模型。
步骤302,获取用于预测学生成绩变化趋势的历史数据。
步骤303,基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到第一预测值。
步骤304,基于所述历史数据,利用统计方法预测学生成绩变化趋势,得到第二预测值。
步骤305,对所述第一预测值和第二预测值进行融合,得到融合得分。
步骤306,判断所述融合得分是否大于设定得分(所述设定得分可以是通过大量实验和/或经验得到);如果是,则执行步骤307;否则,执行步骤308。
步骤307,确定学生成绩呈上升趋势。
步骤308,确定学生成绩呈保持或下降趋势。
相应地,本发明实施例还提供一种预测学生成绩变化趋势的系统,如图4所示,是该系统的一种结构示意图。
在该实施例中,所述系统包括:
预测模型构建模块401,用于预先构建学生成绩变化趋势预测模型,所述模型包括;基于一次历史数据的预测模型,以及基于多次历史数据的预测模型;
历史数据获取模块402,用于获取用于预测学生成绩变化趋势的历史数据;
预测模块403,用于基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。
需要说明的是,上述预测模型构建模块401具体可以构建一种类型的预测模型,也可以分别构建多种不同类型的预测模型,比如,可以构建逻辑回归模型或岭回归模型,也可以同时构建逻辑回归模型和岭回归模型等线性回归模型。不同类型的预测模型的构建过程类似,只是模型的预测函数不同。而且,在本发明实施例中,针对每类预测模型,都可以预先构建基于一次历史数据的预测模型及基于多次历史数据的预测模型。
相应地,如果仅构建有一种类型的预测模型,则上述预测模块403在利用预先构建的预测模型进行学生成绩变化趋势预测时,具体可以根据预先构建的预测模型,得到对应的预测函数值;如果所述预测函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
相应地,如果构建有多种类型的预测模型,则上述预测模块403在利用预先构建的预测模型进行学生成绩变化趋势预测时,具体可以基于所述历史数据,分别根据所述不同类型的预测模型,得到对应不同类型的预测模型的预测函数值;对得到的所有预测函数值进行融合,得到融合函数值;如果所述融合函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。比如,同时构建有逻辑回归模型和岭回归模型,则上述预测模块403分别根据预先构建的逻辑回归模型和岭回归模型进行学生成绩变化趋势预测,得到对应逻辑回归模型的第一预测函数值和对应岭回归模型的第二预测函数值;对所述第一预测函数值和所述第二预测函数值进行线性加权,得到加权值;如果所述加权值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。当然,在这种情况下,上述预测函数值及加权值的计算、以及根据加权值及变化趋势阈值对学生成绩变化趋势的判断可以由不同的功能单元来完成,也可以由单一的预测模块403来完成,对此本发明实施例不做限定。
本发明实施例提供的预测学生成绩变化趋势的系统,采用基于模型的方式,利用学生成绩的历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,解决了传统成绩变化趋势预测方法存在的针对较少历史数据无法做出较为准确预测的问题。本发明方案不仅适用于有大量历史数据的情况,同样适用于历史数据量相对较少的情况,均能得到准确的预测结果。而且,还可以将基于不同类型的预测模型预测得到的预测函数值进行融合,根据融合结果确定学生成绩的变化趋势,进一步提高了预测结果的准确性。
图5示出了预测模型构建模块401的一种具体结构,包括以下各单元:
数据收集单元51,用于收集学生历史考试数据,所述学生历史考试数据为两次或两次以上历史考试数据;
预处理单元52,用于对所述历史考试数据进行预处理;
初始数据确定单元53,用于基于预处理后的历史考试数据,得到初始的学生成绩变化趋势;
训练单元54,用于基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型。
其中,所述预处理单元52具体用于针对每一科目,根据该科目的所有学生成绩,将每个学生该科目的绝对成绩分数转化为相对成绩分数。
所述初始数据确定单元53可以包括:排序子单元和判断子单元,其中,排序子单元用于依据所述历史考试数据的时间顺序,获取最近两次历史考试数据;判断子单元用于在最近一次的学生成绩高于前一次的学生成绩时,确定初始的学生成绩变化趋势为上升趋势,否则确定初始的学生成绩变化趋势为保持或者下降。
所述训练单元54包括:预测函数确定子单元和参数训练子单元,其中,预测函数确定子单元用于确定预测函数;参数训练子单元用于训练得到所述预测函数中的参数,具体地,可以利用梯度下降法、牛顿迭代法等算法训练模型参数。模型的具体训练过程在前面本发明方法实施例中已有详细说明,在此不再赘述。
如图6所示,是本发明预测学生成绩变化趋势的系统的另一种结构示意图。
与图4不同的是,在该实施例中,该系统还包括统计模块601和融合模块602。其中:
统计模块601,用于基于所述历史数据,利用统计方法预测学生成绩变化趋势;
融合模块602,用于融合基于预测模型得到的预测结果和基于统计方法得到的预测结果,得到最终预测结果。
需要说明的是,在该实施例中,预测模块403基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到第一预测值。统计模块601基于所述历史数据,利用统计方法预测学生成绩变化趋势,得到第二预测值。融合模块602对所述第一预测值和第二预测值进行融合,得到融合得分,并且在所述融合得分是否大于设定得分时,确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
本发明实施例的预测学生成绩变化趋势的系统,分别基于模型的方法及基于统计的方法预测学生成绩变化趋势,然后对不同方法得到的预测结果进行融合,得到最终预测结果,进一步提高了预测结果的准确性。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上对本发明实施例进行了详细介绍,本文中应用了具体实施方式对本发明进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及系统;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (16)
1.一种基于数据挖掘技术的预测学生成绩变化趋势的方法,其特征在于,包括:
预先基于历史数据及学生成绩变化趋势,构建学生成绩变化趋势预测模型,所述模型包括:基于一次历史数据的预测模型,以及基于多次历史数据的预测模型;构建所述预测模型包括:利用历史考试成绩以及基于单次历史考试成绩比较出的初始变化趋势,训练得到所述预测模型的预测函数中的学科间影响系数;
获取用于预测学生成绩变化趋势的历史数据;
基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。
2.根据权利要求1所述的方法,其特征在于,所述构建学生成绩变化趋势预测模型包括:
收集学生历史考试数据,所述学生历史考试数据为两次或两次以上历史考试数据;
对所述历史考试数据进行预处理;
基于预处理后的历史考试数据,得到初始的学生成绩变化趋势;
基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型。
3.根据权利要求2所述的方法,其特征在于,所述对所述历史考试数据进行预处理包括:
针对每一科目,根据该科目的所有学生成绩,将每个学生该科目的绝对成绩分数转化为相对成绩分数。
4.根据权利要求3所述的方法,其特征在于,所述基于预处理后的历史考试数据,得到初始的学生成绩变化趋势包括:
依据所述历史考试数据的时间顺序,获取最近两次历史考试数据;
如果最近一次的学生成绩高于前一次的学生成绩,则确定初始的学生成绩变化趋势为上升趋势,否则确定初始的学生成绩变化趋势为保持或者下降。
5.根据权利要求4所述的方法,其特征在于,所述基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型包括:
确定预测函数;
训练得到所述预测函数中的参数。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述学生成绩变化趋势预测模型为线性回归模型;
所述基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果包括:
基于所述历史数据,根据预先构建的预测模型预测学生成绩变化趋势,得到对应的预测函数值;
如果所述预测函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
基于所述历史数据,利用统计方法预测学生成绩变化趋势;
融合基于预测模型得到的预测结果和基于统计方法得到的预测结果,得到最终预测结果。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述学生成绩变化趋势预测模型包括:多种不同类型的预测模型;
所述基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果包括:
基于所述历史数据,分别根据所述不同类型的预测模型,得到对应不同类型的预测模型的预测函数值;
对得到的所有预测函数值进行融合,得到融合函数值;
如果所述融合函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
9.一种基于数据挖掘技术的预测学生成绩变化趋势的系统,其特征在于,包括:
预测模型构建模块,用于预先基于历史数据及学生成绩变化趋势,构建学生成绩变化趋势预测模型,所述模型包括:基于一次历史数据的预测模型,以及基于多次历史数据的预测模型;构建所述预测模型包括:利用历史考试成绩以及基于单次历史考试成绩比较出的初始变化趋势,训练得到所述预测模型的预测函数中的学科间影响系数;
历史数据获取模块,用于获取用于预测学生成绩变化趋势的历史数据;
预测模块,用于基于所述历史数据及预先构建的学生成绩变化趋势预测模型,预测学生成绩变化趋势,得到预测结果。
10.根据权利要求9所述的系统,其特征在于,所述预测模型构建模块包括:
数据收集单元,用于收集学生历史考试数据,所述学生历史考试数据为两次或两次以上历史考试数据;
预处理单元,用于对所述历史考试数据进行预处理;
初始数据确定单元,用于基于预处理后的历史考试数据,得到初始的学生成绩变化趋势;
训练单元,用于基于所述预处理后的历史数据及初始学生成绩变化趋势,训练学生成绩变化趋势预测模型。
11.根据权利要求10所述的系统,其特征在于,
所述预处理单元,具体用于针对每一科目,根据该科目的所有学生成绩,将每个学生该科目的绝对成绩分数转化为相对成绩分数。
12.根据权利要求11所述的系统,其特征在于,所述初始数据确定单元包括:
排序子单元,用于依据所述历史考试数据的时间顺序,获取最近两次历史考试数据;
判断子单元,用于在最近一次的学生成绩高于前一次的学生成绩时,确定初始的学生成绩变化趋势为上升趋势,否则确定初始的学生成绩变化趋势为保持或者下降。
13.根据权利要求12所述的系统,其特征在于,所述训练单元包括:
预测函数确定子单元,用于确定预测函数;
参数训练子单元,用于训练得到所述预测函数中的参数。
14.根据权利要求9至13任一项所述的系统,其特征在于,所述学生成绩变化趋势预测模型为线性回归模型;
所述预测模块,具体用于基于所述历史数据,根据预先构建的预测模型,得到对应的预测函数值;如果所述预测函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
15.根据权利要求14所述的系统,其特征在于,所述系统还包括:
统计模块,用于基于所述历史数据,利用统计方法预测学生成绩变化趋势;
融合模块,用于融合基于预测模型得到的预测结果和基于统计方法得到的预测结果,得到最终预测结果。
16.根据权利要求9至13任一项所述的系统,其特征在于,所述学生成绩变化趋势预测模型包括:多种不同类型的预测模型;
所述预测模块,具体用于基于所述历史数据,分别根据所述不同类型的预测模型,得到对应不同类型的预测模型的预测函数值;对得到的所有预测函数值进行融合,得到融合函数值;如果所述融合函数值大于变化趋势阈值,则确定学生成绩呈上升趋势,否则确定学生成绩呈保持或下降趋势。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611205391.6A CN108241625B (zh) | 2016-12-23 | 2016-12-23 | 预测学生成绩变化趋势的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611205391.6A CN108241625B (zh) | 2016-12-23 | 2016-12-23 | 预测学生成绩变化趋势的方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108241625A CN108241625A (zh) | 2018-07-03 |
CN108241625B true CN108241625B (zh) | 2021-10-01 |
Family
ID=62704133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611205391.6A Active CN108241625B (zh) | 2016-12-23 | 2016-12-23 | 预测学生成绩变化趋势的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108241625B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108985988A (zh) * | 2018-07-16 | 2018-12-11 | 安徽国通亿创科技股份有限公司 | 一种基于在线教学学业成长算法 |
CN110990639B (zh) * | 2019-10-29 | 2021-04-06 | 华中师范大学 | 一种教育信息化水平趋势分析的数据处理方法及装置 |
CN111091481B (zh) * | 2019-11-25 | 2023-07-18 | 珠海格力电器股份有限公司 | 报名信息验证方法、装置、存储介质及电子设备 |
CN111160743A (zh) * | 2019-12-19 | 2020-05-15 | 广东德诚大数据科技有限公司 | 一种对比分析历次考试成绩的数据处理系统 |
CN112085262B (zh) * | 2020-08-24 | 2023-12-26 | 辽宁石油化工大学 | 一种基于机器学习算法的大学生寝室调配方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567391A (zh) * | 2010-12-20 | 2012-07-11 | 中国移动通信集团广东有限公司 | 一种分类预测混合模型的建立方法及装置 |
CN102708153A (zh) * | 2012-04-18 | 2012-10-03 | 中国信息安全测评中心 | 自适应在线社交网络热点话题发现预测方法及系统 |
CN103544393A (zh) * | 2013-10-23 | 2014-01-29 | 北京师范大学 | 追踪儿童语言能力发展的方法 |
CN105069525A (zh) * | 2015-07-30 | 2015-11-18 | 广西大学 | 全天候96点日负荷曲线预测及优化修正系统 |
CN105335870A (zh) * | 2015-09-29 | 2016-02-17 | 吉林农业大学 | 一种生猪价格趋势预测方法 |
CN105392154A (zh) * | 2014-09-05 | 2016-03-09 | 中兴通讯股份有限公司 | 一种资源占用量的预测方法与预测系统 |
CN105608200A (zh) * | 2015-12-28 | 2016-05-25 | 湖南蚁坊软件有限公司 | 一种网络舆论趋势预测分析方法 |
CN105894407A (zh) * | 2014-10-24 | 2016-08-24 | 丁洁 | 一种评估学生学习能力发展趋势的方法 |
CN106127634A (zh) * | 2016-06-20 | 2016-11-16 | 山东师范大学 | 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统 |
CN106157204A (zh) * | 2016-06-20 | 2016-11-23 | 山东师范大学 | 一种基于bp神经网络模型的学生学业成绩预测方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1450280A4 (en) * | 2001-11-07 | 2007-10-10 | Takafumi Terasawa | SCHEDULE DATA DISTRIBUTION ASSESSMENT PROCEDURES |
US8712828B2 (en) * | 2005-12-30 | 2014-04-29 | Accenture Global Services Limited | Churn prediction and management system |
WO2014204528A2 (en) * | 2013-03-14 | 2014-12-24 | Lawrence Livermore National Security, Llc | Method for predicting lifetime of optimal conditioned kdp optics |
CN104598582A (zh) * | 2015-01-15 | 2015-05-06 | 任中硕 | 全程学业跟踪分析系统 |
CN105022825A (zh) * | 2015-07-22 | 2015-11-04 | 中国人民解放军国防科学技术大学 | 结合财经新闻挖掘和金融历史数据的金融品种价格预测方法 |
CN105631483B (zh) * | 2016-03-08 | 2019-03-12 | 国家电网公司 | 一种短期用电负荷预测方法及装置 |
CN106056241A (zh) * | 2016-05-26 | 2016-10-26 | 中国太平洋保险(集团)股份有限公司 | 一种基于大数据预测用户行为的控制方法及装置 |
CN106127333A (zh) * | 2016-06-21 | 2016-11-16 | 北京大学 | 电影上座率预测方法和系统 |
-
2016
- 2016-12-23 CN CN201611205391.6A patent/CN108241625B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102567391A (zh) * | 2010-12-20 | 2012-07-11 | 中国移动通信集团广东有限公司 | 一种分类预测混合模型的建立方法及装置 |
CN102708153A (zh) * | 2012-04-18 | 2012-10-03 | 中国信息安全测评中心 | 自适应在线社交网络热点话题发现预测方法及系统 |
CN103544393A (zh) * | 2013-10-23 | 2014-01-29 | 北京师范大学 | 追踪儿童语言能力发展的方法 |
CN105392154A (zh) * | 2014-09-05 | 2016-03-09 | 中兴通讯股份有限公司 | 一种资源占用量的预测方法与预测系统 |
CN105894407A (zh) * | 2014-10-24 | 2016-08-24 | 丁洁 | 一种评估学生学习能力发展趋势的方法 |
CN105069525A (zh) * | 2015-07-30 | 2015-11-18 | 广西大学 | 全天候96点日负荷曲线预测及优化修正系统 |
CN105335870A (zh) * | 2015-09-29 | 2016-02-17 | 吉林农业大学 | 一种生猪价格趋势预测方法 |
CN105608200A (zh) * | 2015-12-28 | 2016-05-25 | 湖南蚁坊软件有限公司 | 一种网络舆论趋势预测分析方法 |
CN106127634A (zh) * | 2016-06-20 | 2016-11-16 | 山东师范大学 | 一种基于朴素贝叶斯模型的学生学业成绩预测方法及系统 |
CN106157204A (zh) * | 2016-06-20 | 2016-11-23 | 山东师范大学 | 一种基于bp神经网络模型的学生学业成绩预测方法及系统 |
Non-Patent Citations (3)
Title |
---|
招展如桦的博客.Logistic regression(逻辑回归)概述.《http://blog.sina.com.cn/s/blog_890c6aa301015mya.html》.2012, * |
骆毅.基于不确定性系统研究方法的高校学生学习成绩分析与预测.《中国优秀硕士学位论文全文数据库 社会科学II辑》.2012,(第06期),H131-238. * |
黄爱辉.基于决策树算法的考试成绩分析系统的研究与开发.《中国优秀硕士学位论文全文数据库 信息科技辑》.2010,(第01期),I138-171. * |
Also Published As
Publication number | Publication date |
---|---|
CN108241625A (zh) | 2018-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108241625B (zh) | 预测学生成绩变化趋势的方法及系统 | |
JP6960688B2 (ja) | 学習効率に基づいて個人カスタマイズ型教育コンテンツを提供するための機械学習方法、装置及びコンピュータプログラム | |
Kanetaki et al. | A hybrid machine learning model for grade prediction in online engineering education | |
CN110991195B (zh) | 机器翻译模型训练方法、装置及存储介质 | |
CN111126610B (zh) | 题目分析方法、装置、电子设备和存储介质 | |
Hinaut et al. | On-line processing of grammatical structure using reservoir computing | |
Lubis et al. | Gradient descent and normal equations on cost function minimization for online predictive using linear regression with multiple variables | |
CN114998071B (zh) | 一种航空管制模拟训练智能教学方法和系统 | |
Welling | Are ML and statistics complementary | |
Isljamovıc et al. | PREDICTING STUDENTS’ACADEMIC PERFORMANCE USING ARTIFICIAL NEURAL NETWORK: A CASE STUDY FROM FACULTY OF ORGANIZATIONAL SCIENCES | |
CN110852071A (zh) | 知识点检测方法、装置、设备及可读存储介质 | |
Sreenivasulu et al. | Implementation of latest machine learning approaches for students grade prediction | |
KR20190025871A (ko) | 사용자 맞춤형 컨텐츠를 제공하기 위한 방법, 장치 및 컴퓨터 프로그램 | |
CN106709829B (zh) | 基于在线题库的学情诊断方法及系统 | |
CN116342082A (zh) | 基于知识图谱的岗位胜任力判断方法、装置、介质及设备 | |
JP2020166816A5 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
EP4336477A1 (en) | Method for guiding reading and writing skill improvement, and device therefor | |
CN110059117A (zh) | 一种教学大数据的分析处理方法及装置 | |
Lee et al. | Prescribing deep attentive score prediction attracts improved student engagement | |
CN114386327A (zh) | 一种基于深度学习的高校专业课程成绩预测方法 | |
Jaffe et al. | Discovering dynamical models of human behavior | |
CN115017321A (zh) | 一种知识点预测方法、装置、存储介质以及计算机设备 | |
Wong et al. | An automatic approach for discovering skill relationship from learning data | |
Da Corte et al. | Enhancing Writing Proficiency Classification in Developmental Education: The Quest for Accuracy | |
Duran-Dominguez et al. | Virtual Classrooms as Data Sources for Prediction Tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |