CN114372618A - 一种学生成绩的预测方法、系统、计算机设备及存储介质 - Google Patents
一种学生成绩的预测方法、系统、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN114372618A CN114372618A CN202111612360.3A CN202111612360A CN114372618A CN 114372618 A CN114372618 A CN 114372618A CN 202111612360 A CN202111612360 A CN 202111612360A CN 114372618 A CN114372618 A CN 114372618A
- Authority
- CN
- China
- Prior art keywords
- student
- prediction
- data
- achievement
- collection table
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000013480 data collection Methods 0.000 claims abstract description 36
- 230000009467 reduction Effects 0.000 claims abstract description 32
- 238000000513 principal component analysis Methods 0.000 claims abstract description 22
- 230000006870 function Effects 0.000 claims description 47
- 238000012549 training Methods 0.000 claims description 32
- 238000004422 calculation algorithm Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 5
- 238000010845 search algorithm Methods 0.000 claims description 2
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Educational Technology (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种学生成绩的预测方法、系统、计算机设备及存储介质。该方法通过获取学生数据;对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。该方法可解决现有模型的复杂度过高,且容易导致模型出现过拟合,使得最终得到的预测结果准确度偏低的技术问题,基于该方法可以得出较为准确的学生成绩预测结果,有利于更好地指导教学工作的进行。本申请可广泛应用于人工智能技术领域内。
Description
技术领域
本申请涉及人工智能技术领域,尤其是一种学生成绩的预测方法、系统、计算机设备及存储介质。
背景技术
学生成绩是评价教学质量的重要依据。随着信息化技术的普及,学校教学管理系统及课程作业系统中,以电子数据形式积累了大量的学生作业成绩和考试成绩。如何对这些成绩数据进行有效挖掘以提高教学质量,是值得研究的问题。学生因个体差异,导致学习效果会存在很大的差异。如果能利用学生已有成绩对该学生的未来成绩做出预测,并以预测结果为依据,适当地更改教学策略并对学生进行提示,可以提高教学质量。
相关技术中,成绩预测主要采用基于人工的预测方法,由教师或者科研人员人工收集数据,并根据经验对成绩进行估计。该类方法不仅工作过程复杂,而且计算量大、耗时长。随后出现了基于数理统计的预测方法,如最小二乘回归、灰色模型等。该类方法采用数学建模对学生成绩进行预测,然而该类方法对于非线性数据的预测能力不强,无法准确刻画学生成绩变化特点。近些年,基于机器学习的预测方法发展迅速,如贝叶斯网络、BP神经网络等。该类方法具有很强的非线性建模能力。
但是,学生学习的相关数据维度庞大,并且部分维度数据对于预测结果的影响较小,基于原始维度的数据训练会大大增加训练的耗时,增加模型的复杂度,且容易导致模型出现过拟合,使得最终得到的预测结果准确度偏低。
综合上述,相关技术中存在的技术问题亟需得到解决。
发明内容
本申请的目的在于至少一定程度上解决相关技术中存在的技术问题之一。
为此,本申请实施例的一个目的在于提供一种学生成绩的预测方法,该方法可以得出较为准确的学生成绩预测结果,有利于更好地指导教学工作的进行。
本申请实施例的另一个目的在于提供学生成绩的预测系统。
为了达到上述技术目的,本申请实施例所采取的技术方案包括:
第一方面,本申请实施例提供了一种学生成绩的预测方法,所述方法包括以下步骤:
获取学生数据;
对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;
对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。
另外,根据本申请上述实施例的学生成绩的预测方法,还可以具有以下附加的技术特征:
进一步地,在本申请的一个实施例中,所述成绩预测模型通过以下步骤得到:
采集批量学生的样本数据,所述样本数据携带有学生成绩标签;
对所述样本数据进行PCA降维处理,得到降维后的主分量的样本数据收集表;所述样本数据收集表中包括多种和学生相关的属性值;
对所述样本数据收集表中的各个属性值进行正交编码,得到第二特征数据,将所述第二特征数据输入到初始化的成绩预测模型中进行预测,得到所述样本数据对应的第一成绩预测结果;
根据所述学生成绩标签和所述第一成绩预测结果,确定训练的损失值;
根据所述损失值,通过反向传播算法对所述成绩预测模型进行参数更新,得到训练好的成绩预测模型。
进一步地,在本申请的一个实施例中,所述确定训练的损失值,包括:
通过预先设定的损失函数确定训练的损失值;所述损失函数包括0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数中的任一种。
进一步地,在本申请的一个实施例中,所述损失函数中还包括有L2正则项。
进一步地,在本申请的一个实施例中,所述根据所述损失值,通过反向传播算法对所述成绩预测模型进行参数更新,包括:
根据所述损失值,通过网格搜索算法按照预定的步长调整所述成绩预测模型的参数。
进一步地,在本申请的一个实施例中,所述对所述成绩预测模型进行参数更新,得到训练好的成绩预测模型:
通过验证集对每次参数更新后的模型进行验证,确定所述成绩预测模型的预测准确率;
若当前所述预测准确率大于预设阈值,则完成所述成绩预测模型的训练,得到训练好的成绩预测模型。
第二方面,本申请实施例提供了一种学生成绩的预测系统,所述系统包括:
获取模块,用于获取学生数据;
降维模块,用于对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;
预测模块,用于对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。
第三方面,本申请实施例提供了一种计算机设备,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现第一方面所述的学生成绩的预测方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于实现第一方面所述的学生成绩的预测方法。
本申请的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到:
本申请实施例中提供一种学生成绩的预测方法,该方法通过获取学生数据;对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。该方法可解决现有模型的复杂度过高,且容易导致模型出现过拟合,使得最终得到的预测结果准确度偏低的技术问题,基于该方法可以得出较为准确的学生成绩预测结果,有利于更好地指导教学工作的进行。
附图说明
为了更清楚地说明本申请实施例或者现有技术中的技术方案,下面对本申请实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本申请的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为本申请实施例中提供的一种学生成绩的预测方法的实施环境示意图;
图2为本申请实施例中提供的一种学生成绩的预测方法的流程示意图;
图3为本申请实施例中提供的一种BP神经网络的结构示意图;
图4为本申请实施例中提供的一种学生成绩的预测系统的结构示意图;
图5为本申请实施例中提供的一种计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
学生成绩是评价教学质量的重要依据。随着信息化技术的普及,学校教学管理系统及课程作业系统中,以电子数据形式积累了大量的学生作业成绩和考试成绩。如何对这些成绩数据进行有效挖掘以提高教学质量,是值得研究的问题。学生因个体差异,导致学习效果会存在很大的差异。如果能利用学生已有成绩对该学生的未来成绩做出预测,并以预测结果为依据,适当地更改教学策略并对学生进行提示,可以提高教学质量。
相关技术中,成绩预测主要采用基于人工的预测方法,由教师或者科研人员人工收集数据,并根据经验对成绩进行估计。该类方法不仅工作过程复杂,而且计算量大、耗时长。随后出现了基于数理统计的预测方法,如最小二乘回归、灰色模型等。该类方法采用数学建模对学生成绩进行预测,然而该类方法对于非线性数据的预测能力不强,无法准确刻画学生成绩变化特点。近些年,基于机器学习的预测方法发展迅速,如贝叶斯网络、BP神经网络等。该类方法具有很强的非线性建模能力。
但是,学生学习的相关数据维度庞大,并且部分维度数据对于预测结果的影响较小,基于原始维度的数据训练会大大增加训练的耗时,增加模型的复杂度,且容易导致模型出现过拟合,使得最终得到的预测结果准确度偏低。
有鉴于此,本申请实施例中提供一种学生成绩的预测方法,本申请实施例中的方法使用BP神经网络进行学生成绩的预测,通过引入PCA降维技术和正则化技术,解决现有模型的复杂度过高,且容易导致模型出现过拟合,使得最终得到的预测结果准确度偏低的技术问题。该方法可以得出较为准确的学生成绩预测结果,有利于更好地指导教学工作的进行。
首先,请参照图1,图1是本申请实施例提供的一种学生成绩的预测方法的实施环境示意图。参照图1,该实施环境的软硬件主体主要包括操作终端101和服务器102,操作终端101与服务器102通信连接。其中,该学生成绩的预测方法可以单独配置于操作终端101执行,也可以单独配置于服务器102执行,或者基于操作终端101与服务器102二者之间的交互来执行,具体可以根据实际应用情况进行适当的选择,本实施例对此并不作具体限定。此外,操作终端101与服务器102可以为区块链中的结点,本实施例对此并不作具体限定。
具体地,本申请中的操作终端101可以包括但不限于智能手表、智能手机、电脑、个人数字助理(Personal Digital Assistant,PDA)、智能语音交互设备、智能家电或者车载终端中的任意一种或者多种。服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content DeliveryNetwork,内容分发网络)以及大数据和人工智能平台等基础云计算服务的云服务器。操作终端101与服务器102之间可以通过无线网络或有线网络建立通信连接,该无线网络或有线网络使用标准通信技术和/或协议,网络可以设置为因特网,也可以是其它任何网络,例如包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。
请参照图2,图2是本申请实施例提供的一种学生成绩的预测方法的示意图,该学生成绩的预测方法可以配置在操作终端或者服务器中的至少一者。参照图2,该学生成绩的预测方法包括但不限于:
步骤110、获取学生数据;
本申请实施例中,获取的学生数据可以包括学生各个维度的指标数据,本申请对此不作具体限制。例如,在一些实施例中,当要预测学生的英语成绩时,可以采集获取的学生数据包括:词汇量、语法水平、听力水平、口语水平、中英互译水平、学习专注度、阅读能力、写作能力、表达能力、文化理解能力、交际能力、主观能动性等等指标数据。此处,需要说明的是,针对每种指标数据,都可以设置一个对应的评分表,由客观的具体条件或者专业的老师给出对应的得分,作为采集得到的指标数据。
在一些实施例中,对于获取的多个维度的指标数据,为了提高数据的有效性,可以通过多个专家老师进行评分,还可以将获得的原始数据中每一项指标得分均去掉3个最低分和3个最高分后取平均值。并且,为了尽可能避免评价过程中主观因素的影响,可以采用信息熵方法计算各评价指标的权重,将指标得分的线性加权和作为最终的学生数据。
当然,需要理解的是,本申请实施例中获取学生数据的方式并不局限于上述说明的情形,具体可以根据需要灵活实施。
步骤120、对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;
本申请实施例中,通过PCA降维技术对学生数据进行降维处理。PCA降维技术也被称为主分量分析法,是一种掌握主要矛盾的多元统计方法,PCA降维技术在表现方法上,能够将原始数据间隐含的相互关系,在低维空间用排序图的形式直观地反映出来。
具体地,PCA降维处理的实质是用数学统计的方法将多个相关程度较大的变量转化为少数几个互相无关的综合变量,降低原始样本的数据维数。假设样本矩阵X=(X1,X2,…,Xn)的样本容量为n,每个样本有m个特征指标Xi=(Xi1,Xi2…,Xin),i=(1,2,…,m),计算样本矩阵X的相关系数矩阵,如下式:
Rx·ωi=λi·ωi;
接着,设特征向量矩阵训[ω1、ω2、…ωm],按照M=a·ωi T计算可以建立新的样本矩阵M。将m维的样本矩阵变换为等维的样本矩阵,M中任一元素Mij表示X中第i样本的第j个主分量。计算前P个主成分的累计贡献率,保留重构样本矩阵中的主要分量,剔除次要分量,当累计贡献率大于一定数值时,可以用前P个主成分代替初始的个m特征指标,从而达到数据降维的目的。本申请实施例中,可以在数据降维后得到主分量的学生数据收集表,该表中包括有多种和学习相关的属性值。
步骤130、对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。
本申请实施例中,在得到学生数据收集表之后,可以对学生数据收集表中的各个属性值进行正交编码,将得到的数据记为第一特征数据,可以将第一特征数据输入到训练好的成绩预测模型中进行预测,从而得到学生数据对应的学生成绩预测结果。
具体地,本申请实施例中,使用的BP(BackPropagation)神经网络是一种按误差逆向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络之一,参照图3,BP神经网络的组成有输入层、隐藏层和输出层。模型在处理数据时,输入向量x的每个元素的值赋给传输层对应的神经元,依次向前计算每一层的每个神经元的值(在隐藏层里计算神经元的值),隐藏层计算完结果传递给输出层(每个值都要传给输出层,输出层统计神经元的值),输出层输出期望结果。
基本的BP算法包括信号的前向传播和误差的反向传播两个过程。即计算误差输出时按从输入到输出的方向进行,而调整权值和阈值则从输出到输入的方向进行。正向传播时,输入信号通过隐含层作用于输出节点,经过非线性变换,产生输出信号,若实际输出与期望输出不相符,则转入误差的反向传播过程。误差反传是将输出误差通过隐含层向输入层逐层反传,并将误差分摊给各层所有单元,以从各层获得的误差信号作为调整各单元权值的依据。通过调整输入节点与隐层节点的联接强度和隐层节点与输出节点的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。
具体地,本申请实施例中,所述成绩预测模型通过以下步骤得到:
采集批量学生的样本数据,所述样本数据携带有学生成绩标签;
对所述样本数据进行PCA降维处理,得到降维后的主分量的样本数据收集表;所述样本数据收集表中包括多种和学生相关的属性值;
对所述样本数据收集表中的各个属性值进行正交编码,得到第二特征数据,将所述第二特征数据输入到初始化的成绩预测模型中进行预测,得到所述样本数据对应的第一成绩预测结果;
根据所述学生成绩标签和所述第一成绩预测结果,确定训练的损失值;
根据所述损失值,通过反向传播算法对所述成绩预测模型进行参数更新,得到训练好的成绩预测模型。
本申请实施例中,在训练成绩预测模型时,可以采集获取批量的学生的样本数据,此处,样本数据的获取以及处理过程和前述的学生数据较为类似,在此不再一一赘述。当样本数据得到第二特征数据后,可以将第二特征数据输入到初始化的成绩预测模型中,得到成绩预测模型输出的预测结果,记为第一成绩预测结果。得到第一成绩预测结果后,可以根据该预测结果和样本数据携带的学生成绩标签评估成绩预测模型预测的准确性,以对模型进行反向传播训练,更新其内容的相关参数。
具体地,对于成绩预测模型来说,它的预测结果的准确性可以通过损失函数(LossFunction)来衡量,损失函数是定义在单个训练数据上的,用于衡量一个训练数据的预测误差,具体是通过单个训练数据的标签和模型对该训练数据的预测结果确定该训练数据的损失值。而实际训练时,一个训练数据集有很多训练数据,因此一般采用代价函数(CostFunction)来衡量训练数据集的整体误差,代价函数是定义在整个训练数据集上的,用于计算所有训练数据的预测误差的平均值,能够更好地衡量出模型的预测效果。对于一般的机器学习模型来说,基于前述的代价函数,再加上衡量模型复杂度的正则项即可作为训练的目标函数,基于该目标函数便能求出整个训练数据集的损失值。常用的损失函数种类有很多,例如0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数等均可以作为机器学习模型的损失函数,在此不再一一阐述。本申请实施例中,可以从中任选一种损失函数来确定训练的损失值,为了防止模型出现过拟合现象,可以采用正则化的方法来防止过度拟合,例如可以在损失函数设置L2正则项,就是在原本的损失函数基础上加上一个惩罚项,以使模型里面的参数复杂度变小,从而达到避免过拟合现象的发生。
在一些实施例中,在训练过程中,当选择和调整模型的参数的时候,一般是凭经验微调,或者选择不同大小的参数,代入模型中,挑选表现最好的参数。但是这两种方式的效率均较低,本申请实施例中,可以通过网格搜索快速找到最合适的模型参数。具体地,网格搜索,即GridSearchCV,搜索对象是模型的参数,目的是通过机器搜索,在指定的参数范围内,按步长依次调整参数,利用调整的参数训练学习器,从所有的参数中找到在验证集上精度最高的参数,作为模型参数。即当每次进行参数更新后,通过验证集对模型进行验证,确定模型当前的预测准确率,当当前的预测准确率最高或者超过预先设定的阈值时,可以认为模型的精度达到要求,可以停止训练,从而得到训练好的模型。本申请实施例中,验证集的获取方式和训练数据集类似,在此不再赘述。
可以理解的是,本申请实施例中,提供一种基于神经网络的学生成绩预测方法,使用BP神经网络进行学生成绩的预测,通过引入PCA降维技术和正则化技术,解决现有模型的复杂度过高,且容易导致模型出现过拟合,使得最终得到的预测结果准确度偏低的技术问题。该方法可以得出较为准确的学生成绩预测结果,有利于更好地指导教学工作的进行。
下面参照附图详细描述根据本申请实施例提出的学生成绩的预测系统。
参照图4,本申请实施例中提出的学生成绩的预测系统,系统包括:
获取模块201,用于获取学生数据;
降维模块202,用于对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;
预测模块203,用于对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。
可以理解的是,上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
参照图5,本申请实施例提供了计算机设备,包括:
至少一个处理器301;
至少一个存储器302,用于存储至少一个程序;
当至少一个程序被至少一个处理器301执行时,使得至少一个处理器301实现的学生成绩的预测方法。
同理,上述方法实施例中的内容均适用于本计算机设备实施例中,本计算机设备实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
本申请实施例还提供了一种计算机可读存储介质,其中存储有处理器301可执行的程序,处理器301可执行的程序在由处理器301执行时用于执行上述的学生成绩的预测方法。
同理,上述方法实施例中的内容均适用于本计算机可读存储介质实施例中,本计算机可读存储介质实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或方框有时能以相反顺序被执行。此外,在本申请的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本申请,但应当理解的是,除非另有相反说明,功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本申请是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本申请。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本申请的范围,本申请的范围由所附权利要求书及其等同方案的全部范围来决定。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本申请的实施方式,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同物限定。
以上是对本申请的较佳实施进行了具体说明,但本申请并不限于实施例,熟悉本领域的技术人员在不违背本申请精神的前提下可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (9)
1.一种学生成绩的预测方法,其特征在于,包括以下步骤:
获取学生数据;
对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;
对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。
2.根据权利要求1所述的学生成绩的预测方法,其特征在于,所述成绩预测模型通过以下步骤得到:
采集批量学生的样本数据,所述样本数据携带有学生成绩标签;
对所述样本数据进行PCA降维处理,得到降维后的主分量的样本数据收集表;所述样本数据收集表中包括多种和学生相关的属性值;
对所述样本数据收集表中的各个属性值进行正交编码,得到第二特征数据,将所述第二特征数据输入到初始化的成绩预测模型中进行预测,得到所述样本数据对应的第一成绩预测结果;
根据所述学生成绩标签和所述第一成绩预测结果,确定训练的损失值;
根据所述损失值,通过反向传播算法对所述成绩预测模型进行参数更新,得到训练好的成绩预测模型。
3.根据权利要求2所述的学生成绩的预测方法,其特征在于,所述确定训练的损失值,包括:
通过预先设定的损失函数确定训练的损失值;所述损失函数包括0-1损失函数、平方损失函数、绝对损失函数、对数损失函数、交叉熵损失函数中的任一种。
4.根据权利要求3所述的学生成绩的预测方法,其特征在于,所述损失函数中还包括有L2正则项。
5.根据权利要求2-4中任一项所述的学生成绩的预测方法,其特征在于,所述根据所述损失值,通过反向传播算法对所述成绩预测模型进行参数更新,包括:
根据所述损失值,通过网格搜索算法按照预定的步长调整所述成绩预测模型的参数。
6.根据权利要求2所述的学生成绩的预测方法,其特征在于,所述对所述成绩预测模型进行参数更新,得到训练好的成绩预测模型:
通过验证集对每次参数更新后的模型进行验证,确定所述成绩预测模型的预测准确率;
若当前所述预测准确率大于预设阈值,则完成所述成绩预测模型的训练,得到训练好的成绩预测模型。
7.一种学生成绩的预测系统,其特征在于,包括:
获取模块,用于获取学生数据;
降维模块,用于对所述学生数据进行PCA降维处理,得到降维后的主分量的学生数据收集表;所述学生数据收集表中包括多种和学生相关的属性值;
预测模块,用于对所述学生数据收集表中的各个属性值进行正交编码,得到第一特征数据,将所述第一特征数据输入到训练好的成绩预测模型中进行预测,得到所述学生数据对应的学生成绩预测结果。
8.一种计算机设备,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如权利要求1-6中任一项所述的学生成绩的预测方法。
9.一种计算机可读存储介质,其中存储有处理器可执行的程序,其特征在于:所述处理器可执行的程序在由处理器执行时用于实现如权利要求1-6中任一项所述的学生成绩的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612360.3A CN114372618A (zh) | 2021-12-27 | 2021-12-27 | 一种学生成绩的预测方法、系统、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111612360.3A CN114372618A (zh) | 2021-12-27 | 2021-12-27 | 一种学生成绩的预测方法、系统、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114372618A true CN114372618A (zh) | 2022-04-19 |
Family
ID=81142160
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111612360.3A Pending CN114372618A (zh) | 2021-12-27 | 2021-12-27 | 一种学生成绩的预测方法、系统、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114372618A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115185805A (zh) * | 2022-09-13 | 2022-10-14 | 浪潮电子信息产业股份有限公司 | 一种存储系统的性能预测方法、系统、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157204A (zh) * | 2016-06-20 | 2016-11-23 | 山东师范大学 | 一种基于bp神经网络模型的学生学业成绩预测方法及系统 |
CN111914004A (zh) * | 2020-08-19 | 2020-11-10 | 青海民族大学 | 一种基于数据挖掘算法的学业预警方法、系统及存储介质 |
CN113222123A (zh) * | 2021-06-15 | 2021-08-06 | 深圳市商汤科技有限公司 | 模型训练方法、装置、设备及计算机存储介质 |
-
2021
- 2021-12-27 CN CN202111612360.3A patent/CN114372618A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157204A (zh) * | 2016-06-20 | 2016-11-23 | 山东师范大学 | 一种基于bp神经网络模型的学生学业成绩预测方法及系统 |
CN111914004A (zh) * | 2020-08-19 | 2020-11-10 | 青海民族大学 | 一种基于数据挖掘算法的学业预警方法、系统及存储介质 |
CN113222123A (zh) * | 2021-06-15 | 2021-08-06 | 深圳市商汤科技有限公司 | 模型训练方法、装置、设备及计算机存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115185805A (zh) * | 2022-09-13 | 2022-10-14 | 浪潮电子信息产业股份有限公司 | 一种存储系统的性能预测方法、系统、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111860982A (zh) | 一种基于vmd-fcm-gru的风电场短期风电功率预测方法 | |
CN111046187B (zh) | 基于对抗式注意力机制的一样本知识图谱关系学习方法及系统 | |
CN112418482A (zh) | 一种基于时间序列聚类的云计算能耗预测方法 | |
KR102239464B1 (ko) | 심층 구조를 이용한 전력 수요 예측 방법 및 장치 | |
CN112766496B (zh) | 基于强化学习的深度学习模型安全性保障压缩方法与装置 | |
CN115906954A (zh) | 一种基于图神经网络的多变量时间序列预测方法及装置 | |
CN108961460B (zh) | 基于稀疏esgp与多目标优化的故障预测方法及装置 | |
CN112098833B (zh) | 一种继电器寿命预测方法、系统、介质及设备 | |
CN114660497A (zh) | 一种针对容量再生现象的锂离子电池寿命预测方法 | |
Kosana et al. | Hybrid wind speed prediction framework using data pre-processing strategy based autoencoder network | |
CN113361707A (zh) | 一种模型压缩方法、系统及计算机可读介质 | |
CN114580262A (zh) | 一种锂离子电池健康状态估计方法 | |
CN117077327A (zh) | 基于数字孪生的轴承寿命预测方法及系统 | |
CN117173883A (zh) | 一种城市交通流量预测方法及系统 | |
CN114372618A (zh) | 一种学生成绩的预测方法、系统、计算机设备及存储介质 | |
CN117494573B (zh) | 一种风速预测方法、系统及电子设备 | |
CN110516792A (zh) | 基于小波分解和浅层神经网络的非平稳时间序列预测方法 | |
CN116865235A (zh) | 一种基于lstm与多模型集成的负荷预测方法及装置 | |
CN117035710A (zh) | 人才评估量化方法、系统、设备及介质 | |
CN111882124B (zh) | 一种基于生成对抗模仿学习的同质平台发展效应预测方法 | |
CN108053266A (zh) | 一种专利价值预估方法以及装置 | |
CN115116614A (zh) | 一种健康状态评估方法、装置、设备及存储介质 | |
CN115048290A (zh) | 软件质量的评估方法、装置、存储介质及计算机设备 | |
CN114091908A (zh) | 计及多模式储能站的配电网综合评价方法、装置和设备 | |
Zha et al. | Container throughput time series forecasting using a hybrid approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |