CN112102135A - 基于lstm神经网络的高校贫困生精准资助模型 - Google Patents
基于lstm神经网络的高校贫困生精准资助模型 Download PDFInfo
- Publication number
- CN112102135A CN112102135A CN202010949473.1A CN202010949473A CN112102135A CN 112102135 A CN112102135 A CN 112102135A CN 202010949473 A CN202010949473 A CN 202010949473A CN 112102135 A CN112102135 A CN 112102135A
- Authority
- CN
- China
- Prior art keywords
- poverty
- subsidy
- layer
- neural network
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 59
- 238000012549 training Methods 0.000 claims abstract description 39
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 210000002569 neuron Anatomy 0.000 claims description 39
- 238000012360 testing method Methods 0.000 claims description 20
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000015654 memory Effects 0.000 abstract description 6
- 238000002474 experimental method Methods 0.000 abstract description 2
- 238000011002 quantification Methods 0.000 abstract description 2
- 230000001537 neural effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000011160 research Methods 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 210000004027 cell Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于长短期记忆神经网络LSTM的高校贫困生精准资助模型,基于LSTM神经网络构建了高校贫困生精准资助模型,通过数据实验分析了LSTM神经网络隐层神经单元数、训练优化算法与贫困生资助等级识别率之间的关系,并据此对基于LSTM的高校贫困生精准资助模型进行结构与参数优化。该精准资助模型能够根据高校贫困生消费数据识别国家助学金资助等级,为高校贫困生资助的精准识别和分类提供智能量化工具,能够减少人为干扰因素,对于高校学生资助助学工作具有创新性意义。
Description
技术领域
本发明涉及一种基于LSTM神经网络的高校贫困生精准资助模型。
背景技术
高校贫困学生资助体系是国家教育扶贫的重要组成部分,随着社会经济的飞速发展,高校贫困生资助体系也面临一些基础性和共性问题,而贫困生身份认定工作一直是资助工作的基础和难点,现阶段主要存在认定依据简单、人为因素干扰、参照标准片面、量化指标真实性核实难等问题。现阶段教育精准资助研究主要还是集中在资助对象精准识别上。目前的研究成果主要分为以下两种层面:
一是从宏观层面对大数据应用进行顶层设计、技术路径和保障措施方面进行研究,技术实施方案和细节研究的较少,此层面文献占比较大。
二是从技术路径层面对资助对象精准识别技术实施方案展开研究,这方面研究较少见诸报道。吴朝文对学生校园卡消费数据的用餐次数、平均用餐金额和用餐金额波动情况进行统计,根据已经认定的贫困生消费数据制定贫困线,比较每名学生的以上三类统计值与贫困线的距离从而确定贫困指数,对贫困指数排序后与认定贫困生名单对比以评估学校资助体系运行情况。齐怀峰采用K-means算法对校园卡消费数据聚类,与认定贫困生名单比对从而确定“可疑”人员。
以上研究仍在待深入研究的问题:一是已有技术实施方案在精准识别资助对象上还不够完善,更多的是验证资助体系运行情况和找出“可疑”对象;二是如何利用大数据思维从海量数据内部挖掘出相互关系和潜在规律,从而对拟资助对象精准识别有待深入研究,传统数学模型和方法在基于大数据背景下的研究已“力不从心”。
面对上述待深入研究的问题,人工神经网络(Artificial Neural Network,ANN)提供了新的可行解决路径。ANN能够在对问题了解较少的情况下,通过神经网络的训练,找出输入数据和输出数据之间的潜在联系,对未知问题做出预测和分类,而不是依赖经验和精确建模。同时,与人类大脑相似,人工神经网络计算功能是并行分布的,处理速度较快。将ANN实际应用于高校资助工作中的研究较少,代表性文献有柴政将BP(BP,backpropagation)神经网络应用于贫困生等级识别,从学生校园卡消费数据中提取统计特征值对BP网络训练和测试,测试样本数量为234条,识别精度为97.8%。但是由于BP神经网络权值调节采用的是负梯度下降法,如果初始状态参数选择不当,容易使BP网络收敛速度很缓慢甚至停止,从而使BP神经网络陷入局部极小值而识别失败;而且测试样本数较少,在模型识别精度验证上还需提供更多数据进行测试,在贫困生识别特征选取上,缺乏理论指导;
因此,如何针对传统模型存在的问题,提出一种更适用于贫困生识别特征选取的模型是目前亟待解决的问题。
发明内容
针对上述存在的问题,本发明旨在提供基于LSTM神经网络的高校贫困生精准资助模型,基于LSTM神经,提出一种高校贫困生精准资助模型,能够有效的对国家助学金拟资助贫困生受资助等级进行精确分类。
为了实现上述目的,本发明所采用的技术方案如下:
基于LSTM神经网络的高校贫困生精准资助模型,其特征在于,包括以下步骤:
S1:采集已受不同等级国家助学金资助的学生消费记录;
S2:对每个学生消费记录数据进行归一化处理;
S3:基于LSTM神经网络,建立高校贫困生精准资助模型;
S4:对建立好的高校贫困生精准资助模型进行训练和测试;
S5:利用训练好的模型对拟资助高校贫困生进行资助等级分类。
进一步地,步骤S2的具体操作步骤包括:
S21:计算每个贫困生消费数据的标准差,计算的公式为:
S22:对数据进行均值减法,通过公式(2)进行变换,使得每个等级贫困生消费数据平均值为零:
S23:得到均一化数据,其计算公式为:
进一步地,步骤S3中所述的高校贫困生精准资助模型由上至下依次包括输入层、隐藏层、Dropout层、全连接层、似然层以及输出层;
输入层为第一层,输入维数为每个受国家助学金资助的学生消费记录的数目;
隐藏层为第二层,主要用于提取特征;
Dropout层为第三层,用于按照一定的概率将神经网络单元从网络中暂时丢弃的操作,所述概率设置为0.4;
全连接层为第四层,用于将提取到的特征进行分类;
似然层为第五层,用于计算各类别的似然概率来确定分类的类别;
输出层为第六层,用于输出国家助学金拟资助学生分类结果。
进一步地,所述分类结果根据国家助学金资助政策为三类,分别为:一等资助、二等资助和三等资助。
进一步地,步骤S4的具体操作步骤包括:
S41:将每类学生消费数据的70%作为训练数据,30%作为测试数据;
S42:设置不同的隐层神经元数目对模型进行识别率的测试,得出的识别率最高的神经元数目即为最优神经元数目;
S43:根据最优神经元数目设定所述隐层中的神经元数目,采用Adam为训练优化算法,用以优化模型。
进一步地,步骤42的具体操作步骤包括:
步骤421:将以往受资助的贫困生消费记录数据作为输入,同时按照资助等级对数据贴标签;
步骤422:计算训练样本预测值与实际输出值的误差,并且计算误差的函数采用交叉熵损失函数;
步骤423:根据误差函数值利用反向传播算法不断调整神经网络权值与偏差,直到误差函数达到精度要求,此时得到的最高的神经元数目即为最优神经元数目。
本发明的有益效果是:
第一,本发明中所采用的LSTM神经网络与传统浅层神经网络如BP神经网络相比,其不需经过特征提取过程,直接通过LSTM深度神经网络进行逐层特征提取,提取更有效、鲁棒的特征;
第二,本发明中提出的高校贫困生精准资助模型能够有效的对国家助学金拟资助贫困生受资助等级进行精确分类,为高校精准资助工作提供智能化工具,对于提高教育资助公平和效益具有重要意义;
综上所述,本发明中提出的方法能够有效解决在高校贫困生资助工作中存在认定过程受人为因素干扰、认定过程量化程度较弱等问题。
附图说明
图1为LSTM神经网络的结构图;
图2为LSTM中记忆单元的内部结构图;
图3为2019年重庆商务职业学院学生一卡通消费数据示例;
图4(a)为高校贫困生精准资助模型的神经网络层次结构;
图4(b)为LSTM神经网络各层设置示意图;
图5(a)-(g)为隐层神经元数分别设为60、80、100、120、140、160、180时高校贫困生精准资助模型训练过程图;
图6(a)-(b)分别采用为Sgdm训练优化算法和Rmsprop训练优化算法的高校贫困生精准资助模型训练过程(隐层神经元数=120)。
具体实施方式
为了使本领域的普通技术人员能更好的理解本发明的技术方案,下面结合附图和实施例对本发明的技术方案做进一步的描述。
Hochreiter提出的长短期记忆(LSTM,Long Short-Term Memory Networks)神经网络具有“长期记忆”和时间序列数据分类预测能力,LSTM可以对输入序列数据进行逐层学习并自适应提取特征,弥补了BP神经网络在提取校园卡数据特征值中的人为因素干扰。
近年来,随着计算机硬件、大数据、云计算等技术为新一代人工智能技术发展提供了支撑,2006年Hinton提出了深度神经网络,随后以卷积神经网络(CNN,ConvolutionalNeural Networks)、循环神经网络(RNN,Recurrent Neural Network)、自编码器(Autoencoder)和受限玻尔兹曼机(RBM,restricted Boltzmann machine)为代表的深度学习技术在人工智能中展示了独特的优势,在图像处理、机器视觉、语音识别、自然语言处理方面已经有广泛的应用。RNN中的LSTM(LSTM,Long Short-Term Memory Networks)直接把原始观测数据作为输入,不需经过特征提取过程,通过深度神经网络进行逐层特征提取,提取更有效、鲁棒的特征,能够较好的解决BP神经网络应用于贫困生资助中存在的特征提取缺乏理论依据和网络训练容易陷入局部极值而失败等问题。
LSTM是RNN的一种变体,由输入层、隐藏层,输出层构成。LSTM隐层神经元不仅接收输入层传递的信息,还接收神经元在前一个时刻的状态信息,LSTM的这种循环结构更适合时间序列数据的特征提取和处理。
参考附图1可以看出LSTM结构,在t时刻,隐层的输入为前一时刻隐藏层状态ht-1,记忆单元状态ct-1和当前时刻的输入xt,然后依次通过遗忘门ft、输入门it、输出门ot得到t时刻的隐藏层状态ht和记忆单元状态ct,ht与ct一起输入后一神经网络层作为输入;
参考附图2可以看出LSTM记忆单元结构,在t时刻,将记忆单元状态变量ct-1、前一时刻的隐藏层状态变量ht-1和当前时刻的输入信息xt作为记忆单元的输入;然后模型依次通过遗忘门ft、输出门ot、输入门it和相应的控制函数得到t时刻的隐藏层状态变量ht和记忆单元状态变量ct;最终ht会作为输入生成LSTM在t时刻的输出yt,同时与ct一起作为后一时刻的输入;
本发明中的基于LSTM神经网络的高校贫困生精准资助模型,包括以下步骤:
S1:采集已受不同等级国家助学金资助的学生消费记录;
S2:对每个学生消费记录数据进行归一化处理;
S3:基于LSTM神经网络,建立高校贫困生精准资助模型;
S4:对建立好的高校贫困生精准资助模型进行训练和测试;
S5:利用训练好的模型对拟资助高校贫困生进行资助等级分类。
对每个等级的学生消费数据进行归一化处理,具体步骤为:
按公式(1)求出每个贫困生消费数据的标准差,式中x为每个贫困生消费数据的平均值。
按式(2)对数据进行均值减法,式中xi为原始数据,通过该公式变换,使得每个等级贫困生消费数据平均值为零。
对数据进行均值减法后,再按式(3)除以标准差得到均一化数据。
得到的均一化数据有利于后续LSTM精准资助模型的训练和测试。
LSTM神经网络对一维序列数据进行深度学习并逐层自动提取特征,避免了特征提取过程中可能存在的人为因素干扰,其输出利用似然函数(Softmax)对输出结果进行分类。
参考附图4可以看出,本发明中的基于LSTM神经网络的高校贫困生精准资助模型共有6层:
第一层为输入层(sequenceinput层),这里输入维数为提取的每名受国家助学金资助的学生消费记录的数目,这里设为300,即从采集的每名学生消费记录选择300条作为输入;
第二层为隐层(biLISTM层),主要是提取特征之用,隐层神经元数目的确定根据后续模型测试结果确定;
第三层为dropout层,是在ANN训练过程中为防止过拟合,按照一定的概率将神经网络单元从网络中暂时丢弃的操作,这里设为0.4;
第四层为全连接层fc层,起到特征“分类器”作用;
第五层为似然层softmax层,计算各类别的似然概率以确定分类类别;
第六层为输出层classoutput层,最后输出国家助学金拟资助学生分类结果,输出类别为3类,第一类为一等资助,第二类为二等资助,第三类为三等资助。
进一步地,步骤4的具体操作步骤包括:
S41:将每类学生消费数据的70%作为训练数据,30%作为测试数据;
S42:设置不同的隐层神经元数目对模型进行识别率的测试,得出的识别率最高的神经元数目即为最优神经元数目,且当识别率最高时相应的结构、参数为最优;
训练损失函数采用softmax层采用的交叉熵损失函数(Cross-entropy costfunction)衡量,如式(18)所示:
S43:当确定最优隐层神经元数后对比Adam、SGDM和RMSProp训练优化算法的识别率,最终采用Adam算法为训练优化算法,并根据最优神经元数目设定所述隐层中的神经元数目来优化模型。
LSTM神经网络在训练中常用的训练优化算法是自适应矩估计(Adam,AdaptiveMoment Estimation)算法,Adam算法。
Adam算法结合了带动量随机梯度下降算法(SGDM,Stochastic Gradient DescentWith Momentum)和前向均方根梯度下降(RMSProp,Root Mean Square Propagation)算法的优点,将以往梯度的平方vt的指数衰减平均值,同时也保留了过去梯度mt的指数衰减平均值。
mt=β1mt-1+(1-β1)gt (4)
gt为小批量梯度,初始化mt和vt为0向量,为抵消向0的偏置,需要做偏差校正,方法如下:
t+1状态梯度按以下公式更新:
Adam算法中包含了超参数β1,β2和ε,β1一般取值0.9,β2取值0.999,ε设置为10-8,学习率η为0.001[12]。
LSTM神经网络模型参数的设置如表1所示。
表1 LSTM神经网络模型参数
模型的隐层神经元数目对于识别准确率具有显著影响,在以上结构、参数基础上,通过设置不同隐层神经元数目对模型进行识别率的测试,分析隐层神经元数目与识别率之间的关系以优化模型。
实施例:
1、数据采集:
人工神经网络之所以能够模拟人脑进行精准分类和识别,其前提是需要大量的数据对神经网络训练和测试,使得神经网络模型能够对未知数据模式进行分类。而对于大学贫困生资助工作而言,需要对贫困生贫困程度进行分析预测以确定其应受资助的等级。一卡通中的消费数据能够直接的反映学生经济状况,而国家助学金资助对象范围最广,形成的数据较为丰富,适合于ANN模型的训练和测试。本发明中采集了2019年重庆商务职业学院学生校园一卡通消费记录,附图3所示的为部分学生消费记录,共采集6万余条一卡通消费记录。
其中,对已受国家助学金资助学生的消费记录进行分析提取,为消除消费异常行为和便于模型处理,采集每名学生消费记录数大于300条的学生消费记录,匹配2017至2019受国家助学金资助学生名单,最后形成国家助学金一等资助学生一卡通消费记录40758条,国家助学金二等资助学生一卡通消费记录50381条,国家助学金三等资助学生一卡通消费记录40477条。
设定输入层输入维数为提取的每名受国家助学金资助的学生消费记录的数目,这里设为300,对提取后的每个等级的学生消费数据进行归一化处理后,得到相应的归一化数据。
2、模型训练
LSTM神经网络模型输入数据是先期采集的学生消费数据,每类学生消费数据的70%作为训练数据,30%作为测试数据。对模型进行训练,不同隐层神经元数对应的LSTM模型训练过程如图5所示,在附图5(a)-(g)中分别设置隐层神经元数为:60、80、100、120、140、160、180,然后对模型进行训练,训练后在不同隐层神经元数条件下对应的测试识别率如表2所示。
表2贫困生资助等级识别率和隐层神经元数之间的关系
很明显可以看出,当神经元数为120时,识别率最高,那么在构建LSTM神经网络的高校精准资助模型时在隐层biLISTM层,确定隐层神经元数目为120为最优;
3、模型验证
为验证本模型中采用的Adam训练优化算法的优越性,将隐层神经元数设为120,采用SGDM和RMSProp算法分别对模型进行训练和测试,附图6为训练过程图,采用SGDM算法时模型识别率为87.3%,采用RMSProp算法时模型识别率为89.5%,很明显这两种算法与采用Adam算法相比识别率较低;
4、结论
本发明中的方法以学生校园卡消费数据为研究对象,采集了2019年重庆商务职业学院学生校园卡消费数据,与2017至2019年受国家助学金资助学生名单匹配,生成三个资助等级的学生消费记录数据13余万条,样本数据丰富,满足人工神经网络训练对大数据量的需求。对基于LSTM神经网络的高校贫困生精准资助模型的结构、参数进行设计和开发,研究了模型隐层单元数与贫困生资助等级识别率之间的关系,实验结果表明贫困资助等级识别率随着隐层神经元数目的增加而增加,但达到一定数目时识别率保持稳定,没有明显增加。该贫困生精准资助模型能够自动的识别贫困生资助等级,正确识别率能达到98.11%;
综上可以看出,LSTM神经网络有一般性的结构和训练优化算法,针对具体场景应用需输入相关数据进行模型训练和测试,从而选取识别率高的隐层神经元数和训练算法对应的LSTM结构。本发明中通过实验确定模型隐层神经元数为120,训练优化算法为Adam,通过以上优化设计适合高校贫困生精准资助等级识别的模型,从而得到了较大的正确识别率。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.基于LSTM神经网络的高校贫困生精准资助模型,其特征在于,包括以下步骤:
S1:采集已受不同等级国家助学金资助的学生消费记录;
S2:对每个学生消费记录数据进行归一化处理;
S3:基于LSTM神经网络,建立高校贫困生精准资助模型;
S4:对建立好的高校贫困生精准资助模型进行训练和测试以优化模型;
S5:利用优化后的模型对拟资助高校贫困生进行资助等级分类。
3.根据权利要求2所述的基于LSTM神经网络的高校贫困生精准资助模型,其特征在于:步骤S3中所述的高校贫困生精准资助模型由上至下依次包括输入层、隐藏层、Dropout层、全连接层、似然层以及输出层;
输入层为第一层,输入维数为每个受国家助学金资助的学生消费记录的数目;
隐藏层为第二层,主要用于提取特征;
Dropout层为第三层,用于按照一定的概率将神经网络单元从网络中暂时丢弃的操作以防止过拟合,所述概率设置为0.4;
全连接层为第四层,用于将提取到的特征进行分类;
似然层为第五层,用于计算各类别的似然概率来确定分类的类别;
输出层为第六层,用于输出国家助学金拟资助等级分类结果。
4.根据权利要求3所述的基于LSTM神经网络的高校贫困生精准资助模型,其特征在于:所述分类结果根据国家助学金资助政策分为三类,分别为:一等资助、二等资助和三等资助。
5.根据权利要求1所述的基于LSTM神经网络的高校贫困生精准资助模型,其特征在于:步骤S4的具体操作步骤包括:
S41:将每类学生消费数据的70%作为训练数据,30%作为测试数据;
S42:设置不同的隐层神经元数目对模型进行识别率的测试,得出的识别率最高的神经元数目即为最优神经元数目;
S43:根据最优神经元数目设定所述隐层中的神经元数目,采用Adam为训练优化算法,用以优化模型。
6.根据权利要求1所述的基于LSTM神经网络的高校贫困生精准资助模型,其特征在于:步骤42的具体操作步骤包括:
步骤421:将以往受资助的贫困生消费记录数据作为输入,同时按照资助等级对数据贴标签;
步骤422:计算训练样本预测值与实际输出值的误差,并且计算误差的函数采用交叉熵损失函数;
步骤423:根据误差函数值利用反向传播算法不断调整神经网络权值与偏差,直到误差函数达到精度要求,此时得到的最高的神经元数目即为最优神经元数目。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010949473.1A CN112102135A (zh) | 2020-09-10 | 2020-09-10 | 基于lstm神经网络的高校贫困生精准资助模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010949473.1A CN112102135A (zh) | 2020-09-10 | 2020-09-10 | 基于lstm神经网络的高校贫困生精准资助模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112102135A true CN112102135A (zh) | 2020-12-18 |
Family
ID=73750910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010949473.1A Pending CN112102135A (zh) | 2020-09-10 | 2020-09-10 | 基于lstm神经网络的高校贫困生精准资助模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102135A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541579A (zh) * | 2020-12-23 | 2021-03-23 | 北京北明数科信息技术有限公司 | 模型训练方法、贫困程度信息识别方法、装置和存储介质 |
CN113554077A (zh) * | 2021-07-13 | 2021-10-26 | 南京铉盈网络科技有限公司 | 基于多模态神经网络模型的工况评估及业务量预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977955A (zh) * | 2019-04-03 | 2019-07-05 | 南昌航空大学 | 一种基于深度学习的宫颈癌前病变识别的方法 |
CN110097142A (zh) * | 2019-05-15 | 2019-08-06 | 杭州华网信息技术有限公司 | 针对学生序列化行为的贫困生预测方法 |
-
2020
- 2020-09-10 CN CN202010949473.1A patent/CN112102135A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977955A (zh) * | 2019-04-03 | 2019-07-05 | 南昌航空大学 | 一种基于深度学习的宫颈癌前病变识别的方法 |
CN110097142A (zh) * | 2019-05-15 | 2019-08-06 | 杭州华网信息技术有限公司 | 针对学生序列化行为的贫困生预测方法 |
Non-Patent Citations (3)
Title |
---|
JUN ZHOU ET AL: "Research on the Precise Funding Model of Poor College Students Based on LSTM Neural Network", BASIC & CLINICAL PHARMARCOLOGY & TOXICOLOGY, vol. 127, no. 1, 2 August 2020 (2020-08-02), pages 94 - 95 * |
柴政;屈莉莉;彭贵宾;: "高校贫困生精准资助的神经网络模型", 数学的实践与认识, no. 16, 23 August 2018 (2018-08-23), pages 87 - 93 * |
言有三: "深度学习之人脸图像处理 核心算法与案例实战", 31 July 2020, 机械工业出版社, pages: 39 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541579A (zh) * | 2020-12-23 | 2021-03-23 | 北京北明数科信息技术有限公司 | 模型训练方法、贫困程度信息识别方法、装置和存储介质 |
CN112541579B (zh) * | 2020-12-23 | 2023-08-08 | 北京北明数科信息技术有限公司 | 模型训练方法、贫困程度信息识别方法、装置和存储介质 |
CN113554077A (zh) * | 2021-07-13 | 2021-10-26 | 南京铉盈网络科技有限公司 | 基于多模态神经网络模型的工况评估及业务量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144496B (zh) | 一种基于混合卷积神经网络的垃圾分类方法 | |
CN108647583B (zh) | 一种基于多目标学习的人脸识别算法训练方法 | |
CN109101938B (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
CN111241837A (zh) | 基于对抗迁移学习的盗窃案件法律文书命名实体识别方法 | |
CN108846413B (zh) | 一种基于全局语义一致网络的零样本学习方法 | |
CN109993236A (zh) | 基于one-shot Siamese卷积神经网络的少样本满文匹配方法 | |
Jing et al. | Yarn-dyed fabric defect classification based on convolutional neural network | |
CN111275113A (zh) | 基于代价敏感混合网络的偏斜类时间序列异常检测方法 | |
CN113469470B (zh) | 基于电力大脑中枢的用能数据与碳排放量关联分析方法 | |
CN110348608A (zh) | 一种基于模糊聚类算法改进lstm的预测方法 | |
CN110689523A (zh) | 基于元学习个性化图像信息评价方法、信息数据处理终端 | |
CN112102135A (zh) | 基于lstm神经网络的高校贫困生精准资助模型 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN109582974A (zh) | 一种基于深度学习的在校大学生信用评估方法及装置 | |
CN112883931A (zh) | 基于长短期记忆网络的实时真假运动判断方法 | |
CN115761408A (zh) | 一种基于知识蒸馏的联邦域适应方法及系统 | |
CN110765285A (zh) | 基于视觉特征的多媒体信息内容管控方法及系统 | |
CN116110089A (zh) | 一种基于深度自适应度量学习的面部表情识别方法 | |
CN117274657A (zh) | 基于课程知识蒸馏的耐噪声木薯叶病害分类方法及系统 | |
CN111241165B (zh) | 一种基于大数据的人工智能教育系统及数据处理方法 | |
CN104050451A (zh) | 一种基于多通道Haar-like特征的鲁棒目标跟踪方法 | |
CN111126444A (zh) | 分类器集成方法 | |
CN113792574B (zh) | 一种基于度量学习和教师学生模型的跨数据集表情识别方法 | |
CN111950333B (zh) | 一种基于神经网络电子手写签名识别的方法 | |
CN114462466A (zh) | 一种面向深度学习的数据去偏方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |