CN108764718A

CN108764718A - 基于深度学习算法的高考分数预估及志愿选择方法、系统

Info

Publication number: CN108764718A
Application number: CN201810523472.3A
Authority: CN
Inventors: 王春宁; 官晨晔
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-05-28
Filing date: 2018-05-28
Publication date: 2018-11-06
Anticipated expiration: 2038-05-28
Also published as: CN108764718B

Abstract

本发明公开了一种基于深度学习算法的高考分数预估及志愿选择方法，包括：根据往年各高校各专业各生源地的分数线和线差，通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差；根据预测出的当前年度各高校各专业各生源地的线差，确定考生生源地当前年度各级别高校分数线；根据考生生源地，对其当前年度成绩值进行判断，并采用DNN神经网络算法计算得出相关的高校专业结果；根据匹配出的高校专业结果，得到初步报考方案；将初步报考方案与高校政策类信息结合分析，得到最终报考方案。本发明还提供了一种基于深度学习算法的高考分数预估及志愿选择系统。本发明的有益效果：去除人为主观性影响，使得专业选择更具备科学性，更为准确。

Description

基于深度学习算法的高考分数预估及志愿选择方法、系统

技术领域

本发明涉及数据分析技术领域，具体而言，涉及一种基于深度学习算法的高考分数预估及志愿选择方法、系统。

背景技术

随着国内社会对于青少年教育领域的重视程度及投入逐年提高，学生的志愿报考问题作为在一定意义上决定学生未来发展方向的决定性因素也受到了越来越多的重视。但现有的志愿报考辅助系统多为简单的数据库筛选、排序，并且其数据库多为往年高校专业的分数线、线差等数据，存在原理性的误差，忽略了相关数据的变化趋势，缺乏科学性的体系进行专业选择的指导，进而导致了很多学生高考志愿选择失败，对其未来的大学学习生活及就业产生了极大的不利影响。

发明内容

为解决上述问题，本发明的目的在于提供一种基于深度学习算法的高考分数预估及志愿选择方法、系统，去除人为主观性影响，使得专业选择更具备科学性，更为准确。

本发明提供了一种基于深度学习算法的高考分数预估及志愿选择方法，包括：

步骤1，根据往年各高校各专业各生源地的历史分数线和线差数据，通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据，并对预测出来的各高校各专业各生源地的线差值进行分组；

步骤2，根据预测出的当前年度各高校各专业各生源地的线差数据，确定考生生源地当前年度各级别高校分数线，包括一本、二本、三本和专科分数线；

步骤3，考生输入当前年度的成绩值，根据所在生源地，对其输入的成绩值进行判断：

当输入的成绩值为其实际考取的成绩时，采用DNN神经网络算法训练得出该考生成绩所对应的线差，与步骤1中所得的各高校各专业的线差值分组进行匹配，得出相关的高校专业结果；

当输入的成绩值为其预估的成绩时，对输入的预估成绩进行模糊化处理，得到该考生的预估分数区间，并结合考生的高中数据，采用DNN神经网络算法联合训练后，得出相关的高校专业结果；

步骤4，根据匹配出的高校专业结果，得到初步报考方案；

步骤5，将初步报考方案与高校政策类信息结合分析，得到最终报考方案。

作为本发明进一步的改进，步骤1中，采用LSTM神经网络算法预测当前年度各高校各专业的线差数据的方法为：

以往年各高校各专业的线差的时间序列数据作为样本输入，采用LSTM神经网络训练这些样本数据，获取当前年度各高校各专业各生源地的线差模拟器，得到当前年度各高校各专业各生源地的线差值；

其中，采用的LSTM神经网络由输入门、忘记门、输出门以及细胞单元组成：

输入门，其用于对输入的成绩值进行筛选，采用的公示为：

i_t＝σ_g(W_ix_t+U_ih_t-1+b_i)；

忘记门，其用于历史信息在单元中的继承问题，采用的公示为：

f_t＝σ_g(W_fx_t+U_fh_t-1+b_f)；

输出门，其用于围绕输出值展开过滤，采用的公示为：

o_t＝σ_g(W_ox_t+U_oh_t-1+b_o)；

细胞单元，采用的公式为：

历经各计算过程后，最终可根据细胞单元c_t计算得到隐态

其中初始状态为：c_o＝0，h_o＝0；

式中，x_t为LSTM神经网络输入值，i_t为输入门激活向量，f_t为忘记门激活向量，o_t为输出门激活向量，h_t为LSTM神经网络输出值，c_t为细胞单元向量，W、U为权矩阵，b为偏差向量，σ_g、σ_c、σ_h则分别为Sigmoid函数、Tanh函数、Tanh或恒等函数，则为逐点矩阵乘法。

作为本发明进一步的改进，步骤3中，当输入的成绩值为其实际考取的成绩时：

将步骤1中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据，训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器，将成绩值输入该高校专业线差分类器，计算得到该考生成绩所对应的线差值；

将计算出的考生线差值与步骤1中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分，根据总的得分结果，得出考生对应的高校专业结果，包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。

作为本发明进一步的改进，相似度打分：将考生线差值与该生源地对应的各高校各专业的线差值的匹配程度进行从高到低的排名；

区间打分：删除考生的成绩值所对应的生源地当前年度分数线以外的各高校和各专业；

条件打分：删除不满足考生设定条件的各高校和各专业。

作为本发明进一步的改进，步骤3中，当输入的成绩值为其预估的成绩时：

根据该预估成绩的评价因素的权重及评分结果，经模糊数学模型处理后，得到该考生的预估分数区间；

从步骤1中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据，训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器；

根据采集到的各高校各专业各生源地学生的高中数据，将该高中数据作为DNN神经网络的样本数据，训练得到各高校各专业各生源地的学生高中考试分数表现分类器；

将高校专业线差分类器与学生高中考试分类器联合训练，以使得二者各类别一一对应；

将考生的高中数据输入学生高中考试分数表现分类器，以得到该考生所属高中考试分类器的类别，并获取对应的高校专业线差分类器中的类别；

根据分类情况，将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果。

作为本发明进一步的改进，评价因素包括：考生高考各科目主观题对比高考参考答案后的得分、最后三次摸底考试中各科目客观题所得的实际分数、以高考题目难度为基准所对比的最后三次摸底考试各科目客观题难度，以及考生考试状态的个人心理预期评分。

作为本发明进一步的改进，学生高中数据包括：高中考试成绩、考试难度评测、考试状态评测、在省内排名；其中，

高中考试成绩包括最后若干次摸底考试成绩与高考成绩，高考成绩包括高考客观题对比正确答案后的实际分数和高考主观题的预估分数，摸底考试为主观题和客观题的实际分数；

考试难度评测与考试状态评测为：对比于高考，各次摸底考试主观题以高考主观题为参照的个人对题目难度与考试状态的打分；

在省内排名为各次摸底考试的排名。

本发明还提供了一种基于深度学习算法的高考分数预估及志愿选择系统，包括：

线差预测模块，其用于根据往年各高校各专业各生源地的历史分数线和线差数据，通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据，并对预测出来的各高校各专业各生源地的线差值进行分组；

分数线预测模块，其用于根据预测出的当前年度各高校各专业各生源地的线差数据，确定考生生源地当前年度各级别高校分数线，包括一本、二本、三本和专科分数线；

专业匹配模块，其用于考生输入当前年度的成绩值，并根据所在生源地，对其输入的成绩值进行判断：

初步报考方案模块，其用于根据匹配出的高校专业结果，得到初步报考方案；

最终报考方案模块，其用于将初步报考方案与高校政策类信息结合分析，得到最终报考方案。

作为本发明进一步的改进，专业匹配模块中，当输入的成绩值为其实际考取的成绩时：

将线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据，训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器，将成绩值输入该高校专业线差分类器，计算得到该考生成绩所对应的线差值；

将计算出的考生线差值与线差预测模块中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分，根据总的得分结果，得出考生对应的高校专业结果，包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。

作为本发明进一步的改进，专业匹配模块中，当输入的成绩值为其预估的成绩时：

从线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据，训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器；

本发明的有益效果为：

1、去除了人工选择的主观性影响，更具备科学性，选择效果更好；

2、利用往年高校专业的分数线、线差等数据的变化趋势，预测了当前年度各高校各专业各生源地的线差数据及分数线，使得专业选择更具备科学性，更为准确；

3、采用模糊数学模型来处理预估分数，避免了预估的不准确性，使得处理后的预估分数区间更为客观准确，进而使得后续专业选择的结果更为准确。

附图说明

图1为本发明实施例所述的一种基于深度学习算法的高考分数预估及志愿选择方法流程示意图。

具体实施方式

下面通过具体的实施例并结合附图对本发明做进一步的详细描述。

实施例1，如图1所示，本发明实施例所述的一种基于深度学习算法的高考分数预估及志愿选择方法，包括：

步骤1，根据往年各高校各专业各生源地的历史分数线和线差数据，通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据，并对预测出来的各高校各专业各生源地的线差值进行分组。

具体来说，采用LSTM神经网络算法预测当前年度各高校各专业的线差数据的方法为：

输入门，其用于对输入的成绩值进行筛选，采用的公示为：

i_t＝σ_g(W_ix_t+U_ih_t-1+b_i)；

f_t＝σ_g(W_fx_t+U_fh_t-1+b_f)；

输出门，其用于围绕输出值展开过滤，采用的公示为：

o_t＝σ_g(W_ox_t+U_oh_t-1+b_o)；

细胞单元，采用的公式为：

历经各计算过程后，最终可根据细胞单元c_t计算得到隐态

其中初始状态为：c_o＝0，h_o＝0；

LSTM是长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。一个细胞单元当中被放置了三扇门(输入门、忘记门和输出门)。一个信息进入LSTM的网络当中，可以根据规则来判断是否有用，只有符合算法认证的信息才会留下，不符的信息则通过忘记门被遗忘，可以在反复运算下避免网络中长期依赖的问题。

本发明将生源地作为研究对象基本单元而非全国，主要是考虑各高校面向各生源地招生情况及生源地地区之间文化等因素的巨大差异存在致使预测精度大幅下降的潜在可能性，为避免简化问题牺牲精度的严重问题存在，在此根据国情与人文将生源地作为基本单元。

步骤2，根据预测出的当前年度各高校各专业各生源地的线差数据，确定考生生源地当前年度各级别高校分数线，包括一本、二本、三本和专科分数线。

具体来说，若官方未公开且权威机构未出预测值，则采用LSTM神经网络模型与模糊数学相结合的方式对其进行预测，权威机构发布预测值后采用该预测值，官方公开实际值后则采用实际值。LSTM神经网络模型与前述一样，这里不再详述。

(1)当输入的成绩值为其实际考取的成绩时，采用DNN神经网络算法训练得出该考生成绩所对应的线差，与步骤1中所得的各高校各专业的线差值分组进行匹配，得出相关的高校专业结果。具体方法如下：

其中，相似度打分为：将考生线差值与该生源地对应的各高校各专业的线差值的匹配程度进行从高到低的排名；

区间打分为：删除考生的成绩值所对应的生源地当前年度分数线以外的各高校和各专业，例如超过匹配10分的高校专业不包含在冲刺列表中；

条件打分为：删除不满足考生设定条件的各高校和各专业，例如不考虑基础数学专业等。

(2)当输入的成绩值为其预估的成绩时，对输入的预估成绩进行模糊化处理，得到该考生的预估分数区间，并结合考生的高中数据，采用DNN神经网络算法联合训练后，得出相关的高校专业结果。具体方法如下：

根据该预估成绩的评价因素的权重及评分结果，经模糊数学模型处理后，得到该考生的预估分数区间；其中，评价因素包括：考生高考各科目主观题对比高考参考答案后的得分、最后三次摸底考试中各科目客观题所得的实际分数、以高考题目难度为基准所对比的最后三次摸底考试各科目客观题难度，以及考生考试状态的个人心理预期评分；

根据采集到的各高校各专业各生源地学生的高中数据，将该高中数据作为DNN神经网络的样本数据，训练得到各高校各专业各生源地的学生高中考试分数表现分类器；其中，学生高中数据包括：高中考试成绩、考试难度评测、考试状态评测、在省内排名；高中考试成绩包括最后若干次摸底考试成绩与高考成绩，高考成绩包括高考客观题(如选择题、判断题等)对比正确答案后的实际分数和高考主观题(如作文、阅读理解等)的预估分数，摸底考试为主观题和客观题的实际分数；考试难度评测与考试状态评测为：对比于高考，各次摸底考试主观题以高考主观题为参照的个人对题目难度与考试状态的打分；在省内排名为各次摸底考试的排名；

本发明采用模糊数学模型来处理预估分数，避免了预估的不准确性，使得处理后的预估分数区间更为客观准确，进而使得后续专业推荐的结果更为准确。

步骤4，根据匹配出的高校专业结果，得到初步报考方案；

其中，该步骤综合高校政策类信息包括：

1、转专业信息，既学生是否可以通过报考分数线较低的专业进入目标高校后进行转专业，转入目标高校专业；

2、高校区位优势；

3、高校就业优势；

4、高校考保研数据。

结合这些政策类信息对初步匹配出的专业结果进行进一步筛选，得到最终的专业选取结果。

实施例2，本发明还提供了一种基于深度学习算法的高考分数预估及志愿选择系统，包括：

当输入的成绩值为其实际考取的成绩时，采用DNN神经网络算法训练得出该考生成绩所对应的线差，与步骤1中所得的各高校各专业的线差值分组进行匹配，得出相关的高校专业结果；具体包括：

当输入的成绩值为其预估的成绩时，对输入的预估成绩进行模糊化处理，得到该考生的预估分数区间，并结合考生的高中数据，采用DNN神经网络算法联合训练后，得出相关的高校专业结果；具体包括：

根据分类情况，将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果；

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度学习算法的高考分数预估及志愿选择方法，其特征在于，包括：

步骤4，根据匹配出的高校专业结果，得到初步报考方案；

2.根据权利要求1所述的高考分数预估及志愿选择方法，其特征在于，步骤1中，采用LSTM神经网络算法预测当前年度各高校各专业的线差数据的方法为：

输入门，其用于对输入的成绩值进行筛选，采用的公示为：

i_t＝σ_g(W_ix_t+U_ih_t-1+b_i)；

f_t＝σ_g(W_fx_t+U_fh_t-1+b_f)；

输出门，其用于围绕输出值展开过滤，采用的公示为：

o_t＝σ_g(W_ox_t+U_oh_t-1+b_o)；

细胞单元，采用的公式为：

历经各计算过程后，最终可根据细胞单元c_t计算得到隐态

其中初始状态为：c_o＝0，h_o＝0；

3.根据权利要求1所述的高考分数预估及志愿选择方法，其特征在于，步骤3中，当输入的成绩值为其实际考取的成绩时：

4.根据权利要求3所述的高考分数预估及志愿选择方法，其特征在于，

相似度打分：将考生线差值与该生源地对应的各高校各专业的线差值的匹配程度进行从高到低的排名；

条件打分：删除不满足考生设定条件的各高校和各专业。

5.根据权利要求1所述的高考分数预估及志愿选择方法，其特征在于，步骤3中，当输入的成绩值为其预估的成绩时：

6.根据权利要求5所述的高考分数预估及志愿选择方法，其特征在于，评价因素包括：考生高考各科目主观题对比高考参考答案后的得分、最后三次摸底考试中各科目客观题所得的实际分数、以高考题目难度为基准所对比的最后三次摸底考试各科目客观题难度，以及考生考试状态的个人心理预期评分。

7.根据权利要求5所述的高考分数预估及志愿选择方法，其特征在于，学生高中数据包括：高中考试成绩、考试难度评测、考试状态评测、在省内排名；其中，

在省内排名为各次摸底考试的排名。

8.一种基于深度学习算法的高考分数预估及志愿选择系统，其特征在于，包括：

9.根据权利要求8所述的高考分数预估及志愿选择系统，其特征在于，专业匹配模块中，当输入的成绩值为其实际考取的成绩时：

10.根据权利要求8所述的高考分数预估及志愿选择系统，其特征在于，专业匹配模块中，当输入的成绩值为其预估的成绩时：