CN108764718A - 基于深度学习算法的高考分数预估及志愿选择方法、系统 - Google Patents

基于深度学习算法的高考分数预估及志愿选择方法、系统 Download PDF

Info

Publication number
CN108764718A
CN108764718A CN201810523472.3A CN201810523472A CN108764718A CN 108764718 A CN108764718 A CN 108764718A CN 201810523472 A CN201810523472 A CN 201810523472A CN 108764718 A CN108764718 A CN 108764718A
Authority
CN
China
Prior art keywords
score
line difference
university
examination
examinee
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810523472.3A
Other languages
English (en)
Other versions
CN108764718B (zh
Inventor
王春宁
官晨晔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810523472.3A priority Critical patent/CN108764718B/zh
Publication of CN108764718A publication Critical patent/CN108764718A/zh
Application granted granted Critical
Publication of CN108764718B publication Critical patent/CN108764718B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2053Education institution selection, admissions, or financial aid

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Educational Technology (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于深度学习算法的高考分数预估及志愿选择方法,包括:根据往年各高校各专业各生源地的分数线和线差,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差;根据预测出的当前年度各高校各专业各生源地的线差,确定考生生源地当前年度各级别高校分数线;根据考生生源地,对其当前年度成绩值进行判断,并采用DNN神经网络算法计算得出相关的高校专业结果;根据匹配出的高校专业结果,得到初步报考方案;将初步报考方案与高校政策类信息结合分析,得到最终报考方案。本发明还提供了一种基于深度学习算法的高考分数预估及志愿选择系统。本发明的有益效果:去除人为主观性影响,使得专业选择更具备科学性,更为准确。

Description

基于深度学习算法的高考分数预估及志愿选择方法、系统
技术领域
本发明涉及数据分析技术领域,具体而言,涉及一种基于深度学习算法的高考分数预估及志愿选择方法、系统。
背景技术
随着国内社会对于青少年教育领域的重视程度及投入逐年提高,学生的志愿报考问题作为在一定意义上决定学生未来发展方向的决定性因素也受到了越来越多的重视。但现有的志愿报考辅助系统多为简单的数据库筛选、排序,并且其数据库多为往年高校专业的分数线、线差等数据,存在原理性的误差,忽略了相关数据的变化趋势,缺乏科学性的体系进行专业选择的指导,进而导致了很多学生高考志愿选择失败,对其未来的大学学习生活及就业产生了极大的不利影响。
发明内容
为解决上述问题,本发明的目的在于提供一种基于深度学习算法的高考分数预估及志愿选择方法、系统,去除人为主观性影响,使得专业选择更具备科学性,更为准确。
本发明提供了一种基于深度学习算法的高考分数预估及志愿选择方法,包括:
步骤1,根据往年各高校各专业各生源地的历史分数线和线差数据,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据,并对预测出来的各高校各专业各生源地的线差值进行分组;
步骤2,根据预测出的当前年度各高校各专业各生源地的线差数据,确定考生生源地当前年度各级别高校分数线,包括一本、二本、三本和专科分数线;
步骤3,考生输入当前年度的成绩值,根据所在生源地,对其输入的成绩值进行判断:
当输入的成绩值为其实际考取的成绩时,采用DNN神经网络算法训练得出该考生成绩所对应的线差,与步骤1中所得的各高校各专业的线差值分组进行匹配,得出相关的高校专业结果;
当输入的成绩值为其预估的成绩时,对输入的预估成绩进行模糊化处理,得到该考生的预估分数区间,并结合考生的高中数据,采用DNN神经网络算法联合训练后,得出相关的高校专业结果;
步骤4,根据匹配出的高校专业结果,得到初步报考方案;
步骤5,将初步报考方案与高校政策类信息结合分析,得到最终报考方案。
作为本发明进一步的改进,步骤1中,采用LSTM神经网络算法预测当前年度各高校各专业的线差数据的方法为:
以往年各高校各专业的线差的时间序列数据作为样本输入,采用LSTM神经网络训练这些样本数据,获取当前年度各高校各专业各生源地的线差模拟器,得到当前年度各高校各专业各生源地的线差值;
其中,采用的LSTM神经网络由输入门、忘记门、输出门以及细胞单元组成:
输入门,其用于对输入的成绩值进行筛选,采用的公示为:
it=σg(Wixt+Uiht-1+bi);
忘记门,其用于历史信息在单元中的继承问题,采用的公示为:
ft=σg(Wfxt+Ufht-1+bf);
输出门,其用于围绕输出值展开过滤,采用的公示为:
ot=σg(Woxt+Uoht-1+bo);
细胞单元,采用的公式为:
历经各计算过程后,最终可根据细胞单元ct计算得到隐态
其中初始状态为:co=0,ho=0;
式中,xt为LSTM神经网络输入值,it为输入门激活向量,ft为忘记门激活向量,ot为输出门激活向量,ht为LSTM神经网络输出值,ct为细胞单元向量,W、U为权矩阵,b为偏差向量,σg、σc、σh则分别为Sigmoid函数、Tanh函数、Tanh或恒等函数,则为逐点矩阵乘法。
作为本发明进一步的改进,步骤3中,当输入的成绩值为其实际考取的成绩时:
将步骤1中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器,将成绩值输入该高校专业线差分类器,计算得到该考生成绩所对应的线差值;
将计算出的考生线差值与步骤1中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分,根据总的得分结果,得出考生对应的高校专业结果,包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。
作为本发明进一步的改进,相似度打分:将考生线差值与该生源地对应的各高校各专业的线差值的匹配程度进行从高到低的排名;
区间打分:删除考生的成绩值所对应的生源地当前年度分数线以外的各高校和各专业;
条件打分:删除不满足考生设定条件的各高校和各专业。
作为本发明进一步的改进,步骤3中,当输入的成绩值为其预估的成绩时:
根据该预估成绩的评价因素的权重及评分结果,经模糊数学模型处理后,得到该考生的预估分数区间;
从步骤1中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器;
根据采集到的各高校各专业各生源地学生的高中数据,将该高中数据作为DNN神经网络的样本数据,训练得到各高校各专业各生源地的学生高中考试分数表现分类器;
将高校专业线差分类器与学生高中考试分类器联合训练,以使得二者各类别一一对应;
将考生的高中数据输入学生高中考试分数表现分类器,以得到该考生所属高中考试分类器的类别,并获取对应的高校专业线差分类器中的类别;
根据分类情况,将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果。
作为本发明进一步的改进,评价因素包括:考生高考各科目主观题对比高考参考答案后的得分、最后三次摸底考试中各科目客观题所得的实际分数、以高考题目难度为基准所对比的最后三次摸底考试各科目客观题难度,以及考生考试状态的个人心理预期评分。
作为本发明进一步的改进,学生高中数据包括:高中考试成绩、考试难度评测、考试状态评测、在省内排名;其中,
高中考试成绩包括最后若干次摸底考试成绩与高考成绩,高考成绩包括高考客观题对比正确答案后的实际分数和高考主观题的预估分数,摸底考试为主观题和客观题的实际分数;
考试难度评测与考试状态评测为:对比于高考,各次摸底考试主观题以高考主观题为参照的个人对题目难度与考试状态的打分;
在省内排名为各次摸底考试的排名。
本发明还提供了一种基于深度学习算法的高考分数预估及志愿选择系统,包括:
线差预测模块,其用于根据往年各高校各专业各生源地的历史分数线和线差数据,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据,并对预测出来的各高校各专业各生源地的线差值进行分组;
分数线预测模块,其用于根据预测出的当前年度各高校各专业各生源地的线差数据,确定考生生源地当前年度各级别高校分数线,包括一本、二本、三本和专科分数线;
专业匹配模块,其用于考生输入当前年度的成绩值,并根据所在生源地,对其输入的成绩值进行判断:
当输入的成绩值为其实际考取的成绩时,采用DNN神经网络算法训练得出该考生成绩所对应的线差,与步骤1中所得的各高校各专业的线差值分组进行匹配,得出相关的高校专业结果;
当输入的成绩值为其预估的成绩时,对输入的预估成绩进行模糊化处理,得到该考生的预估分数区间,并结合考生的高中数据,采用DNN神经网络算法联合训练后,得出相关的高校专业结果;
初步报考方案模块,其用于根据匹配出的高校专业结果,得到初步报考方案;
最终报考方案模块,其用于将初步报考方案与高校政策类信息结合分析,得到最终报考方案。
作为本发明进一步的改进,专业匹配模块中,当输入的成绩值为其实际考取的成绩时:
将线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器,将成绩值输入该高校专业线差分类器,计算得到该考生成绩所对应的线差值;
将计算出的考生线差值与线差预测模块中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分,根据总的得分结果,得出考生对应的高校专业结果,包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。
作为本发明进一步的改进,专业匹配模块中,当输入的成绩值为其预估的成绩时:
根据该预估成绩的评价因素的权重及评分结果,经模糊数学模型处理后,得到该考生的预估分数区间;
从线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器;
根据采集到的各高校各专业各生源地学生的高中数据,将该高中数据作为DNN神经网络的样本数据,训练得到各高校各专业各生源地的学生高中考试分数表现分类器;
将高校专业线差分类器与学生高中考试分类器联合训练,以使得二者各类别一一对应;
将考生的高中数据输入学生高中考试分数表现分类器,以得到该考生所属高中考试分类器的类别,并获取对应的高校专业线差分类器中的类别;
根据分类情况,将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果。
本发明的有益效果为:
1、去除了人工选择的主观性影响,更具备科学性,选择效果更好;
2、利用往年高校专业的分数线、线差等数据的变化趋势,预测了当前年度各高校各专业各生源地的线差数据及分数线,使得专业选择更具备科学性,更为准确;
3、采用模糊数学模型来处理预估分数,避免了预估的不准确性,使得处理后的预估分数区间更为客观准确,进而使得后续专业选择的结果更为准确。
附图说明
图1为本发明实施例所述的一种基于深度学习算法的高考分数预估及志愿选择方法流程示意图。
具体实施方式
下面通过具体的实施例并结合附图对本发明做进一步的详细描述。
实施例1,如图1所示,本发明实施例所述的一种基于深度学习算法的高考分数预估及志愿选择方法,包括:
步骤1,根据往年各高校各专业各生源地的历史分数线和线差数据,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据,并对预测出来的各高校各专业各生源地的线差值进行分组。
具体来说,采用LSTM神经网络算法预测当前年度各高校各专业的线差数据的方法为:
以往年各高校各专业的线差的时间序列数据作为样本输入,采用LSTM神经网络训练这些样本数据,获取当前年度各高校各专业各生源地的线差模拟器,得到当前年度各高校各专业各生源地的线差值;
其中,采用的LSTM神经网络由输入门、忘记门、输出门以及细胞单元组成:
输入门,其用于对输入的成绩值进行筛选,采用的公示为:
it=σg(Wixt+Uiht-1+bi);
忘记门,其用于历史信息在单元中的继承问题,采用的公示为:
ft=σg(Wfxt+Ufht-1+bf);
输出门,其用于围绕输出值展开过滤,采用的公示为:
ot=σg(Woxt+Uoht-1+bo);
细胞单元,采用的公式为:
历经各计算过程后,最终可根据细胞单元ct计算得到隐态
其中初始状态为:co=0,ho=0;
式中,xt为LSTM神经网络输入值,it为输入门激活向量,ft为忘记门激活向量,ot为输出门激活向量,ht为LSTM神经网络输出值,ct为细胞单元向量,W、U为权矩阵,b为偏差向量,σg、σc、σh则分别为Sigmoid函数、Tanh函数、Tanh或恒等函数,则为逐点矩阵乘法。
LSTM是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。一个细胞单元当中被放置了三扇门(输入门、忘记门和输出门)。一个信息进入LSTM的网络当中,可以根据规则来判断是否有用,只有符合算法认证的信息才会留下,不符的信息则通过忘记门被遗忘,可以在反复运算下避免网络中长期依赖的问题。
本发明将生源地作为研究对象基本单元而非全国,主要是考虑各高校面向各生源地招生情况及生源地地区之间文化等因素的巨大差异存在致使预测精度大幅下降的潜在可能性,为避免简化问题牺牲精度的严重问题存在,在此根据国情与人文将生源地作为基本单元。
步骤2,根据预测出的当前年度各高校各专业各生源地的线差数据,确定考生生源地当前年度各级别高校分数线,包括一本、二本、三本和专科分数线。
具体来说,若官方未公开且权威机构未出预测值,则采用LSTM神经网络模型与模糊数学相结合的方式对其进行预测,权威机构发布预测值后采用该预测值,官方公开实际值后则采用实际值。LSTM神经网络模型与前述一样,这里不再详述。
步骤3,考生输入当前年度的成绩值,根据所在生源地,对其输入的成绩值进行判断:
(1)当输入的成绩值为其实际考取的成绩时,采用DNN神经网络算法训练得出该考生成绩所对应的线差,与步骤1中所得的各高校各专业的线差值分组进行匹配,得出相关的高校专业结果。具体方法如下:
将步骤1中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器,将成绩值输入该高校专业线差分类器,计算得到该考生成绩所对应的线差值;
将计算出的考生线差值与步骤1中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分,根据总的得分结果,得出考生对应的高校专业结果,包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。
其中,相似度打分为:将考生线差值与该生源地对应的各高校各专业的线差值的匹配程度进行从高到低的排名;
区间打分为:删除考生的成绩值所对应的生源地当前年度分数线以外的各高校和各专业,例如超过匹配10分的高校专业不包含在冲刺列表中;
条件打分为:删除不满足考生设定条件的各高校和各专业,例如不考虑基础数学专业等。
(2)当输入的成绩值为其预估的成绩时,对输入的预估成绩进行模糊化处理,得到该考生的预估分数区间,并结合考生的高中数据,采用DNN神经网络算法联合训练后,得出相关的高校专业结果。具体方法如下:
根据该预估成绩的评价因素的权重及评分结果,经模糊数学模型处理后,得到该考生的预估分数区间;其中,评价因素包括:考生高考各科目主观题对比高考参考答案后的得分、最后三次摸底考试中各科目客观题所得的实际分数、以高考题目难度为基准所对比的最后三次摸底考试各科目客观题难度,以及考生考试状态的个人心理预期评分;
从步骤1中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器;
根据采集到的各高校各专业各生源地学生的高中数据,将该高中数据作为DNN神经网络的样本数据,训练得到各高校各专业各生源地的学生高中考试分数表现分类器;其中,学生高中数据包括:高中考试成绩、考试难度评测、考试状态评测、在省内排名;高中考试成绩包括最后若干次摸底考试成绩与高考成绩,高考成绩包括高考客观题(如选择题、判断题等)对比正确答案后的实际分数和高考主观题(如作文、阅读理解等)的预估分数,摸底考试为主观题和客观题的实际分数;考试难度评测与考试状态评测为:对比于高考,各次摸底考试主观题以高考主观题为参照的个人对题目难度与考试状态的打分;在省内排名为各次摸底考试的排名;
将高校专业线差分类器与学生高中考试分类器联合训练,以使得二者各类别一一对应;
将考生的高中数据输入学生高中考试分数表现分类器,以得到该考生所属高中考试分类器的类别,并获取对应的高校专业线差分类器中的类别;
根据分类情况,将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果。
本发明采用模糊数学模型来处理预估分数,避免了预估的不准确性,使得处理后的预估分数区间更为客观准确,进而使得后续专业推荐的结果更为准确。
步骤4,根据匹配出的高校专业结果,得到初步报考方案;
步骤5,将初步报考方案与高校政策类信息结合分析,得到最终报考方案。
其中,该步骤综合高校政策类信息包括:
1、转专业信息,既学生是否可以通过报考分数线较低的专业进入目标高校后进行转专业,转入目标高校专业;
2、高校区位优势;
3、高校就业优势;
4、高校考保研数据。
结合这些政策类信息对初步匹配出的专业结果进行进一步筛选,得到最终的专业选取结果。
实施例2,本发明还提供了一种基于深度学习算法的高考分数预估及志愿选择系统,包括:
线差预测模块,其用于根据往年各高校各专业各生源地的历史分数线和线差数据,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据,并对预测出来的各高校各专业各生源地的线差值进行分组;
分数线预测模块,其用于根据预测出的当前年度各高校各专业各生源地的线差数据,确定考生生源地当前年度各级别高校分数线,包括一本、二本、三本和专科分数线;
专业匹配模块,其用于考生输入当前年度的成绩值,并根据所在生源地,对其输入的成绩值进行判断:
当输入的成绩值为其实际考取的成绩时,采用DNN神经网络算法训练得出该考生成绩所对应的线差,与步骤1中所得的各高校各专业的线差值分组进行匹配,得出相关的高校专业结果;具体包括:
将线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器,将成绩值输入该高校专业线差分类器,计算得到该考生成绩所对应的线差值;
将计算出的考生线差值与线差预测模块中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分,根据总的得分结果,得出考生对应的高校专业结果,包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。
当输入的成绩值为其预估的成绩时,对输入的预估成绩进行模糊化处理,得到该考生的预估分数区间,并结合考生的高中数据,采用DNN神经网络算法联合训练后,得出相关的高校专业结果;具体包括:
根据该预估成绩的评价因素的权重及评分结果,经模糊数学模型处理后,得到该考生的预估分数区间;
从线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器;
根据采集到的各高校各专业各生源地学生的高中数据,将该高中数据作为DNN神经网络的样本数据,训练得到各高校各专业各生源地的学生高中考试分数表现分类器;
将高校专业线差分类器与学生高中考试分类器联合训练,以使得二者各类别一一对应;
将考生的高中数据输入学生高中考试分数表现分类器,以得到该考生所属高中考试分类器的类别,并获取对应的高校专业线差分类器中的类别;
根据分类情况,将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果;
初步报考方案模块,其用于根据匹配出的高校专业结果,得到初步报考方案;
最终报考方案模块,其用于将初步报考方案与高校政策类信息结合分析,得到最终报考方案。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于深度学习算法的高考分数预估及志愿选择方法,其特征在于,包括:
步骤1,根据往年各高校各专业各生源地的历史分数线和线差数据,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据,并对预测出来的各高校各专业各生源地的线差值进行分组;
步骤2,根据预测出的当前年度各高校各专业各生源地的线差数据,确定考生生源地当前年度各级别高校分数线,包括一本、二本、三本和专科分数线;
步骤3,考生输入当前年度的成绩值,根据所在生源地,对其输入的成绩值进行判断:
当输入的成绩值为其实际考取的成绩时,采用DNN神经网络算法训练得出该考生成绩所对应的线差,与步骤1中所得的各高校各专业的线差值分组进行匹配,得出相关的高校专业结果;
当输入的成绩值为其预估的成绩时,对输入的预估成绩进行模糊化处理,得到该考生的预估分数区间,并结合考生的高中数据,采用DNN神经网络算法联合训练后,得出相关的高校专业结果;
步骤4,根据匹配出的高校专业结果,得到初步报考方案;
步骤5,将初步报考方案与高校政策类信息结合分析,得到最终报考方案。
2.根据权利要求1所述的高考分数预估及志愿选择方法,其特征在于,步骤1中,采用LSTM神经网络算法预测当前年度各高校各专业的线差数据的方法为:
以往年各高校各专业的线差的时间序列数据作为样本输入,采用LSTM神经网络训练这些样本数据,获取当前年度各高校各专业各生源地的线差模拟器,得到当前年度各高校各专业各生源地的线差值;
其中,采用的LSTM神经网络由输入门、忘记门、输出门以及细胞单元组成:
输入门,其用于对输入的成绩值进行筛选,采用的公示为:
it=σg(Wixt+Uiht-1+bi);
忘记门,其用于历史信息在单元中的继承问题,采用的公示为:
ft=σg(Wfxt+Ufht-1+bf);
输出门,其用于围绕输出值展开过滤,采用的公示为:
ot=σg(Woxt+Uoht-1+bo);
细胞单元,采用的公式为:
历经各计算过程后,最终可根据细胞单元ct计算得到隐态
其中初始状态为:co=0,ho=0;
式中,xt为LSTM神经网络输入值,it为输入门激活向量,ft为忘记门激活向量,ot为输出门激活向量,ht为LSTM神经网络输出值,ct为细胞单元向量,W、U为权矩阵,b为偏差向量,σg、σc、σh则分别为Sigmoid函数、Tanh函数、Tanh或恒等函数,则为逐点矩阵乘法。
3.根据权利要求1所述的高考分数预估及志愿选择方法,其特征在于,步骤3中,当输入的成绩值为其实际考取的成绩时:
将步骤1中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器,将成绩值输入该高校专业线差分类器,计算得到该考生成绩所对应的线差值;
将计算出的考生线差值与步骤1中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分,根据总的得分结果,得出考生对应的高校专业结果,包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。
4.根据权利要求3所述的高考分数预估及志愿选择方法,其特征在于,
相似度打分:将考生线差值与该生源地对应的各高校各专业的线差值的匹配程度进行从高到低的排名;
区间打分:删除考生的成绩值所对应的生源地当前年度分数线以外的各高校和各专业;
条件打分:删除不满足考生设定条件的各高校和各专业。
5.根据权利要求1所述的高考分数预估及志愿选择方法,其特征在于,步骤3中,当输入的成绩值为其预估的成绩时:
根据该预估成绩的评价因素的权重及评分结果,经模糊数学模型处理后,得到该考生的预估分数区间;
从步骤1中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器;
根据采集到的各高校各专业各生源地学生的高中数据,将该高中数据作为DNN神经网络的样本数据,训练得到各高校各专业各生源地的学生高中考试分数表现分类器;
将高校专业线差分类器与学生高中考试分类器联合训练,以使得二者各类别一一对应;
将考生的高中数据输入学生高中考试分数表现分类器,以得到该考生所属高中考试分类器的类别,并获取对应的高校专业线差分类器中的类别;
根据分类情况,将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果。
6.根据权利要求5所述的高考分数预估及志愿选择方法,其特征在于,评价因素包括:考生高考各科目主观题对比高考参考答案后的得分、最后三次摸底考试中各科目客观题所得的实际分数、以高考题目难度为基准所对比的最后三次摸底考试各科目客观题难度,以及考生考试状态的个人心理预期评分。
7.根据权利要求5所述的高考分数预估及志愿选择方法,其特征在于,学生高中数据包括:高中考试成绩、考试难度评测、考试状态评测、在省内排名;其中,
高中考试成绩包括最后若干次摸底考试成绩与高考成绩,高考成绩包括高考客观题对比正确答案后的实际分数和高考主观题的预估分数,摸底考试为主观题和客观题的实际分数;
考试难度评测与考试状态评测为:对比于高考,各次摸底考试主观题以高考主观题为参照的个人对题目难度与考试状态的打分;
在省内排名为各次摸底考试的排名。
8.一种基于深度学习算法的高考分数预估及志愿选择系统,其特征在于,包括:
线差预测模块,其用于根据往年各高校各专业各生源地的历史分数线和线差数据,通过LSTM神经网络算法预测当前年度各高校各专业各生源地的线差数据,并对预测出来的各高校各专业各生源地的线差值进行分组;
分数线预测模块,其用于根据预测出的当前年度各高校各专业各生源地的线差数据,确定考生生源地当前年度各级别高校分数线,包括一本、二本、三本和专科分数线;
专业匹配模块,其用于考生输入当前年度的成绩值,并根据所在生源地,对其输入的成绩值进行判断:
当输入的成绩值为其实际考取的成绩时,采用DNN神经网络算法训练得出该考生成绩所对应的线差,与步骤1中所得的各高校各专业的线差值分组进行匹配,得出相关的高校专业结果;
当输入的成绩值为其预估的成绩时,对输入的预估成绩进行模糊化处理,得到该考生的预估分数区间,并结合考生的高中数据,采用DNN神经网络算法联合训练后,得出相关的高校专业结果;
初步报考方案模块,其用于根据匹配出的高校专业结果,得到初步报考方案;
最终报考方案模块,其用于将初步报考方案与高校政策类信息结合分析,得到最终报考方案。
9.根据权利要求8所述的高考分数预估及志愿选择系统,其特征在于,专业匹配模块中,当输入的成绩值为其实际考取的成绩时:
将线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器,将成绩值输入该高校专业线差分类器,计算得到该考生成绩所对应的线差值;
将计算出的考生线差值与线差预测模块中预测得到的各高校各专业各生源地的线差值进行相似度打分、区间打分和条件打分,根据总的得分结果,得出考生对应的高校专业结果,包括冲刺学校专业若干、大概率录取学校专业若干和保底学校专业若干。
10.根据权利要求8所述的高考分数预估及志愿选择系统,其特征在于,专业匹配模块中,当输入的成绩值为其预估的成绩时:
根据该预估成绩的评价因素的权重及评分结果,经模糊数学模型处理后,得到该考生的预估分数区间;
从线差预测模块中预测获得的各高校各专业各生源地的线差时间序列数据中筛选出该预估分数区间所对应的线差时间序列数据作为DNN神经网络的样本数据,训练得到该考生所在生源地各高校各专业所对应的高校专业线差分类器;
根据采集到的各高校各专业各生源地学生的高中数据,将该高中数据作为DNN神经网络的样本数据,训练得到各高校各专业各生源地的学生高中考试分数表现分类器;
将高校专业线差分类器与学生高中考试分类器联合训练,以使得二者各类别一一对应;
将考生的高中数据输入学生高中考试分数表现分类器,以得到该考生所属高中考试分类器的类别,并获取对应的高校专业线差分类器中的类别;
根据分类情况,将所属该高校专业线差分类器中的类别作为考生对应的高校专业结果。
CN201810523472.3A 2018-05-28 2018-05-28 基于深度学习算法的高考分数预估及志愿选择方法、系统 Active CN108764718B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810523472.3A CN108764718B (zh) 2018-05-28 2018-05-28 基于深度学习算法的高考分数预估及志愿选择方法、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810523472.3A CN108764718B (zh) 2018-05-28 2018-05-28 基于深度学习算法的高考分数预估及志愿选择方法、系统

Publications (2)

Publication Number Publication Date
CN108764718A true CN108764718A (zh) 2018-11-06
CN108764718B CN108764718B (zh) 2021-05-18

Family

ID=64002958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810523472.3A Active CN108764718B (zh) 2018-05-28 2018-05-28 基于深度学习算法的高考分数预估及志愿选择方法、系统

Country Status (1)

Country Link
CN (1) CN108764718B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109509129A (zh) * 2018-12-20 2019-03-22 李京 高考志愿报考推荐系统
CN109614410A (zh) * 2018-11-15 2019-04-12 福建大道之行教育科技有限公司 一种基于大数据建模的人才结构分析方法及系统
CN109919375A (zh) * 2019-03-01 2019-06-21 北京慧辰资道资讯股份有限公司 一种基于大数据预测考试关键学生的方法及装置
CN109993456A (zh) * 2019-04-11 2019-07-09 陈建华 一种基于大数据与人工智能的人生综合能力打分方法
CN110472929A (zh) * 2019-07-17 2019-11-19 武汉科技大学 一种基于神经网络的志愿填报方法、系统、装置和介质
CN111091481A (zh) * 2019-11-25 2020-05-01 珠海格力电器股份有限公司 报名信息验证方法、装置、存储介质及电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392316A (zh) * 2014-11-21 2015-03-04 浪潮电子信息产业股份有限公司 一种基于云计算的高考志愿填报决策支持系统
US20150371133A1 (en) * 2014-06-19 2015-12-24 Yahoo Japan Corporation Providing device, providing method, and recording medium
CN105956968A (zh) * 2016-05-26 2016-09-21 程欧亚 一种高考志愿人工智能填报系统及方法
CN106875305A (zh) * 2016-12-28 2017-06-20 广东工业大学 一种高校教学质量评价方法
CN107169593A (zh) * 2017-04-25 2017-09-15 江苏树正信息科技有限公司 一种基于神经网络的院校投档线预测方法
CN107463951A (zh) * 2017-07-19 2017-12-12 清华大学 一种提高深度学习模型鲁棒性的方法及装置
CN107609711A (zh) * 2017-09-27 2018-01-19 百度在线网络技术(北京)有限公司 一种报考信息的提供方法、装置、设备及存储介质
CN107798604A (zh) * 2017-09-28 2018-03-13 平安科技(深圳)有限公司 基于机器学习的择时入股方法及终端设备
CN108009673A (zh) * 2017-11-24 2018-05-08 国网北京市电力公司 基于深度学习的新型负荷预测方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150371133A1 (en) * 2014-06-19 2015-12-24 Yahoo Japan Corporation Providing device, providing method, and recording medium
CN104392316A (zh) * 2014-11-21 2015-03-04 浪潮电子信息产业股份有限公司 一种基于云计算的高考志愿填报决策支持系统
CN105956968A (zh) * 2016-05-26 2016-09-21 程欧亚 一种高考志愿人工智能填报系统及方法
CN106875305A (zh) * 2016-12-28 2017-06-20 广东工业大学 一种高校教学质量评价方法
CN107169593A (zh) * 2017-04-25 2017-09-15 江苏树正信息科技有限公司 一种基于神经网络的院校投档线预测方法
CN107463951A (zh) * 2017-07-19 2017-12-12 清华大学 一种提高深度学习模型鲁棒性的方法及装置
CN107609711A (zh) * 2017-09-27 2018-01-19 百度在线网络技术(北京)有限公司 一种报考信息的提供方法、装置、设备及存储介质
CN107798604A (zh) * 2017-09-28 2018-03-13 平安科技(深圳)有限公司 基于机器学习的择时入股方法及终端设备
CN108009673A (zh) * 2017-11-24 2018-05-08 国网北京市电力公司 基于深度学习的新型负荷预测方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109614410A (zh) * 2018-11-15 2019-04-12 福建大道之行教育科技有限公司 一种基于大数据建模的人才结构分析方法及系统
CN109509129A (zh) * 2018-12-20 2019-03-22 李京 高考志愿报考推荐系统
CN109919375A (zh) * 2019-03-01 2019-06-21 北京慧辰资道资讯股份有限公司 一种基于大数据预测考试关键学生的方法及装置
CN109919375B (zh) * 2019-03-01 2021-05-14 北京慧辰资道资讯股份有限公司 一种基于大数据预测考试关键学生的方法及装置
CN109993456A (zh) * 2019-04-11 2019-07-09 陈建华 一种基于大数据与人工智能的人生综合能力打分方法
CN110472929A (zh) * 2019-07-17 2019-11-19 武汉科技大学 一种基于神经网络的志愿填报方法、系统、装置和介质
CN111091481A (zh) * 2019-11-25 2020-05-01 珠海格力电器股份有限公司 报名信息验证方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN108764718B (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN108764718B (zh) 基于深度学习算法的高考分数预估及志愿选择方法、系统
Gunst et al. Regression analysis and its application: a data-oriented approach
Khorramdel et al. Plausible values: Principles of item response theory and multiple imputations
CN112667776B (zh) 一种智能教学评估与分析方法
Şevgin et al. Comparison of classification performances of MARS and BRT data mining methods: ABİDE-2016 case
Guarino et al. Comparing and assessing the consequences of two different approaches to measuring school effectiveness
CN115409257A (zh) 一种基于条件密度估计模型的成绩分布预测方法及系统
Zulkifli et al. A revised Bloom’s taxonomy: An essential approach to constructing assessment questions for the probability and statistics course
Sudrajat et al. Hybrid Learning Predictions on Learning Quality Using Multiple Linear Regression.
Kuhfeld Multilevel item factor analysis and student perceptions of teacher effectiveness
Shvetsov et al. Student model implementation in the digital educational environment for IT specialists training
Dewi et al. Determinants of accounting students’ perceptions of ethics on tax evasion
Labayne et al. Model development of students' scholarship status at first asia institute of technology and humanities (Faith)
CN113782147A (zh) 基于运动社交关系网络的学生心理状态预判系统
Churnia et al. Analysis of student career maturity using holland’s theory
Han The construction of the structure model of college students' positive mental qualities
Bilgic et al. The attitudes of the elementary school mathematics teacher candidates towards proof in the mathematical modelling proccess
Fu et al. Full Paper: Algorithm Bias: Computer Science Student Perceptions Survey
Gomes et al. Study on computer science undergraduate students dropout at the university of brasilia
CN109919375B (zh) 一种基于大数据预测考试关键学生的方法及装置
Shukla et al. Deep Learning-Based Assessment of Teacher Effectiveness in classrooms: Integrating ARIMA and LSTM Models
Tsakirtzis et al. Investigating factors affecting secondary school non-achievers in mathematics before and after the pandemic
Mehmood et al. Optimizing English Language Evaluation: A Hybrid AI Framework Using Neural Networks and Fuzzy Decision-Making Models
Tangprasert et al. Factors Affecting Mathematics Achievement: Analysis of Learner Characteristics and Competencies
Pronina et al. Predicting Students’ Academic Performance Based on the Cluster Analysis Method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant