CN107609711A - 一种报考信息的提供方法、装置、设备及存储介质 - Google Patents

一种报考信息的提供方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN107609711A
CN107609711A CN201710889075.3A CN201710889075A CN107609711A CN 107609711 A CN107609711 A CN 107609711A CN 201710889075 A CN201710889075 A CN 201710889075A CN 107609711 A CN107609711 A CN 107609711A
Authority
CN
China
Prior art keywords
universities
colleges
admission
target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710889075.3A
Other languages
English (en)
Inventor
何晓楠
谢剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710889075.3A priority Critical patent/CN107609711A/zh
Publication of CN107609711A publication Critical patent/CN107609711A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例公开了一种报考信息的提供方法、装置、设备及存储介质。所述方法包括:根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。本发明实施例能够给填报高考志愿提供专业化的指导,在短时间内推荐适合的志愿供考生参考,实现了填报志愿智能化,有效避免了志愿填报的失误,从而提高报考的成功率。

Description

一种报考信息的提供方法、装置、设备及存储介质
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种报考信息的提供方法、装置、设备及存储介质。
背景技术
高考是目前我国高等教育选拔人才的主要途径,由于填报志愿的失误导致上不了理想的大学,甚至落榜的实例几乎每年都有,因此这也是家长、学校和社会广泛关注的影响很大的问题。
传统的高考志愿填报方式为考生依据各省(市)考试院发放的高考指南手册,通过翻阅指南手册查找历年录取分数与自己考试分数接近的院校及其相关专业,据此进行院校及专业的选择。这种高考志愿填报方式信息量大,容易导致考生抓不住重点。同时,鉴于每年的考试难度不一致,每年的分数都存在一定的波动情况。考生和家长难以有效掌握和整合海量分散的各类高考信息以及缺乏专业化的志愿填报指导,同时受到时间的紧迫性和对政策了解程度不足等因素的限制,很难在较短时间内完成一套或多套适合自己报考院校的志愿方案,进而导致在志愿填报过程中的失误,影响了报考的成功率。
发明内容
本发明实施例提供一种报考信息的提供方法、装置、设备及存储介质,以实现根据考生的高考分数,综合近几年的高校录取招生数据及波动情况,为考生按照不同的录取难度推荐高校集合,从而提高高考志愿填报的科学性、可靠性和合理性。
第一方面,本发明实施例提供了一种报考信息的提供方法,包括:
根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;
根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;
将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
第二方面,本发明实施例还提供了一种报考信息的提供装置,包括:
录取分数线预测模块,用于根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;
高校集合推荐模块,用于根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;
高校分档提供模块,用于将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的报考信息的提供方法。
第四方面,本发明实施例还提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的报考信息的提供方法。
本发明实施例通过根据海量院校历年录取的真实分数数据,捕捉近年分数涨跌趋势对各个高校当年的录取分数线进行准确预测,在获取用户输入的高考成绩信息后,根据对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合,进而可以将所述推荐高校集合按照不同的录取难度,分档提供给所述用户,解决了因高考志愿填报方式信息量、波动大导致的难以制定适合性的报考院校志愿方案的问题,在有效提升当年录取分数线的预测准确性的同时,能够在短时间内推荐适合的报考高校供考生参考,实现了填报志愿智能化,有效避免了志愿填报的失误,从而提高报考的成功率。
附图说明
图1a是本发明实施例一提供的一种报考信息的提供方法的流程图;
图1b是本发明实施例一提供的一种志愿推荐知识图谱的模型图;
图2是本发明实施例二提供的一种报考信息的提供方法的流程图;
图3是本发明实施例三提供的一种报考信息的提供方法的流程图;
图4是本发明实施例四提供的一种报考信息的提供方法的流程图;
图5是本发明实施例五提供的一种报考信息的提供装置的结构图;
图6为本发明实施例六提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1a是本发明实施例一提供的一种报考信息的提供方法的流程图,本实施例可适用于根据考生当年的高考成绩,向考生合理推荐适合报考的高校的情况,该方法可以由报考信息的提供装置来执行,该装置可以由软件和/或硬件的方式来实现,并一般可集成在服务器中,与用于完成高校推荐功能的客户端配合使用,该方法包括如下操作:
S110、根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测。
其中,各个高校对不同的省份制定的录取计划有所差异,因此,对各个高校当年的录取分数线进行预测时,需要以各个高校在本省历年的录取数据为依据推测出高校当年的录取分数线。
相应的,所述各个高校历年的历史录取数据可以为:在一个或者多个历史年份中,各个高校的各个专业在各个省份,在各个批次(第一批次以及第二批次等)下针对各个分科(文科以及理科)的录取分数数据。
预测的所述录取分数线可以为高校的实际录取分数,典型的:XX高校的XX专业在XX省份,在XX批次下针对XX分科的最低录取分数线,例如:630分;也可以为高校针对省控分的线差值,典型的,XX高校的XX专业在省份A,在XX批次下针对XX分科的最低线差值,例如,超过省份A的省控分50分。
在本发明实施例中,可以根据全国近年来(如3年、5年等)的院校录取分数数据,对某大学,某专业,某批次、在某省份文理分科的条件下的录取分数线进行一定准确度的预测。
可选的,在用户输入高考分数进行预测前,首先可以以考生信息、院校、专业三类概念实体为节点,构建志愿推荐知识图谱。如图1b所示,该图谱包括考生信息、院校数据、专业数据、分数预测、分档推荐等,图的边为考生考上某院校或某专业的概率参数等志愿推荐相关的参数。
其中,考生分数信息包括省份、文理科、批次、分数等基本信息;院校数据包括院校特征信息、院校介绍、院校热度排名、历史录取平均分、最高分、最低分等;专业数据同样包含专业信息和历史分数等。
发明人通过整合各种网络资源,对上述结构的知识图谱进行构建。目前所构建出的知识图谱共整合超过3000所院校、1300个专业的信息,涵盖54万条大学录取分数线、290万条大学专业分数线的海量信息,合计约5万个节点和2300万条边。通过上述海量信息,可以实现高准确度的录取分数线的预测。
其中,志愿推荐知识图谱可在考生、学校、专业三者之间构建关系网络,输入任意一类实体信息则可查询到与之相关的另外两类实体的信息,从而更加全面满足用户多元化的查询需求。
典型的,可以预先选取一个预测模型(例如:线性回归模型、贝叶斯预测模型或者神经网络模型等),通过从知识图谱中获取对应的历史录取数据对该预测模型进行训练,可以最终得到一个可以预测当年录取分数线的分数线预测模型。一般来说,各个高校在各个省份的录取分数线都和该省份的省控分息息相关。因此,可以相应构建一个能够预测线差值(录取分数线与省控分的差值)的分数线预测模型。在各个省份公布当年的省控分之后,可以根据该分数线预测模型预测出的各个高校的各个专业在各个省份,在各个批次下针对各个分科的线差值,得到各个高校的实际录取分数线。
S120、根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合。
在本实施例的一个可选的实施方式中,根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合可以包括:
根据用户输入的高考成绩信息,获取与所述高考成绩信息对应的用户高考分数、用户所在省份、用户录取批次以及用户分科类型;
获取与所述用户所在省份对应的目标省控线,并计算所述高考分数与所述目标省控线之间的用户线差;
根据对各个高校当年的录取分数线的预测结果,获取与所述用户所在省份、所述用户录取批次以及所述用户分科类型匹配的各个高校的各个专业当年的预测录取线差;
如果所述用户线差与第一高校中至少一个专业当年的预测录取线差之间的差值处于设定门限范围内,则将所述第一高校归集于所述推荐高校集合中。
其中,用户输入的高考成绩信息可以包括姓名、高考分数,省份以及文理科等信息,根据这些具体的高考成绩信息,可以获取相应的用户高考分数、用户所在省份、用户录取批次以及用户分科类型等;或者,用户输入的高考成绩信息可以仅包括高考分数以及准考证号等信息,可以通过分析准考证号的构造方式,以及当前系统时间,对应提取用户所在省份、用户录取批次以及用户分科类型等信息。
由于与不同省份对应的省控线各不相同,可以联网获取与用户所在省份对应的目标省控线,或者可以在当年所有省份的省控线对外公布后,获取并存储在本地数据库,在用户输入当年的高考成绩信息后,在本地数据库中查找与用户所在省份对应的目标省控线。在获取到目标省控线后,计算用户高考分数与目标省控线之间的用户线差,同时根据对各个高校当年的录取分数线的预测结果,获取与用户所在省份、用户录取批次以及用户分科类型匹配的各个高校的各个专业当年的录取分数线与所述目标省控线之间的预测录取线差。如果用户线差与某一高校中至少一个专业当年的预测录取线差之间的差值处于设定门限范围内,则将该高校归集于推荐高校集合中。
在一个具体例子中,可以预先规定所述设定门限范围为[-12,45],如果用户X的高考分数为619分,且对应获取的用户X所在省份的目标省控分为580分,则计算得到用户线差为619-580=39分;如果确定高校A的B专业的预测录取线差为19分,高校A的C专业的预测录取线差为11分,则用户线差与B专业的预测录取线差之间的差值为39-19=20分,20落入了[-12,45]这一门限范围内;用户线差与C专业的预测录取线差之间的差值为39-11=28,28也落入了[-12,45]这一门限范围,则可以将高校A归集为与用户X对应的推荐高校集合中。
典型的,为了使得用户在推荐高校中能够有比较多的专业选择权,在确定推荐高校集合中的第一高校时,可以预先规定如果所述用户线差与第一高校中设定数量(上述例子将所述设定数量确定为2,还可以为3个、5个或者10个等)获取设定比例(全部专业中的1/2或者1/3等)的专业当年的预测录取线差之间的差值处于设定门限范围内,则将所述第一高校归集于所述推荐高校集合中。其中,所述设定数量以及设定比例可以根据实际情况进行预设,本实施例对此并不进行限制。
S130、将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
在本实施例中,为了将推荐高校集合以一种更加直观的,指导性更强的方式提供给用户,进一步的,可以将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
例如,可以根据不同的录取难度将上述推荐高校集合分为至少两个档位,典型的,可以分为三个档位,不同档位对应不同的录取难度,也即:不同档位对应用户线差与第一高校中至少一个专业当年的预测录取线差之间的不同的差值范围。
典型的,可以设定三个录取难度:“冲一冲”、“稳一稳”以及“保一保”,其中,针对前述的设定门限范围为[-12,45],可以设定“冲一冲”对应的差值范围为[-12,8],“稳一稳”对应的差值范围为(8,23],“保一保”对应的差值范围为(23,45]。
其中,“冲一冲”档包含的推荐高校是录取概率相对较小的部分高校,通常该部分高校综合水平也较高,在填写志愿时,可以将此类高校放在前列,最大程度发挥考分的价值。“稳一稳”档包含的推荐高校是录取概率居中的部分高校,通常该部分高校综合水平较“冲一冲”档包含的推荐高校相对较低,在填写志愿时,可以将此类高校放在居中位置,在“冲一冲”类高校未被录取的情况下能够有望被水平相当的高校录取。“保一保”档包含的推荐高校是录取概率最高的部分高校,通常该部分高校综合水平在三档推荐高校集合中是最低的,在填写志愿时,可以将此类高校放在最后以防止未被录取。
相应的,可以根据上述不同的录取难度,将所述推荐高校集合分档提供给所述用户。
需要说明的是,因为推荐高校集合中包括有多个专业,因此具有多个预测录取线差。因此,在确定该推荐高校集合中的某一个高校(例如,第二高校)的录取难度时,可以选择根据第二高校中各个专业的最低录取线差或者各个专业的平均录取线差计算与所述用户线差的差值范围。
在本实施例的一个可选的实施方式中,在将所述推荐高校集合按照不同的录取难度,分档提供给所述用户之后,还可以包括:将所述推荐高校集合中,与各所述推荐高校对应的关联参考信息提供给所述用户;
其中,所述关联参考信息可以包括:各推荐高校的推荐专业,各推荐高校在前M年的最低录取分数线、平均录取分数线以及最低录取分数线与对应省控线的线差,M为大于等于1的整数。
具体的,本发明实施例不仅可以为用户分档提供推荐高校集合,还可实现提供各推荐高校的推荐专业,各推荐高校在近几年的最低录取分数线、平均录取分数线以及最低录取分数线与对应省控线的线差等信息,从而提供更加丰富的院校信息及往年院校的招生情况。
其中,所述推荐高校的推荐专业,具体是指所述推荐高校中,预测录取线差与用户线差满足对应分档的差值范围的专业。
例如:A高校的B专业的预测录取线差为15,用户线差为34,A高校的录取难度确定为“稳一稳”,对应的差值范围为(8,23],用户线差与B专业的预测录取线差之间的差值为34-15=19分,符合与“稳一稳”对应的差值范围。因此,在将A高校分档为“稳一稳”提供给用户之后,同时可以将B专业作为推荐专业提供给用户,以进一步指导用户准确填报志愿。
本发明实施例通过根据海量院校历年录取的真实分数数据,捕捉近年分数涨跌趋势对各个高校当年的录取分数线进行准确预测,在获取用户输入的高考成绩信息后,根据对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合,进而可以将所述推荐高校集合按照不同的录取难度,分档提供给所述用户,解决了因高考志愿填报方式信息量、波动大导致的难以制定适合性的报考院校志愿方案的问题,在有效提升当年录取分数线的预测准确性的同时,能够在短时间内推荐适合的报考高校供考生参考,实现了填报志愿智能化,有效避免了志愿填报的失误,从而提高报考的成功率。
实施例二
本实施例以上述实施例为基础进行具体化,在本实施例中,将根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测,具体为:获取各个高校在至少一个历史年份中的历史录取数据,并按照设定特征维度对所述历史录取数据进行分类;根据分类结果,得到各个高校在不同历史年份中,与所述统计维度对应的历史录取分数信息;根据各个高校在至少一个历史年份中,与所述统计维度对应的历史录取分数信息,计算至少一个预测特征的至少一个特征值,并将计算得到的所述特征值输入至预先训练的分数线预测模型中;根据所述分数线预测模型的输出结果,对各个高校当年的录取分数线进行预测。相应的,本实施例的方法可以包括:
S210、获取各个高校在至少一个历史年份中的历史录取数据,并按照设定特征维度对所述历史录取数据进行分类。
其中,对于任意历史录取数据,其属性一般包括有:高校、专业、年份、省份、分科(文理科)、录取批次等6个相互垂直的特征维度。不同维度数据可以单独处理,而相关维度数据则需考虑数据潜在的关联关系。
相应的,可以根据不同的特征维度,对历史录取数据进行分类,以方便后续的预测模型的训练以及当年的录取分数线的预测。
一般来说,主要依据高校在不同历史年份的历史录取数据进行数据处理,这相当于固定了两个维度,也即高校以及年份,相应的,所述统计维度可以包括:设定专业、设定录取批次、设定省份以及设定分科。
S220、根据分类结果,得到各个高校在不同历史年份中,与所述统计维度对应的历史录取分数信息。
其中,所述历史录取分数信息可以包括下述至少一项:最高分、最低分以及平均分。
所述最高分为各个专业中的最高录取分,所述最低分为各个专业的最低录取分,所述平均分为各个专业的平均录取分。
具体的,根据对历史录取数据分类获取的最高分、最低分、平均分的结果,得到各个高校在不同历史年份中,与设定专业、设定录取批次、设定省份以及设定分科(如:通信专业、二批、河北省、理工科)对应的最高分、最低分以及平均分等信息。
S230、根据各个高校在至少一个历史年份中,与所述统计维度对应的历史录取分数信息,计算至少一个预测特征的至少一个特征值,并将计算得到的所述特征值输入至预先训练的分数线预测模型中。
发明人通过研究发现,一个预测模型的预测准确度与其所选用的预测特征密切相关,预测特征选择的越好,预测模型的预测准确度也越高。基于此,发明人在仅基于简单的历年录取线差对当前录取线差进行预测的方法的基础上,构造了一个或者多个能够准确录取线差的预测特征对分数线预测模型进行训练。
在本实施例的一个可选的实施方式中,所述预测特征可以包括:核心预测特征;
所述核心预测特征具体是指对预测录取分数线至关重要的特征,这是发明人通过多次试验后得到的特征,其中,关于所述核心预测特征的一种比较直观的描述可以包括:(学校各个专业的平均分-省控分)/省控分;(学校最低分数线-省控分)/省控分;(学校平均分数线-省控分)/省控分;最低分线差(学校最低分数线-省控分);以及省控分。
也即:所述核心预测特征包括下述至少一项:
目标高校在目标历史年份中与所述统计维度匹配的至少一个专业的录取平均分减去所述目标高校在目标历史年份中与所述统计维度匹配的第一省控线之差,除以所述第一省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配校最低录取分数线分减去所述目标高校在目标历史年份中与所述统计维度匹配的第二省控线之差,除以所述第二省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配的校平均录取分数线减去所述目标高校在目标历史年份中与所述统计维度匹配的第三省控线之差,除以所述第三省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配的校最低录取分数线线差;以及
目标高校在目标历史年份中与所述统计维度对应的省控线。
具体的,可以获取某一个高校在M1个历史年份中,与设定专业、设定录取批次、设定省份以及设定分科对应的历史录取分数信息(最高分、最低分以及平均分),基于上述历史录取信息,以及对应的省控线,计算与K个核心预测特征对应的K1个特征值,将该K1个特征值组成一个特征向量,最终将M1个K1维的特征向量输入至预先训练的分数线预测模型中,以实现对当年的录取分数线进行预测。
在另一个可选的实施方式中,所述预测特征还可以包括:关联预测特征。
所述关联预测特征具体是指对预测录取分数线具有辅助作用的特征,这是发明人通过多次试验后得到的特征,其中,关于所述关联预测特征的一种比较直观的描述可以包括:前一年与当前年(某一个历史年份)线差的差值,体现线差的变化;前一年与当前年省线的线差,体现省线的变化;每年最低分数线;各年最低分数线之间的差值,观察浮动情况;线差与省线之间的比率;线差与自身分数线的比率以及平均分线差。
也即:所述关联预测特征可以包括下述至少一项:
目标高校在所述统计维度下的目标历史年份的前一年与所述目标历史年份线差的差值、目标高校在所述统计维度下的目标历史年份的前一年与所述目标历史年份省控线的差值、目标高校在目标历史年份中与所述统计维度匹配的校最低录取分数线、目标高校在所述统计维度下至少两个相邻历史年份的校最低录取分数线之间的差值、目标高校在目标历史年份中与所述统计维度匹配的线差与省控线之间的比率、目标高校在目标历史年份中与所述统计维度匹配的线差与最低录取分数线之间的比率、目标高校在目标历史年份中与所述统计维度匹配的校录取平均分线差以及目标高校在目标历史年份中与所述统计维度匹配的校录取平均分线差与省控线之间的比率。
具体的,可以获取某一个高校在M2个历史年份中,与设定专业、设定录取批次、设定省份以及设定分科对应的历史录取分数信息(最高分、最低分以及平均分),基于上述历史录取信息,以及对应的省控线,计算与K2个核心预测特征对应的K2个特征值,将该K2个特征值组成一个特征向量,最终将M2个K2维的特征向量输入至预先训练的分数线预测模型中,以实现对当年的录取分数线进行预测。
需要说明的是,在现有数据处理的基础上,核心预测特征以及关联预测特征能够提取数据之间的逻辑关系和相关性关系作为重要特征,而非简单地使用分数或线差。因此,核心预测特征以及关联预测特征的应用能够更加科学、合理地推荐高校集合。
其中,所述分数线预测模型的模型训练过程与上述录取分数线的预测过程相类似,区别在于在对模型训练时,各个高校的录取分数线都是已知的,相应的,可以根据录取分数线的实际值,以及该分数预测模型输出的录取分数线的预测值,对该分数预测模型中包括的模型参数(例如,预测权重)进行调整,以最终完成对分数预测模型的训练。
在本实施例的一个可选的实施方式中,所述分数线预测模型可以为多元线性回归模型,所述分数线预测模型的输入为根据目标高校在至少两个历史年份中,与所述统计维度对应的所述预测特征的特征值,所述分数线预测模型的输出为目标高校当年在所述统计维度下的预测录取线差。
其中,分数线预测模型采用基于时间序列的多元线性回归模型。一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,若需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,即为多元回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元线性回归。
具体的,设y为因变量,x1,x2···xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:
y=b0+b1x1+b2x2+Lbkxk+e
其中,e为超参数,用于对计算误差进行微调,b0为常数项,b1,b2···bk为回归系数,b1为x2,x3···xk固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为x1,xk固定时,x2每增加一个单位对y的效应,即x2对y的偏回归系数。
其中,所述分数线预测模型的输入,即x1、···、xk为根据某高校在至少两个历史年份中,与设定专业、设定录取批次、设定省份以及设定分科对应的至少两个预测特征(例如,核心预测特征以及关联预测特征)的至少两个特征值;b1、···、bk为预先训练的分数预测模型的模型参数,也即回归系数;分数线预测模型的输出,即y代表某高校当年在设定专业、设定录取批次、设定省份以及设定分科的预测录取线差。在利用上述多元线性回归模型进行预测录取线差之前,首先要对多元线性回归模型进行预先训练求出回归系数的值。
以两个历史年份为例,如果上述多元线性回归模型使用两个历史年份,对当年的录取分数线进行预测,则所述多元线性回归模型可以调整为:
y=b0+b1x1+b2x2
其中,x1对应由一个历史年份下的历史录取数据计算得到的一个预测特征的特征值,或者由多个预测特征的特征值构成的特征向量;x2对应由另一个历史年份下的历史录取数据计算得到的一个预测特征的特征值,或者由多个预测特征的特征值构成的特征向量。
也即:模型中引入的预测特征越多,自变量x本身包括的向量维数也越多;模型中引入的历史年份的数量越多,包括的自变量x的数量也越多。举例而言,以2015年、2014年这二年中某高校在设定专业、设定录取批次、设定省份以及设定分科对应的多个预测特征分别对应的两个自变量作为训练模型的输入,以2016年该高校在设定专业、设定录取批次、设定省份以及设定分科的实际的录取线差作为因变量;以2014年、2013年二年中某高校在设定专业、设定录取批次、设定省份以及设定分科对应的多个预测特征分别对应的两个自变量作为训练模型的输入,以2015年该高校在设定专业、设定录取批次、设定省份以及设定分科的实际的录取线差作为因变量,以此类推来求得分数线预测模型中各个回归系数的具体数值,完成对多元线性回归模型的训练。
获得预先训练的多元线性回归模型后,即可以将2016年、2015年二年中某高校在设定专业、设定录取批次、设定省份以及设定分科对应的多个预测特征分别对应的两个自变量作为该分数预测模型的输入,预测2017年当年某高校在设定专业、设定录取批次、设定省份以及设定分科下的录取线差。
在本发明实施例中,考虑到同一高校对各个省份的录取情况不同,需预测当年某院校在某省份,不同批次和文理科的录取分数。根据院校历史招生数据,以及招生录取的平均分、最高分和最低分等分数数据,包括院校信息、院校分数、专业信息、专业分数以及历年省份招生的省控线对当年该省高考录取分数进行预估。需基于现有历史数据,抽取、抽象和计算出对新一年分数有影响的特征集合。通过机器学习模型,在生成特征集合的基础上进行建模和计算,找到录取分数与高考省控线等即时信息的关系函数,从而在新一年高考录取计划和省控线等信息公布后,快速根据该关系函数,预估院校及各专业的录取分数,并根据预估结果与当年高考成绩信息匹配的推荐高校集合。其中,与当年高考成绩信息匹配的推荐高校集合中包含多种水平的高校,以保障推荐的准确性和时效性。
S240、根据所述分数线预测模型的输出结果,对各个高校当年的录取分数线进行预测。
在本发明的实施例中,完成对分数线预测模型的训练后,即可采用分数线预测模型对各个高校当年的录取分数线进行预测,分数线预测模型的输出结果即为各个高校当年的预测录取线差。
S250、根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合。
S260、将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
本发明实施例的技术方案根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测,在现有数据数值处理的基础上,提取数据之间的逻辑关系和相关性关系作为重要特征,而非简单地使用分数或线差,能够解决单纯考虑分数或线差作为预测数据导致的推荐院校不合理的问题,从而提高高考志愿填报的科学性、可靠性和合理性。
实施例三
图3是本发明实施例三提供的一种报考信息的提供方法的流程图,本实施例以上述实施例为基础进行具体化,将根据各个高校在不同年份中,与所述统计维度对应的历史录取分数信息,计算至少一个预测特征的至少一个特征值,具体为:分别根据各个高校在当年的前N年中,与所述统计维度对应的历史录取分数信息,计算与至少一个预测特征分别对应的N个特征值,其中,N为大于等于3的整数;如果与同一预测特征对应的N个特征值中包含奇异值,则采取设定奇异数据处理方法,对所述奇异值进行平滑处理。相应的,本实施例的方法可以包括:
S310、获取各个高校在至少一个历史年份中的历史录取数据,并按照设定特征维度对所述历史录取数据进行分类。
S320、根据分类结果,得到各个高校在不同历史年份中,与所述统计维度对应的历史录取分数信息。
S330、分别根据各个高校在当年的前N年中,与所述统计维度对应的历史录取分数信息,计算与至少一个预测特征分别对应的N个特征值,并将计算得到的所述特征值输入至预先训练的分数线预测模型中。其中,N为大于等于3的整数。
在本发明的实施例中,在计算特征值时,需要以各个高校在当年的最少前3年中的设定专业、设定录取批次、设定省份以及设定分科对应的历史录取分数信息为依据来计算预测特征对应的特征值。需要说明的是,特征值越多,则分数线预测模型综合考虑的高校的录取情况越详细,预测模型输出的结果越合理、越科学。
S340、如果与同一预测特征对应的N个特征值中包含奇异值,则采取设定奇异数据处理方法,对所述奇异值进行平滑处理。
在本发明实施例中,在使用分数线预测模型进行预估时,不能保证数据和模型完全正确,而考虑到高考志愿推荐准确性需优先于院校覆盖率。因此在现有模型基础上对推荐结果进行检查和筛选,进一步剔除不合理的推荐。
其中,由于某些院校受录取人数变化、专业变动、或招生政策变化等原因的影响,导致分数变化在个别年份浮动较大,存在分数“跳变”的现象,这就会导致奇异值的产生。例如北京邮电大学在2012和2013年安徽理科分数线相差143分。在利用北京邮电大学在2012和2013年安徽理科分数线对2014年安徽理科分数线进行预测时就会产生奇异值。
在本发明的实施例中,如果特征值中包含奇异值,则使用数值优化方法处理奇异值,使得各个数据反映的结果趋势相同,或将得到的数据限制在合理的范围内,从而尽量降低预估误差。例如,若北京邮电大学在2012、2013和2014年安徽理科线差分别为80、150和90,则将北京邮电大学在2013年安徽理科线差进行平滑处理,设为85,对奇异值的平滑处理能够降低分数波动较大的高校的推荐概率,从而提高高考志愿填报可靠性。
需要说明的是,除了奇异值会增大预估误差,高考原始数据存在数据缺失、个别数据不准确、部分数据疑似有误等问题也会增大预估误差。遇到这种数据,需要对数据缺失情况进行分类处理,使用多种子策略组合预估,弃用可能有误的数据,最大限粗弥补数据缺失的缺陷,尽量降低对预测结果准确率的不利影响。
S350、根据所述分数线预测模型的输出结果,对各个高校当年的录取分数线进行预测。
S360、根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合。
S370、将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
本发明实施例的技术方案通过对分数线预测模型中特征值存在的奇异值进行平滑处理,以及针对高考原始数据存在数据缺失、个别数据不准确、部分数据疑似有误等问题的分类处理,解决异常数据对分数线预测模型输出结果的影响,从而提高高考志愿填报的可靠性。
实施例四
图4为本发明实施例四提供的一种报考信息的提供方法的流程图,本实施例以上述实施例为基础进行具体化,在本实施例中,将所述推荐高校集合按照不同的录取难度,分档提供给所述用户,具体为:按照各推荐高校各专业的当年最低录取分数线的线差与所述用户线差之间的差值,确定所述推荐高校集合中各高校的录取难度,其中,不同录取难度对应不同的差值范围;获取与相邻两个录取难度对应的至少两个关联高校,并根据与各所述关联高校对应的高校关联推荐因素,修正各所述关联高校的录取难度;将所述推荐高校集合按照修正后的所述录取难度,分档提供给所述用户。相应的,本实施例的方法可以包括:
S410、根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测。
S420、根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合。
S430、按照各推荐高校各专业的当年最低录取分数线的线差与所述用户线差之间的差值,确定所述推荐高校集合中各高校的录取难度,其中,不同录取难度对应不同的差值范围。
在本发明的实施例中,在获取到与当年高考成绩信息匹配的推荐高校集合后,再根据集合中高校各专业的当年最低录取分数线的线差与用户线差之间的差值确定录取难度,用户线差超过当年最低录取分数线的线差的数值越大,相应的录取难度也就越低。
S440、获取与相邻两个录取难度对应的至少两个关联高校,并根据与各所述关联高校对应的高校关联推荐因素,修正各所述关联高校的录取难度。
其中,所述高校关联推荐因素包括:录取概率、高校排名、高校知名度、高校最近一年的最低录取分数线与对应省控线的线差以及所述高校的历史录取数据的置信度评分。
具体的,以三个录取难度为例:假设与用户B对应的推荐高校集合中,与“冲一冲”对应的推荐高校为高校1、高校2以及高校3;与“稳一稳”对应的推荐高校为高校4以及高校5,与“保一保”对应的推荐高校为高校6、高校7以及高校8。其中,相邻录取难度为“冲一冲”以及“稳一稳”;“稳一稳”以及“保一保”。
进一步的,以相邻录取难度为“冲一冲”以及“稳一稳”为例,对应的关联高校为高校1、高校2、高校3、高校4以及高校5。相应可以根据上述高校关联推荐因素,修正与上述高校对应的录取难度。
例如:可以分别为每个高校计算一个调整权重K,K=A1*c1+A2*c2,其中,A1、A2为设定比例系数,c1为录取概率,c2为高校排名,如果与“稳一稳”对应的高校4的调整权项大于与“冲一冲”对应的高校1的调整权项,则可以将高校4的录取难度修正为“冲一冲”,将高校1的录取难度修正为“稳一稳”。
当然,上述调整权重的计算方法仅作为示例,本领域技术人员可以根据实际情况选择对应的高校关联推荐因素构造调整权重的计算公式,本实施例对此并不进行限制。
典型的,所述录取概率通过公式:计算得到;
其中,所述P(x)为所述用户被目标高校录取的录取概率;x为所述用户的用户高考分数与所述目标高校的最低录取分数线的差值。
本发明实施例基于录取概率进行高校推荐,而录取概率计算基于分差,及限定省份、文理科、院校、专业后,首先预测该院校该专业的录取分数,再与考生分数计算差值,根据差值计算录取概率。
在本发明的实施例中,对每一个推荐结果集合,会先进行排序,在排序的基础上,依据用户的真实分数对结果进行分档。排序主要依据是分数预估结果,根据该预估结果以及用户对学校报考预期综合计算考生被某院校或专业录取的概率系数,使用该概率系数作为结果排序和分档的主要参考。
S450、将所述推荐高校集合按照修正后的所述录取难度,分档提供给所述用户。
在根据预测分数对学校进行分档的基础上对每个档位所包含的推荐高校集合进行档位调整能够降低系统整体误差,修正边缘数据预测结果,提升推荐准确率同时,在参考模型结果的前提下,能够提供更符合用户预期的推荐结果。
举例说明,获取到用户当年的用户高考分数后,根据对不同高校的各个专业的录取分数线的预测结果,对学校进行预分档形成三个等级中包含的推荐高校集合情况为:“冲一冲”包含的推荐高校为:北京邮电大学、北京交通大学、北京林业大学等,“稳一稳”包含的推荐高校为:河北工业大学、复旦大学、郑州大学等,由于复旦大学知名度远高于北京林业大学,所以将复旦大学和北京林业大学进行互换,实现档位调整。
本发明实施例的技术方案,通过获取与相邻两个录取难度对应的至少两个关联高校,并根据与各关联高校对应的高校关联推荐因素,修正各关联高校的录取难度,分档提供给用户,解决因数据或模型不完全准确导致的预测数据出现偏差的问题,从而提高高考志愿填报的科学性、可靠性和合理性。
实施例五
图5是本发明实施例五提供的一种报考信息的提供装置的示意图,可执行本发明任意实施例所提供的报考信息的提供方法,具备执行方法相应的功能模块和有益效果,本实施例可适用于填报高考志愿的情况。如图5所示,所述装置包括:
录取分数线预测模块510,用于根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;
高校集合推荐模块520,用于根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;
高校分档提供模块530,用于将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
本发明实施例通过根据海量院校历年录取的真实分数数据,捕捉近年分数涨跌趋势对各个高校当年的录取分数线进行准确预测,在获取用户输入的高考成绩信息后,根据对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合,进而可以将所述推荐高校集合按照不同的录取难度,分档提供给所述用户,解决了因高考志愿填报方式信息量、波动大导致的难以制定适合性的报考院校志愿方案的问题,在有效提升当年录取分数线的预测准确性的同时,能够在短时间内推荐适合的报考高校供考生参考,实现了填报志愿智能化,有效避免了志愿填报的失误,从而提高报考的成功率。
在上述各实施例的基础上,所述录取分数线预测模块510,具体可以用于:
获取各个高校在至少一个历史年份中的历史录取数据,并按照设定特征维度对所述历史录取数据进行分类;
根据分类结果,得到各个高校在不同历史年份中,与所述统计维度对应的历史录取分数信息;
根据各个高校在至少一个历史年份中,与所述统计维度对应的历史录取分数信息,计算至少一个预测特征的至少一个特征值,并将计算得到的所述特征值输入至预先训练的分数线预测模型中;
根据所述分数线预测模型的输出结果,对各个高校当年的录取分数线进行预测。
进一步的,所述统计维度包括:设定专业、设定录取批次、设定省份以及设定分科;
所述历史录取分数信息包括下述至少一项:最高分、最低分以及平均分。
进一步的,所述预测特征包括:核心预测特征;
所述核心预测特征包括下述至少一项:
目标高校在目标历史年份中与所述统计维度匹配的至少一个专业的录取平均分减去所述目标高校在目标历史年份中与所述统计维度匹配的第一省控线之差,除以所述第一省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配校最低录取分数线分减去所述目标高校在目标历史年份中与所述统计维度匹配的第二省控线之差,除以所述第二省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配的校平均录取分数线减去所述目标高校在目标历史年份中与所述统计维度匹配的第三省控线之差,除以所述第三省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配的校最低录取分数线线差;以及
目标高校在目标历史年份中与所述统计维度对应的省控线。
进一步的,所述预测特征还包括:关联预测特征;
所述关联预测特征包括下述至少一项:
目标高校在所述统计维度下的目标历史年份的前一年与所述目标历史年份线差的差值、目标高校在所述统计维度下的目标历史年份的前一年与所述目标历史年份省控线的差值、目标高校在目标历史年份中与所述统计维度匹配的校最低录取分数线、目标高校在所述统计维度下至少两个相邻历史年份的校最低录取分数线之间的差值、目标高校在目标历史年份中与所述统计维度匹配的线差与省控线之间的比率、目标高校在目标历史年份中与所述统计维度匹配的线差与最低录取分数线之间的比率、目标高校在目标历史年份中与所述统计维度匹配的校录取平均分线差、以及目标高校在目标历史年份中与所述统计维度匹配的校录取平均分线差与省控线之间的比率。
进一步的,所述分数线预测模型为多元线性回归模型,所述分数线预测模型的输入为根据目标高校在至少两个历史年份中,与所述统计维度对应的所述预测特征的特征值,所述分数线预测模型的输出为目标高校当年在所述统计维度下的预测录取线差。
在上述各实施例的基础上,所述录取分数线预测模块510,还可以用于:
分别根据各个高校在当年的前N年中,与所述统计维度对应的历史录取分数信息,计算与至少一个预测特征分别对应的N个特征值,其中,N为大于等于3的整数;
如果与同一预测特征对应的N个特征值中包含奇异值,则采取设定奇异数据处理方法,对所述奇异值进行平滑处理。
在上述各实施例的基础上,所述高校集合推荐模块520,具体可以用于:
根据用户输入的高考成绩信息,获取与所述高考成绩信息对应的用户高考分数、用户所在省份、用户录取批次以及用户分科类型;
获取与所述用户所在省份对应的目标省控线,并计算所述用户高考分数与所述目标省控线之间的用户线差;
根据对各个高校当年的录取分数线的预测结果,获取与所述用户所在省份、所述用户录取批次以及所述用户分科类型匹配的各个高校的各个专业当年的预测录取线差;
如果所述用户线差与第一高校中至少一个专业当年的预测录取线差之间的差值处于设定门限范围内,则将所述第一高校归集于所述推荐高校集合中。
在上述各实施例的基础上,所述高校集合推荐模块520,还可以用于:
按照各推荐高校各专业的当年最低录取分数线的线差与所述用户线差之间的差值,确定所述推荐高校集合中各高校的录取难度,其中,不同录取难度对应不同的差值范围;
获取与相邻两个录取难度对应的至少两个关联高校,并根据与各所述关联高校对应的高校关联推荐因素,修正各所述关联高校的录取难度;
将所述推荐高校集合按照修正后的所述录取难度,分档提供给所述用户;
其中,所述高校关联推荐因素包括:录取概率、高校排名、高校知名度、高校最近一年的最低录取分数线与对应省控线的线差以及所述高校的历史录取数据的置信度评分。
在上述各实施例的基础上,所述录取概率通过公式:
计算得到;
其中,所述P(x)为所述用户被目标高校录取的录取概率;所述x为所述用户的用户高考分数与所述目标高校的最低录取分数线的差值。
在上述各实施例的基础上,还可以包括,关联参考信息提供模块,用于将所述推荐高校集合中,与各所述推荐高校对应的关联参考信息提供给所述用户;
其中,所述关联参考信息包括下述至少一项:
各推荐高校的推荐专业;
各推荐高校在当年的前M年的最低录取分数线与对应省控线的线差;
各推荐高校在当年的前M年的平均录取分数线与对应省控线的线差;
各推荐高校在当年的前M年的最低录取分数线与对应省控线的线差;
其中,M为大于等于1的整数。
上述报考信息的提供装置可执行本发明任意实施例所提供的报考信息的提供方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的报考信息的提供方法。
实施例六
图6为本发明实施例六提供的一种计算机设备的结构示意图。图6示出了适于用来实现本发明实施方式的计算机设备612的框图。图6显示的计算机设备612仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机设备612以通用计算设备的形式表现。计算机设备612的组件可以包括但不限于:一个或者多个处理器616,存储装置628,连接不同系统组件(包括存储装置628和处理器616)的总线618。
总线618表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
计算机设备612典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备612访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置628可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)630和/或高速缓存存储器632。计算机设备612可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统634可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线618相连。存储装置628可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块626的程序636,可以存储在例如存储装置628中,这样的程序模块626包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块626通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备612也可以与一个或多个外部设备614(例如键盘、指向设备、摄像头、显示器624等)通信,还可与一个或者多个使得用户能与该计算机设备612交互的设备通信,和/或与使得该计算机设备612能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口622进行。并且,计算机设备612还可以通过网络适配器620与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器620通过总线618与计算机设备612的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备612使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理器616通过运行存储在存储装置628中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的报考信息的提供方法。
通过所述计算机设备,根据海量院校历年录取的真实分数数据,捕捉近年分数涨跌趋势对各个高校当年的录取分数线进行准确预测,在获取用户输入的高考成绩信息后,根据对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合,进而可以将所述推荐高校集合按照不同的录取难度,分档提供给所述用户,解决了因高考志愿填报方式信息量、波动大导致的难以制定适合性的报考院校志愿方案的问题,在有效提升当年录取分数线的预测准确性的同时,能够在短时间内推荐适合的报考高校供考生参考,实现了填报志愿智能化,有效避免了志愿填报的失误,从而提高报考的成功率。
实施例七
本发明实施例七还提供一种存储计算机程序的计算机存储介质,所述计算机程序在由计算机处理器执行时用于执行本发明上述实施例任一所述的报考信息的提供方法。
也即,该程序被处理器执行时实现:根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (14)

1.一种报考信息的提供方法,其特征在于,包括:
根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;
根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;
将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测,包括:
获取各个高校在至少一个历史年份中的历史录取数据,并按照设定特征维度对所述历史录取数据进行分类;
根据分类结果,得到各个高校在不同历史年份中,与所述统计维度对应的历史录取分数信息;
根据各个高校在至少一个历史年份中,与所述统计维度对应的历史录取分数信息,计算至少一个预测特征的至少一个特征值,并将计算得到的所述特征值输入至预先训练的分数线预测模型中;
根据所述分数线预测模型的输出结果,对各个高校当年的录取分数线进行预测。
3.根据权利要求2所述的方法,其特征在于,
所述统计维度包括:设定专业、设定录取批次、设定省份以及设定分科;
所述历史录取分数信息包括下述至少一项:最高分、最低分以及平均分。
4.根据权利要求2所述的方法,其特征在于,所述预测特征包括:核心预测特征;
所述核心预测特征包括下述至少一项:
目标高校在目标历史年份中与所述统计维度匹配的至少一个专业的录取平均分减去所述目标高校在目标历史年份中与所述统计维度匹配的第一省控线之差,除以所述第一省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配校最低录取分数线分减去所述目标高校在目标历史年份中与所述统计维度匹配的第二省控线之差,除以所述第二省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配的校平均录取分数线减去所述目标高校在目标历史年份中与所述统计维度匹配的第三省控线之差,除以所述第三省控线的结果;
目标高校在目标历史年份中与所述统计维度匹配的校最低录取分数线线差;以及
目标高校在目标历史年份中与所述统计维度对应的省控线。
5.根据权利要求4所述的方法,其特征在于,所述预测特征还包括:关联预测特征;
所述关联预测特征包括下述至少一项:
目标高校在所述统计维度下的目标历史年份的前一年与所述目标历史年份线差的差值、目标高校在所述统计维度下的目标历史年份的前一年与所述目标历史年份省控线的差值、目标高校在目标历史年份中与所述统计维度匹配的校最低录取分数线、目标高校在所述统计维度下至少两个相邻历史年份的校最低录取分数线之间的差值、目标高校在目标历史年份中与所述统计维度匹配的线差与省控线之间的比率、目标高校在目标历史年份中与所述统计维度匹配的线差与最低录取分数线之间的比率、目标高校在目标历史年份中与所述统计维度匹配的校录取平均分线差、以及目标高校在目标历史年份中与所述统计维度匹配的校录取平均分线差与省控线之间的比率。
6.根据权利要求4或5所述的方法,其特征在于,
所述分数线预测模型为多元线性回归模型;
所述分数线预测模型的输入为根据目标高校在至少两个历史年份中,与所述统计维度对应的所述预测特征的特征值,所述分数线预测模型的输出为目标高校当年在所述统计维度下的预测录取线差。
7.根据权利要求2-5任一项所述的方法,其特征在于,所述根据各个高校在不同年份中,与所述统计维度对应的历史录取分数信息,计算至少一个预测特征的至少一个特征值,包括:
分别根据各个高校在当年的前N年中,与所述统计维度对应的历史录取分数信息,计算与至少一个预测特征分别对应的N个特征值,其中,N为大于等于3的整数;
如果与同一预测特征对应的N个特征值中包含奇异值,则采取设定奇异数据处理方法,对所述奇异值进行平滑处理。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合,包括:
根据用户输入的高考成绩信息,获取与所述高考成绩信息对应的用户高考分数、用户所在省份、用户录取批次以及用户分科类型;
获取与所述用户所在省份对应的目标省控线,并计算所述用户高考分数与所述目标省控线之间的用户线差;
根据对各个高校当年的录取分数线的预测结果,获取与所述用户所在省份、所述用户录取批次以及所述用户分科类型匹配的各个高校的各个专业当年的预测录取线差;
如果所述用户线差与第一高校中至少一个专业当年的预测录取线差之间的差值处于设定门限范围内,则将所述第一高校归集于所述推荐高校集合中。
9.根据权利要求1所述的方法,其特征在于,所述将所述推荐高校集合按照不同的录取难度,分档提供给所述用户,包括:
按照各推荐高校各专业的当年最低录取分数线的线差与所述用户线差之间的差值,确定所述推荐高校集合中各高校的录取难度,其中,不同录取难度对应不同的差值范围;
获取与相邻两个录取难度对应的至少两个关联高校,并根据与各所述关联高校对应的高校关联推荐因素,修正各所述关联高校的录取难度;
将所述推荐高校集合按照修正后的所述录取难度,分档提供给所述用户;
其中,所述高校关联推荐因素包括:录取概率、高校排名、高校知名度、高校最近一年的最低录取分数线与对应省控线的线差以及所述高校的历史录取数据的置信度评分。
10.根据权利要求9所述的方法,其特征在于,
所述录取概率通过公式:计算得到;
其中,所述P(x)为所述用户被目标高校录取的录取概率;所述x为所述用户的用户高考分数与所述目标高校的最低录取分数线的差值。
11.根据权利要求1所述的方法,其特征在于,在将所述推荐高校集合按照不同的录取难度,分档提供给所述用户之后,还包括:
将所述推荐高校集合中,与各所述推荐高校对应的关联参考信息提供给所述用户;
其中,所述关联参考信息包括下述至少一项:
各推荐高校的推荐专业;
各推荐高校在当年的前M年的最低录取分数线与对应省控线的线差;
各推荐高校在当年的前M年的平均录取分数线与对应省控线的线差;
各推荐高校在当年的前M年的最低录取分数线与对应省控线的线差;
其中,M为大于等于1的整数。
12.一种报考信息的提供装置,其特征在于,包括:
录取分数线预测模块,用于根据各个高校历年的历史录取数据,对各个高校当年的录取分数线进行预测;
高校集合推荐模块,用于根据用户输入的当年高考成绩信息,以及对各个高校当年的录取分数线的预测结果,获取与所述当年高考成绩信息匹配的推荐高校集合;
高校分档提供模块,用于将所述推荐高校集合按照不同的录取难度,分档提供给所述用户。
13.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-11中任一所述的报考信息的提供方法。
14.一种计算机存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-11中任一所述的报考信息的提供方法。
CN201710889075.3A 2017-09-27 2017-09-27 一种报考信息的提供方法、装置、设备及存储介质 Pending CN107609711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710889075.3A CN107609711A (zh) 2017-09-27 2017-09-27 一种报考信息的提供方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710889075.3A CN107609711A (zh) 2017-09-27 2017-09-27 一种报考信息的提供方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN107609711A true CN107609711A (zh) 2018-01-19

Family

ID=61058696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710889075.3A Pending CN107609711A (zh) 2017-09-27 2017-09-27 一种报考信息的提供方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN107609711A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053351A (zh) * 2018-02-08 2018-05-18 南京邮电大学 智能高考志愿推荐系统和推荐方法
CN108596806A (zh) * 2018-05-04 2018-09-28 上饶市普适科技有限公司 精确匹配历史数据的方法
CN108764718A (zh) * 2018-05-28 2018-11-06 王春宁 基于深度学习算法的高考分数预估及志愿选择方法、系统
CN108921750A (zh) * 2018-07-30 2018-11-30 张仁平 一种高考志愿填报辅助系统
CN109064363A (zh) * 2018-09-04 2018-12-21 广州市乐无边教育科技有限公司 一种高考志愿推荐方法、装置、终端及存储介质
CN109190020A (zh) * 2018-08-08 2019-01-11 仪征达人信息技术有限公司 一种基于考生专业需求进行高考志愿推荐方法
CN109658304A (zh) * 2018-12-12 2019-04-19 广东小天才科技有限公司 一种报考信息的生成方法及电子设备
CN110335185A (zh) * 2019-07-24 2019-10-15 黄河水利职业技术学院 高等教育专业结构调整预警展示装置
CN110363501A (zh) * 2019-07-16 2019-10-22 方山县城内小学 一种基于大数据的教学学习成长管理系统
CN110472929A (zh) * 2019-07-17 2019-11-19 武汉科技大学 一种基于神经网络的志愿填报方法、系统、装置和介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927602A (zh) * 2014-04-28 2014-07-16 河南云卓数据服务有限公司 一种面向高考志愿填报的辅助决策方法
CN104978496A (zh) * 2015-08-05 2015-10-14 上海亿阁信息科技有限公司 高考志愿院校智能推荐算法
CN106408473A (zh) * 2016-08-29 2017-02-15 曹子健 一种高考志愿院校选择算法
CN106803216A (zh) * 2017-01-13 2017-06-06 深圳爱拼信息科技有限公司 一种适应浙江省的志愿推荐系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927602A (zh) * 2014-04-28 2014-07-16 河南云卓数据服务有限公司 一种面向高考志愿填报的辅助决策方法
CN104978496A (zh) * 2015-08-05 2015-10-14 上海亿阁信息科技有限公司 高考志愿院校智能推荐算法
CN106408473A (zh) * 2016-08-29 2017-02-15 曹子健 一种高考志愿院校选择算法
CN106803216A (zh) * 2017-01-13 2017-06-06 深圳爱拼信息科技有限公司 一种适应浙江省的志愿推荐系统及方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053351A (zh) * 2018-02-08 2018-05-18 南京邮电大学 智能高考志愿推荐系统和推荐方法
CN108596806A (zh) * 2018-05-04 2018-09-28 上饶市普适科技有限公司 精确匹配历史数据的方法
CN108764718A (zh) * 2018-05-28 2018-11-06 王春宁 基于深度学习算法的高考分数预估及志愿选择方法、系统
CN108921750A (zh) * 2018-07-30 2018-11-30 张仁平 一种高考志愿填报辅助系统
CN109190020A (zh) * 2018-08-08 2019-01-11 仪征达人信息技术有限公司 一种基于考生专业需求进行高考志愿推荐方法
CN109064363A (zh) * 2018-09-04 2018-12-21 广州市乐无边教育科技有限公司 一种高考志愿推荐方法、装置、终端及存储介质
CN109658304A (zh) * 2018-12-12 2019-04-19 广东小天才科技有限公司 一种报考信息的生成方法及电子设备
CN110363501A (zh) * 2019-07-16 2019-10-22 方山县城内小学 一种基于大数据的教学学习成长管理系统
CN110472929A (zh) * 2019-07-17 2019-11-19 武汉科技大学 一种基于神经网络的志愿填报方法、系统、装置和介质
CN110335185A (zh) * 2019-07-24 2019-10-15 黄河水利职业技术学院 高等教育专业结构调整预警展示装置

Similar Documents

Publication Publication Date Title
CN107609711A (zh) 一种报考信息的提供方法、装置、设备及存储介质
Ngo et al. Factor-based big data and predictive analytics capability assessment tool for the construction industry
US11941645B1 (en) Methods and systems to extract signals from large and imperfect datasets
Song et al. Prioritising technical attributes in QFD under vague environment: a rough-grey relational analysis approach
CN110928993A (zh) 基于深度循环神经网络的用户位置预测方法及系统
CN109657805A (zh) 超参数确定方法、装置、电子设备及计算机可读介质
CN111091196B (zh) 客流数据确定方法、装置、计算机设备和存储介质
Kumar et al. Fuzzy system reliability evaluation using time-dependent intuitionistic fuzzy set
CN104166731A (zh) 一种社交网络重叠社区发现系统及其方法
Wu et al. Control chart pattern recognition using an integrated model based on binary-tree support vector machine
CN106796618A (zh) 时序预测装置和时序预测方法
CN106779224A (zh) 一种预测高考录取概率的方法及系统
Maboudou-Tchao et al. Monitoring the mean vector with Mahalanobis kernels
CN114021837A (zh) 基于混合机器学习和空间地址匹配的区域用电量预测方法
CN116244513A (zh) 随机群组poi推荐方法、系统、设备及存储介质
Kang et al. A random forest classifier with cost-sensitive learning to extract urban landmarks from an imbalanced dataset
US10803218B1 (en) Processor-implemented systems using neural networks for simulating high quantile behaviors in physical systems
CN105162643B (zh) 流量预估的方法、装置及计算设备
CN118133728A (zh) 电路生成方法、装置、计算机设备、存储介质和程序产品
Fong et al. A hybrid multiple sensor fault detection, diagnosis and reconstruction algorithm for chiller plants
CN103279549A (zh) 一种目标对象的目标数据的获取方法及装置
Félix et al. Predicting students’ performance using survey data
Wang et al. Research on estimation model of the battery state of charge in a hybrid electric vehicle based on the classification and regression tree
WO2022222230A1 (zh) 基于机器学习的指标预测方法、装置、设备及存储介质
CN109886288A (zh) 一种用于电力变压器的状态评价方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180119

RJ01 Rejection of invention patent application after publication