CN106447111A - 一种基于大数据的高考志愿填报方法 - Google Patents

一种基于大数据的高考志愿填报方法 Download PDF

Info

Publication number
CN106447111A
CN106447111A CN201610871137.3A CN201610871137A CN106447111A CN 106447111 A CN106447111 A CN 106447111A CN 201610871137 A CN201610871137 A CN 201610871137A CN 106447111 A CN106447111 A CN 106447111A
Authority
CN
China
Prior art keywords
information
college entrance
admission
entrance examination
examinee
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610871137.3A
Other languages
English (en)
Inventor
晋彤
李永康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Special Road Mdt Infotech Ltd
Original Assignee
Guangzhou Special Road Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Special Road Mdt Infotech Ltd filed Critical Guangzhou Special Road Mdt Infotech Ltd
Priority to CN201610871137.3A priority Critical patent/CN106447111A/zh
Publication of CN106447111A publication Critical patent/CN106447111A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance
    • G06Q50/2053Education institution selection, admissions, or financial aid

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的高考志愿填报方法,包括:A、高考信息采集;B、高考信息检索;C、热门专业分析;D、历年录取情况分析;E、考生录取情况预测;F、考生信息上传。通过分析出各个高校今年志愿录取趋势、志愿录取范围、起伏程度以及各个高校志愿录取线,为高考学子提供志愿辅助。

Description

一种基于大数据的高考志愿填报方法
技术领域
本发明涉及高考报考领域,特别涉及一种基于大数据的高考志愿填报方法。
背景技术
中国教育在线提供了比较全面的高校搜索、专业搜索、生源地高考分批分数线、大学录取线、高校各省录取人数查询和专业录取线等搜索功能。百度教育提供了根据考生生源地、考生类型(文理科)、录取批次、估分以及报考分析(保底、稳妥、冒险)等条件,搜索出比较适合考生报考的学校,所展示的信息有学校、所在地、录取年份、最高分、平均分、省控分和录取概率等信息。
目前,中国教育在线只提供搜索服务,也就是简单的查询,没有进行数据分析,其不能进行智能推荐。百度教育在提供搜索服务的基础上,采用大数据分析技术,提供录取风险和概率等信息。但百度教育根据历史数据做分析,没有今年模拟数据做参考,缺乏智能推荐的修正数据。这样通常会造成考生报考的盲目性,影响报考的成功率。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述不能智能推荐、报考盲目性较大、影响报考的成功率的缺陷,提供一种能智能推荐、避免报考的盲目性、提高报考的成功率的基于大数据的高考志愿填报方法。
本发明解决其技术问题所采用的技术方案是:一种基于大数据的高考志愿填报方法,所述方法包括:
A、高考信息采集:高考信息采集功能可以实现全国范围内网站的信息采集,全面覆盖各个高校网站、志愿录取网站、历年高校统计等网站。采集的数据来源包括网站、论坛、博客、微博等诸多类型的媒体。信息采集的要素包括:标题、作者、信息正文、来源(当前网站)、发布时间、链接等多种要素。在采集站点配置方面,可以根据不同的站点灵活设定采集策略,允许用户配置站点起始URL、URL过滤规则、抓取深度、抓取网页数量、扫描间隔、所属频道等采集主要网站、论坛、博客、采集的开始时间、频率、采集优先级等,对于网站中需要重点监控的频道可以设成更新站点并设置较高采集频率,每个网站的采集方案可进行保存、查看和修改。同时可对网页进行增量更新,保证重复的网页不再下载。
B、高考信息检索:检索本地搜索引擎采集到信息,还能实时调用云平台搜索引擎的检索结果,把检索结果和本地搜索引擎采集到信息进行整合,自动去除重复链接,使用户查询到在大量高考网站中出现的信息;用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数。
提供了分布式检索和负载均衡集群服务器,实现分布式检索和负载均衡功能,满足大数据量和高并发的检索要求。用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数、规章制度等信息内容。同时可以按照信息的来源、时间段等要素进行组合,确保用户搜索到真正需要的内容。
C、热门专业分析:通过遍布全国的蜘蛛采集集群服务器,实时采集与高考相关的各种信息数据,并且基于统计的文本信息处理方法实现能对信息的热点信息的自动聚类,并结合往年高考热门专业的情况,通过比对分析对未来热门专业的预期判断;
D、历年录取情况分析:通过对目标院校历年的录取情况进行分析,并以形式丰富多样的各种统计图表进行展示,使用户能够全面掌握录取情况,为填报志愿提供辅助;
E、考生录取情况预测:在获取了考生高考信息后,针对考生选择的院校、专业,将考生情况与录取情况分析结果进行比对,对考生可能被目标院校专业录取的情况进行预测,为填报志愿提供辅助;
F、考生信息上传:用户使用考生信息上传功能,将考生的高考信息上传至服务器,在后续分析及预测时,能够自动获取考生的各种信息。还支持手动添加信息内容,也支持用户从本地或网上上传文件作为发送信息的附件。
本发明的高考志愿填报方法对高考信息进行深入挖掘,通过互联网对高考信息挖掘和信息库的整合,过滤和屏蔽垃圾信息,提取高考全国范围内近几年高校志愿录取率、录取分数,结合今年参考高考的人数、今年规章制度等情况进行统计分析,分析出各个高校今年志愿录取趋势、志愿录取范围、起伏程度以及各个高校志愿录取线,为高考学子提供志愿辅助。
附图说明
图1是本发明的高考志愿填报方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
一种基于大数据的高考志愿填报方法,如图1所示所述方法包括如下步骤:
A、高考信息采集:高考信息采集功能可以实现全国范围内网站的信息采集,全面覆盖各个高校网站、志愿录取网站、历年高校统计等网站。采集的数据来源包括网站、论坛、博客、微博等诸多类型的媒体。信息采集的要素包括:标题、作者、信息正文、来源(当前网站)、发布时间、链接等多种要素。在采集站点配置方面,可以根据不同的站点灵活设定采集策略,允许用户配置站点起始URL、URL过滤规则、抓取深度、抓取网页数量、扫描间隔、所属频道等采集主要网站、论坛、博客、采集的开始时间、频率、采集优先级等,对于网站中需要重点监控的频道可以设成更新站点并设置较高采集频率,每个网站的采集方案可进行保存、查看和修改。同时可对网页进行增量更新,保证重复的网页不再下载。
B、高考信息检索:检索本地搜索引擎采集到信息,还能实时调用云平台搜索引擎的检索结果,把检索结果和本地搜索引擎采集到信息进行整合,自动去除重复链接,使用户查询到在大量高考网站中出现的信息;用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数。
提供了分布式检索和负载均衡集群服务器,实现分布式检索和负载均衡功能,满足大数据量和高并发的检索要求。用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数、规章制度等信息内容。同时可以按照信息的来源、时间段等要素进行组合,确保用户搜索到真正需要的内容。
C、热门专业分析:通过遍布全国的蜘蛛采集集群服务器,实时采集与高考相关的各种信息数据,并且基于统计的文本信息处理方法实现能对信息的热点信息的自动聚类,并结合往年高考热门专业的情况,通过比对分析对未来热门专业的预期判断;
D、历年录取情况分析:通过对目标院校历年的录取情况进行分析,并以形式丰富多样的各种统计图表进行展示,使用户能够全面掌握录取情况,为填报志愿提供辅助;
E、考生录取情况预测:在获取了考生高考信息后,针对考生选择的院校、专业,将考生情况与录取情况分析结果进行比对,对考生可能被目标院校专业录取的情况进行预测,为填报志愿提供辅助;
F、考生信息上传:用户使用考生信息上传功能,将考生的高考信息上传至服务器,在后续分析及预测时,能够自动获取考生的各种信息。还支持手动添加信息内容,也支持用户从本地或网上上传文件作为发送信息的附件。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (4)

1.一种基于大数据的高考志愿填报方法,其特征在于,所述方法包括:
A、高考信息采集:通过全国的各个高校网站、志愿录取网站和历年高校录取统计网站进行信息采集;
B、高考信息检索:检索本地搜索引擎采集到信息,还能实时调用云平台搜索引擎的检索结果,把检索结果和本地搜索引擎采集到信息进行整合,自动去除重复链接,使用户查询到在大量高考网站中出现的信息;用户通过输入关键字即可搜索出相应的详细信息,包括录取率、录取分数、参考高考的人数;
C、热门专业分析:通过遍布全国的蜘蛛采集集群服务器,实时采集与高考相关的各种信息数据,并且基于统计的文本信息处理方法实现能对信息的热点信息的自动聚类,并结合往年高考热门专业的情况,通过比对分析对未来热门专业的预期判断;
D、历年录取情况分析:通过对目标院校历年的录取情况进行分析,并以形式丰富多样的各种统计图表进行展示,使用户能够全面掌握录取情况,为填报志愿提供辅助;
E、考生录取情况预测:在获取了考生高考信息后,针对考生选择的院校、专业,将考生情况与录取情况分析结果进行比对,对考生可能被目标院校专业录取的情况进行预测,为填报志愿提供辅助;
F、考生信息上传:用户使用考生信息上传功能,将考生的高考信息上传至服务器,在后续分析及预测时,能够自动获取考生的各种信息。
2.根据权利要求1所述的方法,其特征在于,在步骤A中,信息采集的要素包括:标题、作者、信息正文、来源、发布时间。
3.根据权利要求1所述的方法,其特征在于,在步骤B中,高考信息检索支持实时索引更新,支持更新与搜索同时进行。
4.根据权利要求1所述的方法,其特征在于,在步骤F中,还支持手动添加信息内容,也支持用户从本地或网上上传文件作为发送信息的附件。
CN201610871137.3A 2016-09-30 2016-09-30 一种基于大数据的高考志愿填报方法 Pending CN106447111A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610871137.3A CN106447111A (zh) 2016-09-30 2016-09-30 一种基于大数据的高考志愿填报方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610871137.3A CN106447111A (zh) 2016-09-30 2016-09-30 一种基于大数据的高考志愿填报方法

Publications (1)

Publication Number Publication Date
CN106447111A true CN106447111A (zh) 2017-02-22

Family

ID=58171525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610871137.3A Pending CN106447111A (zh) 2016-09-30 2016-09-30 一种基于大数据的高考志愿填报方法

Country Status (1)

Country Link
CN (1) CN106447111A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193958A (zh) * 2017-05-24 2017-09-22 上海赢帆信息技术有限公司 一种用于呈现学生定位与高校(专业组)和专业匹配情况的图示方法
CN107403397A (zh) * 2017-05-18 2017-11-28 杭州圆橙科技有限公司 一种基于群智计算的高考志愿填报分析系统
CN111192175A (zh) * 2019-12-28 2020-05-22 西安指尖教育科技有限公司 基于关键因子摘取预估院校和专业调档分数递推映射算法
CN111667389A (zh) * 2020-06-16 2020-09-15 衢州量智科技有限公司 基于大数据的高考录取概率的评估方法及评估装置
CN113468233A (zh) * 2021-05-27 2021-10-01 济南伟成教育科技有限公司 一种高考历年录取数据处理方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123337A (zh) * 2014-05-28 2014-10-29 北京百度网讯科技有限公司 一种预测报考信息的方法和装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123337A (zh) * 2014-05-28 2014-10-29 北京百度网讯科技有限公司 一种预测报考信息的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107403397A (zh) * 2017-05-18 2017-11-28 杭州圆橙科技有限公司 一种基于群智计算的高考志愿填报分析系统
CN107193958A (zh) * 2017-05-24 2017-09-22 上海赢帆信息技术有限公司 一种用于呈现学生定位与高校(专业组)和专业匹配情况的图示方法
CN107193958B (zh) * 2017-05-24 2020-12-18 上海赢帆信息技术有限公司 一种用于呈现学生定位与高校(专业组)和专业匹配情况的图示方法
CN111192175A (zh) * 2019-12-28 2020-05-22 西安指尖教育科技有限公司 基于关键因子摘取预估院校和专业调档分数递推映射算法
CN111667389A (zh) * 2020-06-16 2020-09-15 衢州量智科技有限公司 基于大数据的高考录取概率的评估方法及评估装置
CN113468233A (zh) * 2021-05-27 2021-10-01 济南伟成教育科技有限公司 一种高考历年录取数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN106447111A (zh) 一种基于大数据的高考志愿填报方法
Strandgard et al. Estimating harvester productivity in Pinus radiata plantations using StanForD stem files
CN103646086B (zh) 一种垃圾文件的清理方法和装置
CN104077402B (zh) 数据处理方法和数据处理系统
Fekety et al. Transferability of lidar-derived basal area and stem density models within a northern Idaho ecoregion
Doherty et al. Linking conservation actions to demography: grass height explains variation in greater sage‐grouse nest survival
Saikia et al. Land-use/land-cover change and fragmentation in the Nameri Tiger Reserve, India
Jamsranjav et al. Opportunities to integrate herders’ indicators into formal rangeland monitoring: an example from Mongolia
CN103902703B (zh) 基于移动互联网访问的文本内容分类方法
CN106779581A (zh) 一种人力资源管理系统
JP2009048380A5 (zh)
CN105718590A (zh) 面向多租户的SaaS舆情监控系统及方法
CN104834739B (zh) 互联网信息存储系统
CN103745006B (zh) 一种互联网信息搜索系统及方法
CN109388751A (zh) 一种智能情报收集推送系统、模块及方法
CN106021552A (zh) 基于人群行为模拟的互联网爬虫并发数据采集方法及系统
Yost et al. The California phenology collections network: using digital images to investigate phenological change in a biodiversity hotspot
Lopes et al. A comparative approach of methods to estimate machine productivity in wood cutting
CN107609203B (zh) 一种搜索引擎优化效果量化评估的数据分析系统及方法
CN107943937A (zh) 一种基于司法公开信息分析的债务人资产监控方法及系统
CN104123337B (zh) 一种预测报考信息的方法和装置
Pontikakos et al. A location aware system for integrated management of Rhynchophorus ferrugineus in urban systems
CN114358375B (zh) 一种基于大数据的人群密度预测方法及系统
US20150331864A1 (en) Ranking and rating system and method utilizing a computer network
CN108038490A (zh) 一种基于互联网数据的p2p企业自动识别方法与系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222