CN108874749B - 一种高考志愿录取概率模型的建立方法 - Google Patents

一种高考志愿录取概率模型的建立方法 Download PDF

Info

Publication number
CN108874749B
CN108874749B CN201810650474.9A CN201810650474A CN108874749B CN 108874749 B CN108874749 B CN 108874749B CN 201810650474 A CN201810650474 A CN 201810650474A CN 108874749 B CN108874749 B CN 108874749B
Authority
CN
China
Prior art keywords
equivalent
score
scores
admission
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810650474.9A
Other languages
English (en)
Other versions
CN108874749A (zh
Inventor
龙强
朱静雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest University of Science and Technology
Original Assignee
Southwest University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest University of Science and Technology filed Critical Southwest University of Science and Technology
Priority to CN201810650474.9A priority Critical patent/CN108874749B/zh
Publication of CN108874749A publication Critical patent/CN108874749A/zh
Application granted granted Critical
Publication of CN108874749B publication Critical patent/CN108874749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/20Education
    • G06Q50/205Education administration or guidance

Abstract

本发明公开了一种高考志愿录取概率模型的建立方法,包括以下步骤:S1、根据确定的参考年份,对其高考分数进行预处理,将历年高考分数转化为待测年份对应的等效分数;S2、对等效分数进行概率密度估计,并计算概率密度函数的可信度;S3、根据等效分数及其概率密度估计,得到对应的不同分数段的录取概率模型。本发明提供的高考志愿录取概率模型的建立方法中用位次分析法处理历年高考分数,消除了不同年份分数波动的影响;提供了精确到全国高校各专业的录取概率,解决了同一高校不同专业录取分数不同影响录取概率预测的问题,降低了高分低录、高分不录的风险。

Description

一种高考志愿录取概率模型的建立方法
技术领域
本发明属于数据统计技术领域,具体涉及一种高考志愿录取概率模型的建立方法。
背景技术
志愿填报比高考本身更为重要,高考志愿填报是一个庞大又复杂的系统,每年有近千万考生,其进行高考志愿填报并不是一件简单的事,如果不提取做好准备,或有专人指导,很难单凭分数做出最佳选择。为了使考生结合自身分数填报录取概率最高的志愿高效,越来越多的高考志愿评估筛选平台可供考生选择。
现有相关技术中,其中一种高考填报志愿综合参考系统,是根据估分,院校满意度与专业知识库三个方面的院校推荐服务,其估分选志愿是直接根据考生分数筛选录取分数线上下浮动10分的院校,不提供专业录取分数等相关信息,其直接根据考生分数的上下浮动分数作为院校推荐,没有考虑不同年份的数据差异,而实际上每年录取分数存在着波动;另一种高考志愿填报系统是通过分数估数选大学与位次选大学两个方面进行志愿评估,根据院校录取分数线提供院校评估结果,为考生提供各高校热度排名、院校类别、专业信息供给考生浏览,考生通过志愿推荐与院校信息两方面来进行志愿抉择,其拥有位次推荐院校的技术,但是只是根据院校录取分数来计算录取概率,不能提供给考生报考院校某专业的录取概率;还有一种高考志愿填报参考系统通过高考分数与全省位次选大学两个方面进行院校录取的概率计算。提供院校大全、专业大全与职业大全等信息,并为考生提供性格兴趣测试推荐专业,根据考生的成绩提供同等分数学生院校去向信息,其不能提供院校专业的录取概率,智能提供被院校录取的概率。
在上述高考志愿填报参考平台中,考生通过高考分数直接估算录取概率的方法通常存在较大的误差,并且院校通常公布的都是录取批次线,而不同的专业录取分数通常相差较大,因此通过院校分数线预测录取概率是在很大可能性被院校调剂的范畴进行的志愿评估。
发明内容
针对现有技术中的上述不足,本发明提供的高考志愿录取概率模型的建立方法解决了现有高考志愿推荐系统中只能对报考院校录取概率进行分析,不能提供某一确定专业录取概率的问题。
为了达到上述发明目的,本发明采用的技术方案为:
本发明的有益效果为:本发明提供的高考志愿录取概率模型的建立方法,里用位次分析法处理历年高考分数,消除了不同年份分数波动的影响;提供了精确到全国高校各专业的录取概率,解决了同一高校不同专业录取分数不同影响录取概率预测的问题,降低了高分低录、高分不录的风险。
附图说明
图1为本发明提供的实施例中高考志愿录取概率模型的建立方法实现流程图。
图2为本发明提供的实施例中计算等效分数概率密度函数的方法实现流程图。
图3为本发明提供的实施例中对等效分数概率密度函数进行可信度计算的方法实现流程图。
图4为本发明提供的实施例中高考分数录取概率对应统计图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,一种高考志愿录取概率模型的建立方法,包括以下步骤:
S1、根据确定的参考年份,对其高考分数进行预处理,将历年高考分数转化为待测年份对应的等效分数;
上述步骤S1中:
预测待测年份的录取概率主要依靠历年的录取数据,但是历年的分数会根据实体的难度和考生的整体水平而有所波动,所以首先需要将历年的高考分数转化为待测年份的等效分数。
借鉴金融数学中“折现”的思想,将参考年份的高考分数通过位次转化为待测年份的等效分数。其中,待转化的历年高考分数称为原始分数,转化到待测年份的分数称为原始分数的等效分数。
其具体转化方法为:
查找参考年份中原始分数的一卡一段信息表,确定原始分数在参考年份中的位次;然后,查找待测年份的一卡一段信息表,确定和原始分数为相同位次的分数,该分数为待测年份中原始分数的等效分数;转化为待测年份中待测学校待测专业对应的等效分数组成序列
Figure GDA0003769546070000031
假设
Figure GDA0003769546070000032
为某学校某专业在参考年份j所录取的所有nj名学生的高考原始分数,将原始分数转化到待测年份的等效分数
Figure GDA0003769546070000033
例如,将2018年视为待测年份,去其前3年的分数作为参考,则j=2017,2016,2015,而各年度的原始分数分别为:
Figure GDA0003769546070000041
Figure GDA0003769546070000042
Figure GDA0003769546070000043
转化到2018年后的等效分数分别为:
Figure GDA0003769546070000044
Figure GDA0003769546070000045
Figure GDA0003769546070000046
将所有等效分数合并为一个序列为,
Figure GDA0003769546070000047
统一将其表示为等效分数序列
Figure GDA0003769546070000048
S2、对等效分数进行概率密度估计,并计算概率密度函数的可信度;
大量数据表明,高考分数总体是负荷正态分布的,所以假设序列
Figure GDA0003769546070000049
也符合正态分布,以下估计序列
Figure GDA00037695460700000410
的概率密度函数;根据最大似然估计法,正态分布的均值和方差的最大似然估计量分别为:
Figure GDA00037695460700000411
Figure GDA00037695460700000412
由此,可以来估计序列
Figure GDA00037695460700000413
的概率密度函数。
如图2所示,由此上述步骤S2具体为:
S21、计算等效分数序列里的样本均值
Figure GDA00037695460700000414
Figure GDA00037695460700000415
式中,n为等效分数样本的数据总数,i为第i个等效分数
Figure GDA00037695460700000416
的下标;
S22、计算等效分数序列里的样本标准差
Figure GDA00037695460700000417
Figure GDA00037695460700000418
S23、根据均值和标准差,计算得到等效分数序列的概率密度估计函数;
Figure GDA0003769546070000051
式中,ρ(.)表示估计出的概率密度函数;
为了得到等效分数序列的概率密度函数的可信度,需要对等效分数均值和方差在合适的置信度下进行区间估计,合适的置信度即是等效分数概率密度函数的可信度;
如图3所示,对上述概率密度估计函数进行可信度计算的方法具体为:
A1、对等效分数序列的样本均值
Figure GDA0003769546070000052
构造服从自由度n-1的t分布统计量;
Figure GDA0003769546070000053
其中,
Figure GDA0003769546070000054
为总体均值的无偏估计,且
Figure GDA0003769546070000055
A2、对等效分数序列的样本方差
Figure GDA0003769546070000056
构造服从自由度n-1的χ2分布统计量;
Figure GDA0003769546070000057
其中,S为总体方差的无偏估计,
Figure GDA0003769546070000058
A3、设定α=0.05;
A4、计算得出等效分数序列的均值
Figure GDA0003769546070000059
和方差
Figure GDA00037695460700000510
的显著水平为1-α的置信区间;
所述等效分数序列的均值
Figure GDA00037695460700000511
的显著水平为1-α的置信区间为:
Figure GDA00037695460700000512
所述等效分数序列的方差
Figure GDA00037695460700000513
的显著水平为1-α的置信区间为:
Figure GDA0003769546070000061
A5、判断均值
Figure GDA0003769546070000062
与置信区间Aμ,方差
Figure GDA0003769546070000063
与置信区间
Figure GDA0003769546070000064
的关系,若
Figure GDA0003769546070000065
Figure GDA0003769546070000066
进入步骤A6;否则令α=α+0.05,并返回步骤A4;
A6、得到等效分数概率密度函数的可信度为1-α。
S3、根据等效分数及其概率密度估计,得到对应的不同分数段的录取概率模型。
上述步骤S3具体为:
设定上述序列
Figure GDA0003769546070000067
中,序列最小值为
Figure GDA0003769546070000068
序列均值为
Figure GDA0003769546070000069
序列最大值为
Figure GDA00037695460700000610
且确定高考分数最低分和最高分分别为0分和750分;
根据等效分数概率密度函数分别计算出0、
Figure GDA00037695460700000611
和750分处的概率,得到各个分数段的录取概率分别为:
Figure GDA00037695460700000612
Figure GDA00037695460700000613
Figure GDA00037695460700000614
Figure GDA00037695460700000615
Figure GDA00037695460700000616
得到高考志愿录取概率模型为:
Figure GDA0003769546070000071
式中,
Figure GDA0003769546070000072
为待测年份分数s的等效分概率。
在本发明的一个实施例中,提供了本发明方法对高考分数录取概率计算的实例:某学校某专业2014年、2015年和2016年在四川省录取的所有分数如表1所示;
表1:某学校某专业2014年、2015年和2016年在四川省录取的所有分数统计
Figure GDA0003769546070000073
根据2014年、2015年、2016年和2017年四川省一卡一段信息表得到它们在2017年的等效分数如表2所示;
表2:2014年、2015年、2016年在2017年等效分数统计
Figure GDA0003769546070000074
得到等效分数序列如表3所示;
表3:2017年等效分数序列
Figure GDA0003769546070000081
Figure GDA0003769546070000082
标准化处理并进行正态分布概率估计得到
Figure GDA0003769546070000083
然后,根据录取概率计算公式P(s)可以计算出任何一个分数s在2017年被该专业录取的概率;考虑0-750分的范围,得到如图4所示的高考分数录取概率对应统计。如表4所示,从450到600分,以20分为一级的分数在某学校某专业录取的概率;
表4:以20分为一级的分数在某学校某专业录取的概率
高考分数 450 460 470 480 490 500
录取概率 0.4742 0.4883 0.5086 0.5368 0.5740 0.6210
高考分数 510 520 530 540 550 560
录取概率 0.6778 0.7432 0.8153 0.8911 0.9086 0.9179
高考分数 570 580 590 600
录取概率 0.9264 0.9339 0.9402 0.9452
本发明的有益效果为:本发明提供的高考志愿录取概率模型的建立方法中用位次分析法处理历年高考分数,消除了不同年份分数波动的影响;提供了精确到全国高校各专业的录取概率,解决了同一高校不同专业录取分数不同影响录取概率预测的问题,降低了高分低录、高分不录的风险。

Claims (2)

1.一种高考志愿录取概率模型的建立方法,其特征在于,包括以下步骤:
S1、根据确定的参考年份,对其高考分数进行预处理,将历年高考分数转化为待测年份对应的等效分数;
S2、对等效分数进行概率密度估计,并计算概率密度函数的可信度;
S3、根据等效分数及其概率密度估计,得到对应的不同分数段的录取概率模型;
所述步骤S1具体为:
将所述参考年份的高考分数作为原始分数;
查找参考年份中原始分数的一卡一段信息表,确定原始分数在参考年份中的位次;然后,查找待测年份的一卡一段信息表,确定和原始分数为相同位次的分数,该分数为待测年份中原始分数的等效分数;
转化为待测年份中待测学校中待测专业对应等效分数组成序列
Figure FDA0003792764150000011
所述步骤S2中,对所述概率密度函数进行可信度计算的方法具体为:
A1、对等效分数序列的样本均值
Figure FDA0003792764150000012
构造服从自由度n-1的t分布统计量;
Figure FDA0003792764150000013
其中,
Figure FDA0003792764150000014
为总体均值的无偏估计,且
Figure FDA0003792764150000015
A2、对等效分数序列的样本方差
Figure FDA0003792764150000016
构造服从自由度n-1的χ2分布统计量;
Figure FDA0003792764150000017
其中,S为总体方差的无偏估计,
Figure 1
A3、设定α=0.05;
A4、计算得出等效分数序列的均值
Figure FDA0003792764150000021
和方差
Figure FDA0003792764150000022
的显著水平为1-α的置信区间;
所述等效分数序列的均值
Figure FDA0003792764150000023
的显著水平为1-α的置信区间为:
Figure FDA0003792764150000024
所述等效分数序列的方差
Figure FDA0003792764150000025
的显著水平为1-α的置信区间为:
Figure FDA0003792764150000026
A5、判断均值
Figure FDA0003792764150000027
与置信区间Aμ,方差
Figure FDA0003792764150000028
与置信区间
Figure FDA0003792764150000029
的关系,若
Figure FDA00037927641500000210
Figure FDA00037927641500000211
进入步骤A6;否则令α=α+0.05,并返回步骤A4;
A6、得到等效分数概率密度函数的可信度为1-α;
所述步骤S3具体为:
设定所述序列
Figure FDA00037927641500000212
中,序列最小值为
Figure FDA00037927641500000213
序列均值为
Figure FDA00037927641500000214
序列最大值为
Figure FDA00037927641500000215
且确定高考分数最低分和最高分分别为0分和750分;
根据等效分数概率密度函数ρ(x)分别计算出0、
Figure FDA00037927641500000216
和750分处的概率,得到各个分数段的录取概率分别为:
Figure FDA00037927641500000217
Figure FDA00037927641500000218
Figure FDA00037927641500000219
Figure FDA00037927641500000220
Figure FDA00037927641500000221
得到高考志愿录取概率模型为:
Figure FDA0003792764150000031
式中,
Figure FDA0003792764150000032
为待测年份分数s的等效分概率,t为年份。
2.根据权利要求1所述的高考志愿录取概率模型的建立方法,其特征在于,所属步骤S2中,等效分数符合正态分布;
对等效分数进行概率密度估计的方法具体为:
S21、计算等效分数序列里的样本均值
Figure FDA0003792764150000033
Figure FDA0003792764150000034
式中,n为等效分数样本的数据总数,i为第i个等效分数
Figure FDA0003792764150000035
的下标;
S22、计算等效分数序列里的样本标准差
Figure FDA0003792764150000036
Figure FDA0003792764150000037
S23、根据均值和标准差,计算得到等效分数序列的概率密度估计函数;
Figure FDA0003792764150000038
式中,ρ(.)表示估计出的概率密度函数。
CN201810650474.9A 2018-06-22 2018-06-22 一种高考志愿录取概率模型的建立方法 Active CN108874749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810650474.9A CN108874749B (zh) 2018-06-22 2018-06-22 一种高考志愿录取概率模型的建立方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810650474.9A CN108874749B (zh) 2018-06-22 2018-06-22 一种高考志愿录取概率模型的建立方法

Publications (2)

Publication Number Publication Date
CN108874749A CN108874749A (zh) 2018-11-23
CN108874749B true CN108874749B (zh) 2022-10-14

Family

ID=64340850

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810650474.9A Active CN108874749B (zh) 2018-06-22 2018-06-22 一种高考志愿录取概率模型的建立方法

Country Status (1)

Country Link
CN (1) CN108874749B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632470A (zh) * 2020-12-23 2021-04-09 浙江萃文科技有限公司 一种基于umput的概率检验的高考录取概率建立方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03235550A (ja) * 1990-02-13 1991-10-21 Nippon Telegr & Teleph Corp <Ntt> セル廃棄率推定方法、ならびに、これを用いた呼受付制御装置およびバッファリンク設計装置
CN102603893A (zh) * 2007-01-05 2012-07-25 苏黎世大学 提供疾患特异性结合分子和靶的方法
CN106558001A (zh) * 2016-11-16 2017-04-05 上海市风华中学 一种高中生生涯发展规划系统
CN107784609A (zh) * 2017-10-26 2018-03-09 贵州尧米科技有限公司 学生信息管理方法、装置及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100226997B1 (ko) * 1997-06-30 1999-10-15 김영환 트래픽 모니터링 기반 고속 호출허용 제어방법 및장치
CN105913350A (zh) * 2016-03-31 2016-08-31 成都文儒德教育科技有限公司 一种基于位点法的高考志愿填报决策方法及系统
CN105956968A (zh) * 2016-05-26 2016-09-21 程欧亚 一种高考志愿人工智能填报系统及方法
CN106599271A (zh) * 2016-12-22 2017-04-26 江苏方天电力技术有限公司 一种燃煤机组排放监测时序数据异常值检测方法
CN107038665A (zh) * 2017-04-21 2017-08-11 西安电子科技大学 一种输出录取概率的方法、推荐志愿高校的方法及装置
CN108154269A (zh) * 2017-12-27 2018-06-12 武汉米奈希尔科技有限公司 一种基于正态分布概率模型的高校投档分数线预测方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03235550A (ja) * 1990-02-13 1991-10-21 Nippon Telegr & Teleph Corp <Ntt> セル廃棄率推定方法、ならびに、これを用いた呼受付制御装置およびバッファリンク設計装置
CN102603893A (zh) * 2007-01-05 2012-07-25 苏黎世大学 提供疾患特异性结合分子和靶的方法
CN106558001A (zh) * 2016-11-16 2017-04-05 上海市风华中学 一种高中生生涯发展规划系统
CN107784609A (zh) * 2017-10-26 2018-03-09 贵州尧米科技有限公司 学生信息管理方法、装置及系统

Also Published As

Publication number Publication date
CN108874749A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
Lohr et al. Combining survey data with other data sources
Morrison A comparison of procedures for the calculation of forensic likelihood ratios from acoustic–phonetic data: Multivariate kernel density (MVKD) versus Gaussian mixture model–universal background model (GMM–UBM)
Horowitz Identification and diagnosis of specification errors in the multinomial logit model
CN111343147B (zh) 一种基于深度学习的网络攻击检测装置及方法
Popli et al. Educational attainment and wage inequality in Turkey
Gascón et al. Statistical postprocessing of dual‐resolution ensemble precipitation forecasts across Europe
Fauer et al. Flexible and consistent quantile estimation for intensity–duration–frequency curves
CN112948823A (zh) 一种数据泄露风险评估方法
CN113657449A (zh) 一种含噪标注数据的中医舌象腐腻分类方法
CN108874749B (zh) 一种高考志愿录取概率模型的建立方法
CN112016618A (zh) 一种用于对图像语义分割模型泛化能力的度量方法
Baran et al. Statistical post‐processing of heat index ensemble forecasts: is there a royal road?
CN110515836A (zh) 一种面向软件缺陷预测的加权朴素贝叶斯方法
Williams Building hydrologic foundations for applications of ELOHA: How long a record should you have?
CN113889274B (zh) 一种孤独症谱系障碍的风险预测模型构建方法及装置
Smith Objective quality control and performance diagnostics of an oceanic subsurface thermal analysis scheme
CN113673609B (zh) 一种基于线性隐变量的调查问卷数据分析方法
CN112732908B (zh) 试题新颖度评估方法、装置、电子设备和存储介质
Galvão et al. Real‐Time Perceptions of Historical GDP Data Uncertainty
Antonia Silles The effects of language skills on the economic assimilation of female immigrants in the United States
Hampden-Thompson et al. Statistics in Brief: Course Credit Accrual and Dropping Out of High School, by Student Characteristics, February 2009. NCES 2009-035.
CN114819260A (zh) 一种水文时间序列预测模型动态生成方法
CN111861033A (zh) 一种带有白噪声的高考录取概率预测方法
Ashmead et al. Small area model diagnostics and validation with applications to the Voting Rights Act, Section 203
Gonçalves et al. Unit level model for small area estimation with count data under square root transformation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant