CN117290610B - 一种高校招生信息推荐方法和系统 - Google Patents
一种高校招生信息推荐方法和系统 Download PDFInfo
- Publication number
- CN117290610B CN117290610B CN202311577020.0A CN202311577020A CN117290610B CN 117290610 B CN117290610 B CN 117290610B CN 202311577020 A CN202311577020 A CN 202311577020A CN 117290610 B CN117290610 B CN 117290610B
- Authority
- CN
- China
- Prior art keywords
- institution
- score line
- predicted
- prediction
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000007115 recruitment Effects 0.000 title claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 31
- 238000012360 testing method Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及招生推荐领域,提供了一种高校招生信息推荐方法和系统,包括,获取院校数据集L中的学校名称;以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K‑means算法进行院校推荐,准确率高且推荐信息全面。
Description
技术领域
本发明涉及招生推荐领域,特别是指一种高校招生信息推荐方法和系统。
背景技术
由于近几年来,高考政策变化大、每年试题难度不统一等因素,以及部分院校扩招、某些院校的报考热度忽高忽低,导致录取分数线波动大。
如果仅仅根据往年的院校录取分数线推荐院校,会与当年实际录取情况出现大差异,容易给考生造成一定误解,甚至给出错误的选择,严重影响考生志愿填报的准确性。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种高校招生信息推荐,利用多种预测模型对院校录取分数线进行预测,根据预测的院校录取分数线利用改进的K-means算法进行多层次院校推荐,准确率高且推荐信息全面。
本发明采用的技术方案,
一种高校招生信息推荐方法,包括,
获取院校数据集L中的学校名称;
以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;
通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;
输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;
根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐。
具体地,通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择,所述后验差法具体为:
设e(i)为原始数列x(i)和预测数列x’(i)的残差,即e(i)=x(i)-x’(i);
后验差比C公式为:
C=S2/S1;
其中,S1为原始数列的标准差,S2是预测数列的残差的标准差;
小误差概率P公式为:
P=P{|e(i)-E|}<0.6745S1;
其中,E为残差的均值;
利用后验差比和小误差概率P进行精度检验,选择精度高的模型预测结果作为预测录取分数线。
具体地,利用后验差比和小误差概率P进行精度检验,具体为:
首先对比后验差比C的值,选择值小的预测结果作为最终的院录取分数线预测值,如果后验差比C的值相同,则通过小误差概率P进行精度检验,选择P值大的预测结果作为最终的录取分数线预测值。
具体地,根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:
SS1:在数据集D中随机选取一个院校预测分数线点a1作为初始质心;
SS2:计算数据集D中每一个院校录取分数线点与当前质心的欧式距离的d(r),;
SS3:根据的概率选取新的质心;
SS4重复步骤SS2-SS3,直至获取K个质心;
SS5:对于K个质心再采用K-means算法得到聚类结果。
具体地,根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:在得到聚类结果后,
采用欧式距离公式计算应届考生高考分数点与聚类结果中各簇心的距离,选择距离最小的簇A,并计算应届考生高考分数点与簇A中所有数据点的距离;
按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级;
以不同的层级进行院校推荐。
具体地,按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级,具体为:
Sort(A)
t=len(Aj)/3
u=len(Aj)%3
Aj表簇A中第j个数据点;(0,t+u)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险低”的层级;当j∈(t+u+1,2t)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险中”的层级;当j∈(2t+1,3t)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险高”的层级。
本发明实施例另一方面提供一种高校招生信息推荐系统,包括,
院校数据集获取单元:获取院校数据集L中的学校名称;
院校录取分数线预测单元:以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;
预测分数线校验单元:通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;
录取分数线数据集获取单元:输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;
院校推荐单元:根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐。
本发明再一方面提供一种电子设备,包括:存储器,处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现上述一种高校招生信息推荐方法步骤。
本发明又一方面提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述一种高校招生信息推荐方法步骤。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
本发明提供了一种高校招生信息推荐方法,包括,获取院校数据集L中的学校名称;以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐;本发明提出了一种高校招生信息推荐系统,利用多种预测模型对院校录取分数线进行预测,根据预测的院校录取分数线利用改进的K-means算法进行多层次院校推荐,准确率高且推荐信息全面。
附图说明
图1为本发明实施例提供的一种高校招生信息推荐方法流程图;
图2本发明实施例提供的一种高校招生信息推荐系统的框架图;
图3为本发明实施例提供的一种电子设备示意图;
图4为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
以下结合附图和具体实施例对本发明作进一步详述。
具体实施方式
本发明提出了一种高校招生信息推荐方法,利用多种预测模型对院校录取分数线进行预测,根据预测的院校录取分数线利用改进的K-means算法进行多层次院校推荐,准确率高且推荐信息全面。
如图1,为一种高校招生信息推荐方法流程图,具体方法如下:
一种高校招生信息推荐方法,包括,
S101:获取院校数据集L中的学校名称;
S102:以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;
预测模型中,常用的预测模型有GM(1,1)预测模型、GM(1,n)预测模型和Verhulst预测模型。其中GM(1,1)预测模型用于对无规则的数据序列进行处理,从而得到具有一定规律的序列,以曲线进行逼近,最终得到预测结果GM(1,n)预测模型适合处理多维数据。本发明输入的数据只有一维的录取分数线,因此采用GM(1,1)预测模型预测各院校的录取分数线。Verhulst预测模型适用于处理呈S型增长的数据,S型增长是指数据前期呈指数增长,当周围环境变化时,增长速度逐渐放慢,最终稳定在一个固定值。由于部分院校扩招、某些院校的报考热度忽高忽低,导致录取分数线波动大,因此评估具体的应用场景特点,本发明同时采用Verhulst预测模型同时对各院校的录取分数线进行预测;再对GM(1,1)预测模型的预测结果和Verhulst预测模型的预测结果校验,准确率大大提高。
S103:通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;
设e(i)为原始数列x(i)和预测数列x’(i)的残差,即e(i)=x(i)-x’(i);
后验差比C公式为:
C=S2/S1;
其中,S1为原始数列的标准差,S2是预测数列的残差的标准差;
小误差概率P公式为:
P=P{|e(i)-E|}<0.6745S1;
其中,E为残差的均值;
利用后验差比和小误差概率P进行精度检验,选择精度高的模型预测结果作为预测录取分数线。
具体地,利用后验差比和小误差概率P进行精度检验,具体为:
首先对比后验差比C的值,选择值小的预测结果作为最终的院录取分数线预测值,如果后验差比C的值相同,则通过小误差概率P进行精度检验,选择P值大的预测结果作为最终的录取分数线预测值。
一般后验差比C小于0.35为良好,小误差概率P大于0.95为良好;后验差比C大于0.65为不及格,小误差概率P小于0.7为不及格。
S104:输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;
S105:根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐。
具体地,根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:
SS1:在数据集D中随机选取一个院校预测分数线点a1作为初始质心;
SS2:计算数据集D中每一个院校录取分数线点与当前质心的欧式距离的d(r),;
SS3:根据的概率选取新的质心;
SS4重复步骤SS2-SS3,直至获取K个质心;
SS5:对于K个质心再采用K-means算法得到聚类结果。
具体地,根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:在得到聚类结果后,
采用欧式距离公式计算应届考生高考分数点与聚类结果中各簇心的距离,选择距离最小的簇A,并计算应届考生高考分数点与簇A中所有数据点的距离;
按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级;
以不同的层级进行院校推荐。
具体地,按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级,具体为:
Sort(A)
t=len(Aj)/3
u=len(Aj)%3
Aj表簇A中第j个数据点;(0,t+u)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险低”的层级;当j∈(t+u+1,2t)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险中”的层级;当j∈(2t+1,3t)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险高”的层级。
例如,某考生的高考分数为520分。首先选择K值为6,通过K-means++算法计算得到6个簇心,分别为349、437、505、568、627和665。与该考生的高考分数距离最近的簇心是505,该簇的区间为(478,532)。计算该分数与簇中所有数据点的距离len(Aj)。预测录取分数线为502的数据点排在34位,且len(B34)为63,则t为21,u为0,则预测录取分数线为502的院校以“风险中”的层级进行推荐。
K-means算法可以简单高效的对数据型的数据进行聚类,但是存在如下问题:一旦初始点选择不恰当,容易导致聚类时间增加和聚类精度降低。为了解决初始点难以准确选择的问题,本发明提出了改进的K-means算法进行优化,改进的K-means的聚类效果远优于K-means算法。
如图2为一种高校招生信息推荐系统架构图,具体包括:
院校数据集获取单元201:获取院校数据集L中的学校名称;
院校录取分数线预测单元202:以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;
预测模型中,常用的预测模型有GM(1,1)预测模型、GM(1,n)预测模型和Verhulst预测模型。其中GM(1,1)预测模型用于对无规则的数据序列进行处理,从而得到具有一定规律的序列,以曲线进行逼近,最终得到预测结果GM(1,n)预测模型适合处理多维数据。本发明输入的数据只有一维的录取分数线,因此采用GM(1,1)预测模型预测各院校的录取分数线。Verhulst预测模型适用于处理呈S型增长的数据,S型增长是指数据前期呈指数增长,当周围环境变化时,增长速度逐渐放慢,最终稳定在一个固定值。由于部分院校扩招、某些院校的报考热度忽高忽低,导致录取分数线波动大,因此评估具体的应用场景特点,本发明同时采用Verhulst预测模型同时对各院校的录取分数线进行预测;再对GM(1,1)预测模型的预测结果和Verhulst预测模型的预测结果校验,准确率大大提高。
预测分数线校验单元203:通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;
设e(i)为原始数列x(i)和预测数列x’(i)的残差,即e(i)=x(i)-x’(i);
后验差比C公式为:
C=S2/S1;
其中,S1为原始数列的标准差,S2是预测数列的残差的标准差;
小误差概率P公式为:
P=P{|e(i)-E|}<0.6745S1;
其中,E为残差的均值;
利用后验差比和小误差概率P进行精度检验,选择精度高的模型预测结果作为预测录取分数线。
具体地,利用后验差比和小误差概率P进行精度检验,具体为:
首先对比后验差比C的值,选择值小的预测结果作为最终的院录取分数线预测值,如果后验差比C的值相同,则通过小误差概率P进行精度检验,选择P值大的预测结果作为最终的录取分数线预测值。
一般后验差比C小于0.35为良好,小误差概率P大于0.95为良好;后验差比C大于0.65为不及格,小误差概率P小于0.7为不及格。
录取分数线数据集获取单元204:输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;
院校推荐单元205:根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐。
具体地,根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:
SS1:在数据集D中随机选取一个院校预测分数线点a1作为初始质心;
SS2:计算数据集D中每一个院校录取分数线点与当前质心的欧式距离的d(r),;
SS3:根据的概率选取新的质心;
SS4重复步骤SS2-SS3,直至获取K个质心;
SS5:对于K个质心再采用K-means算法得到聚类结果。
具体地,根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:在得到聚类结果后,
采用欧式距离公式计算应届考生高考分数点与聚类结果中各簇心的距离,选择距离最小的簇A,并计算应届考生高考分数点与簇A中所有数据点的距离;
按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级;
以不同的层级进行院校推荐。
具体地,按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级,具体为:
Sort(A)
t=len(Aj)/3
u=len(Aj)%3
Aj表簇A中第j个数据点;(0,t+u)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险低”的层级;当j∈(t+u+1,2t)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险中”的层级;当i∈(2t+1,3t)时,预测分数线数据点xi对应的院校处于推荐列表中的“风险高”的层级。
例如,某考生的高考分数为520分。首先选择K值为6,通过K-means++算法计算得到6个簇心,分别为349、437、505、568、627和665。与该考生的高考分数距离最近的簇心是505,该簇的区间为(478,532)。计算该分数与簇中所有数据点的距离len(Aj)。预测录取分数线为502的数据点排在34位,且len(B34)为63,则t为21,u为0,则预测录取分数线为502的院校以“风险中”的层级进行推荐。
图3所示,本发明实施例提供了一种电子设备300,包括存储器310、处理器320及存储在存储器310上并可在处理器320上运行的计算机代码311,处理器320执行计算机代码311时实现本发明实施例提供的一种高校招生信息推荐方法。
由于本实施例所介绍的电子设备为实施本发明实施例中所采用的设备,故而基于本发明实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍,只要本领域所属技术人员实施本发明实施例中的方法所采用的设备,都属于本发明所欲保护的范围。
请参阅图4,图4为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
如图4所示,本实施例提供了一种计算机可读存储介质400,其上存储有计算机程序411,该计算机程序411被处理器执行时实现本发明实施例提供的一种高校招生信息推荐方法。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明提供了一种高校招生信息推荐方法,包括,获取院校数据集L中的学校名称;以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐;本发明提出了一种高校招生信息推荐方法,利用多种预测模型对院校录取分数线进行预测,根据预测的院校录取分数线利用改进的K-means算法进行多层次院校推荐,准确率高且推荐信息全面。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上所述仅是本申请的具体实施方式,使本领域技术人员能够理解或实现本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均属于侵犯本发明保护范围的行为。
Claims (6)
1.一种高校招生信息推荐方法,其特征在于,包括,
获取院校数据集L中的学校名称;
以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;
通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;
输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;
根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐;具体为:
SS1:在数据集D中随机选取一个院校预测分数线点a1作为初始质心;
SS2:计算数据集D中每一个院校录取分数线点与当前质心的欧式距离的d(r),;SS3:根据/>的概率选取新的质心,其中/>为设定的选取新质心的概率;
SS4重复步骤SS2-SS3,直至获取K个质心;
SS5:对于K个质心再采用K-means算法得到聚类结果。
2.根据权利要求1所述的一种高校招生信息推荐方法,其特征在于,通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择,所述后验差法具体为:
设e(i)为原始数列x(i)和预测数列x’(i)的残差,即e(i)=x(i)-x’(i);
后验差比C公式为:
C=S2/S1;
其中,S1为原始数列的标准差,S2是预测数列的残差的标准差;
小误差概率P公式为:
P=P{|e(i)-E|}<0.6745S1;
其中,E为残差的均值;
利用后验差比和小误差概率P进行精度检验,选择精度高的模型预测结果作为预测录取分数线。
3.根据权利要求2所述的一种高校招生信息推荐方法,其特征在于,利用后验差比和小误差概率P进行精度检验,具体为:
首先对比后验差比C的值,选择值小的预测结果作为最终的院录取分数线预测值,如果后验差比C的值相同,则通过小误差概率P进行精度检验,选择P值大的预测结果作为最终的录取分数线预测值。
4.根据权利要求3所述的一种高校招生信息推荐方法,其特征在于,根据院校预测录取分数线数据集D应届考生高考分数,利用改进的K-means算法进行院校推荐,具体为:在得到聚类结果后,
采用欧式距离公式计算应届考生高考分数点与聚类结果中各簇心的距离,选择距离最小的簇A,并计算应届考生高考分数点与簇A中所有数据点的距离;
按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级;
以不同的层级进行院校推荐。
5.根据权利要求4所述的一种高校招生信息推荐方法,其特征在于,按照距离大小对簇中的数据点进行排序并对排序结果进行划分层级,具体为:
Sort(A)
t=len(Aj)/3
u=len(Aj)%3
Aj表簇A中第j个数据点;len(Aj)表示为Aj在簇A中所有数据点的排位数,%是除法取余运算,t为排序第一节点,u为排序第二节点,(0,t+u)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险低”的层级;当j∈(t+u+1,2t)时,预测分数线数据点xj应的院校处于推荐列表中的“风险中”的层级;当j∈(2t+1,3t)时,预测分数线数据点xj对应的院校处于推荐列表中的“风险高”的层级。
6.一种高校招生信息推荐系统,其特征在于,包括,
院校数据集获取单元:获取院校数据集L中的学校名称;
院校录取分数线预测单元:以各院校近四年的录取分数线作为输入,分别通过GM(1,1)预测模型和Verhulst预测模型对各院校录取分数线进行预测;
预测分数线校验单元:通过后验差法对各院校的GM(1,1)模型预测结果和Verhulst模型预测结果进行检验并择优选择;
录取分数线数据集获取单元:输出各院校所对应的预测录取分数线,得到院校预测录取分数线数据集D;
院校推荐单元:根据院校预测录取分数线数据集D、应届考生高考分数,利用改进的K-means算法进行院校推荐;院校推荐单元实现具体为:
SS1:在数据集D中随机选取一个院校预测分数线点a1作为初始质心;
SS2:计算数据集D中每一个院校录取分数线点与当前质心的欧式距离的d(r),;
SS3:根据的概率选取新的质心,其中/>为设定的选取新质心的概率;
SS4重复步骤SS2-SS3,直至获取K个质心;
SS5:对于K个质心再采用K-means算法得到聚类结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311577020.0A CN117290610B (zh) | 2023-11-24 | 2023-11-24 | 一种高校招生信息推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311577020.0A CN117290610B (zh) | 2023-11-24 | 2023-11-24 | 一种高校招生信息推荐方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117290610A CN117290610A (zh) | 2023-12-26 |
CN117290610B true CN117290610B (zh) | 2024-02-09 |
Family
ID=89258912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311577020.0A Active CN117290610B (zh) | 2023-11-24 | 2023-11-24 | 一种高校招生信息推荐方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117290610B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358318A (zh) * | 2017-06-29 | 2017-11-17 | 上海电力学院 | 基于GM(1,1)模型和灰色Verhulst模型的城市用电量预测方法 |
CN108875126A (zh) * | 2018-04-27 | 2018-11-23 | 中国航空无线电电子研究所 | 电解电容剩余寿命预测方法 |
CN111259340A (zh) * | 2020-01-16 | 2020-06-09 | 天津大学 | 一种基于logistic回归的饱和负荷预测方法 |
CN113761376A (zh) * | 2021-09-10 | 2021-12-07 | 广东德诚科教有限公司 | 一种新高考模式下的志愿推荐方法、装置及计算机设备 |
CN116244504A (zh) * | 2022-12-29 | 2023-06-09 | 黄泽鑫 | 一种用于辅助高考志愿填报方案的推荐方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11410210B2 (en) * | 2020-02-13 | 2022-08-09 | Intuit Inc. | System and method for predicting personalized payment screen architecture |
-
2023
- 2023-11-24 CN CN202311577020.0A patent/CN117290610B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107358318A (zh) * | 2017-06-29 | 2017-11-17 | 上海电力学院 | 基于GM(1,1)模型和灰色Verhulst模型的城市用电量预测方法 |
CN108875126A (zh) * | 2018-04-27 | 2018-11-23 | 中国航空无线电电子研究所 | 电解电容剩余寿命预测方法 |
CN111259340A (zh) * | 2020-01-16 | 2020-06-09 | 天津大学 | 一种基于logistic回归的饱和负荷预测方法 |
CN113761376A (zh) * | 2021-09-10 | 2021-12-07 | 广东德诚科教有限公司 | 一种新高考模式下的志愿推荐方法、装置及计算机设备 |
CN116244504A (zh) * | 2022-12-29 | 2023-06-09 | 黄泽鑫 | 一种用于辅助高考志愿填报方案的推荐方法及系统 |
Non-Patent Citations (2)
Title |
---|
灰色系统残差与Verhulst模型预测恶性肿瘤死亡;孙彬;何穗智;;预防医学情报杂志(第08期);全文 * |
袁磊 ; 童迦伟 ; 杨伟鹏 ; 吴昊远 ; 吕奕鹏 ; 段光锋 ; .GM(1,1)和Verhulst模型在三级医院门急诊量预测中的应用比较.解放军医院管理杂志.2019,(第02期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN117290610A (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645581B2 (en) | Meaningfully explaining black-box machine learning models | |
US10685044B2 (en) | Identification and management system for log entries | |
JP7169369B2 (ja) | 機械学習アルゴリズムのためのデータを生成する方法、システム | |
Elbadrawy et al. | Domain-aware grade prediction and top-n course recommendation | |
Liu et al. | An online learning approach to improving the quality of crowd-sourcing | |
US10824951B2 (en) | System and method for rule generation using data processed by a binary classifier | |
US9292550B2 (en) | Feature generation and model selection for generalized linear models | |
US8214373B1 (en) | Systems and methods for assignment of human reviewers using probabilistic prioritization | |
US20190235987A1 (en) | Duplicate bug report detection using machine learning algorithms and automated feedback incorporation | |
CN101494557B (zh) | 用于自动识别最优属性组的方法和系统 | |
JP2009163615A (ja) | 共クラスタリング装置、共クラスタリング方法、共クラスタリングプログラム、および、そのプログラムを記録した記録媒体 | |
JP2010086179A (ja) | 情報処理装置、コンピュータプログラムおよび記録媒体 | |
KR100932843B1 (ko) | 검색결과간의 연관도에 기초하여 클러스터링된 검색결과를제공하는 방법 및 시스템 그리고 검색결과를클러스터링하는 방법 및 시스템 | |
CN112836750A (zh) | 一种系统资源分配方法、装置及设备 | |
CN109255389B (zh) | 一种装备评价方法、装置、设备及可读存储介质 | |
US7177863B2 (en) | System and method for determining internal parameters of a data clustering program | |
CN104794135B (zh) | 一种对搜索结果进行排序的方法和装置 | |
CN117290610B (zh) | 一种高校招生信息推荐方法和系统 | |
CN114077859A (zh) | 异常样本的检测方法及装置、电子设备、存储介质 | |
Pham-Toan et al. | A New Binary Adaptive Elitist Differential Evolution Based Automatic k‐Medoids Clustering for Probability Density Functions | |
CN113420153B (zh) | 一种基于话题库和事件库的专题制作方法、装置及设备 | |
US20030037016A1 (en) | Method and apparatus for representing and generating evaluation functions in a data classification system | |
JP2019079437A (ja) | 回答出力プログラム、回答出力方法および情報処理装置 | |
JP5310328B2 (ja) | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 | |
JP5310196B2 (ja) | 分類体系改正支援プログラム、分類体系改正支援装置、および分類体系改正支援方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |