CN115222081A - 学位资源预测方法、装置及计算机设备 - Google Patents
学位资源预测方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN115222081A CN115222081A CN202110405559.2A CN202110405559A CN115222081A CN 115222081 A CN115222081 A CN 115222081A CN 202110405559 A CN202110405559 A CN 202110405559A CN 115222081 A CN115222081 A CN 115222081A
- Authority
- CN
- China
- Prior art keywords
- academic
- resource
- school
- data
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 169
- 238000012549 training Methods 0.000 claims description 103
- 230000008569 process Effects 0.000 claims description 67
- 230000006870 function Effects 0.000 claims description 48
- 238000009826 distribution Methods 0.000 claims description 45
- 238000012545 processing Methods 0.000 claims description 33
- 230000033228 biological regulation Effects 0.000 claims description 29
- 230000014759 maintenance of location Effects 0.000 claims description 25
- 238000013508 migration Methods 0.000 claims description 24
- 230000005012 migration Effects 0.000 claims description 24
- 238000007781 pre-processing Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 12
- 238000007619 statistical method Methods 0.000 claims description 10
- 238000013468 resource allocation Methods 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 13
- 238000013439 planning Methods 0.000 description 13
- 238000012795 verification Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 7
- 230000007774 longterm Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 230000033001 locomotion Effects 0.000 description 6
- 230000012010 growth Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 238000005315 distribution function Methods 0.000 description 4
- 238000013179 statistical model Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000035558 fertility Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000556 factor analysis Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000013102 re-test Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Technology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提出了一种学位资源预测方法、装置及计算机设备,由于本申请预训练的学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,且校区的学位资源需求数依赖于层次结构的历史学位资源预测数据,当需要预测已知学区/校区/待建新校区等目标对象的学位资源需求情况,可以获取目标对象的一种或多种学位资源预测数据,将预处理后得到的学位资源特征参数,输入该学位资源预测模型,将快速且精准地预测出该学区和/或校区的学位资源需求数,以指导实现教育资源的合理分配和科学规划。
Description
技术领域
本申请涉及计算机技术领域,具体涉及一种学位资源预测方法、装置及计算机设备。
背景技术
为了实现教育资源合理分配和科学规划,如教育部门、政府规划部门等相关部门通常需要预测不同区域每个阶段的学龄人口,即预测该区域一段时间内的学位资源需求情况,以便据此对教育资源进行合理分配,尽量保证每个学生能够接受良好的教育,能够享受足够的校舍、教师和图书等资源。
然而,在实际应用中,受到生育政策带来的生育率的变化影响,会使得学龄人口数量和分布发生相应变化,进而影响教育资源的分配合理性。可见,如何准确性预测未来学龄人口数量及分布等学位资源,以辅助实现教育资源的合理分配和科学规划,成为技术人员亟需解决的问题。
发明内容
有鉴于此,本申请提出了如下技术方案:
一方面,本申请提出了一种学位资源预测方法,所述方法包括:
获取目标对象的学位资源预测数据;所述学位资源预测数据包括所述目标对象的人口流动数据、多维教育数据以及学区房交易数据中的至少一种;
对所述学位资源预测数据进行预处理,得到学位资源预测特征参数;
将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数;所述学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,其中,所述校区的学位资源需求数依赖于层次结构的历史学位资源预测数据;
输出所述目标对象的目标学位资源需求数。
在一些实施例中,所述学位资源预测模型包括多层概率预测模型,其中:
所述多层概率预测模型是基于层次结构的样本数据训练得到的,所述层次结构的样本数据包括不同样本学区内各样本校区的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据。
在一些实施例中,所述学位资源预测模型还包括学龄人口预测模型,所述学龄人口预测模型是依据同一样本学区内不同年龄区间各自的学位资源需求数之间的递推关系训练得到的;
其中,所述递推关系包括上一统计周期中上一年龄区间的学位资源需求数和、学龄人口留存率以及学龄人口迁入率,与本统计周期内本年龄区间的学位资源需求数之间的关系;所述学龄人口留存率和所述学龄人口迁入率依据相应年龄区间内的所述人口流动数据训练得到的。
在一些实施例中,所述多层概率预测模型的训练过程包括:
获取具有层次结构的多组样本数据;其中,所述多组样本数据包括位于不同样本学区内的不同样本校区在最新一年的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据;
对所述多组样本数据进行归一化处理,得到相应的样本特征参数;
利用得到的所述样本特征参数,对初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,将最后一次训练得到的多层贝叶斯模型确定为多层概率预测模型。
在一些实施例中,所述利用得到的所述样本特征参数,对初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,包括:
利用得到的所述样本特征参数,采用多条马尔可夫链蒙特卡洛方式,对初始多层贝叶斯模型进行学习训练,直至训练得到的多层贝叶斯模型的预测结果的偏差信息量最小。
在一些实施例中,所述初始多层贝叶斯模型中的数据子模型是依据影响不同样本校区的学位资源需求数的先验概率分布,从多个预设数据子模型中选定的;
其中,所述先验概率分布是对所述多组样本数据进行统计分析得到的;所述数据子模型是指基于所述多组样本数据中每一类样本数据,确定不同样本校区的学位资源需求数的似然估计函数;所述多个预设数据子模型包括待训练参数为函数截距的第一似然估计函数、待训练参数为函数斜率的第二似然估计函数,和/或待训练参数为函数截距和函数斜率的第三似然估计函数。
在一些实施例中,所述学龄人口预测模型的训练过程包括:
对样本学区内不同年龄的学龄人口进行分组,得到多个年龄区间;
在不同统计周期内,利用所述多个年龄区间各自的历史人口流动数据,得到相应统计周期的历史学龄人口分布向量;
确定依据上一统计周期内上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率,得到本统计周期内本年龄区间的学位资源需求数的递推关系;
依据所述递推关系,构建初始人口预测模型;
利用不同统计周期的所述历史学龄人口分布向量,对所述初始人口预测模型中各年龄区间的学龄人口迁入率和学龄人口留存率进行训练学习,直至人口预测模型的预测误差率小于第一误差阈值,确定最后一次训练得到的人口预测模型为学龄人口预测模型。
在一些实施例中,所述将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数,包括:
将不同类别的所述学位资源预测特征参数输入多层概率预测模型,得到所述目标对象的目标校区学位资源需求数;其中,若所述目标对象为目标学区,所述目标校区学位资源需求数包括所述目标学区包含的各校区的校区学位资源需求数;
将所述人口流动数据对应的学位资源预测特征参数输入学龄人口预测模型,得到所述目标对象的目标学区学位资源需求数;
所述输出所述目标对象的目标学位资源需求数,包括:
输出所述目标学区学位资源需求数和所述目标校区学位资源需求数。
在一些实施例中,所述方法还包括:
获取所述目标对象的学位资源配置数据;
将所述学位资源配置数据与目标学位资源需求数进行比较,得到学位资源比较结果;
依据所述学位资源比较结果,确定所述目标对象的学位资源调控信息,其中,所述学位资源调控信息包括目标学区学位资源缺口数,和/或目标校区学位资源缺口数,和/或针对所述目标对象的学位资源调配建议;
输出所述学位资源调控信息。
在一些实施例中,所述获取目标对象的学位资源预测数据,包括:
接收针对目标对象的学位资源查询请求;其中,所述学位资源查询请求是电子设备响应于对学位资源查询页面的输入操作生成并发送的;
响应所述学位资源查询请求,从第三方平台,获取所述目标对象的学位资源预测候选数据;
对获取的学位资源预测候选数据进行异常筛选和缺失值插补处理,得到学位资源预测数据;
所述输出所述学位资源调控信息,包括:
将所述学位资源调控信息反馈至所述电子设备,以在所述电子设备输出的所述学位资源查询页面进行展示。
在一些实施例中,若所述目标对象为目标校区,所述学位资源查询页面具有查询结果展示区域以及不同学区不同校区位置的地图展示区域,所述学位资源调控信息的展示实现方法包括:
电子设备响应于对所述地图展示区域中所述目标校区的学位资源查询选择操作,弹出校区学位资源预警面板,在所述校区学位资源预警面板展示下一年所述目标校区学位资源缺口数,以及针对所述目标校区的学位资源调配建议;其中,所述目标校区学位资源缺口数包括目标校区的班级缺口数和学龄人口缺口数;
且,在所述学位资源查询页面的查询结果展示区域内,展示所述目标校区所在目标学区在多个未来年份各自的目标学区学位资源缺口数;
其中,所述目标学区学位资源缺口数包括:相应未来年份内所述目标学区出现学位资源缺口的预警校区数,以及各预警校区的班级缺口数和学龄人口缺口数。
在一些实施例中,若所述目标对象为待建校区,所述获取目标对象的学位资源预测数据,包括:
确定所述待建校区所在的目标学区;
获取所述目标学区的学位资源预测数据;
所述将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数,输出所述目标对象的目标学位资源需求数,包括:
将所述学位资源特征参数输入多层概率预测模型,得到所述待建校区的学位资源预测数据;
将所述待建校区的学位资源预测数据发送学位资源查询平台进行展示。
又一方面,本申请还提出了一种学位资源预测装置,所述装置包括:
预测数据获取模块,用于获取目标对象的学位资源预测数据;所述学位资源预测数据包括所述目标对象的人口流动数据、多维教育数据以及学区房交易数据中的至少一种;
特征参数得到模块,用于对所述学位资源预测数据进行预处理,得到学位资源预测特征参数;
预测处理模块,用于将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数;所述学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,其中,所述校区的学位资源需求数依赖于层次结构的历史学位资源预测数据;
学位资源需求数输出模块,用于输出所述目标对象的目标学位资源需求数。
又一方面,本申请还提出了一种计算机设备,所述计算机设备包括:
通信接口;
存储器,用于存储实现如上述的学位资源预测方法的程序;
处理器,用于加载并执行所述存储器存储的程序,以实现如上述的学位资源预测方法的各步骤。
又一方面,本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行,实现如上述的学位资源预测方法的各步骤。
基于上述技术方案,本申请提出了一种学位资源预测方法、装置及计算机设备,预先训练能够表征不同样本学区和/或不同样本校区的历史学位资源预测数据,与相应样本学区或样本校区的学位资源需求数之间的依赖关系的学位资源预测模型,且样本校区的学位资源需求数依赖于层次结构的历史学位资源预测数据,以使该学位资源预测模型能够更精准预测各学区各校区的学位资源需求数。当需要预测任一学区、任一校区或待建新校区等目标对象的学位资源需求情况时,可以获取该目标对象的相应类别的学位资源预测数据,经过预处理得到相应的学位资源特征参数,输入上述学位资源预测模型,将快速且精准地预测出目标对象的学位资源需求数,以指导实现教育资源的合理分配和科学规划。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为适用于本申请提供的学位资源预测方法和装置的计算机设备的一可选示例的硬件结构示意图;
图2为适用于本申请提供的学位资源预测方法和装置的应用场景的一可选系统结构示意图;
图3为本申请提供的学位资源预测方法中,学位资源查询页面的一可选示意图;
图4为本申请提供的学位资源预测方法中,学位资源查询页面的又一可选示意图;
图5为本申请提供的学位资源预测方法的一可选示例的流程示意图;
图6为本申请提供的学位资源预测方法中,一种学位资源预测模型的可选训练实现过程的流程示意图;
图7a为本申请提供的学位资源预测方法中,一种层次结构的多组样本数据示例;
图7b为本申请提供的学位资源预测方法中,又一种层次结构的多组样本数据示例;
图8为本申请提供的学位资源预测方法中,又一种学位资源预测模型的可选训练实现过程的流程示意图;
图9为本申请提供的学位资源预测方法中,学位资源预测模型的又一可选训练实现过程的流程示意图;
图10为本申请提供的学位资源预测方法的又一可选示例的信令流程示意图;
图11为本申请提出的学位资源预测装置的一可选示例的结构示意图;
图12为本申请提出的学位资源预测装置的又一可选示例的结构示意图。
具体实施方式
针对背景技术部分描述的技术问题,本申请为了实现学位资源的预测,提出采用如基于灰度预测方法、基于时间序列的预测方法、基于逻辑回归的预测方法等统计分析方式,对入学率、学生数量、师生比、办学条件、义务教育的学位数等历史数据进行量化分析,来相应校区的学位资源需求数。
其中,基于灰度预测方法是通过对样本校区的历史数据进行累加,得到近似指数规律的样本数据,来构建学位资源预测模型,实现各校区在未来某一年的学位资源需求数。但这种方式只适用于产生近似指数增长的历史数据的校区的学位资源预测,具有极大的局限性。
而基于时间序列的预测方法也是通过对待预测校区的历史数据进行统计分析,推测待预测校区未来的发展趋势,如利用样本校区的历史数据,对初始自回归移动平均模型进行训练,得到学位资源预测模型,以实现各校区未来的学位资源需求数预测。但这种预测实现方式更适用于中短期预测,在长期预测中,若外界发生较大变化,预测结果将会出现较大偏差,且由于其模型是基于历史学位资源需求数据训练得到的,并未考虑当前阶段的其他因素对学位资源需求数的影响,导致其预测结果的精准度较低。
基于逻辑回归的预测方法,其根据不同的实际需求从如线性模型、乘幂曲线模型以及复合曲线模型等预设多个模型中选择,实现学位资源需求数的预测。所选择的模型不同得到的预测结果会存在一定差异,但无法保证所选择的模型为最合适的预测模型,也就无法保证预测结果的高精准度和可靠性。而且,该预测方法需要待预测校区的历史数据满足逻辑回归生长特点才适应,所以说,这种预测方法可适用的预测场景也具有一定局限性。
另外,对于上文描述的几种学位资源预测方法,经过研究可知,在其统计分析过程中,都是视未知参数为固定的常数,并基于目标对象(如待预测校区)的大量历史数据对总体分布进行推断预测,导致预测结果高度依赖于历史数据内容。因此,在历史数据出现偏差的情况下,将会直接导致预测结果不准确,特别是对于人口流动的面板数据,受小样本数据和自相关的影响,导致这种基于大样本数据预测总体信息的统计模型具有局限性,无法满足学位资源调控的可靠性和高精准度需求。而且,若待预测校区为新建校区,其并不存在历史数据,上述各预测方法均无法实现对该新建校区的学位资源需求数预测。
为了克服上述统计模型的局限性,提高预测结果的准确性和可靠性,降低长期预测的误差率,满足各已知学区、校区以及各新建校区的学位资源需求数的预测要求,本申请提出利用待预测区域(记为目标对象,如某一学区和/或某一校区等)的人口流动数据、多维教育数据、学区房交易数据等至少一类学位资源预测数据,来统计分析相应学区和/或相应校区的学位资源需求数,具体会考虑同一学区的不同校区之间的学位资源需求数影响特点,以及不同学区之间的学位资源需求数影响特点,来确定不同学区/校区的学位资源预测数据,与相应学区/校区的学位资源需求数之间的依赖关系,以克服小样本数据的缺陷,实现对不同学区不同校区的学位资源需求数的高精准度预测。
而且,由于校区的学位资源需求数依赖于层次结构的学位资源预测数据,而非该校区固有的历史数据,这样,即便在需要预测新建校区的学位资源需求数,本申请基于上述依赖关系预训练的学位资源预测模型,也能够更加精确地预测该新建校区的学位资源需求数;同理,对于已有校区/学区的预测需求,利用该学位资源预测模型进行统计分析,考虑到了不同校区、学区之间的相互影响,以及不同维度的学位资源预测数据,对学位资源需求数的影响,使其不仅能够高效率、精准度地预测整个学区的学位资源需求数,还能够进一步预测各学区包含的各校区的学位资源需求数,以更好地满足应用需求,如辅助实现相应区域的教育资源合理分配和科学规划。
其中,本申请依据上述依赖关系实现学位资源预测模型的构建过程,具体可以结合人工智能(ArtificialIntelligence,AI)技术实现。由于人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。所以,本申请可以依据实际需求,选择合适的机器学习/深度学习/统计分析等算法,对所构建的层次结构的样本数据进行学习训练,以提高模型训练效率及输出准确性,具体训练实现过程可以参照但并不局限于下文实施例相应部分的描述,本实施例在此不做详述。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,可以理解的是,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。应当理解,本申请中使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换该词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。以下术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
另外,本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
参照图1,为实现本申请提供的学位资源预测方法和装置的计算机设备的一可选示例的结构示意图,在实际应用中,该计算机设备可以是服务器,或者具有一定数据处理能力的终端。本申请对该计算机设备的产品类型不做限定,图1示出的计算机设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限定。
如图1所示,本实施例提出的计算机设备可以包括:通信接口11、存储器12和处理器13,其中:
通信接口11、存储器12、处理器13各自的数量可以是至少一个,且通信接口11、存储器12以及处理器13可以连接通信总线,相互之间可以通过该通信总线实现数据交互,具体实现过程可以根据实际应用需求确定,本申请不做详述。
通信接口11可以为适用于无线网络或有线网络的通信模块的接口,如GSM模块、WIFI模块、蓝牙模块、无线射频模块、5G/6G(第五代移动通信网络/第六代移动通信网络)模块等通信模块的通信接口,可以实现与其他设备的数据交互,接收其他设备发送的各种请求、事件、学位资源预测数据等信息,并将得到的目标学位资源需求数反馈至预设电子等,具体可以根据实际应用需求确定。
可以理解,上述通信接口11还可以包括如USB接口、串/并口等接口,用以实现计算机设备内部组成部件之间的数据交互。关于该通信接口11包含的接口类型及数量,可以根据该计算机设备的设备类型及其应用需求确定,本申请不做一一详述。
存储器12可以用于存储实现本申请提出的学位资源预测方法的程序;处理器13可以用于加载并执行存储器12存储的程序,以实现本申请实施例提出的学位资源预测方法的各步骤,具体实现过程可以参照但并不局限于下文实施例相应部分的描述。
本申请实施例中,存储器12可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。处理器13,可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路(application-specificintegrated circuit,ASIC)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。本申请对上述存储器12和处理器13的具体器件类型及功能不做详述。
应该理解的是,图1所示的计算机设备的结构并不构成对本申请实施例中计算机设备的限定,在实际应用中,计算机设备可以包括比图1所示的更多或更少的部件,或者组合某些部件,可以结合该计算机设备的设备类型及功能需求确定,本申请在此不做一一列举。
参照图2,为实现本申请提供的学位资源预测方法和装置的一可选应用场景的系统结构示意图,在该应用场景下,其系统可以包括多个电子设备21和计算机设备22,该计算机设备22可以通过有线或无线网络实现与电子设备21的数据交互,满足应用需求,关于该计算机设备22的组成结构及其功能,可以参照上述实施例相应部分的描述,本实施例不做赘述。
电子设备21可以是供用户查询某学区或某校区的学位资源预测结果的用户终端。在实际应用中,为了方便用户对该电子设备21进行互动操作,直观查看某学区或某校区的学位资源预测结果,甚至是基于该预测结果进一步确定的相应学区或校区的学位资源缺口数等,电子设备21具体可以是具有显示模组的终端,其可以包括但并不局限于智能手机、平板电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、台式计算机等,图2示出的电子设备仅是应用场景的示例,并不对产品类型和功能做任何限定。
基于此,在本申请实际应用中,用户可以通过电子设备21登录如智慧教育等学位资源查询平台,在显示界面展示学位资源查询页面,如图2所示,用户可以在该学位资源查询页面输入待查询的学区或校区等目标对象,以使电子设备生成针对该目标对象的学位资源查询请求,发送至如上述实施例描述的计算机设备,以获得该目标对象的目标学位资源需求数,或者是结合该目标对象的学位资源配置数据,进一步确定的目标对象的学位资源调控信息,如学区学位资源缺口数、校区学位资源缺口数、针对目标对象的学位资源调配建议等,在学位资源查询页面中的相应展示区域进行展示,具体展示方式本申请不做限制。
在一些实施例中,如图3所示的学位资源查询页面的一可选示意图,该学位资源查询页面可以包括不同学区不同校区位置的地图展示区域,在该地图展示区域内展示包含所搜索校区(学校)的地理位置地图,并在该地理位置地图中展示所搜索校区及其所在学区的地理位置,以及该学区包含的其他校区的地理位置等,本申请对地图展示区域对不同学区不同校区的地理位置的展示方式不做限制。可选的,用户可以根据实际需求,动态调整地图展示区域所展示的地理位置地图数据,如放大/缩小等,以方便用户查看不同学区/校区的地理位置分布等,具体实现过程本申请在此不做详述。
因此,用户在如图3所示的学位资源查询页面输入目标对象后,可以在该地图展示区域内展示目标对象所在学区包含的各校区的地理位置,方便用户直观看到该学区内各校区的分布。与此同时,电子设备可以向计算机设备发送针对该目标对象的学位资源查询请求,以使该计算机设备按照本申请实施例提出的学位资源预测方法,得到目标对象的目标学位资源需求数,反馈至该电子设备,从而在预测结果展示区域内进行展示。
如图3所示,可以在预测结果展示区域内展示该学区在若干未来年份下,各自对应的学位资源调控信息,如不同未来年份内出现学位资源缺口的预警校区数、班级缺口数以及学龄人口缺口数(即学生学位缺口数)等。同时,还可以详细展示下一年份(即次年)的学位资源调控信息,如图3所示的该学区包含的校区总数、次年出现学位资源缺口的预警校区数、预警校区的次年班级缺口数以及次年学龄人口缺口数等,本申请对学位资源调控信息包含的内容及其展示方式不做限制,可视情况而定。
在一些实施例中,在如图3所示的学位资源查询页面中,用户可以选择地图展示区域所展示的任一校区为目标校区,来查询该目标校区的学位资源需求数/缺口数,本实施例以展示学位资源缺口数为例进行说明,关于学位资源需求数的展示方式类似,本申请不做详述。基于此,用户可以将鼠标箭头移动至地图展示区域所展示的目标校区的位置标识(或手指直接点击目标校区的位置标识),以使该目标校区处于选中状态,弹出校区学位资源预警面板,以展示该校区的次年班级缺口数和次年学龄人口缺口数,还可以展示针对该目标校区目前具有的学位资源的调配建议等信息。
可选的,上述校区学位资源预警面板还可以配置详情查看按钮,用户可以点击该详情查看按钮,来查看关于该校区更详细的学位资源调控信息、学位资源需求数等内容,具体内容本申请在此不做一一详述。
结合上文计算机设备实施例的相关描述可知,支持学位资源查询平台服务的计算机设备22,可以在智慧教育的基础上应用本申请提出的学位资源预测方法,对学区校区的学位资源进行精准预测,以便将得到的学位资源需求数与区域教育资源的建设规划进行交叉对比分析,确定各学区各校区中不同年级(即不同年龄区间)内的学位资源缺口规模,以帮助教育部门和区域管理者进行长期的教育政策的规划,以及短期资源投入的管理,解决不同年级的学位资源供给失衡的矛盾。
而且,结合上文对本申请技术构思的相关描述,本申请训练的学位资源预测模型还可以用于预测新建或规划中校区的学位资源需求数,因此,在实际应用中,若需要在某一学区新增一校区,可以先利用本申请提出的学位资源预测方法,来预测该校区的学位资源需求数,如班级需求数、学龄人口需求数等,以便据此设计该校区的整体建筑布局,确定该校区的招生计划等。
具体的,参照图4所示的又一应用场景下的学位资源查询页面示意图,用户可以输入规划中的校区的地址后,点击查询按钮,以生成包含该校区的地理位置的学位资源查询请求,以使计算机设备依据该校区所在学区的学位资源预测数据,预测得到该校区的学位资源需求数,并展示在学位资源查询页面。如图4所示,可以在学位资源查询页面的地图展示区域展示该校区的地理位置标识(如图4中D小学(规划中)等标识信息),并弹出学位资源需求查询面板,展示该校区的学位资源需求数等,并不局限于图4所示的展示方式和内容。
应该理解的是,图2所示的应用场景的系统结构并不构成对本申请实施例应用场景的学位资源预测系统的限定,在实际应用中,该系统可以包括比图2所示的更多的组成设备,如为了获取不同学区/校区的各种学位资源预测数据,能够与计算机设备22通信连接的,如统计局服务器、教育局服务器、各学校服务器、各网站服务器等第三方平台等,根据需要还可以包括用于存储学位资源查询历史数据的数据存储设备等,可以依据不同应用场景的需求确定,本申请在此不做一一列举。
另外,对于适用于本申请实施例提出的学位资源预测方法和装置的各应用场景的系统结构,其包含的各计算机设备、服务器、电子设备等设备可以组成一区块链,这些设备可以是该区块链上的节点。这样,在按照本申请提出的学位资源预测方法,得到某一学区/校区的学位资源需求数、缺口数等信息后,可以存储在区块链中,这样,其他用户可以直接访问相应的节点查询,无需等待计算机设备重新预测计算,提高了学位资源查询效率,也保证了学位资源查询结果可靠性。
参照图5,为本申请提供的学位资源预测方法的一可选示例的流程示意图,该方法可以适用于如上述计算机设备,本申请对该计算机设备的产品类型不做限定,可依据实际应用场景需求确定。如图5所示,该方法可以包括:
步骤S11,获取目标对象的学位资源预测数据;
本申请实施例中,目标对象可以是包括一个或多个学区的城市区域,也可以是一个学区或一个校区等,可以依据实际预测需求确定目标对象的内容。为了满足不同类别的目标对象的学位资源预测要求,同时提高预测结果精确性,本申请获取的学位资源预测数据可以包括目标对象的人口流动数据、多维教育数据(如学区信息、校区信息等)以及学区房交易数据等各类数据中的至少一种。
具体的,在实际应用中,计算机设备可以从统计局、防疫站、教育局、各个学校、统计年鉴、各个网站等至少一个第三方平台,获取本次预测所需的过去若干年份的历史数据,构成目标对象的学位资源预测数据,本申请对学位资源预测数据的获取方式及其包含的内容不做限制。
其中,学区信息可以包括不同规模的学区内校区的各类信息;校区信息可以包括学校类型、归属学区、各学段(即不同年龄区间即不同年级)招生人数、预报名人数、实际入学人数、毕业生数、在校生数、各学段班级数、标准教室数、空闲教室数、教师相关数据、教学设备相关数据等内容;人口流动数据可以包括各个学区常驻人口数据、人口迁入/迁出等流动数据。本申请可以依据该目标对象的类别,获取已存在的相应学位资源预测数据,包括但并不局限于上文列举的数据内容。
可以理解,本申请实施例中的人口是指学龄人口,下文不再一一解释。该学龄人口是指某地区内具有常驻户口并达到法定入学年龄的人口,如达到义务教育法定入学年龄的人口,记为义务教育学龄人口,例如年龄区间在6-11岁的为小学学龄人口,年龄区间在12-14岁的为初中学龄人口,本申请对各年级的年龄区间不做限制,可视情况而定。
步骤S12,对该学位资源预测数据进行预处理,得到学位资源预测特征参数;
在实际应用中,由于计算机设备直接从不同第三方平台获取的数据中,可能存在重复或无关等数据,为了避免这类数据对预测结果的不利影响,本申请可以先对直接获取的数据进行筛选和清洗等预处理,得到相对可靠的学位资源预测数据后,再对其进行归一化处理,得到同一维度下的学位资源预测特征参数,用以实现后续模型处理。
其中,对于不同类别的学位资源预测数据,经过上述归一化处理后,可以得到对应的学位资源预测特征参数,所以说,本实施例获取的学位资源预测数据包括多类数据的情况下,经过归一化处理后,可以得到多组学位资源预测特征参数,每一组学位资源预测特征参数可以是一个特征向量;当然,经过归一化处理后,也可以得到多个学位资源预测特征参数,每一个学位资源预测特征参数对应一类学位资源预测数据。可见,该学位资源特征参数的具体内容可视情况而定,本申请实施例在此不做详述。
步骤S13,将学位资源特征参数输入学位资源预测模型,得到目标对象的目标学位资源需求数;
结合上文对本申请技术构思的相关描述可知,本申请预训练的学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,且,校区的学位资源需求数依赖于层次结构的历史学位资源预测数据。也就是说,本申请是基于这些依赖关系进行建模的,所以,本申请的学位资源预测模型不仅可以精准预测已有学区、校区未来的学位资源需求数,而且由于其消除了先验概率分布对预测结果的过度影响,使其能够用于预测待建校区的学位资源需求数,提高了学位资源预测模型的适用场景范围和扩展性。
基于此,本申请将目标对象的学位资源预测特征参数输入学位资源预测模型后,可以依据预训练的上述依赖关系所对应的模型参数,对输入的学位资源预测特征参数进行统计分析,预测目标对象的学位资源需求数,具体预测实现过程本申请实施例在此不做详述。
结合上文应用场景的相关描述,本申请预测得到的目标对象的学位资源需求数可以包括:目标对象在一个或多个未来年份内的学位资源需求数,具体可以包括在任一未来年份内,本学区期望构建的学校数、各校区需要配置年级数,以及不同年级的学龄人口数(即学生学位数)等,本申请对该学位资源需求数的具体内容不做限制,可视情况而定。
可以理解,在某些应用场景下,若已知目标对象实际具有的学位资源配置数据,可以通过将其与上述预测结果进行比较,来确定目前该目标对象的学位资源缺口数,如次校区缺口数、年班级缺口数、学龄人口缺口数等,以便相关部件能够据此调整目标对象的学位资源分配和规划,提高整个区域教育资源的分配合理性。
步骤S14,输出目标对象的目标学位资源需求数。
结合上文分析,计算机设备得到目标对象的目标学位资源需求数后,在一些应用场景下,可以直接将其反馈至请求查看目标对象的目标学位资源需求数的电子设备进行展示,以供用户直观了解目标对象的目标学位资源需求数,可以参照但并不局限于上图4所示的目标学位资源需求数展示方式。
在又一些实施例中,还可以进一步结合当前针对目标对象的学位资源配置数据,如当前各学区校区的班级配置情况等,通过交叉比较,确定该目标对象的学位资源调控信息,再反馈至电子设备进行展示,具体展示方式可以参照但并不局限于上图3所示内容。
综上,在本申请实施例中,由于本申请预先训练的学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,且校区的学位资源需求数依赖于层次结构的历史学位资源预测数据,从而该学位资源预测模型克服了小样本数据的缺陷,消除了先验分布对预测结果的过度影响,增强了模型预测的稳健性和适应性,这样,当需要预测任一学区、校区或待建/规划中的新校区等目标对象的学位资源需求情况,获取目标对象的一种或多种学位资源预测数据后,将预处理后得到的学位资源特征参数输入该学位资源预测模型,能够快速且精准地预测出该学区/校区的学位资源需求数,以指导实现教育资源的合理分配和科学规划。
下面将对上述学位资源预测模型的训练实现过程进行描述,需要说明,本申请对该学位资源预测模型的具体训练实现方法不做限制。在一些实施例中,上述学位资源预测模型可以包括多层概率预测模型,该多层概率预测模型可以基于层次结构的样本数据训练得到的。
其中,具有层次结构的样本数据包括过去最近一年内,不同样本学区内各样本校区的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据,具体可以依据实际从第三方平台获取的数据内容,确定所构建的层次数据结构类型,本申请对此不做限制,可视情况而定。
基于多层概率预测模型的训练特点可知,该多层概率预测模型充分考虑不同层级样本数据相互之间的影响,能够更高精度地实现学位资源需求数的预测,且依据多层模型的预测特点可知,在其预测分析过程中,会利用多个层级各自的预测结果的均值,降低预测误差,克服传统统计模型的局限性,保证该多层概率预测模型不仅能够精准预测不同学区各已办校区未来的学位资源需求数,还能够精准预测新建校区或规划中校区的学位资源需求数,以满足不同预测场景的高精度预测需求。
结合上文对多层概率预测模型的描述,本申请将以依据多层贝叶斯算法,对具有层次结构的历史学位资源预测数据进行训练,得到多层概率预测模型的训练方式为例,来具体说明多层概率预测模型的训练实现过程。
具体的,参照图6,为本申请提供的学位资源预测方法中,一种学位资源预测模型可选训练实现过程的流程示意图,本实施例主要对学位资源预测模型包含的多层概率模型的训练过程进行描述,但并不局限于本实施例描述的这种训练实现方法。如图6所示,该方法可以包括:
步骤S21,获取具有层次结构的多组样本数据;
在本实施例实际应用中,结合上图2所示的一可选应用场景的系统结构示意图,计算机设备可以从一个或多个第三方平台,获取不同样本学区内各样本校区所对应的,一种或多种学位资源预测数据,本申请对从不同第三方平台获取数据所采用的具体方式不做限制,如利用爬虫技术,从各网站爬取所需的一种或多种学位资源预测数据等,本申请实施例在此不做一一列举。
应该理解的是,由于计算机设备直接从第三方平台获取的数据(可以记为学位资源预测候选数据)中,往往会存在重复、内容无关、不连续等异常问题,为了保证所得样本数据的可靠性,本申请可以采用数据去重、异常值替换(如采用前后相邻年份的均值替换)、离群值删除、缺失值插补(如采用移动平均法进行补全,并采用极大似然估计方式对部分年度无法补全的数据进行预测补充)等方式,对直接获取的学位资源预测候选数据进行预处理,再经过归一化处理后,得到同一维度的样本数据。本申请对这些预处理实现手段的具体实现过程不做详述,且实现手段包括但并不局限于本申请列举的几种方式。
之后,对于预处理得到的大量样本数据,可以按照一定比例(如6:2:2等),将所得到的样本数据划分成训练样本集、验证样本集以及测试样本集等三个数据集合,分别用以实现模型训练、验证和测试,保证最终所得模型预测结果的精准性。但并不局限于本申请描述的这种样本数据划分方式,可以依据模型训练要求确定。
基于上述描述内容,为了消除先验概率分布对预测结果的过度影响,增强模型预测的稳健性,在确定训练模型所需的样本数据过程中,可以将上述获得的多个样本数据划分为合适的多层结构,即构建具有层次结构的多组样本数据。示例性的,本申请可以按照不同学区,对过去最近一年的样本数据的整理,得到如图7a所示的位于不同样本学区内不同样本校区的多组样本数据。如图7a所示,为了区分不同样本学区,可以为每一个样本学区配置唯一的学区标识,其包括但并不局限于图7a所示的数字编号;同理,对于位于同一学区内的不同校区,也可以配置对应的校区标识进行区分,其包括但并不局限于图7a所示的数字编号。
在又一些实施例中,本申请也可以按照学校对获取的各样本校区过去若干年的样本数据进行整理,得到但并不局限于如图7b所示的不同样本校区在不同年份下的多组样本数据。可以理解,本申请所获取的各组样本数据包含的数据内容,均为相应样本校区的不同类别的历史数据,且对于构建多组样本数据所依据的层次数据结构,并不局限于图7a和图7b所示的两种层次数据结构。
另外,需要说明的是,关于对应每一样本学区的每一样本校区的一组样本数据,包括但并不局限于图7a和图7b所示的招生人数、实际入学人数、在校学生数、专业教师数、学区房交易数、人口流动净值等多种数据,可以依据实际情况,增加其他类别的学位资源预测数据,本申请实施例在此不做一一列举。
步骤S22,对多组样本数据进行归一化处理,得到相应的样本特征参数;
需要说明,在本申请实际应用中,在从第三方平台获取不同样本学区不同样本校区对应的,各类历史学位资源预测数据后,也可以先按照上文描述的预处理、归一化处理后,再对归一化处理后的样本特征参数进行分组,得到具有层次结构的多组样本特征参数。本申请对上述步骤S21和步骤S22的执行顺序不做限制,可视情况而定。
步骤S23,利用得到的样本特征参数,对初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,将最后一次训练得到的多层贝叶斯模型确定为多层概率预测模型;
步骤S24,对多层概率预测模型进行存储。
多层贝叶斯模型是具有结构化层次的统计模型,用来为复杂的统计问题建立层次模型,即为具有不同水平的问题进行建模,通过贝叶斯方式估计后验分布的参数,从而避免参数过多导致的过拟合问题。因此,在本申请构建层次结构的多组样本数据后,可以调用多层贝叶斯模型作为训练多层概率预测模型的初始模型,本申请对多层贝叶斯模型的初始化构建实现过程不做详述。
结合多层贝叶斯算法的工作原理,多层贝叶斯模型实际上是一个联合后验概率密度函数,是由超先验概率分布、先验概率分布以及似然估计函数乘积得到,所以说,本申请的初始多层贝叶斯模型可以由数据子模型、过程子模型和超参数子模型三部分组成。
其中,上述数据子模型可以表示为Yi~f(yi|θj),(i=1,2,…,n,j=1,2,…,J)的似然估计函数,若上述多组样本参数是按照学区构建的,该yi可以表示第i个校区的学位资源需求数,θj可以是第j个学区的参数,如图7a中第j个学区中各类样本数据;若上述多组样本参数是按照校区构建的,如图7b所示,该yi可以表示第i个年份的学位资源需求数,θj可以是第j个校区的参数。本申请对该数据子模型的具体构建过程不做详述。
在一些实施例中,本申请在确定构建上述数据子模型过程中,具体可以依据影响不同样本校区的学位资源需求数的先验概率分布,从多个预设数据子模型中选定。其中,先验概率分布与试验结果和随机抽样无关,是在进行统计实验之前根据其他知识已经获得的分布,本申请实施例可以通过对多组样本数据进行统计分析得到,具体实现过程不做详述。
如上文描述,由于该数据子模型是指基于多组样本数据中每一类样本数据,确定不同样本校区的学位资源需求数的似然估计函数。因此,本申请上述多个预设数据子模型可以是多个预设的似然估计函数,如待训练参数为函数截距的第一似然估计函数、待训练参数为函数斜率的第二似然估计函数,和/或待训练参数为函数截距和函数斜率的第三似然估计函数等,在构建初始多层贝叶斯模型时,可以依据所获取的先验概率分布,来确定本次数据子模型的似然估计函数表达式,具体实现过程本申请不做详述。
对于上述过程子模型,其表达式可以为θj~p(θj|φ),即参数θj服从先验概率分布p(θj|φ),也就是说,该过程子模型可以是先验概率分布函数。在实际应用中,若已知不同学区不同校区的样本数据,影响学位资源需求数的先验概率分布,该过程子模型可以是由此得到的有信息先验概率分布函数;反之,该过程子模型可以是无信息先验概率分布函数,具体可以依据经验确定的正态分布等,本申请对先验概率分布的具体获取过程不做详述。
对于上述超参数子模型,其表达式可以为φ~p(φ),即超参数φ服从超参数先验分布p(φ),该超参数先验分布p(φ)的获取过程与上述先验概率分布p(θj|φ)的获取过程类似,可以依据经验确定的先验概率分布,即采用无信息先验得到,具体内容不做限制。也就是说,在上述各子模型训练过程中,对各相互独立的参数,均可以采用最简单的无信息先验(uniform(0,100))分布确定,如超参数的先验分布为p(φ)∝1,具体实现过程不做详述。
结合上文描述的多层贝叶斯模型的构建原理,本申请可以通过上述先验概率分布和似然估计函数,确定参数和超参数的后验概率分布p(θj,φ|yi),之后,将得到的似然估计函数、先验概率分布和超参数先验概率分布进行乘积运算,得到如下所示的高维度的联合概率密度函数,即初始多层贝叶斯模型:
p(θi,φ|yi)∝p(yi|θj,φ)p(θj,φ)=p(yi|θj,φ)p(θj|φ)p(φ)
本申请在训练多层概率预测模型过程中,可以直接调用上述初始多层贝叶斯模型,从而利用获取的层次结构的多组样本特征参数,对该初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,如训练次数达到预设次数、模型预测结果的偏差信息量最小、预测结果的误差率小于预设误差阈值等,可以停止继续迭代,将本次训练得到的多层贝叶斯模型确定为多层概率预测模型。
其中,在上述多层贝叶斯模型的多次迭代训练过程中,可以依据各参数的后验均值预测结果,实现上述数据子模型的模型参数不断调整,以提高整个多层贝叶斯模型的预测结果的精准度。如删除前2000次迭代结果,通过后续迭代过程计算得到各参数的后验均值预测结果,以实现模型参数的调整,但并不局限于这种调整方式,可视情况而定。
在本申请提出的又一些实施例中,为了保证模型收敛性,在上述模型训练过程中,可以采用多条马尔可夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)方式实现,具体实现过程本申请不做详述。其中,在模型收敛性判断过程中,通过单因素分析进行变量筛选时,可以根据Gelman-Rubin统计参数估计,检查MCMC链是否收敛,若不收敛,可以采用中心化方式来改进MCMC的收敛性,如将原始样本数据减去所在一组样本数据的均值,作为新的样本数据继续进行训练,以加快模型的收敛速度,提高模型训练效率,本申请对如何采用MCMC方式实现模型快速收敛的实现过程不做详述。
另外,在按照上述方式,利用训练样本数据对初始多层贝叶斯模型完成训练后,可以继续利用预先构建的验证样本集中的验证数据,对训练得到的模型进行准确性验证,在该过程中,可以依据验证结果按照上述方式继续调整模型参数,直至满足验证终止条件。
进一步地,本申请还可以利用预先构建的测试样本集中的测试数据,对验证后的模型做进一步测试,在该过程中,仍可以依据测试结果进一步调整模型参数,以提高模型预测精准度,具体实现过程本申请不做详述。
综上,本申请实施例构建层次结构的多组样本数据后,将利用多层贝叶斯算法进行建模,通过细化总体结构和部分细节的先验信息,分层逐步地建模,能够消除先验分布对预测结果的过度影响,增加预测结果的稳健性,即保证所得多层概率预测模型能够借助层次的均值,降低预测误差率,提高对不同学区不同校区的学位资源需求数的预测结果准确性,且能够用于预测新建校区,即无历史教育数据的校区的学位资源需求情况,提高模型可扩展性。
在又一些实施例中,上述学位资源预测模型还可以包括:用于预测整个学区的学位资源需求数的学龄人口预测模型,该学龄人口预测模型可以依据同一样本学区内不同年龄区间各自的学位资源需求数之间的递推关系训练得到,相对于传统的人口增长模型,而本申请的递推关系是指上一统计周期中上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率,与本统计周期内本年龄区间的学位资源需求数之间的关系,也就是说,本统计周期内本年龄区间的学位资源需求数,将依据上一统计周期中上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率计算得到。其中,学龄人口留存率和学龄人口迁入率依据相应年龄区间内的人口流动数据训练得到的,该学龄人口留存率=1-学龄人口迁出率。
可见,相对于传统的人口增长模型,本申请的学龄人口预测模型在训练过程中,由不用年龄区间内的学龄人口迁入率和学龄人口迁出率,替换出生率和死亡率,提高了不同年龄区间内学龄人口数之间的递推关系准确性和可靠性,从而提高了模型预测过程的稳健性和适应性,能够显著降低长期预测误差率。
基于上述分析,参照图8,为本申请提供的学位资源预测方法中,又一种学位资源预测模型的可选训练实现过程的流程示意图,本实施例实现学位资源预测方法的学位资源预测模型可以仅包括上述学龄人口预测模型,也可以由上述多层概率预测模型和学龄人口预测模型组,本实施例在此主要对该学龄人口预测模型的训练过程进行描述,但并不局限于本实施例描述的这种训练实现方法。如图8所示,该方法可以包括:
步骤S31,对样本学区内不同年龄的学龄人口进行分组,得到多个年龄区间;
步骤S32,在不同统计周期内,利用多个年龄区间各自的历史人口流动数据,得到相应统计周期的历史学龄人口分布向量;
在本申请实施例中,将通过对传统的人口增长模型(如莱斯利Leslie模型)进行改进,得到用于预测整个学区的学位资源需求数的人口预测模型,因此,该人口预测模型主要需要样本学区的历史人口流动数据,获取方式可以参照上述实施例相应部分的描述,本实施例不做赘述。
考虑到学区内不同校区的学龄人口的年龄范围不同,假设最大学龄人口为m岁,本申请可以将整个学龄阶段划分为n个年龄区间,即将m岁分为n个年龄区间,从而按照该划分方式,确定不同年龄区间对应组的学龄人口,从而将整个样本学区的学龄人口划分成n个组,并将第i组的学龄人口数记为xi(i=1,2....,n)。
假设预测的初始时间为t0,本申请可以每间隔m/n年(即一个统计周期),对各年龄区间内的历史人口流动数据统计一次,将统计周期的个数记为k,可以得到第k个统计周期内,即tk=t0+km/n时间内,多组年龄区间的人口分布向量(表示为列向量)记为xk=(xk1,xk2,…,xkn)T,具体内容可视情况而定,本申请在此不做详述。
步骤S33,确定依据上一统计周期内上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率,得到本统计周期内本年龄区间的学位资源需求数的递推关系;
步骤S34,依据所确定的递推关系,构建初始人口预测模型;
本申请实施例中,将综合考虑不同统计周期内,各年龄区间内学龄人口的迁入和留存,对相邻本年龄区间以及下一年龄区间各自包含的学龄人口数的影响,来构建初始人口预测模型,以提高模型预测过程的稳健性和适应性。
具体的,可以依据上述考虑,来确定相邻两个年龄区间内的学位资源需求数的递推关系,也就是说,在构建初始人口预测模型时,可以定义:依据上一统计周期内上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率,得到本统计周期内本年龄区间的学位资源需求数。因此,在每年新增出生人口数b0确定的情况下,第i组年龄区间内的学龄人口对应的学龄人口迁入率为bi,学龄人口迁出率为di,则学龄人口留存率为si=1-di。假设bi和di在同一统计周期内保持不变,可以按照上文描述的推断关系,得到各统计周期内不同年龄区间的学龄人口数的表达式:
在tk统计周期内,第一组年龄区间内的学龄人口的总数(即学位资源需求数)xk1可以为每年新增人口数,即xk1=b0;第i+1组年龄区间内的学龄人口的总数xk(i+1)可以是:tk-1统计周期内第i组年龄区间内的学龄人口迁出后留存下来的学龄人口数加上新迁入的学龄人口数,即xk(i+1)=(bi+si)x(k-1)i。
通过对上述不同统计周期内,各年龄区间的学龄人口数的表达式进行分析,可以构建用以表达不同年龄区间的学龄人口数递推关系的递推关系矩阵,如莱斯利矩阵L:
之后,结合人口增长模型(如Leslie模型)的构建方式,利用上述矩阵L构建初始人口预测模型,可以理解,上述矩阵包含的各学龄人口迁入率、学龄人口留存率等为模型参数,可以由相应年龄区间的历史人口流动数据训练得到。该初始人口预测模型可以为:
由此上述模型表达式可知,对于每一个统计周期(如第k个统计周期)内,每一个年龄区间(如第i个)的学龄人口数,依赖于上一统计周期(如第k-1个统计周期)中上一个年龄区间(如第i-1个)的学龄人口的留存人数和迁入人数,提高了每一年龄区间在不同统计周期内的学龄人口数的计算准确性。
步骤S35,利用不同统计周期的历史学龄人口分布向量,对初始人口预测模型中各年龄区间对应的学龄人口迁入率和学龄人口留存率进行训练学习,直至人口预测模型的预测误差率小于第一误差阈值,确定最后一次训练得到的人口预测模型为学龄人口预测模型;
步骤S36,对该学龄人口预测模型进行存储。
本申请实施例中,按照上述方式得到初始人口预测模型后,可以利用上述得到的样本学区中不同统计周期的历史学龄人口分布向量进行学习训练,以确定上述各年龄区间对应的学龄人口迁入率和学龄人口留存率。具体训练实现过程可以依据Leslie模型的训练原理确定,本申请在此不做详述,且需要说明的是,关于该人口预测模型的训练终止条件,可以包括但并不局限于上文描述的预测误差率小于第一误差阈值,且对该第一误差阈值的具体数值不做限制,可视情况而定。
其中,在样本学区的样本数据量一定的情况下,上述预测误差率可以指均方误差,即反映估计量与被估计量之间差异程度的一种度量,本实施例可以获取各学龄人口迁入率/留存率的估计量与历史样本值θ(即基于历史人口流动数据计算得到的数值)之间的差异程度。可以按照公式 计算得到各模型参数的均方误差具体计算过程本申请在此不做详述。
为了进一步提高训练得到的学龄人口预测模型的预测可靠性和精准性,在利用训练样本集中的各训练数据进行建模后,还可以利用预先构建的验证样本集中的验证数据,对构建的学龄人口预测模型进行验证,若所得预测误差率大于第一误差阈值,可以按照上述方式继续调整上述学龄人口预测模型中的模型参数,直至预测误差率小于第一误差阈值,存储最终所得学龄人口预测模型。根据需要,还可以利用测试样本集中的测试数据,对学龄人口预测模型进行评估测试,以确定该学龄人口预测模型是否满足应用需求,若不满足,可以按照上述方式继续对该学龄人口预测模型进行迭代训练,直至得到满足测试要求的学龄人口预测模型。
综上,本申请实施例考虑各年龄区间的学龄人口数,在不同统计周期内,受相邻上一年龄区间内的学龄人口迁入数和留存数的影响,构建用以预测整个学区的学龄人口预测模型,经过学位数据验证可知,无论是在短期预测还是长期预测中,本申请训练得到的学龄人口预测模型的误差率基本都小于5%,相对于基本统计分析方法,该学龄人口预测模型显著的降低了长期预测误差率,以便后续基于该预测结果,动态调整学区学位供应量、教育资源的分配计划,从而为长期的教育规划和短期投资方案提供可靠且准确性的指导性建议。
综合上述各实施例的描述,结合图9所示的学位资源预测方法中,学位资源预测模型的又一可选训练实现过程的流程示意图,本申请可以将整个学位预测模型的训练实现过程划分三大阶段。如图9所示,在数据采集和预处理阶段,计算机设备从第三方平台获取各样本学区样本校区的各类学位资源预测候选数据后,经过去除重复数据、异常值替换、离群值删除、缺失值插补等预处理操作,得到学位资源预测数据。
在模型训练阶段,对学位资源预测数据进行标准化处理(如归一化处理)后进行数据划分,得到训练样本集、验证样本集和测试样本集,具体实现过程可以参照上述实施例相应部分的描述。之后,可以利用训练样本集中的样本数据进行建模。如上述分析,为了实现对不同学区不同校区的学位资源需求数的精准预测,可以采用多层贝叶斯算法进行建模,且在该建模过程中,将依据所获取的先验概率分布,选定构建多层贝叶斯模型中数据子模型的似然估计函数表达式,如图9所示,可以从变截距的第一似然估计函数、变斜率的第二似然估计函数、变截距和斜率的第三似然估计函数中选择一个,具体选择实现过程不做详述。
需要说明,在上述多层概率预测模型的构建过程中,可以先对所获取的具有层次结构的多组样本数据的组内相关性进行检验,以确定组内相关系数(intraclasscorrelation coefficient,ICC)是否位于预设范围内,如在0.05至0.20之间,若是再据此进行建模;若不是,需要对各样本数据进行调整。其中,ICC是衡量和评价样本数据间信度和复测信度的信度系数指标,等于个体的变异度除以总的变异度,通常介于0和1之间,具体计算过程本申请不做详述。
其中,组内相关系数ICC可以按照如下公式计算:
上述公式中,可以表示群组内方差,其可以反映同一总体不同观测值(样本数据)的差异程度,是各个样本对其所在组的平均数的算术平均数;可以表示群组间方差,其可以反映不同总体不同观测值的差异程度,是各组平均数对总平均数离差平方和的算术平均数,具体计算过程本申请不做详述。
另外,若不需要区分学区内的校区,要预测整个区域(如整个学区)的学位资源需求数,本申请实施例可以采用上文相应部分描述的建模方式,构建改进的Leslie矩阵模型为学龄人口预测模型,建模过程本实施例在此不做详述。
在模型预测修正阶段,具体可以在完成上述建模后,将基于多层贝叶斯算法构建的多层概率预测模型,与基于改进的Leslie算法构建的学龄人口预测模型后,可以由这两个模型组成学位资源预测模型,利用验证样本集包含的各验证数据,对该学位资源预测模型进行迭代验证,得到相应的多个预测结果,通过计算预测结果的误差率,调整学位资源预测模型的模型参数。具体的,对于不同校区的学位资源需求数预测,可以利用多层概率预测模型实现,基于这类预测结果计算得到的误差率,实现该多层概率预测模型的模型参数的调整;同理,对于整个学区的学位资源需求数预测,可以利用学龄人口预测模型实现,之后,可以依据这类预测结果的误差率,调整学龄人口预测模型的模型参数,以提高整个模型在不同预测场景下的预测精准度。
按照上述模型验证方式,确定学位资源预测模型的预测结果的误差率小于预设的相应误差阈值的情况下,可以对该学位资源预测模型进行存储,这样,在需要获取目标对象的学位资源需求数时,可以直接调用该学位资源预测模型实现。
为了实现对验证后的学位资源预测模型的评价,本申请还可以进一步使用测试样本集中的测试数据,对该学位资源预测模型进行预测测试,确定该学位资源预测模型的预测准确性、稳健性和适应性等,还可以通过计算测试结果的误差率,从而依据该误差率,继续调整学位资源预测模型的模型参数,以使该学位资源预测模型能够更好地适应当前预测场景。
综上分析可知,按照上述方式预训练得到的学位资源预测模型,如多层概率预测模型和学龄人口预测模型后,在该学位资源预测模型的实际应用中,若需要预测某一学区中的某一校区,可以是已知校区或未建校区的学位资源需求数,为了保证预测结果可靠性,本申请可以选择调用该多层概率预测模型实现;若需要预测某一学区或区域内的学位资源,在保证预测结果可靠性的同时,提高预测效率,本申请可以选择调用学龄人口预测模型实现,但并不局限于这种预测调用处理方式,且关于模型预测的实现过程,可以参照但并不局限于下文相应实施例的描述。
基于上文描述的学位资源预测模型训练实现过程,参照图10,为本申请提供的学位资源预测方法的又一可选示例的信令流程示意图,本实施例主要对如何利用预训练的学位资源预测模型,满足预测场景下对目标对象的学位资源需求数的预测要求的实现过程进行描述,但并不局限于本实施例描述的预测场景。如图10所示,该方法可以包括:
步骤S41,电子设备输出学位资源查询页面;
步骤S42,电子设备响应于对学位资源查询页面的输入操作,向计算机设备发送针对该目标对象的学位资源查询请求;
本申请实施例中,结合上图2所示的应用场景的系统结构,以及图3和图4所示的学位资源查询页面,当需要获取某一学区和/或校区的学位资源需求数,以确定相应的学位资源缺口数,用户通过电子设备登录学位资源查询平台,在输出的学位资源查询页面中,输入要查询的目标对象的名称、地址等标识,以使电子设备响应于对学位资源查询页面的输入操作,生成针对该目标对象的学位资源查询请求,发送至计算机设备,但并不局限于本实施例描述的这种学位资源查询请求的生成方式。
基于此,计算机设备接收到的学位资源查询请求中,可以包括该目标对象的名称、地址等标识,以及对该目标对象的学位资源的查询请求内容,如请求查询目标对象的未来一年或多年各自的学位资源需求数等,本申请对该学位资源查询请求包含的内容不做限制,可视情况而定。
步骤S43,计算机设备响应该学位资源查询请求,得到目标对象的标识信息以及学位资源配置数据;
如上分析,计算机设备可以是指学位资源查询平台,其接收到电子设备发送的学位资源查询请求后,可以解析该请求,确定查询的目标对象的标识信息,如学区/校区的名称、地址等。且为了确定该目标对象的学位资源缺口数,可以获取当前该目标对象所具有的学位资源配置数据,即实际具有的学位资源分配情况,如学区包含的校区数,各校区具有的班级数和学龄人口数等。
步骤S44,计算机设备从第三方平台,获取与该标识信息关联的学位资源预测候选数据;
步骤S45,计算机设备对学位资源预测候选数据进行异常筛选和缺失值插补处理,得到学位资源预测数据;
步骤S46,计算机设备对学位资源预测数据进行归一化处理,得到相应的学位资源特征参数;
关于上述步骤S44~步骤S46的数据预处理过程,可以参照上述实施例相应部分的描述,本实施例在此不做详述。
步骤S47,计算机设备将不同类别的学位资源预测特征参数输入多层概率预测模型,得到目标对象的目标校区学位资源需求数;
可以理解,若该目标对象为目标学区,所得到的目标校区学位资源需求数可以包括所述目标学区包含的各校区的校区学位资源需求数。
步骤S48,计算机设备将人口流动数据对应的学位资源预测特征参数输入学龄人口预测模型,得到目标对象的目标学区学位资源需求数;
在本申请实施例中,在用户登录学位资源查询平台,查询某一学区/校区的学位资源情况,计算机设备可以同时获取该学区包含的各校区,或者说该校区所在学区内各校区的学位资源需求数/缺口数,以便用户了解学位资源分布情况。所以,在得到学位资源预测特征参数后,可以分别输入上述不同的模型,以获得不同层次的学位资源需求数。
可以理解,若仅需要某一学区或校区的学位资源需求数,可以调用相应的学位资源预测模型即可,可以不用调用如上两个模型进行预测处理,实现过程类似,本申请不做详述。
步骤S49,计算机设备将学位资源配置数据与校区学位资源需求数,以及目标学区学位资源需求数进行比较,得到相应的学位资源比较结果;
在实际应用中,对于不同学区、校区来说,其建筑规模可能不同,所具有的学位资源配置数据不同,所对应的学龄人口数、所在地区的经济等方面也会有所差异,这就会导致各学区、校区的学位资源需求数不同,为了解相应学区、校区各自的学位资源缺口数,可以将模型预测的各自学位资源需求数,与各自已具有的学位资源配置数据进行对比,具体实现方法不做详述。
步骤S410,计算机设备依据该学位资源比较结果,确定目标对象的学位资源调控信息;
结合上文描述,本实施例得到的学位资源调控信息可以包括:目标学区学位资源缺口数,和/或目标校区学位资源缺口数,和/或针对目标对象的学位资源调配建议;具体如上述图3所示,目标学区在未来若干年各自的预警学校数、各预警学校的年级缺口数和学龄人口缺口数等,重点可以展示针对目标学区次年的学位资源调控信息,可以包括但并不局限于图3所示的信息内容。
步骤S411,计算机设备将该目标对象的学位资源调控信息反馈至电子设备;
步骤S412,电子设备在学位资源查询页面的查询结果展示区域内,展示学位资源调控信息中目标学区在多个未来年份各自的目标学区学位资源缺口数;
步骤S413,电子设备响应于对学位资源查询页面中,地图展示区域所展示的目标学区中任一校区的学位资源查询选择操作,弹出校区学位资源预警面板,在校区学位资源预警面板展示下一年目标校区学位资源缺口数,以及针对目标校区的学位资源调配建议。
关于学位资源调控信息的展示方式,可以参照但并不局限于上图3和图4所示的展示方式,具体可以依据实际需求进行适应性调整,本申请在此不做一一详述。
可以理解,在计算机设备获得目标学区内各校区的学位资源需求数、学位资源调控信息后,可以不用直接展示在学位资源查询页面中,当用户将鼠标移动到地图展示区域内,属于该目标学区的任一校区的位置标识上,以使该校区处于选中状态,再按照上述方式弹出校区学位资源预警面板,展示所选择的校区的学位资源需求数、缺口数等信息,但并不局限于这种查看方式。
综上所示,在本申请实施例中,在如智慧教育等学位资源查询平台上,配置按照本申请上文描述的方式训练得到的学位资源预测模型,实现对不同学区不同校区的学位资源需求数的高精准度的预测,以及对整个区域的学位资源需求数的高效率和高精准度的预测,通过与该区域教育资源的建设规划进行交叉对比分析,确定各学段学位缺口规模,即实现对相应学区校区的学位资源进行预警,如直接向用户展示所查询目标对象的学位资源调控信息,从而帮助教育部门和区域管理者进行长期的教育政策的规划和短期资源投入的管理,保证教育资源的合理分配和科学规划,以使每个学生能够接受良好的教育,享受足够的校舍、教师和图书等资源。
结合上文实施例描述的学位资源查询平台,如何实现目标对象的学位资源需求数、缺口数等信息的查询过程的描述,在目标对象为待建校区的场景下,由于该目标对象不存在历史教育数据,为了预测其学位资源需求数,结合上图4可知,电子设备发送针对待建校区的学位资源查询请求后,计算机设备依据该待建校区的地理位置信息,确定其所在的目标学区后,可以利用该目标学区的学位资源预测数据,以及多层概率预测模型,获得该待建校区的学位资源需求数,解决了上文依赖校区的历史数据构建的学位资源预测数据,无法获取待建校区的学位资源需求数的技术问题,提高了学位资源预测模型的扩展性。
参照图11,为本申请提出的学位资源预测装置的一可选示例的结构示意图,该装置可以适用于上述计算机设备,如图11所示,该装置可以包括:
预测数据获取模块31,用于获取目标对象的学位资源预测数据;所述学位资源预测数据包括所述目标对象的人口流动数据、多维教育数据以及学区房交易数据中的至少一种;
特征参数得到模块32,用于对所述学位资源预测数据进行预处理,得到学位资源预测特征参数;
预测处理模块33,用于将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数;
本申请实施例中,所述学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,其中,所述校区的学位资源需求数依赖于层次结构的历史学位资源预测数据;
学位资源需求数输出模块34,用于输出所述目标对象的目标学位资源需求数。
在一些实施例中,上述学位资源预测模型包括多层概率预测模型,为了实现该多层概率预测模型的训练,如图12所示,上述预测处理模块33可以包括:
多层概率预测模型训练单元331,用于基于层次结构的样本数据训练得到多层概率预测模型,其中,该层次结构的样本数据包括不同样本学区内各样本校区的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据。
在一种可能的实现方式中,该多层概率预测模型训练单元331可以包括:
样本数据获取子单元,用于获取具有层次结构的多组样本数据;其中,所述多组样本数据包括位于不同样本学区内的不同样本校区在最新一年的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据;
归一化处理子单元,用于对所述多组样本数据进行归一化处理,得到相应的样本特征参数;
多层贝叶斯模型训练子单元,用于利用得到的所述样本特征参数,对初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,将最后一次训练得到的多层贝叶斯模型确定为多层概率预测模型。
其中,多层贝叶斯模型训练单元具体可以用于利用得到的所述样本特征参数,采用多条马尔可夫链蒙特卡洛方式,对初始多层贝叶斯模型进行学习训练,直至训练得到的多层贝叶斯模型的预测结果的偏差信息量最小。
在本申请实施例中,为了构建初始多层贝叶斯模型,上述多层贝叶斯模型训练单元可以包括:
数据子模型是确定单元,用于依据影响不同样本校区的学位资源需求数的先验概率分布,从多个预设数据子模型中选定构成初始多层贝叶斯模型的数据子模型;
其中,所述先验概率分布是对所述多组样本数据进行统计分析得到的;所述数据子模型是指基于所述多组样本数据中每一类样本数据,确定不同样本校区的学位资源需求数的似然估计函数;所述多个预设数据子模型包括待训练参数为函数截距的第一似然估计函数、待训练参数为函数斜率的第二似然估计函数,和/或待训练参数为函数截距和函数斜率的第三似然估计函数。
在又一些实施例中,上述学位资源预测模型还可以包括学龄人口预测模型,因此,上述预测处理模块33还可以包括:
学龄人口预测模型训练单元332,用于依据同一样本学区内不同年龄区间各自的学位资源需求数之间的递推关系,训练得到学龄人口预测模型;
其中,递推关系包括上一统计周期中上一年龄区间的学位资源需求数和、学龄人口留存率以及学龄人口迁入率,与本统计周期内本年龄区间的学位资源需求数之间的关系;所述学龄人口留存率和所述学龄人口迁入率依据相应年龄区间内的所述人口流动数据训练得到的。
在一种可能的实现方式中,该学龄人口预测模型训练单元332可以包括:
分组单元,用于对样本学区内不同年龄的学龄人口进行分组,得到多个年龄区间;
学龄人口分组统计子单元,用于在不同统计周期内,利用所述多个年龄区间各自的历史人口流动数据,得到相应统计周期的历史学龄人口分布向量;
递推关系确定子单元,用于确定依据上一统计周期内上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率,得到本统计周期内本年龄区间的学位资源需求数的递推关系;
初始人口预测模型构建子单元,用于依据所述递推关系,构建初始人口预测模型;
学龄人口预测模型训练子单元,用于利用不同统计周期的所述历史学龄人口分布向量,对所述初始人口预测模型中各年龄区间的学龄人口迁入率和学龄人口留存率进行训练学习,直至人口预测模型的预测误差率小于第一误差阈值,确定最后一次训练得到的人口预测模型为学龄人口预测模型。
基于上述各实施例的描述,如图12所示,上述预测处理模块33还可以包括:
第一处理单元333,用于将不同类别的所述学位资源预测特征参数输入多层概率预测模型,得到所述目标对象的目标校区学位资源需求数;其中,若所述目标对象为目标学区,所述目标校区学位资源需求数包括所述目标学区包含的各校区的校区学位资源需求数;
第二处理单元334,用于将所述人口流动数据对应的学位资源预测特征参数输入学龄人口预测模型,得到所述目标对象的目标学区学位资源需求数;
相应地,上述学位资源需求数输出模块34具体可以用于输出所述目标学区学位资源需求数和所述目标校区学位资源需求数。
在上述实施例描述的学位资源预测装置的基础上,该装置还可以包括:
学位资源配置数据获取模块,用于获取所述目标对象的学位资源配置数据;
比较模块,用于将所述学位资源配置数据与目标学位资源需求数进行比较,得到学位资源比较结果;
学位资源调控信息确定模块,用于依据所述学位资源比较结果,确定所述目标对象的学位资源调控信息,其中,所述学位资源调控信息包括目标学区学位资源缺口数,和/或目标校区学位资源缺口数,和/或针对所述目标对象的学位资源调配建议;
学位资源调控信息输出模块,用于输出所述学位资源调控信息。
基于上述分析,上述预测数据获取模块31可以包括:
学位资源查询请求接收单元,用于接收针对目标对象的学位资源查询请求;其中,所述学位资源查询请求是电子设备响应于对学位资源查询页面的输入操作生成并发送的;
学位资源预测候选数据获取单元,用于响应所述学位资源查询请求,从第三方平台,获取所述目标对象的学位资源预测候选数据;
数据预处理单元,用于对获取的学位资源预测候选数据进行异常筛选和缺失值插补处理,得到学位资源预测数据;
学位资源需求数输出模块34具体可以用于将所述学位资源调控信息反馈至所述电子设备,以在所述电子设备输出的所述学位资源查询页面进行展示。
示例性的,若目标对象为目标校区,所述学位资源查询页面具有查询结果展示区域以及不同学区不同校区位置的地图展示区域,在电子设备与计算机设备进行交互,实现本申请提出的学位资源预测方法的应用场景下,电子设备为了实现学位资源调控信息的展示,电子设备可以包括:
第一展示模块,用于在电子设备响应于对所述地图展示区域中所述目标校区的学位资源查询选择操作的情况下,弹出校区学位资源预警面板,在所述校区学位资源预警面板展示下一年所述目标校区学位资源缺口数,以及针对所述目标校区的学位资源调配建议;其中,所述目标校区学位资源缺口数包括目标校区的班级缺口数和学龄人口缺口数;
第二展示模块,用于在所述学位资源查询页面的查询结果展示区域内,展示所述目标校区所在目标学区在多个未来年份各自的目标学区学位资源缺口数;其中,所述目标学区学位资源缺口数包括:相应未来年份内所述目标学区出现学位资源缺口的预警校区数,以及各预警校区的班级缺口数和学龄人口缺口数。
可以理解,对于电子设备与计算机设备进行交互,实现本申请学位资源预测及预警过程,可以参照上述方法实施例相应部分的描述,电子设备可以配置有实现相应步骤的功能模块,具体本实施例在此不做列举。
可选的,若目标对象为待建校区,上述预测数据获取模块31可以包括:
目标学区确定单元,用于确定所述待建校区所在的目标学区;
数据获取单元,用于获取所述目标学区的学位资源预测数据;
相应地,上述预测处理模块33具体可以用于将所述学位资源特征参数输入多层概率预测模型,得到所述待建校区的学位资源预测数据;
学位资源需求数输出模块34具体可以用于将所述待建校区的学位资源预测数据发送学位资源查询平台进行展示。
需要说明的是,关于上述各装置实施例中的各种模块、单元等,均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块,以实现相应的功能,关于各程序模块及其组合所实现的功能,以及达到的技术效果,可以参照上述方法实施例相应部分的描述,本实施例不再赘述。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行,实现上述学位资源预测方法的各步骤,该学位资源预测方法的实现过程可以参照上述方法实施例的描述。
本申请还提出了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述学位资源预测方法方面或学位资源预测装置方面的各种可选实现方式中所提供方法,具体实现过程可以参照上述相应实施例的描述,不做赘述。
最后,需要说明,本说明书中各个实施例采用递进或并列的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备、计算机可读存储介质、计算机产品而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的核心思想或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种学位资源预测方法,其特征在于,所述方法包括:
获取目标对象的学位资源预测数据;所述学位资源预测数据包括所述目标对象的人口流动数据、多维教育数据以及学区房交易数据中的至少一种;
对所述学位资源预测数据进行预处理,得到学位资源预测特征参数;
将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数;所述学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,其中,所述校区的学位资源需求数依赖于层次结构的历史学位资源预测数据;
输出所述目标对象的目标学位资源需求数。
2.根据权利要求1所述的方法,其特征在于,所述学位资源预测模型包括多层概率预测模型和/或学龄人口预测模型;
所述多层概率预测模型是基于层次结构的样本数据训练得到的,所述层次结构的样本数据包括不同样本学区内各样本校区的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据;
所述学龄人口预测模型是依据同一样本学区内不同年龄区间各自的学位资源需求数之间的递推关系训练得到的;
其中,所述递推关系包括上一统计周期中上一年龄区间的学位资源需求数和、学龄人口留存率以及学龄人口迁入率,与本统计周期内本年龄区间的学位资源需求数之间的关系;所述学龄人口留存率和所述学龄人口迁入率依据相应年龄区间内的所述人口流动数据训练得到的。
3.根据权利要求2所述的方法,其特征在于,所述多层概率预测模型的训练过程包括:
获取具有层次结构的多组样本数据;其中,所述多组样本数据包括位于不同样本学区内的不同样本校区在最新一年的历史学位资源预测数据,或者不同样本校区在不同年份下的历史学位资源预测数据;
对所述多组样本数据进行归一化处理,得到相应的样本特征参数;
利用得到的所述样本特征参数,对初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,将最后一次训练得到的多层贝叶斯模型确定为多层概率预测模型。
4.根据权利要求3所述的方法,其特征在于,所述利用得到的所述样本特征参数,对初始多层贝叶斯模型进行学习训练,直至满足训练终止条件,包括:
利用得到的所述样本特征参数,采用多条马尔可夫链蒙特卡洛方式,对初始多层贝叶斯模型进行学习训练,直至训练得到的多层贝叶斯模型的预测结果的偏差信息量最小;
其中,所述初始多层贝叶斯模型中的数据子模型是依据影响不同样本校区的学位资源需求数的先验概率分布,从多个预设数据子模型中选定的;
所述先验概率分布是对所述多组样本数据进行统计分析得到的;所述数据子模型是指基于所述多组样本数据中每一类样本数据,确定不同样本校区的学位资源需求数的似然估计函数;所述多个预设数据子模型包括待训练参数为函数截距的第一似然估计函数、待训练参数为函数斜率的第二似然估计函数,和/或待训练参数为函数截距和函数斜率的第三似然估计函数。
5.根据权利要求2所述的方法,其特征在于,所述学龄人口预测模型的训练过程包括:
对样本学区内不同年龄的学龄人口进行分组,得到多个年龄区间;
在不同统计周期内,利用所述多个年龄区间各自的历史人口流动数据,得到相应统计周期的历史学龄人口分布向量;
确定依据上一统计周期内上一年龄区间的学位资源需求数、学龄人口留存率以及学龄人口迁入率,得到本统计周期内本年龄区间的学位资源需求数的递推关系;
依据所述递推关系,构建初始人口预测模型;
利用不同统计周期的所述历史学龄人口分布向量,对所述初始人口预测模型中各年龄区间的学龄人口迁入率和学龄人口留存率进行训练学习,直至人口预测模型的预测误差率小于第一误差阈值,确定最后一次训练得到的人口预测模型为学龄人口预测模型。
6.根据权利要求1~5任一项所述的方法,其特征在于,所述方法还包括:
获取所述目标对象的学位资源配置数据;
将所述学位资源配置数据与目标学位资源需求数进行比较,得到学位资源比较结果;
依据所述学位资源比较结果,确定所述目标对象的学位资源调控信息,其中,所述学位资源调控信息包括目标学区学位资源缺口数,和/或目标校区学位资源缺口数,和/或针对所述目标对象的学位资源调配建议;
输出所述学位资源调控信息。
7.根据权利要求6所述的方法,其特征在于,所述获取目标对象的学位资源预测数据,包括:
接收针对目标对象的学位资源查询请求;其中,所述学位资源查询请求是电子设备响应于对学位资源查询页面的输入操作生成并发送的;
响应所述学位资源查询请求,从第三方平台,获取所述目标对象的学位资源预测候选数据;
对获取的学位资源预测候选数据进行异常筛选和缺失值插补处理,得到学位资源预测数据;
其中,若所述目标对象为目标校区,所述学位资源查询页面具有查询结果展示区域以及不同学区不同校区位置的地图展示区域,所述学位资源调控信息的展示实现方法包括:
电子设备响应于对所述地图展示区域中所述目标校区的学位资源查询选择操作,弹出校区学位资源预警面板,在所述校区学位资源预警面板展示下一年所述目标校区学位资源缺口数,以及针对所述目标校区的学位资源调配建议;其中,所述目标校区学位资源缺口数包括目标校区的班级缺口数和学龄人口缺口数;
且,在所述学位资源查询页面的查询结果展示区域内,展示所述目标校区所在目标学区在多个未来年份各自的目标学区学位资源缺口数;所述目标学区学位资源缺口数包括:相应未来年份内所述目标学区出现学位资源缺口的预警校区数,以及各预警校区的班级缺口数和学龄人口缺口数。
8.根据权利要求2~5任一项所述的方法,其特征在于,若所述目标对象为待建校区,所述获取目标对象的学位资源预测数据,包括:
确定所述待建校区所在的目标学区;
获取所述目标学区的学位资源预测数据;
所述将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数,输出所述目标对象的目标学位资源需求数,包括:
将所述学位资源特征参数输入多层概率预测模型,得到所述待建校区的学位资源预测数据;
将所述待建校区的学位资源预测数据发送学位资源查询平台进行展示。
9.一种学位资源预测装置,其特征在于,所述装置包括:
预测数据获取模块,用于获取目标对象的学位资源预测数据;所述学位资源预测数据包括所述目标对象的人口流动数据、多维教育数据以及学区房交易数据中的至少一种;
特征参数得到模块,用于对所述学位资源预测数据进行预处理,得到学位资源预测特征参数;
预测处理模块,用于将所述学位资源特征参数输入学位资源预测模型,得到所述目标对象的目标学位资源需求数;所述学位资源预测模型能够表征不同学区和/或不同校区的历史学位资源预测数据,与相应学区或校区的学位资源需求数之间的依赖关系,其中,所述校区的学位资源需求数依赖于层次结构的历史学位资源预测数据;
学位资源需求数输出模块,用于输出所述目标对象的目标学位资源需求数。
10.一种计算机设备,其特征在于,所述计算机设备包括:
通信接口;
存储器,用于存储实现如权利要求1-8任意一项所述的学位资源预测方法的程序;
处理器,用于加载并执行所述存储器存储的程序,以实现如权利要求1-8任意一项所述的学位资源预测方法的各步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110405559.2A CN115222081A (zh) | 2021-04-15 | 2021-04-15 | 学位资源预测方法、装置及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110405559.2A CN115222081A (zh) | 2021-04-15 | 2021-04-15 | 学位资源预测方法、装置及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115222081A true CN115222081A (zh) | 2022-10-21 |
Family
ID=83605005
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110405559.2A Pending CN115222081A (zh) | 2021-04-15 | 2021-04-15 | 学位资源预测方法、装置及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115222081A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796347A (zh) * | 2022-11-23 | 2023-03-14 | 天闻数媒科技(北京)有限公司 | 教育资源投入均衡度预测方法、装置、设备及存储介质 |
CN117634802A (zh) * | 2023-11-27 | 2024-03-01 | 四川才子软件信息网络有限公司 | 一种学区学位情况预测方法、设备及介质 |
-
2021
- 2021-04-15 CN CN202110405559.2A patent/CN115222081A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796347A (zh) * | 2022-11-23 | 2023-03-14 | 天闻数媒科技(北京)有限公司 | 教育资源投入均衡度预测方法、装置、设备及存储介质 |
CN117634802A (zh) * | 2023-11-27 | 2024-03-01 | 四川才子软件信息网络有限公司 | 一种学区学位情况预测方法、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mimis et al. | Property valuation with artificial neural network: the case of Athens | |
Camacho Olmedo et al. | Interest in intermediate soft-classified maps in land change model validation: suitability versus transition potential | |
CN111091196B (zh) | 客流数据确定方法、装置、计算机设备和存储介质 | |
CN111177473B (zh) | 人员关系分析方法、装置和可读存储介质 | |
Marsal-Llacuna et al. | Smart urban planning: designing urban land use from urban time use | |
Du et al. | A comparative approach to modelling multiple urban land use changes using tree-based methods and cellular automata: the case of Greater Tokyo Area | |
WO2016206557A1 (zh) | 一种风险识别方法及装置 | |
Hu et al. | Uncertain Gompertz regression model with imprecise observations | |
CN115222081A (zh) | 学位资源预测方法、装置及计算机设备 | |
Bai et al. | A forecasting method of forest pests based on the rough set and PSO-BP neural network | |
Willekens | Evidence-based monitoring of international migration flows in Europe | |
Corrente et al. | Handling imprecise evaluations in multiple criteria decision aiding and robust ordinal regression by n-point intervals | |
Mas et al. | LUCC modeling approaches to calibration | |
Assareh et al. | A metaheuristic approach to forecast the global carbon dioxide emissions | |
Chao | Estimating project overheads rate in bidding: DSS approach using neural networks | |
US11099107B2 (en) | Component testing plan considering distinguishable and undistinguishable components | |
Yet et al. | Estimating criteria weight distributions in multiple criteria decision making: a Bayesian approach | |
Zhao et al. | LandSys II: Agent-based land use–forecast model with artificial neural networks and multiagent model | |
CN116776006B (zh) | 用于企业融资的客户画像构建方法及系统 | |
Verma et al. | A systematic review on the advancement in the study of fuzzy variational problems | |
Almomani et al. | Selecting a good stochastic system for the large number of alternatives | |
Soto-Ferrari et al. | AGGFORCLUS: A hybrid methodology integrating forecasting with clustering to assess mitigation plans and contagion risk in pandemic outbreaks: the COVID-19 Case Study | |
Jagtenberg et al. | Optimal ambulance dispatching | |
CN111598114A (zh) | 隐藏状态序列的确定方法和街区的功能类型的确定方法 | |
CN115994312A (zh) | 一种行为分析方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |