CN108830402A - 一种人口预测方法及装置 - Google Patents
一种人口预测方法及装置 Download PDFInfo
- Publication number
- CN108830402A CN108830402A CN201810426357.4A CN201810426357A CN108830402A CN 108830402 A CN108830402 A CN 108830402A CN 201810426357 A CN201810426357 A CN 201810426357A CN 108830402 A CN108830402 A CN 108830402A
- Authority
- CN
- China
- Prior art keywords
- population
- forecast
- prediction
- task
- population forecast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 230000007547 defect Effects 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 24
- 230000035558 fertility Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 17
- 230000034994 death Effects 0.000 description 9
- 231100000517 death Toxicity 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 230000004083 survival effect Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 235000007926 Craterellus fallax Nutrition 0.000 description 2
- 240000007175 Datura inoxia Species 0.000 description 2
- 235000013405 beer Nutrition 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000008140 language development Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001617 migratory effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及计算机技术领域,尤其涉及一种人口预测方法及装置,用以解决现有技术中存在的人口预测的角度以及依赖的预测模型较为单一、扩展性较差的问题。主要包括:获取用于进行人口预测的指标数据,生成至少一项人口预测任务,从预设模型集合中,为至少一项人口预测任务中每个人口预测任务选取相应的预测模型,针对每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。从而,避免现有技术中人口预测产品仅依赖单一预测模型进行人口预测的缺陷,可以从预设模型集合中的至少两种预测模型中选择相应的预测模型,支持使用多种预测模型,从而,提升人口预测产品的使用效率以及可扩展性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种人口预测方法及装置。
背景技术
当前各个国家经济的发展、环境的变化、资源的配置等都离不开人口结构的变化。在这样的需求下,高精度的人口预测方案尤为重要。
目前存在的一些人口预测软件,例如:Spectrum,PDE,PADIS-INT等。这些人口预测软件仅支持单一预测模型,导致人口预测的角度以及依赖的预测模型较为单一。而且这些人口预测软件是基于用户界面进行操作,扩展性较差。
综上,亟需找到一种新的人口预测方案以克服上述缺陷。
发明内容
本申请实施例提供一种人口预测方法及装置,用以解决现有技术中存在的人口预测的角度以及依赖的预测模型较为单一、扩展性较差的问题。
为了解决上述技术问题,本申请实施例采用下述技术方案:
第一方面,提供了一种人口预测方法,包括:
获取用于进行人口预测的指标数据,所述指标数据为反映人口信息的至少一项指标信息;
生成至少一项人口预测任务;
从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,其中,所述预设模型集合中包含至少两种类型的预测模型;
针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。
第二方面,提供了一种人口预测装置,包括:
获取模块,用于获取用于进行人口预测的指标数据,所述指标数据为反映人口信息的至少一项指标信息;
生成模块,用于生成至少一项人口预测任务;
选取模块,用于从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,其中,所述预设模型集合中包含至少两种类型的预测模型;
预测模块,用于针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。
第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的人口预测方法的步骤。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过本申请技术方案,获取用于进行人口预测的指标数据,生成至少一项人口预测任务,从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。从而,基于多种预测模型以各个角度进行人口预测,此外还引入了贝叶斯概率模型。避免了现有技术中人口预测产品仅依赖单一预测模型进行人口预测的缺陷,可以从预设模型集合中的至少两种预测模型中选择相应的预测模型,支持使用多种预测模型,从而,提升人口预测产品的使用效率以及可扩展性。同时,本申请采用基于浏览器的开发,用户只要有网络可以随时随地访问该服务,可视化较为丰富,支持自动化生成报告。还可以同时支持多种语言。可以修改模型使用的任何参数,模拟政策变化带来的人口结构变化。支持用户进行多任务的对比,可以对同类任务进行对比,也可以对不同人口结构的国家进行对比。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请所涉及的人口预测方案所适用的系统架构示意图;
图2a为本申请实施例提供的人口预测方法的步骤示意图之一;
图2b为本申请实施例中步骤23的具体实现步骤示意图;
图2c为本申请实施例中步骤22的具体实现步骤示意图;
图2d为本申请实施例提供的人口预测方法的步骤示意图之二;
图2e为本申请实施例提供的人口预测方法的步骤示意图之三;
图3a为本申请实施例提供的以分要素模型进行人口预测的步骤示意图;
图3b为本申请实施例提供的以多状态模型进行人口预测的步骤示意图;
图4a为本申请提供的人口预测装置的结构示意图之一;
图4b为本申请提供的人口预测装置的结构示意图之二;
图4c为本申请提供的人口预测装置的结构示意图之三。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
需要说明的是,本申请说明书所涉及的人口预测方案是基于多种预测模型实现的,基于浏览器的系统。人口预测是对人口的数量和结构进行预测,对经济、社会、环境的发展有指导作用,为政府决策提供重要依据。人口数量由出生、死亡和迁移决定,确定了这三个组分的变化,就可以确定人口数的变化趋势。本专利采用多种人口预测模型预测世界各国人口变化趋势,包括分要素模型、基于贝叶斯的概率人口预测模型、多状态模型、多维家庭户模型,并基于预测结果计算各项人口关键指标的值,较为全面的涵盖了人口结构预测的各类统计模型。另外,软件本身基于浏览器操作,用户在何时何地都可以使用。各项指标的预测结果支持报表报告的导出功能,并支持打印。
因此,在介绍本申请方案之前,对有可能涉及到的术语进行解释。
--人口预测:人口预测就是根据现有的人口状况并考虑影响人口发展的各种因素,按照科学的方法,测算在未来某个时间的人口规模、水平和趋势。
--分要素模型:分要素模型将人口划分为按照分年龄、性别的队列,并由生育、死亡和迁移行为来解释。
--多状态模型:在分要素模型的基础上考虑人口状态,例如:教育、城乡、婚姻、宗教等,通过考虑状态转移率,预测每个状态下的分年龄和性别的人口数。
--总和生育率:指该国家或地区的妇女在育龄期间,每个妇女平均的生育子女数。
--分年龄生育率:指任一年龄组中每1000妇女的全年活产婴儿数。
--模型生命表:能够概括许多国家和地区人口死亡风险的一套有代表性的生命表。主要作用是在缺乏可靠基础数据的情况下,帮助估计出人口的死亡率、平均预期寿命等风险参数。
--婴儿死亡率:指婴儿出生后不满周岁死亡人数同出生人数的比率。
--出生性别比:某一时期内出生男婴与女婴的数量之比的反映。其数值为每100名女婴对应的男婴数。
下面通过以下实施例对本申请所涉及的方案进行详述。
参照图1所示,为本申请所涉及的人口预测方案所适用的系统架构,该系统架构中执行人口预测方法的执行主体可以为服务器11,而用户可以通过能够访问服务器11的终端设备12与服务器11进行交互。参照图1中所示,该系统架构中可以包含一台服务器11和多台终端设备12,每台终端设备12可以被用户以Web网页的方式访问来实现人口预测。
实施例一
参照图2a所示,为本申请实施例提供的人口预测方法的步骤示意图,其中,该方法的执行主体可以为服务器,该方法主要包括以下步骤:
步骤21:获取用于进行人口预测的指标数据,所述指标数据为反映人口信息的至少一项指标信息。
应理解,在本申请中,这些指标数据可以是从某些公认的权威机构获取或是申请采集,这些权威机构可以为:联合国或是世界银行等合法机构。
其中,指标数据可以理解为包含至少一项指标信息的数据集合。指标信息具体可以为:基础年份人口数据、分年龄生育率、简易生命表、出生性别比、婴儿死亡率等信息中的一种。
在获取到这些用于进行人口预测的指标数据之后,会将这些指标数据以不同的方式(由于指标数据的格式有可能不同,因此,存储方式会有差别,例如:有些以表格形式存储,有些以文字形式存储,有些以图标形式存储等)存储在预设的数据库中,该数据库可以是一个关系型数据库管理系统,例如,由瑞典MySQL AB公司开发的MYSQL数据库。MySQL数据库是最流行的关系型数据库管理系统之一,在WEB应用方面的效果尤佳。而且,考虑到用于进行人口预测的指标数据的信息数量较大,即其涵盖的指标信息较多,因此,可选用在服务器内部设置数据库或是外置为该服务器服务的数据库,以减小服务器的存储开销,同时合理布局设计数据库。
需要说明的是,鉴于人口信息是时刻发生变化的,因此,执行人口预测的服务器可以通过周期性访问相应权威机构的方式,更新自身配置的数据库中的指标信息。这里的更新操作可以包括但不限于:增加新的指标信息、修改变化的指标信息、删除旧的指标信息等。
步骤22:生成至少一项人口预测任务。
应理解,本申请中并不是仅在同一时刻生成一项人口预测任务,在任一时刻,可以同时生成一项或是多项人口预测任务,即可以并行处理多项人口预测任务。
步骤23:从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,其中,所述预设模型集合中包含至少两种类型的预测模型。
本申请实施例中,预设模型集合中的预测模型包括:分要素模型、贝叶斯概率模型和多状态模型等人口预测模型中的至少两种。因此,当生成有一项或是多项人口预测任务时,服务器可从预设模型集合中,为每项人口预测任务选取相应的预测模型。由此,避免了现有技术中人口预测产品仅依赖单一预测模型进行人口预测的缺陷,可以从预设模型集合中的至少两种预测模型中选择相应的预测模型,支持使用多种预测模型,从而,提升人口预测产品的使用效率以及可扩展性。
应理解,预设模型集合可以为服务器管理人员预先存储的,随着人口预测技术的发展,在出现新的预测模型或是有其他预测方式时,可根据需求更新预设模型集合。
步骤24:针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。
应理解,本申请的人口预测方案可以按照一定顺序依次执行相应的人口预测任务,也可以并行执行多个人口预测任务。针对每个人口预测任务,将与该人口预测任务相关的指标数据中指标信息输入选取的预测模型中,以执行人口预测。
在通过预测模型得到人口预测结果之后,可以将这些人口预测结果存入MySQL数据库中,以便于后续方便使用。
通过该技术方案,获取用于进行人口预测的指标数据,生成至少一项人口预测任务,从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。从而,基于多种预测模型以各个角度进行人口预测,此外还引入了贝叶斯概率模型。避免了现有技术中人口预测产品仅依赖单一预测模型进行人口预测的缺陷,可以从预设模型集合中的至少两种预测模型中选择相应的预测模型,支持使用多种预测模型,从而,提升人口预测产品的使用效率以及可扩展性。
可选地,基于上述实施例,参照图2b所示,步骤23在从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型时,可具体执行为以下子步骤:
子步骤231:确定所述至少一项人口预测任务中每个人口预测任务的任务内容。
在本申请中,任务内容可以包括:预测目标年份的人口数、预测总和生育率和预测预期寿命等预测项目中的任意一种或多种组合;其中,分要素模型主要用于:预测目标年份的人口数;贝叶斯概率模型主要用于:预测总和生育率、预测预期寿命;多状态模型主要用于:预测目标年份的人口数,而且该多状态模型主要是基于分要素模型进行的状态考虑。上述表述中,可定义:预测目标年份的人口数与分要素模型相关,预测总和生育率、预测预期寿命与贝叶斯概率模型相关,预测目标年份的人口数还与多状态模型相关。
子步骤232:从预设模型集合中选取与所述任务内容相关的预测模型。
基于上述子步骤231的描述,当每个人口预测任务的任务内容包含预测项目的个数为一个时,从预设模型集合中可以选取与任务内容中的该预测项目相关的一个预测模型;其实,当为了比较不同预测模型对同一预测项目进行预测的差异时,还可以为该预测项目同时选择两种预测模型,分别进行人口预测以便于后续比较预测结果。当每个人口预测任务的任务内容包含预测项目的个数为多个时,从预设模型集合中可以选取与任务内容中的每个预测项目相关的预测模型,这样,可以选取出多个或是一个。
可选地,在本申请实施例中,参照图2c所示,步骤22在生成至少一项人口预测任务时,具体包括以下子步骤:
子步骤221:接收用户在浏览器界面操作而生成的指令信息。
具体地,当用户在终端设备的浏览器界面输入网址或是点击进入该产品的网页后,可根据用户在Web前端的界面操作生成指令信息,服务器接收该指令信息。
子步骤222:根据所述指令信息生成至少一项人口预测任务。
服务器响应该指令信息,生成至少一项人口预测任务的json。
应理解,本申请支持的预测模型种类多,对应于不同的功能,如教育和城乡的人口预测,模型使用R语言开发,新增或修改都非常灵活。而且该人口预测方案基于web操作,何时何地都可以在有网络条件下使用,人口预测结果的图表展示较为丰富,且用户可以自行修改参数,进行不同政策的模拟。系统支持多语言,可以服务于多个国家的用户,达到国际化标准。
其实,在本申请中,并不限于采用浏览器界面的方式进行人口预测,还可以采用应用用户界面的方式实现。由此,本申请的人口预测方案的适用场景更为灵活。
可选地,本申请方案中,参照图2d所示,在执行人口预测操作后,还包括以下步骤:
步骤25:统计并比对至少两项人口预测任务的人口预测结果。
针对得到的人口预测结果,可以对同一任务内容的人口预测结果进行比对。例如,分别根据分要素模型以及多状态模型得到的目标年份的人口数1以及目标年份的人口数1,将这两个人口预测结果进行比对分析。再如,对分别跟贝叶斯概率模型得到的A国家与B国家的总和生育率进行比对分析。
可选地,基于上述任一实施例,参照图2e所示,在执行人口预测操作后,还包括:
步骤26:将人口预测结果和/或比对结果进行展示。
虽然本申请主要是基于Web界面实现人口预测,在得到相应的人口预测结果之后,可将人口预测结果和/或比对结果进行展示,方便用户查看。
此外,还可以将人口预测结果和/或比对结果作为报告插入文档或是打印。
下面通过具体的实例对本申请所涉及的预测模型进行详细描述。
--分要素模型
人口预测任务:分年龄、性别的人口预测;模型分组队列包括生育,死亡和迁移的变化。遵循的原理是随着时间的变化,人群中的每个人都会变老。
模型涉及公式:
P(t+n)=P(t)+B(t)-D(t)+I(D)-E(D) (1)
P(t)是基础年份人口数,B(t)是从t到t+n年出生的人数,D(t)是从t到t+n年死亡的人数,I(t)是从t到t+n迁移进的人数,E(t)是从t到t+n迁移出的人数。
需要的指标数据:基础年份分年龄性别的人口数、生命表、分年龄的生育率、分年龄性别的净迁移人数(如果假定封闭则不需要)。
假设按照5岁年龄组进行人口预测,即0~4,5~9,...,80+,参照图3a所示,预测步骤如下:
步骤31a:计算存活人数。
根据生命表计算存活率(某些组需要合并,如0~1岁和1~5岁组),5Lx/5Lx-5为存活率,其中5Lx为此年龄组活的人年数。活到下一个年龄段的人数为:
开口组计算略有不同,需要结合前面两个年龄组的存活人数:
其中,Tx为在x岁后将要活的总人年数。
步骤32a:调整移民数。
具体操作时,可在以上基础上加上分年龄和性别的净移民数。
步骤33a:计算出生人数。
出生总人口数:
其中,5Fx为分年龄的生育率,β为目标年份。
分性别的出生人口数:
步骤34a:计算出生人口的存活数。
由于从出生到预测的时间间隔内,新生儿会有一部分死亡,例如,在2010-2011年间出生的婴儿,在2015年是4岁,在此过程中,会有一部分在0-1岁或1-4岁死亡。
其中,S(0,t+5)=5L0/(5·I0),表示婴儿存活率。
步骤35a:调整0~4岁移民数。
步骤36a:将5岁组转为1岁组,得到1岁组的分年龄和性别的人口数。
在计算得到5岁组结果后,使用Beers方法将5岁组插补为1岁组,需要对年份和年龄进行拆分,在拆分时,不需要考虑开口组(80+)。
例如:以下表1表示为五岁组人口数;表2所示为插补为1岁组的结果:
年龄 | 人口数 |
15~19 | 35700 |
20~24 | 30500 |
25~29 | 32600 |
表1
年龄 | 人口数 |
15 | 7000 |
16 | 7100 |
… | … |
28 | 6000 |
29 | 6100 |
表2
--多状态模型
人口预测任务:分教育水平、城乡、年龄、性别等状态的人口预测;分教育水平的人口预测是多状态模型中比较常见的应用,只是在普通分要素模型的基础上。
将教育水平分为4类:未受教育,初等教育,中等教育,高等教育。假定只能从低教育水平到高教育水平转移。由于分教育状态的移民人数难获得,因此这里假定迁移人数为0。参照图3b所示,该人口预测方法包括:
步骤31b:计算出生人口数。
基于不同教育状态下的总和生育率,计算出生人口总数,根据婴儿死亡率计算存活数,根据出生性别比分别计算0~4岁男性和女性人口数。
步骤32b:计算死亡人口数。
根据不同教育状态下的存活率,计算死亡人数。
步骤33b:计算转移人数。
根据状态转移率(升学)计算转移人数,如2010年0~4岁人口,一部分将从无教育转移到初等教育,2015年,这部分人将变更为5~9岁的初等教育组。为了计算方便,这里假定任何年龄段在前3个教育水平下都会发生转移,因此将转移率设定为一个3列的矩阵。
步骤34b:将5岁组转为1岁组。
使用Beers方法将5岁组转为1岁组,拆分年龄和年份。
--贝叶斯概率模型
除传统的分要素模型外,本申请还提供近年来联合国采用的基于贝叶斯概率的人口预测模型,使用贝叶斯概率模型分别预测总和生育率和预期寿命,将预测结果转换为分年龄的数据,再用分要素模型进行人口预测。与传统的预测总和生育率和预期寿命的方法不同,贝叶斯概率模型将总和生育率和预期寿命认为是不确定的,因此模型给出的是其概率分布,并非确定性地进行预测。
人口预测任务:总和生育率的预测、预期寿命的预测、人口数的预测。
其中,在对全球所有国家的总和生育率进行预测时,贝叶斯概率模型将总和生育率的变化分解成三个阶段:
阶段(1)、转移前的高生育率阶段;
阶段(2)、生育率转移阶段;
阶段(3)、转移后的低生育率阶段。
在此之前的确定性模型认为生育率最终会低于人口替代水平。贝叶斯概率模型在拟合生育率的降低时使用了两个logistic方程和一个随机项的和,采用MCMC算法估计。
在对全球所有国家的女性出生预期寿命进行预测时,女性出生预期寿命的预测与总和生育率预测的第二步类似,采用两个logistic函数和一个随机项预测寿命的增长,由于男性出生预期寿命与女性高度相关,因此可以一起估计,首先估计女性预期寿命,再估计二者的差值,得到男性出生预期寿命。
其实,在对总和生育率和预期寿命进行转换时,使用总和生育率在年龄上的分布计算分年龄生育率,用历史的死亡比例数据,使用Lee-Carter方法将出生预期寿命转换为分年龄的死亡率。
此外,还可以用以上参数的预测结果使用分要素模型进行人口预测,方法与之前提到的分要素模型相同,预测结果给出高中低三个方案。高和低是指在总和生育率的基础上加减0.5个孩子。
在系统层面,用户可以自行选择用来预测的历史数据的时间段和预测的年限,得出预测值。由于预测算法需要的时间较长,计算过程可以运行在后台,运算结束后保存在数据库中。贝叶斯概率的人口预测模型与传统的确定性的预测模型相比较更加客观,可以重复联合国的预测结果,但总和生育率和出生预期寿命预测需要的计算资源和时间较长,可以接受的是,预测一次可以长期使用。
下面基于具体的预测实例的结果对模型预测效果进行分析。
--分要素模型
指标数据及来源:起始年人口数、生育率、简易生命表、出生性别比等指标来自联合国。
模型建立:标准分要素模型主要利用人口平衡方程建立,相关程序使用R语言编程实现。用户选定起始年和终止年,可以预测各年份人口数。
应用举例:例如通过2010年人口数据,预测到2030年人口数。
以下表格为预测结果与联合国结果比对分析表:
年份 | 联合国-男 | 预测-男 | 相对误差 | 联合国-女 | 预测-女 | 相对误差 |
2010-2015 | 13653563 | 13657168 | 0.02% | 14205740 | 14139241 | 0.47% |
2015-2020 | 16109023 | 16162007 | 0.33% | 16718380 | 16689460 | 0.17% |
2020-2025 | 18876896 | 18985525 | 0.58% | 19554307 | 19611380 | 0.29% |
2025-2030 | 21976524 | 22152763 | 0.080% | 22735755 | 22930750 | 0.86% |
表3
--分状态模型
数据来源:维特根斯坦中心
模型建立:分状态模型在标准分要素模型的基础上考虑了状态转移率,相关程序使用R语言编程实现。用户选定起始年和终止年,可以预测分教育状态下的各年份人口数。
应用举例:例如通过2010年分教育人口数,预测到2050年分教育人口数;在此并不示出预测结果。
--贝叶斯概率模型
数据来源:联合国的历史数据
应用举例:利用联合国的历史数据和bayesTFR,bayesLife两个R包将总和生育率和预期寿命预测出来,再利用bayesDem预测人口数,预测结果与标准分要素模型相似,在此并不示出预测结果。
实施例二
与上述人口预测方法属于同一发明构思,本申请实施例还提供一种人口预测装置。
参照图4a所示,为本申请提供的人口预测装置的结构示意图,该人口预测装置主要包括:
获取模块41,用于获取用于进行人口预测的指标数据,所述指标数据为反映人口信息的至少一项指标信息;
生成模块42,用于生成至少一项人口预测任务;
选取模块43,用于从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,其中,所述预设模型集合中包含至少两种类型的预测模型;
预测模块44,用于针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。
可选地,选取模块43,具体用于:确定所述至少一项人口预测任务中每个人口预测任务的任务内容;从预设模型集合中选取与所述任务内容相关的预测模型。
可选地,生成模块42,具体用于:接收用户在浏览器界面操作而生成的指令信息;根据所述指令信息生成至少一项人口预测任务。
可选地,参照图4b所示,本申请的人口预测装置还包括:
比对模块45,用于统计并比对至少两项人口预测任务的人口预测结果。
可选地,参照图4c所示,本申请的人口预测装置还包括:
展示模块46,用于将人口预测结果和/或比对结果进行展示。
实施例三
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述人口预测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (11)
1.一种人口预测方法,其特征在于,包括:
获取用于进行人口预测的指标数据,所述指标数据为反映人口信息的至少一项指标信息;
生成至少一项人口预测任务;
从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,其中,所述预设模型集合中包含至少两种类型的预测模型;
针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。
2.如权利要求1所述的人口预测方法,其特征在于,从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,具体包括:
确定所述至少一项人口预测任务中每个人口预测任务的任务内容;
从预设模型集合中选取与所述任务内容相关的预测模型。
3.如权利要求1或2所述的人口预测方法,其特征在于,生成至少一项人口预测任务,具体包括:
接收用户在浏览器界面操作而生成的指令信息;
根据所述指令信息生成至少一项人口预测任务。
4.如权利要求1所述的人口预测方法,其特征在于,还包括:
统计并比对至少两项人口预测任务的人口预测结果。
5.如权利要求4所述的人口预测方法,其特征在于,还包括:
将人口预测结果和/或比对结果进行展示。
6.一种人口预测装置,其特征在于,包括:
获取模块,用于获取用于进行人口预测的指标数据,所述指标数据为反映人口信息的至少一项指标信息;
生成模块,用于生成至少一项人口预测任务;
选取模块,用于从预设模型集合中,为所述至少一项人口预测任务中每个人口预测任务选取相应的预测模型,其中,所述预设模型集合中包含至少两种类型的预测模型;
预测模块,用于针对所述每个人口预测任务,基于选取的预测模型以及获取的指标数据进行人口预测。
7.如权利要求6所述的人口预测装置,其特征在于,所述选取模块,具体用于:
确定所述至少一项人口预测任务中每个人口预测任务的任务内容;
从预设模型集合中选取与所述任务内容相关的预测模型。
8.如权利要求6或7所述的人口预测装置,其特征在于,生成模块,具体用于:
接收用户在浏览器界面操作而生成的指令信息;
根据所述指令信息生成至少一项人口预测任务。
9.如权利要求6所述的人口预测装置,其特征在于,还包括:
比对模块,用于统计并比对至少两项人口预测任务的人口预测结果。
10.如权利要求9所述的人口预测装置,其特征在于,还包括:
展示模块,用于将人口预测结果和/或比对结果进行展示。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的人口预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810426357.4A CN108830402A (zh) | 2018-05-07 | 2018-05-07 | 一种人口预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810426357.4A CN108830402A (zh) | 2018-05-07 | 2018-05-07 | 一种人口预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108830402A true CN108830402A (zh) | 2018-11-16 |
Family
ID=64147617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810426357.4A Pending CN108830402A (zh) | 2018-05-07 | 2018-05-07 | 一种人口预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108830402A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651727A (zh) * | 2020-05-29 | 2020-09-11 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN112330033A (zh) * | 2020-11-10 | 2021-02-05 | 中国地震局地震预测研究所 | 一种人口综合预测方法及系统 |
CN112383625A (zh) * | 2020-11-16 | 2021-02-19 | 每日互动股份有限公司 | 区域人口数量的预测方法、装置、计算机设备及存储介质 |
CN112785061A (zh) * | 2021-01-26 | 2021-05-11 | 北京明略软件系统有限公司 | 用于预测家庭户规模方法、装置及设备 |
CN113191527A (zh) * | 2021-03-19 | 2021-07-30 | 特斯联科技集团有限公司 | 一种基于预测模型进行人口预测的预测方法及装置 |
CN114328654A (zh) * | 2021-12-10 | 2022-04-12 | 北京融信数联科技有限公司 | 一种基于大数据的人口统计方法、系统和可读存储介质 |
CN115018215A (zh) * | 2022-08-09 | 2022-09-06 | 北京融信数联科技有限公司 | 基于多模态认知图谱的人口居住预测方法、系统和介质 |
CN116150230A (zh) * | 2023-03-02 | 2023-05-23 | 重庆市规划和自然资源信息中心 | 基于多空间尺度进行动态住房人口登记监测方法 |
-
2018
- 2018-05-07 CN CN201810426357.4A patent/CN108830402A/zh active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111651727A (zh) * | 2020-05-29 | 2020-09-11 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN111651727B (zh) * | 2020-05-29 | 2023-09-26 | 京东城市(北京)数字科技有限公司 | 一种区域间整体人口转移量的计算方法及装置 |
CN112330033A (zh) * | 2020-11-10 | 2021-02-05 | 中国地震局地震预测研究所 | 一种人口综合预测方法及系统 |
CN112383625A (zh) * | 2020-11-16 | 2021-02-19 | 每日互动股份有限公司 | 区域人口数量的预测方法、装置、计算机设备及存储介质 |
CN112383625B (zh) * | 2020-11-16 | 2023-06-20 | 每日互动股份有限公司 | 区域人口数量的预测方法、装置、计算机设备及存储介质 |
CN112785061A (zh) * | 2021-01-26 | 2021-05-11 | 北京明略软件系统有限公司 | 用于预测家庭户规模方法、装置及设备 |
CN113191527A (zh) * | 2021-03-19 | 2021-07-30 | 特斯联科技集团有限公司 | 一种基于预测模型进行人口预测的预测方法及装置 |
CN114328654A (zh) * | 2021-12-10 | 2022-04-12 | 北京融信数联科技有限公司 | 一种基于大数据的人口统计方法、系统和可读存储介质 |
CN115018215A (zh) * | 2022-08-09 | 2022-09-06 | 北京融信数联科技有限公司 | 基于多模态认知图谱的人口居住预测方法、系统和介质 |
CN115018215B (zh) * | 2022-08-09 | 2022-11-25 | 北京融信数联科技有限公司 | 基于多模态认知图谱的人口居住预测方法、系统和介质 |
CN116150230A (zh) * | 2023-03-02 | 2023-05-23 | 重庆市规划和自然资源信息中心 | 基于多空间尺度进行动态住房人口登记监测方法 |
CN116150230B (zh) * | 2023-03-02 | 2023-08-29 | 重庆市规划和自然资源信息中心 | 基于多空间尺度进行动态住房人口登记监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830402A (zh) | 一种人口预测方法及装置 | |
CN110363449B (zh) | 一种风险识别方法、装置及系统 | |
Jongman et al. | Declining vulnerability to river floods and the global benefits of adaptation | |
Lu et al. | Research on mining of applied mathematics educational resources based on edge computing and data stream classification | |
US11604994B2 (en) | Explainable machine learning based on heterogeneous data | |
US10459934B2 (en) | Re-sizing data partitions for ensemble models in a mapreduce framework | |
JP6907664B2 (ja) | 非定常時系列データの予測に用いる方法及び装置 | |
Papík et al. | Impacts of crisis on SME bankruptcy prediction models’ performance | |
US20230061778A1 (en) | Conversation information processing method, apparatus, computer- readable storage medium, and device | |
US11803374B2 (en) | Monolithic computer application refactoring | |
US20230083810A1 (en) | Method and apparatus for processing molecular scaffold transition, medium, electronic device, and computer program product | |
Xia et al. | A minimum-volume oriented bounding box strategy for improving the performance of urban cellular automata based on vectorization and parallel computing technology | |
CN109375910A (zh) | 类文件生成方法、装置、电子设备及存储介质 | |
Al-Najjar | Impact of the twin pandemics: COVID-19 and oil crash on Saudi exchange index | |
US10824777B2 (en) | Employing natural language processing to facilitate geospatial analysis | |
US11790885B2 (en) | Semi-structured content aware bi-directional transformer | |
Salas et al. | A global prediction model for sudden stops of capital flows using decision trees | |
Mukherjee et al. | Self-organization of the Sound Inventories: Analysis and Synthesis of the Occurrence and Co-occurrence Networks of Consonants∗ | |
WO2021135330A1 (zh) | 图像样本选择方法及相关设备 | |
Mondreti et al. | Bug severity prediction system using xgboost framework | |
Siji Rani et al. | Spatio-temporal prediction in epidemiology using graph convolution network | |
Shao et al. | ℓp‐Norm Multikernel Learning Approach for Stock Market Price Forecasting | |
Iwata et al. | Bin-based estimation of the amount of effort for embedded software development projects with support vector machines | |
Jansevskis et al. | Machine Learning and on 5G Based Technologies Create New Opportunities to Gain Knowledge | |
Zhao | A resource sharing system for music education using the entropy technology |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100081 No.101, 1st floor, building 14, 27 Jiancai Chengzhong Road, Haidian District, Beijing Applicant after: Beijing PERCENT Technology Group Co.,Ltd. Address before: 100081 16 / F, block a, Beichen Century Center, building 2, courtyard 8, Beichen West Road, Chaoyang District, Beijing Applicant before: BEIJING BAIFENDIAN INFORMATION SCIENCE & TECHNOLOGY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181116 |