CN112990530B - 区域人口数量预测方法、装置、电子设备和存储介质 - Google Patents
区域人口数量预测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112990530B CN112990530B CN202011541316.3A CN202011541316A CN112990530B CN 112990530 B CN112990530 B CN 112990530B CN 202011541316 A CN202011541316 A CN 202011541316A CN 112990530 B CN112990530 B CN 112990530B
- Authority
- CN
- China
- Prior art keywords
- population
- attention
- regional
- urban
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 132
- 230000008859 change Effects 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 21
- 238000003062 neural network model Methods 0.000 claims abstract description 8
- 230000000694 effects Effects 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 7
- 230000000306 recurrent effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 10
- 125000004122 cyclic group Chemical group 0.000 abstract description 9
- 230000006870 function Effects 0.000 description 15
- 230000007246 mechanism Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000004913 activation Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000009435 building construction Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种区域人口数量预测方法、装置、电子设备和存储介质,其中,该方法包括:根据目标区域和时间窗口确定对应的城市人口变化序列;在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量;基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量;在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量。通过循环神经网络模型准确获取城市人口注意力向量,提高人口分析的特征准确性,使得人口预测过程贴合实际生活,可提高人口预测的准确性。
Description
技术领域
本发明实施例涉及数据处理技术领域,尤其涉及一种区域人口预测方法、装置、电子设备和存储介质。
背景技术
20世纪50年代以来,区域人口预测形成了一系列具有代表性的理论模型,例如,Clark模型、城市人口与城区面积间的异速生长模型、正态密度模型、负幂指数模型、二次指数模型等,随着多核城市结构研究的兴起,也随着出现了城市人口密度多核心模型,上述模型在用于预测区域人口变化时不能反映出真实的人口变化。
发明内容
本发明提供一种区域人口预测方法、装置、电子设备和存储介质,以实现区域人口数量预测的真实性。
第一方面,本申请实施例提供了一种区域人口数量预测方法,该方法包括:
根据目标区域和时间窗口确定对应的城市人口变化序列;
在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量;
基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量;
在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量。
第二方面,本申请实施例提供了一种区域人口数量预测装置,该装置包括:
序列获取模块,用于根据目标区域和时间窗口确定对应的城市人口变化序列;
时间特征模块,用于在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量;
空间特征模块,用于基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量;
人口预测模块,用于在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量。
第三方面,本申请实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请实施例中任一所述的区域人口数量预测方法。
第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如本申请实施例中任一所述的区域人口数量预测方法。
本申请实施例,通过目标区域和时间窗口确定城市人口变化序列,根据区域人口注意力模型处理城市人口变化序列获取区域人口注意力向量,基于城市人口注意力模型处理区域人口注意力向量获取城市人口注意力向量,在人口数量预测模型使用目标区域的属性信息和城市人口注意力向量获取到未来人口数量,预测过程贴合实际生活中人口数量非平稳变化的情况,提高目标区域人口预测的准确性。
附图说明
图1是本申请实施例一提供的一种区域人口数量预测方法的流程图;
图2是本申请实施例二提供的另一种区域人口数量预测方法的流程图;
图3是本申请实施例二提供的一种循环神经网络单元的结构示意图;
图4是本申请实施例二提供的一种区域人口数量预测方法的示例图;
图5是本申请实施例三提供的一种区域人口数量预测装置的结构示意图;
图6是本申请实施例四提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构,此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
区域人口预测是一项极具挑战性的工作,在人口预测的准确性收到诸多因素的影响,例如,时间的相关性、人口预测属性的相关性以及外部因素的相关性等,时间的相关信息可以包括区域人口发展随时间变化的相关性因素,也可以包括区域人口发展随空间发展的相关因素,例如,城市楼宇建设和交通建设等,外部因素的相关性可以包括区域气候、突发事件以及其他外部因素等,由于区域人口的发展在时间上具有序列性和周期性的规律性,可以根据这些特点对区域未来人口数量进行预测。
实施例一
图1是本申请实施例一提供的一种区域人口数量预测方法的流程图,本实施例可适用于预测区域未来人口数量的情况,该方法可以由区域人口数量预测装置来执行,该装置可以采用硬件和/或软件的方式来实现,参见图1,本申请实施例提供的方法具体包括如下步骤:
步骤110、根据目标区域和时间窗口确定对应的城市人口变化序列。
其中,目标区域可以可地理位置区域也可以是行政区域,目标区域对应的地区可以是城市中的一部分。时间窗口可以是获取目标区域的历史人口数量的时间范围,时间窗口的单位可以是年或者月。城市人口变化序列可以包括一个城市在时间窗口范围内的人口数量,例如,假设某个城市存在T个区域,给定的时间窗口为Y,则城市人口变化序列X=(x1,x2,x3,…,xk),其中,xi=(x1 i, x2 i,x3 i,…,xy i),i=1,…,k。
在本申请实施例中,可以根据目标区域查询该目标区域所在的城市,并基于时间窗口在该城市对应的历史人口数量数据集中查找对应时间的人口数量,可以查询到的人口数量按照时间的先后顺序排列生成城市人口变化序列。
步骤120、在预先训练生成的区域人口注意力模型以城市人口变化序列为输入层确定区域人口注意力向量。
其中,区域人口注意力模型可以是提取城市人口变化序列中区域和人口之间的关联关系的神经网络模型,区域人口注意力模型可以通过海量的具有时间标识的海量人口数据训练生成。
在本申请实施例中,可以将城市人口变化序列作为区域人口注意力模型的输入信息,可以通过模型中的隐藏层和激活函数处理城市人口变化序列,获取到模型输出的代表区域和人口之间关联关系的数据,可以将输出的数据合并为区域人口注意力向量,可以理解的是,输入的城市人口变化序列的维度与时间窗口的时间维度相对应,相应的,输出的区域人口注意力向量的维度可以与对应于区域人口注意力向量。
步骤130、基于预先训练的城市人口注意力模型处理区域人口注意力向量以获取城市人口注意力向量。
其中,城市人口注意力模型可以是提取城市中各区域之间关联关系的神经网络模型,由于区域的入住人口在城市内部具有相关性,例如,两个区域之间的人口变化趋势更接近,可以通过获取到不同区域之间的关联关系的特征来提高目标区域人口数量预测的准确性。
具体的,可以将获取到的区域人口注意力向量作为城市人口注意力模型的输入层的输入,通过城市人口注意力模型生成区域人口注意力向量对应的城市人口注意力向量,该城市人口注意力向量中各数据之间可以隐含有不同区域之间的关联特征。
步骤140、在预先训练的人口数量预测模型根据城市人口注意力向量和目标区域的属性信息确定时间窗口对应的未来人口数量。
其中,目标区域的属性信息可以是对人口数量产生影响的区域自身属性,可以包括政策影响和环境影响等。人口数量预测模型可以是对未来人口数量进行预测的神经网络模型,该神经网络模型可以使用海量具有时间标签的人口数量信息训练生成。
在本申请实施例中,可以对目标区域的属性信息进行向量化表示,可以将向量化的属性信息与城市人口注意力向量共同作为人口数量预测模型的输入层,在人口数量预测模型中通过激活函数进行处理获取到输出的未来人口数量,各未来人口数量对应的预测时间长度可以与时间窗口的时间长度对应。
本申请实施例,通过目标区域和时间窗口确定城市人口变化序列,根据区域人口注意力模型处理城市人口变化序列获取区域人口注意力向量,基于城市人口注意力模型处理区域人口注意力向量获取城市人口注意力向量,在人口数量预测模型使用目标区域的属性信息和城市人口注意力向量获取到未来人口数量,预测过程贴合实际生活中人口数量非平稳变化的情况,提高目标区域人口预测的准确性。
实施例二
图2是本申请实施例二提供的另一种区域人口数量预测方法的流程图,本申请实施例是在上述申请实施例基础上的具体化,参见图2,本申请实施例提供的方法具体包括如下步骤:
步骤210、获取目标区域对应的城市人口数据集。
具体的,可以根据目标区域的标识编号查找对应的城市人口数据集,其中,该城市人口数据集的数据来源可以包括号码常住区域信息,乘坐公共交通工具的人数系统信息,办理的居住证系统信息等。
步骤220、按照时间窗口在城市人口数据集获取历年人口信息组成城市人口变化序列。
其中,历年人口信息可以是目标区域所在城市的人口数量信息,在城市人口数据集中一个城市可以对应多个时间的人口数量信息。
在本申请实施例中,可以在获取到的城市人口数据集中以时间窗口对应的时间范围为检索关键词查询对应的人口数量信息,可以将获取到的人口数量信息按照对应的时间排列作为城市人口变化序列。
步骤230、将城市人口变化序列按照年份和地区输入到所述区域人口注意力模型。
其中,年份可以是城市人口序列中历年人口信息对应的时间信息,地区可以是是城市人口序列中历年人口信息对应的位置信息。城市人口变化序列中的历年人口信息是以年份和地区的形式进行排列,城市人口变化序列中可以包括有不同地区的按照年份排列的历年人口信息。
在本申请实施例中,可以将城市人口变化序列分别以年份和地区两个维度进行处理,可以将处理后的城市人口变化序列输入到区域人口注意力模型中。示例性的,由于同一城市所有地区存在区域性,可以通过区域人口注意力模型获取到不同区域的地区与年份的关联关系,对于给定的城市人口变化序列 X=(x1,x2,x3,…,xk),将X∈RY作为区域人口注意力模型的输入层的输入信息。
步骤240、在区域人口注意力模型通过隐藏层状态值对城市人口变化序列进行处理获取到对应的人口数量信息。
其中,隐藏层状态值可以是区域人口注意力模型中经过训练生成的取值,该隐藏层状态值具体可以通过激活函数映射生成,例如,可以在区域人口注意力模型的训练过程中使用h=feb(ht-1,xt)更新t时刻的隐藏层状态值,隐藏层状态值h=(h1,h2,…,hi),hi∈Rn,隐藏层状态值的确定考虑了训练样本中地区与年份之间的依赖关系。
在本申请实施例中,在区域注意力模型中通过隐藏层状态值对城市人口变化序列进行处理,使得城市人口变化序列中各历年人口信息映射为不同取值的人口数量信息,这些人口数量信息可以包含有不同地区的人口数量与年份的关联关系。
步骤250、排列各所述人口数量信息作为区域人口注意力向量。
具体的,可以将获取到的人口数量信息排列生成区域人口注意力向量,其中,区域人口注意力向量中每行或者每列可以分别与一个地区对应。
步骤260、将区域人口注意力向量作为输入层输入城市人口注意力模型。
在本申请实施例中,由于不同区域间的人口变化存在复杂的相关性,可以对区域人口注意力向量进行处理,获取不同区域对人口数量变化的影响。具体的,可以将区域人口注意力向量输入到城市人口注意力模型进行处理,其中,城市人口注意力模型可以通过包含地区、年份和人口数量的训练样本训练生成。
步骤270、获取城市人口注意力模型生成的对应地区的人口数量信息。
具体的,采集城市人口注意力模型输出的人口数量信息,该人口数量信息的输出顺序可以根据输入的区域人口注意力向量的地区排列顺序对应,不同的人口数量信息可以对应不同的地区,各地区对应的人口数量信息可以包含有不同地区间对人口数量的影响。
步骤280、排列对应所述地区的人口数量信息作为城市人口注意力向量。
在本申请实施例中,可以将获取到的人口数量信息排列为城市人口注意力向量,城市人口注意力向量中对应相同地区的人口数量信息可以处于相同行或者相同列。
步骤290、对目标区域的属性信息按照类型进行编码处理生成属性向量,其中,编码处理至少包括降维处理、归一化处理、转换编码处理中至少一种;合并属性向量和城市人口注意力向量作为待预测向量。
其中,类型可以是表示目标区域的属性信息的数据类型,由于属性信息的不同内容取值具有不同的离散程度,在使用属性信息进行预测前需要进行处理,示例性的,如下表所示,目标区域的属性信息按照其类型具有不同的离散程度,将ID离散属性的属性信息转换为向量,由于转换后的向量的维度较高,可以将编码后的向量分别输入到不同的嵌入层,将高维向量映射到低维向量,也就是向量的降维处理。对于一般离散属性,只进行转换编码,将属性信息转换为向量;对于连续属性的属性信息,则进行归一化处理。
在本申请实施例中,可以将目标区域的属性信息根据不同类型的离散程度分别进行降维处理、归一化处理、转换编码处理等处理,将目标区域的各属性信息转换为属性向量,其中,属性向量中每条信息可以分别对应一条属性信息。可以将属性向量与城市人口注意力向量进行合并,合并的方式在本申请中不进行限制,例如,可以直接拼接或者进行乘积运算等。可以将属性向量和城市人口注意力向量合并生成的向量作为待预测向量。
步骤2100、将待预测向量输入人口数量预测模型获取目标区域对应的未来人口数量向量。
具体的,可以将待预测向量输入人口数量预测模型的输入层,通过人口数量预测模型中的隐藏层进行处理获取到未来人口数量向量。示例性的,在一个人口数量预测模型中隐藏层公式可以为:其中,Wm可以表示待预测向量,cy′和gy′可以分别表示属性向量和城市人口注意力向量,/>bm和by可以为训练生成的隐藏层状态值。
步骤2110、提取未来人口数量向量中的人口数量分别作为时间窗口对应的未来人口数量。
本申请实施例,可以提取未来人口数量向量中每行或者每列信息可以分别对应一个未来年份的未来人口数量,未来人口数量向量中包含的未来人口数量的多少可以与时间窗口包含的年份的数量对应。
本申请实施例,通过查询目标区域对应的城市人口数据集,并按照时间窗口采集城市人口数据集中的历年人口信息组成城市人口变化序列,将该城市城市人口变化序列按照对应的地区和年份输入区域人口注意力模型处理获取人口数量信息,根据该人口数量信息排列生成区域人口注意力向量,基于城市人口注意力模型处理区域人口注意力向量获取到城市人口注意力向量,对目标区域的属性信息处理生成属性向量,合并属性向量和城市人口注意力向量的待预测向量在人口数量预测模型获取到未来人口数量,实现了目标区域人口的准确预测,提高了预测过程的真实性。
进一步的,在上述申请实施例的基础上,所述目标区域的属性信息至少包括:社会环境、服务设施、政策规划、交通便利程度、区位压力、自然环境、毕业季影响、春运影响、重大节日影响、大型工程影响和国际经济指标中一种。
在本申请实施例中,目标区域的属性信息对人口数量产生影响的角度可以划分自身因素和其他因素,其中,自身因素可以包括社会环境、服务设施、政策规划、交通便利程度、区位压力、自然环境等,其他因素可以包括毕业季影响、春运影响、重大节日影响、大型工程影响和国际经济指标等,可以理解的是,目标区域的属性信息具体可以包括其中的一种或者多种。
进一步的,在上述申请实施例的基础上,所述区域人口注意力模型、所述城市人口注意力模型和所述人口数量预测模型的网络结构为循环神经网络结构,所述循环神经网络结构至少包括更新门和输出门。
在本申请实施例中注意力模型、城市注意力模型和人口数量预测模型的网络结构可以循环神经网络结构,该循环神经网络结构中可以包括一个或者多个循环神经单元,参见图3,每个循环神经单元可以包括更新门和输出门,该循环神经单元由组合了传统的长短记忆循环模型的遗忘门和输入门作为一个单独的更新门,输出门使用ELU函数进行向量特征计算,输入值不会映射为数值较小的输出值,可以解决梯度消失问题,可减少输入变化或噪声的影响,具有更高的鲁棒性,由于ELU函数的的输出均值接近于零,使用该函数作为激活函数时具有更快的收敛速度。
在一个示例性的实施方式中,图4是本申请实施例二提供的一种区域人口数量预测方法的示例图,参见图4,该方法可以包括由三个部分组成,使用循环神经网络中的门控循环单元(Gated Recurrent Unit,GRU)获取不同区域在不同年份的区域相关性,以捕获城市内所有区域在不同年份的区域依赖性,并考虑外部因素对人口变化的影响,其中,本示例中的GRU为改进的循环神经网络单元,将忘记门和输入门合并为单一的更新门。首先,由于同一城市所有区域存在着区域性,本申请使用GRU单元,捕获预测所在不同区域在城市的区域序列。给定输入序列X=(x1,x2,x3,…,xk),将Xt∈RY作为该GRU单元在第t个区域的人口密度输入,可以使用函数h=feb(ht-1,xt)来更新该GRU单元在第t个时刻的隐藏层状态值,其中feb代表第2个GRU单元的更新函数,可以使用该GRU单元中的隐藏状态值h=(h1,h2,…,hi),hi∈Rn,获取到该城市所有年份所有区域的人口数量与年份的关联关系。其次,由于不同区域的人口变化存在复杂的相关性,为了能够自适应地捕获目标区域与其他区域的人口变化的相关性,可以对于GRU单元采用如下的区域注意力机制进行运算:
其中,需要学习的参数是ve,be∈Rn,We∈Rn×2m和Ue∈Rn×n,目标区域注意力的权重由编码器的第2个GRU单元各个区域的隐藏层状态值以及第1 个GRU单元的历史状态qy-1和sy-1共同决定。是衡量目标区域的第y年,第t个区域人口密度变化序列对目标区域当年人口变化率影响程度的注意力权重。在GRU单元中还可以采用softmax函数对注意力/>进行归一化,使得所有注意力权重之和为1。GRU单元处理后输出的向量如下:
其中,第1个GRU单元在区域年份y时的隐藏层状态值可以通过如下公式确定:qy=fea(qd-1,zd)(4),fea是第1个GRU单元的更新函数。本申请实施例中所在区域的注意力机制通过第1个GRU单元选择性地关注编码器第 2个GRU单元的隐藏层状态值,而不是平等地处理所有区域的隐藏层状态值。最后,在根据外部属性信息和区域人口注意力预测人口变化时,可以通过以下方式预先获取GRU单元中隐藏层状态值的注意力权重进行人口变化预测。
其中,vl,bl∈Rm,Wl∈Rm×2p和Ul∈Rm×m是GRU单元训练过程中学习的参数。采用softmax函数对进行归一化即可得到注意力权重/>cy′可以表示第y′年的所有区域注意力机制输出向量。在GRU单元的隐藏层中使用:/>对外部属性信息和区域人口注意力进行处理,最终的输出值作为人口数量预测结果。本示例性的实施方式中建立基于多粒度时间、空间注意力机制的循环神经网络MIX-RNN,它由分别结合目前区域人口注意力机制、区域所在城市同周期区域的注意力机制的2个编码器组成。首先其机制用来捕获一年中区域人口变化的时间序依赖性。在此基础上,引入目前预测预取的注意力机制,通过参考第一个阶段先前隐藏层的状态值和第二个阶段在各自预测区域对预测人口变化的影响。在解码器中引入时间、空间维度,以自适应的选择预测区域预测时点年的状态输出值,从而捕获预测区域人口空间序列的趋势性和周期性。其次,融合外部因素的模块。该模块用于处理区域目前自身承载能力和进入本区域的工作的取得居住证等的其他因素对预测人口变化的影响,其输出作为部分输入提供给解码器。基于多注意力机制、外部因素特征融合模块、对用以提高区域人口预测的准确性。
实施例三
图5是本申请实施例三提供的一种区域人口数量预测装置的结构示意图,可执行本发明任意实施例所提供的区域人口数量预测方法,具备执行方法相应的功能模块和有益效果。该装置可以由软件和/或硬件实现,具体包括:序列获取模块310、时间特征模块320、空间特征模块330和人口预测模块340。
序列获取模块310,用于根据目标区域和时间窗口确定对应的城市人口变化序列。
时间特征模块320,用于在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量。
空间特征模块330,用于基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量。
人口预测模块340,用于在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量。
本申请实施例,通过序列获取模块根据目标区域和时间窗口确定城市人口变化序列,时间特征模块根据区域人口注意力模型处理城市人口变化序列获取区域人口注意力向量,空间特征模块基于城市人口注意力模型处理区域人口注意力向量获取城市人口注意力向量,人口预测模块在人口数量预测模型使用目标区域的属性信息和城市人口注意力向量获取到未来人口数量,预测过程贴合实际生活中人口数量非平稳变化的情况,提高目标区域人口预测的准确性。
进一步的,在上述申请实施例的基础上,所述目标区域的属性信息至少包括:社会环境、服务设施、政策规划、交通便利程度、区位压力、自然环境、毕业季影响、春运影响、重大节日影响、大型工程影响和国际经济指标中一种。
进一步的,在上述申请实施例的基础上,所述序列获取模块310包括:
数据采集单元,用于获取目标区域对应的城市人口数据集。
序列生成单元,用于按照所述时间窗口在所述城市人口数据集获取历年人口信息组成城市人口变化序列。
进一步的,在上述申请实施例的基础上,所述时间特征模块320具体用于:将所述城市人口变化序列按照年份和地区输入到所述区域人口注意力模型;在所述区域人口注意力模型通过隐藏层状态值对所述城市人口变化序列进行处理获取到对应的人口数量信息;排列各所述人口数量信息作为区域人口注意力向量。
进一步的,在上述申请实施例的基础上,所述空间特征模块330具体用于:将所述区域人口注意力向量作为输入层输入所述城市人口注意力模型;获取所述城市人口注意力模型生成的对应所述地区的人口数量信息;排列对应所述地区的人口数量信息作为城市人口注意力向量。
进一步的,在上述申请实施例的基础上,所述人口预测模块340包括:
外部属性单元,用于对所述目标区域的属性信息按照类型进行编码处理生成属性向量,其中,所述编码处理至少包括降维处理、归一化处理、转换编码处理中至少一种。
向量合并单元,用于合并所述属性向量和所述城市人口注意力向量作为待预测向量。
预测单元,用于将所述待预测向量输入所述人口数量预测模型获取所述目标区域对应的未来人口数量向量;提取所述未来人口数量向量中的人口数量分别作为所述时间窗口对应的未来人口数量。
进一步的,在上述申请实施例的基础上,所述装置中所述区域人口注意力模型、所述城市人口注意力模型和所述人口数量预测模型的网络结构为循环神经网络结构,所述循环神经网络结构至少包括更新门和输出门。
实施例四
图6是本申请实施例四提供的一种电子设备的结构示意图,如图6所示,该电子设备包括处理器60、存储器61、输入装置62和输出装置63;电子设备中处理器60的数量可以是一个或多个,图6中以一个处理器60为例;电子设备中的处理器60、存储器61、输入装置62和输出装置63可以通过总线或其他方式连接,图6中以通过总线连接为例。
存储器61作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的区域人口数量预测方法对应的程序指令/模块(例如,区域人口数量预测装置中的序列获取模块310、时间特征模块320、空间特征模块330和人口预测模块340)。处理器60通过运行存储在存储器61中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的区域人口数量预测方法。
存储器61可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器61可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器61可进一步包括相对于处理器60远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置62可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置63可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种区域人口数量预测方法,该方法包括:
根据目标区域和时间窗口确定对应的城市人口变化序列;
在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量;
基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量;
在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的区域人口数量预测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器 (Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述区域人口数量预测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (7)
1.一种区域人口数量预测方法,其特征在于,所述方法包括:
根据目标区域和时间窗口确定对应的城市人口变化序列;
在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量,其中,所述区域人口注意力模型是提取城市人口变化序列中区域和人口之间的关联关系的神经网络模型;
基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量,其中,所述城市人口注意力模型是提取城市中各区域之间关联关系的神经网络模型;
在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量;
所述根据目标区域和时间窗口确定对应的城市人口变化序列,包括:获取目标区域对应的城市人口数据集;按照所述时间窗口在所述城市人口数据集获取历年人口信息组成城市人口变化序列,其中,所述城市人口变化序列中所述历年人口信息是以年份和地区的形式进行排列,所述年份表示所述城市人口序列中历年人口信息对应的时间信息,所述地区表示所述城市人口序列中历年人口信息对应的位置信息;
所述在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量,包括:将所述城市人口变化序列按照年份和地区输入到所述区域人口注意力模型;在所述区域人口注意力模型通过隐藏层状态值对所述城市人口变化序列进行处理获取到对应的人口数量信息;排列各所述人口数量信息作为区域人口注意力向量,其中,所述隐藏层状态值可以是区域人口注意力模型中经过训练生成的取值,所述隐藏层状态值由训练样本中地区和年份之间的依赖关系确定;
所述基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量,包括:将所述区域人口注意力向量作为输入层输入所述城市人口注意力模型;获取所述城市人口注意力模型生成的对应所述地区的人口数量信息;排列对应所述地区的人口数量信息作为城市人口注意力向量,其中,区域人口注意力向量中每行或者每列可以分别与一个地区对应。
2.根据权利要求1所述的方法,其特征在于,所述目标区域的属性信息至少包括:社会环境、服务设施、政策规划、交通便利程度、区位压力、自然环境、毕业季影响、春运影响、重大节日影响、大型工程影响和国际经济指标中一种。
3.根据权利要求1所述的方法,其特征在于,所述在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量,包括:
对所述目标区域的属性信息按照类型进行编码处理生成属性向量,其中,所述编码处理至少包括降维处理、归一化处理、转换编码处理中至少一种;
合并所述属性向量和所述城市人口注意力向量作为待预测向量;
将所述待预测向量输入所述人口数量预测模型获取所述目标区域对应的未来人口数量向量;
提取所述未来人口数量向量中的人口数量分别作为所述时间窗口对应的未来人口数量。
4.根据权利要求1-3中任一所述的方法,其特征在于,所述区域人口注意力模型、所述城市人口注意力模型和所述人口数量预测模型的网络结构为循环神经网络结构,所述循环神经网络结构至少包括更新门和输出门。
5.一种区域人口数量预测装置,其特征在于,所述装置包括:
序列获取模块,用于根据目标区域和时间窗口确定对应的城市人口变化序列;
时间特征模块,用于在预先训练生成的区域人口注意力模型以所述城市人口变化序列为输入层确定区域人口注意力向量,其中,所述区域人口注意力模型是提取城市人口变化序列中区域和人口之间的关联关系的神经网络模型;
空间特征模块,用于基于预先训练的城市人口注意力模型处理所述区域人口注意力向量以获取城市人口注意力向量,其中,所述城市人口注意力模型是提取城市中各区域之间关联关系的神经网络模型;
人口预测模块,用于在预先训练的人口数量预测模型根据所述城市人口注意力向量和所述目标区域的属性信息确定所述时间窗口对应的未来人口数量;
所述序列获取模块包括:数据采集单元,用于获取目标区域对应的城市人口数据集;序列生成单元,用于按照所述时间窗口在所述城市人口数据集获取历年人口信息组成城市人口变化序列,其中,所述城市人口变化序列中所述历年人口信息是以年份和地区的形式进行排列,所述年份表示所述城市人口序列中历年人口信息对应的时间信息,所述地区表示所述城市人口序列中历年人口信息对应的位置信息;
所述时间特征模块具体用于:将所述城市人口变化序列按照年份和地区输入到所述区域人口注意力模型;在所述区域人口注意力模型通过隐藏层状态值对所述城市人口变化序列进行处理获取到对应的人口数量信息;排列各所述人口数量信息作为区域人口注意力向量,其中,所述隐藏层状态值可以是区域人口注意力模型中经过训练生成的取值,所述隐藏层状态值由训练样本中地区和年份之间的依赖关系确定;
所述空间特征模块具体用于:将所述区域人口注意力向量作为输入层输入所述城市人口注意力模型;获取所述城市人口注意力模型生成的对应所述地区的人口数量信息;排列对应所述地区的人口数量信息作为城市人口注意力向量,其中,区域人口注意力向量中每行或者每列可以分别与一个地区对应。
6.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的区域人口数量预测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一所述的区域人口数量预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011541316.3A CN112990530B (zh) | 2020-12-23 | 2020-12-23 | 区域人口数量预测方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011541316.3A CN112990530B (zh) | 2020-12-23 | 2020-12-23 | 区域人口数量预测方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112990530A CN112990530A (zh) | 2021-06-18 |
CN112990530B true CN112990530B (zh) | 2023-12-26 |
Family
ID=76345049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011541316.3A Active CN112990530B (zh) | 2020-12-23 | 2020-12-23 | 区域人口数量预测方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112990530B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115878964B (zh) * | 2023-03-01 | 2023-11-24 | 北京市城市规划设计研究院 | 常住人口确定方法、装置、设备和存储介质 |
CN117473327B (zh) * | 2023-12-26 | 2024-04-26 | 中电科新型智慧城市研究院有限公司 | 区域人口模型训练方法及区域人口预测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107624189A (zh) * | 2015-05-18 | 2018-01-23 | 北京市商汤科技开发有限公司 | 用于生成预测模型的方法和设备 |
CN109376969A (zh) * | 2018-12-14 | 2019-02-22 | 中南大学 | 基于深度学习的城市精细化人口分布动态预测方法及装置 |
CN110163401A (zh) * | 2018-02-12 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 时间序列的预测方法、数据预测方法和装置 |
CN110298483A (zh) * | 2019-05-27 | 2019-10-01 | 特斯联(北京)科技有限公司 | 一种基于空间吸引度指标的区域人口预测方法与系统 |
CN111612249A (zh) * | 2020-05-20 | 2020-09-01 | 北京百度网讯科技有限公司 | 用于预测人流量的方法、装置、设备以及存储介质 |
CN111860162A (zh) * | 2020-06-17 | 2020-10-30 | 上海交通大学 | 一种视频人群计数系统及方法 |
CN112116155A (zh) * | 2020-09-18 | 2020-12-22 | 平安科技(深圳)有限公司 | 基于智能决策的人口流动预测方法、装置及计算机设备 |
-
2020
- 2020-12-23 CN CN202011541316.3A patent/CN112990530B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107624189A (zh) * | 2015-05-18 | 2018-01-23 | 北京市商汤科技开发有限公司 | 用于生成预测模型的方法和设备 |
CN110163401A (zh) * | 2018-02-12 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 时间序列的预测方法、数据预测方法和装置 |
CN109376969A (zh) * | 2018-12-14 | 2019-02-22 | 中南大学 | 基于深度学习的城市精细化人口分布动态预测方法及装置 |
CN110298483A (zh) * | 2019-05-27 | 2019-10-01 | 特斯联(北京)科技有限公司 | 一种基于空间吸引度指标的区域人口预测方法与系统 |
CN111612249A (zh) * | 2020-05-20 | 2020-09-01 | 北京百度网讯科技有限公司 | 用于预测人流量的方法、装置、设备以及存储介质 |
CN111860162A (zh) * | 2020-06-17 | 2020-10-30 | 上海交通大学 | 一种视频人群计数系统及方法 |
CN112116155A (zh) * | 2020-09-18 | 2020-12-22 | 平安科技(深圳)有限公司 | 基于智能决策的人口流动预测方法、装置及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112990530A (zh) | 2021-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Short-term traffic flow prediction based on spatio-temporal analysis and CNN deep learning | |
Zhang et al. | A novel Encoder-Decoder model based on read-first LSTM for air pollutant prediction | |
Wang et al. | Financial time series prediction using elman recurrent random neural networks | |
CN111091196B (zh) | 客流数据确定方法、装置、计算机设备和存储介质 | |
CN112990530B (zh) | 区域人口数量预测方法、装置、电子设备和存储介质 | |
CN112256886B (zh) | 图谱中的概率计算方法、装置、计算机设备及存储介质 | |
CN109919188A (zh) | 基于稀疏局部注意力机制和卷积回声状态网络的时序分类方法 | |
CN114647741A (zh) | 工艺自动决策和推理方法、装置、计算机设备及存储介质 | |
CN112508265A (zh) | 面向业务流程管理的时间与活动多任务预测方法及系统 | |
CN114971748B (zh) | 预测数据生成、模型训练方法、计算机设备以及存储介质 | |
Wang et al. | Forecasting hotel reservations with long short-term memory-based recurrent neural networks | |
Stergiou et al. | Application of deep learning and chaos theory for load forecasting in Greece | |
CN117035073B (zh) | 一种基于分层事件发展模式归纳的未来气象事件预测方法 | |
Dey et al. | Modeling long-term groundwater levels by exploring deep bidirectional long short-term memory using hydro-climatic data | |
CN112508177A (zh) | 一种网络结构搜索方法、装置、电子设备及存储介质 | |
Rosati et al. | Machine learning in capital markets: decision support system for outcome analysis | |
Mehdizadeh Khorrami et al. | Forecasting heating and cooling loads in residential buildings using machine learning: A comparative study of techniques and influential indicators | |
Brahimi et al. | Modelling on Car‐Sharing Serial Prediction Based on Machine Learning and Deep Learning | |
Lu et al. | Efficient deep learning based method for multi‐lane speed forecasting: a case study in Beijing | |
Wang et al. | A New Hybrid Forecasting Model Based on SW‐LSTM and Wavelet Packet Decomposition: A Case Study of Oil Futures Prices | |
CN114826947A (zh) | 一种基于自动编码器的流量矩阵恢复预测方法及系统 | |
Guo et al. | Learning and integration of adaptive hybrid graph structures for multivariate time series forecasting | |
Verma et al. | A systematic review on the advancement in the study of fuzzy variational problems | |
Ciaburro | Time series data analysis using deep learning methods for smart cities monitoring | |
CN116109449A (zh) | 一种数据处理方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 101, 2nd Floor, Building 3, East District, No. 10 Northwest Wangdong Road, Haidian District, Beijing, 100193 Applicant after: Beijing softong Intelligent Technology Co.,Ltd. Address before: 100193 202, floor 2, building 16, East District, No. 10, northwest Wangdong Road, Haidian District, Beijing Applicant before: Beijing Softcom Smart City Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |