CN112163717B - 人口数据预测方法、装置、计算机设备及介质 - Google Patents

人口数据预测方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN112163717B
CN112163717B CN202011123445.0A CN202011123445A CN112163717B CN 112163717 B CN112163717 B CN 112163717B CN 202011123445 A CN202011123445 A CN 202011123445A CN 112163717 B CN112163717 B CN 112163717B
Authority
CN
China
Prior art keywords
population
data
prediction
sample
population data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011123445.0A
Other languages
English (en)
Other versions
CN112163717A (zh
Inventor
杨帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011123445.0A priority Critical patent/CN112163717B/zh
Publication of CN112163717A publication Critical patent/CN112163717A/zh
Application granted granted Critical
Publication of CN112163717B publication Critical patent/CN112163717B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例公开了一种人口数据预测方法、装置、计算机设备及介质,属于计算机技术领域。该方法包括:获取目标区域在第一时间点的第一人口数据和第二人口数据;对第一人口数据进行预测处理,得到目标区域在第二时间点的第一中间人口数据,对第二人口数据进行预测处理,得到目标区域在第二时间点的第二中间人口数据;对第一中间人口数据和第二中间人口数据进行数据共享,分别得到目标区域在第二时间点的第三人口数据和第四人口数据。该方法在对地图中不同区域的人口流动进行预测时,采用人工智能技术,考虑流出人口数量、流入人口数量和迁徙人口数量之间的关系,提高了人口数据预测的准确率。

Description

人口数据预测方法、装置、计算机设备及介质
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种人口数据预测方法、装置、计算机设备及介质。
背景技术
人口流动是目前普遍存在的社会现状,人口流动对交通管控、疫情防控等涉及人口管理的方面有较大的影响。其中,人口流动包括人口流出、人口流入和人口驻留。为了便于进行人口管理,需要对区域的人口数据进行预测,因此,如何进行人口数据的预测已成为亟待解决的问题。
发明内容
本申请实施例提供了一种人口数据预测方法、装置、计算机设备及介质,实现了人口数据预测。所述技术方案如下:
一方面,提供了一种人口数据预测方法,所述方法包括:
获取目标区域在第一时间点的第一人口数据和第二人口数据,所述第一人口数据包括所述第一时间点对应的流出人口数量和流入人口数量,所述第二人口数据包括所述第一时间点对应的多个迁徙人口数量,每个迁徙人口数量为从所述目标区域向其他区域迁徙的人口数量,任一时间点对应的流出人口数量等于所述任一时间点对应的多个迁徙人口数量之和;
对所述第一人口数据进行预测处理,得到所述目标区域在第二时间点的第一中间人口数据,对所述第二人口数据进行预测处理,得到所述目标区域在所述第二时间点的第二中间人口数据,所述第二时间点为所述第一时间点之后的时间点;
对所述第一中间人口数据和所述第二中间人口数据进行数据共享,分别得到所述目标区域在所述第二时间点的第三人口数据和第四人口数据,所述第三人口数据包括所述第二时间点对应的流出人口数量和流入人口数量,所述第四人口数据包括所述第二时间点对应的多个迁徙人口数量。
可选地,所述第一人口数据为包括所述历史流出人口数量和所述历史流入人口数量的第一人口矩阵,所述第二人口数据为包括所述多个人口数量的第二人口矩阵,所述人口预测模型还包括第一输入层和第二输入层;
所述调用人口预测模型中的人口预测网络,对所述第一人口数据进行预测处理,得到所述第一中间人口数据,对所述第二人口数据进行预测处理,得到所述第二中间人口数据之前,所述方法还包括:
调用所述第一输入层,对所述第一人口矩阵进行变换处理,得到对应的第三人口矩阵;
调用所述第二输入层,对所述第二人口矩阵进行变换处理,得到对应的第四人口矩阵。
可选地,所述根据多个第一样本人口数据和多个第二样本人口数据,训练所述人口预测模型,包括:
调用所述人口预测模型,对所述多个第一样本人口数据和所述多个第二样本人口数据进行处理,得到所述样本区域的第一预测人口数据和第二预测人口数据,所述第一预测人口数据包括预测流出人口数量和预测流入人口数量,所述第二预测人口数据包括多个预测迁徙人口数量;
根据所述预测流出人口数量和所述多个预测迁徙人口数量,训练所述人口预测模型,以使所述预测流出人口数量等于所述多个预测迁徙人口数量之和。
另一方面,提供了一种人口数据预测装置,所述装置包括:
数据获取模块,用于获取目标区域在第一时间点的第一人口数据和第二人口数据,所述第一人口数据包括所述第一时间点对应的流出人口数量和流入人口数量,所述第二人口数据包括所述第一时间点对应的多个迁徙人口数量,每个迁徙人口数量为从所述目标区域向其他区域迁徙的人口数量,任一时间点对应的流出人口数量等于所述任一时间点对应的多个迁徙人口数量之和;
数据预测模块,用于对所述第一人口数据进行预测处理,得到所述目标区域在第二时间点的第一中间人口数据,对所述第二人口数据进行预测处理,得到所述目标区域在所述第二时间点的第二中间人口数据,所述第二时间点为所述第一时间点之后的时间点;
数据共享模块,用于对所述第一中间人口数据和所述第二中间人口数据进行数据共享,分别得到所述目标区域在所述第二时间点的第三人口数据和第四人口数据,所述第三人口数据包括所述第二时间点对应的流出人口数量和流入人口数量,所述第四人口数据包括所述第二时间点对应的多个迁徙人口数量。
可选地,所述数据预测模块,用于调用人口预测模型中的人口预测网络,对所述第一人口数据进行预测处理,得到所述第一中间人口数据,对所述第二人口数据进行预测处理,得到所述第二中间人口数据;
所述数据共享模块,用于调用所述人口预测模型中的数据共享网络,对所述第一中间人口数据和所述第二中间人口数据进行数据共享,分别得到所述第三人口数据和所述第四人口数据。
可选地,所述人口预测网络包括第一特征提取层和第一人口预测层,所述数据预测模块,包括:
第一提取单元,用于调用所述第一特征提取层,对所述第一人口数据进行特征提取,得到第一人口特征;
第一预测单元,用于调用所述第一人口预测层,对所述第一人口特征进行预测处理,得到所述第一中间人口数据。
可选地,所述第一预测单元,用于:
调用所述第一人口预测层,根据平均流出数据对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述平均流出数据为所述目标区域在多个时间点的历史流出人口数量的均值;
调用所述第一人口预测层,根据距离关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述距离关系数据包括所述目标区域与其他区域之间的距离;
调用所述第一人口预测层,根据空间关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述空间关系数据表示所述目标区域的人口数据、其他区域的人口数据与参考距离之间的关系,所述参考距离为所述目标区域与所述其他区域之间的距离;
调用所述第一人口预测层,根据等级关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述等级关系数据表示所述目标区域与其他区域之间的所属关系。
可选地,所述第一预测单元,用于:
所述空间关系数据包括引力关系数据,调用所述第一人口预测层,根据所述引力关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述引力关系数据表示所述目标区域的常住人口数量、其他区域的常住人口数量与所述参考距离之间的关系;
所述空间关系数据包括流动关系数据,调用所述第一人口预测层,根据所述流动关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述流动关系数据用于表示所述目标区域的流出人口数量、其他区域的流入人口数量与所述参考距离之间的关系;
所述空间关系数据包括辐射数据,调用所述第一人口预测层,根据所述辐射数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述辐射数据表示所述目标区域的常住人口数量、其他区域的常住人口数量与关联区域的人口数量之间的关系,所述关联区域为根据所述参考距离确定的区域。
可选地,所述人口预测网络还包括第二特征提取层和第二人口预测层,所述数据预测模块,包括:
第二提取单元,用于调用所述第二特征提取层,对所述第二人口数据进行特征提取,得到第二人口特征;
第二预测单元,用于调用所述第二人口预测层,对所述第二人口特征进行预测处理,得到所述第二中间人口数据。
可选地,所述第二预测单元,用于:
获取第一相似矩阵,所述第一相似矩阵中的每个元素表示多个第一迁徙向量中任两个第一迁徙向量之间的相似度,所述第一迁徙向量为所述目标区域到其他任一区域的迁徙向量;
获取第二相似矩阵,所述第二相似矩阵中的每个元素表示多个第二迁徙向量中任两个第二迁徙向量之间的相似度,所述第二迁徙向量为所述其他任一区域到所述目标区域的迁徙向量;
调用所述第二人口预测层,对所述第一相似矩阵和所述第二相似矩阵进行预测处理,得到所述第二中间人口数据。
可选地,所述第一人口数据为包括所述历史流出人口数量和所述历史流入人口数量的第一人口矩阵,所述第二人口数据为包括所述多个人口数量的第二人口矩阵,所述人口预测模型还包括第一输入层和第二输入层;所述装置还包括:
数据变换模块,用于调用所述第一输入层,对所述第一人口矩阵进行变换处理,得到对应的第三人口矩阵;
所述数据变换模块,还用于调用所述第二输入层,对所述第二人口矩阵进行变换处理,得到对应的第四人口矩阵。
可选地,所述人口预测模型还包括外部特征处理层,所述装置还包括:
特征获取模块,用于获取外部特征,所述外部特征包括时间特征或空间特征,所述时间特征是指所述第一时间点对应的特征,所述空间特征包括所述目标区域的地理位置或所述目标区域所属的等级;
所述特征获取模块,还用于调用所述外部特征层,对所述外部特征进行处理,得到处理后的外部特征。
可选地,所述数据预测模块,用于调用所述人口预测网络,分别将所述第一人口数据和所述第二人口数据与所述处理后的外部特征进行拼接,分别对拼接后的所述第一人口数据和拼接后的所述第二人口数据进行预测处理,得到所述第一中间人口数据和所述第二中间人口数据。
可选地,所述数据共享网络包括第一数据共享层和第二数据共享层,所述数据共享模块,包括:
第一共享单元,用于调用所述第一数据共享层,根据所述第二中间人口数据对所述第一中间人口数据进行调整,得到所述第三人口数据;
第二共享单元,用于调用所述第二数据共享层,根据所述第一中间人口数据对所述第二中间人口数据进行调整,得到所述第四人口数据。
可选地,所述装置还包括:
样本获取模块,用于获取样本区域在多个时间点的第一样本人口数据和第二样本人口数据,所述第一样本人口数据包括样本流出人口数量和样本流入人口数量,所述第二样本人口数据包括多个样本迁徙人口数量,每个样本迁徙人口数量为从所述样本区域向其他样本区域迁徙的人口数量;
模型训练模块,用于根据多个第一样本人口数据和多个第二样本人口数据,训练所述人口预测模型。
可选地,所述模型训练模块,用于:
根据多个样本区域之间的等级关系、所述多个第一样本人口数据和所述多个第二样本人口数据,训练所述人口预测模型,以使得到的第一样本区域的预测人口数据和多个第二样本区域的预测人口数据满足目标条件,所述多个第二样本区域为所述第一样本区域的下级区域;
其中,所述目标条件包括所述第一样本区域的预测流出人口数量等于所述多个第二样本区域的预测流出人口数量之和、所述第一样本区域的预测流入人口数量等于所述多个第二样本区域的预测流入人口数量之和,或者所述第一样本区域的预测迁徙人口数量之和等于所述多个第二样本区域的预测迁徙人口数量之和中的至少一项。
可选地,所述模型训练模块,用于:
调用所述人口预测模型,对所述多个第一样本人口数据和所述多个第二样本人口数据进行处理,得到所述样本区域的第一预测人口数据和第二预测人口数据,所述第一预测人口数据包括预测流出人口数量和预测流入人口数量,所述第二预测人口数据包括多个预测迁徙人口数量;
根据所述预测流出人口数量和所述多个预测迁徙人口数量,训练所述人口预测模型,以使所述预测流出人口数量等于所述多个预测迁徙人口数量之和。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如上述方面所述的人口数据预测方法中所执行的操作。
另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如上述方面所述的人口数据预测方法中所执行的操作。
另一方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或所述计算机程序包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从计算机可读存储介质读取所述计算机程序代码,处理器执行所述计算机程序代码,使得所述计算机设备实现如上述方面所述的人口数据预测方法中所执行的操作。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例提供的方法中,目标区域的流出人口数量与从该目标区域迁徙至其他区域的多个迁徙人口数量之间存在关联关系,在预测流出人口数量、流入人口数量和多个迁徙人口数量时,考虑该关联关系的影响,对预测得到的中间数据进行共享,从而在实现人口数据预测的同时,提高预测的人口数据的准确率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种人口预测模型的结构示意图;
图2是本申请实施例提供的另一种人口预测模型的结构示意图;
图3是本申请实施例提供的另一种人口预测模型的结构示意图;
图4是本申请实施例提供的另一种人口预测模型的结构示意图;
图5是本申请实施例提供的另一种人口预测模型的结构示意图;
图6是本申请实施例提供的另一种人口预测模型的结构示意图;
图7是本申请实施例提供的一种人口数据预测方法的流程图;
图8是本申请实施例提供的另一种人口数据预测方法的流程图;
图9是本申请实施例提供的一种模型训练方法的流程图;
图10是本申请实施例提供的一种人口数据预测装置的结构示意图;
图11是本申请实施例提供的另一种人口数据预测装置的结构示意图;
图12是本申请实施例提供的一种终端的结构示意图;
图13是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种概念,但除非特别说明,这些概念不受这些术语限制。这些术语仅用于将一个概念与另一个概念区分。举例来说,在不脱离本申请的范围的情况下,可以将第一人口数据称为第二人口数据,将第二人口数据称为第一人口数据。
本申请所使用的术语“多个”、“每个”、“任一”等,多个包括两个或两个以上,每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个区域包括3个区域,而每个区域是指这3个区域中的每一个区域,任一是指这3个区域中的任意一个,可以是第一个,可以是第二个,也可以是第三个。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明。
为了便于理解本申请实施例,先对本申请实施例涉及到的关键词进行解释:
行政区划:行政区划包括四个等级:省级行政区划(省或自治区,例如河北省、山东省等)、地级行政区划(市,例如石家庄市、东莞市等)、县级行政区划(县或区,例如海淀区、东阳县等)、乡级行政区划(街道乡镇,例如马连洼街道、西北旺镇等)。
迁徙:人群在区域间移动的行为,例如某人由北京到上海,即为一次迁徙行为。
人口类型:对于任一区域,流入人口是指从其他区域迁徙至该区域的人口,流出人口是指从该区域迁徙至其他区域的人口,驻留人口是指一直在该区域内没有发生过迁徙行为的人口。
图卷积神经网络(Graph Convolutional Network,GCN):图卷积神经网络是一种深度学习网络,与传统的卷积神经网络(Convolutional Neural Network,CNN)不同的是,图卷积神经网络可适用于非欧氏空间的对象中。
均方根误差(Root Mean Square Error,RMSE):RMSE是一种测量数值之间差异的量度,作为回归模型的评测指标。对于同样的数据集,RMSE的值越小,表示对应模型的误差越低,模型越准确。
平均绝对误差(Mean Absolute Error,MAE):MAE是一种回归模型的评测指标,对于同样的数据集,MAE的值越小,表示对应模型误差越低,模型越准确。
加权平均绝对百分比误差(Weighted Mean Absolute Percentage Error,WMAPE):WMAPE是一种回归模型的评测指标,由于WMAPE是一个百分比指标,因此能够在不同的数据集之间进行比较,WMAPE的值越小,表示对应模型的误差越低,模型越准确。相比平均绝对百分比误差(Mean Absolute Percentage Error,MAPE),WMAPE的优点在于根据数值加权,避免部分数值过小的指标,真实值与预测值之间的误差比例较大,从而严重影响整个数据集上的平均指标,因此WMAPE更准确。
图1是本申请实施例提供的一种人口预测模型的结构示意图,参见图1,该人口预测模型包括人口预测网络101和数据共享网络102,人口预测网络101与数据共享网络102连接。
其中,人口预测网络101用于对输入的人口数据进行初步预测处理,得到初步预测结果,数据共享网络102用于对初步预测结果进行进一步处理,得到最终的人口数据的预测结果。
在一种可能实现方式中,参见图2,人口预测模型还包括输入网络103和输出网络104,输入网络103与人口预测网络101连接,输出网络104与数据共享网络102连接。输入网络103用于对输入的人口数据进行变换处理,得到变换后的人口数据,则人口预测网络101用于对变换后的人口数据进行初步预测处理,输出网络104用于对数据共享网络102输出的预测结果进行变换处理,输出最终的预测结果。
在一种可能实现方式中,参见图3,人口预测模型还包括外部特征层105,外部特征层105与人口预测网络101连接,外部特征层105用于对与人口数据相关的外部特征进行处理。则人口预测网络101用于对输入网络103输出的人口数据和外部特征层105处理后的外部特征一起进行预测处理。
在一种可能实现方式中,参见图4,输入网络103包括第一输入层1031和第二输入层1032,人口预测网络101包括第一特征提取层1011、第一人口预测层1012、第二特征提取层1013和第二人口预测层1014,数据共享网络102包括第一数据共享层1021和第二数据共享层1022,输出网络104包括第一输出层1041和第二输出层1042。
其中,第一输入层1031与第一特征提取层1011连接,第一特征提取层1011与第一人口预测层1012连接,第一人口预测层1012与第一数据共享层1021连接,第一数据共享层1021与第一输出层1041连接;第二输入层1032与第二特征提取层1013连接,第二特征提取层1013与第二人口预测层1014连接,第二人口预测层1014与第二数据共享层1022连接,第二数据共享层1022和第二输出层1042连接,且第一人口预测层1012还与第二数据共享层1022连接,第二人口预测层1014还与第一数据共享层1021连接。
从另一个角度来看,人口预测模型包括第一子模型和第二子模型,第一子模型包括第一输入层1031、第一特征提取层1011、第一人口预测层1012、第一数据共享层1021和第一输出层1041,第二子模型包括第二输入层1032、第二特征提取层1013、第二人口预测层1014、第二数据共享层1022和第二输出层1042。其中,第一子模型用于对第一人口数据进行处理,第二子模型用于对第二人口数据进行处理。
在一种可能实现方式中,人口预测模型的详细结构参见图5,第一特征提取层中包括RNN(Recurrent Neural Networks,循环卷积神经网络)层、FC(Fully Connected,全连接)层和Add(融合)层,第一人口预测网络中还包括Concat(拼接)层,该拼接层用于将第一特征提取层提取出的第一人口特征和经过全连接层处理的外部特征拼接在一起,作为第一人口预测层的输入,第一人口预测层中包括多个图卷积单元,每个图卷积单元中包括GCN层、Dropout(防止过拟合)层和LN(Layer Norm,归一化)层。同样的,第二特征提取层中包括RNN层、FC层和Add层,第二人口预测网络中还包括Concat层,该拼接层用于将第二特征提取层提取出的第二人口特征和经过FC层处理的外部特征拼接在一起,作为第二人口预测层的输入,第二人口预测层中包括多个图卷积单元,每个图卷积单元中包括2D-GCN层、Dropout层和LN层。
在另一种可能实现方式中,参见图6,在第一输入层中输入不同时间点的第一人口数据,分别经过第一特征提取层的处理,得到对应的第一人口特征,再由拼接层将多个不同时间点对应的第一人口特征和外部特征拼接在一起,作为第一人口预测层的输入。同样的,在第二输入层中输入不同时间点的第二人口数据,分别经过第二特征提取层的处理,得到对应的第二人口特征,再由拼接层将多个不同时间点对应的第二人口特征和外部特征拼接在一起,作为第二人口预测层的输入。
图7是本申请实施例提供的一种人口数据预测方法的流程图。本申请实施例的执行主体为计算机设备,参加图7,该方法包括以下步骤:
701、获取目标区域在第一时间点的第一人口数据和第二人口数据。
本申请实施例以预测出目标区域在第二时间点的人口数据为例进行说明。
其中,第一人口数据包括第一时间点对应的流出人口数量和流入人口数量,第二人口数据包括第一时间点对应的多个迁徙人口数量,每个迁徙人口数量为从目标区域向其他区域迁徙的人口数量,任一时间点对应的流出人口数量等于任一时间点对应的多个迁徙人口数量之和。
时间点是指某一天或者某个时间段,第二时间点是第一时间点之后的任一时间点,以当前时间点为分界,第一时间点为当前时间点之前的任一时间点,第二时间点为当前时间点或当前时间点之后的任一时间点。其中,第一时间点与第二时间点之间间隔预设时长,例如,预设时长为一天、一周或一个月。
在一种可能实现方式中,第一人口数据还包括第一时间点对应的驻留人口数量。
702、对第一人口数据进行预测处理,得到目标区域在第二时间点的第一中间人口数据,对第二人口数据进行预测处理,得到目标区域在第二时间点的第二中间人口数据。
本公开实施例中,第一人口数据和第二人口数据是两种表示人口流动的数据,这两种人口数据的处理方式不同,因此需要分别对第一人口数据和第二人口数据进行处理。在处理过程中,可选地,同时处理第一人口数据和第二人口数据,或者先处理第一人口数据再处理第二人口数据,或者先处理第二人口数据再处理第一人口数据。
其中,第一中间人口数据是对第一人口数据进行初步预测得到的人口数据,第二中间人口数据是对第二人口数据进行初步预测得到的人口数据,该第一中间人口数据和第二中间人口数据能够在一定程度上表示为第二时间点预测出的人口数据。
在一种可能实现方式中,计算机设备调用人口预测模型对第一人口数据和第二人口数据进行处理。可选地,计算机设备调用人口预测模型中的人口预测网络,对第一人口数据进行预测处理,得到第一中间人口数据,对第二人口数据进行预测处理,得到第二中间人口数据。
703、对第一中间人口数据和第二中间人口数据进行数据共享,分别得到目标区域在第二时间点的第三人口数据和第四人口数据。
对第一中间人口数据和第二中间人口数据进行数据共享是指:在第一中间人口数据的基础上参考第二中间人口数据,得到预测的包括第二时间点对应的流出人口数量和流入人口数量的第三人口数据,在第二中间人口数据的基础上参考第一中间人口数据,得到预测的包括第二时间点对应的多个迁徙人口数量的第四人口数据。
在一种可能实现方式中,第一人口数据还包括驻留人口数量时,预测得到的第三人口数据也包括第二时间点的驻留人口数量。
在一种可能实现方式中,计算机设备调用人口预测模型中的数据共享网络,对第一中间人口数据和第二中间人口数据进行数据共享,分别得到第三人口数据和第四人口数据。
需要说明的是,本申请实施例的执行主体为计算机设备,该计算机设备为终端或服务器。其中,终端为电脑、手机、平板电脑或者其他终端;服务器是独立的物理服务器,或者是多个物理服务器构成的服务器集群或者分布式系统,或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(ContentDelivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例提供的方法中,目标区域的流出人口数量与从该目标区域迁徙至其他区域的多个迁徙人口数量之间存在关联关系,在预测流出人口数量、流入人口数量和多个迁徙人口数量时,考虑该关联关系的影响,对预测得到的中间数据进行共享,从而在实现人口数据预测的同时,提高预测的人口数据的准确率。
上述图1-图6对人口预测模型进行了介绍,本申请实施例中调用上述图1-图6所示的人口预测模型,对人口数据进行预测。以下将通过图8所示的实施例对调用人口预测模型进行人口数据预测的过程进行说明。
图8是本申请实施例提供的另一种人口数据预测方法的流程图。本申请实施例的执行主体为计算机设备,参加图8,该方法包括以下步骤:
801、获取目标区域在第一时间点的第一人口数据和第二人口数据。
本申请实施例中,第一时间点与第二时间点之间间隔预设时长,则在对第二时间点的人口数据进行预测时,根据预设时长,先确定需要获取人口数据的第一时间点,获取该第一时间点的第一人口数据和第二人口数据。
在一种可能实现方式中,以一天为预设时长,选取第一时间点的第一人口数据和第二人口数据,例如,第二时间点为第t天,则第一时间点为第t-1天;或者以一周为预设时长,选取第一时间点的第一人口数据和第二人口数据,例如,第二时间点为第t天,则第一时间点为第t-7天;或者,以一个月为预设时长,选取第一时间点的第一人口数据和第二人口数据,例如,第二时间点为第t天,则第一时间点为第t-30天。其中,t为正整数。
在一种可能实现方式中,第一人口数据为包括流出人口数量和流入人口数量的第一人口矩阵,例如,第一人口矩阵中第一列的元素表示流出人口数量,第二列的元素表示流入人口数量,或者第一列的元素表示流入人口数量,第二列的元素表示流出人口数量。第二人口数据为包括多个迁徙人口数量的第二人口矩阵,其中,每个元素表示从目标区域向其他区域迁徙的人口数量。例如,第二人口矩阵中的第一列表示目标区域向A区域迁徙的人口数量,第二列表示目标区域向B区域迁徙的人口数量。
在一种可能实现方式中,在第一人口数据还包括驻留人口数量的情况下,第一人口矩阵中第三列的元素表示驻留人口数量。即是,第一人口矩阵为1*3的矩阵。
上述实施例方式仅是以对目标区域的人口数据进行预测为例,在另一实施例中,能够同时对多个目标区域的人口数据进行预测。
同时预测多个目标区域的人口数据时,获取多个目标区域在第一时间点的第一人口数据,得到N*2的第一人口矩阵,其中,N为目标区域的数量,N为正整数。例如,第一人口矩阵中的第一列表示流入人口数量,第二列表示流出人口数量,则矩阵中[i,1]位置的元素为第i个目标区域在第一时间点的流入人口数量,[i,2]位置的元素为第i个目标区域在第一时间点的流出人口数量,其中,i为正整数。
在一种可能实现方式中,第一人口数据还包括驻留人口数据时,得到的是N*3的第一人口矩阵。例如,第一人口矩阵中的第一列表示流入人口数量,第二列表示流出人口数量,第三列表示驻留人口数量,则[i,3]位置的元素为第i个目标区域在第一时间点的驻留人口数量。
获取多个目标区域在第一时间点的第二人口数据,得到N*N的第二人口矩阵,其中,[i,j]位置的元素表示在第一时间点从第i个目标区域向第j个区域迁徙的人口数量。其中,j为正整数。
另外,本申请实施例中,人口预测模型预先设置了时间机制,能够根据输入的第一时间点的人口数据,确定预测出的人口数据属于哪个时间点。例如,人口预测模型中设置的预设时长为一天,则将第t-1天的人口数据输入至人口预测模型,该人口预测模型能够预测出第t天的人口数据。
在一种可能实现方式中,人口预测模型的时间机制中包括多个不同的预设时长,对于不同预设时长对应的人口数据,人口预测模型分别进行处理。获取多个第一时间点的第一人口数据和第二人口数据。例如,人口预测模型中设置的预设时长为一天和一周,则将第t-1天的人口数据和第t-7天的人口数据分别输入至人口预测模型,对第t-1天的人口数据和第t-7天的人口数据分别进行人口特征提取。
802、调用第一特征提取层,对第一人口数据进行特征提取,得到第一人口特征。
其中,第一人口特征表示目标区域的人口流出情况和人口流入情况。
在一种可能实现方式中,第一特征提取层包括循环神经网络层、全连接层和融合层。调用循环神经网络层,对第一人口数据经过特征提取,得到第一人口特征,为了避免丢失原始的人口特征,将得到的第一人口特征与经过全连接层的原始人口特征在融合层中进行融合,得到融合后的第一人口特征。其中,循环神经网络层为标准的循环神经网络(Recurrent Neural Networks,RNN)、LSTM(Long Short-Term Memory,长短期记忆网络)或者GRU(Gated Recurrent Units,门控循环单元)中的任一种。
在一种可能实现方式中,在对第一数据进行特征提取之前,调用第一输入层,对第一人口矩阵进行变换处理,得到对应的第三人口矩阵。然后调用第一特征提取层,对第三人口矩阵进行特征提取,得到第一人口特征。
例如,第一人口矩阵为N*3的矩阵,对该第一人口矩阵进行变换,得到的第三人口矩阵为T*(N*3)*1的矩阵,其中T表示预设时长,N表示目标区域的数量。将第三人口矩阵T*(N*3)*1输入到第一特征提取层中进行特征提取。
在一种可能实现方式中,获取多个第一时间点的第一人口数据的情况下,分别将多个第一时间点的第一人口数据输入至第一特征提取层,对多个第一人口数据进行特征提取,得到多个人口特征,将多个人口特征进行拼接,将拼接后的人口特征作为第一人口特征。
803、调用第一人口预测层,对第一人口特征进行预测处理,得到第一中间人口数据。
本申请实施例中,将得到的第一人口特征作为第一人口预测层的输入,调用第一人口预测层进行人口数据的预测。在一种可能实现方式中,第一人口预测层为图卷积网络,该图卷积网络中包括多个图卷积层,每个图卷积层中采用下述公式对第一人口特征进行处理:
Figure GDA0003707857790000161
其中,Hl为图卷积层中的第l层的输出,σ为激活函数,Hl-1为图卷积层中的第l-1层的输出(第l层的输入),
Figure GDA0003707857790000162
为目标区域对应的邻接矩阵,Wl是第l层待训练的模型参数。
其中,
Figure GDA0003707857790000163
为归一化之后的邻接矩阵,需要对A进行归一化处理得到
Figure GDA0003707857790000164
采用下述公式进行处理:
Figure GDA0003707857790000165
其中,A为归一化之前的邻接矩阵,I为单位矩阵,D为A+I的度矩阵。
上述公式中的邻接矩阵表示目标区域与其他区域之间的关系,该关系包括人口流出关系、距离关系、等级关系或空间关系中的至少一种。
在一种可能实现方式中,对于目标区域与其他区域之间的几种关系,采用下述几种方式来对第一人口特征进行预测处理:
第一种:考虑平均流出数据的影响。计算机设备调用第一人口预测层,根据平均流出数据对第一人口特征进行预测处理,得到第一中间人口数据。其中,平均流出数据为目标区域在多个时间点的历史流出人口数量的均值。
其中,平均流出数据为包括多个平均迁徙数据的平均迁徙矩阵。
例如,采用下述公式获取平均流出数据:
Figure GDA0003707857790000166
其中,A1为表示平均流出数据的邻接矩阵,
Figure GDA0003707857790000167
为包括多个平均迁徙数据的平均迁徙矩阵,i为目标区域,j为其他区域。
第二种:考虑距离关系数据的影响。计算机设备调用第一人口预测层,根据距离关系数据,对第一人口特征进行预测处理,得到第一中间人口数据。其中,距离关系数据包括目标区域与其他区域之间的距离。
例如,采用下述公式获取距离关系数据:
Figure GDA0003707857790000168
其中,A2为表示距离关系数据的邻接矩阵,dij为目标区域i和其他区域j之间的距离。
第三种:考虑等级关系数据的影响。计算机设备调用第一人口预测层,根据等级关系数据,对第一人口特征进行预测处理,得到第一中间人口数据。其中,等级关系数据表示目标区域与其他区域之间的所属关系。
例如,如果目标区域i与其他区域j具有同一个父区域(例如目标区域i为广东省广州市从化区,其他区域j为广东省广州市天河区,则父区域均为广州省广州市),则确定邻接矩阵A3中[i,j]位置的元素为1;如果目标区域i与其他区域j具有同一个祖父区域(例如目标区域i为广东省广州市从化区,其他区域j为广东省深圳市南山区,则父区域分别为广东省广州市与广东省深圳市,父区域不同,但祖父区域均为广东省),则确定邻接矩阵A3中[i,j]位置的元素为0.5。其余情况下,确定邻接矩阵A3中[i,j]位置的元素为0。
第四种:考虑空间关系数据的影响。计算机设备调用第一人口预测层,根据空间关系数据,对第一人口特征进行预测处理,得到第一中间人口数据。其中,空间关系数据表示目标区域的人口数据、其他区域的人口数据与参考距离之间的关系,参考距离为目标区域与其他区域之间的距离。
在一种可能实现方式中,空间关系数据包括以下几种:
第一种:空间关系数据包括引力关系数据,计算机设备调用第一人口预测层,根据引力关系数据,对第一人口特征进行预测处理,得到第一中间人口数据。其中,引力关系数据表示目标区域的常住人口数量、其他区域的常住人口数量与参考距离之间的关系,该引力关系数据表示任两个区域的常住人口数量和该任两个区域之间的距离对人口流动的影响,例如,常住人口数量越多,距离越小,月容易产生人口流动,流动的人口数量也就越多。
例如,采用下述公式获取引力关系数据:
Figure GDA0003707857790000171
其中,A4为表示引力关系数据的邻接矩阵,Pi为目标区域i的常住人口数量,Pj为其他区域j的常住人口数量,dij为目标区域i与其他区域j之间的距离,k是预设参数。
第二种:空间关系数据包括流动关系数据,计算机设备调用第一人口预测层,根据流动关系数据,对第一人口特征进行预测处理,得到第一中间人口数据。其中,流动关系数据用于表示目标区域的流出人口数量、其他区域的流入人口数量与参考距离之间的关系。
例如,采用下述公式获取流动关系数据:
Figure GDA0003707857790000181
其中,A5为表示流动关系数据的邻接矩阵,Oi为目标区域i的流出人口数量、Dj为其他区域j的流入人口数量,dij为目标区域i与其他区域j之间的距离,Ai、Bj、α和β为预设参数。
第三种:空间关系数据包括辐射数据,计算机设备调用第一人口预测层,根据辐射数据,对第一人口特征进行预测处理,得到第一中间人口数据。其中,辐射数据表示目标区域的常住人口数量、其他区域的常住人口数量与关联区域的人口数量之间的关系,关联区域为根据参考距离确定的区域。
可选地,关联区域为以目标区域的中心位置为圆心,参考距离为半径的圆形区域;或者关联区域为以参考距离为直径,且经过目标区域的中心位置和其他区域的中心位置的圆形区域;或者关联区域为根据参考距离采用其他方式确定的区域。
例如,采用下述公式获取辐射数据:
A6=kPiPj/(Pi+sij)(Pi+Pj+sij);
其中,A6为表示辐射数据的邻接矩阵,Pi为目标区域i的常住人口数量,Pj为其他区域j的常住人口数量,sij为关联区域的常住人口数量,k为预设参数。
上述几种关系,得到的邻接矩阵参见下述表1:
表1
Figure GDA0003707857790000182
对于上述几种情况,采用得到的至少一个邻接矩阵,来计算图卷积层的输出,例如,采用下述公式计算图卷积层的输出:
Figure GDA0003707857790000191
其中,M表示有M个邻接矩阵,M为正整数。
上述确定第一中间人口数据的方式中,综合考虑了多种关系的影响,使得到的第一中间人口数据更加准确。
另外,在一种可能实现方式中,计算机设备获取外部特征,调用外部特征层,对外部特征进行处理,得到处理后的外部特征。其中,外部特征包括时间特征或空间特征,时间特征是指第一时间点对应的特征,时间特征包括第一时间点是星期几、是否是节假日、是否是节假日的前一天或后一天等特征等,由于不同的时间人口流动情况可能存在不同,因此考虑时间对人口流动的影响。例如,周末或者节假期人口流动可能较大,工作日人口流动可能较小。空间特征包括目标区域的地理位置或目标区域所属的等级。例如,目标区域位于东部区域、中部区域、西部区域、沿海区域等,目标区域为省级、市级、县级等。
在一种可能实现方式中,天气情况、目标区域的常住人口数量等也会对人口流动产生影响,则外部特征还包括天气特征、常住人口特征等。
在存在外部特征的情况下,计算机设备调用第一人口预测层,将第一人口数据与处理后的外部特征进行拼接,对拼接后的第一人口数据进行预测处理,得到第一中间人口数据。
在一种可能实现方式中,计算机设备将第一人口特征和处理后的外部特征进行拼接,对拼接后的第一人口特征进行预测处理,得到第一中间人口数据。
804、调用第二特征提取层,对第二人口数据进行特征提取,得到第二人口特征。
步骤804的实施方式与上述步骤802的实施方式类似,在此不再赘述。
不同的是,在一种可能实现方式中,第二人口数据为包括多个人口数量的第二人口矩阵。计算机设备调用第二输入层,对第二人口矩阵进行变换处理,得到对应的第四人口矩阵。
例如,第二人口矩阵为N*N的矩阵,对该第二人口矩阵进行变换,得到第四人口矩阵T*(N*N)*1,其中T表示预设时长,N表示区域的数量。将第四人口矩阵T*(N*N)*1输入到第二特征提取层中进行特征提取。
在一种可能实现方式中,获取多个第一时间点的第二人口数据的情况下,分别将多个第一时间点的第二人口数据输入至第二特征提取层,对多个第二人口数据进行特征提取,得到多个人口特征,将多个人口特征进行拼接,将拼接后的人口特征作为第二人口特征。
805、调用第二人口预测层,对第二人口特征进行预测处理,得到第二中间人口数据。
本申请实施例中,将得到的第二人口特征作为第二人口预测层的输入,调用第二人口预测层进行人口数据的预测。
在一种可能实现方式中,获取第一相似矩阵和第二相似矩阵,调用第二人口预测层,对第一相似矩阵和第二相似矩阵进行预测处理,得到第二中间人口数据。其中,第一相似矩阵和第二相似矩阵是根据第二人口特征中目标区域和其他区域的特征确定的。
其中,第一相似矩阵中的每个元素表示多个第一迁徙向量中任两个第一迁徙向量之间的相似度,第一迁徙向量为目标区域到其他任一区域的迁徙向量,即是将多个区域映射到坐标系中,将目标区域作为第一迁徙向量的起始位置,其他区域作为第一迁徙向量的终止位置,从而得到第一迁徙向量;获取第二相似矩阵,第二相似矩阵中的每个元素表示多个第二迁徙向量中任两个第二迁徙向量之间的相似度,第二迁徙向量为其他任一区域到目标区域的迁徙向量,即是将多个区域映射到坐标系中,将目标区域作为第二迁徙向量的终止位置,其他区域作为第二迁徙向量的起始位置。
例如,采用下述公式计算第一相似矩阵:
AO=cos(X[i,j],X[i,l]);
其中,AO为第一相似矩阵,i表示目标区域,j和l分别表示不同的其他区域。
采用下述公式计算第二相似矩阵:
AD=cos(X[j,i],X[l,i]);
其中,AD为第二相似矩阵,i表示目标区域,j和l分别表示不同的其他区域。
在一种可能实现方式中,如果同时对多个目标区域的人口数据进行预测,第一相似矩阵中的每个元素表示各个起始位置之间的相似度,采用下述公式计算第一相似矩阵:
AO(i,j)=cos(X[i,:],X[j,:]);
其中,AO为第一相似矩阵,i表示一个目标区域,j表示另一目标区域。
第二相似矩阵中的每个元素表示各个终止位置之间的相似度,采用下述公式计算第二相似矩阵:
AD(i,j)=cos(X[:,i],X[:,j]);
其中,AD为第二相似矩阵,i表示一个目标区域,j表示另一目标区域。
在一种可能实现方式中,得到第一相似矩阵和第二相似矩阵之后,采用下述公式得到第二中间人口数据:
Hl=σ(AOADHl-1Wl);
其中,Hl为图卷积层中的第l层的输出,σ为激活函数,AO为第一相似矩阵,AD为第二相似矩阵,Hl-1为图卷积层中的第l-1层的输出(第l层的输入),Wl是第l层待学习的参数。
需要说明的是,本申请实施例仅是以先执行步骤802-步骤803,再执行步骤804-步骤805为例进行说明,在另一实施例中,先执行步骤804-步骤805,再执行步骤802-步骤803,或者同时执行步骤802-步骤803和步骤804-步骤805。
806、调用第一数据共享层,根据第二中间人口数据对第一中间人口数据进行调整,得到第三人口数据。
在上述处理过程中,第一人口数据和第二人口数据是分开进行处理的,为了使预测的人口数据充分考虑第一人口数据和第二人口数据之间的关系,将第一中间人口数据和第二中间人口数据进行数据共享。
在一种可能实现方式中,第一人口预测层输出的第一中间人口数据为N*H的二维矩阵,第一个维度为N,第二个维度为H;第二人口预测层输出的第二中间人口数据为N*N*S的三维矩阵,第一个维度和第二个维度均为N,第三个维度为S;将三维矩阵N*N*S变形为二维矩阵N*(N*S),在第二个维度上对N*H和N*(N*S)进行拼接,得到二维矩阵N*(N*S+H),即得到第一数据共享层的输出。其中,H为2或3,如果H为2,则得到的第三人口数据中包括第二时间点的流入人口数量和流出人口数量,如果H为3,则得到的第三人口数据中包括第二时间点的流入人口数量、流出人口数量和驻留人口数量。
在一种可能实现方式中,调用第一输出层,对第一数据共享层输出的第三人口数据进行变换,得到N*2的矩阵,这个N*2的矩阵中包括第二时间点的流入人口数量和流出人口数量;或者得到N*3的矩阵,这个N*3的矩阵中包括第二时间点的流入人口数量、流出人口数量和驻留人口数量。
807、调用第二数据共享层,根据第一中间人口数据对第二中间人口数据进行调整,得到第四人口数据。
对于第二数据共享层来说,在一种可能实现方式中,第一人口预测层输出的第一中间人口数据为N*H的矩阵,第二人口预测层输出的第二中间人口数据为N*N*S的矩阵,对第一中间人口数据对应的矩阵进行变换得到三维矩阵N*1*H,第一个维度为N,第二个维度为1,第三个维度为H,再在第二个维度上重复堆叠N次,得到再次变换后的矩阵N*N*H,将矩阵N*N*H和第二中间人口数据对应的矩阵N*N*S在最后一个维度上拼接起来,得到矩阵N*N*(S+H),即得到第二数据共享层的输出。
如果采用与第一数据共享层同样的方式得到第二数据共享层的输出,那么后续在由第二输出层需要处理的数据为(N*S+H)*N,数据量较大,处理速度会较慢,容易产生过拟合。
在一种可能实现方式中,调用第二输出层,对第二数据共享层输出的第四人口数据进行变换,得到N*N的矩阵,这个N*N的矩阵中包括第二时间点的多个迁徙人口数量。
另外,人口预测模型是由计算机设备训练得到的,或者是由其他设备训练之后发送给计算机设备的,人口预测模型的训练过程详见下述图9所示的实施例,在此不再赘述。
另外,上述人口数据预测方法,能够应用于交通管控、疫情防控、旅行、空间规划或应急管理等场景下。
本申请实施例提供的方法,目标区域的流出人口数量与从该目标区域迁徙至其他区域的多个迁徙人口数量之间存在关联关系,在预测流出人口数量、流入人口数量和多个迁徙人口数量时,考虑该关联关系的影响,对预测得到的中间数据进行共享,从而在实现人口数据预测的同时,提高预测的人口数据的准确率。
并且,采用多任务的网络结构,根据第一人口数据和第二人口数据的特点,分别对第一人口数据和第二人口数据进行处理。由于人口流入和人口流出受到不同区域之间距离或区域所属的等级的影响,在对第一人口数据进行预测处理时,综合考虑多种关系的影响,提高了第一中间人口数据的预测准确率;由于人口迁徙受到起始区域和终止区域的影响,在对第二人口数据进行预测处理时,考虑不同区域之间的相似度,提高了第二中间人口数据的预测准确率。
并且,在进行数据共享时,为了避免数据量过大,采用不同的方式,分别对第一中间人口数据和第二中间人口数据进行调整,以减小处理量,提高处理速度,且避免了人口预测模型的过拟合问题。
并且,本申请中的人口预测模型对区域的形状没有限制,适用于任意形状的区域的人口数据的预测,扩展了应用范围。例如,区域的形状可以为网格或其他存在一定规律的形状,也可以是行政区域这种没有规律的形状。
图9是本申请实施例提供的一种模型训练方法的流程图。本申请实施例的执行主体为计算机设备,参见图9,该方法包括以下步骤:
901、获取样本区域在多个时间点的第一样本人口数据和第二样本人口数据。
其中,第一样本人口数据包括样本流出人口数量和样本流入人口数量,第二样本人口数据包括多个样本迁徙人口数量,每个样本迁徙人口数量为从样本区域向其他样本区域迁徙的人口数量。
获取样本人口数据的实施方式与上述图8所示的实施例中获取第一时间点的人口数据的实施方式类似,在此不再赘述。
902、根据多个第一样本人口数据和多个第二样本人口数据,训练人口预测模型。
在一种可能实现方式中,根据多个样本区域之间的等级关系、多个第一样本人口数据和多个第二样本人口数据,训练人口预测模型,以使得到的第一样本区域的预测人口数据和多个第二样本区域的预测人口数据满足目标条件,多个第二样本区域为第一样本区域的下级区域。
其中,目标条件包括第一样本区域的预测流出人口数量等于多个第二样本区域的预测流出人口数量之和、第一样本区域的预测流入人口数量等于多个第二样本区域的预测流入人口数量之和,或者第一样本区域的预测迁徙人口数量之和等于多个第二样本区域的预测迁徙人口数量之和中的至少一项。
例如,福州市、厦门市、龙岩市等福建省下辖的城市迁入北京市的人数之和等于福建省迁入北京市的总人数,对于任何情况都应当成立。因此,考虑此约束条件,将预测结果与约束条件的偏差作为Loss函数。设置第一指示矩阵X和第二指示矩阵Y,第一指示矩阵中如果第i个样本区域为第j个样本区域的下级区域,则第i行第j列对应的元素为1,否则对应的元素为0;第二指示矩阵中第i行第i列的元素为1,其他位置的元素为0,则损失函数为:
Loss1=∑(OedgeA-OedgeB)2
其中,Oedge为第二预测人口数据,该第二预测人口数据中包括第一样本区域的流入人口数量和第一样本区域的多个下级区域的流入人口数量。
在另一种可能实现方式中,调用人口预测模型,对多个第一样本人口数据和多个第二样本人口数据进行处理,得到样本区域的第一预测人口数据和第二预测人口数据,第一预测人口数据包括预测流出人口数量和预测流入人口数量,第二预测人口数据包括多个预测迁徙人口数量;根据预测流出人口数量和多个预测迁徙人口数量,训练人口预测模型,以使预测流出人口数量等于多个预测迁徙人口数量之和。
例如,损失函数为:
Figure GDA0003707857790000241
其中,Onode为第一预测人口数据,Onode[:,2]为预测流出人口数量,Oedge为第二预测人口数据。
在另一种可能实现方式中,调用人口预测模型,对多个样本区域的第一样本人口数据和第二样本人口数据进行处理,得到多个样本区域的第一预测人口数据和第二预测人口数据,第一预测人口数据包括预测流出人口数量和预测流入人口数量,第二预测人口数据包括多个预测迁徙人口数量;根据任一样本区域的预测流入人口数量和多个其他样本区域的预测迁徙人口数量,训练人口预测模型,以使任一样本区域的预测流入人口数量等于多个其他样本区域迁徙至该任一样本区域的多个预测迁徙人口数量之和。
例如,损失函数为:
Figure GDA0003707857790000242
其中,Onode为第一预测人口数据,Onode[:,1]为预测流入人口数量,
Figure GDA0003707857790000243
为预测迁徙数据,该预测迁徙数据中包括多个其他样本区域迁徙至该任一样本区域的多个预测迁徙人口数量。
在训练模型的过程中,能够采用上述至少一种损失函数进行训练,以使人口预测模型学习到根据历史时间点的人口数据对将来的人口数据进行预测的能力。
在训练人口预测模型的过程中,根据样本人口数据,获取预测人口数据的过程如下:
1、获取样本区域在多个时间点的第一样本人口数据和第二样本人口数据。
2、调用第一特征提取层,对第一样本人口数据进行特征提取,得到第一样本人口特征。
3、调用第一人口预测层,对第一样本人口特征进行预测处理,得到第一样本中间人口数据。
4、调用第二特征提取层,对第二样本人口数据进行特征提取,得到第二样本人口特征。
5、调用第二人口预测层,对第二样本人口特征进行预测处理,得到第二样本中间人口数据。
6、调用第一数据共享层,根据第二样本中间人口数据对第一样本中间人口数据进行调整,得到第一预测人口数据。
7、调用第二数据共享层,根据第一样本中间人口数据对第二样本中间人口数据进行调整,得到第二预测人口数据。
训练过程中的实施方式与上述图8所示的实施方式类似,在此不再赘述。
本申请实施例提供的方法,在训练模型的过程中,考虑到区域之间的等级关系,以及流出人口数量、流入人口数量和迁徙人口数量之间的约束关系,设置损失函数来对模型进行训练,提高了模型的准确率。
另外,相关技术中的传统时间序列分析方法也能够实现人口数据的预测,例如使用历史均值(History Average,HA)、差分自回归移动平均模型(AutoregressiveIntegrated Moving Average model,ARIMA)、季节性差分自回归移动平均模型(SeasonalAutoregressive Integrated Moving Average model,SARIMA)等模型。但是由于人口流动的复杂性、时空性、随机性等特征,传统时间序列分析方法难以对人口数据进行准确预测。
传统时间序列分析方法和本申请中的人口预测模型相比,对流出人口数量和流入人口数量的预测的准确率,如表2所示:
表2
测评指标 时间序列分析模型 人口预测模型
RMSE 32741.09 5221.89
MAE 13080.86 1773.44
WMAPE 5.61% 0.78%
对迁徙人口数量的预测的准确率,如表3所示:
表3
测评指标 时间序列分析模型 人口预测模型
RMSE 660.65 501.75
MAE 31.10 22.27
WMAPE 11.37% 7.76%
从上述表2和表3能够看出,本申请中的人口预测模型的预测准确率远大于传统时间序列分析方法的预测准确率。
图10是本申请实施例提供的一种人口数据预测装置的结构示意图。参见图10,该装置包括:
数据获取模块1001,用于获取目标区域在第一时间点的第一人口数据和第二人口数据,第一人口数据包括第一时间点对应的流出人口数量和流入人口数量,第二人口数据包括第一时间点对应的多个迁徙人口数量,每个迁徙人口数量为从目标区域向其他区域迁徙的人口数量,任一时间点对应的流出人口数量等于任一时间点对应的多个迁徙人口数量之和;
数据预测模块1002,用于对第一人口数据进行预测处理,得到目标区域在第二时间点的第一中间人口数据,对第二人口数据进行预测处理,得到目标区域在第二时间点的第二中间人口数据,第二时间点为第一时间点之后的时间点;
数据共享模块1003,用于对第一中间人口数据和第二中间人口数据进行数据共享,分别得到目标区域在第二时间点的第三人口数据和第四人口数据,第三人口数据包括第二时间点对应的流出人口数量和流入人口数量,第四人口数据包括第二时间点对应的多个迁徙人口数量。
本申请实施例提供的装置,本申请实施例提供的方法,目标区域的流出人口数量与从该目标区域迁徙至其他区域的多个迁徙人口数量之间存在关联关系,在预测流出人口数量、流入人口数量和多个迁徙人口数量时,考虑该关联关系的影响,对预测得到的中间数据进行共享,从而在实现人口数据预测的同时,提高预测的人口数据的准确率。
可选地,数据预测模块1002,用于调用人口预测模型中的人口预测网络,对第一人口数据进行预测处理,得到第一中间人口数据,对第二人口数据进行预测处理,得到第二中间人口数据;
数据共享模块1003,用于调用人口预测模型中的数据共享网络,对第一中间人口数据和第二中间人口数据进行数据共享,分别得到第三人口数据和第四人口数据。
可选地,人口预测网络包括第一特征提取层和第一人口预测层,参见图11,数据预测模块1002,包括:
第一提取单元1012,用于调用第一特征提取层,对第一人口数据进行特征提取,得到第一人口特征;
第一预测单元1022,用于调用第一人口预测层,对第一人口特征进行预测处理,得到第一中间人口数据。
可选地,参见图11,第一预测单元1022,用于:
调用第一人口预测层,根据平均流出数据对第一人口特征进行预测处理,得到第一中间人口数据,平均流出数据为目标区域在多个时间点的历史流出人口数量的均值;
调用第一人口预测层,根据距离关系数据,对第一人口特征进行预测处理,得到第一中间人口数据,距离关系数据包括目标区域与其他区域之间的距离;
调用第一人口预测层,根据空间关系数据,对第一人口特征进行预测处理,得到第一中间人口数据,空间关系数据表示目标区域的人口数据、其他区域的人口数据与参考距离之间的关系,参考距离为目标区域与其他区域之间的距离;
调用第一人口预测层,根据等级关系数据,对第一人口特征进行预测处理,得到第一中间人口数据,等级关系数据表示目标区域与其他区域之间的所属关系。
可选地,参见图11,第一预测单元1022,用于:
空间关系数据包括引力关系数据,调用第一人口预测层,根据引力关系数据,对第一人口特征进行预测处理,得到第一中间人口数据,引力关系数据表示目标区域的常住人口数量、其他区域的常住人口数量与参考距离之间的关系;
空间关系数据包括流动关系数据,调用第一人口预测层,根据流动关系数据,对第一人口特征进行预测处理,得到第一中间人口数据,流动关系数据用于表示目标区域的流出人口数量、其他区域的流入人口数量与参考距离之间的关系;
空间关系数据包括辐射数据,调用第一人口预测层,根据辐射数据,对第一人口特征进行预测处理,得到第一中间人口数据,辐射数据表示目标区域的常住人口数量、其他区域的常住人口数量与关联区域的人口数量之间的关系,关联区域为根据参考距离确定的区域。
可选地,人口预测网络还包括第二特征提取层和第二人口预测层,参见图11,数据预测模块1002,包括:
第二提取单元1032,用于调用第二特征提取层,对第二人口数据进行特征提取,得到第二人口特征;
第二预测单元1042,用于调用第二人口预测层,对第二人口特征进行预测处理,得到第二中间人口数据。
可选地,参见图11,第二预测单元1042,用于:
获取第一相似矩阵,第一相似矩阵中的每个元素表示多个第一迁徙向量中任两个第一迁徙向量之间的相似度,第一迁徙向量为目标区域到其他任一区域的迁徙向量;
获取第二相似矩阵,第二相似矩阵中的每个元素表示多个第二迁徙向量中任两个第二迁徙向量之间的相似度,第二迁徙向量为其他任一区域到目标区域的迁徙向量;
调用第二人口预测层,对第一相似矩阵和第二相似矩阵进行预测处理,得到第二中间人口数据。
可选地,第一人口数据为包括历史流出人口数量和历史流入人口数量的第一人口矩阵,第二人口数据为包括多个人口数量的第二人口矩阵,人口预测模型还包括第一输入层和第二输入层;参见图11,该装置还包括:
数据变换模块1004,用于调用第一输入层,对第一人口矩阵进行变换处理,得到对应的第三人口矩阵;
数据变换模块1004,还用于调用第二输入层,对第二人口矩阵进行变换处理,得到对应的第四人口矩阵。
可选地,人口预测模型还包括外部特征处理层,参见图11,该装置还包括:
特征获取模块1005,用于获取外部特征,外部特征包括时间特征或空间特征,时间特征是指第一时间点对应的特征,空间特征包括目标区域的地理位置或目标区域所属的等级;
特征获取模块1005,还用于调用外部特征层,对外部特征进行处理,得到处理后的外部特征。
可选地,数据预测模块1002,用于调用人口预测网络,分别将第一人口数据和第二人口数据与处理后的外部特征进行拼接,分别对拼接后的第一人口数据和拼接后的第二人口数据进行预测处理,得到第一中间人口数据和第二中间人口数据。
可选地,数据共享网络包括第一数据共享层和第二数据共享层,参见图11,数据共享模块1003,包括:
第一共享单元1013,用于调用第一数据共享层,根据第二中间人口数据对第一中间人口数据进行调整,得到第三人口数据;
第二共享单元1023,用于调用第二数据共享层,根据第一中间人口数据对第二中间人口数据进行调整,得到第四人口数据。
可选地,参见图11,该装置还包括:
样本获取模块1006,用于获取样本区域在多个时间点的第一样本人口数据和第二样本人口数据,第一样本人口数据包括样本流出人口数量和样本流入人口数量,第二样本人口数据包括多个样本迁徙人口数量,每个样本迁徙人口数量为从样本区域向其他样本区域迁徙的人口数量;
模型训练模块1007,用于根据多个第一样本人口数据和多个第二样本人口数据,训练人口预测模型。
可选地,参见图11,模型训练模块1007,用于:
根据多个样本区域之间的等级关系、多个第一样本人口数据和多个第二样本人口数据,训练人口预测模型,以使得到的第一样本区域的预测人口数据和多个第二样本区域的预测人口数据满足目标条件,多个第二样本区域为第一样本区域的下级区域;
其中,目标条件包括第一样本区域的预测流出人口数量等于多个第二样本区域的预测流出人口数量之和、第一样本区域的预测流入人口数量等于多个第二样本区域的预测流入人口数量之和,或者第一样本区域的预测迁徙人口数量之和等于多个第二样本区域的预测迁徙人口数量之和中的至少一项。
可选地,参见图11,模型训练模块1007,用于:
调用人口预测模型,对多个第一样本人口数据和多个第二样本人口数据进行处理,得到样本区域的第一预测人口数据和第二预测人口数据,第一预测人口数据包括预测流出人口数量和预测流入人口数量,第二预测人口数据包括多个预测迁徙人口数量;
根据预测流出人口数量和多个预测迁徙人口数量,训练人口预测模型,以使预测流出人口数量等于多个预测迁徙人口数量之和。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
需要说明的是:上述实施例提供的人口数据预测装置在预测人口数据时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的人口数据预测装置与人口数据预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图12是本申请实施例提供的一种终端1200的结构示意图。该终端1200可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving Picture Experts GroupAudio LayerIII,动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1200还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
终端1200包括有:处理器1201和存储器1202。
处理器1201可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1201可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1201可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。在一些实施例中,处理器1201还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1202可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1202中的非暂态的计算机可读存储介质用于存储至少一条程序代码,该至少一条程序代码用于被处理器1201所执行以实现本申请中方法实施例提供的人口数据预测方法。
在一些实施例中,终端1200还可选包括有:外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地,外围设备包括:射频电路1204、显示屏1205、摄像头组件1206、音频电路1207和电源1209中的至少一种。
外围设备接口1203可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。在一些实施例中,处理器1201、存储器1202和外围设备接口1203被集成在同一芯片或电路板上;在一些其他实施例中,处理器1201、存储器1202和外围设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路1204用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路1204包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1204可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路1204还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏1205用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时,显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时,显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏1205可以为一个,设置在终端1200的前面板;在另一些实施例中,显示屏1205可以为至少两个,分别设置在终端1200的不同表面或呈折叠设计;在另一些实施例中,显示屏1205可以是柔性显示屏,设置在终端1200的弯曲表面上或折叠面上。甚至,显示屏1205还可以设置成非矩形的不规则图形,也即异形屏。显示屏1205可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-EmittingDiode,有机发光二极管)等材质制备。
摄像头组件1206用于采集图像或视频。可选地,摄像头组件1206包括前置摄像头和后置摄像头。前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件1206还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器1201进行处理,或者输入至射频电路1204以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在终端1200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路1207还可以包括耳机插孔。
电源1209用于为终端1200中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。当电源1209包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,终端1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于:加速度传感器1211、陀螺仪传感器1212、压力传感器1213、光学传感器1215以及接近传感器1216。
加速度传感器1211可以检测以终端1200建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器1211可以用于检测重力加速度在三个坐标轴上的分量。处理器1201可以根据加速度传感器1211采集的重力加速度信号,控制显示屏1205以横向视图或纵向视图进行用户界面的显示。加速度传感器1211还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器1212可以检测终端1200的机体方向及转动角度,陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端1200的3D动作。处理器1201根据陀螺仪传感器1212采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器1213可以设置在终端1200的侧边框和/或显示屏1205的下层。当压力传感器1213设置在终端1200的侧边框时,可以检测用户对终端1200的握持信号,由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在显示屏1205的下层时,由处理器1201根据用户对显示屏1205的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
光学传感器1215用于采集环境光强度。在一个实施例中,处理器1201可以根据光学传感器1215采集的环境光强度,控制显示屏1205的显示亮度。具体地,当环境光强度较高时,调高显示屏1205的显示亮度;当环境光强度较低时,调低显示屏1205的显示亮度。在另一个实施例中,处理器1201还可以根据光学传感器1215采集的环境光强度,动态调整摄像头组件1206的拍摄参数。
接近传感器1216,也称距离传感器,设置在终端1200的前面板。接近传感器1216用于采集用户与终端1200的正面之间的距离。在一个实施例中,当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变小时,由处理器1201控制显示屏1205从亮屏状态切换为息屏状态;当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变大时,由处理器1201控制显示屏1205从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图12中示出的结构并不构成对终端1200的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图13是本申请实施例提供的一种服务器的结构示意图,该服务器1300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(Central ProcessingUnits,CPU)1301和一个或一个以上的存储器1302,其中,存储器1302中存储有至少一条程序代码,该至少一条程序代码由处理器1301加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
服务器1300可以用于执行上述人口数据预测方法中服务器所执行的步骤。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,存储器中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现上述实施例的人口数据预测方法中所执行的操作。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现上述实施例的人口数据预测方法中所执行的操作。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机程序代码,该计算机程序代码存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序代码,处理器执行该计算机程序代码,使得计算机设备实现上述实施例的人口数据预测方法中所执行的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上仅为本申请实施例的可选实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种人口数据预测方法,其特征在于,由计算机设备执行,所述方法包括:
获取多个样本区域在多个时间点的第一样本人口数据和第二样本人口数据,所述第一样本人口数据包括样本流出人口数量和样本流入人口数量,所述第二样本人口数据包括多个样本迁徙人口数量,每个样本迁徙人口数量为从所述样本区域向其他样本区域迁徙的人口数量;
根据所述多个样本区域之间的等级关系、多个第一样本人口数据和多个第二样本人口数据,训练人口预测模型,以使得到的样本区域的预测流出人口数量等于多个预测迁徙人口数量之和,且得到的第一样本区域的预测人口数据和多个第二样本区域的预测人口数据满足目标条件,所述多个第二样本区域为所述第一样本区域的下级区域;其中,所述目标条件包括所述第一样本区域的预测流出人口数量等于所述多个第二样本区域的预测流出人口数量之和、所述第一样本区域的预测流入人口数量等于所述多个第二样本区域的预测流入人口数量之和,或者所述第一样本区域的预测迁徙人口数量之和等于所述多个第二样本区域的预测迁徙人口数量之和中的至少一项;
获取目标区域在第一时间点的第一人口数据和第二人口数据,所述第一人口数据包括所述第一时间点对应的流出人口数量和流入人口数量,所述第二人口数据包括所述第一时间点对应的多个迁徙人口数量,每个迁徙人口数量为从所述目标区域向其他区域迁徙的人口数量,任一时间点对应的流出人口数量等于所述任一时间点对应的多个迁徙人口数量之和;
获取外部特征,所述外部特征包括时间特征、空间特征、天气特征或常住人口特征中的至少一项,所述时间特征是指所述第一时间点对应的特征,所述空间特征包括所述目标区域的地理位置或所述目标区域所属的等级,所述天气特征表示天气情况,所述常住人口特征表示所述目标区域的常住人口数量;调用所述人口预测模型中的外部特征层,对所述外部特征进行处理,得到处理后的外部特征;
调用所述人口预测模型中的人口预测网络,分别将所述第一人口数据和所述第二人口数据与所述处理后的外部特征进行拼接,分别对拼接后的所述第一人口数据和拼接后的所述第二人口数据进行预测处理,得到所述目标区域在第二时间点的第一中间人口数据和第二中间人口数据,所述第二时间点为所述第一时间点之后的时间点;
调用所述人口预测模型中的数据共享网络,根据所述第二中间人口数据对所述第一中间人口数据进行调整,得到所述目标区域在所述第二时间点的第三人口数据,根据所述第一中间人口数据对所述第二中间人口数据进行调整,得到所述目标区域在所述第二时间点的第四人口数据,所述第三人口数据包括所述第二时间点对应的流出人口数量和流入人口数量,所述第四人口数据包括所述第二时间点对应的多个迁徙人口数量。
2.根据权利要求1所述的方法,其特征在于,所述人口预测网络包括第一特征提取层和第一人口预测层,调用所述人口预测网络,对拼接后的所述第一人口数据进行预测处理,得到所述第一中间人口数据,包括:
调用所述第一特征提取层,对拼接后的所述第一人口数据进行特征提取,得到第一人口特征;
调用所述第一人口预测层,对所述第一人口特征进行预测处理,得到所述第一中间人口数据。
3.根据权利要求2所述的方法,其特征在于,所述调用所述第一人口预测层,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,包括以下至少一项:
调用所述第一人口预测层,根据平均流出数据对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述平均流出数据为所述目标区域在多个时间点的历史流出人口数量的均值;
调用所述第一人口预测层,根据距离关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述距离关系数据包括所述目标区域与其他区域之间的距离;
调用所述第一人口预测层,根据空间关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述空间关系数据表示所述目标区域的人口数据、其他区域的人口数据与参考距离之间的关系,所述参考距离为所述目标区域与所述其他区域之间的距离;
调用所述第一人口预测层,根据等级关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述等级关系数据表示所述目标区域与其他区域之间的所属关系。
4.根据权利要求3所述的方法,其特征在于,所述调用所述第一人口预测层,根据空间关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,包括以下至少一项:
所述空间关系数据包括引力关系数据,调用所述第一人口预测层,根据所述引力关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述引力关系数据表示所述目标区域的常住人口数量、其他区域的常住人口数量与所述参考距离之间的关系;
所述空间关系数据包括流动关系数据,调用所述第一人口预测层,根据所述流动关系数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述流动关系数据用于表示所述目标区域的流出人口数量、其他区域的流入人口数量与所述参考距离之间的关系;
所述空间关系数据包括辐射数据,调用所述第一人口预测层,根据所述辐射数据,对所述第一人口特征进行预测处理,得到所述第一中间人口数据,所述辐射数据表示所述目标区域的常住人口数量、其他区域的常住人口数量与关联区域的人口数量之间的关系,所述关联区域为根据所述参考距离确定的区域。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述人口预测网络还包括第二特征提取层和第二人口预测层,调用所述人口预测网络,对拼接后的所述第二人口数据进行预测处理,得到所述第二中间人口数据,包括:
调用所述第二特征提取层,对拼接后的所述第二人口数据进行特征提取,得到第二人口特征;
调用所述第二人口预测层,对所述第二人口特征进行预测处理,得到所述第二中间人口数据。
6.根据权利要求5所述的方法,其特征在于,所述调用所述第二人口预测层,对所述第二人口特征进行预测处理,得到所述第二中间人口数据,包括:
获取第一相似矩阵,所述第一相似矩阵中的每个元素表示多个第一迁徙向量中任两个第一迁徙向量之间的相似度,所述第一迁徙向量为所述目标区域到其他任一区域的迁徙向量;
获取第二相似矩阵,所述第二相似矩阵中的每个元素表示多个第二迁徙向量中任两个第二迁徙向量之间的相似度,所述第二迁徙向量为所述其他任一区域到所述目标区域的迁徙向量;
调用所述第二人口预测层,对所述第一相似矩阵和所述第二相似矩阵进行预测处理,得到所述第二中间人口数据。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述数据共享网络包括第一数据共享层和第二数据共享层,所述调用所述人口预测模型中的数据共享网络,根据所述第二中间人口数据对所述第一中间人口数据进行调整,得到所述目标区域在所述第二时间点的第三人口数据,根据所述第一中间人口数据对所述第二中间人口数据进行调整,得到所述目标区域在所述第二时间点的第四人口数据,包括:
调用所述第一数据共享层,根据所述第二中间人口数据对所述第一中间人口数据进行调整,得到所述第三人口数据;
调用所述第二数据共享层,根据所述第一中间人口数据对所述第二中间人口数据进行调整,得到所述第四人口数据。
8.一种人口数据预测装置,其特征在于,运行于计算机设备,所述装置包括:
样本获取模块,用于获取多个样本区域在多个时间点的第一样本人口数据和第二样本人口数据,所述第一样本人口数据包括样本流出人口数量和样本流入人口数量,所述第二样本人口数据包括多个样本迁徙人口数量,每个样本迁徙人口数量为从所述样本区域向其他样本区域迁徙的人口数量;
模型训练模块,用于根据所述多个样本区域之间的等级关系、多个第一样本人口数据和多个第二样本人口数据,训练人口预测模型,以使得到的样本区域的预测流出人口数量等于多个预测迁徙人口数量之和,且得到的第一样本区域的预测人口数据和多个第二样本区域的预测人口数据满足目标条件,所述多个第二样本区域为所述第一样本区域的下级区域;其中,所述目标条件包括所述第一样本区域的预测流出人口数量等于所述多个第二样本区域的预测流出人口数量之和、所述第一样本区域的预测流入人口数量等于所述多个第二样本区域的预测流入人口数量之和,或者所述第一样本区域的预测迁徙人口数量之和等于所述多个第二样本区域的预测迁徙人口数量之和中的至少一项;
数据获取模块,用于获取目标区域在第一时间点的第一人口数据和第二人口数据,所述第一人口数据包括所述第一时间点对应的流出人口数量和流入人口数量,所述第二人口数据包括所述第一时间点对应的多个迁徙人口数量,每个迁徙人口数量为从所述目标区域向其他区域迁徙的人口数量,任一时间点对应的流出人口数量等于所述任一时间点对应的多个迁徙人口数量之和;
特征获取模块,用于获取外部特征,所述外部特征包括时间特征、空间特征、天气特征或常住人口特征中的至少一项,所述时间特征是指所述第一时间点对应的特征,所述空间特征包括所述目标区域的地理位置或所述目标区域所属的等级,所述天气特征表示天气情况,所述常住人口特征表示所述目标区域的常住人口数量;调用所述人口预测模型中的外部特征层,对所述外部特征进行处理,得到处理后的外部特征;
数据预测模块,用于调用所述人口预测模型中的人口预测网络,分别将所述第一人口数据和所述第二人口数据与所述处理后的外部特征进行拼接,分别对拼接后的所述第一人口数据和拼接后的所述第二人口数据进行预测处理,得到所述目标区域在第二时间点的第一中间人口数据和第二中间人口数据,所述第二时间点为所述第一时间点之后的时间点;
数据共享模块,用于调用所述人口预测模型中的数据共享网络,根据所述第二中间人口数据对所述第一中间人口数据进行调整,得到所述目标区域在所述第二时间点的第三人口数据,根据所述第一中间人口数据对所述第二中间人口数据进行调整,得到所述目标区域在所述第二时间点的第四人口数据,所述第三人口数据包括所述第二时间点对应的流出人口数量和流入人口数量,所述第四人口数据包括所述第二时间点对应的多个迁徙人口数量。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至7任一权利要求所述的人口数据预测方法中所执行的操作。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至7任一权利要求所述的人口数据预测方法中所执行的操作。
CN202011123445.0A 2020-10-20 2020-10-20 人口数据预测方法、装置、计算机设备及介质 Active CN112163717B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011123445.0A CN112163717B (zh) 2020-10-20 2020-10-20 人口数据预测方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011123445.0A CN112163717B (zh) 2020-10-20 2020-10-20 人口数据预测方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN112163717A CN112163717A (zh) 2021-01-01
CN112163717B true CN112163717B (zh) 2023-01-10

Family

ID=73867585

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011123445.0A Active CN112163717B (zh) 2020-10-20 2020-10-20 人口数据预测方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN112163717B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191527A (zh) * 2021-03-19 2021-07-30 特斯联科技集团有限公司 一种基于预测模型进行人口预测的预测方法及装置
CN113724892B (zh) * 2021-08-31 2024-06-21 深圳平安智慧医健科技有限公司 一种人口流动的分析方法、装置、电子设备及存储介质
CN114328654A (zh) * 2021-12-10 2022-04-12 北京融信数联科技有限公司 一种基于大数据的人口统计方法、系统和可读存储介质
CN114707729B (zh) * 2022-04-07 2024-02-09 杭州城市大脑有限公司 老年人人口数量预测方法、装置、计算机设备及存储介质
CN116823572B (zh) * 2023-06-16 2023-12-19 中国联合网络通信有限公司深圳市分公司 人口流动数据的获取方法、装置及计算机可读存储介质
CN116861197B (zh) * 2023-09-01 2024-04-05 北京融信数联科技有限公司 一种基于大数据的流动人口监测方法、系统和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298483A (zh) * 2019-05-27 2019-10-01 特斯联(北京)科技有限公司 一种基于空间吸引度指标的区域人口预测方法与系统
CN110826786A (zh) * 2019-10-28 2020-02-21 广州杰赛科技股份有限公司 目的地点人口数量的预测方法、装置及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6493006B2 (ja) * 2015-06-18 2019-04-03 富士通株式会社 人口推計方法、人口推計プログラム、および人口推計装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110298483A (zh) * 2019-05-27 2019-10-01 特斯联(北京)科技有限公司 一种基于空间吸引度指标的区域人口预测方法与系统
CN110826786A (zh) * 2019-10-28 2020-02-21 广州杰赛科技股份有限公司 目的地点人口数量的预测方法、装置及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘钦普等.中小区域多单元人口发展预测――以南京市为例.《生态经济》.2013,(第06期), *
廖松等.基于改进PDE的人口预测建模与仿真.《电脑知识与技术》.2019,(第15期), *
蔡乐等.基于卷积神经网络的人口流量预测.《电脑与信息技术》.2019,(第06期), *

Also Published As

Publication number Publication date
CN112163717A (zh) 2021-01-01

Similar Documents

Publication Publication Date Title
CN112163717B (zh) 人口数据预测方法、装置、计算机设备及介质
CN109299315B (zh) 多媒体资源分类方法、装置、计算机设备及存储介质
CN110097019B (zh) 字符识别方法、装置、计算机设备以及存储介质
CN110544272B (zh) 脸部跟踪方法、装置、计算机设备及存储介质
CN113610750B (zh) 对象识别方法、装置、计算机设备及存储介质
CN114332530A (zh) 图像分类方法、装置、计算机设备及存储介质
CN112990053B (zh) 图像处理方法、装置、设备及存储介质
CN112036331A (zh) 活体检测模型的训练方法、装置、设备及存储介质
CN111243668A (zh) 分子结合位点检测方法、装置、电子设备及存储介质
CN111860485A (zh) 图像识别模型的训练方法、图像的识别方法、装置、设备
CN112115900B (zh) 图像处理方法、装置、设备及存储介质
CN110796248A (zh) 数据增强的方法、装置、设备及存储介质
CN111178343A (zh) 基于人工智能的多媒体资源检测方法、装置、设备及介质
CN113705302A (zh) 图像生成模型的训练方法、装置、计算机设备及存储介质
CN114820633A (zh) 语义分割方法、语义分割模型的训练方法、装置及设备
CN111753498A (zh) 文本处理方法、装置、设备及存储介质
CN114511864A (zh) 文本信息提取方法、目标模型的获取方法、装置及设备
CN113763931B (zh) 波形特征提取方法、装置、计算机设备及存储介质
CN112989134B (zh) 节点关系图的处理方法、装置、设备及存储介质
CN114283299A (zh) 图像聚类方法、装置、计算机设备及存储介质
CN113822263A (zh) 图像标注方法、装置、计算机设备及存储介质
CN113821658A (zh) 对编码器进行训练的方法、装置、设备及存储介质
CN112527104A (zh) 确定参数确定方法、装置、设备及存储介质
CN115168643B (zh) 音频处理方法、装置、设备及计算机可读存储介质
CN110990549A (zh) 获取答案的方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant