CN112801377A

CN112801377A - 一种对象估计方法、装置、设备及存储介质

Info

Publication number: CN112801377A
Application number: CN202110133241.3A
Authority: CN
Inventors: 冯杰; 李勇; 郭殿升; 孙福宁
Original assignee: Tsinghua University; Tencent Dadi Tongtu Beijing Technology Co Ltd
Current assignee: Tsinghua University; Tencent Dadi Tongtu Beijing Technology Co Ltd
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2021-05-14
Anticipated expiration: 2041-01-29
Also published as: CN112801377B

Abstract

本发明实施例公开了一种对象估计方法、装置、设备及存储介质，其中方法包括：通过获取待估计区域的定位数据和地图数据，进而获取到训练所需要的特征，如对象密度、兴趣点分布、区域对象流量和进出对象流量等；再根据对象密度和兴趣点分布对幂律模型进行训练，得到目标幂律模型；采用上述目标幂律模型根据对象密度得到估计对象数量；利用区域对象流量和进出对象流量对图神经网络模型进行训练，以使得图神经网络模型具备各子区域中的对象数量之间的邻近关系，最后根据邻近关系对估计对象数量进行调整，得到最终的目标估计数量。本发明提供的对象估计方法可以有效地提高数量估计模型对目标区域的全量数据进行估计的准确度。

Description

一种对象估计方法、装置、设备及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种对象估计方法、装置、设备及存储介质。

背景技术

对象数量的估计在城市建设的方方面面中都具有很大的社会价值，例如在公共安全方面、交通疏导方面，以及商业选址方面等等，而当前用于进行对象数量估计的方法，多是采用的基于定位数据进行对象数量的估计的方法，例如先采集使用定位服务的对象的数量，从而进一步地基于定位服务采集到的对象的数量，利用回归模型进行回归拟合，从而实现对对象数量的估计。由此可见，由于当前进行对象估计时采用的对象估计模型，仅参考了采样对象的数量，因此，采用当前进行对象估计的方法构建的对象估计模型所估计得到的对象的估计数量准确度较低。

发明内容

本发明实施例提供了一种对象估计方法、装置、设备及存储介质，可以提高在估计对象的数量时的准确性。

一方面，本发明实施例提供了一种对象估计方法，所述方法包括：

获取待估计区域中各个子区域的对象密度，调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量；

获取所述待估计区域中各个子区域的第一流量特征和第二流量特征，其中，任一子区域的第一流量特征用于描述相应子区域的对象从所述相应子区域转移到另一子区域的数量，任一子区域的第二流量特征用于描述进入相应子区域的对象的数量，以及离开相应子区域的对象的数量；

根据各个子区域的第一流量特征和第二流量特征，对图神经网络模型进行训练，以确定所述待估计区域的各个子区域包括对象的数量对应的邻近关系；

采用所述邻近关系对每个子区域包括的对象的估计数量进行校正处理，并根据每个子区域校正后的估计数量确定所述待估计区域包括的对象的目标估计数量。

再一方面，本发明实施例提供了一种对象估计装置，其特征在于，所述装置包括：获取单元，用于获取待估计区域中各个子区域的对象密度，调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量；

所述获取单元，还用于获取所述待估计区域中各个子区域的第一流量特征和第二流量特征，其中，任一子区域的第一流量特征用于描述相应子区域的对象从所述相应子区域转移到另一子区域的数量，任一子区域的第二流量特征用于描述进入相应子区域的对象的数量，以及离开相应子区域的对象的数量；

训练单元，用于根据各个子区域的第一流量特征和第二流量特征，对图神经网络模型进行训练，以确定所述待估计区域的各个子区域包括对象的数量对应的邻近关系；

校正单元，用于采用所述邻近关系对每个子区域包括的对象的估计数量进行校正处理；

估计单元，用于根据每个子区域校正后的估计数量确定所述待估计区域包括的对象的目标估计数量。

再一方面，本发明实施例提供了一种对象估计设备，其特征在于，所述设备包括输入接口和输出接口，还包括：

处理器，适于实现一条或多条指令；

计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行上述对象估计方法。

再一方面，本发明实施例提供了一种计算机存储介质，其特征在于，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行上述对象估计方法。

在本发明实施例中，通过获取待估计区域的定位数据和地图数据，得到待估计区域包括的多个子区域中每个子区域对应的对象密度和功能属性，在进行对象估计时，根据每个子区域的功能属性和对象密度运行对应的估计算法，得到每个子区域包括的对象的估计数量，然后结合本实施例中构建的图神经网络模型在时间和空间两个维度上对该对象的估计数量进行进一步地调整，不仅减少了真值数据的使用量，还具备在不同城市、不同数据之前的迁移能力。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种对象估计系统的架构示意图；

图2是本发明实施例提供的一种对象估计方法的流程示意图；

图3a是本发明实施例提供的一种功能属性推断的流程示意图；

图3b是本发明实施例提供的一种图神经网络模型的架构示意图；

图3c是本发明实施例提供的一种对象特征图的示意图；

图4是本发明实施例提供的一种对象估计方法的流程示意图；

图5是本发明实施例提供的一种对象估计流程的示意图；

图6是本发明实施例提供的一种对象估计装置的示意性框图；

图7是本发明实施例提供的一种对象估计设备的示意性框图。

具体实施方式：

本发明实施例提供了一种对象估计方法，该对象估计方法通过挖掘采样数据和全量数据之间的关系，结合图神经网络构建了一个有效的、可泛化的对象估计方法，使得服务器可通过定位服务确定某个区域包括的少量对象，进而可采用该对象估计方法对该某个区域中包括的全部对象的数量进行估计，并可估计得到准确度较高的，针对该某个区域包括的对象的数量，其中，该某个区域中包括的对象可以是人或者动物等。在一个实施例中，该对象估计方法可应用在如图1所示的对象估计系统中，如图1所示，该对象估计系统包括多个终端设备10，以及服务器11，其中，该服务器11和该对象估计系统中的每个终端设备均建立有通信连接，该终端设备10为待估计区域中使用了定位服务采样对象的终端设备，该终端设备10则用于获取该待估计区域中使用了定位服务的采样对象的定位数据，并将获取到的定位数据发送到服务器11，对应地，该服务器11用于从终端设备10获取定位数据，并基于获取到的定位数据对待估计区域中包括的对象的数据进行估计。在一个实施例中，在服务器11从终端设备10中获取定位数据时，该服务器11可按照一定的时间间隔从该终端设备10中周期性地获取定位数据，或者，该服务器11也可确定需要进行对象数量的估计时，从终端设备10中获取定位数据。在本发明实施例中，对采样对象的终端设备10向服务器11发送定位数据的时机和方式均不作限定。其中，该待估计区域中使用定位服务的的采样对象的数量可以是一个或多个，每个采样对象对应的终端设备也可以是一个或多个，本发明实施例主要以一个采样对象与一个终端设备相对应为例进行说明。

在一个实施例中，当服务器11从不同采样对象对应的终端设备10处获取到相应采样对象的定位数据后，该服务器11还可进一步获取该待估计区域的地图数据，从而使得服务器11可基于该定位数据和地图数据对该待估计区域中对象的数量进行估计。其中，该地图数据用于确定该待估计区域中的一个或多个子区域，在服务器基于地图数据确定该待估计区域中的子区域时，该服务器可基于地图数据中的兴趣点(Point Of Interest，POI)确定该待估计区域包括的一个或多个子区域，具体地，该地图数据包括的兴趣点用于描述该待估计区域中位于特定位置区域的区域标签，该区域标签例如可以是餐馆，学校或者医院等，那么可以理解，服务器在可将每个兴趣点指示的位置区域作为一个子区域；或者，该服务器也可基于地图数据指示的街道区域，确定该待估计区域包括的子区域，其中，该地图数据如果指示的街道区域(或街区)包括A街区，B街区，C街区，那么可以理解，服务器可将A街区作为一个子区域，B街区作为一个子区域等；或者，服务器也可按照预设的区域大小确定该待估计区域包括的一个或多个子区域，具体地，该服务器可将地图数据中处于每500*500平方毫米大小网格的区域作为一个子区域。

在服务器获取到地图数据和定位数据后，服务器则可根据获取到的定位数据和地图数据进行特征提取，从而得到用于描述该待估计区域中包括的对象的数量的静态特征和动态特征，静态特征包括采样对象的数量、POI分布，其中，采样对象的数量用于表示当前时刻使用过定位服务的人数，即用于指示该待估计区域中使用了线上定位服务的采样人口的数量，且服务器将基于该采样对象的数量对该待估计区域中全部对象的数量进行估计，因此，该采样对象的数量将作为对象估计的核心基础输入，POI分布可按照地图数据中各地理位置的功能分区，确定该地图数据包括的一个或多个子区域，可以理解，基于POI分布确定的任一子区域即为该待估计区域的一个功能区域，其中，不同功能区域具备的功能属性不同，且不同功能区的功能属性是对象迁移和聚集的重要地理因素。在一个实施例中，服务器可基于提取得到的静态特征确定该待估计区域中各子区域中的对象密度。在一个实施例中，动态特征用于描述待估计区域中各子区域包括的对象对应的流量特征，动态特征包括第一流量特征(如origin-destination，OD流量)，和第二流量特征(对象出入流量)，其中，OD流量是指在一定时间范围内，该待估计区域中某个区域(origin)的对象从该某个子区域到达另一子区域(destination)的数量，该对象出入流量是指在一定时间范围内，进入该待估计区域中的某个子区域的对象的数量，以及离开该待估计区域中某个子区域的对象的数量。其中，OD流量及对象出入流量描述了待估计区域的不同子区域中对象活动的热度和对象在不同子区域之间的交互强度，该OD流量和对象出入流量可以直接从定位数据中统计得到。

在服务器得到上述的静态特征和动态特征后，可调用目标幂律模型根据待估计区域中各子区域的对象密度，确定相应子区域中对象的估计数量，以及，该服务器可基于该待估计区域中各子区域的第一流量特征和第二流量特征对图神经网络模型进行训练，并得到各个子区域中包括的对象的数量所具备的邻近关系，可以理解，该邻近关系是根据对象在该待估计区域的不同子区域之间的移动，导致的各子区域中包括的对象产生的数量变化确定的，服务器得到该邻近关系之后，则可采用该邻近关系对每个子区域中包括的对象的数量进行校正处理，具体地，可以是根据该邻近关系增加或减少某个子区域中对象的估计数量。在服务器对每个子区域中包括的对象的估计数量进行校正处理后，该服务器则可基于每个子区域中包括的对象对应的校正后的估计数量，确定该待估计区域中包括的全部对象的数量(即全量对象数)。

在一个实施例中，为了确定得到更加准确的对象的估计数量，服务器还可通过对象估计模型对每个子区域中包括的对象对应的校正后的估计数量进行动态调整和补全，例如服务器可以根据待估计区域包括的对象总数对应的波动假设，对每个子区域包括的对象的校正后的估计数量进行缩放处理，然后将缩放处理后的对象的估计数量进行求和处理，得到该待估计区域中的全量对象数。

请参见图2，图2是本发明实施例提供的一种对象估计方法的示意流程图。如图2所示，该方法包括：

S201，获取待估计区域中各个子区域的对象密度，调用目标幂律模型根据任一子区域的对象密度确定该任一子区域中对象的估计数量。

在对待估计区域中包括的对象的数量进行估计时，服务器可先获取该待估计区域中使用了定位服务的采样对象的定位数据，以及该待估计区域的地图数据，进一步地，服务器可基于该地图数据确定该待估计区域包括的一个或多个子区域，并根据确定出的子区域和定位数据，得到该待估计区域中每个子区域包括的对象的对象密度。在服务器基于该地图数据确定该待估计区域包括的一个或多个子区域时，该服务器可先确定地图数据中的POI分布，进一步地，服务器可基于该POI分布，对该地图数据中的兴趣点进行聚类运算，从而确定出该地图数据包括的一个或多个功能区，进而可将确定出的一个功能区作为一个子区域，其中，该功能区可以是娱乐属性的区域、教育属性的区域，或者医疗属性的区域等。在一个实施例中，服务器在采用聚类的方式确定该地图数据包括的一个或多个功能区时，可如图3a所示，该待估计区域中不同的子区域如果类比为不同的文档，每个子区域中包括的POI的类型和每个文档中包括的单词的类型类似，那么，可以参考基于文档中单词的类型确定文档主题的方式，根据该待估计区域包括的POI的类型确定待估计区域中包括的子区域。其中，在确定文档主题时可通过对文档的词频-逆文档频率(Term Frequency-Inversedocument Frequency，TF-IDF)的统计，从而可将较高频率的单词作为文档的主题，由于可通过每个文档中出现频率较高的单词的类型确定文档的主题，那么，可以类比得到：服务器在确定该待估计区域的多个子区域时，可以通过每个子区域中出现率较高的POI的类型确定每个子区域对应的属性。具体地，通过对待估计区域中的兴趣点进行统计分类，从而将相同类型的兴趣点聚合到同一类，进而服务器就可根据每一类的兴趣点指示的地理位置得到待估计区域中的子区域，进而根据兴趣点的类别确定该子区域的功能属性，每个子区域的功能属性代表着对象移动和聚集的关键地理要素。

在一个实施例中，服务器对待估计区域中POI分布的进行聚类运算时，可采用无监督的聚类算法对该待估计区域中的POI分布进行分类，该无监督的聚类算法例如可以是K均值(Kmeans)聚类算法，或者层次聚类算法等，此外，服务器也可采用有监督的聚类算法，对待估计区域中POI分布的进行统计分类，并得到该待估计区域中包括的一个或多个子区域。在服务器确定出该待估计区域包括的子区域后，进一步地，可基于每个子区域中使用定位服务的采样对象的数量，确定每个子区域的对象密度，在服务器得到每个子区域的对象密度之后，则可调用目标幂律模型根据任一子区域的对象密度，对该任一子区域内包括的对象的数量进行估计，得到该任一区域中包括的对象的估计数量；在服务器得到每个子区域中包括的对象的估计数量后，即可确定出该待估计区域包括的全部对象的估计数量。

在一个实施例中，该目标幂律模型是训练完成的幂律模型，服务器在对初始的幂律模型进行训练，并得到该目标幂律模型时，可先基于该地图数据和定位数据进行特征提取，得到用于描述该待估计区域中包括的对象的数量的静态特征和动态特征，从而可根据该静态特征，动态特征，以及各子区域的区域语义对该初始的幂律模型进行训练，从而得到目标幂律模型。在具体实现中，服务器可先调用该初始的幂律模型根据该静态特征和动态特征，并在考虑不同子区域的区域语义的情况下，对该待估计区域中包括的对象的数量进行初步估计，得到初步估计数量，然后，服务器可基于各子区域对应的功能属性和对象密度，确定用于对每个子区域中包括的全部对象进行估计的估计算法，并对该估计算法的参数(即幂律模型中的关键参数)进行动态调整，从而将调整完成的算法参数作为目标幂律模型中包括的目标估计算法，其中，该估计算法如式(1)所示：

其中，该待估计区域中的一个子区域与一个u相对应，j表示每个子区域对应的功能属性，

表示子区域u在t时段对应的对象密度，

为目标幂律模型的输出，即估计得到的某个子区域中对象的数量，δ用于指示预设的密度阈值，那么可以理解，对应对象密度大于δ的子区域为对象密集区，对应对象密度小于δ的子区域为对象稀疏区，也就是说，在该估计算法中，

用于估计对象稀疏区中包括的对象的数量，

则用于估计对象密集区中包括的对象的数量。而α和β则是目标幂律模型的关键参数，其中，α是线性参数和β是指数参数，那么服务器确定目标幂律模型的过程即是对关键参数α和β不断调整，从而确定出目标α和目标β的过程，在一个实施例中，服务器在可基于某个子区域中采样对象的数量，以及提前收集的该某个子区域中全部对象的数量使用最小二乘法对该参数α和β进行训练，从而确定出最优的目标α和目标β。在服务器确定出最优的目标α和目标β后，即可确定得到了目标幂律模型，并可调用目标幂律模型根据任一子区域的对象密度，对该任一子区域内包括的对象的数量进行估计，得到该任一区域中包括的对象对应的估计数量。

S202，获取待估计区域中各个子区域的第一流量特征和第二流量特征。

S203，根据各个子区域的第一流量特征和第二流量特征，对图神经网络模型进行训练，以确定待估计区域的各个子区域包括对象的数量对应的邻近关系。

在步骤S202和步骤S203中，第一流量特征可以是上述的OD流量，第二流量特征可以是上述的对象出入流量，服务器在获取到待估计区域中每个子区域的第一流量和第二流量后，则可基于该每个子区域的第一流量特征和第二流量特征对该图神经网络(GraphConvolutional Network，GCN)进行训练，并确定出该待估计区域的各个子区域包括的对象的数量对应的邻近关系，从而可基于该邻近关系，对该待估计区域中每个子区域包括的对象的估计数量进行校正处理，即转而执行步骤S204。在一个实施例中，图神经网络模型是一种面向图结构数据的神经网络结构，该结构能够通过捕捉以边所描述的节点之间的相似性，学习得到节点的向量特征表达，并应用于下游的不同任务(如分类、预测等)中，具体地，服务器可先将易得的、丰富的对象数据作为基础，并通过构建对象的流量预测任务来预训练图神经网络模型，从而使图神经网络学到基础的时空信息，随后通过少量的全局对象数据来微调模型，即可完成迁移场景下的对象扩样估计任务。

在一个实施例中，该图神经网络的模型框架可如图3b所示，服务器将提取得到的特征(即包括该第一流量特征和第二流量特征)拼接起来，作为图神经网络的输入，随后通过图神经网络学习区域的嵌入表征，并利用线性层完成将学习得到的嵌入表征转换为对于目标值的估计。用对象预测任务预训练该模型，所有的模型参数均可更新，同时目标值为人流量真值(采样)，完成预训练后，用于扩样任务的微调时，将每个子区域中包括的对象的估计数量作为额外输入到模型中，只有最终的线性层参数可微调，同时目标值改为整体的全局人口数量，完成微调后，输入该待估计区域的特征，即可给出对区域的整体对象数量的估计。其中，通过对象预测任务预训练该图神经网络模型可以具体是基于估计数量和人流量真值之间的均方误差和均方误差阈值对图神经网络模型中的参数进行调整，以得到训练好的图神经网络模型。需要说明的是，输入到该图神经网络的模型框架，以对该图神经网络进行训练的特征还可包括上述提及的静态特征，即服务器可将提取到的静态特征和动态特征拼接后，输入到该图神经网络中进行训练。

基于第一流量特征和第二流量特征对图神经网络模型的训练，将得到该待估计区域中各个子区域包括的对象的数量对应的邻近关系，其中，得到的邻近关系可以是如图3c所示的对象特征图，其中，该对象特征图包括多个节点，每个节点用于指示所述待估计区域中的一个子区域，如图3c中由30标记的节点和由31标记的节点分别指示待估计区域中不同的子区域，且该对象特征图中的任意两个不同节点之间的连接关系用于指示相应子区域中包括的对象的数量对应的邻近关系。例如节点30和节点31之间的连线32代表节点30指示的子区域和节点31指示的子区域中包括的对象的数量之间存在邻近关系。在服务器得到各个子区域中包括的对象的数量对应的邻近关系后，则可采用该邻近关系对每个子区域包括的对象的估计数量进行校正处理，以使得每个子区域中包括的对象的估计数量在时域上更加平滑，在空间上更加符合先验分布。

S204，采用邻近关系对每个子区域包括的对象的估计数量进行校正处理，并根据每个子区域校正后的估计数量确定待估计区域包括的对象的目标估计数量。

在服务器确定出待估计区域中的各子区域包括的对象的数量对应的邻近关系后，可采用该邻近关系对每个子区域包括的对象的估计数量进行校正处理，在服务器采用该邻近关系对每个子区域包括的对象的估计数量进行校正处理时，可先根据每个子区域包括的对象的估计数量，构建任一子区域对象对应的数量变化曲线，那么，服务器可根据先验知识对该数量变化曲线做平滑处理，并基于平滑处理后的曲线确定每个子区域对应的校正后的数量，从而完成对每个子区域中包括对象的数量的平滑处理。在服务器对每个子区域包括的对象的数量进行平滑处理完成后，进一步地，该服务器则可基于每个子区域校正后的估计数量，确定出该待估计区域中包括的对象的目标估计数量，在具体实现中，服务器可直接对每个子区域对应的校正后的估计数量进行求和，并将求和后的数量作为该待估计区域中包括的对象的目标估计数量；或者，该服务器也可对每个待估计区域对应的校正后的估计数量进行缩放处理，并进一步对缩放处理后的估计数量进行求和处理，从而得到该待估计区域的目标估计数量。

在本发明实施例中，服务器通过待估计区域的定位数据和地图数据，得到待估计区域包括的多个子区域中每个子区域对应的对象密度和功能属性，在进行对象估计时，根据每个子区域的功能属性和对象密度运行对应的估计算法，得到每个子区域包括的对象的估计数量，然后结合本实施例中构建的图神经网络模型在时间和空间两个维度上对该对象的估计数量进行进一步地调整，不仅解决了由于待估计区域的兴趣点和对象数据缺乏而带来的参数估计难题，还提升了对象的估计数量的准确性和真实性。

请参见图4，图4是本发明实施例提供的另一种对象估计方法的流程示意图。如图4所示，该方法包括：

S401，获取待估计区域中各个子区域的对象密度，调用目标幂律模型根据任一子区域的对象密度确定该任一子区域中对象的估计数量。

在一个实施例中，在服务器获取待估计区域中各个子区域的对象密度时，具体可以通过服务器获取待估计区域的地图数据和定位数据，再根据该地图数据和该定位数据确定该待估计区域中的各个子区域的对象密度。其中，该定位数据用于指示每个子区域中包括的对象数量，该地图数据用于指示该待估计区域中包括的子区域。在一个实施例中，服务器在调用目标幂律模型根据任一子区域的对象密度确定该任一子区域中对象的估计数量时，服务器可先根据任一子区域的对象密度，确定该任一子区域的对象密度对应的目标密度类型，然后服务器可根据该目标密度类型，确定该目标幂律模型对该目标密度类型的对象密度进行数量估计时采用的目标估计算法；再采用该目标估计算法，根据该任一子区域的对象密度估计该任一子区域的对象的估计数量。其中，任一子区域的对象密度对应的目标密度类型为第一密度类型或第二密度类型，进行对象估计时采用的目标估计算法为第一估计算法或第二估计算法。

具体实施例中，若该目标密度类型为第一密度类型，则确定该目标幂律模型在对该目标密度类型的对象密度进行数量估计时，采用的目标估计算法为该第一估计算法；若该目标密度类型为第二密度类型，则确定该目标幂律模型在对该目标密度类型的对象密度进行数量估计时，采用的目标估计算法为第二估计算法。其中，该第一估计算法如式(2)所示，第二估计算法如式(3)所示：

在一个实施例中，多个同一目标密度类型的子区域在进行对象估计时，同一功能属性的子区域所用的目标α和目标β一致。服务器对目标α和目标β进行调整时，可以基于各个子区域的功能属性和目标密度类型将该多个子区域进行分组，并针对任一分组，对幂律模型中的关键参数α和β进行调整，以得到目标α和目标β。示例性地，假设按对象密度的稀疏性确定目标密度类型，以对A市的全量人口进行估计为例进行说明。服务器先获取待估计区域(A市)的地图数据和A市市民使用的终端产生的定位数据，然后根据地图数据得到待估计区域中包括的A功能区、B功能区和C功能区，根据定位数据得到A功能区、B功能区和C功能区的采样人口密度，并基于人口密度的阈值，将待估计区域的各个功能区中采样人口密度小于阈值的子区域的人口密度对应的目标密度类型定义为第一密度类型(人口稀疏类型)，将采样人口密度大于或等于阈值的功能区的人口密度对应的目标密度类型定义为第二密度类型(人口密集类型)。假设A功能区和C功能区的采样人口密度对应的目标密度类型为人口稀疏类型，B功能区的采样人口密度对应的目标密度类型为人口密集类型，且A功能区和B功能区的功能属性为教育属性，C功能区的功能属性为娱乐属性，那么，利用上述A、B、C三个功能区的人口数据对幂律模型进行训练时，将会得到3组目标α和目标β，分别为人口稀疏类型的教育属性区域对应的目标α和目标β、人口稀疏类型的娱乐属性区域对应的目标α和目标β，以及人口密集类型的教育属性区域对应的目标α和目标β。

S402，获取待估计区域中各个子区域的第一流量特征和第二流量特征。

S403，根据各个子区域的第一流量特征和第二流量特征，对图神经网络模型进行训练，以确定待估计区域的各个子区域包括对象的数量对应的邻近关系。

在一个实施例中，步骤S402和步骤S403的具体实施方式可参见上述实施例中步骤S202和步骤S203的描述，在此不再赘述。S404，根据任一子区域在不同时间包括的对象对应的估计数量，构建该任一子区域中的对象在时间上对应的数量变化曲线。

S405，根据该待估计区域中各个子区域中对象在不同时间对应的数量的邻近关系，对该任一子区域中的对象在时间上对应的数量变化曲线进行平滑处理。

S406，根据该平滑处理后的数量变化曲线，确定该任一子区域的校正后的估计数量，并根据每个子区域校正后的估计数量确定该待估计区域包括的对象的目标估计数量。

在步骤S404至步骤S406中，服务器可以先基于定位数据中获取各个子区域中包括的对象的估计数量，进而构建各个子区域中每个子区域对应的对象的估计数量的数量变化曲线，该数量变化曲线用于指示对应的子区域在不同时间上的对象的估计数量。在构建了每个子区域对应的数量变化曲线之后，服务器可以通过上述图神经网络模型中学习得到的各个子区域包括的对象的数量之间的邻近关系，从时间和空间两个维度上对该每个子区域对应的数量变化曲线进行平滑微调，从而使得该数量变化曲线在时域上更加平滑，在空间上更符合先验分布，进而使得该估计对象数量更加真实和准确。可以理解的是，该平滑微调使得数量变化曲线所指示的对象的估计数量的变化趋势不会出现陡增或骤降的情况，进而使得在任何时间下，对象的估计数量都更符合真实分布。

经过实验发现，若待估计区域为A市，定位数据为A市19年10月28日到11月28日的自由定位数据，通过引入外部运营商数据作为全局采样人口来评估人口估计的整体效果。实验中，统计了在500米网格上的使用定位服务的人数、人口出入数等，同时将运营商数据同步映射到500米网格上作为人口真值，最终以平均绝对百分比误差(Mean AbsolutePercentage Error，MAPE)作为估计结果来衡量不同对象估计模型的估计效果，可以理解的是，本实验中每个子区域的大小为500平方米，在每个子区域上使用定位服务的人数即为本次实验中每个子区域的采样人口数，该子区域的人口出入数为一段时间内进入该子区域的人数和离开该子区域的人数之和。本次实验选择了基础幂律模型(不考虑各种高阶特征和区域特性的最初版幂律模型)和多层感知机(Multi-Layer Perceptron，MLP)模型作为基准算法模型，在同一条件下，分别交由基础幂律模型得到人口估计数量1、MLP模型得到人口估计数量2，以及交由本发明提供的对象估计模型得到人口估计数量3，然后将人口估计数量1、人口估计数量2和人口估计数量3分别与基于运营商数据指示的人口真值进行差值运算得到MAPE1、MAPE2、MAPE3，通过比较MAPE1、MAPE2、MAPE3的大小来评估上述三个对象估计模型的估计效果，其中，该MLP模型可直接通过输入的多种特征得到人口估计数量。实验结果可如表1所示：

表1

采用的模型	平均绝对百分百误差	提升
			基础幂律模型	77％	25.97％
MLP	81％	29.63％
			本申请	57％	-

可见，相比基准算法模型，使用本申请实施例提供的对象估计方法可以将MAPE降低25％以上达到57％的水平，由此可见，本申请进行对象数量的估计的效果相比于现有的进行对象估计的方法所达到的效果得到了有效提升，并可产生可观的收益。在一个实施例中，使用本申请实施例提供的对象估计方法构建对象估计模型的流程可参见图5所示。服务器在特征提取过程中，先根据地图数据61得到待估计区域中的每个子区域以及每个子区域对应的功能属性，然后再基于定位数据得到每个子区域对应的对象密度、OD流量及对象出入流量。在服务器得到每个子区域的对象密度之后，可基于对象密度得到每个子区域的对象密度对应的目标密度类型，具体地，可以根据对象密度与对象密度阈值的大小关系进行确定目标密度类型。然后服务器采用目标幂律模型根据目标密度类型及功能属性选择62中对应的目标估计算法对该子区域进行对象估计，得到对应的对象的估计数量，该子区域中包括的对象的估计数量与该子区域对应的对象密度之间的关系可参见如63所示的散点图；并且，服务器会根据获取到的每个子区域的OD流量、对象出入流量、对象密度以及兴趣点分布对图神经网络模型进行训练，使得该图神经网络模型学习到待估计区域中各个子区域之间的邻近关系。其中，OD流量和对象出入流量用于指示如65所示的该子区域与其他子区域之间的对象流动情况，如指示子区域A包括的对象与子区域B包括的对象之间是否存在对象流动，以及指示对象流动的方向是由A区域流向B区域，还是由B区域流向A区域；邻近关系用于指示各个节点对应的子区域包括的对象的数量之间存在的影响关系，例如64表示了与节点641指示的子区域包括的对象的数量存在影响关系的子区域，在不同的时间下，节点641指示的子区域包括的对象的数量对其他节点指示的子区域中包括的对象的数量造成的影响也不相同，因此可以理解，不同时间下同一待估计区域中的各个子区域包括的对象的数量之间形成的邻近关系也不相同。当服务器训练好图神经网络模型之后，采用该邻近关系对目标幂律模型得到的各个子区域包括的对象的估计数量进行调整，最后服务器基于经过图神经网络模型调整的对象的估计数量得到待估计区域的估计结果，即得到待估计区域的全量数据。

具体实施例中，由于用户产生定位数据的设备的市场占用率、用户设备情况以及用户关闭设备上的定位权限等多方面原因，单一的LBS(Location Based Services，基于位置的服务)应用通常只能捕捉到待估计区域中不同子区域的采样人口数量，而且采样人口数量所占的比例在不同的子区域中不相同，因此，基于采样人口数量估计用户的出行需求是十分困难的。又由于已有的实时人流数据只是在待估计区域中的部分子区域进行采样得到的人流变化情况，无法准确反映待估计区域中包括的全量人口对应的人流变化情况，因此，通过已有的实时人流数据得到的对象估计模型的应用价值和可信度都十分有限。基于人口扩样后的人流监控，其稳定性、覆盖面和可信度都将得以提高。本发明实施例提供的对象估计方法构建的对象估计模型可以增强和扩充定位数据感知到的采样人口数据，从而得到增强后的全量人口数据，该增强后的全量人口估计数据可以广泛地应用于面向公共安全和智慧交通的产品中，有效地提升了定位数据在人口感知方面的可用性。具体地，服务器可通过将采样人口数量进行动态、精准的补全，以获得对于待估计区域全量人口的动态估计，进而得到更加准确的人流数量，以使得相关部门能够获得更加准确的出行需求估计，有效地提高了下游的交通感知和研判效果。

在又一个实施例中，假设待估计区域为北京市，则服务器可通过获取北京市海淀区中的地图数据和定位数据，得到海淀区中包括的各个子区域对应的对象密度、兴趣点分布、OD流量和人口出入流量，并且，基于海淀区的定位数据和地图数据对幂律模型进行参数调整，以及对图神经网络模型进行训练，得到目标幂律模型和训练好的图神经网络模型，进而得到对象估计模型，权值，该对象估计模型具有时间和空间上的迁移能力。例如，在服务器得到对象估计络模型之后，服务器可在需要对北京市的全量人口进行估计时，使用该对象估计模型对海淀区的人口数量进行估计，也可以使用该对象估计模型对北京市的其他区县的人口进行估计(如对朝阳区的人口数量进行估计)，最终将北京市各个区县的人口估计数量进行求和，即可得到北京市的全量人口数据。

在本发明实施例中，服务器通过待估计区域的定位数据和地图数据，得到待估计区域包括的多个子区域中每个子区域对应的对象密度和功能属性，在进行对象估计时，根据每个子区域的功能属性和对象密度运行对应的估计算法，得到每个子区域包括的对象的估计数量，然后结合本实施例中构建的图神经网络模型在时间和空间两个维度上对该对象的估计数量进行进一步地调整，不仅减少了真值数据的使用量，还具备在不同城市、不同数据之前的迁移能力。

基于上述对象估计方法实施例的描述，本发明实施例还公开了一种对象估计装置，所述对象估计装置可以是运行于上述所提及的服务器中的一个计算机程序(包括程序代码)。该对象估计装置可以执行图2或图4所示的方法。请参见图6，所述对象估计装置可以包括：获取单元601，训练单元602，校正单元603和估计单元604。

获取单元601，用于获取待估计区域中各个子区域的对象密度，调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量；

获取单元601，还用于获取所述待估计区域中各个子区域的第一流量特征和第二流量特征，其中，任一子区域的第一流量特征用于描述相应子区域的对象从所述相应子区域转移到另一子区域的数量，任一子区域的第二流量特征用于描述进入相应子区域的对象的数量，以及离开相应子区域的对象的数量；

训练单元602，用于根据各个子区域的第一流量特征和第二流量特征，对图神经网络模型进行训练，以确定所述待估计区域的各个子区域包括对象的数量对应的邻近关系；

校正单元603，用于采用所述邻近关系对每个子区域包括的对象的估计数量进行校正处理；

估计单元604，用于根据每个子区域校正后的估计数量确定所述待估计区域包括的对象的目标估计数量。

在一种实施方式中，所述根据各个子区域的第一流量特征和第二流量特征，训练单元602在对图神经网络模型进行训练，以确定所述待估计区域的各个子区域包括对象的数量对应的邻近关系时，具体用于：

采用所述图神经网络模型根据各个子区域的第一流量特征和所述第二流量特征，构建所述待估计区域的对象特征图；

其中，所述对象特征图包括多个节点，每个节点用于指示所述待估计区域中的一个子区域，任意两个不同节点之间的连接关系用于指示相应子区域中包括的对象的数量对应的邻近关系。

在又一种实施方式中，所述待估计区域中的各个子区域中包括的对象的数量在不同时间对应的邻近关系不同；校正单元603在所述采用所述邻近关系对每个子区域包括的对象的估计数量进行校正处理时，可以具体用于：

根据任一子区域在不同时间包括的对象对应的估计数量，构建所述任一子区域中的对象在时间上对应的数量变化曲线；

根据所述待估计区域中各个子区域中对象在不同时间对应的数量的邻近关系，对所述任一子区域中的对象在时间上对应的数量变化曲线进行平滑处理；

根据所述平滑处理后的数量变化曲线，确定所述任一子区域的校正后的估计数量。

在一种实施方式中，获取单元601在所述获取待估计区域中各个子区域的对象密度时，具体用于：

获取所述待估计区域的地图数据和定位数据，所述地图数据用于指示所述待估计区域中包括的子区域，所述定位数据用于指示每个子区域中的对象数量；

根据所述地图数据和所述定位数据，确定所述待估计区域中的各个子区域的对象密度。

在又一种实施方式中，获取单元601在所述调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量时，还可具体用于：

确定任一子区域的对象密度的目标密度类型；

根据所述目标密度类型，确定所述目标幂律模型对所述目标密度类型的对象密度进行估计时采用的目标估计算法；

采用所述目标估计算法，并根据所述任一子区域的对象密度估计所述任一子区域中对象的估计数量。

在又一种实施方式中，所述目标密度类型包括第一密度类型或第二密度类型，所述目标估计算法包括第一估计算法或第二估计算法；所述根据所述目标密度类型，确定所述目标幂律模型对所述目标密度类型的对象密度进行估计时采用的目标估计算法时，获取单元601还可以具体用于：

若所述目标密度类型为所述第一密度类型，则所述目标幂律模型对所述第一密度类型的对象密度进行估计时采用的目标估计算法为所述第一估计算法；

若所述目标密度类型为所述第二密度类型，则所述目标幂律模型对所述第二密度类型的对象密度进行估计时采用的目标估计算法为所述第二估计算法。

在一种实施方式中，估计单元604在所述根据每个子区域校正后的估计数量确定所述待估计区域包括的对象的目标估计数量时，具体用于：

根据所述待估计区域包括的对象的总数对应的波动假设，对所述每个子区域校正后的估计数量进行缩放处理，得到每个子区域中包括对象对应的缩放数量；

将所述每个子区域中包括对象对应的缩放数量求和处理，得到所述待估计区域包括的对象的目标估计数量。

根据本发明的另一个实施例，图6所示的对象估计装置中的各个单元是基于逻辑功能划分的，上述各个单元可以分别或全部合并为一个或若干个另外的单元来构成，或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成，这可以实现同样的操作，而不影响本发明的实施例的技术效果的实现。在本发明的其它实施例中，基于对象估计装置也可以包括其它单元，在实际应用中，这些功能也可以由其它单元协助实现，并且可以由多个单元协作实现。

根据本发明的另一个实施例，可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2或图4所示的相应方法所涉及的各步骤的计算机程序(包括程序代码)，来构造如图6中所示的对象估计装置，以及来实现本发明实施例的服务处理方法。所述计算机程序可以记载于例如计算机存储介质上，并通过计算机存储介质装载于上述计算设备中，并在其中运行。

基于上述实施例提供的对象估计装置，在对待估计区域进行对象的数量估计的过程中，对象估计装置通过获取单元601获取待估计区域的定位数据和地图数据，得到待估计区域包括的多个子区域中每个子区域对应的对象密度和功能属性，在进行对象估计时，获取单元601根据每个子区域的功能属性和对象密度运行对应的估计算法，得到每个子区域包括的对象的估计数量，然后校正单元603结合本实施例中构建的图神经网络模型在时间和空间两个维度上对该对象的估计数量进行进一步地调整，不仅解决了由于待估计区域的兴趣点和对象数据缺乏而带来的参数估计难题，还提升了对象的估计数量的准确性和真实性。

基于上述方法实施例以及装置实施例的描述，本发明实施例还提供一种对象估计设备。请参见图7，该对象估计设备至少包括处理器701、输入接口702、输出接口703以及计算机存储介质704，且计算机设备内的处理器701、输入接口702、输出接口703以及计算机存储介质704可通过总线或其他方式连接。

所述计算机存储介质704是计算机设备中的记忆设备，用于存放程序和数据。可以理解的是，此处的计算机存储介质704既可以包括终端中的内置存储介质，当然也可以包括计算机设备所支持的扩展存储介质。计算机存储介质704提供存储空间，该存储空间存储了计算机设备的操作系统。并且，在该存储空间中还存放了适于被处理器701加载并执行的一条或多条的指令，这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是，此处的计算机存储介质可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器；可选的还可以是至少一个位于远离前述处理器的计算机存储介质。所述处理器701(或称CPU(Central Processing Unit，中央处理器))是计算机设备的计算核心以及控制核心，其适于实现一条或多条指令，具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能。

在一个实施例中，可由处理器701加载并执行计算机存储介质704中存放的一条或多条指令，以实现上述有关图2和图4所示的对象估计方法实施例中的相应方法步骤；具体实现中，计算机存储介质704中的一条或多条指令由处理器701加载并执行如下步骤：

在一种实施方式中，所述根据各个子区域的第一流量特征和第二流量特征，计算机存储介质704中的对图神经网络模型进行训练，以确定所述待估计区域的各个子区域包括对象的数量对应的邻近关系指令，由处理器701加载并具体执行如下步骤：

在又一种实施方式中，所述待估计区域中的各个子区域中包括的对象的数量在不同时间对应的邻近关系不同，计算机存储介质704中的所述采用所述邻近关系对每个子区域包括的对象的估计数量进行校正处理指令，由处理器701加载并具体执行如下步骤：

在一种实施方式中，计算机存储介质704中的所述获取待估计区域中各个子区域的对象密度指令，具体由处理器701加载并执行如下步骤：

在又一种实施方式中，计算机存储介质704中的在所述调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量指令，具体由处理器701加载并执行如下步骤：

确定任一子区域的对象密度的目标密度类型；

在又一种实施方式中，所述目标密度类型包括第一密度类型或第二密度类型，所述目标估计算法包括第一估计算法或第二估计算法；计算机存储介质中的所述根据所述目标密度类型，确定所述目标幂律模型对所述目标密度类型的对象密度进行估计时采用的目标估计算法指令，具体由处理器701加载并执行如下步骤：

在一种实施方式中，计算机存储介质704中的所述根据每个子区域校正后的估计数量确定所述待估计区域包括的对象的目标估计数量指令，具体由处理器701加载并执行如下步骤：

基于上述实施例提供的对象估计设备，在对待估计区域进行对象的数量估计的过程中，服务器通过处理器获取待估计区域的定位数据和地图数据，得到待估计区域包括的多个子区域中每个子区域对应的对象密度和功能属性，在进行对象估计时，然后处理器根据每个子区域的功能属性和对象密度运行对应的估计算法，得到每个子区域包括的对象的估计数量，然后结合本实施例中构建的图神经网络模型在时间和空间两个维度上对该对象的估计数量进行进一步地调整，不仅解决了由于待估计区域的兴趣点和对象数据缺乏而带来的参数估计难题，还提升了对象的估计数量的准确性和真实性。

本申请实施例还提供了一种计算机存储介质，该计算机存储介质中存储了上述对象估计方法的计算机程序，该计算机程序包括程序指令，当一个或多个处理器加载并执行该程序指令，可以实现实施例中对服务处理方法的描述，在此不再赘述。对采用相同方法的有益效果的描述，在此不再赘述。可以理解的是，程序指令可以被部署在一个或多个能够相互通信的设备上执行。

需要说明的是，根据本申请的一个方面，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。对象估计设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该对象估计设备执行上述图2和图4所示的对象估计方法实施例方面的各种可选方式中提供的方法。

并且，应理解的是，以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种对象估计方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据各个子区域的第一流量特征和第二流量特征，对图神经网络模型进行训练，以确定所述待估计区域的各个子区域包括对象的数量对应的邻近关系，包括：

3.根据权利要求1所述的方法，其特征在于，所述待估计区域中的各个子区域中包括的对象的数量在不同时间对应的邻近关系不同；所述采用所述邻近关系对每个子区域包括的对象的估计数量进行校正处理，包括：

4.根据权利要求1所述的方法，其特征在于，所述获取待估计区域中各个子区域的对象密度，包括：

5.根据权利要求4所述的方法，其特征在于，所述调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量，包括：

确定任一子区域的对象密度的目标密度类型；

6.根据权利要求5所述的方法，其特征在于，所述目标密度类型包括第一密度类型或第二密度类型，所述目标估计算法包括第一估计算法或第二估计算法；所述根据所述目标密度类型，确定所述目标幂律模型对所述目标密度类型的对象密度进行估计时采用的目标估计算法，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据每个子区域校正后的估计数量确定所述待估计区域包括的对象的目标估计数量，包括：

8.一种对象估计装置，其特征在于，所述装置包括：

获取单元，用于获取待估计区域中各个子区域的对象密度，调用目标幂律模型根据任一子区域的对象密度确定所述任一子区域中对象的估计数量；

获取单元，还用于获取所述待估计区域中各个子区域的第一流量特征和第二流量特征，其中，任一子区域的第一流量特征用于描述相应子区域的对象从所述相应子区域转移到另一子区域的数量，任一子区域的第二流量特征用于描述进入相应子区域的对象的数量，以及离开相应子区域的对象的数量；

9.一种对象估计设备，其特征在于，所述设备包括输入接口和输出接口，还包括：

处理器，适于实现一条或多条指令；

计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由所述处理器加载并执行如权利要求1-7任一项所述的对象估计方法。

10.一种计算机存储介质，所述计算机存储介质存储有一条或多条指令，所述一条或多条指令适于由处理器加载并执行如权利要求1-7任一项所述的对象估计方法。