CN114329238A

CN114329238A - 数据处理方法、装置、设备和存储介质

Info

Publication number: CN114329238A
Application number: CN202111298796.XA
Authority: CN
Inventors: 王建光; 阚长城; 项雯怡; 闫浩强; 江畅
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-11-04
Filing date: 2021-11-04
Publication date: 2022-04-12

Abstract

本公开提供了一种数据处理方法、装置、设备和存储介质，涉及计算机技术领域，具体涉及大数据、云计算、智慧城市、智能交通等技术领域。数据处理方法包括：获取目标对象使用智能终端产生的时空数据；若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量；基于所述数量，确定所述目标对象的时空分布信息。本公开可以提高数据处理效果。

Description

数据处理方法、装置、设备和存储介质

技术领域

本公开涉及计算机技术领域，具体涉及大数据、云计算、智慧城市、智能交通等技术领域，尤其涉及一种数据处理方法、装置、设备和存储介质。

背景技术

人的实时空间分布量(可简称实时人流量)是城市数字化管理关注的重点问题，在智慧政务、公安应急、景区管理等众多场景中，实时人流量是需要获取的首要指标。

相关技术中，可以采用摄像头或红外传感器等专用硬件设备获得实时人流量。

发明内容

本公开提供了一种数据处理方法、装置、设备和存储介质。

根据本公开的一方面，提供了一种数据处理方法，包括：获取目标对象使用智能终端产生的时空数据；若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量；基于所述数量，确定所述目标对象的时空分布信息。

根据本公开的另一方面，提供了一种数据处理装置，包括：获取模块，用于获取目标对象使用智能终端产生的时空数据；统计模块，用于若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量；确定模块，用于基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如上述任一方面的任一项所述的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据上述任一方面的任一项所述的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据上述任一方面的任一项所述的方法。

根据本公开的技术方案，可以提高数据处理效果。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开第一实施例的示意图；

图2是根据本公开第二实施例的示意图；

图3是根据本公开第三实施例的示意图；

图4是根据本公开第四实施例的示意图；

图5是根据本公开第五实施例的示意图；

图6是根据本公开第六实施例的示意图；

图7是根据本公开第七实施例的示意图；

图8是根据本公开第八实施例的示意图；

图9是根据本公开第九实施例的示意图；

图10是用来实现本公开实施例的数据处理方法中任一方法的电子设备的示意图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

相关技术中，可以采用摄像头或红外传感器等专用硬件设备获得实时人流。然而，这种方式需要部署摄像头或红外传感器等专用硬件设备，成本较高，并且适用场景也受限，因此，处理效果不理想。

图1是根据本公开第一实施例的示意图，本实施例提供一种数据处理方法，包括：

101、获取目标对象使用智能终端产生的时空数据。

102、若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量。

103、基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息。

本实施例的执行主体可以为数据处理装置，该装置的具体形式不限定，可以为硬件、软件，或者软硬结合。该装置可以位于电子设备内，电子设备可以为用户终端或者服务端，服务端可以为本地服务器或者云端，用户终端可以包括移动设备(如手机、平板电脑)、可穿戴式设备(如智能手表、智能手环)、车载设备(如车机)等。

本实施例中，通过基于目标对象使用智能终端产生的时空数据，确定目标对象的时空分布信息，可以不需要专用硬件设备，降低成本，提高适用性，从而提高数据处理效果。

其中，目标对象可以为人等需要获得时空分布信息的对象。

如未特别说明，本公开实施例中，以目标对象为人进行说明。

智能终端为人(或称为用户)使用的智能设备，比如为手机、可穿戴式设备等便携式设备，一般来讲，这种设备的定位信息可以作为人的定位信息。

时空数据可以包括：时间数据和/或空间数据，比如，某个人某个时刻的地理位置信息。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

比如，参见图2，以服务端执行数据处理方法为例，用户在使用智能终端(如手机)201时，智能终端可以将当前的时空数据发送给服务端202，从而服务端可以基于智能终端的时空数据进行处理。

具体地，用户在使用智能终端时，可以由智能终端的操作系统或者智能终端上安装的APP产生时空数据。

一些实施例中，该方法还可以包括：对所述时空数据进行完整性验证；其中，所述若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量，包括：若所述时空数据通过所述完整性验证，且所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量。

即，将通过完整性验证的时空数据进行后续处理，未通过完整性验证的时空数据可以丢弃。

具体地，时空数据可以至少包括如表1所示的信息：

表1

名称	含义
		用户ID	(尽量)唯一标识用户的字段，设备编码是常用的方案
定位时间	时空数据产生的时间，可以精确到秒
		位置坐标	描述具体的经纬度信息

其中，用户ID用于标识各个用户，定位时间为时空数据中的时间数据，位置坐标为时空数据中的空间数据。

具体地，完整性验证是指，对应每个时空数据，验证该时空数据是否包含表1所示的三种信息，若全部包含(一般是指包含对应字段以及对应字段内有值，且值合理)则通过完整性验证，若缺失上述三种信息中的至少一种，则未通过完整性验证。

通过对时空数据进行完整性验证，可以保证时空数据的有效性，进而提高时空分布信息的准确度。

一些实施例中，所述对所述时空数据进行完整性验证，包括：确定待处理所述时空数据的计算资源，所述计算资源采用如下至少一种方式确定：基于预先配置的智能终端与计算资源之间的对应关系，依次遍历各个计算资源，基于预设的推荐策略确定；采用所述计算资源，对所述时空数据进行完整性验证。

其中，计算资源可以称为接入算子，由接入算子对时空数据进行完整性验证。

如图3所示，智能终端与接入算子可以为多对多的关系，即一个智能终端可以由多个接入算子进行处理，或者，一个接入算子可以接入多个智能终端。

进一步地，接入算子可以采用分布式方式，比如，不同的接入算子位于不同的服务器等。

其中，接入算子与智能终端的关系可以采用如下方式确定：

第一，固定配置的方式。比如，预先配置智能终端-1对应接入算子-1，则由接入算子-1对智能终端-1进行处理。进一步地，还可以配置故障处理策略，以用于当某接入算子故障时，可以保障原先对应于该算子的智能终端能重新“寻路”至新的可用接入算子。

第二，依次遍历的方式。比如，对应某个智能终端，第一次由接入算子-1处理，第二次由接入算子-2处理，依此类推。进一步地，还可以配置故障处理策略，以用于当某接入算子故障时，能“跳过”该算子。

第三，基于推荐策略的方式。比如，由系统“推荐”1个接入算子作为与该智能终端对应的接入算子，推荐标准可以为接入算子当前负载最小，这种方式可以保证各接入算子之间的负载平衡。

通过确定处理时空数据的计算资源，可以合理的确定计算资源，以提高验证效率。

一些实施例中，所述时空数据包括所述目标对象所在位置点的空间数据，所述方法还包括：基于所述空间数据，确定所述位置点所在的空间单元；若所述位置点所在的空间单元全部位于所述目标区域内，确定所述目标对象位于所述目标区域；或者，若所述位置点所在的空间单元部分位于所述目标区域内，以所述位置点作为端点，生成预设方向的射线，若所述射线与所述目标区域的相交点的个数为奇数，确定所述目标对象位于所述目标区域。

其中，目标对象是否位于目标区域可以基于目标对象所在位置点是否位于目标区域内确定。比如，参见图4，示出了目标对象位于目标区域内的情况。

目标对象所在的位置点还可以称为定位点，定位点的空间数据还可以称为位置数据，可以用位置坐标表示。假设定位点的坐标为(x,y)，目标区域(简称为面)的边界坐标为{(x1,y1),(x2,y2),(x3,y3)…(xn,yn)}，判断定位点是否位于某个区域内，假设最基本的判定算法(称为PIP算法)为：以定位点为端点，向设定方向(比如，二维坐标系中x轴正方向)生成一条射线，计算该射线与目标区域对应的多边形的相交关系，如果交点数量为奇数个，则定位点位于目标区域内部，否则位于目标区域外部。该算法的复杂度为O(n)，当目标区域的边界非常复杂、坐标点非常多时，此算法的效率会严重下降。

通过构建空间索引，可以实现点面关系判定的效率提升。空间索引的本质是把空间全域划分成一个个单元(类似于网格)，并预先确定目标区域与各个空间单元之间的关系。如图5所示，单个空间单元与目标区域的关系只有3种可能(图5中分别用数字表示空间单元与目标区域的关系)，分别为：

1，空间单元完全位于目标区域内

2，空间单元部分位于目标区域内

3，空间单元完全位于目标区域外

一般来说，通过定位点坐标确定其所在的空间单元只需进行简单计算即可，复杂度为O(1)，比如，空间单元的大小为500*500，某个定位点的坐标(x,y)＝(5000,10000)，则该定位点位于x方向的第10个，且y方向的第20个空间单元内。

通过该空间单元可以高效判定该定位点与目标区域的关系，具体为：

如果空间单元完全位于目标区域内部，则该定位点一定位于目标区域内部，无需执行PIP算法；

如果空间单元部分位于目标区域内部，则需要使用PIP算法进一步判定定位点是否位于目标区域内部；

如果空间单元完全位于目标区域外部，则该定位点一定位于目标区域外部，无需执行PIP算法。

通过以上过程可见，只有在少数情况下，才涉及执行PIP算法，因此点面关系判定效率大幅提升。

一些实施例中，所述目标对象在所述目标区域内的数量为拟合数量，所述基于所述时空数据，统计所述目标对象在所述目标区域内的数量，包括：确定统计时长；基于所述时空数据，确定所述统计时长内的所述目标对象的定位数量；对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量。

以人为例，通过统计人的定位信息，可以获得实时人流量。假设每个人在每时每刻都产生定位信息，那么某时刻该区域内的实时人流量就等于该时刻发生定位的人数。但实际上定位信息是伴随用户使用智能终端产生的，并不是每个时刻都在产生，所以该时刻发生定位的人数只是当前实时人流量的一部分，因此需要设计算法拟合真实的人流量。

通过对定位数量进行拟合，可以获得目标对象在目标区域内的真实数量。

进一步地，所述确定统计时长，包括：若所述目标对象在所述目标区域内的出行活动规律，将预设时长确定为统计时长；若所述目标对象在所述目标区域内的出行活动不规律，基于所述目标区域内的所述目标对象的停留时长，确定所述统计时长。

其中，以目标对象为人为例，目标区域可以分为：居住区域、工作区域、一般区域，一般区域是指除了居住区域和工作区域之外的区域。

区域的属性可以基于地图数据获得，比如，地图数据中可以记录某一区域的属性，假设该属性为居住属性，则对应的区域为居住区域，类似的，若该属性为工作属性，则对应的区域为工作区域。

其中，居住区域和工作区域可以认为是出行活动规律的区域，一般区域为出行活动不规律的区域。

对应工作区域和居住区域，统计时长可以为预设的固定时长，比如为1小时。

对应一般区域，统计时长可以为非固定的，具体可以根据停留时长确定。

具体来讲，居住区域的真实人流表现为白天少(人在早上从该区域流出)，晚上多(人流回该区域)，深夜达到人流峰值，即区域的居住人口，并在凌晨时段维持这个数据；而定位人数也总体表现白天少，晚上多，深夜达到峰值，但由于人们在凌晨较少使用智能终端，所以凌晨时段定位人数会逐渐下降。

工作区域的真实人流表现为白天多(人在早上流入该区域)，晚上少(人从该区域流出)，凌晨时段人数最少；定位人数也表现出相同的规律。

因此，居住区域和工作区域的人的出行活动都比较规律。

一般区域的真实人流表现为活跃时段人数多，非活跃时段人数少，而且在活跃时段内同时有人流入和流出，定位人数也表现出类似的规律。

定义此类区域实时定位人数是一个难点。居住区域或工作区域的人仅在早上和晚上的少数时刻表现出流动性，因此在大部分时刻，选取1小时作为观察窗口，大部分人都会发生一次定位，从而作为有效样本；而此类区域在大部分时刻都会有人流入或流出，1小时作为观察窗口并不一定合适，例如菜市场，人均停留时间大约为20分钟，如果将统计1小时窗口内的人数作为实时人流数量，则会高于实际值；又例如大型主体游乐场，人均停留时间可能超过3小时，如果仅把1小时作为计数窗口，则可能低于实际值。可见，需要根据人均停留时长来计算实时定位人数，具体步骤如下：

针对在该区域内发生定位的每个人，确定其在该区域内第一次定位的时间T1和最后一次定位的时间Tn，Tn-T1即为该用户在该区域内的停留时长；

计算所有用户(比如，24小时内的所有用户)的停留时长的中位数mid(T)作为人群的平均停留时长S；

将上述的平均停留时长S作为统计时长，从而可以将最近S窗口内的定位人数最为当前时刻的实时定位人数。

通过基于不同的方式确定统计时长，可以获得不同场景下更准确的统计时长。

一些实施例中，所述目标对象为人，所述目标区域为居住区域，所述对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量，包括：

确定预定的夜晚时段(比如，20点到24点)的所述定位数量的夜晚高峰值以及第一时间，所述第一时间为所述夜晚高峰值对应的时间；

基于所述夜晚高峰值和所述居住区域的居住人口数量，确定缩放比例；

将所述缩放比例与所述定位数量的乘积，作为初始拟合数量；

确定预定的早间时段(比如4点到10点)的所述初始拟合数量的早间高峰值以及第二时间，所述第二时间为所述早间高峰值对应的时间；

将所述第一时间与预设早间时间点(比如5点)之间的拟合数量，确定为所述居住人口数量；

基于所述居住人口数量、所述早间高峰值，对所述初始拟合数量进行等比例下降处理，以获得所述预设早间时间点与所述第二时间之间的拟合数量；

将所述初始拟合数量，作为所述第二时间与所述第一时间之间的拟合数量。

具体地，针对居住区域，可以执行：

在各个采样点(采样点间隔预设周期，预设周期比如为1分钟等)，确定该采样点之前的统计时长(比如1小时)内的人的定位数量；

计算预定的夜晚时段(比如，20点到24点)内的各个采样点的定位数量，并确定其中的夜晚高峰值及其对应时间，该时间可以称为第一时间。假设夜晚高峰值和第一时间分别用Pn和Tn表示；

将居住人口数量(记为N)与夜晚高峰值Pn的比值确定为缩放比例，即f＝N/Pn，将各个采样点的定位数量乘以该缩放比例f作为对应采样点的初始拟合数量，即，此时，夜晚高峰值对应的初始拟合数量为N；

计算预定的早间时段(比如，4点到10点)内的各个采样点的初始拟合数量，并确定其中的早间高峰值及其对应时间，该时间可以称为第二时间。假设早间高峰值和第一时间分别用Pm和Tm表示；

将第一时间Tn与预设早间时间点(比如5点)之间的拟合数量，拟合到居住人口数量N；

将预设早间时间点(比如5点)与第二时间点Tm之间的拟合数量从居住人口数量N逐渐下降到早间高峰值Pm，其中，可以采用均速下降策略，即，预设早间时间点(比如5点)与第二时间点Tm之间的任一采样点Tx对应的拟合数量Px＝N-(Tx-T5)*(N-Pm)/(Tm-T5)，其中，T5表示早上5点对应的时刻；

对于其他采样点的拟合数量即为上述的各个采样点的初始拟合数量。

上述居住人口数量N可以基于长期(例如3个月)的位置数据得到，记录用户在3个月内每天18:00至次日8点时段发生定位的情况，将超过10天有上述定位记录的用户总数作为该区域的居住人口。

如图6所示，示出了某个居住区域在一天内实时定位人数的变化趋势和实时人流拟合值的变化趋势。其中，横向坐标轴为时间轴，纵向坐标轴为人的定位数量(实时定位人数)或者拟合数量(实时人流拟合值)。

通过上述处理，可以获得居住区域的拟合数量，将该拟合数量作为居住区域的实时人流量。

一些实施例中，所述目标对象为人，所述目标区域为工作区域，所述对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量，包括：

基于所述工作区域的预定工作时段(比如8点到17点)的所述定位数量的高峰值与工作人口数量，确定缩放比例；

将所述定位数量与所述缩放比例的乘积，作为所述拟合数量。

具体地，针对工作区域，可以执行：

计算预定的工作时段(比如，8点到17点)内的各个采样点的定位数量，并确定其中的工作高峰值及其对应时间，假设分别用Pd和Td表示；

将工作人口数量(记为E)与工作高峰值Pd的比值确定为缩放比例，即f＝E/Pd，将各个采样点的定位数量乘以该缩放比例f作为对应采样点的拟合数量，即，此时，工作高峰值对应的拟合数量为E；

即，各个采样点的拟合数量即为各个采样点的定位数量乘以f。其中，各个采样点包括：工作日的采样点和非工作日的采样点。

上述工作人口数量E可以基于长期(例如3个月)的位置数据得到，记录用户在3个月内每天8:00至17:00点时段发生定位的情况，将超过10天有上述定位记录的用户总数作为该区域的工作人口。

如图7所示，示出了某个工作区域在一天内实时定位人数的变化趋势和实时人流拟合值的变化趋势。其中，横向坐标轴为时间轴，纵向坐标轴为人的定位数量(实时定位人数)或者拟合数量(实时人流拟合值)。

通过上述处理，可以获得工作区域的拟合数量，将该拟合数量作为工作区域的实时人流量。

一些实施例中，所述目标对象为人，所述目标区域为一般区域，所述对所述定位数量进行拟合，以获得所述目标对象的拟合数量，包括：

获取所述一般区域的人流量真值及真值时刻；

基于所述人流量真值和所述真值时刻的定位数量，确定缩放比例；

具体地，以某个景区为例，可以从官方网站利用网络爬虫抓取景区的实时客流量，一般这种数据是小时或分钟粒度的(以下以小时粒度为例进行说明)，将实时客流量作为人流量真值。

比如，对于对于[h,h+1)内(如14:00-15:00)的任意时刻，缩放比例f＝h时刻的实时客流量/h时刻的实时定位人数；以及，[h,h+1)内的任一时刻x的拟合数量＝f*(x时刻的定位数量)。

在缺乏实时人流量真值的情况下，可以将f设定为一个经验常数。

通过上述处理，可以获得一般区域的拟合数量，将该拟合数量作为一般区域的实时人流量。

一些实施例中，所述基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息，包括：基于所述数量以及所述数量对应的时间信息，生成所述目标区域内的数量与所述时间信息的关系曲线；将所述目标区域内的所述关系曲线，作为所述时空分布信息。

其中，拟合数量是基于定位数量获得的，定位数量基于时空数据获得，因此，可以将定位数量对应的时空数据中的时间信息作为拟合数量对应的时间信息，进而可以生成拟合数量与时间信息之间的关系曲线，并且，对应不同的区域可以生成各自对应的关系曲线，将该关系曲线作为对应区域的时空分布信息。比如，图6或图7所示的关系曲线为对应的区域(居住区域或工作区域)的时空分布信息。

通过基于数量和时间信息可以生成对应区域的时空分布信息，从而可以提供更细节的目标对象的分布规律。

图8是根据本公开第八实施例的示意图，本实施例提供一种数据处理方法，该数据处理方法包括：

801、获取目标对象使用智能终端产生的时空数据。

802、判断所述时空数据是否完整，若是，执行803，否则丢弃所述时空数据。

803、判断所述时空数据是否属于目标区域，若是，执行804，否则丢弃所述时空数据。

804、确定统计时长。

805、基于所述时空数据，确定所述统计时长内的所述目标对象的定位数量。

806、对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量。

807、将所述拟合数量与所述拟合数量对应的时间信息的关系曲线作为所述目标区域内的时空分布信息，展示所述时空分布信息。

本实施例的各步骤的具体实现可以参见上述实施例中的相关描述。

本公开实施例中，通过基于目标对象使用智能终端产生的时空数据，确定目标对象的时空分布信息，可以不需要专用硬件设备，降低成本，提高适用性，从而提高数据处理效果。

图9是根据本公开第九实施例的示意图，本实施例提供一种数据处理装置。如图9所示，数据处理装置900包括：获取模块901、统计模块902和确定模块903。

获取模块901用于获取目标对象使用智能终端产生的时空数据；统计模块902用于若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量；确定模块903用于基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息。

一些实施例中，所述时空数据包括所述目标对象所在位置点的空间数据，所述装置900还包括：

定位模块，用于基于所述空间数据，确定所述位置点所在的空间单元；判定模块，用于若所述位置点所在的空间单元全部位于所述目标区域内，确定所述目标对象位于所述目标区域；或者，若所述位置点所在的空间单元部分位于所述目标区域内，以所述位置点作为端点，生成预设方向的射线，若所述射线与所述目标区域的相交点的个数为奇数，确定所述时空数据属于所述目标区域。

一些实施例中，所述装置900还包括：验证模块，用于对所述时空数据进行完整性验证；所述统计模块902具体用于：若所述时空数据通过所述完整性验证，且所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量。

一些实施例中，所述验证模块具体用于：确定待处理所述时空数据的计算资源，所述计算资源采用如下至少一种方式确定：基于预先配置的智能终端与计算资源之间的对应关系，依次遍历各个计算资源，基于预设的推荐策略确定；采用所述计算资源，对所述时空数据进行完整性验证。

一些实施例中，所述目标对象在所述目标区域内的数量为拟合数量，所述统计模块902具体用于：确定统计时长；基于所述时空数据，确定所述统计时长内的所述目标对象的定位数量；对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量。

一些实施例中，所述统计模块902进一步具体用于：若所述目标对象在所述目标区域内的出行活动规律，将预设时长确定为统计时长；若所述目标对象在所述目标区域内的出行活动不规律，基于所述目标区域内的所述目标对象的停留时长，确定所述统计时长。

一些实施例中，所述目标对象为人，所述目标区域为居住区域，所述统计模块902进一步具体用于：确定预定的夜晚时段的所述定位数量的夜晚高峰值以及第一时间，所述第一时间为所述夜晚高峰值对应的时间；基于所述夜晚高峰值和所述居住区域的居住人口数量，确定缩放比例；将所述缩放比例与所述定位数量的乘积，作为初始拟合数量；确定预定的早间时段的所述初始拟合数量的早间高峰值以及第二时间，所述第二时间为所述早间高峰值对应的时间；将所述第一时间与预设早间时间点之间的拟合数量，确定为所述居住人口数量；基于所述居住人口数量、所述早间高峰值，对所述初始拟合数量进行等比例下降处理，以获得所述预设早间时间点与所述第二时间之间的拟合数量；将所述初始拟合数量，作为所述第二时间与所述第一时间之间的拟合数量。

一些实施例中，所述目标对象为人，所述目标区域为工作区域，所述统计模块902进一步具体用于：基于所述工作区域的预定工作时段的所述定位数量的高峰值与工作人口数量，确定缩放比例；将所述定位数量与所述缩放比例的乘积，作为所述拟合数量。

一些实施例中，所述目标对象为人，所述目标区域为一般区域，所述一般区域为居住区域和工作区域之外的区域，所述统计模块902进一步具体用于：获取所述一般区域的人流量真值及真值时刻；基于所述人流量真值和所述真值时刻的定位数量，确定缩放比例；将所述定位数量与所述缩放比例的乘积，作为所述拟合数量。

一些实施例中，所述确定模块903具体用于：基于所述数量以及所述数量对应的时间信息，生成所述目标区域内的数量与所述时间信息的关系曲线；将所述目标区域内的所述关系曲线，作为所述时空分布信息。

可以理解的是，本公开实施例中，不同实施例中的相同或相似内容可以相互参考。

可以理解的是，本公开实施例中的“第一”、“第二”等只是用于区分，不表示重要程度高低、时序先后等。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图10所示，电子设备1000包括计算单元1001，其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序，来执行各种适当的动作和处理。在RAM 1003中，还可存储电子设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

电子设备1000中的多个部件连接至I/O接口1005，包括：输入单元1006，例如键盘、鼠标等；输出单元1007，例如各种类型的显示器、扬声器等；存储单元1008，例如磁盘、光盘等；以及通信单元1009，例如网卡、调制解调器、无线通信收发机等。通信单元1009允许电子设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理，例如数据处理方法。例如，在一些实施例中，数据处理方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由ROM1002和/或通信单元1009而被载入和/或安装到电子设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时，可以执行上文描述的数据处理方法的一个或多个步骤。备选地，在其他实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行数据处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种数据处理方法，包括：

获取目标对象使用智能终端产生的时空数据；

若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量；

基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息。

2.根据权利要求1所述的方法，其中，所述时空数据包括所述目标对象所在位置点的空间数据，所述方法还包括：

基于所述空间数据，确定所述位置点所在的空间单元；

若所述位置点所在的空间单元全部位于所述目标区域内，确定所述目标对象位于所述目标区域；或者，

若所述位置点所在的空间单元部分位于所述目标区域内，以所述位置点作为端点，生成预设方向的射线，若所述射线与所述目标区域的相交点的个数为奇数，确定所述目标对象位于所述目标区域。

3.根据权利要求1所述的方法，还包括：

对所述时空数据进行完整性验证；

其中，所述若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量，包括：

若所述时空数据通过所述完整性验证，且所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量。

4.根据权利要求3所述的方法，其中，所述对所述时空数据进行完整性验证，包括：

确定待处理所述时空数据的计算资源，所述计算资源采用如下至少一种方式确定：基于预先配置的智能终端与计算资源之间的对应关系，依次遍历各个计算资源，基于预设的推荐策略确定；

采用所述计算资源，对所述时空数据进行完整性验证。

5.根据权利要求1-4任一项所述的方法，其中，所述目标对象在所述目标区域内的数量为拟合数量，所述基于所述时空数据，统计所述目标对象在所述目标区域内的数量，包括：

确定统计时长；

基于所述时空数据，确定所述统计时长内的所述目标对象的定位数量；

对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量。

6.根据权利要求5所述的方法，其中，所述确定统计时长，包括：

若所述目标对象在所述目标区域内的出行活动规律，将预设时长确定为统计时长；

若所述目标对象在所述目标区域内的出行活动不规律，基于所述目标区域内的所述目标对象的停留时长，确定所述统计时长。

7.根据权利要求5所述的方法，其中，所述目标对象为人，所述目标区域为居住区域，所述对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量，包括：

确定预定的夜晚时段的所述定位数量的夜晚高峰值以及第一时间，所述第一时间为所述夜晚高峰值对应的时间；

确定预定的早间时段的所述初始拟合数量的早间高峰值以及第二时间，所述第二时间为所述早间高峰值对应的时间；

将所述第一时间与预设早间时间点之间的拟合数量，确定为所述居住人口数量；

8.根据权利要求5所述的方法，其中，所述目标对象为人，所述目标区域为工作区域，所述对所述定位数量进行拟合，以获得所述目标对象的所述拟合数量，包括：

基于所述工作区域的预定工作时段的所述定位数量的高峰值与工作人口数量，确定缩放比例；

9.根据权利要求5所述的方法，其中，所述目标对象为人，所述目标区域为一般区域，所述一般区域为居住区域和工作区域之外的区域，所述对所述定位数量进行拟合，以获得所述目标对象的拟合数量，包括：

获取所述一般区域的人流量真值及真值时刻；

10.根据权利要求1-4、6-9任一项所述的方法，其中，所述基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息，包括：

基于所述数量以及所述数量对应的时间信息，生成所述目标区域内的数量与所述时间信息的关系曲线；

将所述目标区域内的所述关系曲线，作为所述时空分布信息。

11.一种数据处理装置，包括：

获取模块，用于获取目标对象使用智能终端产生的时空数据；

统计模块，用于若所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量；

确定模块，用于基于所述数量，确定所述目标对象在所述目标区域内的时空分布信息。

12.根据权利要求11所述的装置，其中，所述时空数据包括所述目标对象所在位置点的空间数据，所述装置还包括：

定位模块，用于基于所述空间数据，确定所述位置点所在的空间单元；

判定模块，用于若所述位置点所在的空间单元全部位于所述目标区域内，确定所述目标对象位于所述目标区域；或者，若所述位置点所在的空间单元部分位于所述目标区域内，以所述位置点作为端点，生成预设方向的射线，若所述射线与所述目标区域的相交点的个数为奇数，确定所述目标对象位于所述目标区域。

13.根据权利要求11所述的装置，还包括：

验证模块，用于对所述时空数据进行完整性验证；

所述统计模块具体用于：若所述时空数据通过所述完整性验证，且所述目标对象位于目标区域，基于所述时空数据，统计所述目标对象在所述目标区域内的数量。

14.根据权利要求13所述的装置，其中，所述验证模块具体用于：

采用所述计算资源，对所述时空数据进行完整性验证。

15.根据权利要求11-14任一项所述的装置，其中，所述目标对象在所述目标区域内的数量为拟合数量，所述统计模块具体用于：

确定统计时长；

16.根据权利要求15所述的装置，其中，所述统计模块进一步具体用于：

17.根据权利要求15所述的装置，其中，所述目标对象为人，所述目标区域为居住区域，所述统计模块进一步具体用于：

18.根据权利要求15所述的装置，其中，所述目标对象为人，所述目标区域为工作区域，所述统计模块进一步具体用于：

19.根据权利要求15所述的装置，其中，所述目标对象为人，所述目标区域为一般区域，所述一般区域为居住区域和工作区域之外的区域，所述统计模块进一步具体用于：

获取所述一般区域的人流量真值及真值时刻；

20.根据权利要求11-14、6-9任一项所述的装置，其中，所述确定模块具体用于：

21.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的方法。