CN110134754B

CN110134754B - 区域兴趣点的作业时长预测方法、装置、服务器和介质

Info

Publication number: CN110134754B
Application number: CN201910434130.9A
Authority: CN
Inventors: 吴箫; 赵光辉; 吴云鹏
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-05-23
Filing date: 2019-05-23
Publication date: 2021-07-23
Anticipated expiration: 2039-05-23
Also published as: CN110134754A

Abstract

本发明实施例公开了一种区域兴趣点的作业时长预测方法、装置、服务器和介质。该方法包括：根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；其中，所述映射关系是根据样本区域的历史POI采集记录生成的；根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长。本发明实施例的方案以提高区域POI作业时长的预测效率及准确率，且可适用于历史未触达区域的POI作业时长的预测，可实现对任意区域POI作业的收益与成本进行有效的衡量。

Description

区域兴趣点的作业时长预测方法、装置、服务器和介质

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种区域兴趣点的作业时长预测方法、装置、服务器和介质。

背景技术

随着互联网地图的应用越来越广泛，兴趣点(point of interest，POI)数据的及时更新变得越来越重要。在实际对区域POI进行作业维护的过程中，需要预估区域POI的作业时长，从而更好的衡量区域POI作业的收益与成本之间的关系。

目前，现有技术通常是基于人工经验或区域的历史POI作业时长，来对该区域POI的作业时长进行预测。但是基于人工经验预测区域POI作业时长的方式，过于依赖人工对区域的熟悉程度，成本高且准确率和预估效率受人为因素影响较大；而基于区域的历史POI作业时长预估区域的当前POI作业时长的方式，又存在因区域POI数据的更新，影响预测结果准确性的问题，且无法实现对历史未触达区域POI作业时长的预估，亟需改进。

发明内容

本发明实施例提供了一种区域兴趣点的作业时长预测方法、装置、服务器和介质，以提高区域POI作业时长的预测效率及准确率，且可适用于历史未触达区域的POI作业时长的预测，可实现对任意区域POI作业的收益与成本进行有效的衡量。

第一方面，本发明实施例提供了一种区域兴趣点的作业时长预测方法，该方法包括：

根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；

根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长。

第二方面，本发明实施例还提供了一种区域兴趣点的作业时长预测装置，该装置包括：

数量确定模块，用于根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；

作业时长确定模块，用于根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长。

第三方面，本发明实施例还提供了一种服务器，该服务器包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明任意实施例所述的区域兴趣点的作业时长预测方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所述的区域兴趣点的作业时长预测方法。

本发明实施例的技术方案，通过根据目标区域中POI的行业类型，以及预先根据样本区域的历史POI采集记录生成的候选行业类型与候选采集难度之间的映射关系，确定目标区域中具有候选采集难度的POI数量，进而根据具有候选采集难度的POI数量确定目标区域的POI作业时长。本发明实施例的技术方案，通过预先根据样本区域的历史POI采集记录生成的候选行业类型与候选采集难度之间的映射关系，结合目标区域的POI的行业类型及各类型对应的采集难度来预测目标区域的POI作业时长，以提高区域POI作业时长的预测效率及准确率，且可适用于历史未触达区域的POI作业时长的预测，可实现对任意区域POI作业的收益与成本进行有效的衡量。

附图说明

图1是本发明实施例一提供的一种区域兴趣点的作业时长预测方法的流程图；

图2A是本发明实施例二提供的一种区域兴趣点的作业时长预测方法的流程图；

图2B是本发明实施例二提供的一种基于候选行业类型与候选采集难度的映射关系预测POI作业时长的示意图；

图3是本发明实施例三提供的一种区域兴趣点的作业时长预测方法的流程图；

图4是本发明实施例四提供的一种区域兴趣点的作业时长预测装置的结构框图；

图5是本发明实施例五提供的一种服务器的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一提供的一种区域兴趣点的作业时长预测方法的流程图，本实施例可适用于对任意区域的兴趣点作业时长进行预测的情况。该方法可以由本发明实施例提供的区域兴趣点的作业时长预测装置或服务器来执行，该装置可以采用软件和/或硬件的方式实现，该方法具体包括如下步骤：

S101，根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定目标区域中具有候选采集难度的POI数量。

其中，目标区域可以是指需要进行POI作业的区域，可选的，该目标区域可以是需要进行POI作业的整个城市区域；若需要进行POI作业的城市区域范围较大时，该目标区域也可以是对城市区域按照预设规则划分后的每一个子区域。其中，预设规则可以是依据路网数据，按照预设面积(如一平方公里)，将城市区域划分为至少一个子区域。兴趣点POI的行业类型可以是对各POI按照其所属行业进行分类后得到的行业类型，如可以包括但不限于：生活服务类(如医院、超市、加油站、火车站等)、政府机构类(如民政局、教育局、财政局等)、休闲娱乐类(如购物广场、植物园、展览馆、游乐场、KTV等)等。候选采集难度可以是预先针对采集POI的难易程度，设置的难易等级，如可以包括：高采集难度、中等采集难度和低采集难度这三类。

其中，候选行业类型与候选采集难度之间的映射关系是根据样本区域的历史POI采集记录生成的。如可以是根据历史采集不同候选行业类型的POI所需花费的时长来设置该候选行业类型关联的采集难度，如针对一个候选行业类型的POI，采集其需要花费的时间越长，则表明该候选行业类型关联的候选采集难度越大；还可以是根据历史采集不同行业的POI时，对应的影响因素的多少来设置该候选行业类型关联的采集难度，如针对一个候选行业类型的POI，影响其采集的因素越多，则表明该候选行业类型关联的候选采集难度越大；还可以采用其他方式生成，对此本发明实施例不进行限定。具体的，如何根据样本区域的历史POI采集记录生成候选行业类型与候选采集难度之间的映射关系的过程将在后续实施例进行详细介绍。

可选的，在本发明实施例中，可以先采集目标区域的所有POI，确定出各POI对应的行业类型，然后根据候选行业类型与候选采集难度之间的映射关系，确定出各POI的行业类型对应的候选采集难度，对目标区域中属于各候选采集难度的POI进行统计，得到目标区域中各候选采集难度的POI数量值。

S102，根据目标区域中具有候选采集难度的POI数量，确定目标区域的POI作业时长。

其中，目标区域的POI作业时长可以是针对目标区域，采集该区域的POI数据所需要的时长。

可选的，针对每一个POI来说，其对应的候选采集难度不同，采集该POI所需耗费的时长就不同，POI对应的候选采集难度越大，采集该POI所需要耗费的时间就越长。所以本发明实施例中，可以根据目标区域中具有候选采集难度的POI数量，确定目标区域的POI作业时长的过程中，可以是预先为不同的候选采集难度设置该候选采集难度对应的难度值(如该难度值可以是采集该候选采集难度的POI所需的时长)，然后根据各候选采集难度对应的难度值，以及各候选采集难度对应的POI数量，就可以确定出采集目标区域的POI作业时长。例如，若候选采集难度分为三类：高采集难度、中等采集难度和低采集难度，各采集难度对应采集一个POI所需的时长分别为：20分钟、10分钟和5分钟。目标区域中各采集难度对应的POI数量分别为10个、15个和20个，则采集该目标区域的POI所需的总时长可以为450分钟。

可选的，由于影响POI作业时长的因素除了各POI采集难度之外，还存在很多其他因素。因此，为了提高本发明实施例确定目标区域的POI作业时长的准确性，本发明实施例在根据目标区域中具有候选采集难度的POI数量，确定目标区域的POI作业时长时，还可以包括：根据目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项，以及目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长。

其中，目标区域的POI总数量越多，对应的采集目标区域POI所需的时长就越长；目标区域中道路数量、道路里程或面积越大，采集POI时所需走的路程就越多，相应的，采集POI所需的时长就越长；目标区域中建筑数量越多，分析这些建筑是否为POI所需要的时长就越长。因此上述目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的任意一项影响因素，都会影响到该目标区域的POI作业时长，所以本发明实施例可以是根据各影响因素(目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项)的具体数值，按照预设规则，设置需要额外增加的影响作业时长，然后再根据目标区域中具有候选采集难度的POI数量，确定出的POI作业时长的基础上，累加上述影响作业时长，即可得到目标区域的POI总作业时长。

可选的，在根据目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项，以及目标区域中具有候选采集难度的POI数量，确定目标区域的POI作业时长时，还可以是采用预先训练好的POI作业时长预测模型来预测目标区域的POI作业时长。具体的，可以是将各影响因素(目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项)的具体数值，以及目标区域中具有的各候选采集难度的POI数量作为输入参数，输入到预先训练好的POI作业时长预测模型中，该预测模型就会基于训练时的算法和训练样本，对输入的参数进行分析，输出目标区域的POI作业时长。

其中，可将历史采集POI的区域作为样本区域，然后在历史每一次从样本区域采集POI的过程中，收集训练样本，采用训练样本对预设初始模型进行训练，最终得到用于确定目标区域的POI作业时长的预测模型。示例性的，训练样本中包含：样本区域中具有候选采集难度的POI数量(除此之外，还可以包括样本区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项)以及该样本区域对应的POI作业时长。具体的，如何训练本发明实施例所需的POI作业时长预测模型的具体方法，将在后续实施例进行详细介绍。

本发明实施例的区域兴趣点的作业时长预测方法，通过根据目标区域中POI的行业类型，以及预先根据样本区域的历史POI采集记录生成的候选行业类型与候选采集难度之间的映射关系，确定目标区域中具有候选采集难度的POI数量，进而根据具有候选采集难度的POI数量确定目标区域的POI作业时长。本发明实施例的技术方案，通过预先根据样本区域的历史POI采集记录生成的候选行业类型与候选采集难度之间的映射关系，结合目标区域的POI的行业类型及各类型对应的采集难度来预测目标区域的POI作业时长，以提高区域POI作业时长的预测效率及准确率，且可适用于历史未触达区域的POI作业时长的预测，可实现对任意区域POI作业的收益与成本进行有效的衡量。

实施例二

图2A是本发明实施例二提供的一种区域兴趣点的作业时长预测方法的流程图，图2B本发明实施例二提供的一种基于候选行业类型与候选采集难度的映射关系预处POI作业时长的示意图。本实施例在上述实施例的基础上，进行了进一步的优化，具体给出了如何根据样本区域的历史POI采集记录生成候选行业类型与候选采集难度之间的映射关系的具体情况介绍，该方法具体包括：

S201，将第一历史时间段在样本区域内采集的历史POI作为候选POI，以及将历史POI所属行业类型作为候选行业类型。

其中，第一历史时间段可以是预先设置的与当前时间段较为接近的一个时间段(如最近一周)，该第一历史时间段的选择需尽可能的保证获取到样本区域中最新且最全面的POI数据。可选的，该第一历史时间段可以根据样本区域POI数据更新周期而设置，例如，若样本区域的POI数据每隔一周重新采集更新一次，则该第一历史时间段可以设置为最近一周。本发明实施例的样本区域可以是预先选择的用于确定候选行业类型与候选采集难度之间的映射关系时所需的区域，该样本区域可以是结合历史采集POI的各区域的特点，从中选择出的至少一个区域。

可选的，可以是从历史采集POI数据的区域中，确定出至少一个样本区域，然后针对每一个样本区域，可以从该样本区域历史采集POI的所有数据(即该样本区域的所有POI数据)中，获取第一历史时间段内采集到的历史POI，将其作为候选POI，然后将第一历史时间段内采集到的各历史POI所属的行业类型作为候选行业类型。示例性的，如图2B所示，可以获取近一周内样本区域采集的候选POI，并按照各候选POI所属的候选行业类型对采集的候选POI进行分类，确定出各候选行业类型下对应的候选POI。

需要说明的是，本发明实施例中，第一历史时间段在样本区域内采集的历史POI，可以为样本区域当前真实存在的，且最为准确的POI数据。其可以是通过众包等采集方式获取的。

S202，根据第二历史时间段在样本区域内，候选行业类型下采回的候选POI数量和未采回的候选POI数量，确定候选行业类型关联的候选采集难度。

其中，第二历史时间段可以是为确定候选行业类型的关联候选采集难度而设置的一个时间段(如近一年)。第一历史时间段小于第二历史时间段，第二历史时间段内可以包含至少一次样本区域的POI数据的作业(如采集更新)过程。

可选的，第一历史时间段在样本区域内采集的候选POI是该样本区域内最为准确的POI数据，由于第二历史时间段大于第一历史时间段，第二历史时间段内的POI数据可能发生了变化，所以第二历史时间段内采集的POI数据与第一历史时间段内采集的POI数据不一定相同。此时如图2B所示，可以根据第一历史时间段(如近一周)内对应的候选POI，确定第二历史时间段(如近一年)内上述候选POI哪些被采回了，哪些未被采回，进而结合各候选POI的候选行业类型，确定出每一种候选行业类型下被采回的候选POI数量p和未被采回的候选POI数量q。

可选的，由于第二历史时间段包含了至少一次样本区域的POI数据的作业过程，所以本发明实施例可以针对第二历史时间段内的每一次样本区域的POI作业过程，都确定一次各候选行业类型下采回的候选POI数量p'和未采回的候选POI数量q'，然后将多次确定出的各候选行业类型下采回的候选POI数量p'和未采回的候选POI数量q'的均值，作为最终的各候选行业类型下采回的候选POI数量p和未采回的候选POI数量q。例如，若第一历史时间段在样本区域内，候选POI的候选行业类型中生活服务类对应的候选POI为50个。第二历史时间段内该样本区域执行了三次POI作业过程。针对第一次作业过程，生活服务类的候选POI采集回了30个，未采集回20个；针对第二次作业过程，生活服务类的候选POI采集回了35个，未采集回15个；针对第三次作业过程，生活服务类的候选POI采集回了40个，未采集回10个。则对三次作业过程的数据求均值，可以得到最终的生活服务类的候选POI采集回35个，未采集回15个。

可选的，如图2B所示，本发明实施例在确定出样本区域中各候选行业类型下采回的候选POI数量p和未采回的候选POI数量q后，可计算各候选行业类型对应的候选采集难度，具体计算过程可以包括：

确定第二历史时间段在所述样本区域内，候选行业类型下采回的候选POI数量和未采回的候选POI数量之间的比例值；若所述候选行业类型下的比例值小于第一比例阈值，则确定所述候选行业类型关联的候选采集难度是第一难度；若所述候选行业类型下的比例值大于或等于所述第一比例阈值，且小于或等于第二比例阈值，则确定所述候选行业类型关联的候选采集难度是第二难度；若所述候选行业类型下的比例值大于所述第二比例阈值，则确定所述候选行业类型关联的候选采集难度是第三难度；其中，所述第一比例阈值小于所述第二比例阈值，所述第一难度小于所述第二难度，且所述第二难度小于所述第三难度。

具体的，可以针对每一个候选行业类型，若该候选行业类型下采回的候选POI数量为p，未采回的候选POI数量为q，确定两者之间的比例值r＝p/q。然后判断比例值r与第一比例阈值a和第二比例阈值b之间的大小关系，其中，a<b。具体的，r与a、b之间的大小关系包括以下三种：

1)若r<a，则确定该候选行业类型的难度为第一难度，如难度为低采集难度；

2)若a≤r≤b，则确定该候选行业类型的难度为第二难度，如难度为中等采集难度；

3)若r<b，则确定该候选行业类型的难度为第三难度，如难度为高采集难度。

其中，第一难度小于第二难度，第二难度小于第三难度。

可选的，如图2B所示，在根据上述方式确定了候选行业类型关联的候选采集难度后，即可建立各候选行业类型与候选采集难度之间的映射关系，例如，若针对生活服务类型计算的比例值r小于第二比例阈值b，属于第三难度，则将生活服务类型与第三难度建立映射关系。

S203，根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定目标区域中具有候选采集难度的POI数量。

示例性的，如图2B所示，若要确定某一个城市区域的POI作业时长时，可以是先对该城市区域按照预设规则划分为多个目标区域，针对每一个目标区域，根据目标区域中各POI所属的行业类型，统计不同候选行业类型下对应的POI数量，进而根据S202中构建的候选行业类型与候选采集难度的映射关系，确定目标区域中第一难度对应的POI数量为X个，第二难度对应的POI数量为Y个，第三难度对应的POI数量为Z个。

S204，根据目标区域中具有候选采集难度的POI数量，确定目标区域的POI作业时长。

示例性的，如图2B所示，根据目标区域中每一个候选采集难度对应的POI数量，按照预设规则或基于预先训练好的POI作业时长预测模型，确定出该目标区域的POI作业时长。将区域划分后的每一个子目标区域的POI作业时长都确定后，将其进行累加即可得到该城市区域的POI总作业时长。

本发明实施例的区域兴趣点的作业时长预测方法，通过第一历史时间段内针对样本区域采集到的候选POI及其对应的候选行业类型，确定第二历史时间段内在该样本区域内，各候选行业类型下采回的候选POI数量和未采回的候选POI数量，进而确定出候选行业类型关联的候选采集难度，构建候选行业类型与候选采集难度之间的映射关系；在预测目标区域的POI作业时长时，根据目标区域中POI的作业类型以及预先构建的映射关系，确定目标区域中各候选采集难度的POI数量，进而确定出目标区域POI作业时长。本发明实施例通过针对样本区域，分析不同历史时间段的历史POI数据的相关信息，构建适用于任何区域的候选行业类型与候选采集难度之间的映射关系，保证了映射关系构建的准确性，进而保证了根据该映射关系预测出的POI作业时长的准确性和实效性，且本发明实施例的方案可适用于对任何目标区域(包括历史未触及区域)POI作业的收益与成本进行有效的衡量。

实施例三

图3是本发明实施例三提供的一种区域兴趣点的作业时长预测方法的流程图。本实施例在上述各实施例的基础上，进行了进一步的优化，具体给出了如何构建POI作业时长预测模型，以及根据该POI时长预测模型确定所述目标区域的POI作业时长的具体情况介绍，该方法具体包括：

S301，根据样本区域的历史POI采集记录，确定样本区域中具有候选采集难度的POI数量以及样本区域的POI作业时长。

其中，历史POI采集记录可以是针对某一历史采集过POI数据的区域，历史采集该区域内POI数据时所记录的数据，如可以包括但不限于：该区域中采集到的POI的相关信息(如POI的总数量、所属行业类型以及采集POI所花费的时长等)，区域的面积以及区域内道路数量、道路里程和建筑物数量等。本发明实施例中的历史POI采集记录可以是通过众包等方式采集区域POI数据得到的采集记录。可选的，本发明实施例中的样本区域可以是从历史采集POI的区域中选择的样本区域，为了保证最终构建的POI作业时长预测模型的准确性，本发明实施例需要获取大量样本区域的历史POI采集记录来构建POI作业时长预测模型。

可选的，本发明实施例中，可以根据各样本区域中的历史采集记录中的POI的相关信息，确定各样本区域对应的候选采集难度的POI数量以及该样本区域的POI作业时长。如可以根据POI相关信息中各POI所属行业，结合候选行业类型和候选采集难度之间的映射关系，确定出各POI对应的候选采集难度，进而确定该样本区域中各候选采集难度对应的POI数量；将POI相关信息中记录的采集该目标区域POI所花费的时长，作为样本区域的POI作业时长。

S302，根据样本区域中具有候选采集难度的POI数量以及样本区域的POI作业时长，构建POI作业时长预测模型。

可选的，本发明实施例可以将S301中确定的每一个样本区域中各候选采集难度的POI数量以及该样本区域的POI作业时长作为一个训练样本，将大量的训练样本输入预设初始模型中，采用预设算法对预设初始模型进行训练，最终得到用于确定目标区域的POI作业时长的预测模型。其中，该预测模型可以是机器学习模型，所采用的预设算法可以包括循环神经网络(Recurrent neuralnetworks,RNN)、长短期记忆(Long Short-Term Memory,LSTM)网络、门限循环单元、简单循环单元、自动编码器、决策树、随机森林、特征均值分类、分类回归树、隐马尔科夫、K最近邻(k-NearestNeighbor，KNN)算法、逻辑回归模型、贝叶斯模型、高斯模型以及KL散度(Kullback–Leibler divergence)等等。

可选的，为了提高构建的POI作业时长预测模型的准确性，本发明实施例中还可以根据样本区域的历史POI采集记录，获取样本区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项，与样本区域中各候选采集难度的POI数量以及该样本区域的POI作业时长一并作为训练样本，来按照上述方法训练POI作业时长预测模型。这样设置的好处在于，能够更为全面的考虑多维度的影响因素来训练POI作业时长预测模型，保证该POI作业时长预测模型在实际预测目标区域的POI作业时长时能够得到更为准确的预测结果。

S303，根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定目标区域中具有候选采集难度的POI数量。

S304，根据目标区域中具有候选采集难度的POI数量和构建的POI作业时长预测模型，确定目标区域的POI作业时长。

示例性的，本发明实施例在基于S301-S302构建的POI作业时长预测模型确定目标区域的POI作业时长时，可以是将目标区域中具有候选采集难度的POI数量输入该POI作业时长预测模型，还可以是将目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项，以及目标区域中具有候选采集难度的POI数量一并输入该POI作业时长预测模型，该POI作业时长预测模型就会基于训练时的算法和样本数据，对输入的数据进行分析，输出目标区域的POI作业时长。需要说明的是，实际确定目标区域POI作业时长时输入POI作业时长预测模型的输入参数的种类取决于训练该预测模型时训练样本中数据的种类。

本发明实施例的一种区域兴趣点的作业时长预测方法，根据大量的样本区域的历史POI采集记录，确定至少包括样本区域中各候选采集难度的POI数量以及样本区域的POI作业时长的训练样本，基于该训练样本训练得到POI作业时长预测模型，在实际预测目标区域的POI作业时长时，根据目标区域中POI的行业类型以及预先构建的候选行业类型与候选采集难度之间的映射关系，确定目标区域中各候选采集难度的POI数量，然后基于训练好的POI作业时长预测模型，预测目标区域的POI作业时长。能够基于POI作业时长预测模型高效且准确的预测任何区域(包括历史未触达区域)的POI作业时长，可实现对任意区域POI作业的收益与成本进行有效的衡量。

实施例四

图4是本发明实施例四提供的一种区域兴趣点的作业时长预测装置的结构框图，该装置可执行本发明上述任意实施例所提供的区域兴趣点的作业时长预测方法，具体执行方法相应的功能模块和有益效果。如图4所示，该装置包括：

数量确定模块401，用于根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；

作业时长确定模块402，用于根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长。

本发明实施例的区域兴趣点的作业时长预测装置，通过根据目标区域中POI的行业类型，以及预先根据样本区域的历史POI采集记录生成的候选行业类型与候选采集难度之间的映射关系，确定目标区域中具有候选采集难度的POI数量，进而根据具有候选采集难度的POI数量确定目标区域的POI作业时长。本发明实施例的技术方案，通过预先根据样本区域的历史POI采集记录生成的候选行业类型与候选采集难度之间的映射关系，结合目标区域的POI的行业类型及各类型对应的采集难度来预测目标区域的POI作业时长，以提高区域POI作业时长的预测效率及准确率，且可适用于历史未触达区域的POI作业时长的预测，可实现对任意区域POI作业的收益与成本进行有效的衡量。

进一步的，上述装置中，所述映射关系是根据样本区域的历史POI采集记录生成的。

进一步的，上述装置还包括：

候选信息确定模块，用于将第一历史时间段在样本区域内采集的历史POI作为候选POI，以及将历史POI所属行业类型作为候选行业类型；

候选难度确定模块，用于根据第二历史时间段在所述样本区域内，所述候选行业类型下采回的候选POI数量和未采回的候选POI数量，确定所述候选行业类型关联的候选采集难度；

其中，所述第一历史时间段小于所述第二历史时间段。

进一步的，上述候选难度确定模块具体用于：

确定第二历史时间段在所述样本区域内，所述候选行业类型下采回的候选POI数量和未采回的候选POI数量之间的比例值；

若所述候选行业类型下的比例值小于第一比例阈值，则确定所述候选行业类型关联的候选采集难度是第一难度；

若所述候选行业类型下的比例值大于或等于所述第一比例阈值，且小于或等于第二比例阈值，则确定所述候选行业类型关联的候选采集难度是第二难度；

若所述候选行业类型下的比例值大于所述第二比例阈值，则确定所述候选行业类型关联的候选采集难度是第三难度；

其中，所述第一比例阈值小于所述第二比例阈值，所述第一难度小于所述第二难度，且所述第二难度小于所述第三难度。

进一步的，上述作业时长确定模块402具体用于：

根据所述目标区域的POI总数量、道路数量、道路里程、建筑物数量和面积中的至少一项，以及所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长。

进一步的，上述装置还包括:预测模型构建模块，该模块具有用于：

根据样本区域的历史POI采集记录，确定所述样本区域中具有候选采集难度的POI数量以及所述样本区域的POI作业时长；

根据所述样本区域中具有候选采集难度的POI数量以及所述样本区域的POI作业时长，构建POI作业时长预测模型。

实施例五

图5是本发明实施例五提供的一种服务器的结构示意图，图5示出了适于用来实现本发明实施例实施方式的示例性服务器的框图。图5显示的服务器仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示，服务器500以通用计算设备的形式表现。服务器500的组件可以包括但不限于：一个或者多个处理器或者处理单元516，存储器528，连接不同系统组件(包括存储器528和处理单元516)的总线518。

总线518表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

服务器500典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器500访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器528可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)530和/或高速缓存存储器532。服务器500可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示，通常称为“硬盘驱动器”)。尽管图5中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明实施例各实施例的功能。

具有一组(至少一个)程序模块542的程序/实用工具540，可以存储在例如存储器528中，这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明实施例所描述的实施例中的功能和/或方法。

服务器500也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信，还可与一个或者多个使得用户能与该服务器500交互的设备通信，和/或与使得该服务器500能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且，服务器500还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图5所示，网络适配器520通过总线518与服务器500的其它模块通信。应当明白，尽管图5中未示出，可以结合服务器500使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元516通过运行存储在存储器528中的程序，从而执行各种功能应用以及数据处理，本发明实施例的服务器可以实现本发明任一实施例所提供的区域兴趣点的作业时长预测方法。

实施例六

本发明实施例六还提供一种计算机可读存储介质，其上存储有计算机程序(或称为计算机可执行指令)，该程序被处理器执行时可以用于执行一种区域兴趣点的作业时长预测方法，该方法包括：

根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；其中，所述映射关系是根据样本区域的历史POI采集记录生成的；

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明实施例进行了较为详细的说明，但是本发明实施例不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种区域兴趣点的作业时长预测方法，其特征在于，所述方法包括：

根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；所述映射关系是根据样本区域的历史POI采集记录生成的；

根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长；其中，所述POI作业时长为采集所述目标区域的POI数据所需要的时长。

2.根据权利要求1所述的方法，其特征在于：根据样本区域的历史POI采集记录生成候选行业类型与候选采集难度之间的映射关系，包括：

将第一历史时间段在样本区域内采集的历史POI作为候选POI，以及将历史POI所属行业类型作为候选行业类型；

根据第二历史时间段在所述样本区域内，所述候选行业类型下采回的候选POI数量和未采回的候选POI数量，确定所述候选行业类型关联的候选采集难度；

其中，所述第一历史时间段小于所述第二历史时间段。

3.根据权利要求2所述的方法，其特征在于，所述根据第二历史时间段在所述样本区域内，所述候选行业类型下采回的候选POI数量和未采回的候选POI数量，确定所述候选行业类型关联的候选采集难度，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长，包括：

5.根据权利要求1所述的方法，其特征在于，在根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长之前，还包括：

6.一种区域兴趣点的作业时长预测装置，其特征在于，所述装置包括：

数量确定模块，用于根据目标区域中兴趣点POI的行业类型，以及候选行业类型与候选采集难度之间的映射关系，确定所述目标区域中具有候选采集难度的POI数量；所述映射关系是根据样本区域的历史POI采集记录生成的；

作业时长确定模块，用于根据所述目标区域中具有候选采集难度的POI数量，确定所述目标区域的POI作业时长；其中，所述POI作业时长为采集所述目标区域的POI数据所需要的时长。

7.一种服务器，其特征在于，所述服务器包括：

一个或多个处理器；

存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的区域兴趣点的作业时长预测方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-5中任一所述的区域兴趣点的作业时长预测方法。