计算自提柜投放位置的数据处理方法和系统
技术领域
本发明涉及数据处理技术领域,尤其是涉及基于GIS(地理信息系统)数据的、计算自提柜投放位置的数据处理方法和系统。
背景技术
随着互联网在线商品交易的增加,商品的运输、配送成为了商品交易流程中不可缺少的一个环节。商品配送是否准确、快速也成了影响客户选择网络商家的一个重要因素。对于某些大型网络商家或网终交易平台,通常建有自己的配送网络,所述配送网络包括商品仓库和配送站。为了满足其快速增长的业务量需求,提高客户对商品配送的良好体验,并节约人力资源,在所述配送网络中还包括在一些地点设置的自提柜。从而从多个方面确保商品配送的准确、及时。
对于自提柜的投放位置,为了提高其利用率,同时能真正满足客户的需求,需要基于订单、客户、人口密度等数据进行客观的分析。另外,由于各个地区的销售额的变化,对于配送网络中已有的自提柜,通常也需要重新进行评估,将利用率低的自提柜进行合并或转移到其他地点。
目前确定自提柜投放地点的方法通常是;在配送站站点安排人员实地考察,通过人工用excel表提报粗略的订单量,和人工分析运营成本及自提柜周转率的分析报告,然后确定自提柜的投放位置。但是这种根据区域或者站点上报的数据准确性存在误差,关于人工分析运营成本及自提柜周转率存在主观因素,因而常常导致自提柜的周转率较低,运营成本较高。
发明内容
本发明要解决的技术问题在于,针对现有技术的不足,提供一种用于计算自提柜投放位置的数据处理方法和系统,用于根据订单和地理位置数据,客观地计算出自提柜的最佳投放位置。
为了解决上述的技术问题,根据本发明的一个方面,本发明提供了一种计算自提柜投放位置的数据处理方法,其中,包括:
在系统数据库中提取出地址为选定区域的多个订单;
将所述多个订单的地址分别转换为对应的地理网格坐标;
根据投放参数及所述每一订单的地理网格坐标,计算选定区域中每一个地理网格的参数值;和
根据所述地理网格的参数值信息计算自提柜投放坐标。
优选地,根据所述地理网格的参数值信息计算自提柜投放坐标包括:
遍历所有地理网格,确定网格参数值大于或等于预设第一阈值的N个配送地理网格,其中,N≥2;
以所述每一个配送地理网格和与其相邻配送地理网格构成配送子集;
在所述N个配送子集中确定网格个数大于等于预设第二阈值的M个配送子集,其中,M≥2;和
在所述M个配送子集中,将至少由两个配送子集覆盖的网格作为自提柜投放位置。
优选地,将所述多个订单的地址分别转换为多个对应的地理网格坐标之前,包括:
设定关注距离,根据所述关注距离将所述选定区域在相应缩放级别的地理图库中划分为多个计算网格,所述计算网格包括多个地理网格;
将所述多个订单的地址分别转换为多个对应的地理网格坐标具体为:将所述每一个订单的地址分别转换为与所述计算网格相同缩放级别的地理网格坐标。
优选地,根据所述地理网格的参数值信息计算自提柜投放坐标,包括:
比较一个计算网格中的多个地理网格的参数值,将参数值最大的地理网格的坐标作为自提柜投放坐标。
优选地,所述投放参数包括订单数量、商品数量、商品价值和客户数量中的一种或多种,其中订单量包括白天配送订单量和夜间配送订单量;所述参数值包括订单数量,或商品数量,或商品价值,或以上各参数值中至少两种的加权参数值。
优选地,将所述多个订单的地址分别转换为多个对应的地理网格坐标,具体包括:
将选定区域的地理图片划分为多个缩放级别的地理网格,并根据地理经纬度坐标确定每一缩放级别的每一个网格的地理网格坐标;
将所述多个订单的地址分别转换为地理经纬度坐标;和
根据地理经纬度坐标与每一缩放级别的地理网格坐标的对应关系,确定每一个订单在每一缩放级别的地理网格坐标。
优选地所述缩放级别为从0到19级。
优选地,在计算选定区域中每一个地理网格的参数值之前,对所述多个订单或多个订单对应的地理网格坐标按照投放参数进行聚类计算,获得符合投放参数的订单地址或对应的地理网格坐标;
根据投放参数及所述每一订单的地理网格坐标,计算选定区域中每一个地理网格的参数值时,所述计算时的投放参数与进行聚类计算时采用的投放参数相同。
为了解决上述的技术问题,根据本发明的另一个方面,本发明提供了一种计算自提柜投放位置的数据处理系统,其中,包括:
订单数据提取模块,用于从系统数据库中提取出地址为选定区域的多个订单;
地理网格坐标转换模块,与所述订单数据提取模块相连接,将提取出的所述多个订单的地址分别转换为多个对应的地理网格坐标;
地理网格参数值计算模块,与所述地理网格坐标转换模块相连接,根据投放参数及所述每一订单的地理网格坐标,计算选定区域中每一个地理网格的参数值;和
投放位置确定模块,根据每一个地理网格的参数值信息,利用设定的算法计算出自提柜投放坐标。
优选地,所述地理网格坐标转换模块包括:
地理网格划分单元,用于将选定区域的地理图片划分为具有多个缩放级别的地理网格;
地理网格坐标确定单元,与所述地理网格划分单元相连接,用于根据地理经纬度坐标确定每一缩放级别的每一个网格的地理网格坐标;和
订单地址转换单元,用于所述多个订单的地址分别转换为地理经纬度坐标;和
订单地理网格坐标确定单元,分别与所述地理网格坐标确定单元和订单地址转换单元相连接,根据订单的地理经纬度坐标与每一缩放级别的地理网格坐标的对应关系,确定每一个订单在每一缩放级别的地理网格坐标。
优选地,所述地理网格参数值计算模块包括:
参数值计算单元,用于计算每一地理网格的订单数量、商品数量、商品值和客户数量;和
加权计算单元,与所述参数值计算单元连接,用于根据预置的参数权重,计算所述地理网格的加权参数值。
优选地,所述投放位置确定模块包括:
计算网格划分单元,用于根据设定的关注距离将所述选定区域在相应缩放级别的地理图库中划分为多个计算网格;
计算网格过滤单元,用于选取计算网格中的所有地理网格的参数值大于或等于预定值的计算网络;和
参数值比较单元,与所述计算网格划分单元相连接,针对过滤后得到的计算网络,比较一个计算网格中的地理网格中的多个地理网格的参数值,确定一个参数值最大的地理网格。
优选地,所述投放位置确定块包括:
比较单元,用于遍历所有地理网格,通过比较每一地理网格的参数值和预设第一阈值,确定N个参数值大于或等于预设第一阈值配送地理网格,计算每一个配送子集中的节点数是否大于等于预设第二阈值;
配送子集建立单元,以所述每一个配送地理网格和与其相邻配送地理网格构成N个配送子集,并在在所述N个配送子集中确定节点个数大于等于预设第二阈值的M个配送子集,其中,N≥2,M≥2;和
位置确定单元,用于在所述M个配送子集中,将至少由两个配送子集覆盖的节点作为自提柜投放位置。
本发明基于GIS(地理信息系统)数据来确定自提柜投放地址,与人工评估相比,第一:节省了时间,使用本发明所述的系统和方法可以节约50%以上的时间;第二:加强了订单量评估的准确性。另外,根据本发明提供的订单分布、商品分布、客户分布及潜在客户分布,使得投放自提柜的周转率可以从原来的20%提升到55%,提高了自提柜的利用率。
附图说明
通过参照以下附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1为本发明所述计算自提柜投放位置的数据处理方法总体流程图;
图2为本发明中应用到的地理网格示例示意图;
图3为地理网格划分示意图;
图4为本发明中确定自提柜投放位置的实施例一的流程图;
图5为本发明中确定自提柜投放位置的实施例二的流程图;
图6为本发明提供的计算自提柜投放位置的数据处理系统的原理框图;
图7为本发明地理网格坐标转换模块的原理框图;
图8为所述地理网格参数值计算模块的原理框图;
图9为本发明投放位置确定模块实施例一的原理框图;和
图10为本发明所述投放位置确定模块实施例一的原理框图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程没有详细叙述。另外附图不一定是按比例绘制的。
附图中的流程图、框图图示了本发明实施例的系统、方法、装置的可能的体系框架、功能和操作,流程图和框图上的方框可以代表一个模块、程序段或仅仅是一段代码,所述模块、程序段和代码都是用来实现规定逻辑功能的可执行指令。也应当注意,所述实现规定逻辑功能的可执行指令可以重新组合,从而生成新的模块和程序段。因此附图的方框以及方框顺序只是用来更好的图示实施例的过程和步骤,而不应以此作为对发明本身的限制。
如图1所示,为本发明提供的一种计算自提柜投放位置的数据处理方法流程图,如图6所示,为本发明提供的计算自提柜投放位置的数据处理系统的原理框图。其中,所述系统包括:订单数据提取模块1、地理网格坐标转换模块2、地理网格参数值计算模块3和投放位置确定模块4。结合所述系统原理图,所述方法包括:
步骤S1,所述订单数据提取模块1从系统数据库5中提取出地址为选定区域的多个订单;
步骤S2,所述地理网格坐标转换模块2将所述多个订单的地址分别转换为对应的地理网格坐标;
步骤S3,所述地理网格参数值计算模块3根据投放参数及所述每一订单的地理网格坐标,计算选定区域中每一个地理网格的参数值;
步骤S4,所述投放位置确定模块4根据每一个地理网格的参数值信息,利用设定的算法计算出自提柜投放坐标。
其中,在步骤S1中,选定一个用于投放自提柜的区域,如一个城市或城市中的某一个区域,通过获取这个区域订单情况来确定自提柜的投放位置。
在步骤S2中,针对获取的每一个订单地址,利用GIS系统中的地理数据,根据地理编码算法,将订单的地址分别转换为对应的地理网格坐标。如图7所示,所述地理网格坐标转换模块2包括:地理网格划分单元21、地理网格坐标确定单元22、订单地址转换单元23和订单地理网格坐标确定单元24。其中,地理网格划分单元21用于将选定区域的地理图片划分为具有多个缩放级别的地理网格。关于地理网格,本发明将选定区域的地理图片划分为多个地理网格,例如图2所示。为了更加精确地对选定区域进行划分,本发明利用地图服务平台,确定所述地图服务平台要提供的缩放级别的数量N,把缩放级别最低、地图比例尺最大的地图图片作为金字塔的底层,即第0层,并对其进行分块。从地图图片的左上角开始,从左至右、从上到下进行切割,分割成相同大小(比如256x256像素)的正方形地图瓦片,形成第0层瓦片矩阵。在第O层地图图片的基础上,按每2x2像素合成为一个像素的方法生成第1层地图图片,并对其进行分块,分割成与下一层相同大小的正方形地图瓦片,形成第1层瓦片矩阵;采用同样的方法生成第2层瓦片矩阵;…;如此下去,直到第N一1层,构成整个瓦片金字塔。
例如,如图3所示,将一个特定区域的地理图片在第0层平均切割成4块,形成第1层,即第1层包含41个地图瓦片。而后将第1层中的每一块地图瓦片上再分别平均切割成4块,形成第2层,即第2层包含42个地图瓦片。而后将第2层中的每一块地图瓦片上再分别平均切割成4块,形成第3层,即第3层包含43个地图瓦片。以此类推,通过分级切割,将一个特定区域的地理图片切割成一个缩放级别不同的不同网格,在每一个缩放级别上,网格的大小不同。
地理网格坐标确定单元22与所述地理网格划分单元21相连接。当确定了地理网格之后,根据GIS系统数据中的地理经纬度坐标,地理网格坐标确定单元便可以确定每一缩放级别的每一个网格的地理网格坐标。
订单地址转换单元23根据GIS系统数据,将所述订单的地址分别转换为地理经纬度坐标。
订单地理网格坐标确定单元24根据订单的地理经纬度坐标与每一缩放级别的地理网格坐标的对应关系,确定每一个订单在每一缩放级别的地理网格坐标。当将所述订单的地址分别转换为对应的地理网格坐标时,便建立了订单与地理网格的对应关系。此时,便可以得到该特定区域的订单分布情况。
如果订单的分布过于密集,通过稀疏算法来解决通过上述计算得到的网格推荐点过于集中的问题,具体而言,即通过对相邻网格推荐点做比较,如果两个相邻推荐点比较近,则选取其中订单量最大的作为推荐点。
在步骤S3中,投放参数为用来确定自提柜投放位置的参考因素,如可以为订单数量、商品数量或商品价值,或是这三种中多种组合。当参考因素不同时,自提柜的投放位置也会相应不同。当投放参数只为其中一种时,可以根据该参数计算出每一个地理网格的参数值。例如,如果投放参数为订单数量时,需要统计每一个地理网格的订单数量,即统计同为一个地理网格坐标的订单的数量,所述的数量即为地理网格的参数值。如果以商品数量作为投放参数,则需要首先统计为同一个地理网格坐标的订单的数量,再统计每一个订单中的商品数量,而后将所有订单中的商品数量相加,则可以得到地理网格坐标的商品数量,该商品数量即为该地理网格坐标参数值。如果投放参数为以上几种参考因素的组合时,需要定义其各种的权重,然后计算出每一个地理网格的加权值,以此作为该地理网格的参数值。因而,如图8所示,本发明中的所述地理网格参数值计算模块3包括参数值计算单元31和加权计算单元32,参数值计算单元31用于根据用户的选择来计算每一地理网格的订单数量、商品数量、商品值或客户数量(所述客户,指对应于同一地址的订单);如果用户选择了两种以上时,加权计算单元32根据预置的参数权重,计算所述地理网格的加权参数值。
为了能按照关注的投放参数设置自提柜,并且提高准确度,首先对所选定区域的订单数据采用地图厂商提供的API进行聚类计算,从而得到诸如普通订单分布数据、客户分布数据或商品价值的分布数据等。如果有特定要求,如在某个小区设置自提柜,通过关键字筛选,即通过客户地址作为关键字对原始选定区域的订单数据进行过滤,从而得到符合特定要求的数据,该数据作为以下步骤S4的计算基础。
在步骤S4中,根据投放的自提柜数量要求,在确定自提柜位置时流程稍有不同。如果只放一个自提柜,则将参数值最大的网格坐标作为自提柜投放坐标,即有最大量订单或最多商品或商品价值最高的那个地理网格作为投放自提柜的位置。
如果可以投放多个自提柜,可以参考图10所示的投放位置确定模块的原理结构及图4所示的流程。所述投放位置确定模块24包括比较单元、配送子集建立单元和位置确定单元。
在步骤S41a,所述比较单元41a遍历所有的地理网格,确定网格参数值大于或等于预设第一阈值的N个配送地理网格,其中,N≥2。例如,当地理网格的订单数量大于10才会考虑是否需要设置一个自提柜,所以,通过将每一个地理网格的参数值与10,即预设的第一阈值,进行比较,将参数值大于等于所述第一阈值(10)的地理网格过滤出来,假设有N个,将所述过滤出来的N个地理网格命名为配送地理网格,以便与其他地理网格相区分。
步骤S42a,所述配送子集建立单元42a将所述N个配送地理网格作为N个节点,将每一个配送地理网格和与他相邻的配送地理网格节点合成为一个配送子集,即建立N个配送子集。
步骤S43a,在这N个配送子集中,有的节点(即配送地理网格)多,有的节点少,预设一个预设第二阈值,即配送子集中节点的最小数量,由所述比较单元比较每一个配送子集的节点数与预设第二阈值,在配送子集中过滤出节点数量大于或等于所述预设第二阈值的配送子集,假设为M个子集,M≥2;
步骤S44a,位置确定单元43a在所述M个配送子集中,获取至少由两个配送子集覆盖的节点,将所述节点,即网格坐标作为自提柜投放位置。
以上流程参照了最大覆盖子集模型算法或基于浙进覆盖的Huff引力模型算法,从而来确定最佳的自提柜投放位置。
在第二实施例中,参考图9所示的投放位置确定模块的原理结构及图5所示的流程。所述投放位置确定模块包括计算网格划分单元41b、计算网格过滤单元42b和参数值比较单元43b。
步骤S41b,设定关注距离。所述关注距离确定了网络所在的缩放级别,不同的关注距离对应不同的缩放级别,因而会得到不同精度的网格坐标。
步骤S42b,计算网格划分单元41b根据设定的关注距离将所述选定区域在相应缩放级别的地理图库中划分为多个计算网格;每个计算网络包括多个地理网格。
步骤S43b,将所述每一个订单的地址分别转换为与所述计算网格相同缩放级别的地理网格坐标。转换完之后,便可以得到订单的分布情况。
步骤S44b,计算每一个计算网格的参数值。其中,可以先计算每一个地理网格的参数值,然后再根据一个计算网格中包括的地理网格数量,将一个计算网格中的所有地理网格的参数值求和,便可以得到每一个计算网格的参数值。
步骤S45b,选取一个计算网格,即需要设置自提柜的区域。
步骤S46b,参数值比较单元43b针对该计算网络中的各个地理网格的参数值,比较各个地理网格的参数值,确定一个参数值最大的地理网格。
步骤S47b,将参数值最大的地理网格的坐标作为投放自提柜的坐标。
由于不同的投放参数对应的网格的参数值不同,因而当选取的投放参数不同时,即关注点不同时,则得到的自提柜的坐标也会不同。
以上流程采用了权最大覆盖模型算法,从而来确定最佳的自提柜投放位置。
在以上算法流程中,所述选定区域中没有配送站,如果选定区域中包含有配送站,则需要首先确定需要放置自提柜的区域,即,将可由配送站直接送达的地理网格去掉。具体为:根据配送站的经纬度坐标,确定所述配送站的网格坐标,当得到该特定区域的订单分布情况后,通过已知的配送站的地理空间坐标,可以计算出从配送站到订单的配送距离。再根据配送站可配送的距离,可以计算出每一个配送站可配送的订单量。根据配送站的工作额度,可以得到配送站能够配送的地理网格,从所述区域中去掉这些地理网格,基于剩余的地理网格,再利用上述算法流程中进行计算。
通过上述系统,可以针对某个特定区域,如一个城市,得到订单分布、商品分布、客户分布乃至于潜在客户分布,根据投放时考虑的参数,如按订单量,或商品量,或商品价值或客户量,在分布密集的地方设置自提柜,节省了人工配送成本,提高了现有自提柜的利用率。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。