CN115018596B - 虚假定位识别及模型训练方法、装置、设备、介质 - Google Patents
虚假定位识别及模型训练方法、装置、设备、介质 Download PDFInfo
- Publication number
- CN115018596B CN115018596B CN202210930297.6A CN202210930297A CN115018596B CN 115018596 B CN115018596 B CN 115018596B CN 202210930297 A CN202210930297 A CN 202210930297A CN 115018596 B CN115018596 B CN 115018596B
- Authority
- CN
- China
- Prior art keywords
- time
- distribution
- behavior
- sequence
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0835—Relationships between shipper or supplier and carriers
- G06Q10/08355—Routing methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/109—Time management, e.g. calendars, reminders, meetings or time accounting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
Abstract
本公开实施例公开了一种虚假定位识别及模型训练方法、装置、设备、介质,该方法包括:获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;基于所述配送行为时序数据,确定所述待识别订单对应的虚假定位识别结果。该技术方案可以对虚拟定位的虚假定位行为进行准确有效的识别。
Description
技术领域
本公开涉及互联网技术领域,具体涉及一种虚假定位识别及模型训练方法、装置、设备、介质。
背景技术
在互联网的即时配送的场景下,网约配送员在接单后,需根据订单需求,按照平台智能规划路线,在一定时间内从商户取得订单物品并递送至指定地点。平台为掌握配送员的配送情况,通常会在配送过程中的各个节点设置相应的考察机制以保证配送的及时性、有效性等。以外卖配送场景为例,配送中的重要节点有到店节点即配送员到达商户、取餐节点即配送员从商户处取得餐品、送达节点即配送员到达用户指定地点完成配送。每个节点会由平台指定相应的策略以监督配送员有效地完成相应节点的服务动作。其中,在各个节点处,平台判定配送员满足服务动作完成条件的基础要求便是配送员的定位或行驶路径确实在对应场地(商户、用户)周围,比如说配送员距商户的距离需要小于一定阈值才能准许配送员完成到店节点的服务动作。这种监督方式就会出现配送员通过虚拟定位类的作弊手段,向平台提供虚假的定位或行驶路径以绕开平台的监督,从而虚假完成相应的服务动作,实现虚假配送、虚假出勤等欺诈行为。因此,如何准确识别配送过程中的虚假定位作弊行为成为发展配送服务不得不解决的问题。
发明内容
本公开实施例提供一种虚假定位识别及模型训练方法、装置、设备、介质。
第一方面,本公开实施例中提供了一种虚假定位识别方法。
具体的,该虚假定位识别方法包括:
获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
在第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值大于预设阈值时,确定所述待识别订单为虚假定位订单,其中,所述第一序列时刻与所述第二序列时刻为两个相邻的序列时刻。
第二方面,本公开实施例中提供了一种虚假定位识别方法。
具体的,该虚假定位识别方法包括:
获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
获取所述待识别订单的配送行为统计特征,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段;
基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果,包括:
将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述配送行为数据包括配送距离和配送速度,所述预设的识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层,所述将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果,包括:
将各序列时刻的配送速度输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;
将各序列时刻的配送距离输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;
将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;
将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层。
在一种可能的实现方式中,所述预设的识别模型还包括权重特征提取层,将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征,包括:
将所述配送行为统计特征输入至所述权重特征提取层,得到所述权重特征提取层输出的权重特征;
将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征。
在一种可能的实现方式中,所述当前已完成配送行为的统计特征包括以下至少一种:所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。
在一种可能的实现方式中,所述待识别订单包括已完成配送的订单或正在进行配送的订单。
在一种可能的实现方式中,所述方法还包括:
获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
基于所述样本数据,对初始识别模型进行训练,得到所述预设的识别模型。
第三方面,本公开实施例中提供了一种虚假定位识别模型训练方法。
具体的,该虚假定位识别模型训练方法包括:
获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
基于所述样本数据,对初始识别模型进行训练,得到预设的识别模型;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段。
在一种可能的实现方式中,所述配送行为时序特征包括配送速度时序数据和配送距离时序数据,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
所述初始识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层;所述第一时序特征提取层用于提取所述配送速度时序数据得到配送速度时序特征;所述第二时序特征提取层用于提取所述配送距离时序数据得到配送速度时序特征;所述识别输出层用于基于所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征,识别样本订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层;
训练所述识别模型时的损失函数包括交叉熵,优化器包括自适应矩估计。
在一种可能的实现方式中,所述初始识别模型包括权重特征提取层,所述权重特征提取层用于提取配送行为统计特征中的权重特征。
第四方面,本公开实施例中提供了一种虚假定位识别装置。
具体的,该虚假定位识别装置包括:
第一获取模块,被配置为获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
第一确定模块,被配置为在第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值大于预设阈值时,确定所述待识别订单为待识别订单,其中,所述第一序列时刻与所述第二序列时刻为两个相邻的序列时刻。
第五方面,本公开实施例中提供了一种虚假定位识别装置。
具体的,该虚假定位识别装置包括:
第二获取模块,被配置为获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
第三获取模块,被配置为获取所述待识别订单的配送行为统计特征,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段;
第二确定模块,被配置为基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述第二确定模块被配置为:
将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述配送行为数据包括配送距离和配送速度,所述预设的识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层,所述第二确定模块被配置为:
将各序列时刻的配送速度输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;
将各序列时刻的配送距离输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;
将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;
将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层。
在一种可能的实现方式中,所述预设的识别模型还包括权重特征提取层,所述第二确定模块中将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征的部分被配置为:
将所述配送行为统计特征输入至所述权重特征提取层,得到所述权重特征提取层输出的权重特征;
将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征。
在一种可能的实现方式中,所述当前已完成配送行为的统计特征包括以下至少一种:所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。
在一种可能的实现方式中,所述待识别订单包括已完成配送的订单或正在进行配送的订单。
在一种可能的实现方式中,所述装置还包括:
第四获取模块,被配置为获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
第一训练模块,被配置为基于所述样本数据,对初始识别模型进行训练,得到所述预设的识别模型。
第六方面,本公开实施例中提供了一种虚假定位识别模型训练装置。
具体的,该虚假定位识别模型训练装置包括:
第五获取模块,被配置为获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
第二训练模块,被配置为基于所述样本数据,对初始识别模型进行训练,得到预设的识别模型;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段。
在一种可能的实现方式中,所述配送行为时序特征包括配送速度时序数据和配送距离时序数据,所述配送距离包括定位位置与所述已完成配送环节的目标点的距离;
所述初始识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层;所述第一时序特征提取层用于提取所述配送速度时序数据得到配送速度时序特征;所述第二时序特征提取层用于提取所述配送距离时序数据得到配送速度时序特征;所述识别输出层用于基于所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征,识别样本订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层;
训练所述识别模型时的损失函数包括交叉熵,优化器包括自适应矩估计。
在一种可能的实现方式中,所述初始识别模型还包括权重特征提取层,所述权重特征提取层用于提取配送行为统计特征中的权重特征。
第七方面,本公开实施例提供了一种电子设备,包括存储器和至少一个处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述至少一个处理器执行以实现上述各方法的方法步骤。
第八方面,本公开实施例提供了一种计算机可读存储介质,用于存储计算机指令,该计算机指令被处理器执行时实现上述的方法步骤。
第九方面,本公开实施例提供了一种计算机程序产品,包括计算机程序/指令,其中,该计算机程序/指令被处理器执行时实现上述的方法步骤。
本公开实施例提供的技术方案可以包括以下有益效果:
上述技术方案可以对配送员在进行待识别订单时在各配送环节的服务动作完成时刻前后的配送行为时序数据进行分析,识别配送员是否有虚假定位行为,这样通过对配送行为的特征分析可以全面覆盖不同手段下的虚拟定位虚假定位场景,对于配送员自行修改定位的虚假定位行为能够做到准确有效的识别。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。以下是对附图的说明。
图1示出根据本公开一实施方式的虚假定位识别方法的流程图。
图2A示出根据本公开一实施方式的虚假定位识别方法的流程图。
图2B示出根据本公开一实施方式的识别模型的识别流程示意图。
图3示出根据本公开一实施方式的虚假定位识别模型训练方法的流程图。
图4A示出根据本公开一实施方式的虚假定位识别装置的结构框图。
图4B示出根据本公开一实施方式的虚假定位识别装置的结构框图。
图5示出根据本公开一实施方式的虚假定位识别模型训练装置的结构框图。
图6示出根据本公开一实施方式的电子设备的结构框图。
图7示出适于用来实现根据本公开实施例的方法的计算机系统的结构示意图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
在本公开中,对用户信息或用户数据的获取均为经用户授权、确认,或由用户主动选择的操作。
上文提及,在互联网的即时配送的场景下,网约配送员在接单后,需根据订单需求,按照平台智能规划路线,在一定时间内从商户取得订单物品并递送至指定地点。平台为掌握配送员的配送情况,通常会在配送过程中的各个节点设置相应的考察机制以保证配送的及时性、有效性等。以外卖配送场景为例,配送中的重要节点有到店节点即配送员到达商户、取餐节点即配送员从商户处取得餐品、送达节点即配送员到达用户指定地点完成配送。每个节点会由平台指定相应的策略以监督配送员有效地完成相应节点的服务动作。其中,在各个节点处,平台判定配送员满足服务动作完成条件的基础要求便是配送员的定位或行驶路径确实在对应场地(商户、用户)周围,比如说配送员距商户的距离需要小于一定阈值才能准许配送员完成到店节点的服务动作。这种监督方式就会出现配送员通过虚拟定位类的作弊手段,向平台提供虚假的定位或行驶路径以绕开平台的监督,从而虚假完成相应的服务动作,实现虚假配送、虚假出勤等欺诈行为。
现有虚假定位行为的识别方案是检测配送员的定位设备是否连接虚假定位用的外设硬件,其主要识别的场景是配送员通过手机I/O接口连接外部硬件设备或通过蓝牙连接外设,使用软硬结合方式干扰平台应用定位功能实现虚拟定位的作弊手段。但是目前的虚假定位手段不仅仅有连接外设这一种,还可以通过纯软件的方式如修改定制脚本、修改平台应用二次打包等方式进行虚假定位,使用现有的识别方案仅能识别连接外设的虚假定位手段,不能准确识别出其他虚假定位行为;另外,现有的识别方案具有一定误判性,例如终端设备连接其他正常的蓝牙设备如耳机时,可能会被误判为连接虚假定位外设。因此,如何准确识别配送过程中的虚假定位行为成为发展配送服务不得不解决的问题。
本公开实施例提供的技术方案可以对配送员待识别订单的各配送环节的服务动作完成时刻前后的配送行为数据进行分析,识别配送员是否有虚假定位行为。这样通过对配送行为的特征分析可以全面覆盖不同手段下的虚拟定位虚假定位场景,对于配送员自行修改定位的虚假定位行为能够做到准确有效的识别。
图1示出根据本公开一实施方式的虚假定位识别方法的流程图,如图1所示,所述虚假定位识别包括以下步骤S101-S102:
在步骤S101中,获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
在步骤S102中,在第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值大于预设阈值时,确定所述待识别订单为虚假定位订单,其中,所述第一序列时刻与所述第二序列时刻为两个相邻的序列时刻。
在一种可能的实施方式中,该虚假定位识别方法适用于可执行该虚假定位识别的服务器、服务器集群、云端等。
在本公开一实施方式中,该待识别订单指的是需要配送员进行配送服务的订单,可以是配送员正在进行配送的订单,也可以是已完成配送的订单,在此并不做限制。
在一种可能的实施方式中,配送员在配送该待识别订单的过程中需要完成以下三个配送环节:配送员到达商户的到店环节、配送员从商户处取得货物的取物环节、配送员将取得的货物送至用户指定的收货位置处的送达环节;配送员在这三个配送环节中的服务动作指的是到店环节的到店动作、取物环节的取物动作和送达环节的送达动作;到店环节的到店动作需要配送员的定位位置到达该到店环节的目标点即商户位置附近才能由配送员输入完成,取餐环节的取餐动作需要配送员的定位位置在取餐环节的目标点即商户位置附近才能由配送员输入完成,送达环节的送达动作需要配送员的定位位置在送达环节的目标点即用户指定的收货位置附近才能由配送员输入完成。
在本公开一实施方式中,不论配送员是通过连接虚假定位外设还是通过纯软件的虚假定位手段欺骗平台的定位功能,其在使用虚拟定位类外挂时,都会经历选择虚拟定位的位置(如商户位置附近或收货位置附近)—将当前定位切换至虚拟定位处—保持处于虚拟定位处一定时间完成相应配送环节的服务动作(如到店动作、取餐动作或送达动作)—再切换回真实定位或其他虚拟定位位置的过程。这一系列行为具有比较鲜明的特征可以归纳总结:从配送员行驶路径角度分析,配送员在上述过程中会手动直接将当前定位切换至虚拟定位处以及从虚拟定位处切换至真实定位或其他虚拟定位位置,这样,配送员的行驶路径会呈现较为明显的大范围瞬移现象。通过上述分析,在识别虚拟定位的虚假定位行为时,需要分析的数据包括待识别订单在第一预设时间段内的配送行为时序数据。
在本公开一实施方式中,该第一预设时间段指的是已完成配送环节的服务动作完成时刻前后一段时间,为了方便描述,可以将该已完成配送环节的服务动作完成时刻记为目标时刻,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,示例的,该第一时刻可以是目标时刻之前的2~4分钟的时刻,该第二时刻可以是目标时刻之后2~4分钟的时刻。
在本公开一实施方式中,可以将从配送终端获取配送员输入完成到店动作、取餐动作和送达动作的时刻作为目标时刻。若该待识别订单为已完成订单,则已完成配送环节包括上述的三个配送环节,此时可以分别获取三个配送环节的目标时刻前后第一预设时间内的配送行为时序数据;若该待识别订单为正在进行配送的订单,则该已完成配送环节包括当前序列时刻之前已完成的配送环节,此时可以分别获取当前已完成配送环节的目标时刻前后第一预设时间内的配送行为时序数据。
在本公开一实施方式中,所述配送行为时序数据指的是第一预设时间段内各序列时刻的配送行为数据,该配送行为数据包括配送距离和/或配送速度,则该配送行为时序数据包括配送距离时序数据和/或配送速度时序数据。所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离。该时序数据指的是按时间顺序记录的各序列时刻的数据列,该配送速度时序数据指的是在第一预设时间段内的各序列时刻的配送速度序列,该配送距离时序数据指的是第一预设时间段内的各序列时刻的定位位置与目标时刻所在定位位置之间的距离。该目标时刻所在定位位置指的是完成配送环节的服务动作需要到达的位置,如完成到店环节的到店动作需要配送员的定位位置到达该到店环节的目标点即商户位置处,完成取餐环节的取餐动作需要配送员的定位位置在取餐环节的目标点即商户位置,完成送达环节的送达动作需要配送员的定位位置在送达环节的目标点即用户指定的收货位置。示例的,假设该已完成配送环节为到店环节,配送员输入完成到店动作的时刻即目标时刻为t1,则该配送速度时序数据可以是t1时刻前后2分钟内多个序列时刻的配送速度,该配送距离时序数据指的是该t1时刻前后2分钟内多个序列时刻的定位位置与商户位置之间的距离。
在本公开一实施方式中,第一预设时间段内的配送行为时序数据可以反应配送员在达到目标点完成服务动作的前后一段时间内配送速度或配送距离是否出现明显的突变现象,如果出现突变现象则该配送员在配送该待识别订单时可能存在虚拟定位的虚假定位行为。故,在该配送行为数据包括配送距离时,如果相邻两个序列时刻的配送距离之差大于预设阈值,则说明第一预设时间段内的配送员的定位位置存在突变现象,此时可以确定所述待识别订单为虚假定位订单;在该配送行为数据包括配送速度时,如果相邻两个序列时刻的配送速度之差大于预设阈值,则说明第一预设时间段内的配送员的定位位置存在突变现象,此时可以确定所述待识别订单为虚假定位订单;在该配送行为数据包括配送距离和配送速度时,如果相邻两个序列时刻的配送距离之差大于相应预设距离阈值和/或相邻两个序列时刻的配送速度之差大于相应预设速度阈值,则说明第一预设时间段内的配送员的定位位置存在突变现象,此时可以确定所述待识别订单为虚假定位订单。示例的,假设该已完成配送环节为到店环节,配送员输入完成到店动作的时刻即目标时刻为t1,该配送行为时序数据包括该t1时刻前2分钟即t1-2时刻的定位位置与目标时刻t1所在定位位置之间的配送距离h1,目标时刻对应的配送距离为0,该t1时刻后2分钟即t1+2时刻的定位位置与目标时刻t1所在定位位置之间的配送距离h2,如果h1-0大于预设阈值,则表明配送员从t1-2时刻至t1时刻之间的时间段内配送距离出现突变,在t1-2时刻至t1时刻之间的某个时刻配送员的定位位置突然从之前的定位位置变换到一个较远位置,此时可以确定所述待识别订单为虚假定位订单。或者,如果h2-0大于预设阈值,则表明配送员从t1时刻至t1+2时刻之间的时间段内配送距离出现突变,在t1时刻至t1+2时刻之间的某个时刻配送员的定位位置突然从之前的定位位置变换到一个较远位置,此时可以确定所述待识别订单为虚假定位订单。
本实施方式提供的方案中,总结了配送员在使用虚拟定位类外挂的过程中表现的行为特征,获取能够反应这些行为特征的配送行为时序数据,对配送员在进行待识别订单时在各配送环节的服务动作完成时刻前后的配送行为时序数据进行分析,识别配送员是否有虚假定位行为,这样通过对配送行为的特征分析可以做到对虚拟定位的虚假定位行为的普适性识别,全面覆盖不同手段下的虚拟定位虚假定位场景,对于配送员自行修改定位的虚假定位行为能够做到准确有效的识别。
在一种可能的实施方式中,通过第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值来确定所述待识别订单为虚假定位订单可能会出现误判,为了更准确地确定该待识别订单是否为虚假定位订单,上述方法还可以包括以下步骤:
获取所述待识别订单的配送行为统计特征,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段;
基于所述配送行为时序数据和所述配送行为统计特征,确定所述虚假定位订单对应的最终虚假定位识别结果。
在该实施方式中,当前已完成配送行为的统计特征可以是配送员从接单时刻至当前序列时刻针对该待识别订单的配送行为的统计类特征,即可以是所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。该配送员的定位设备会周期性地上传定位点,如此可以获取定位点总数量,定位点聚合指的是将预设距离内的定位点聚合为一个定位点,如此可以得到定位点聚合后的数量。其他速度、时间和距离可以根据定位设备上传的定位点的位置和时间统计计算获取。这些统计特征可以反应配送员的配送行驶路径是否正常。
在该实施方式中,所述目标时刻之后预设时长(短时间内如1分钟)内定位位置距离所述已完成配送环节的目标点的极值距离可以是极大值距离和/或极小值距离。示例的,已完成配送环节包括到店环节,则可以获取配送员输入到店动作后1分钟内定位位置距离该待识别订单的商户位置的极值距离;若已完成配送环节还包括取物环节和送达环节,则还可以获取配送员输入取餐完成后1分钟内定位位置距离该待识别订单的商户位置的极值距离,以及配送员输入送达动作后1分钟内定位位置距离该待识别订单的用户指定取货位置的极值距离。如果配送员存在虚假定位行为,则该极大值距离会较大或极大值距离与极小值距离之间的差值会较大,故也可以通过该极值距离来进行虚假定位识别。
在该实施方式中,在该待识别订单为已完成订单时,该第二预设时间段指的是待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段,在该待识别订单为正在进行配送的订单时,该第二预设时间段指的是当前时刻之前的时间段。示例的,该第二预设时间段可以是一较长的时间段,如1小时。如果配送员存在虚假定位行为,则该配送员在该第二预设时间段内的完单量可能会较多,故也可以通过该第二预设时间段内的完单量来进行虚假定位识别。
在该实施方式中,该定位设备的定位置信度指的是该配送员的定位设备向平台发送的定位位置的可信度,可以基于该配送员的历史配送反馈以及对该定位设备的置信度检测获取得到。
在该实施方式中,按照上文描述的配送行为时序数据和所述配送行为统计特征对虚假定位识别的影响,可以分析所述配送行为时序数据和所述配送行为统计特征,可以更准确地确定所述虚假定位订单对应的最终虚假定位识别结果。
在一种可能的实施方式中,可以将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
图2A示出根据本公开一实施方式的虚假定位识别方法的流程图,如图2A所示,所述虚假定位识别包括以下步骤S201-S203:
在步骤S201中,获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
在步骤S202中,获取所述待识别订单的配送行为统计特征;
其中,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段;
在步骤S203中,基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
在本公开一实施方式中,该虚假定位识别方法适用于可执行该虚假定位识别的服务器、服务器集群、云端等。
在本公开一实施方式中,该待识别订单指的是需要配送员进行配送服务的订单,可以是配送员正在进行配送的订单,也可以是已完成配送的订单,在此并不做限制。
在一种可能的实施方式中,配送员在配送该待识别订单的过程中需要完成以下三个配送环节:配送员到达商户的到店环节、配送员从商户处取得货物的取物环节、配送员将取得的货物送至用户指定的收货位置处的送达环节;配送员在这三个配送环节中的服务动作指的是到店环节的到店动作、取物环节的取物动作和送达环节的送达动作;到店环节的到店动作需要配送员的定位位置到达该到店环节的目标点即商户位置附近才能由配送员输入完成,取餐环节的取餐动作需要配送员的定位位置在取餐环节的目标点即商户位置附近才能由配送员输入完成,送达环节的送达动作需要配送员的定位位置在送达环节的目标点即用户指定的收货位置附近才能由配送员输入完成。
在本公开一实施方式中,不论配送员是通过连接作弊外设还是通过纯软件的作弊手段欺骗平台的定位功能,其在使用虚拟定位类外挂时,都会经历选择虚拟定位的位置(如商户位置附近或收货位置附近)—将当前定位切换至虚拟定位处—保持处于虚拟定位处一定时间完成相应配送环节的服务动作(如到店动作、取餐动作或送达动作)—再切换回真实定位或其他虚拟定位位置的过程。这一系列行为具有比较鲜明的特征可以归纳总结:从配送员行驶路径角度分析,配送员在上述过程中会手动直接将当前定位切换至虚拟定位处以及从虚拟定位处切换至真实定位或其他虚拟定位位置,这样,配送员的行驶路径会呈现较为明显的大范围瞬移现象,且虚拟定位位置都是配送员手动切换的,切换频次较低,所以定时上传至平台的虚拟定位点基本都在一两个位置点处不动。另外,由于平台获取配送员定位位置时间频次保持稳定比如每20s获取一次配送员的定位位置,若配送员使用虚拟定位外挂修改定位位置,则配送员的瞬时速度和距离配送环节的目标点(商户、用户)距离在位置修改时会出现较为明显的突变现象。最后,从具体服务场景上来看,使用虚拟定位完成的订单配送在配送路径上通常会呈现不合理的配送线路,配送的行驶路径打点会聚集在切换的虚拟定位处,缺少沿路网的合理移动。综合上述分析,在识别虚拟定位的作弊行为时,该识别模型需要分析的数据包括待识别订单在第一预设时间段内的配送行为时序数据和所述待识别订单的配送行为统计特征。
在本公开一实施方式中,该第一预设时间段指的是已完成配送环节的服务动作完成时刻前后一段时间,为了方便描述,可以将该已完成配送环节的服务动作完成时刻记为目标时刻,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,示例的,该第一时刻可以是目标时刻之前的2~4分钟的时刻,该第二时刻可以是目标时刻之后2~4分钟的时刻。
在本公开一实施方式中,可以将从配送终端获取配送员输入完成到店动作、取餐动作和送达动作的时刻作为目标时刻。若该待识别订单为已完成订单,则已完成配送环节包括上述的三个配送环节,此时可以分别获取三个配送环节的目标时刻前后的配送行为时序数据;若该待识别订单为正在进行配送的订单,则该已完成配送环节包括当前序列时刻之前已完成的配送环节,此时可以分别获取当前已完成配送环节的目标时刻前后的配送行为时序数据。
在本公开一实施方式中,所述配送行为时序数据指的是第一预设时间段内各序列时刻的配送行为数据,该配送行为数据包括配送距离和/或配送速度,则该配送行为时序数据包括配送距离时序数据和/或配送速度时序数据。所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离。该时序数据指的是按时间顺序记录的各序列时刻的数据列,该配送速度时序数据指的是在第一预设时间段内的各序列时刻的配送速度序列,该配送距离时序数据指的是第一预设时间段内的各序列时刻的定位位置与目标时刻所在定位位置之间的距离。该目标时刻所在定位位置指的是完成配送环节的服务动作需要到达的位置,如完成到店环节的到店动作需要配送员的定位位置到达该到店环节的目标点即商户位置处,完成取餐环节的取餐动作需要配送员的定位位置在取餐环节的目标点即商户位置,完成送达环节的送达动作需要配送员的定位位置在送达环节的目标点即用户指定的收货位置。示例的,假设该已完成配送环节为到店环节,配送员输入完成到店动作的时刻即目标时刻为t1,则该配送速度时序数据可以是t1时刻前后2分钟内多个序列时刻的配送速度,该配送距离时序数据指的是该t1时刻前后2分钟内多个序列时刻的定位位置与商户位置之间的距离。
在本公开一实施方式中,第一预设时间段内的配送行为时序数据可以反应配送员在达到目标点完成服务动作的前后一段时间内配送速度和配送距离是否出现明显的突变现象,如果出现突变现象则该配送员在配送该待识别订单时可能存在虚拟定位行为。
在本公开一实施方式中,当前已完成配送行为的统计特征可以是配送员从接单时刻至当前序列时刻针对该待识别订单的配送行为的统计类特征,即可以是所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。该配送员的定位设备会周期性地上传定位点,如此可以获取定位点总数量,定位点聚合指的是将预设距离内的定位点聚合为一个定位点,如此可以得到定位点聚合后的数量。其他速度、时间和距离可以根据定位设备上传的定位点的位置和时间统计计算获取。这些统计特征可以反应配送员的行驶路径是否正常。
在本公开一实施方式中,所述目标时刻之后预设时长(短时间内如1分钟)内定位位置距离所述已完成配送环节的目标点的极值距离可以是极大值距离和/或极小值距离。示例的,已完成配送环节包括到店环节,则可以获取配送员输入到店动作后1分钟内定位位置距离该待识别订单的商户位置的极值距离;若已完成配送环节还包括取物环节和送达环节,则还可以获取配送员输入取餐完成后1分钟内定位位置距离该待识别订单的商户位置的极值距离,以及配送员输入送达动作后1分钟内定位位置距离该待识别订单的用户指定取货位置的极值距离。如果配送员存在虚假定位行为,则该极大值距离会较大或极大值距离与极小值距离之间的差值会较大,故也可以通过该极值距离来进行虚假定位识别。
在本公开一实施方式中,在该待识别订单为已完成订单时,该第二预设时间段指的是待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段,在该待识别订单为正在进行配送的订单时,该第二预设时间段指的是当前时刻之前的时间段。示例的,该第二预设时间段可以是一较长的时间段,如1小时。如果配送员存在虚假定位行为,则该配送员在该第二预设时间段内的完单量可能会较多,故也可以通过该第二预设时间段内的完单量来进行虚假定位识别。
在本公开一实施方式中,该定位设备的定位置信度指的是该配送员的定位设备向平台发送的定位位置的可信度,可以基于该配送员的历史配送反馈以及对该定位设备的置信度检测获取得到。
在本公开一实施方式中,按照上文描述的配送行为时序数据和所述配送行为统计特征对虚假定位识别的影响,可以分析所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
本实施方式提供的方案中,总结了配送员在使用虚拟定位类外挂的过程中表现的行为特征,获取能够反应这些行为特征的配送行为时序数据和配送行为统计特征,对配送员在进行待识别订单时在各配送环节的服务动作完成时刻前后的配送行为时序数据以及配送行为统计类特征进行分析,识别配送员是否有虚假定位行为,这样通过对配送行为的特征分析可以做到对虚拟定位的虚假定位行为的普适性识别,全面覆盖不同手段下的虚拟定位虚假定位场景,对于配送员自行修改定位的虚假定位行为能够做到准确有效的识别。
在本公开一实施方式中,上述虚假定位识别方法中的步骤S103,即所述基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果,可以实现为以下步骤:
将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
在该实施方式中,该识别模型可以是一种深度神经网络模型,用于对配送员配送该待识别订单时配送行为时序数据和所述配送行为统计特征进行分析,得到该待识别订单的虚假定位识别结果。可以基于历史样本订单的配送行为时序数据和所述配送行为统计特征,对初始识别模型进行训练,得到预设的识别模型,然后将待识别订单在第一预设时间段内的配送行为时序数据和配送行为统计特征作为该预设的识别模型的输入,执行所述预设的识别模型就可以得到该识别模型输出的虚假定位识别结果。该虚假定位识别结果可以包括存在虚假定位行为或不存在虚假定位行为;或者该虚假定位识别结果也可以包括存在虚假定位行为的概率值,在此不做限制。
在本公开一实施方式中,上述虚假定位识别方法中,所述配送行为数据包括配送距离和配送速度,所述将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果,包括:
将各序列时刻的配送速度输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;
将各序列时刻的配送距离输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;
将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;
将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
在该实施方式中,图2B示出根据本公开一实施方式的识别模型的识别流程示意图,如图2B所示,所述预设的识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层。该第一时序特征提取层用于提取配送速度时序数据即各序列时刻的配送速度中的时序特征,该第二时序特征提取层用于提取该配送距离时序数据即各序列时刻的配送距离中的时序特征;该识别输出层用于输出虚假定位识别结果。示例的,该第一时序特征提取层和该第二时序特征提取层可以是RNN(Recurrent Neural Networks,循环神经网络)模型。
在该实施方式中,如图2B所示,该第一时序特征提取层的输入为该配送速度时序数据,输出为配送速度时序特征,该第二时序特征提取层的输入为配送距离时序数据,输出为配送距离时序特征;该识别输出层的输入为配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接成为拼接特征,输出为虚假定位识别结果。如此,在获取待识别订单在第一预设时间段内的配送行为时序数据以及该待识别订单的配送行为统计特征后,可以将所述配送速度时序数据输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;将所述配送距离时序数据输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;然后将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;最后,将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
在一种可能的实施方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM(Long Short-Term Memory,长短期记忆)网络和池化层,所述第一时序特征提取层使用最大池化(Max pooling)作为池化层,所述第二时序特征提取层使用平均池化(Mean pooling)作为池化层,所示识别输出层包括残差层。
在该实施方式中,所述第一时序特征提取层包括至少一层LSTM网络和池化层,该第二时序特征提取层也包括至少一层LSTM网络和池化层。优选的,该第一时序特征提取层可以包括两层LSTM网络,该第二时序特征提取层可以包括两层LSTM网络,该第一时序特征提取层和该第二时序特征提取层中的隐含层尺寸均为512。
在该实施方式中,一般来说,特征提取中误差主要来自两个方面:1)邻域大小受限造成的估计值方差增大;(2)卷积层参数误差造成估计均值的偏移。平均池化能减小第一种误差(邻域大小受限造成的估计值方差增大),最大池化能减小第二种误差(卷积层参数误差造成估计均值的偏移),本公开为了更准确地识别虚假定位行为,可以设置该所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层。
在该实施方式中,所述识别输出层包括残差层,该残差层包括归一化(Normalization)层和前馈神经网络(Feed forward)层,在一些其他实施中,该识别输出层还包括二分类(Binary classification)输出层,该二分类输出层输出的虚假定位识别结果是0或1,其中0表示存在虚假定位行为,1表示不存在虚假定位行为。
在本公开一实施方式中,上述虚假定位识别中,将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征,可以包括以下步骤:
将所述配送行为统计特征输入至所述权重特征提取层,得到所述权重特征提取层输出的权重特征;
将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征。
在该实施方式中,所述预设的识别模型还包括权重特征提取层,该权重特征提取层的输入是配送行为统计特征,输出为被赋予权重的配送行为统计特征也即权重特征。该权重特征提取层用于学习配送行为统计特征中各特征的权重,得到的权重值用于表示该配送行为统计特征中各特征对虚假定位识别结果的重要性,该权重特征提取层可以是决策树模型,输出的结果是该配送行为统计特征中各特征与其权重值的乘积。
在该实施方式中,可以将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征,基于该拼接特征进行虚假定位识别,对于重要性高的权重特征充分使用,同时对于不同类目的时序数据做相应的序列化模型构建来提取时序特征,保障了识别模型的识别效果。
在本公开一实施方式中,所述待识别订单包括已完成配送的订单或正在进行配送的订单。
在该实施方式中,上述虚假定位识别方法可以应用于事后场景识别,能够对已完成配送的订单的欺诈行为做到回查和治理,也可以应用于事中场景识别,能够对正在进行配送的订单的欺诈行为做到实时识别,帮助平台合理合规处置配送员的虚假定位行为,及时控制资损,改善平台的使用环境及体验。
在本公开一实施方式中,上述方法还可以包括以下步骤:
获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
基于所述样本数据,对初始识别模型进行训练,得到所述预设的识别模型。
在该实施方式中,可以将该样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征输入初始输出模型,得到初始输出模型的输出结果,该初始识别模型的输出结果与该样本订单的样本标签进行比较,得到该识别模型的输出结果的正确率,不断调整该识别模型中的参数,使该识别模型的输出结果的正确率达到预设阈值如99%,如此就训练得到该预设的识别模型。
本公开还提供了一种虚假定位识别的识别模型训练方法,图3示出根据本公开一实施方式的虚假定位识别的识别模型训练方法的流程图,如图3所示,所述训练方法包括以下步骤S301-S302:
在步骤S301中,获取样本订单的样本数据;
其中,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
在步骤S302中,基于所述样本数据,对初始识别模型进行训练,得到预设的识别模型;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段。
在该实施方式中,所述样本订单在第一预设时间段内的配送行为时序数据以及所述样本订单的配送行为统计特征的描述可以参考上述待识别订单在第一预设时间段内的配送行为时序数据以及所述待识别订单的配送行为统计特征,在此不再一一解释。
在该实施方式中,样本订单的样本标签是该样本订单的真实标签,如果该样本订单已查明真实存在虚假定位行为,则该样本订单的样本标签为所述样本订单存在虚假定位行为,如果该样本订单已查明不存在虚假定位行为,则该样本订单的样本标签为所述样本订单不存在虚假定位行为。
在该实施方式中,可以将该样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征输入初始输出模型,得到初始输出模型的输出结果,该初始识别模型的输出结果与该样本订单的样本标签进行比较,得到该识别模型的输出结果的正确率,不断调整该识别模型中的参数,使该识别模型的输出结果的正确率达到预设阈值如99%,如此就训练得到该预设的识别模型。
在一种可能的实施方式中,所述配送行为时序特征包括配送速度时序数据和配送距离时序数据,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
所述初始识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层,所述第一时序特征提取曾用于提取所述配送速度时序数据得到配送速度时序特征,所述第二时序特征提取层用于提取所述配送距离时序数据得到配送速度时序特征,所述识别输出层用于基于所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征,识别样本订单对应的虚假定位识别结果。
在该实施方式中,所述配送行为时序数据指的是第一预设时间段内各序列时刻的配送行为数据,该配送行为数据包括配送距离和/或配送速度,则该配送行为时序数据包括配送距离时序数据和/或配送速度时序数据。所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离。
在该实施方式中,在训练该初始识别模型时,将该样本订单的配送速度时序数据输入至该第一时序特征提取层,得到该第一时序特征提取层输出的配送速度时序特征,将样本订单的该配送距离时序数据输入至该第二时序特征提取层,得到该第二时序特征提取层输出的配送距离时序特征,将该配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征输入至该识别输出层,可以该识别输出层输出的识别样本订单对应的虚假定位识别结果作为该初始识别模型的输出结果,该初始识别模型的输出结果与该样本订单的样本标签进行比较,得到该识别模型的输出结果的正确率,不断调整该识别模型中第一时序特征提取层、第二时序特征提取层和识别输出层中的参数,使该识别模型的输出结果的正确率达到预设阈值如99%,如此就训练得到该预设的识别模型。
在本公开一实施方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层;训练所述识别模型时的损失函数包括交叉熵,优化器包括自适应矩估计。
在该实施方式中,所述第一时序特征提取层包括至少一层LSTM网络和池化层,该第二时序特征提取层也包括至少一层LSTM网络和池化层。优选的,该第一时序特征提取层可以包括两层LSTM网络,该第二时序特征提取层可以包括两层LSTM网络,该第一时序特征提取层和该第二时序特征提取层中的隐含层尺寸均为512。
在该实施方式中,一般来说,特征提取中误差主要来自两个方面:1)邻域大小受限造成的估计值方差增大;(2)卷积层参数误差造成估计均值的偏移。平均池化能减小第一种误差(邻域大小受限造成的估计值方差增大),最大池化能减小第二种误差(卷积层参数误差造成估计均值的偏移),本公开为了更准确地识别虚假定位行为,可以设置该所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层。
在该实施方式中,所述识别输出层包括残差层,该残差层的数量为2,包括归一化层和前馈神经网络层,在一些其他实施中,该识别输出层还包括二分类输出层,该二分类输出层输出的虚假定位识别结果是0或1,其中0表示存在虚假定位行为,1表示不存在虚假定位行为。
在该实施方式中,训练该识别模型时使用的损失函数可以为BCELoss(交叉熵),主要用来创建衡量目标和输出之间的二进制交叉熵的标准。该优化器可以为Adam(AdaptiveMoment Estimation,自适应矩估计),可以利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率,Adam的优点主要在于经过偏置校正后,每一次迭代学习率都有个确定范围,使得参数比较平稳。
在本公开一实施方式中,所述初始识别模型包括权重特征提取层,所述权重特征提取层用于提取配送行为统计特征中的权重特征。
在该实施方式中,在训练该初始识别模型时,会将样本订单的配送行为统计特征输入值该权重特征提取层,得到该权重特征提取层输出的权重特征,将该配送速度时序特征、配送距离时序特征和所述权重特征拼接的拼接特征输入至该识别输出层,可以将该识别输出层输出的识别样本订单对应的虚假定位识别结果作为该初始识别模型的输出结果,该初始识别模型的输出结果与该样本订单的样本标签进行比较,得到该识别模型的输出结果的正确率,不断调整该识别模型中第一时序特征提取层、第二时序特征提取层、权重特征提取层、识别输出层中的参数,使该识别模型的输出结果的正确率达到预设阈值,如此就训练得到该预设的识别模型。
示例的,假设该初始识别模型的第一时序特征提取层包括两层LSTM网络,该第二时序特征提取层包括两层LSTM网络,该第一时序特征提取层和该第二时序特征提取层中的隐含层尺寸均为512;所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层,损失函数均选择BCELoss(交叉熵),优化器为Adam(自适应矩估计),残差层数量为2,使用上述的样本数据可以训练得到虚假定位识别的识别模型,对该识别模型进行评估可以得到以下评估值:AUC(Area Under Curve,ROC曲线下的面积):0.9877,Max F1(模型精确率和召回率的一种加权平均):0.9378,Precision(精度):0.9799,Recall(召回率):0.8991。从该评估值可以看出训练得到的识别模型对虚拟定位虚假定位行为的场景有较强的识别能力。
图3所示及相关实施方式中涉及的技术术语和技术特征与图1-图2B所示及相关实施方式中提及的技术术语和技术特征相同或相似,对于图3所示及相关实施方式中涉及的技术术语和技术特征的解释和说明可参考上述对于图1-图2B所示及相关实施方式的解释的说明,此处不再赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。
图4A示出根据本公开一实施方式的虚假定位识别装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4A所示,所述虚假定位识别装置包括:
第一获取模块401,被配置为获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
第一确定模块402,被配置为在第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值大于预设阈值时,确定所述待识别订单为虚假定位订单,其中,所述第一序列时刻与所述第二序列时刻为两个相邻的序列时刻。
图4A所示及相关实施方式中涉及的技术术语和技术特征与图1-图3所示及相关实施方式中提及的技术术语和技术特征相同或相似,对于图4A所示及相关实施方式中涉及的技术术语和技术特征的解释和说明可参考上述对于图1-图3所示及相关实施方式的解释的说明,此处不再赘述。
图4B示出根据本公开一实施方式的虚假定位识别装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4B所示,所述虚假定位识别装置包括:
第二获取模块403,被配置为获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
第三获取模块404,被配置为获取所述待识别订单的配送行为统计特征,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段;
第二确定模块405,被配置为基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
在一种可能的实施方式中,所述第二确定模块被配置为:
将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
在一种可能的实施方式中,所述配送行为数据包括配送距离和配送速度,所述预设的识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层,所述第二确定模块被配置为:
将各序列时刻的配送速度输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;
将各序列时刻的配送距离输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;
将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;
将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
在一种可能的实施方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层。
在一种可能的实施方式中,所述预设的识别模型还包括权重特征提取层,所述第二确定模块中将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征的部分被配置为:
将所述配送行为统计特征输入至所述权重特征提取层,得到所述权重特征提取层输出的权重特征;
将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征。
在一种可能的实施方式中,所述当前已完成配送行为的统计特征包括以下至少一种:所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。
在一种可能的实施方式中,所述待识别订单包括已完成配送的订单或正在进行配送的订单。
在一种可能的实施方式中,所述装置还包括:
第四获取模块,被配置为获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
第一训练模块,被配置为基于所述样本数据,对初始识别模型进行训练,得到所述预设的识别模型。
图4B所示及相关实施方式中涉及的技术术语和技术特征与图1-图3所示及相关实施方式中提及的技术术语和技术特征相同或相似,对于图4B所示及相关实施方式中涉及的技术术语和技术特征的解释和说明可参考上述对于图1-图3所示及相关实施方式的解释的说明,此处不再赘述。
图5示出根据本公开一实施方式的虚假定位识别模型训练装置的结构框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图5所示,所述虚假定位识别模型训练装置包括:
第五获取模块501,被配置为获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
第二训练模块502,被配置为基于所述样本数据,对初始识别模型进行训练,得到预设的识别模型;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段。
在一种可能的实现方式中,所述配送行为时序特征包括配送速度时序数据和配送距离时序数据,所述配送距离包括定位位置与所述已完成配送环节的目标点的距离;
所述初始识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层;所述第一时序特征提取层用于提取所述配送速度时序数据得到配送速度时序特征;所述第二时序特征提取层用于提取所述配送距离时序数据得到配送速度时序特征;所述识别输出层用于基于所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征,识别样本订单对应的虚假定位识别结果。
在一种可能的实现方式中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层;
训练所述识别模型时的损失函数包括交叉熵,优化器包括自适应矩估计。
在一种可能的实现方式中,所述初始识别模型还包括权重特征提取层,所述权重特征提取层用于提取配送行为统计特征中的权重特征。
图5所示及相关实施方式中涉及的技术术语和技术特征与图1-图3所示及相关实施方式中提及的技术术语和技术特征相同或相似,对于图5所示及相关实施方式中涉及的技术术语和技术特征的解释和说明可参考上述对于图1-图3所示及相关实施方式的解释的说明,此处不再赘述。
本公开还公开了一种电子设备,图6示出根据本公开一实施方式的电子设备的结构框图,如图6所示,所述电子设备600包括存储器601和处理器602;其中,
所述存储器601用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器602执行以实现上述方法步骤。
图7示出适于用来实现根据本公开实施例的方法的计算机系统的结构示意图。
如图7所示,计算机系统700包括处理单元701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行上述实施方式中的各种处理。在RAM703中,还存储有计算机系统700操作所需的各种程序和数据。处理单元701、ROM702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。其中,所述处理单元701可实现为CPU、GPU、TPU、FPGA、NPU等处理单元。
特别地,根据本公开的实施方式,上文描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行所述路线规划方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。
附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (28)
1.一种虚假定位识别方法,包括:
获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
在第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值大于预设阈值时,确定所述待识别订单为虚假定位订单,其中,所述第一序列时刻与所述第二序列时刻为两个相邻的序列时刻。
2.一种虚假定位识别方法,包括:
获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
获取所述待识别订单的配送行为统计特征,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段;
基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
3.根据权利要求2所述的方法,其中,所述基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果,包括:
将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
4.根据权利要求3所述的方法,其中,所述配送行为数据包括配送距离和配送速度,所述预设的识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层,所述将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果,包括:
将各序列时刻的配送速度输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;
将各序列时刻的配送距离输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;
将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;
将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
5.根据权利要求4所述的方法,其中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层。
6.根据权利要求4所述的方法,其中,所述预设的识别模型还包括权重特征提取层,将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征,包括:
将所述配送行为统计特征输入至所述权重特征提取层,得到所述权重特征提取层输出的权重特征;
将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征。
7.根据权利要求2至6任一项所述的方法,其中,所述当前已完成配送行为的统计特征包括以下至少一种:所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。
8.根据权利要求2所述的方法,其中,所述待识别订单包括已完成配送的订单或正在进行配送的订单。
9.根据权利要求3所述的方法,其中,所述方法还包括:
获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
基于所述样本数据,对初始识别模型进行训练,得到所述预设的识别模型。
10.一种虚假定位识别模型训练方法,其中,包括:
获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
基于所述样本数据,对初始识别模型进行训练,得到预设的识别模型;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段。
11.根据权利要求10所述的方法,其中,
所述配送行为时序特征包括配送速度时序数据和配送距离时序数据,配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
所述初始识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层;所述第一时序特征提取层用于提取所述配送速度时序数据得到配送速度时序特征;所述第二时序特征提取层用于提取所述配送距离时序数据得到配送速度时序特征;所述识别输出层用于基于所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征,识别样本订单对应的虚假定位识别结果。
12.根据权利要求11所述的方法,其中,
所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层;
训练所述识别模型时的损失函数包括交叉熵,优化器包括自适应矩估计。
13.根据权利要求11所述的方法,其中,所述初始识别模型包括权重特征提取层,所述权重特征提取层用于提取配送行为统计特征中的权重特征。
14.一种虚假定位识别装置,包括:
第一获取模块,被配置为获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
第一确定模块,被配置为在第一序列时刻的配送行为数据与第二序列时刻的配送行为数据之间的差值大于预设阈值时,确定所述待识别订单为虚假定位订单,其中,所述第一序列时刻与所述第二序列时刻为两个相邻的序列时刻。
15.一种虚假定位识别装置,包括:
第二获取模块,被配置为获取待识别订单在第一预设时间段内各序列时刻的配送行为数据作为配送行为时序数据,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为数据包括配送距离和/或配送速度,所述配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
第三获取模块,被配置为获取所述待识别订单的配送行为统计特征,所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段;
第二确定模块,被配置为基于所述配送行为时序数据和所述配送行为统计特征,确定所述待识别订单对应的虚假定位识别结果。
16.根据权利要求15所述的装置,其中,所述第二确定模块被配置为:
将所述配送行为时序数据和所述配送行为统计特征输入预设的识别模型,执行所述识别模型,得到所述待识别订单对应的虚假定位识别结果。
17.根据权利要求16所述的装置,其中,所述配送行为数据包括配送距离和配送速度,所述预设的识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层,所述第二确定模块被配置为:
将各序列时刻的配送速度输入至所述第一时序特征提取层,得到所述第一时序特征提取层输出的配送速度时序特征;
将各序列时刻的配送距离输入至所述第二时序特征提取层,得到所述第二时序特征提取层输出的配送距离时序特征;
将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征;
将所述拼接特征输入至所述识别输出层,得到所述识别输出层输出的所述待识别订单对应的虚假定位识别结果。
18.根据权利要求17所述的装置,其中,所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层。
19.根据权利要求17所述的装置,其中,所述预设的识别模型还包括权重特征提取层,所述第二确定模块中将所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接为拼接特征的部分被配置为:
将所述配送行为统计特征输入至所述权重特征提取层,得到所述权重特征提取层输出的权重特征;
将所述配送速度时序特征、配送距离时序特征和所述权重特征拼接为拼接特征。
20.根据权利要求15至19任一项所述的装置,其中,所述当前已完成配送行为的统计特征包括以下至少一种:所述待识别订单在当前已进行的配送过程中的配送速度峰值、配送速度平均值、定位点总数量、定位点聚合后的数量、配送总时长、配送总距离。
21.根据权利要求15所述的装置,其中,所述待识别订单包括已完成配送的订单或正在进行配送的订单。
22.根据权利要求16所述的装置,其中,所述装置还包括:
第四获取模块,被配置为获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
第一训练模块,被配置为基于所述样本数据,对初始识别模型进行训练,得到所述预设的识别模型。
23.一种虚假定位识别模型训练装置,其中,包括:
第五获取模块,被配置为获取样本订单的样本数据,所述样本数据包括样本订单在第一预设时间段内的配送行为时序数据,所述样本订单的配送行为统计特征,所述样本订单的样本标签,所述样本标签包括所述样本订单存在虚假定位行为或不存在虚假定位行为;
第二训练模块,被配置为基于所述样本数据,对初始识别模型进行训练,得到预设的识别模型;
其中,所述第一预设时间段包括目标时刻之前的第一时刻与所述目标时刻之后的第二时刻之间的时间段,所述目标时刻包括已完成配送环节的服务动作完成时刻;所述配送行为统计特征包括以下至少一种特征:当前已完成配送行为的统计特征、所述目标时刻之后预设时长内定位位置距离所述已完成配送环节的目标点的极值距离、第二预设时间段内的完单量、定位设备的定位置信度;其中,所述第二预设时间段包括待识别订单完成时刻之前的第三时刻与其之后的第四时刻之间的时间段或者当前时刻之前的时间段。
24.根据权利要求23所述的装置,其中,
所述配送行为时序特征包括配送速度时序数据和配送距离时序数据,配送距离包括当前序列时刻所在定位位置与目标时刻所在定位位置之间的距离;
所述初始识别模型包括第一时序特征提取层、第二时序特征提取层和识别输出层;所述第一时序特征提取层用于提取所述配送速度时序数据得到配送速度时序特征;所述第二时序特征提取层用于提取所述配送距离时序数据得到配送速度时序特征;所述识别输出层用于基于所述配送速度时序特征、配送距离时序特征和所述配送行为统计特征拼接的拼接特征,识别样本订单对应的虚假定位识别结果。
25.根据权利要求24所述的装置,其中,
所述第一时序特征提取层和所述第二时序特征提取层包括长短时记忆LSTM网络和池化层,所述第一时序特征提取层使用最大池化作为池化层,所述第二时序特征提取层使用平均池化作为池化层;所述识别输出层包括残差层;
训练所述识别模型时的损失函数包括交叉熵,优化器包括自适应矩估计。
26.根据权利要求24所述的装置,其中,所述初始识别模型还包括权重特征提取层,所述权重特征提取层用于提取配送行为统计特征中的权重特征。
27.一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令被所述处理器执行以实现权利要求1至13任一项所述的方法步骤。
28.一种可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现权利要求1至13任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210930297.6A CN115018596B (zh) | 2022-08-03 | 2022-08-03 | 虚假定位识别及模型训练方法、装置、设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210930297.6A CN115018596B (zh) | 2022-08-03 | 2022-08-03 | 虚假定位识别及模型训练方法、装置、设备、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115018596A CN115018596A (zh) | 2022-09-06 |
CN115018596B true CN115018596B (zh) | 2022-11-15 |
Family
ID=83066118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210930297.6A Active CN115018596B (zh) | 2022-08-03 | 2022-08-03 | 虚假定位识别及模型训练方法、装置、设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115018596B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115374713B (zh) * | 2022-10-25 | 2022-12-27 | 成都新希望金融信息有限公司 | 一种gps真伪识别模型的训练方法 |
CN116429119B (zh) * | 2023-06-15 | 2023-08-22 | 交通运输部水运科学研究所 | 一种基于大数据的船舶虚假定位信息的识别方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007124031A (ja) * | 2005-10-25 | 2007-05-17 | Toshiba Corp | 時刻及び位置認証装置、方法及びプログラム |
JP2012171733A (ja) * | 2011-02-21 | 2012-09-10 | Honko Mfg Co Ltd | 物品配送システム |
CN109685404A (zh) * | 2017-10-18 | 2019-04-26 | 北京京东尚科信息技术有限公司 | 监控报警系统 |
CN112601173A (zh) * | 2020-11-30 | 2021-04-02 | 西安电子科技大学 | 5g定位真值检测与攻击溯源方法、系统、设备及应用 |
CN113077114A (zh) * | 2020-01-03 | 2021-07-06 | 北京三快在线科技有限公司 | 配送员操作的监测方法、装置、存储介质及电子设备 |
CN113132906A (zh) * | 2019-12-26 | 2021-07-16 | 北京三快在线科技有限公司 | 虚拟定位识别方法、装置、存储介质及电子设备 |
CN114581167A (zh) * | 2020-12-02 | 2022-06-03 | 北京三快在线科技有限公司 | 一种服务异常的识别方法、装置、存储介质及电子设备 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120316990A1 (en) * | 2011-06-09 | 2012-12-13 | Google Inc. | Evaluating Merchant Trustworthiness |
CN106920109A (zh) * | 2017-02-21 | 2017-07-04 | 福建师范大学福清分校 | 用于电子商务虚假交易的识别方法、系统及电子商务系统 |
CN110930081A (zh) * | 2018-09-19 | 2020-03-27 | 阿里巴巴集团控股有限公司 | 订单配送信息处理方法、装置及电子设备 |
CN110288108A (zh) * | 2019-06-11 | 2019-09-27 | 北京三快在线科技有限公司 | 检测虚假完成订单行为的方法、装置、设备及存储介质 |
CN114612029A (zh) * | 2020-12-08 | 2022-06-10 | 顺丰科技有限公司 | 风险运单数据识别方法、装置、计算机设备和存储介质 |
CN113947355A (zh) * | 2021-10-19 | 2022-01-18 | 拉扎斯网络科技(上海)有限公司 | 报备信息的处理方法、装置及电子设备 |
CN114298013A (zh) * | 2021-12-29 | 2022-04-08 | 江苏苏宁银行股份有限公司 | 一种基于深度学习的虚假收货地址预测方法和装置 |
-
2022
- 2022-08-03 CN CN202210930297.6A patent/CN115018596B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007124031A (ja) * | 2005-10-25 | 2007-05-17 | Toshiba Corp | 時刻及び位置認証装置、方法及びプログラム |
JP2012171733A (ja) * | 2011-02-21 | 2012-09-10 | Honko Mfg Co Ltd | 物品配送システム |
CN109685404A (zh) * | 2017-10-18 | 2019-04-26 | 北京京东尚科信息技术有限公司 | 监控报警系统 |
CN113132906A (zh) * | 2019-12-26 | 2021-07-16 | 北京三快在线科技有限公司 | 虚拟定位识别方法、装置、存储介质及电子设备 |
CN113077114A (zh) * | 2020-01-03 | 2021-07-06 | 北京三快在线科技有限公司 | 配送员操作的监测方法、装置、存储介质及电子设备 |
CN112601173A (zh) * | 2020-11-30 | 2021-04-02 | 西安电子科技大学 | 5g定位真值检测与攻击溯源方法、系统、设备及应用 |
CN114581167A (zh) * | 2020-12-02 | 2022-06-03 | 北京三快在线科技有限公司 | 一种服务异常的识别方法、装置、存储介质及电子设备 |
Non-Patent Citations (2)
Title |
---|
基于位置服务中时空关联的隐私保护方案;李维皓等;《通信学报》;20180525(第05期);全文 * |
数智赋能下的即时物流发展趋势探究;刘如意;《物流科技》;20200410(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115018596A (zh) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115018596B (zh) | 虚假定位识别及模型训练方法、装置、设备、介质 | |
CN109344908A (zh) | 用于生成模型的方法和装置 | |
AU2013364041B2 (en) | Instance weighted learning machine learning model | |
CN107330731B (zh) | 一种识别广告位点击异常的方法和装置 | |
CN107845016B (zh) | 信息输出方法和装置 | |
CN107067274A (zh) | 一个基于混合学习模型的dsp实时竞价广告系统 | |
CN110674979A (zh) | 风险预测模型的训练方法、预测方法及装置、介质和设备 | |
CN112346936A (zh) | 应用故障根因定位方法及系统 | |
CN110378699A (zh) | 一种交易反欺诈方法、装置及系统 | |
CN113642431A (zh) | 目标检测模型的训练方法及装置、电子设备和存储介质 | |
CN109993544A (zh) | 数据处理方法、系统、计算机系统及计算机可读存储介质 | |
CN106934686A (zh) | 一种自助下单的方法及系统 | |
EP3370164A1 (en) | Artificial intelligence digital agent | |
CN114091960A (zh) | 业务智能派单匹配方法、装置、服务器及存储介质 | |
CN112307864A (zh) | 用于确定目标对象的方法、装置、人机交互系统 | |
US8494999B2 (en) | Sensor based truth maintenance method and system | |
CN112233428A (zh) | 车流量预测方法、装置、存储介质及设备 | |
CN111833115B (zh) | 一种操作识别方法、装置及存储介质和服务器 | |
CN111126264A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN109088793B (zh) | 用于检测网络故障的方法和装置 | |
CN110363611A (zh) | 网约车用户匹配方法、装置、服务器及存储介质 | |
CN111667181B (zh) | 任务处理方法、装置、电子设备及计算机可读存储介质 | |
CN111325255B (zh) | 特定人群圈定方法、装置、电子设备及存储介质 | |
US20230177042A1 (en) | Real-time anomaly determination using integrated probabilistic system | |
CN111757272A (zh) | 地铁拥堵程度的预测方法、模型训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |