CN111860561A

CN111860561A - 网约车的异常停留行为识别方法、装置、设备及存储介质

Info

Publication number: CN111860561A
Application number: CN201911421142.4A
Authority: CN
Inventors: 张腾剑; 陈奥
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2019-12-31
Filing date: 2019-12-31
Publication date: 2020-10-30
Anticipated expiration: 2039-12-31
Also published as: WO2021135653A1; CN111860561B

Abstract

本发明实施例提供一种网约车的异常停留行为识别方法、装置、设备及存储介质，通过采集网约车发生停留时的实时数据；从数据库中获取第一历史数据集合和第二历史数据集合；第一历史数据集合包括至少一个司机在与实时数据相同服务状态下的历史停留时长，第二历史数据集合包括至少一个司机在与实时数据相同时间段以及相同区域内的历史停留时长；根据实时数据、第一历史数据集合、第二历史数据集合及预设模型识别网约车当前是否出现异常停留行为。利用海量网约车出行的多维度历史数据及预设模型，考虑停留时长、位置、服务状态等多维度特征信息，可实时准确识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力，保障司机和乘客的安全。

Description

网约车的异常停留行为识别方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种网约车的异常停留行为识别方法、装置、设备及存储介质。

背景技术

对于网约车平台而言，安全是平台可持续发展的保障。而在网约车行程中的异常停留是所有安全场景中最为常见和占比最大的场景，绝大多数的异常停留案例是因为司机和乘客之间发生冲突，或者发生交通事故导致伤亡。

现有技术中判断网约车是否存在异常停留行为，通常需要司机、乘客、警察主动上报到网约车平台，或者通过实时采集网约车停留时长并与固定的停留时长阈值比较来对异常停留进行识别。

通过司机、乘客、警察主动上报到网约车平台，对于网约车异常停留行为的识别存在滞后性，若发生重大案例容易错过最佳救助时机，并且对于未主动上报的异常停留情况没有感知，导致召回率不高；而通过与固定的停留时长阈值比较的异常停留行为的识别的方法准确率不高，非常容易出现错误判定的情况，比如部分城市路口的红灯时间较长，超出固定的停留时长阈值则误判为异常停留，容易对司机和乘客造成困扰。

发明内容

本发明实施例提供一种网约车的异常停留行为识别方法、装置、设备及存储介质，以实时、准确的识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

本发明实施例的第一方面是提供一种网约车的异常停留行为识别方法，包括：

采集网约车发生停留时的实时数据，所述实时数据包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息；

从数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述实时数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述实时数据相同时间段以及相同区域内的历史停留时长；

根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为。

本发明实施例的第二方面是提供一种网约车的异常停留行为识别模型训练方法，包括：

从数据库获取训练数据集合，所述训练数据包括属于异常停留行为的正例训练数据和不属于异常停留行为的负例训练数据；

对于每一训练数据，提取所述训练数据的停留位置、停留时长、司机服务状态以及预定特征信息；

从所述数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述训练数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述训练数据相同时间段以及相同区域内的历史停留时长；

根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，以使预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。

本发明实施例的第三方面是提供一种网约车的异常停留行为识别装置，包括：

采集模块，用于采集网约车发生停留时的实时数据，所述实时数据包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息；

获取模块，用于从数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述实时数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述实时数据相同时间段以及相同区域内的历史停留时长；

处理模块，用于根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为。

本发明实施例的第四方面是提供一种网约车的异常停留行为识别模型训练装置，包括：

获取模块，用于从数据库获取训练数据集合，所述训练数据包括属于异常停留行为的正例训练数据和不属于异常停留行为的负例训练数据；

特征提取模块，用于对于每一训练数据，提取所述训练数据的停留位置、停留时长、司机服务状态以及预定特征信息；

所述获取模块还用于，从所述数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述训练数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述训练数据相同时间段以及相同区域内的历史停留时长；

训练模块，用于根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，以使预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。

本发明实施例的第五方面是提供一种网约车的异常停留行为识别设备，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如第一方面所述的方法。

本发明实施例的第六方面是提供一种网约车的异常停留行为识别模型训练设备，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如第二方面所述的方法。

本发明实施例的第七方面是提供一种计算机可读存储介质，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如第一方面所述的方法。

本发明实施例的第八方面是提供一种计算机可读存储介质，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如第二方面所述的方法。

本发明实施例提供的网约车的异常停留行为识别方法、装置、设备及存储介质，利用海量网约车出行的多维度历史数据以及预设模型，考虑到停留时长、位置、服务状态等多维度的特征信息，可实时、准确的识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的网约车的异常停留行为识别方法的系统架构图；

图2为本发明实施例提供的网约车的异常停留行为识别方法流程图；

图3为本发明另一实施例提供的网约车的异常停留行为识别方法流程图；

图4为本发明另一实施例提供的网约车的异常停留行为识别模型训练方法流程图；

图5为本发明实施例提供的网约车的异常停留行为识别装置的结构图；

图6为本发明实施例提供的网约车的异常停留行为识别模型训练装置的结构图；

图7为本发明实施例提供的网约车的异常停留行为识别设备的结构图；

图8为本发明实施例提供的网约车的异常停留行为识别模型训练设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了解决现有技术中通过司机、乘客、警察主动上报到网约车平台、再对于网约车异常停留行为的识别方法存在的实时性和召回率不高的问题，以及通过与固定的停留时长阈值比较的异常停留行为的识别方法存在的准确率不高的问题，本发明实施例提供一种网约车的异常停留行为识别方法，可以通过采集网约车发生停留时的实时数据，包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息等多维度的特征信息，并结合数据库中的多维度的相关历史数据，采用预先训练得到的智能识别模型，可以实时、准确的识别出网约车当前是否出现异常停留行为，可避免采用固定的停留时长阈值时导致的误判，提高了实时性、准确率和召回率，从而提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

本发明实施例提供的网约车的异常停留行为识别方法，可以适用于图1所示的通信系统。如图1所示，所述通信系统包括网约车平台的服务器10、数据库12、以及与服务器通信连接的网约车终端11(包括车载终端、司机终端或乘客终端)。其中服务器10可以是一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心，可以从网约车终端11采集网约车的实时数据并存储到数据库12，也可从数据库12中获取历史数据。在网约车的异常停留行为识别过程中，服务器10可根据采集到的网约车发生停留时的实时数据，并根据实时数据从数据库12中获取相关历史数据，根据实时数据、历史数据以及预定模型，可识别出所述网约车当前是否出现异常停留行为。

下面结合具体的实施例对网约车的异常停留行为识别过程进行详细的描述。

图2为本发明实施例提供的网约车的异常停留行为识别方法流程图。本实施例提供了一种网约车的异常停留行为识别方法，执行主体可以为网约车平台的服务器，该方法具体步骤如下：

S101、采集网约车发生停留时的实时数据，所述实时数据包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息。

在本实施例中，为了提高网约车司机和乘客的安全，网约车平台的服务器可采集网约车发生停留时的实时数据，具体的，可从网约车终端(包括车载终端、司机终端或乘客终端)将一些实时数据上传到网约车平台的服务器，具体的，该些实时数据可包括但不限于位置信息、时间信息、司机及乘客的一些状态信息和交互信息等。更具体的，可获取网约车的GPS数据，包括实时速度数据，根据实时速度数据可以判断网约车是否停留。

当某一网约车发生停留时，可从上述实时数据中获取其当前停留位置、当前停留时长、司机服务状态以及预定特征信息。其中司机服务状态包括处于服务状态(如接驾状态、到达状态、服务状态)或处于非服务状态(如听单状态、收车状态)；预定特征信息包括但不限于乘客的支付行为、乘客对司机的评价、是否处于发单热点区域等等。

S102、从数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述实时数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述实时数据相同时间段以及相同区域内的历史停留时长。

在本实施例中，数据库中存储有网约车平台维护的所有网约车的历史数据。为了识别网约车当期是否出现异常停留行为，可从数据库中获取多个维度的历史数据，从而从多个维度进行识别异常停留，提高准确率和召回率。本实施例中第一历史数据集合主要考虑司机服务状态的维度，而第二历史数据集合主要考虑时间和空间的维度。此外，本实施例中第一历史数据集合和第二历史数据集合可以从数据库中某一段时间内(例如近一个月内)的一个司机或多个司机(如满足某些要求的司机或所有司机)历史数据的范围内中获取对应的历史停留时长。

S103、根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为。

在本实施例中，可根据预设模型以及获取到的各种数据，实现对网约车的异常停留行为的识别，其中预设模型可以通过数据库中的历史数据进行训练。其中预设模型可以为任意的能够进行异常值检测的模型。

可选的，本实施例中的预设模型为融合模型，可包括第一模型、第二模型和第三模型，从不同的维度逐步判断所述网约车当前是否出现异常停留行为，具体的，如图3所示，S103的步骤可如下：

S201、将所述当前停留时长以及所述第一历史数据集合输入到第一模型中，判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长。

在本实施例中，第一模型可以基于第一历史数据集合初步判断当前停留时长是否为异常停留时长，也即判断当前停留时长相对于第一历史数据集合是否为可能的异常值(outlier)，其中第一模型可以为现有的任意异常值检测方法，例如基于聚类的方法、孤立森林、统计学方法、基于分布的Tukey Method方法等。

在一种可选实施例中，第一模型为基于分布的Tukey Method模型，该模型通常可以基于数据集的四分位数以及用于表征异常程度的系数k，可计算出数据集中的最小估计值和最大估计值，超出最小估计值和最大估计值范围的数值即可能为异常值，其中用于表征异常程度的系数k越大，超出最小估计值和最大估计值范围的数值的异常程度越大，例如k＝1.5时上述的异常程度为中度异常，k＝3时上述的异常程度为极度异常。本实施例中的Tukey Method模型可仅获取第一历史数据集合的最大估计值，若当前停留时长大于最大估计值，则确定所述当前停留时长为异常停留时长。具体的，可将第一历史数据集合中的数据按照数据从小到大排序，然后取排序中位于第25％的数据记为Q1，位于第50％的数据记为Q2，位于第75％的数据记为Q3，然后计算第一历史数据集合的最大估计值＝Q3+k(Q3-Q1)。其中用于表征异常程度的系数k采用预设系数，具体取值可预先通过训练过程确定。

进一步的，所述第一历史数据集合包括第一子集和第二子集；所述第一子集包括当前司机在与所述实时数据相同服务状态下历史停留时长；所述第二子集包括所述数据库中所有司机在与所述实时数据相同服务状态以及相同区域内的历史停留时长；进一步的，S201所述的判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长，具体包括：

通过所述Tukey Method模型以所述预设系数获取所述第一子集的第一最大估计值、以及所述第二子集的第二最大估计值；

若所述当前停留时长大于所述第一最大估计值或所述第二最大估计值，则确定所述当前停留时长为异常停留时长。

在本实施例中，通过第一子集，可以判断当前停留时长相对于当前司机在同样状态下的历史停留时长是否是异常值，可考虑到当前司机在同样状态下的个人习惯；通过第二子集，可以判断当前停留时长相对于所有司机在相同服务状态以及相同区域内的历史停留时长是否是异常值，可考虑到不同司机在相同服务状态以及相同区域内进行停留的通常状况。本实施例在考虑司机服务状态维度的同时，兼顾了当前司机的个人习惯以及当前停留位置所属区域的状况，可以更加准确的判断当前停留时长是否为异常停留时长。可选的，本实施例中当前停留位置所属区域采用经纬度的geohash中的geo6区域(6位编码单位网格，覆盖面积约0.73平方千米)。

S202、若确定所述当前停留时长为异常停留时长，则将所述预定特征信息输入第二模型中，判断所述预定特征信息是否满足所述第二模型的预设规则。

在本实施例中，第二模型为基于统计的规则模型，可预先设定一些规则，来过滤一些虽然当前停留时长属于异常停留时长、但不属于异常停留行为的情况，例如某些情况发生停留但乘客主动支付、主动给出好评，或者当前停留位置为一些发单热点区域也可能存在长时间停留、但不属于异常停留行为，也即出现这些特征时存在异常停留行为的概率很低，通过第二模型可大规模减少数据量，减少计算资源的消耗。第二的预设规则可预先通过训练来确定。

本实施例中可将实时数据中的预定特征信息如乘客的支付行为、乘客对司机的评价、发单热点区域中的至少一个输入到第二模型中，判断所述乘客的支付行为是否为主动支付；和/或判断所述乘客对司机的评价是否为主动好评；和/或判断所述当前停留位置是否处于所述发单热点区域；若上述判断中至少一项判断结果为是，则确定预定特征信息满足第二模型的预设规则，从而确定网约车当前未出现异常停留行为；若上述判断结果均为否，则确定所述预定特征信息不满足所述第二模型的预设规则，可进行下一步的判断。

S203、若确定所述预定特征信息不满足所述第二模型的预设规则，则将所述当前停留时长以及所述第二历史数据集合输入到第三模型中，获取所述当前停留时长的离群程度因子，若所述离群程度因子大于预设阈值，则确定所述网约车当前出现异常停留行为。

在本实施例中，通过第三模型对当前停留时长进行最后的判断，获取当前停留时长相对于第二历史数据集合的离群程度因子，以判断当前停留时长与数据库中各司机在相同时间段以及相同区域内不同状态下的历史停留时长之间存在差异的大小，若离群程度因子大于预设阈值，则说明差异较大，从而可以确定网约车当前出现异常停留行为。可选的，为了增加第二历史数据集合数据数量，提高计算离群程度因子的准确性，本实施例中当前停留位置所述区域采用经纬度的geohash中的geo5区域(5位编码单位网格，覆盖面积约24平方千米)。

进一步的，本实施例中的第三模型为基于密度的LOF(Local Outlier Factor)模型；通过所述LOF模型，根据所述当前停留时长以及所述第二历史数据集合，获取所述当前停留时长的离群程度因子LOF值，LOF值用于反映当前停留时长的邻域点的局部可达密度与当前停留时长的局部可达密度之比的平均数，当LOF值越大于1，则说明当前停留时长的局部可达密度越小于其邻域点的局部可达密度，当前停留时长越有可能为异常点，因此判断当前停留时长的离群程度因子LOF值大于预设阈值，可以确定网约车当前出现异常停留行为。其中预设阈值可预先通过训练获取。

在上述实施例的基础上，由于LOF模型需要一定的数据量，也即需要第二数据集中样本数不少于一定的预设数量，若第二数据集中样本数少于预设数量，则LOF模型的准确性相对较差，可以直接在第二模型确定所述预定特征信息不满足所述第二模型的预设规则时直接确定所述网约车当前出现异常停留行为，而不需要再通过LOF模型计算当前停留时长的离群程度因子LOF值。

其中，预设数量可通过如下过程获取：统计所述数据库中所有司机在与所述实时数据相同时间段内的历史停留数据的数量，并以所述历史停留数据的数量乘以预设百分比(例如25％)后得到的结果作为所述预设数量。

本实施例中获取不同维度条件下的停留次数，也即通过统计数据库中所有司机在各geo5区域中、相同时间段内的历史停留的总次数(也即历史停留数据的数量)，通过乘以预设百分比得到所述预设数量。当第二数据集中样本数不少于该预设数量时才采用LOF模型进行后续计算过程。本实施例中预设百分比可通过预先训练获取。

在上述任一实施例的基础上，在第一模型中，若确定所述当前停留时长不为异常停留时长，则确定所述网约车当前未出现异常停留行为；或者

在第二模型中，若确定所述预定特征信息满足所述第二模型的预设规则，则确定所述网约车当前未出现异常停留行为；或者

在第三模型中，若确定所述离群程度因子小于或等于预设阈值，则确定所述网约车当前未出现异常停留行为。

需要说明的，若某一模型中确定网约车当前未出现异常停留行为，则不需要在进行后续模型的处理。

此外，若识别网约车当前出现异常停留行为，则可进行人为干涉，例如由客服去了解相关情况，及时解决问题，提高司机和乘客的安全。

本实施例提供的网约车的异常停留行为识别方法，通过采集网约车发生停留时的实时数据，所述实时数据包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息；从数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述实时数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述实时数据相同时间段以及相同区域内的历史停留时长；根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为。本实施例利用海量网约车出行的多维度历史数据以及预设模型，考虑到停留时长、位置、服务状态等多维度的特征信息，可实时、准确的识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

图4为本发明实施例提供的网约车的异常停留行为识别模型训练方法流程图。本实施例提供了一个网约车的异常停留行为识别模型训练方法，该方法具体步骤如下：

S301、从数据库获取训练数据集合，所述训练数据包括属于异常停留行为的正例训练数据和不属于异常停留行为的负例训练数据。

在本实施例中，为了对上述的预设模型进行训练，可以从数据库获取训练数据集合，其中正例训练数据可以包括在不同场景下网约车发生异常停留行为的数据，例如，仅在服务状态下发生异常停留(司机在乘客上车后或乘客即将下车后与乘客发生冲突，未结束订单)，仅在非服务状态下发生异常停留(司机在行驶过程中结束订单、在非服务状态停留，与乘客发生冲突)，在服务状态和非服务状态下发生异常停留(司机在服务中停留，结束订单，并开始与乘客发生冲突)，具体的，与乘客发生冲突可包括：与车辆相关的情况(如乘客损坏车辆、弄脏车辆)，与费用相关的情况(如乘客对费用有异议)，与司机安全相关的情况(如乘客辱骂或殴打司机)，与交通事故相关的情况(如急刹车造成乘客受伤，或其他交通事故造成乘客受伤)。负例训练数据则可以包括网约车长时间停留但不属于异常停留行为的数据、以及网约车未长时间停留的数据。其中，正例训练数据和负例训练数据中具体包括网约车相关的位置信息、时间信息、司机及乘客的一些状态信息和交互信息等。

S302、对于每一训练数据，提取所述训练数据的停留位置、停留时长、司机服务状态以及预定特征信息。

在本实施例中，对于上述每一训练数据，提取训练数据的停留位置、停留时长、司机服务状态(如接驾状态、到达状态、服务状态)或处于非服务状态(如听单状态、收车状态)以及预定特征信息(包括但不限于乘客的支付行为、乘客对司机的评价、是否处于发单热点区域中至少一个)，具体过程可参见上述S101的过程。

S303、从所述数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述训练数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述训练数据相同时间段以及相同区域内的历史停留时长。

在本实施例中，对于每一训练数据获取第一历史数据集合和第二历史数据集合，其中获取第一历史数据集合和第二历史数据集合可参见上述S102的过程，此处不再赘述。

S304、根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，以使预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。

在本实施例中，根据训练数据集合中每一训练数据，以及该训练数据对应的第一历史数据集合和第二历史数据集合，对预设模型进行训练，在训练过程中，将每一训练数据，以及该训练数据对应的第一历史数据集合和第二历史数据集合输入到预设模型中，进行同上述S1.3或S201-S203的过程，通过调试预设模型的相关参数，实现预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。

更具体的，预设模型为融合模型，可包括第一模型、第二模型和第三模型，从不同的维度逐步判断所述网约车当前是否出现异常停留行为，S304所述的根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，可包括：

对于每一训练数据，将所述停留时长以及所述第一历史数据集合输入到第一模型中进行训练，确定所述第一模型的预设系数；

将所述预定特征信息输入第二模型中进行训练，确定所述第二模型的预设规则；

将所述停留时长以及所述第二历史数据集合输入到第三模型中进行训练，确定离群程度因子的预设阈值。

在本实施例中，对于第一模型、第二模型和第三模型的训练过程与上述的S201-S203的过程相似，通过多次调试各模型中的相关参数，实现输出的异常停留行为判断结果的准确率和/或召回率达到目标值。例如若第一模型为基于分布的Tukey Method模型需要多次调试用于表征异常程度的系数；再如第二模型为基于统计的规则模型，可预先设定一些规则，然后调试各规则的相关阈值；再如第三模型为基于密度的LOF模型，需要多次调试用于评价离群程度因子LOF值大小的预设阈值；再如若第二数据集中样本数不少预设数量时不进行LOF模型的计算，直接确定所述网约车当前出现异常停留行为，其中预设数量的相关参数也需要多次调试。

本实施例的网约车的异常停留行为识别模型训练方法的执行主体可以与网约车的异常停留行为识别方法的执行主体相同，当然也可不同。

本实施例提供的网约车的异常停留行为识别模型训练方法，通过从数据库获取训练数据集合，所述训练数据包括属于异常停留行为的正例训练数据和不属于异常停留行为的负例训练数据；对于每一训练数据，提取所述训练数据的停留位置、停留时长、司机服务状态以及预定特征信息；从所述数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述训练数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述训练数据相同时间段以及相同区域内的历史停留时长；根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，以使预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。通过多对网约车的异常停留行为识别模型的训练，可得到网约车的异常停留行为识别模型，从而能够利用海量网约车出行的历史数据以及该模型，考虑到停留时长、位置、服务状态等多维度的特征信息，可实时、准确的识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

图5为本发明实施例提供的网约车的异常停留行为识别装置的结构图。本实施例提供的网约车的异常停留行为识别装置可以执行网约车的异常停留行为识别方法实施例提供的处理流程，如图5所示，所述网约车的异常停留行为识别装置400包括采集模块410、获取模块420、以及处理模块430。

采集模块410，用于采集网约车发生停留时的实时数据，所述实时数据包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息；

获取模块420，用于从数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述实时数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述实时数据相同时间段以及相同区域内的历史停留时长；

处理模块430，用于根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为。

在上述实施例的基础上，所述处理模块430包括：

第一处理模块431，用于将所述当前停留时长以及所述第一历史数据集合输入到第一模型中，判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长；

第二处理模块432，用于若确定所述当前停留时长为异常停留时长，则将所述预定特征信息输入第二模型中，判断所述预定特征信息是否满足所述第二模型的预设规则；

第三处理模块433，用于若确定所述预定特征信息不满足所述第二模型的预设规则，则将所述当前停留时长以及所述第二历史数据集合输入到第三模型中，获取所述当前停留时长的离群程度因子，若所述离群程度因子大于预设阈值，则确定所述网约车当前出现异常停留行为。

在上述实施例的基础上，所述第一模型为基于分布的Tukey Method模型，所述Tukey Method模型中用于表征异常程度的系数采用预设系数；

所述第一处理模块431在判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长时，用于：

通过所述Tukey Method模型以所述预设系数获取所述第一历史数据集合的最大估计值；

若所述当前停留时长大于所述最大估计值，则确定所述当前停留时长为异常停留时长。

在上述实施例的基础上，所述第一历史数据集合包括第一子集和第二子集；所述第一子集包括当前司机在与所述实时数据相同服务状态下历史停留时长；所述第二子集包括所述数据库中所有司机在与所述实时数据相同服务状态以及相同区域内的历史停留时长；

在上述实施例的基础上，所述预定特征信息包括以下至少一个：乘客的支付行为、乘客对司机的评价、发单热点区域；

所述第二处理模块432在判断所述预定特征信息是否满足所述第二模型的预设规则时，用于：

判断所述乘客的支付行为是否为主动支付；和/或

判断所述乘客对司机的评价是否为主动好评；和/或

判断所述当前停留位置是否处于所述发单热点区域；

若上述判断结果均为否，则确定所述预定特征信息不满足所述第二模型的预设规则。

在上述实施例的基础上，所述第三模型为基于密度的LOF模型；

所述第三处理模块433在获取所述当前停留时长的离群程度因子时，用于：

通过所述LOF模型，根据所述当前停留时长以及所述第二历史数据集合，获取所述当前停留时长的离群程度因子LOF值。

在上述实施例的基础上，在确定所述预定特征信息不满足所述第二模型的预设规则后，所述第三处理模块433还用于：

若所述第二数据集中样本数少于预设数量，则直接确定所述网约车当前出现异常停留行为；

所述第三处理模块433还用于：

统计所述数据库中所有司机在与所述实时数据相同时间段内的历史停留数据的数量，并以所述历史停留数据的数量乘以预设百分比后得到的结果作为所述预设数量。

在上述实施例的基础上，所述第一处理模块431还用于，若确定所述当前停留时长不为异常停留时长，则确定所述网约车当前未出现异常停留行为；或者

所述第二处理模块432还用于，若确定所述预定特征信息满足所述第二模型的预设规则，则确定所述网约车当前未出现异常停留行为；或者

所述第三处理模块433还用于，若确定所述离群程度因子小于或等于预设阈值，则确定所述网约车当前未出现异常停留行为。

本发明实施例提供的网约车的异常停留行为识别装置可以具体用于执行上述图2-3所提供的方法实施例，具体功能此处不再赘述。

本发明实施例提供的网约车的异常停留行为识别装置，通过采集网约车发生停留时的实时数据，所述实时数据包括当前停留位置、当前停留时长、司机服务状态以及预定特征信息；从数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述实时数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述实时数据相同时间段以及相同区域内的历史停留时长；根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为。本实施例利用海量网约车出行的多维度历史数据以及预设模型，考虑到停留时长、位置、服务状态等多维度的特征信息，可实时、准确的识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

图6为本发明实施例提供的网约车的异常停留行为识别模型训练装置的结构图。本实施例提供的网约车的异常停留行为识别模型训练装置可以执行网约车的异常停留行为识别模型训练方法实施例提供的处理流程，如图3所示，所述网约车的异常停留行为识别模型训练装置500包括获取模块510、特征提取模块520、及训练模块530。

获取模块510，用于从数据库获取训练数据集合，所述训练数据包括属于异常停留行为的正例训练数据和不属于异常停留行为的负例训练数据；

特征提取模块520，用于对于每一训练数据，提取所述训练数据的停留位置、停留时长、司机服务状态以及预定特征信息；

所述获取模块510还用于，从所述数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述训练数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述训练数据相同时间段以及相同区域内的历史停留时长；

训练模块530，用于根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，以使预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。

在上述实施例的基础上，所述训练模块530用于：

将所述停留时长以及所述第一历史数据集合输入到第一模型中进行训练，确定所述第一模型的预设系数；将所述预定特征信息输入第二模型中进行训练，确定所述第二模型的预设规则；将所述停留时长以及所述第二历史数据集合输入到第三模型中进行训练，确定离群程度因子的预设阈值，以使得输出的异常停留行为判断结果的准确率和/或召回率达到目标值。

本发明实施例提供的网约车的异常停留行为识别模型训练装置可以具体用于执行上述图4所提供的方法实施例，具体功能此处不再赘述。

本发明实施例提供的网约车的异常停留行为识别模型训练装置，通过从数据库获取训练数据集合，所述训练数据包括属于异常停留行为的正例训练数据和不属于异常停留行为的负例训练数据；对于每一训练数据，提取所述训练数据的停留位置、停留时长、司机服务状态以及预定特征信息；从所述数据库中获取第一历史数据集合和第二历史数据集合；所述第一历史数据集合包括至少一个司机在与所述训练数据相同服务状态下的历史停留时长，所述第二历史数据集合包括至少一个司机在与所述训练数据相同时间段以及相同区域内的历史停留时长；根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，以使预设模型输出的异常停留行为判断结果的准确率和/或召回率达到目标值。通过多对网约车的异常停留行为识别模型的训练，可得到网约车的异常停留行为识别模型，从而能够利用海量网约车出行的历史数据以及该模型，考虑到停留时长、位置、服务状态等多维度的特征信息，可实时、准确的识别网约车当前是否出现异常停留行为，提高网约车平台的安全感知能力和对交通事故、司机乘客冲突的识别能力，保障司机和乘客的安全。

图7为本发明实施例提供的网约车的异常停留行为识别设备的结构示意图。本发明实施例提供的网约车的异常停留行为识别设备可以执行网约车的异常停留行为识别方法实施例提供的处理流程，如图7所示，网约车的异常停留行为识别设备600包括存储器610、处理器620、计算机程序和通讯接口630；其中，计算机程序存储在存储器610中，并被配置为由处理器620执行以上实施例所述的网约车的异常停留行为识别方法。

图7所示实施例的网约车的异常停留行为识别设备可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

图8为本发明实施例提供的网约车的异常停留行为识别模型训练设备的结构示意图。本发明实施例提供的网约车的异常停留行为识别模型训练设备可以执行网约车的异常停留行为识别模型训练方法实施例提供的处理流程，如图8所示，网约车的异常停留行为识别模型训练设备700包括存储器710、处理器720、计算机程序和通讯接口730；其中，计算机程序存储在存储器710中，并被配置为由处理器720执行以上实施例所述的网约车的异常停留行为识别模型训练方法。

图8所示实施例的网约车的异常停留行为识别模型训练设备可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

另外，本实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行以实现上述实施例所述的网约车的异常停留行为识别方法。

另外，本实施例还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行以实现上述实施例所述的网约车的异常停留行为识别模型训练方法。

在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以清楚地了解到，为描述的方便和简洁，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种网约车的异常停留行为识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述实时数据、所述第一历史数据集合、所述第二历史数据集合以及预设模型，识别所述网约车当前是否出现异常停留行为，包括：

将所述当前停留时长以及所述第一历史数据集合输入到第一模型中，判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长；

若确定所述当前停留时长为异常停留时长，则将所述预定特征信息输入第二模型中，判断所述预定特征信息是否满足所述第二模型的预设规则；

若确定所述预定特征信息不满足所述第二模型的预设规则，则将所述当前停留时长以及所述第二历史数据集合输入到第三模型中，获取所述当前停留时长的离群程度因子，若所述离群程度因子大于预设阈值，则确定所述网约车当前出现异常停留行为。

3.根据权利要求2所述的方法，其特征在于，所述第一模型为基于分布的Tukey Method模型，所述Tukey Method模型中用于表征异常程度的系数采用预设系数；

所述判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长，包括：

4.根据权利要求3所述的方法，其特征在于，所述第一历史数据集合包括第一子集和第二子集；所述第一子集包括当前司机在与所述实时数据相同服务状态下历史停留时长；所述第二子集包括所述数据库中所有司机在与所述实时数据相同服务状态以及相同区域内的历史停留时长；

5.根据权利要求4所述的方法，其特征在于，所述预定特征信息包括以下至少一个：乘客的支付行为、乘客对司机的评价、发单热点区域；

所述判断所述预定特征信息是否满足所述第二模型的预设规则，包括：

判断所述乘客的支付行为是否为主动支付；和/或

判断所述乘客对司机的评价是否为主动好评；和/或

判断所述当前停留位置是否处于所述发单热点区域；

6.根据权利要求2-5任一项所述的方法，其特征在于，所述第三模型为基于密度的LOF模型；

所述获取所述当前停留时长的离群程度因子，包括：

7.根据权利要求6所述的方法，其特征在于，所述确定所述预定特征信息不满足所述第二模型的预设规则后，包括：

所述方法还包括：

8.根据权利要求2所述的方法，其特征在于，还包括：

若确定所述当前停留时长不为异常停留时长，则确定所述网约车当前未出现异常停留行为；或者

若确定所述预定特征信息满足所述第二模型的预设规则，则确定所述网约车当前未出现异常停留行为；或者

若确定所述离群程度因子小于或等于预设阈值，则确定所述网约车当前未出现异常停留行为。

9.一种网约车的异常停留行为识别模型训练方法，其特征在于，包括：

10.根据权利要求9所述的方法，其特征在于，所述根据所述训练数据集合、每一训练数据对应的所述第一历史数据集合和所述第二历史数据集合，对预设模型进行训练，包括：

11.一种网约车的异常停留行为识别装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于，所述处理模块包括：

第一处理模块，用于将所述当前停留时长以及所述第一历史数据集合输入到第一模型中，判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长；

第二处理模块，用于若确定所述当前停留时长为异常停留时长，则将所述预定特征信息输入第二模型中，判断所述预定特征信息是否满足所述第二模型的预设规则；

第三处理模块，用于若确定所述预定特征信息不满足所述第二模型的预设规则，则将所述当前停留时长以及所述第二历史数据集合输入到第三模型中，获取所述当前停留时长的离群程度因子，若所述离群程度因子大于预设阈值，则确定所述网约车当前出现异常停留行为。

13.根据权利要求12所述的装置，其特征在于，所述第一模型为基于分布的TukeyMethod模型，所述Tukey Method模型中用于表征异常程度的系数采用预设系数；

所述第一处理模块在判断所述当前停留时长相对于所述第一历史数据集合是否为异常停留时长时，用于：

14.根据权利要求13所述的装置，其特征在于，所述第一历史数据集合包括第一子集和第二子集；所述第一子集包括当前司机在与所述实时数据相同服务状态下历史停留时长；所述第二子集包括所述数据库中所有司机在与所述实时数据相同服务状态以及相同区域内的历史停留时长；

15.根据权利要求12所述的装置，其特征在于，所述预定特征信息包括以下至少一个：乘客的支付行为、乘客对司机的评价、发单热点区域；

所述第二处理模块在判断所述预定特征信息是否满足所述第二模型的预设规则时，用于：

判断所述乘客的支付行为是否为主动支付；和/或

判断所述乘客对司机的评价是否为主动好评；和/或

判断所述当前停留位置是否处于所述发单热点区域；

16.根据权利要求12-15任一项所述的装置，其特征在于，所述第三模型为基于密度的LOF模型；

所述第三处理模块在获取所述当前停留时长的离群程度因子时，用于：

17.根据权利要求16所述的装置，其特征在于，在确定所述预定特征信息不满足所述第二模型的预设规则后，所述第三处理模块还用于：

所述第三处理模块还用于：

18.根据权利要求12所述的装置，其特征在于，

所述第一处理模块还用于，若确定所述当前停留时长不为异常停留时长，则确定所述网约车当前未出现异常停留行为；或者

所述第二处理模块还用于，若确定所述预定特征信息满足所述第二模型的预设规则，则确定所述网约车当前未出现异常停留行为；或者

所述第三处理模块还用于，若确定所述离群程度因子小于或等于预设阈值，则确定所述网约车当前未出现异常停留行为。

19.一种网约车的异常停留行为识别模型训练装置，其特征在于，包括：

20.根据权利要求19所述的装置，其特征在于，所述训练模块用于：

21.一种网约车的异常停留行为识别设备，其特征在于，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求1-8中任一项所述的方法。

22.一种网约车的异常停留行为识别模型训练设备，其特征在于，包括：

存储器；

处理器；以及

计算机程序；

其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如权利要求9或10所述的方法。

23.一种计算机可读存储介质，其特征在于，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如权利要求1-8中任一项所述的方法。

24.一种计算机可读存储介质，其特征在于，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如权利要求9或10所述的方法。