CN112116158B

CN112116158B - 数据处理方法、数据处理装置、存储介质和电子设备

Info

Publication number: CN112116158B
Application number: CN202010998060.2A
Authority: CN
Inventors: 李嘉诚; 董建强; 陈道昌; 侯广东; 王征
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2020-09-21
Filing date: 2020-09-21
Publication date: 2021-11-02
Anticipated expiration: 2040-09-21
Also published as: CN112116158A

Abstract

本发明实施例公开了一种数据处理方法、数据处理装置、存储介质和电子设备。本发明实施例在获取包括目标任务的位置信息和路径的任务属性信息以及对应的任务处理资源的资源属性信息后，分别根据资源属性信息预测任务处理资源发生异常事件的概率、根据位置信息预测位置信息所属区域内发生异常事件的概率以及根据目标任务的路径确定该路径发生异常事件的概率，从而根据上述概率预测目标任务发生异常事件的概率。通过本发明实施例的方法，可以在用户历史数据较少的情况下较为准确地确定任务为异常任务的概率，从而可以在后续对存在异常的目标任务进行及时提示。

Description

数据处理方法、数据处理装置、存储介质和电子设备

技术领域

本发明涉及计算机技术领域，具体涉及一种数据处理方法、数据处理装置、存储介质和电子设备。

背景技术

随着计算机技术领域以及互联网技术领域的不断发展，越来越多的用户选择在线上约车平台上发布约车需求。线上约车平台为用户的出行带来了较大的便捷，但有时用户产生的一些异常行为会导致约车订单等任务成为异常任务，对任务处理资源的任务完成效率造成较大影响。现有技术可以通过用户的历史数据来预测任务存在异常风险，但对于一些历史数据不足的用户，现有技术无法较为准确地确定任务存在异常风险。

发明内容

有鉴于此,本发明实施例的目的在于提供一种数据处理方法、数据处理装置、存储介质和电子设备，用于在用户的历史数据不足时，较为准确地确定任务为异常任务的概率，从而在后续对存在异常的目标任务进行及时提示。

根据本发明实施例的第一方面，提供了一种数据处理方法，所述方法包括：

获取目标任务的任务属性信息以及对应的任务处理资源的资源属性信息，所述任务属性信息包括所述目标任务的位置信息和目标路径，所述位置信息包括所述目标任务的起始位置和终止位置中的至少一项；

基于第一概率预测模型，根据所述资源属性信息确定所述任务处理资源对应的第一概率，所述第一概率用于表征所述任务处理资源发生异常事件的概率；

基于第二概率预测模型，确定目标区域对应的第二概率，所述目标区域为所述位置信息所属的区域，所述第二概率用于表征所述目标区域内发生异常事件的概率；

基于第三概率预测模型，根据所述目标路径确定所述目标任务对应的第三概率，所述第三概率用于表征所述目标路径发生异常事件的概率；

基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标任务对应的目标概率，所述目标概率用于表征所述目标任务为异常任务的概率。

根据本发明实施例的第二方面，提供一种数据处理方法，所述方法包括：

获取目标订单的订单属性信息以及对应的司机的资源属性信息，所述订单属性信息包括所述目标订单的位置信息和目标路径，所述位置信息包括所述目标订单的起始位置和终止位置中的至少一项；

基于第一概率预测模型，根据所述资源属性信息确定所述司机对应的第一概率，所述第一概率用于表征所述司机发生异常事件的概率；

基于第三概率预测模型，根据所述目标路径确定所述目标订单对应的第三概率，所述第三概率用于表征所述目标路径发生异常事件的概率；

基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标订单对应的目标概率，所述目标概率用于表征所述目标订单为异常订单的概率。

根据本发明实施例的第三方面，提供一种数据处理装置，所述装置包括：

信息获取单元，用于获取目标任务的任务属性信息以及对应的任务处理资源的资源属性信息，所述任务属性信息包括所述目标任务的位置信息和目标路径，所述位置信息包括所述目标任务的起始位置和终止位置中的至少一项；

第一预测单元，用于基于第一概率预测模型，根据所述资源属性信息确定所述任务处理资源对应的第一概率，所述第一概率用于表征所述任务处理资源发生异常事件的概率；

第二预测单元，用于基于第二概率预测模型，确定目标区域对应的第二概率，所述目标区域为所述位置信息所属的区域，所述第二概率用于表征所述目标区域内发生异常事件的概率；

第三预测单元，用于基于第三概率预测模型，根据所述目标路径确定所述目标任务对应的第三概率，所述第三概率用于表征所述目标路径发生异常事件的概率；

第四预测单元，用于基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标任务对应的目标概率，所述目标概率用于表征所述目标任务为异常任务的概率。

根据本发明实施例的第四方面，提供一种计算机可读存储介质，其上存储计算机程序指令，其中，所述计算机程序指令在被处理器执行时实现如第一方面和第二方面中任一项所述的方法。

根据本发明实施例的第五方面，提供一种电子设备，包括存储器和处理器，其中，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面和第二方面中任一项所述的方法。

本发明实施例在获取包括目标任务的位置信息和路径的任务属性信息以及对应的任务处理资源的资源属性信息后，分别根据资源属性信息预测任务处理资源发生异常事件的概率、根据位置信息预测位置信息所属区域内发生异常事件的概率以及根据目标任务的路径确定该路径发生异常事件的概率，从而根据上述概率预测目标任务发生异常事件的概率。通过本发明实施例的方法，可以在用户历史数据较少的情况下较为准确地确定任务为异常任务的概率，从而可以在后续对存在异常的目标任务进行及时提示。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

图1是本发明实施例的硬件系统架构的示意图；

图2是本发明第一实施例的数据处理方法的流程图；

图3是本发明第一实施例的方法获取第二概率的数据流向图；

图4是本发明第一实施例的数据处理方法的数据流向图；

图5是本发明第二实施例的数据处理装置的示意图；

图6是本发明第三实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质，公知的方法、过程、流程、元件和电路并没有详细叙述。

此外，本领域普通技术人员应当理解，在此提供的附图都是为了说明的目的，并且附图不一定是按比例绘制的。

除非上下文明确要求，否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本发明实施例中，以目标任务为约车订单为例进行说明。但是本领域技术人员容易理解，在目标任务为其他类型的任务，例如物流配送任务时，本发明实施例的方法同样适用。

随着约车业务的不断普及，用户通过在线上约车平台上发布约车需求的方式就可以乘车。线上约车平台为用户的出行带来了较大的便捷，但有时用户产生的一些异常行为(例如，乘车前取消订单、订单完成后不支付相应的报酬等)会导致约车订单等任务成为异常任务，对任务处理资源的任务完成效率造成较大影响。现有的订单风险预测方法可以通过用户的历史数据来预测任务存在异常风险，但对于一些历史数据不足的用户(例如，新用户或者约车服务适用频率较低的用户)，现有的订单风险预测方法无法较为准确地确定任务存在异常风险。

图1是本发明实施例的硬件系统架构的示意图。图1所示的硬件系统架构可以包括多个任务发布终端、多个任务处理终端以及至少一个服务器，图1以一个任务发布终端11、一个任务处理终端12以及一个服务器13为例进行说明。图1所示的任务发布终端11、任务处理终端12以及服务器13可以通过网络进行通信连接。在本发明实施例中，任务发布终端11也即用户终端，用户可以通过任务发布终端11在线上约车平台通过约车订单发布乘车需求。服务器13通过线上约车平台获取到约车订单后，可以将约车订单分配给任务处理终端12，以使得持有任务处理终端12的任务处理资源(也即，司机)可以根据约车订单的约定时刻为用户提供约车服务。

在本发明实施例中，服务器13在接收到任一用户通过任务发布终端11发布的约车需求后，可以将该约车需求确定为目标任务，并将目标任务分配给一个任务处理终端12对应的任务处理资源。在对目标任务分配完毕后，服务器13可以获取目标任务的任务属性信息以及任务处理资源的资源属性信息，其中，任务属性信息包括目标任务的起始位置和终止位置中的至少一项以及根据目标任务的起始位置和终止位置进行路径规划得到的目标路径。然后，服务器13可以基于第一概率预测模型，根据任务处理资源的资源属性信息确定任务处理资源发生异常事件(也即，被取消订单、被逃单等)的概率，并基于第二概率预测模型确定目标任务的位置信息所属的目标区域内发生异常事件的概率，同时基于第三概率预测模型，根据目标任务的目标路径确定目标路径发生异常事件的概率，从而基于第四概率预测模型，根据任务处理资源发生异常事件的概率、目标区域内发生异常事件的概率以及目标路径发生异常事件的概率确定目标任务为异常任务的概率。

在一种可选的实现方式中，在确定目标任务为异常任务的概率后，若确定目标任务为异常任务的概率满足预定概率条件，服务器13可以向预定终端(例如，任务处理终端12)发送提示消息，以对目标任务存在异常风险进行提示。

图2是本发明第一实施例的数据处理方法的流程图。如图2所示，本实施例的方法包括如下步骤：

步骤S100，获取目标任务的任务属性信息以及对应的任务处理资源的资源属性信息。

在本步骤中，服务器可以将目标任务分配给一个任务处理资源后，获取目标任务的属性信息以及该任务处理资源的资源属性信息。在本实施例中，任务属性信息可以包括目标任务的位置信息和目标路径，其中，目标任务的位置信息可以包括目标任务的起始位置和终止位置中的至少一项，具体可以通过经纬度坐标来表示，目标路径为根据起始位置和终止位置进行路径规划得到的路径；资源属性信息可以包括任务处理资源的任务处理经验，具体可以包括任务处理资源的任务处理年限(例如，驾龄、实际接单年限等)、任务完成数量(也即，已完成的订单数量)等，资源属性信息还可以包括任务处理资源的评价信息(例如，评分、好评数量、差评数量等)以及任务处理资源所使用的车辆类型等。

步骤S200，基于第一概率预测模型，根据资源属性信息确定任务处理资源对应的第一概率。

在本实施例中，第一概率用于表征任务处理资源发生异常事件的概率，也就是说，在目标任务为约车订单且任务处理资源为司机时，任务处理资源发生异常事件的概率为司机被逃单(也即，在任务完成后，用户不支付相应报酬)等的概率。基于历史数据可以确定，历史异常任务(例如，历史被逃单订单)与任务处理资源的资源属性信息存在一定的关联，例如，任务处理资源的评价越低，或者任务处理经验越不足，用户产生逃单行为的可能性越高，从而使得历史任务成为历史异常任务，因此服务器可以根据资源属性信息对任务处理资源对应的第一概率进行预测。

第一概率预测模型为有监督模型，具体可以为神经网络(例如，卷积神经网络、循环神经网络等)、树模型(例如，回归树模型、提升树模型等)、朴素贝叶斯分类器等，本实施例不做具体限定。

以神经网络为例，神经网络全称人工神经网络(Artificial Neural Network，ANN)，是由大量处理单元互联形成的信息处理模型。常见的人工神经网络包括卷积神经网络(Convolutional Neural Network，CNN)、循环神经网络(Recurrent Neural Network，RNN)等。ANN具有非线性(适于处理非线性信息)、非局限性(也即，一个系统的整体行为取决于处理单元间的相互作用)、非常定性(也即，具有自适应、自组织、自学习能力，能够在处理信息的过程中不断进行自我学习)和非凸性(模型的激活函数具有多个极值，这使得模型具有多个较为稳定的平衡态，从而使得模型的变化是多样的)的特点，因此能够广泛地应用于各种领域，对数据进行较为准确地预测。在本步骤中，也即，较为准确地预测目标任务的第一概率。

步骤S300，基于第二概率预测模型，确定目标区域对应的第二概率。

在本实施例中，目标区域为目标任务的位置信息所属的区域，具体可以为目标任务的起始位置所属的区域或者目标任务的终止位置所属的区域。第二概率用于表征目标区域内发生异常事件的概率，也就是说，在目标任务为约车订单时，目标区域内发生异常事件的概率为目标区域内发生逃单等异常行为的概率。类似地，基于历史数据可以确定，历史异常任务与起始位置或终止位置所属的区域同样存在一定的关联，例如，对应区域内包括历史异常任务的起始位置或终止位置的数量越多，或者对应区域内历史异常任务的任务起始时刻(也即，乘车时刻)或任务终止时刻(也即，下车时刻)越集中，用户在对应区域内产生逃单行为的可能性越高，从而使得历史任务成为历史异常任务，因此服务器可以根据目标区域的历史数据对目标区域对应的第二概率进行预测。

可选地，服务器可以分别预测目标任务的起始位置所属的第一区域对应的概率以及终止位置所属的第二区域对应的概率，然后根据第一区域对应的概率和第二区域对应的概率的加权和确定第二概率，也可以直接预测目标任务的起始位置以及终止位置所属的目标区域的第二概率，本实施例不做具体限定。容易理解，第一区域对应的概率对应的第一权重以及第二区域对应的概率对应的第二权重可以相同，也可以不同。

在本步骤中，服务器可以获取目标区域的区域属性信息，具体可以包括目标区域内的兴趣点(POI，Point Of Interest)集合、历史异常任务的历史任务信息等。其中，兴趣点集合至少包括目标区域内的至少一个兴趣点的兴趣点标识及该兴趣点的位置信息，还可以包括其他信息，例如，该兴趣点的面积等。兴趣点是位置范围的一种表示方式，具体可以为房屋、地铁站、商铺、公交站等。历史任务信息可以包括历史异常任务的历史位置信息、任务起始时刻以及任务终止时刻中的至少一项。容易理解，在本步骤中，历史异常任务的历史位置信息属于目标区域。

在获取兴趣点集合后，服务器可以基于第二概率预测模型对目标区域的区域属性信息进行处理，获取目标区域对应的第二概率。在本实施例中，第二概率预测模型具体包括两个模块，分别为编码模块和全连接神经网络模块，其中，编码模块用于对由兴趣点集合映射得到的矩阵进行编码处理，获取目标区域的低维特征表示，编码模块具体可以为CNN模块、RNN模块等；全连接神经网络模块用于根据历史异常任务的历史任务信息对目标区域对应的第二概率进行预测。

具体地，服务器可以对兴趣点集合中的各兴趣点进行特征嵌入，也就是说，确定兴趣点集合中各兴趣点对应的相邻兴趣点子集合，然后将兴趣点集合对应的各相邻兴趣点子集合映射为矩阵，从而基于编码模块对特征嵌入得到的矩阵进行编码处理，获取目标区域的低维特征表示。其中，相邻兴趣点子集合为目标区域内与对应兴趣点的距离排序在最近的前n(n为大于等于1的预定整数)位的相邻兴趣点构成的集合。在本实施例中，可以通过计算任一兴趣点与相邻兴趣点的欧式距离确定该兴趣点与相邻兴趣点的距离。具体地，矩阵映射过程的损失函数L可以通过如下公式表示：

其中，D为目标区域对应的兴趣点集合，b_i为D内的第i个兴趣点，N(b_i)为b_i对应的相邻兴趣点子集合。

图3是本发明第一实施例的方法获取第二概率的数据流向图。如图3所示，服务器在获取包括目标区域的兴趣点集合31以及历史异常任务的历史任务信息35的区域属性信息后，将兴趣点集合31映射为矩阵32，并通过第二概率模型33的编码模块331对矩阵32进行编码处理，得到目标区域对应的低维特征表示34，然后通过第二概率模型33的全连接神经网络模块332对低维特征表示34以及历史任务信息35进行处理，从而得到目标区域对应的第二概率36。

步骤S400，基于第三概率预测模型，根据目标路径确定目标任务对应的第三概率。

在本实施例中，第三概率用于表征目标路径发生异常事件的概率，也就是说，在目标任务为约车订单时，目标路径发生异常事件的概率为用户经过该路径时逃单的概率。类似地，基于历史数据可以确定，历史异常任务与对应的历史路径同样存在一定的关联，例如，历史异常任务的历史路径(或者经过的兴趣点类型)越相似，或者各历史异常任务经过相同(或相同类型)兴趣点的时刻越集中，用户产生逃单行为的可能性越高，从而使得历史任务成为历史异常任务，因此服务器可以根据目标路径对第三概率进行预测。容易理解，对于历史异常任务，历史路径的坐标序列、坐标点序列中各坐标点对应的兴趣点标识以及各坐标点对应的时间戳是在实际行驶过程中记录得到的。

在本步骤中，服务器可以根据目标路径确定目标任务对应的路径相关信息。路径相关信息包括目标路径的坐标点序列、坐标点序列中各坐标点对应的兴趣点标识以及各坐标点对应的时间戳。

容易理解，在本实施例中，服务器根据目标任务的起始位置、终止位置以及任务起始时刻可以预测得到目标任务的目标路径以及任务执行时长，从而可以根据目标路径以及任务执行时长预测得到用户到达各坐标点的时刻(也即，各坐标点对应的时间戳)，也就是说，对于目标任务，坐标序列、坐标点序列中各坐标点对应的兴趣点标识以及各坐标点对应的时间戳是预测得到的。

在获取目标任务的路径相关信息后，服务器可以确定坐标点序列中各坐标点所属的兴趣点的相邻兴趣点子集合，然后将坐标点序列对应的各相邻兴趣点子集合映射为矩阵，从而根据坐标点序列中各坐标点的经纬度值、时间戳以及矩阵，基于第三概率预测模型对目标任务对应的第三概率进行预测。

步骤S500，基于第四概率预测模型，根据第一概率、第二概率和第三概率确定目标任务对应的目标概率。

在本步骤中，服务器无需获取目标用户的用户信息、历史数据等，从任务处理资源、目标区域以及目标路径的角度就可以对目标任务对应的目标概率进行较为准确地预测。目标概率用于表征目标任务为异常任务的概率。

具体地，服务器可以以目标任务对应的第一概率、第二概率以及第三概率为第四概率预测模型的输入，得到目标概率。第四概率模型为有监督模型，具体可以为神经网络、树模型、朴素贝叶斯分类器等，本实施例不做具体限定。

在本实施例的一种可选的实现方式中，第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型的训练方式是一种端到端的训练方式，也就是说，服务器可以对第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型同时进行训练。

在第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型的训练过程中，服务器可以基于多个历史任务的历史任务数据进行训练。其中，历史任务数据包括历史任务的历史任务属性信息、对应的任务处理资源的历史资源属性信息以及任务异常标识，任务异常标识用于表征历史任务为异常任务的概率。历史任务为异常任务的概率通常为0％或100％，因此可以将任务异常标识确定为0和1，0用于表征历史任务为正常任务，1用于表征历史任务为异常任务。容易理解，历史任务属性信息包括历史任务的位置信息和历史路径。

具体地，服务器可以获取各历史任务的位置信息所属的对应区域的低维特征表示以及历史路径的路径相关信息，然后以各历史任务对应的任务处理资源的资源属性信息、对应区域的低维特征表示、对应区域内历史异常任务的历史任务信息以及历史路径的路径相关信息为第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型的输入，以各历史任务对应的任务异常标识为训练目标进行训练，从而同时得到训练后的第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型。

在本实施例的另一种可选的实现方式中，服务器也可以对第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型分别进行训练。

在第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型的训练过程中，服务器同样可以基于多个历史任务的历史任务数据进行训练。其中，历史任务数据包括历史任务的历史任务属性信息、对应的任务处理资源的历史资源属性信息以及任务异常标识。容易理解，在对第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型分别训练时，历史任务属性信息包括历史任务的位置信息和历史路径，历史资源属性信息包括任务处理资源历史发生异常事件的概率，任务处理资源历史发生异常事件的概率可以根据该任务处理资源处理历史异常任务的数量与处理历史任务的数量的比值确定。

具体地，服务器可以获取各历史任务的位置信息所属的对应区域的区域属性信息以及历史路径的路径相关信息，其中，对应区域的区域属性信息包括对应区域内发生异常事件的概率，历史路径的路径相关信息包括历史路径的路径异常标识。在本实施例中，路径异常标识与任务异常标识类似，用于表征历史路径发生异常事件的概率。

然后根据对应区域的区域属性信息获取低维特征表示以及历史路径的路径相关信息。进而以各历史任务对应的任务处理资源的资源属性信息为第一概率预测模型的输入，以任务处理资源历史发生异常事件的概率为训练目标对第一概率预测模型进行训练；以各历史任务的对应区域的低维特征表示、对应区域内历史异常任务的历史任务信息为第二概率预测模型的输入，以对应区域内发生异常事件的概率为训练目标对第二概率预测模型进行训练；以历史路径的路径相关信息为第三概率预测模型的输入，以历史路径的路径异常标识为训练目标对第三概率预测模型进行训练，并以历史任务对应的任务处理资源历史发生异常事件的概率、对应区域内发生异常事件的概率以及历史路径的路径异常标识为第四概率预测模型的输入，以历史任务的任务异常标识为训练目标对第三概率预测模型进行训练，从而得到训练后的第一概率预测模型、第二概率预测模型、第三概率预测模型以及第四概率预测模型。

图4是本发明第一实施例的数据处理方法的数据流向图。以目标任务为目标订单，以任务处理资源为司机为例进行说明。如图4所示，服务器在对目标订单进行分配后，获取目标订单的包括目标订单的位置信息402以及目标路径403的订单属性信息以及对应的司机的资源属性信息401，然后根据位置信息402确定目标区域的区域属性特征404，根据目标路径403获取目标订单对应的路径相关信息405，然后以资源属性信息401为第一概率预测模型406的输入得到第一概率409，以根据区域属性特征404得到的矩阵以及历史任务信息为第二概率预测模型407的输入得到第二概率410，以路径相关信息405为第三概率预测模型408的输入得到第三概率411，然后以第一概率409、第二概率410以及第三概率411为第四概率预测模型412的输入，得到目标订单的目标概率413。

可选地，在确定目标任务的目标概率后，本实施例的方法还可以包括如下步骤：

步骤S600，响应于目标概率满足预定概率条件，向预定终端发送提示消息。

在本步骤中，若目标概率满足预定概率条件，表示目标任务有较大可能为异常任务，因此服务器可以向预定终端发送提示消息，以对目标任务存在异常风险进行提示。在本实施例中，预定概率条件可以为目标概率大于预定阈值，例如0.7。预定终端可以为任务处理终端，也可以为运维终端等，本实施例不做具体限定。

本实施例在获取包括目标任务的位置信息和路径的任务属性信息以及对应的任务处理资源的资源属性信息后，分别根据资源属性信息预测任务处理资源发生异常事件的概率、根据位置信息预测位置信息所属区域内发生异常事件的概率以及根据目标任务的路径确定该路径发生异常事件的概率，从而根据上述概率预测目标任务发生异常事件的概率。通过本实施例的方法，可以在用户历史数据较少的情况下较为准确地确定任务为异常任务的概率，从而可以在后续对存在异常的目标任务进行及时提示。

图5是本发明第二实施例的数据处理装置的示意图。如图5所示，本实施例的装置包括信息获取单元51、第一预测单元52、第二预测单元53、第三预测单元54和第四预测单元55。

其中，信息获取单元51用于获取目标任务的任务属性信息以及对应的任务处理资源的资源属性信息，所述任务属性信息包括所述目标任务的位置信息和目标路径，所述位置信息包括所述目标任务的起始位置和终止位置中的至少一项。第一预测单元52用于基于第一概率预测模型，根据所述资源属性信息确定所述任务处理资源对应的第一概率，所述第一概率用于表征所述任务处理资源发生异常事件的概率。第二预测单元53用于基于第二概率预测模型，确定目标区域对应的第二概率，所述目标区域为所述位置信息所属的区域，所述第二概率用于表征所述目标区域内发生异常事件的概率。第三预测单元54用于基于第三概率预测模型，根据所述目标路径确定所述目标任务对应的第三概率，所述第三概率用于表征所述目标路径发生异常事件的概率。第四预测单元55用于基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标任务对应的目标概率，所述目标概率用于表征所述目标任务为异常任务的概率。

进一步地，所述第二预测单元53包括特征获取子单元和第一预测子单元。

其中，特征获取子单元用于获取所述目标区域对应的低维特征表示以及历史异常任务的历史任务信息，所述历史任务信息包括所述历史异常任务的历史位置信息、任务起始时刻以及任务终止时刻中的至少一项。第一预测子单元用于基于所述第二概率模型，根据所述低维特征表示以及所述历史任务信息确定所述第二概率。

进一步地，所述第二概率预测模型包括编码模块；

所述特征获取子单元包括信息获取模块和低维特征获取模块。

其中，信息获取模块用于获取所述目标区域对应的兴趣点集合。低维特征获取模块用于基于所述编码模块对矩阵进行编码处理，获取所述目标区域对应的所述低维特征表示，所述矩阵基于所述兴趣点集合映射得到。

进一步地，所述第三预测单元54包括信息获取子单元和第二预测子单元。

其中，信息获取子单元用于根据所述目标路径确定所述目标任务对应的路径相关信息，所述路径相关信息包括所述目标路径的坐标点序列、所述坐标点序列中各坐标点对应的兴趣点标识以及各所述坐标点对应的时间戳。第二预测子单元用于基于所述第三概率预测模型，根据所述路径相关信息确定所述目标任务对应的第三概率。

进一步地，所述第一概率预测模型、第二概率预测模型、第三概率预测模型和第四概率预测模型基于多个历史异常任务的历史任务数据同时训练获得，所述历史任务数据包括所述历史异常任务的历史任务属性信息、对应的任务处理资源的历史资源属性信息以及任务异常标识，所述任务异常标识用于表征所述历史任务为异常任务的概率。

进一步地，所述装置还包括发送单元56。

其中，发送单元56用于响应于所述目标概率满足预定概率条件，向预定终端发送提示消息，所述提示消息用于提示所述目标任务存在异常风险。

本实施例在获取包括目标任务的位置信息和路径的任务属性信息以及对应的任务处理资源的资源属性信息后，分别根据资源属性信息预测任务处理资源发生异常事件的概率、根据位置信息预测位置信息所属区域内发生异常事件的概率以及根据目标任务的路径确定该路径发生异常事件的概率，从而根据上述概率预测目标任务发生异常事件的概率。通过本实施例的装置，可以在用户历史数据较少的情况下较为准确地确定任务为异常任务的概率，从而可以在后续对存在异常的目标任务进行及时提示。

图6是本发明第三实施例的电子设备的示意图。图6所示的电子设备为通用数据处理装置，其包括通用的计算机硬件结构，其至少包括处理器61和存储器62。处理器61和存储器62通过总线63连接。存储器62适于存储处理器61可执行的指令或程序。处理器61可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器61通过执行存储器62所存储的命令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线63将上述多个组件连接在一起，同时将上述组件连接到显示控制器64和显示装置以及输入/输出(I/O)装置65。输入/输出(I/O)装置65可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出(I/O)装置65通过输入/输出(I/O)控制器66与系统相连。

其中，存储器62可以存储软件组件，例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。

上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应理解，流程图和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器，以产生机器，使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。

同时，如本领域技术人员将意识到的，本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此，本发明实施例的各个方面可以采取如下形式：完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外，本发明的方面可以采取如下形式：在一个或多个计算机可读介质中实现的计算机程序产品，计算机可读介质具有在其上实现的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置，或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项：具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中，计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。

计算机可读信号介质可以包括传播的数据信号，所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式，包括但不限于：电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质：不是计算机可读存储介质，并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。

用于执行针对本发明各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写，所述编程语言包括：面向对象的编程语言如Java、Smalltalk、C++、PHP、Python等；以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行；部分地在用户计算机上且部分地在远程计算机上执行；或者完全地在远程计算机或服务器上执行。在后一种情况下，可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机，或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标任务对应的目标概率，所述目标概率用于表征所述目标任务为异常任务的概率；

其中，所述基于第二概率预测模型，确定所述目标区域对应的第二概率包括：

获取所述目标区域对应的低维特征表示以及历史异常任务的历史任务信息，所述历史任务信息包括所述历史异常任务的历史位置信息、任务起始时刻以及任务终止时刻中的至少一项；

基于所述第二概率预测模型，根据所述低维特征表示以及所述历史任务信息确定所述第二概率。

2.根据权利要求1所述的方法，其特征在于，所述第二概率预测模型包括编码模块；

所述获取所述目标区域对应的低维特征表示包括：

获取所述目标区域对应的兴趣点集合；

基于所述编码模块对矩阵进行编码处理，获取所述目标区域对应的所述低维特征表示，所述矩阵基于所述兴趣点集合映射得到。

3.根据权利要求1所述的方法，其特征在于，所述基于第三概率预测模型，根据所述目标路径确定所述目标任务对应的第三概率包括：

根据所述目标路径确定所述目标任务对应的路径相关信息，所述路径相关信息包括所述目标路径的坐标点序列、所述坐标点序列中各坐标点对应的兴趣点标识以及各所述坐标点对应的时间戳；

基于所述第三概率预测模型，根据所述路径相关信息确定所述目标任务对应的第三概率。

4.根据权利要求1所述的方法，其特征在于，所述第一概率预测模型、第二概率预测模型、第三概率预测模型和第四概率预测模型基于多个历史任务的历史任务数据同时训练获得，所述历史任务数据包括所述历史任务的历史任务属性信息、对应的任务处理资源的历史资源属性信息以及任务异常标识，所述任务异常标识用于表征所述历史任务为异常任务的概率。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

响应于所述目标概率满足预定概率条件，向预定终端发送提示消息，所述提示消息用于提示所述目标任务存在异常风险。

6.一种数据处理方法，其特征在于，所述方法包括：

基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标订单对应的目标概率，所述目标概率用于表征所述目标订单为异常订单的概率；

获取所述目标区域对应的低维特征表示以及历史异常订单的历史订单信息，所述历史订单信息包括所述历史异常订单的订单位置信息、订单起始时刻以及订单终止时刻中的至少一项；

基于所述第二概率预测模型，根据所述低维特征表示以及所述历史订单信息确定所述第二概率。

7.一种数据处理装置，其特征在于，所述装置包括：

第四预测单元，用于基于第四概率预测模型，根据所述第一概率、第二概率和所述第三概率确定所述目标任务对应的目标概率，所述目标概率用于表征所述目标任务为异常任务的概率；

其中，所述第二预测单元包括：

特征获取子单元，用于获取所述目标区域对应的低维特征表示以及历史异常任务的历史任务信息，所述历史任务信息包括所述历史异常任务的历史位置信息、任务起始时刻以及任务终止时刻中的至少一项；

第一预测子单元，用于基于所述第二概率模型，根据所述低维特征表示以及所述历史任务信息确定所述第二概率。

8.根据权利要求7所述的装置，其特征在于，所述第二概率预测模型包括编码模块；

所述特征获取子单元包括：

信息获取模块，用于获取所述目标区域对应的兴趣点集合；

低维特征获取模块，用于基于所述编码模块对矩阵进行编码处理，获取所述目标区域对应的所述低维特征表示，所述矩阵基于所述兴趣点集合映射得到。

9.根据权利要求7所述的装置，其特征在于，所述第三预测单元包括：

信息获取子单元，用于根据所述目标路径确定所述目标任务对应的路径相关信息，所述路径相关信息包括所述目标路径的坐标点序列、所述坐标点序列中各坐标点对应的兴趣点标识以及各所述坐标点对应的时间戳；

第二预测子单元，用于基于所述第三概率预测模型，根据所述路径相关信息确定所述目标任务对应的第三概率。

10.根据权利要求7所述的装置，其特征在于，所述第一概率预测模型、第二概率预测模型、第三概率预测模型和第四概率预测模型基于多个历史任务的历史任务数据同时训练获得，所述历史任务数据包括所述历史任务的历史任务属性信息、对应的任务处理资源的历史资源属性信息以及任务异常标识，所述任务异常标识用于表征所述历史任务为异常任务的概率。

11.根据权利要求7所述的装置，其特征在于，所述装置还包括：

发送单元，用于响应于所述目标概率满足预定概率条件，向预定终端发送提示消息，所述提示消息用于提示所述目标任务存在异常风险。

12.一种计算机可读存储介质，其上存储计算机程序指令，其特征在于，所述计算机程序指令在被处理器执行时实现如权利要求1-6中任一项所述的方法。

13.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-6中任一项所述的方法。