CN112329963A

CN112329963A - 数据处理方法、数据处理装置、存储介质和电子设备

Info

Publication number: CN112329963A
Application number: CN202011176910.7A
Authority: CN
Inventors: 吕艺恩; 沙泓州; 郑文芳
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2021-02-05

Abstract

本发明实施例公开了一种数据处理方法、数据处理装置、存储介质和电子设备。本发明实施例获取目标任务执行过程中采集的视频数据和音频数据作为任务信息的一部分，然后基于第一概率预测模型，根据音频数据以及视频数据确定目标用户处于异常状态的概率，并基于第二概率预测模型，根据视频数据以及目标用户处于异常状态的概率确定目标任务执行过程中发生异常事件的概率，从而在目标任务执行过程中发生异常事件的概率满足预定概率条件时，向任务处理终端发送第一消息，以对任务处理资源进行警示。本发明实施例将目标用户处于异常状态的概率作为预测异常事件发生的重要指标，可以较为准确且及时地对发生异常事件的概率较高的任务进行风险警示。

Description

数据处理方法、数据处理装置、存储介质和电子设备

技术领域

本发明涉及计算机技术领域，具体涉及一种数据处理方法、数据处理装置、存储介质和电子设备。

背景技术

随着计算机技术领域以及互联网技术领域的不断发展，越来越多的用户选择在线上约车平台上发布约车需求。线上约车平台为用户的出行带来了较大的便捷，但有时若用户处于异常状态，会使得约车订单执行过程中发生异常事件，而异常事件的发生会对用户的人身或财产造成损失。

发明内容

有鉴于此,本发明实施例的目的在于提供一种数据处理方法、数据处理装置、存储介质和电子设备，用于较为准确地确定任务执行过程中发生异常事件的概率，从而在后续对发生异常事件的概率较高的任务进行风险警示。

根据本发明实施例的第一方面，提供一种数据处理方法，所述方法包括：

获取目标任务的任务信息，所述任务信息包括目标视频数据以及目标音频数据，所述目标视频数据为所述目标任务执行过程中采集的视频数据，所述目标音频数据为所述目标任务执行过程中采集的音频数据；

基于第一概率预测模型，根据所述目标音频数据以及所述目标视频数据确定第一概率，所述第一概率用于表征目标用户处于异常状态的概率，所述目标用户为所述目标任务对应的用户；

基于第二概率预测模型，根据所述目标视频数据以及所述第一概率确定第二概率，所述第二概率用于表征所述目标任务执行过程中发生异常事件的概率；

响应于所述第二概率满足预定概率条件，向任务处理终端发送第一消息，以对任务处理资源进行警示。

根据本发明实施例的第二方面，提供一种数据处理装置，所述装置包括：

任务信息获取单元，用于获取目标任务的任务信息，所述任务信息包括目标视频数据以及目标音频数据，所述目标视频数据为所述目标任务执行过程中采集的视频数据，所述目标音频数据为所述目标任务执行过程中采集的音频数据；

第一概率确定单元，用于基于第一概率预测模型，根据所述目标音频数据以及所述目标视频数据确定第一概率，所述第一概率用于表征目标用户处于异常状态的概率，所述目标用户为所述目标任务对应的用户；

第二概率确定单元，用于基于第二概率预测模型，根据所述目标视频数据以及所述第一概率确定第二概率，所述第二概率用于表征所述目标任务执行过程中发生异常事件的概率；

第一消息发送单元，用于响应于所述第二概率满足预定概率条件，向任务处理终端发送第一消息，以对任务处理资源进行警示。

根据本发明实施例的第三方面，提供一种计算机可读存储介质，其上存储计算机程序指令，其中，所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。

根据本发明实施例的第四方面，提供一种电子设备，包括存储器和处理器，其中，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。

本发明实施例获取目标任务执行过程中采集的视频数据和音频数据作为任务信息的一部分，然后基于第一概率预测模型，根据音频数据以及视频数据确定目标用户处于异常状态的概率，并基于第二概率预测模型，根据视频数据以及目标用户处于异常状态的概率确定目标任务执行过程中发生异常事件的概率，从而在目标任务执行过程中发生异常事件的概率满足预定概率条件时，向任务处理终端发送第一消息，以对任务处理资源进行警示。本发明实施例将目标用户处于异常状态的概率作为预测异常事件发生的重要指标，可以较为准确且及时地对发生异常事件的概率较高的任务进行风险警示。

附图说明

通过以下参照附图对本发明实施例的描述，本发明的上述以及其它目的、特征和优点将更为清楚，在附图中：

图1是本发明实施例的硬件系统架构的示意图；

图2是本发明第一实施例的数据处理方法的流程图；

图3是本发明第一实施例的一种可选的实现方式中确定第一概率的流程图；

图4是本发明第一实施例的方法确定第二概率的数据流向图；

图5是本发明第二实施例的数据处理装置的示意图；

图6是本发明第三实施例的电子设备的示意图。

具体实施方式

以下基于实施例对本发明进行描述，但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质，公知的方法、过程、流程、元件和电路并没有详细叙述。

此外，本领域普通技术人员应当理解，在此提供的附图都是为了说明的目的，并且附图不一定是按比例绘制的。

除非上下文明确要求，否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

随着网约车业务的不断普及，用户通过在线上约车平台上发布约车订单的方式就可以乘车。线上约车平台为用户的出行带来了较大的便捷，但有时用户若用户处于异常状态(例如，醉酒、神志不清等)，会增加乘车过程中发生异常事件(例如，抢劫事件、性侵事件等)的风险，对用户的人身或者财产造成损失。

图1是本发明实施例的硬件系统架构的示意图。图1所示的硬件系统架构可以包括至少一个任务发布终端、至少一个服务器、至少一个任务处理终端、至少一个交通运输工具以及至少一个音视频采集装置，图1以一个任务发布终端11、一个服务器12、一个任务处理终端13、一个交通运输工具14以及一个音视频采集装置15为例进行说明。图1所示的任务发布终端11以及任务处理终端13为具有定位功能的终端，交通运输工具14可以为车辆，具体可以为具有碰撞传感器的车辆，音视频采集装置15可以为独立采集视频数据的图像采集装置和独立采集音频数据的音频采集装置，也可以为同时采集视频数据和视频数据的音视频采集装置，本实施例不做具体限定。任务发布终端11、服务器12、任务处理终端13以及音视频采集装置15可以通过网络与服务器建立通信连接。

任务发布终端11也即用户终端，用户(也即，乘客)可以通过任务发布终端11在线上约车平台发布约车订单。服务器12通过线上约车平台获取到用户的约车订单后，可以将约车订单分配给持有任务处理终端13的任务处理资源(也即，司机)，以使得任务处理资源可以根据用户需求在合适的时间为用户提供乘车服务。在目标订单的执行过程中(也即，乘客上车后)，音视频采集装置15可以采集交通运输工具14内部的视频数据(也即，目标视频数据)以及音频数据(也即，目标音频数据)，并将目标视频数据和目标音频数据发送给服务器12。服务器12在获取到包括目标视频数据和目标音频数据的目标订单的订单信息后，可以基于第一概率预测模型，根据目标音频数据以及目标视频数据确定目标用户处于异常状态的第一概率，然后基于第二概率预测模型，根据目标视频数据以及第一概率确定目标任务执行过程中发生异常事件的第二概率。若第二概率满足预定概率条件，服务器12向任务处理终端13发送第一消息，以对任务处理资源进行警示。

图2是本发明第一实施例的数据处理方法的流程图。如图2所示，本实施例的方法包括如下步骤：

步骤S100，获取目标任务的任务信息。

在本实施例中，在目标任务执行过程中，音视频采集装置可以采集预定时间长度的视频数据和音频数据，并将采集到的目标视频数据和目标音频数据发送至服务器。服务器在接收到目标视频数据和目标音频数据后，还可以获取目标任务的起点位置、终点位置、第一兴趣范围、第二兴趣范围、碰撞数据、第一轨迹以及第二轨迹中的至少一项作为目标任务的任务信息。在本实施例中，预定时间长度可以为预先设置的时间长度，也可以为目标任务执行过程的时间长度。

其中，第一兴趣范围为目标任务的起点位置所属的兴趣范围，第二兴趣范围为目标任务的终点位置所属的兴趣范围，碰撞数据用于表征目标任务执行过程中是否发生碰撞，第一轨迹为目标用户的移动轨迹，第二轨迹为任务处理资源的移动轨迹。

兴趣范围用于反映位置所属区域的类别，例如酒吧、地铁站、餐厅等。通常异常事件发生在从娱乐场所出发或者去往非娱乐场所的过程中的频率高于从非娱乐场所出发或者去往非娱乐场所的过程中的频率，因此可选地，本实施例的兴趣范围可以被分为两类，一类为娱乐场所，一类为非娱乐场所。可选地，本实施例也可以将一个兴趣点作为一类，例如将酒吧作为一类，本实施例不做具体限定。

碰撞数据可以由车辆上设置的碰撞传感器采集得到。当车辆发生碰撞时，碰撞传感器可以检测到车辆碰撞的强度信号并向服务器发送。

在本实施例中，目标用户为目标任务对应的用户，可以为发布约车订单的用户，也可以为实际乘车的用户，本实施例不做具体限定。第一轨迹可以由任务发布终端以预定周期(例如，1秒)采集目标用户的定位信息并向服务器发送，第二轨迹可以由任务处理终端以预定周期采集任务处理资源的定位信息并向服务器发送。

可选地，在得到第一轨迹和第二轨迹后，服务器还可以确定同一时刻，目标用户与任务处理资源之间的距离，并在距离满足小于预定距离时，确定目标用户与任务处理资源未分离，可以用0来表示，反之则确定目标用户与任务处理资源已分离，可以用1来表示。然后将用于表征各时刻目标用户与任务处理资源是否分离的分离状态序列作为目标任务的任务信息的一部分。

例如，目标用户与任务处理资源在时刻t1的分离状态为0，在时刻t2的分离状态为0，……，在时刻tk(k为大于等于1的预定整数)的分离状态为1，也就是说，在时刻t(k-1)前，目标用户与任务处理资源的分离状态均为0，则分离状态序列为(0,0，…，1)，其中0的数量为(l-1)个。

步骤S200，基于第一概率预测模型，根据目标音频数据以及目标视频数据确定第一概率。

在本实施例中，第一概率用于表征目标用户处于异常状态的概率。异常事件的发生与用户处于异常状态存在一定程度的关联，用户在醉酒、神志不清等异常状态下更容易遭到抢劫、性侵等情况，因此本实施例将第一概率作为判断目标任务执行过程中是否会发生异常事件的重要指标。

图3是本发明第一实施例的一种可选的实现方式中确定第一概率的流程图。如图3所示，本实施例的方法包括如下步骤：

步骤S210，对目标音频数据进行音频识别，确定音频相关信息。

本实施例的音频相关信息是基于目标音频数据得到的、与目标用户和任务处理资源的意图相关的信息。在本步骤中，服务器可以通过各种现有的方式对目标音频数据进行语音识别，例如通过《基于可分离卷积与LSTM的语音情感识别研究.李文杰，罗文俊，李艺文，苏成悦，陈玉怀，曹越.广东工业大学.2020》中记载的方法对目标音频数据进行语音识别以得到目标音频数据对应的语音识别文本，本实施例不做具体限定。

在得到语音识别文本后，服务器可以基于词向量模型确定语音识别文本中各词语的词嵌入向量(也即，词向量)。具体地，服务器可以通过各种现有的方式，例如结巴分词等对语音识别文本进行分词，得到多个词语，然后基于预先训练的词向量模型，分别得到各词语对应的词向量。

词向量模型是一种基于分布假说训练得到的模型。分布假说假设上下文相似的词，语义也是相似的，也就是说，相似的词语具有相似的词向量。上下文也即语境，对于一个文本中的任一词语，该文本中在该词语前面的n(n为大于等于1的整数)个词语和在该词语后面的m(m为大于等于1的整数)个词语均为该词语的上下文。在本实施例中，词向量模型也即word2vec模型，具体可以为skip-gram、CBOW(Continuous Bag-of-Word，连续词袋模型)等。词向量可以基于多个训练文本训练获得，以skip-gram为例，在词向量模型的训练过程中，服务器可以分别将各词语通过one-hot(独热)向量表示，然后以各词语的one-hot向量为输入，以该词语的上下文中各词语的one-hot向量为训练目标对skip-gram进行训练。

在得到语音识别文本对应的多个词语后，服务器可以基于根据多个训练文本得到的全量词表得到各词语的one-hot向量，然后以各词语的one-hot向量为skip-gram的输入，得到各词语的词向量。在基于全量词表得到词语的one-hot向量时，服务器可以按照词语在全量词表中的位置，将该词语对应的位置的元素确定为1，并将其他位置的元素确定为0。例如，全量词表包括：我、你、不要、多少等10000个词，则对于词语“多少”，服务器可以将one-hot向量中的第四个(也即，“多少”对应的位置)元素确定为1，并将其他位置的元素确定为0，得到“多少”对应的one-hot向量(0,0,0,1，…，0)，其中，省略号包括9995个0。

在得到各词语对应的词向量后，服务器可以根据各词语的词向量以及预定词表确定各词语对应的相似度。在本实施例中，预定词表为全量词表中与异常状态以及异常事件中的至少一项相关的敏感词语构成的词表，因此服务器根据预定词表可以有效识别乘车过程中用户以及任务处理资源的异常意图，从而为异常事件的发生起到积极的防护作用。与语音识别文本中各词语的词向量的获得方式相似，预定词表中各敏感词语的词向量也是基于全量词表以及词向量模型获得的。

在确定各词语的相似度时，服务器可以将各词语的词向量分别与各敏感词语的词向量进行相似度计算，然后将各词语与各敏感词语的相似度中的最大值作为各词语的相似度。例如，敏感词语包括词语w1、词语2和词语w3，服务器在确定词语“多少”对应的相似度时，可以分别计算“多少”与词语w1的词向量的相似度、“多少”与词语w2的词向量的相似度以及“多少”与词语w3的词向量的相似度，然后将“多少”与词语w1的词向量的相似度(也即，相似度中的最大值)确定为“多少”对应的相似度。

在本实施例中，服务器可以通过各种现有相似度计算方式来计算文本中词语与敏感词语的相似度，例如余弦值、欧氏距离、皮尔逊相关度等，本实施例不做具体限定。

同时，服务器还可以根据各词语的词向量得到语音识别文本的文本向量。具体地，服务器可以将语音识别文本中各词语的词向量的均值向量(也即，各词语的词向量中各相同位置的元素的平均值构成的向量)作为语音识别文本的文本向量。

在得到语音识别文本中各词语的相似度以及语音识别文本的文本向量后，服务器可以根据各相似度以及文本向量确定目标音频数据对应的音频相关信息。

步骤S220，对目标视频数据进行图像识别，确定视频相关信息。

本实施例的视频相关信息为基于目标视频图像得到的、与目标用户的数量、位置等相关的信息。在本步骤中，服务器可以基于各种现有的方式对目标视频数据进行图像识别，例如通过《一种基于双网络模型的图像识别新方法.马林妹，汤晓，王银河.广东工业大学，广州俊氏电气有限公司研发中心.2020》中记载的方法对目标视频数据进行图像识别以得到视频相关信息，本实施例不做具体限定。

本实施例的视频相关信息至少包括目标用户的数量以及目标用户与任务处理资源的相对位置，其中，在任务处理资源的车辆为左侧驾驶室的车辆时，相对位置可以包括在任务处理资源右侧、在任务处理资源后方、在任务处理资源右后方等。

步骤S230，基于第一概率预测模型，根据音频相关信息以及视频相关信息确定第一概率。

在确定音频相关信息以及视频相关信息后，在本步骤中，服务器可以以音频相关信息以及视频相关信息为第一概率预测模型的输入，得到目标任务对应的第一概率。

在本实施例中，第一概率预测模型可以为决策树、贝叶斯分类器、神经网络等，并根据第一样本集合训练获得。第一概率预测模型的选择可以根据历史数据中各参数的特征和/或实际需求确定。用于训练第一概率预测模型的第一样本集合包括多个历史任务的第一历史任务信息，其中，第一历史任务信息包括历史任务的异常状态标识。异常状态标识为第二概率预测模型的训练目标，若历史任务对应的历史用户在历史任务执行过程中处于异常状态，则异常状态标识可以为1，反之可以为0。类似地，第一历史任务信息同样包括各历史任务对应的历史视频相关信息和历史音频相关信息，还可以包括其他历史信息。

以神经网络为例，神经网络全称人工神经网络(Artificial Neural Network，ANN)，是由大量处理单元互联形成的信息处理模型。常见的人工神经网络包括卷积神经网络(Convolutional Neural Network，CNN)、循环神经网络(Recurrent Neural Network，RNN)等。ANN具有非线性(适于处理非线性信息)、非局限性(也即，一个系统的整体状态取决于处理单元间的相互作用)、非常定性(也即，具有自适应、自组织、自学习能力，能够在处理信息的过程中不断进行自我学习)和非凸性(模型的激活函数具有多个极值，这使得模型具有多个较为稳定的平衡态，从而使得模型的变化是多样的)的特点，因此能够广泛地应用于各种领域，进行较为准确的数据预测。

在第一概率预测模型的训练过程中，模型的输入可以包括各历史任务的历史视频相关信息以及历史音频相关信息等历史信息，训练目标为各历史任务对应的异常状态标识。在基于上述训练方式得到训练完毕的第一概率预测模型后，服务器可以以目标任务的视频相关信息、音频相关信息以及其他任务信息为输入，得到目标任务对应的第一概率。

步骤S300，基于第二概率预测模型，根据目标视频数据以及第一概率确定第二概率。

在本实施例中，第二概率用于表征目标任务执行过程中发生异常事件的概率。在本步骤中，服务器同样可以基于目标视频数据得到视频相关信息，然后根据视频相关信息和第一概率，基于第二概率预测模型得到目标任务对应的第二概率。

与第一概率预测模型相似，在本实施例中，第二概率预测模型可以为决策树、贝叶斯分类器、神经网络等，并根据第二样本集合训练获得。第二概率预测模型的选择可以根据历史数据中各参数的特征和/或实际需求确定。用于训练第二概率预测模型的第二样本集合包括多个历史任务的第二历史任务信息，其中，第二历史任务信息包括历史任务的异常事件标识。异常事件标识为第二概率预测模型的训练目标，若在历史任务执行过程中发生过异常事件(也即，接到过历史用户关于异常事件的真实投诉)，则异常事件标识可以为1，反之可以为0。类似地，第二历史任务信息同样包括各历史任务对应的历史视频相关信息，还可以包括其他历史信息。

在第一概率预测模型的训练过程中，模型的输入可以包括各历史任务的历史视频相关信息等历史信息，训练目标为各历史任务对应的异常事件标识。在基于上述训练方式得到训练完毕的第二概率预测模型后，服务器可以以目标任务的视频相关信息、第一概率以及其他任务信息为输入，得到目标任务对应的第二概率。

步骤S400，响应于第二概率满足预定概率条件，向任务处理终端发送第一消息。

预定概率条件用于表征目标任务执行过程中发生异常事件的概率大于第一概率值，有较大可能发生异常事件，因此在第二概率满足预定概率条件时，服务器可以向任务处理终端发送第一消息，以对任务处理资源进行警示，从而从当事人的角度，在一定程度上遏制异常事件的发生，降低用户的人身或财产受到侵害的可能。

在一些可选的实现方式中，本实施例还可以包括如下步骤：

步骤S500，向预定终端发送第二消息。

与步骤S400相似，在本步骤中，服务器可以在第二概率满足预定概率条件时向预定终端发送第二消息，以对目标任务执行过程中存在异常事件的风险进行提示，从而从第三方的角度，在一定程度上遏制异常事件的发生，降低用户的人身或财产受到侵害的可能。在本实施例中，预定终端可以为线上约车平台方的管理人员所持有的终端，也可以为警卫人员所持有的终端，还可以为其他的第三方终端。

可选地，在本步骤前，为了使得第二消息更具有针对性，本实施例还可以通过如下步骤确定第二消息：

步骤S500A，响应于第二概率满足预定概率条件，根据任务信息确定目标任务对应的至少一个标签。

在本步骤中，服务器可以根据任务信息中的至少部分信息确定目标任务对应的至少一个标签。例如，若第一轨迹与第二轨迹满足预定时间段内未分离，服务器可以确定目标任务的一个标签为“轨迹未分离”；若第一概率大于第二概率值，可以认为目标用户处于异常状态，因此服务器可以确定目标任务的一个标签为“异常状态”；若目标任务执行时段属于晚间或夜间，则服务器可以确定目标任务的一个标签为“深夜”。

步骤S500B，根据至少一个标签确定第二消息。

在确定目标任务对应的至少一个标签后，服务器可以根据至少一个标签确定第二消息，以使得预定终端可以对目标任务的异常点进行展示，从而使得持有预定终端的人员可以对目标任务进行更及时更有效的干预。具体地，服务器可以将目标任务的至少一个标签作为第二消息的一部分。

图4是本发明第一实施例的方法确定第二概率的数据流向图。如图4所示，目标任务的任务信息包括目标音频数据41、目标视频数据42以及其他信息43，服务器可以对目标音频数据41进行语音识别，得到音频相关信息44，并对目标视频数据42进行图像识别，得到视频相关信息45，然后以音频相关信息44、视频相关信息45以及其他信息43作为第一概率预测模型的输入，得到第一概率46，然后以第一概率46、视频相关信息45以及其他信息43作为第二概率预测模型的输入，得到第二概率。

本实施例获取目标任务执行过程中采集的视频数据和音频数据作为任务信息的一部分，然后基于第一概率预测模型，根据音频数据以及视频数据确定目标用户处于异常状态的概率，并基于第二概率预测模型，根据视频数据以及目标用户处于异常状态的概率确定目标任务执行过程中发生异常事件的概率，从而在目标任务执行过程中发生异常事件的概率满足预定概率条件时，向任务处理终端发送第一消息，以对任务处理资源进行警示。本实施例将目标用户处于异常状态的概率作为预测异常事件发生的重要指标，可以较为准确且及时地对发生异常事件的概率较高的任务进行风险警示。

图5是本发明第二实施例的数据处理装置的示意图。如图5所示，本实施例的装置包括任务信息获取单元51、第一概率确定单元52、第二概率确定单元53和第一消息发送单元54。

其中，任务信息获取单元51用于获取目标任务的任务信息，所述任务信息包括目标视频数据以及目标音频数据，所述目标视频数据为所述目标任务执行过程中采集的视频数据，所述目标音频数据为所述目标任务执行过程中采集的音频数据。第一概率确定单元52用于基于第一概率预测模型，根据所述目标音频数据以及所述目标视频数据确定第一概率，所述第一概率用于表征目标用户处于异常状态的概率，所述目标用户为所述目标任务对应的用户。第二概率确定单元53用于基于第二概率预测模型，根据所述目标视频数据以及所述第一概率确定第二概率，所述第二概率用于表征所述目标任务执行过程中发生异常事件的概率。第一消息发送单元54用于响应于所述第二概率满足预定概率条件，向任务处理终端发送第一消息，以对任务处理资源进行警示。

图6是本发明第三实施例的电子设备的示意图。图6所示的电子设备为通用数据处理装置，其包括通用的计算机硬件结构，其至少包括处理器61和存储器62。处理器61和存储器62通过总线63连接。存储器62适于存储处理器61可执行的指令或程序。处理器61可以是独立的微处理器，也可以是一个或者多个微处理器集合。由此，处理器61通过执行存储器62所存储的命令，从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线63将上述多个组件连接在一起，同时将上述组件连接到显示控制器64和显示装置以及输入/输出(I/O)装置65。输入/输出(I/O)装置65可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地，输入/输出(I/O)装置65通过输入/输出(I/O)控制器66与系统相连。

其中，存储器62可以存储软件组件，例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。

上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应理解，流程图和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器，以产生机器，使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。

同时，如本领域技术人员将意识到的，本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此，本发明实施例的各个方面可以采取如下形式：完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外，本发明的方面可以采取如下形式：在一个或多个计算机可读介质中实现的计算机程序产品，计算机可读介质具有在其上实现的计算机可读程序代码。

可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置，或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项：具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中，计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。

计算机可读信号介质可以包括传播的数据信号，所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式，包括但不限于：电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质：不是计算机可读存储介质，并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。

用于执行针对本发明各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写，所述编程语言包括：面向对象的编程语言如Java、Smalltalk、C++、PHP、Python等；以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行；部分地在用户计算机上且部分地在远程计算机上执行；或者完全地在远程计算机或服务器上执行。在后一种情况下，可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机，或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种数据处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

向预定终端发送第二消息，以对所述目标任务执行过程中存在异常事件的风险进行提示。

3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

响应于所述第二概率满足所述预定概率条件，根据所述任务信息确定所述目标任务对应的至少一个标签；

根据所述至少一个标签确定所述第二消息。

4.根据权利要求1-3中任一项所述的方法，其特征在于，所述基于第一概率预测模型，根据所述目标音频数据以及所述目标视频数据确定第一概率包括：

对所述目标音频数据进行音频识别，确定音频相关信息；

对所述目标视频数据进行图像识别，确定视频相关信息；

基于所述第一概率预测模型，根据所述音频相关信息以及所述视频相关信息确定所述第一概率。

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述对所述目标音频数据进行音频识别，确定音频相关信息包括：

对所述目标音频数据进行语音识别，得到语音识别文本；

基于词向量模型确定所述语音识别文本中各词语的词向量；

根据各所述词向量以及预定词表确定各所述词语对应的相似度；

根据各所述词向量确定所述语音识别文本的文本向量；

根据各所述相似度以及所述文本向量确定所述音频相关信息。

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述根据各所述词向量确定所述语音识别文本的文本向量包括：

计算各所述词向量的均值向量作为所述文本向量。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述对所述目标视频数据进行图像识别，确定视频相关信息包括：

对所述目标视频数据进行图像识别，确定目标用户的用户数量以及与所述任务处理资源的相对位置作为所述视频相关信息。

8.根据权利要求1-7中任一项所述的方法，其特征在于，所述基于第二概率预测模型，根据所述目标视频数据以及所述第一概率确定第二概率包括：

基于所述第二概率预测模型，根据所述视频相关信息以及所述第一概率确定所述第二概率。

9.根据权利要求1-8中任一项所述的方法，其特征在于，所述目标任务为网约车的约车订单；

所述任务信息还包括所述目标任务的起点位置、终点位置、第一兴趣范围、第二兴趣范围、碰撞数据、第一轨迹以及第二轨迹中的至少一项，所述第一兴趣范围为所述起点位置所属的兴趣范围，所述第二兴趣范围为所述终点位置所属的兴趣范围，所述碰撞数据用于表征所述目标任务执行过程中是否发生碰撞，所述第一轨迹为所述目标用户的移动轨迹，所述第二轨迹为所述任务处理资源的移动轨迹。

10.根据权利要求1-9中任一项所述的方法，其特征在于，所述第一概率预测模型根据第一样本集合训练获得，所述第一样本集合包括多个历史任务的第一历史任务信息，所述第一历史任务信息包括所述历史任务的异常状态标识，所述异常状态标识用于表征对应的历史用户是否处于异常状态；

所述第二概率预测模型根据第二样本集合训练获得，所述第二样本集合包括多个历史任务的第二历史任务信息，所述第二历史任务信息包括所述历史任务的异常事件标识，所述异常事件标识用于表征所述历史任务执行过程中是否发生异常事件。

11.一种数据处理装置，其特征在于，所述装置包括：

12.一种计算机可读存储介质，其上存储计算机程序指令，其特征在于，所述计算机程序指令在被处理器执行时实现如权利要求1-10中任一项所述的方法。

13.一种电子设备，包括存储器和处理器，其特征在于，所述存储器用于存储一条或多条计算机程序指令，其中，所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-10中任一项所述的方法。