CN112016316A

CN112016316A - 一种识别方法和系统

Info

Publication number: CN112016316A
Application number: CN202010894361.0A
Authority: CN
Inventors: 马凯
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2020-08-31
Filing date: 2020-08-31
Publication date: 2020-12-01

Abstract

本申请实施例公开了一种识别方法和系统。所述识别方法包括：获取待识别数据；将所述待识别数据输入识别模型中，其中，所述识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据共同训练自注意力模型后获得；以及根据所述待识别数据和所述识别模型，确定所述待识别数据是否与所述目标相关。本申请可以判断乘车人是否存在安全相关的问题，提高了识别的准确性，可在乘车人乘车过程中提供安全问题保障服务，保障乘车人的出行安全。

Description

一种识别方法和系统

技术领域

本申请涉及数据识别领域，特别涉及一种识别方法和系统。

背景技术

在数据识别领域，通常根据识别出的特征判断所识别数据的性质。例如，在自然语言处理技术领域，识别文本中包含的关键词，然后再根据文本中包含的关键词判断文本的含义。再例如，在图像识别领域，识别图像中包含的物体，判断图像表示的含义。但若只关注识别数据的特有特征，数据识别的含义实际会存在界限不明或出现混淆的情况。

以乘车出行服务中乘客的安全问题为例，传统的智能客服判定乘客是否存在安全问题时是通过判别乘客沟通过程中是否提及了安全问题相关的词汇实现。实际中，乘客与客服沟通过程中可能存在安全问题界限不明、出现混淆的情况。例如包含“司机存在危险驾驶”相关的语句，与包含“什么是危险驾驶行为”的语句中，均有“危险驾驶”这一词汇。传统的识别方式，容易将这两种情况均判定为存在安全问题，识别不准确的同时，容易导致人工客服工作繁重。

因此需要提供一种高效准确的识别方法，提高数据识别的准确性，避免数据识别过程中存在的界限不明或出现混淆的情况。

发明内容

本申请实施例之一提供一种识别方法。所述识别方法包括：获取待识别数据；将所述待识别数据输入识别模型中，其中，所述识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据共同训练自注意力模型后获得；以及根据所述待识别数据和所述识别模型，确定所述待识别数据是否与所述目标相关。

在一些实施例中，所述识别方法还包括训练所述自注意力模型获取所述识别模型，所述训练过程包括：获取两套或以上的多套训练数据，其中，所述多套训练数据包括至少一套与所述目标相关的第一训练数据，以及至少一套与所述目标无关的第二训练数据；以及基于所述多套训练数据，通过自注意力机制训练所述自注意力模型，生成所述识别模型。

在一些实施例中，所述多套训练数据包括多套语料中每个单词经预处理生成的词向量，所述训练过程包括：对于每个单词，获取所述单词的两种或以上词向量，所述两种或以上的词向量与不同的上下文相关；拼接所述两种或以上词向量以获取共有词向量；以及将所述共有词向量与每套语料除该单词外其他单词的词向量通过自注意力机制确定该单词的注意力。

在一些实施例中，拼接所述一种或以上词向量以获取共有词向量包括：将每个单词在所述多套训练数据中的词向量加权求和。

在一些实施例中，所述多套语料为两套语料，所述两套语料包括一套与安全问题相关的语料和一套与安全问题无关的语料。

在一些实施例中，所述预处理过程包括：使用词向量生成算法，生成所述单词的词向量。

在一些实施例中，所述词向量生成算法为Word2Vec。

在一些实施例中，所述识别方法进一步包括：基于识别出所述待识别数据是否与所述目标相关的结果，执行相应的措施。

在一些实施例中，所述目标与安全问题相关，所述措施包括监控人员对驾驶行为人进行继续沟通、持续监控、警告中的一种或多种组合。

本申请实施例之一提供一种识别系统，包括获取模块以及数据识别模块；所述获取模块用于获取待识别数据；所述数据识别模块用于将所述待识别数据输入识别模型中；其中，所述识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据共同训练自注意力模型后获得；根据所述待识别数据和所述识别模型，确定所述待识别数据是否与所述目标相关。

在一些实施例中，所述系统还包括训练模块；所述训练模块用于获取所述多套训练数据，其中，所述多套训练数据包括至少一套与所述目标相关的第一训练数据，以及至少一套与所述目标无关的第二训练数据；以及，基于所述多套训练数据，通过自注意力机制训练所述自注意力模型，生成所述识别模型。

在一些实施例中，所述词向量生成算法为Word2Vec。

本申请实施例之一提供一种识别装置，包括处理器，所述处理器用于执行所述识别方法。

本申请实施例之一提供一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行所述识别方法。

附图说明

本申请将以示例性实施例的方式进一步说明，这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的，在这些实施例中，相同的编号表示相同的结构，其中：

图1是根据本申请一些实施例所示的识别系统的应用场景示意图；

图2是根据本申请一些实施例所示的识别方法的示例性流程图；

图3是根据本申请一些实施例所示的识别模型训练方法的示例性流程图；

图4是根据本申请一些实施例所示的确定单词的注意力方法的示例性流程图；以及

图5是根据本申请一些实施例所示的识别系统的模块图。

具体实施方式

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本申请的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明，图中相同标号代表相同结构或操作。

应当理解，本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而，如果其他词语可实现相同的目的，则可通过其他表达来替换词语。

如本申请和权利要求书中所示，除非上下文明确提示例外情形，“一”、“一个”、“一种”和/或“该”等词并非特指单数，也可包括复数。一般说来，术语“包括”与“包含”仅提示包括已明确标识的步骤和元素，而这些步骤和元素不构成一个排它性的罗列，方法或者设备也可能包含其它的步骤或元素。

本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是，前面或后面操作不一定按照顺序来精确地执行。相反，可以按照倒序或同时处理各个步骤。同时，也可以将其他操作添加到这些过程中，或从这些过程移除某一步或数步操作。

本申请的实施例可以应用于不同的运输系统，不同的运输系统包括但不限于陆地、海洋、航空、航天等中的一种或几种的组合。例如，出租车、专车、顺风车、巴士、代驾、火车、动车、高铁、船舶、飞机、热气球、无人驾驶的交通工具、收/送快递等应用了管理和/或分配的运输系统。本申请的不同实施例应用场景包括但不限于网页、浏览器插件、客户端、定制系统、企业内部分析系统、人工智能机器人等中的一种或几种的组合。应当理解的是，本申请的系统及方法的应用场景仅仅是本申请的一些示例或实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图将本申请应用于其它类似情景。例如，其他类似的引导用户停车系统。

本申请描述的“乘客”、“乘客端”、“用户终端”、“顾客”、“需求者”、“服务需求者”、“消费者”、“消费方”、“使用需求者”等是可以互换的，是指需要或者订购服务的一方，可以是个人，也可以是工具。同样地，本申请描述的“司机”、“司机端”、“提供者”、“供应者”、“服务提供者”、“服务者”、“服务方”等也是可以互换的，是指提供服务或者协助提供服务的个人、工具或者其他实体等。另外，本申请描述的“用户”可以是需要或者订购服务的一方，也可以是提供服务或者协助提供服务的一方。

图1是根据本申请一些实施例所示的识别系统100的应用场景示意图。

识别系统100可以用于任何需要进行数据识别以便根据识别结果采取相应措施的场景。例如，在图像识别领域，针对人体危险动作的姿势识别，如何判别危险假动作(例如假装攻击他人)及危险动作(例如具有真实攻击意图的袭击动作)，以避免针对危险假动作进行报警，而针对危险动作进行报警，利用识别系统100可以将危险假动作及危险动作进行识别并区分。再例如，在自然语言处理及语音识别领域，针对文字或语音内容进行识别，如何判别文字或语音内容具体是否与安全问题(例如文字或语音内容存在与危险驾驶相关的谈话内容)相关，以避免针对不存在安全问题的文字或语音内容(例如什么是危险驾驶的疑问句)进行报警，利用识别系统100可以将不存在安全问题的文字或语音内容与相近的存在安全问题的文字或语音内容进行识别并区分。除此之外，识别系统100还可以对经济、文化、教育、医疗、公共管理等各行各业对相近容易产生错误识别的数据区分而避免对后续执行措施产生影响。

在一些实施例中，针对数据进行识别通常根据识别出的特征判断所识别数据的性质。但若只关注识别数据的特有特征，数据识别的含义实际会存在界限不明或出现混淆的情况。以乘车出行服务中乘客的安全问题为例，传统的智能客服判定乘客是否存在安全问题时是通过判别乘客沟通过程中是否提及了安全问题相关的词汇实现。实际中，乘客与客服沟通过程中可能存在安全问题界限不明、出现混淆的情况。例如包含“司机存在危险驾驶”相关的语句，与包含“什么是危险驾驶行为”的语句中，均有危险驾驶词汇。传统的识别方式，容易将这两种情况均判定为存在安全问题。识别不准确的同时，容易导致人工客服工作繁重。在一些实施例中，识别系统100可以将存在混淆的数据进行区分识别，提高数据识别的准确性，避免数据识别过程中存在的界限不明或出现混淆的情况。

如图1所示，识别系统100可以包括服务器110、网络120、数据获取终端130及存储设备140。

服务器110可以部署有识别模型，识别模型可以针对待识别数据进行识别并判定是否与目标相关，从而避免对与目标相近的数据误判。在一些实施例中，识别模型识别待识别数据是否与目标相关可以是通过判断待识别数据的注意力确定的，其中，注意力可以捕捉数据或特征的内部相关性，以通过数据或特征的内部相关性对数据定义，避免根据数据或特征的某个具体特征将数据定义而产生的含义混淆或识别不准确的情况。在一些实施例中，识别模型可以是由与目标相关的第一训练数据和与目标无关的第二训练数据训练自注意力模型获得。关于识别模型的示例性识别过程可以参见图2，步骤210～步骤270；关于识别模型的示例性训练生成过程可以详见附图3、4，步骤320～步骤340。

在一些实施例中，服务器110可以是单个服务器，也可以是服务器组。服务器组可以是经由接入点连接到网络的集中式服务器组，或者经由至少一个接入点分别连接到网络的分布式服务器组。在一些实施例中，服务器110可以在云平台上实施。仅作为示例，云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。

网络120连接识别系统100的各组成部分，使得各部分之间可以进行通讯，以促进信息和/或数据的交换。在一些实施例中，图像识别系统100中的至少一个组件(例如，服务器110、数据获取终端130、存储设备140)可以经由网络120将信息和/或数据发送给识别系统100中的其他组件。

在一些实施例中，识别系统100中各部分之间的网络120可以是有线网络或无线网络中的任意一种或多种。例如，网络120可以包括电缆网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(LAN)、广域网络(WAN)、无线局域网络(WLAN)、城域网(MAN)、公共交换电话网络(PSTN)、蓝牙网络^TM(Bluetooth)、紫蜂网络^TM(ZigBee)、近场通信(NFC)、设备内总线、设备内线路、线缆连接等或其任意组合。每两个部分之间的网络连接可以是采用上述一种方式，也可以是采取多种方式。

在一些实施例中，网络120可以包括至少一个网络接入点。例如，网络120可以包括有线或无线网络接入点，如基站和/或互联网交换点120-1、120-2、……，通过识别系统100的至少一个部件可以连接到网络120以交换数据和/或信息。

数据获取终端130可以获取提供给服务器110进行识别处理的识别数据(例如图像、视频、语音或文字等)。在一些实施例中，数据获取终端的所有者可以是工作人员(例如司机)、用户(例如乘客、商场顾客等)。在一些实施例中，数据获取终端130的所有者可以是除用户本人之外的其他人。例如，数据获取终端130的所有者A可以使用数据获取终端130来发送针对乘客B的服务请求，和/或从服务器110接收服务确认和/或信息或指令。数据获取终端130可以经由网络120与服务器110通信。

在一些实施例中，数据获取终端130可以包括各类具有信息接收和/或发送功能的设备。数据获取终端130可包括多个终端130-1、130-2、......、130-n。例如，数据获取终端1300可以包括移动设备130-1、平板计算机130-2、膝上型计算机130-3、车载终端设备130-4等或其任何组合。具体地，车载终端设备130-4可以包括内置计算机、车辆内置电视、内置平板电脑等。上述示例仅用于说明设备范围的广泛性而非对其范围的限制。

存储设备140可以储存数据和/或指令。数据可以包括各类待识别数据(例如图像、视频、语音或文字等)、识别模型(例如凸显识别算法、语音识别算法等)、用户资料(如姓名、性别等)、用户实时信息(乘坐车辆信息、上车位置信息)等。在一些实施例中，存储设备140可以存储从数据获取终端130获得的数据。例如，图像、视频、语音或文字等。又例如，存储设备140可以存储与服务器110处理相关的数据，例如识别模型训练数据(如第一训练数据、第二训练数据等)等。

在一些实施例中，存储设备140可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器(ROM)等或其任意组合。示例性的大容量存储器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。示例性易失性读写存储器可以包括随机存取存储器(RAM)。示例性RAM可包括动态随机存取存储器(DRAM)、双倍数据速率同步动态随机存取存储器(DDRSDRAM)、静态随机存取存储器(SRAM)、晶闸管随机存取存储器(T-RAM)和零电容随机存取存储器(Z-RAM)等。示例性只读存储器可以包括掩模型只读存储器(MROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(PEROM)、电可擦除可编程只读存储器(EEPROM)、光盘只读存储器(CD-ROM)和数字多功能磁盘只读存储器等。在一些实施例中，存储设备140可在云平台上实现。仅作为示例，云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。

在一些实施例中，识别系统100中的至少一个组件可以经由网络120访问存储在存储设备140中的数据或指令。在一些实施例中，存储设备140可以作为后端存储器直接连接到服务器110。

应当注意的是，上述有关识别系统100的描述仅仅是为了示例和说明，而不限定本申请的适用范围。对于本领域技术人员来说，在本申请的指导下可以对识别系统100进行各种修正和改变。然而，这些修正和改变仍在本申请的范围之内。

图2是根据本申请一些实施例所示的识别方法200的示例性流程图。如图2所示，所示识别方法200可以包括：

步骤210，获取待识别数据。具体的，该步骤可以由获取模块510执行。

在一些实施例中，待识别数据可以是指用于识别模型识别判断是否与目标相关的数据，待识别数据包括图像、视频、语音、文字资料等，待识别数据具体可以是数据获取终端130收集获取的。以乘车出行服务中乘客的安全问题为例，待识别数据可以是乘客持有的移动设备130-1(如手机)获取的语音资料，待识别数据还可以是车辆搭载的车载终端设备130-4录取的语音资料，通过识别移动设备130-1或车载终端设备130-4录取的语音资料判断乘客是否存在安全问题。以公共智能安防为例，待识别数据可以是监控设备获取的图像或视频资料，通过识别图像或视频资料是否存在人体危险动作判断是否需要启动报警或其他措施。

步骤230，将待识别数据输入识别模型中。具体的，该步骤可以由识别模块520执行。

在一些实施例中，识别模型可以是指用来区分相近似的待识别数据，以避免待识别数据被错误识别并区分。以乘车出行服务中乘客的安全问题为例，相近似的待识别数据可以是指例如“什么是危险驾驶”、“司机正处于危险驾驶行为”等明显不存在安全问题与存在安全问题的图像、语音或文字资料。

在一些实施例中，识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据训练自注意力模型获得。在一些实施例中，目标可以是指安全问题，安全问题可以包括乘车出行服务中乘客的安全问题、公共场合的安全问题、商场的防盗问题等。在一些实施例中，与目标相关可以是指安全问题相关，与目标无关可以是指与安全问题无关。示例性的，“什么是危险驾驶”与安全问题无关，“司机正处于危险驾驶行为”与安全问题相关。在一些实施例中，自注意力模型可以包括注意力层。在一些实施例中，与目标相关的第一训练数据和与目标无关的第二训练数据训练自注意力模型获得识别模型可以包括：针对每个训练数据通过自注意力模型的注意力层以训练注意力模型权重，具体的，注意力模型权重可以包括计算注意力使用的查询向量、键向量、值向量相对应的权重矩阵W_q、W_k、W_v。在一些实施例中，注意力可以捕捉数据或特征的内部相关性，以通过数据或特征的内部相关性对数据定义，避免根据数据或特征的某个具体特征将数据定义而产生的含义混淆或识别不准确的情况。具体的，关于识别模型的训练生成过程可以详见图3，步骤320～步骤340。

步骤250，根据待识别数据和识别模型，确定待识别数据是否与目标相关。具体的，该步骤可以由识别模块520执行。

在一些实施例中，将待识别数据输入识别模型后，可以根据待识别数据和识别模型，确定待识别数据是否与目标相关。在一些实施例中，识别模型识别待识别数据是否与目标相关可以是通过判断待识别数据的注意力确定的。示例性的，以“什么是危险驾驶”、“司机正在进行危险驾驶行为”为例，由于“什么是危险驾驶”语句中“什么”与“危险驾驶”之间的关联度较低，经过识别模型的注意力层后，输出“什么”与“危险驾驶”之间相互注意力较低的结果，最终再将“什么”与“危险驾驶”相互注意力较低的结果通过分类器进行分类，并判别为与目标无关，因此最终可以判定待识别数据(“什么是危险驾驶”)与目标(安全问题)无关，而“司机正在进行危险驾驶行为”语句中“进行”与“危险驾驶”之间的关联度较高，经过识别模型的注意力层后，输出“进行”与“危险驾驶”之间相互注意力较高的结果，最终再将“进行”与“危险驾驶”之间相互注意力较高的结果通过分类器进行分类，并判别为与目标相关，因此最终可以判断待识别数据(“司机正在进行危险驾驶行为”)与目标(安全问题)相关。在一些实施例中，分类器可以包括感知器方法、最小平方误差法、SVM法、神经网络方法、径向基(RBF)方法、softmax分类等。此外，关于注意力计算过程可以详见附图4，步骤450。

步骤270，基于识别出待识别数据是否与目标相关的结果，执行相应的措施。具体的，该步骤可以由执行模块540执行。

在一些实施例中，可以基于识别出待识别数据是否与目标(如安全问题)相关的结果，执行相应的措施以保证识别结果的及时利用。在一些实施例中，与目标相关的结果可以是指判断语音资料是否存在与安全问题相关的结果。示例性的，例如，与安全问题相关的结果可以是指根据语音资料判断司机存在超速驾驶、闯红灯等不遵守交通规则的驾驶行为；再如，与安全问题相关的结果可以是指根据语音资料判断司机存在侵害、袭击等伤害乘车人的行为。

在一些实施例中，执行相应的措施可以包括向与目标相关的对象发出继续沟通、持续监控、警告中的一种或多种组合。在一些实施例中，当识别系统100识别出待识别数据与目标(如安全问题)相关时，识别系统100可以对驾驶行为人发出继续沟通、持续监控、警告等，以避免驾驶行为人给乘车人带来伤害。在一些实施例中，驾驶行为人可以包括公交司机、出租车司机等驾驶公共交通车辆的驾驶人。

图3是根据本申请一些实施例所示的识别模型的训练方法300的示例性流程图。如图3所示，所示识别模型的训练方法300可以包括：

步骤320，获取两套或以上的多套训练数据，其中，多套训练数据包括至少一套与目标相关的第一训练数据，以及至少一套与目标无关的第二训练数据。具体的，该步骤可以由训练模块530执行。

训练数据可以是指用于输入自注意力模型训练生成识别模型的数据集合，训练数据可以包括图像、视频、语音、文本或者其处理生成的数据(如图像特征矩阵、词向量)等。在一些实施例中，获取训练数据可以是从存储设备140中得到的。在一些实施例中，获取训练数据可以是通过数据获取终端130得到的。

多套训练数据可以包括至少一套与目标相关的第一训练数据，以及至少一套与目标无关的第二训练数据。在一些实施例中，一组数据与否与目标相关可以根据单词的上下文进行判断。以乘车出行服务中乘客的安全问题为例，“什么是危险驾驶”与安全问题无关、“司机正处于危险驾驶行为(如超速行驶)”与安全问题相关，则第一训练数据可以包含如“什么是危险驾驶”与安全问题无关的语音资料，第二训练训练数据可以包含如“司机正处于危险驾驶行为(如超速行驶)”与安全问题相关的语音资料。在一些实施例中，第一训练数据可以包含文本如“什么是危险驾驶”，或该本文对应的词向量，第二训练数据可以包含文本如“司机正处于危险驾驶行为(如超速行驶)”，或该文本对应词向量。在一些实施例中，与文本对应的词向量可以采用词向量生成算法(例如Word2Vec)生成。在一些实施例中，第一训练数据及第二训练数据均可以包括训练样本及相对应标识样本，通过输入训练样本及相对应标识样本以训练从训练样本得到相对应标识样本的识别过程。在一些实施例，标识样本可以是基于人工标记或自动标记完成。其中，标记可以是将训练样本的语句进行赋值。以“什么是危险驾驶”、“司机正处于危险驾驶行为”为例，对“什么是危险驾驶”标记为“0”，对“司机正处于危险驾驶行为”赋值为“1”，其中“0”和“1”也可以被其他符号替代。在一些实施例中，自动标记标识样本可以是基于分类思想进行的。在一些实施例中，基于分类思想的标记方法可以包括有监督学习的分类标记方法、无监督学习的分类标记方法。例如，有监督学习的分类标记方法可以是基于高斯混合模型的，再例如，有监督学习的分类标记方法可以是基于受限玻尔兹曼机进行特征学习并应用于标注中的。

步骤340，基于多套训练数据，通过自注意力机制训练自注意力模型，生成识别模型。具体的，该步骤可以由训练模块530执行。

获取多套训练数据后，可以基于多套训练数据，通过自注意力机制训练自注意力模型，生成识别模型。在一些实施例中，自注意力机制可以是指模仿生物观察行为的内部过程，减少对外部信息的依赖，捕捉数据或特征的内部相关性的仿生性数据处理过程。例如，人类在阅读时，通常只有少量要被读取的词会被关注和处理，自注意力机制可以模拟该过程，将阅读的文本转化为数据进行处理，关注少量要被读取的词即可理解语义。

在一些实施例中，自注意力模型可以是指自注意力机制的具体训练模型。在一些实施例中，自注意力模型可以包括注意力层。在一些实施例中，注意力层可以计算训练样本中每个单词的注意力，以便获取训练样本中该单词相对于其他单词的关联度，关于计算每个单词的注意力的详细过程可以参见附图4，步骤410～450。在一些实施例中，获取训练样本对应模型的输出结果后，可以与期望标识样本相比较，例如比较模型最后的输出值(0-1)与期望标识样本(0或1)的差异，若训练样本模型最后的输出值与期望标识样本的差异较大，则可以采用反向传播算法调整注意力模型的权重，以便于获取权重调整好的识别模型。在一些实施例中，注意力模型的权重可以包括计算注意力使用的查询向量、键向量、值向量相对应的权重矩阵W_q、W_k、W_v。

图4是根据本申请一些实施例所示的确定单词注意力的方法400的示例性流程图。

多套训练数据包括多套语料中每个单词经预处理生成的词向量。在一些实施例中，多套语料可以包括从数据获取终端130收集的语音资料或与语音资料对应的文本，其中，多套语料可以包括至少一套与安全问题相关的语音资料或与语音资料对应的文本、以及至少一套与安全问题无关的语音资料或与语音资料对应的文本。在一些实施例中，将多套语料中每个单词经预处理生成词向量可以是采用词向量生成算法生成的，其中，词向量生成算法可以包括Word2Vec。如图4所示，确定单词注意力的方法400可以包括针对每个单词执行以下步骤：

步骤410，获取单词的两种或以上词向量，两种或以上的词向量与不同的上下文相关。具体的，该步骤可以由训练模块530执行。

单词可以是指组成语句的词语。在一些实施例中，可以将语句拆分成单词，其中，将语句拆分形成单词可以是通过分词实现。在一些实施例中，分词方法可以包括正向最大匹配分词、反向最大匹配分词、基于统计的词网格分词、双向最大匹配分词等。

在一些实施例中，由于每个单词均可以存在每套语料中，因此在不同上下文环境下，每个单词在多套语料中可以存在不同的词向量，以获取单词的两种或以上词向量，便于通过词向量区分两套语料。以乘车出行服务中乘客的安全问题为例，对于“什么是危险驾驶”，针对“危险驾驶”单词其上下文信息为“什么”以及“是”，对于“司机正处于危险驾驶行为”，针对“危险驾驶”单词其上下文信息为“司机”、“正处于”以及“行为”，DistributedRepresentation类的词向量表示方法可以将“危险驾驶”表示为[v1]、[v2]，其中v1和v2由于“危险驾驶”上下文信息不同，因此分别具有不同的数据。在一些实施例中，将多套语料中每个单词经预处理生成词向量可以是采用词向量生成算法生成的，其中，词向量生成算法可以包括Word2Vec。在一些实施例中，获取单词的两种或以上词向量可以是从存储设备140中得到的。值得注意的是，上述关于词向量的表述仅仅是示例性的，实际中词向量的维度可以为几十维、几百维等。

步骤430，拼接两种或以上词向量以获取共有词向量。具体的，该步骤可以由训练模块530执行。

在一些实施例中，获取两种或以上词向量后可以将其加权求和生成共有词向量，以便于针对该单词进行统一的注意力计算，判断该单词在哪套语料上集中有较多的注意力。在一些实施例中，获取两种或以上词向量后将其加权求和可以是将两种或以上词向量相加后求平均值。在一些实施例，取两种或以上词向量后将其加权求和可以是将两种或以上词向量乘以对应值，然后相加后求平均值得到。在一些实施例中，共有词向量可以是指根据多套语料中相同单词对应的词向量计算得到的，具体的，共有词向量可以是将两种或以上词向量进行相加后求平均值而得到的。以乘车出行服务中乘客的安全问题为例，对于“什么是危险驾驶”以及“司机正处于危险驾驶行为”的“危险驾驶”词向量[0.1，0.2，0.1]、[0.1，0.1，0.3]，计算得到的共有词向量则可以表示为[0.1，0.15，0.2]。

步骤450，将共有词向量与每套语料除该单词外其他单词的词向量通过自注意力机制确定该单词的注意力。具体的，该步骤可以由训练模块530执行。

在一些实施例中，注意力可以是指该单词与其他单词的关联度，其中，单词与单词之间的关联度可以包括单词与单词间的相似度计算过程。在一些实施例中，单词与单词间的相似度计算方法可以包括点积、权重、拼接权重、感知器等。

在一些实施例中，可以根据该单词的共有词向量与每套语料除该单词外其他单词的词向量，得到该单词与每套语料其他单词的注意力。以乘车出行服务中乘客的安全问题为例，针对“司机”、“存在”、“危险驾驶”、“行为”分别存在两套语料中，“危险驾驶”在两套语料中的词向量分别是W₀’、W₀”，计算得到的共有词向量为W₀，对于“司机”、“存在”、“行为”分别在两套语料中的词向量为W₁’与W₁”、W₂’与W₂”、W₃’与W₃”，依次得到对应的共有词向量W₁、W₂、W₃。以“危险驾驶”共有词向量W₀的注意力计算为例，可以分别计算W₀与W₁’、W₁”的注意力a12’和a12”，然后由W₁’、W₁”、a12’、a12”加权求和计算得到Wa向量，然后依次计算共有词向量W₀与W₂’和W₂”、W₃’和W₃”对应的向量Wb、Wc，最终再将W₀、Wa、Wb、Wc通过注意力机制计算即可得到“危险驾驶”对应的注意力Z₀。以此类推即可计算“司机”、“存在”、“行为”的注意力Z₁、Z₂、Z₃，最终将Z₀、Z₁、Z₂、Z₃输入分类器(例如逻辑回归分类器)进行分类，分类后即可完成样本是否与安全问题相关的识别过程。在一些实施例中，对于训练过程，将Z₀、Z₁、Z₂、Z₃输入分类器(例如逻辑回归分类器)进行分类后，可以判断分类结果(如0-1)与样本标记(0或1)是否相符，若分类结果与样本标记不相符，则可以通过反向传播算法调整识别模型的权重。在一些实施例中，可以包括计算注意力使用的查询向量、键向量、值向量相对应的权重矩阵Wq、Wk、Wv。

在一些实施例中，通过注意力机制计算注意力具体过程可以包括：将多个词向量分别乘以权重矩阵W_q、W_k、W_v对应得到查询向量q、键向量k、值向量v，然后将单词的查询向量q与所有键向量k通过点积计算得到该单词与所有单词的注意力权重，最终再将注意力权重分别与对应单词的值向量v相乘并求和，则可得到该单词的注意力。在一些实施例中，可以将多个词向量组合成为矩阵与再与权重矩阵W_q、W_k、W_v相乘，然后得到查询向量q、键向量k、值向量v的矩阵集合，以减少计算步骤。

图5是根据本申请一些实施例所示的识别系统500的模块图。如图5所示，该识别系统500可以包括获取模块510、识别模块520、训练模块530和执行模块540。

获取模块510可以用于获取待识别数据。待识别数据可以是指用于识别模型识别判断是否与目标相关的数据。在一些实施例中，待识别数据包括图像、视频、语音、文字资料等。在一些实施例中，待识别数据具体可以是数据获取终端130收集获取的。在一些实施例中，待识别数据可以是乘客持有的移动通讯设备(如手机)获取的。在一些实施例中，待识别数据可以是车辆搭载的车载终端设备130-4录取的语音资料。

识别模块520可以用于数据识别模块用于将待识别数据输入识别模型中；其中，识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据训练自注意力模型获得；根据待识别数据和识别模型，确定待识别数据是否与目标相关。在一些实施例中，识别模型可以是指用来区分相近似的待识别数据，以避免待识别数据被错误识别并区分。在一些实施例中，识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据训练自注意力模型获得。在一些实施例中，识别模型识别待识别数据是否与目标相关可以是通过判断待识别数据的注意力确定的。

训练模块530可以用于获取多套训练数据，其中，多套训练数据包括至少一套与目标相关的第一训练数据，以及至少一套与目标无关的第二训练数据；以及，基于多套训练数据，通过自注意力机制训练自注意力模型，生成识别模型。在一些实施例中，训练数据可以是指用于输入自注意力模型训练生成识别模型的数据集合。在一些实施例中，训练数据可以包括图像、视频、语音、文本或者其处理生成的数据(如图像特征矩阵、词向量)等。在一些实施例中，目标可以是指安全问题。在一些实施例中，与目标相关可以是指与安全问题相关，与目标无关可以是指与安全问题相关。在一些实施例中，第一训练数据可以包含文本如“什么是危险驾驶”对应采用Word2Vec生成的词向量，第二训练数据可以包含文本如“司机正处于危险驾驶行为(如超速行驶)”对应采用Word2Vec生成的词向量。在一些实施例中，自注意力机制可以是指模仿生物观察行为的内部过程，减少对外部信息的依赖，捕捉数据或特征的内部相关性的仿生性数据处理过程。在一些实施例中，自注意力模型可以包括注意力层。在一些实施例中，注意力层可以计算训练样本每个单词的注意力。在一些实施例中，获取训练样本对应模型的输出结果后，可以与期望标识样本相比较，例如比较模型最后的输出值(0-1)与期望标识样本(0或1)的差异，若训练样本与期望标识样本的差异较大，则可以采用反向传播算法调整注意力模型的权重，以便于获取权重调整好的识别模型。在一些实施例中，注意力模型的权重可以包括计算注意力使用的查询向量、键向量、值向量相对应的权重矩阵W_q、W_k、W_v。

执行模块540可以用于基于识别出所述待识别数据是否与所述目标相关的结果，执行相应的措施。在一些实施例中，措施可以包括监控人员对驾驶行为人进行继续沟通、持续监控、警告中的一种或多种组合。

应当理解，图5所示的系统及其模块可以利用各种方式来实现。例如，在一些实施例中，系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中，硬件部分可以利用专用逻辑来实现；软件部分则可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用例如由各种类型的处理器所执行的软件实现，还可以由上述硬件电路和软件的结合(例如，固件)来实现。

需要注意的是，以上对于候选项显示、确定系统及其模块的描述，仅为描述方便，并不能把本申请限制在所举实施例范围之内。可以理解，对于本领域的技术人员来说，在了解该系统的原理后，可能在不背离这一原理的情况下，对各个模块进行任意组合，或者构成子系统与其他模块连接。例如，在一些实施例中，例如，图5中披露的获取模块510、识别模块520和训练模块530、执行模块540可以是一个系统中的不同模块，也可以是一个模块实现上述的两个或两个以上模块的功能。例如，识别模块520和训练模块530可以是两个模块，也可以是一个模块同时具有识别和训练功能。例如，各个模块可以共用一个存储模块，各个模块也可以分别具有各自的存储模块。诸如此类的变形，均在本申请的保护范围之内。

本申请实施例可能带来的有益效果包括但不限于：1)可以针对待识别数据进行识别并判定是否与目标相关，从而避免对与目标相近的数据误判；2)可以判断乘车人是否存在安全相关的问题，提高了识别的准确性，可在乘车人乘车过程中提供安全问题保障服务，保障乘车人的出行安全。需要说明的是，不同实施例可能产生的有益效果不同，在不同的实施例里，可能产生的有益效果可以是以上任意一种或几种的组合，也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述，显然，对于本领域技术人员来说，上述详细披露仅仅作为示例，而并不构成对本申请的限定。虽然此处并没有明确说明，本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议，所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。

同时，本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此，应强调并注意的是，本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外，本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外，本领域技术人员可以理解，本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述，包括任何新的和有用的工序、机器、产品或物质的组合，或对他们的任何新的和有用的改进。相应地，本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外，本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品，该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号，例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式，包括电磁形式、光形式等，或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质，该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播，包括无线电、电缆、光纤电缆、RF、或类似介质，或任何上述介质的组合。

本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写，包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等，常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP，动态编程语言如Python、Ruby和Groovy，或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下，远程计算机可以通过任何网络形式与用户计算机连接，比如局域网(LAN)或广域网(WAN)，或连接至外部计算机(例如通过因特网)，或在云计算环境中，或作为服务使用如软件即服务(SaaS)。

此外，除非权利要求中明确说明，本申请处理元素和序列的顺序、数字字母的使用、或其他名称的使用，并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例，但应当理解的是，该类细节仅起到说明的目的，附加的权利要求并不仅限于披露的实施例，相反，权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如，虽然以上所描述的系统组件可以通过硬件设备实现，但是也可以只通过软件的解决方案得以实现，如在现有的服务器或移动设备上安装所描述的系统。

同理，应当注意的是，为了简化本申请披露的表述，从而帮助对一个或多个发明实施例的理解，前文对本申请实施例的描述中，有时会将多种特征归并至一个实施例、附图或对其的描述中。但是，这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上，实施例的特征要少于上述披露的单个实施例的全部特征。

一些实施例中使用了描述成分、属性数量的数字，应当理解的是，此类用于实施例描述的数字，在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明，“大约”、“近似”或“大体上”表明数字允许有±20％的变化。相应地，在一些实施例中，说明书和权利要求中使用的数值参数均为近似值，该近似值根据个别实施例所需特点可以发生改变。在一些实施例中，数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值，在具体实施例中，此类数值的设定在可行范围内尽可能精确。

针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料，如文章、书籍、说明书、出版物、文档等，特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外，对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是，如果本申请附属材料中的描述、定义、和/或术语的使用与本申请内容有不一致或冲突的地方，以本申请的描述、定义和/或术语的使用为准。

最后，应当理解的是，本申请中实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此，作为示例而非限制，本申请实施例的替代配置可视为与本申请的教导一致。相应地，本申请的实施例不仅限于本申请明确介绍和描述的实施例。

Claims

1.一种识别方法，所述方法包括：

获取待识别数据；

将所述待识别数据输入识别模型中，其中，所述识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据共同训练自注意力模型后获得；以及

根据所述待识别数据和所述识别模型，确定所述待识别数据是否与所述目标相关。

2.如权利要求1所述的方法，还包括训练所述自注意力模型获取所述识别模型，所述训练过程包括：

获取两套或以上的多套训练数据，其中，所述多套训练数据包括至少一套与所述目标相关的第一训练数据，以及至少一套与所述目标无关的第二训练数据；以及

基于所述多套训练数据，通过自注意力机制训练所述自注意力模型，生成所述识别模型。

3.如权利要求2所述的方法，所述多套训练数据包括多套语料中每个单词经预处理生成的词向量，所述训练过程包括：

对于每个单词，

获取所述单词的两种或以上词向量，所述两种或以上的词向量与不同的上下文相关；

拼接所述两种或以上词向量以获取共有词向量；以及

将所述共有词向量与每套语料除该单词外其他单词的词向量通过自注意力机制确定该单词的注意力。

4.如权利要求3所述的方法，拼接所述一种或以上词向量以获取共有词向量包括：

将每个单词在所述多套训练数据中的词向量加权求和。

5.如权利要求2所述的方法，所述多套语料为两套语料，所述两套语料包括一套与安全问题相关的语料和一套与安全问题无关的语料。

6.如权利要求3所述的方法，所述预处理过程包括：

使用词向量生成算法，生成所述单词的词向量。

7.如权利要求6所述的方法，所述词向量生成算法为Word2Vec。

8.如权利要求1所述的方法，进一步包括：

基于识别出所述待识别数据是否与所述目标相关的结果，执行相应的措施。

9.如权利要求8所述的方法，所述目标与安全问题相关，以及

所述措施包括向与目标相关的对象发出继续沟通、持续监控、警告中的一种或多种组合。

10.一种安全问题识别系统，包括获取模块以及识别模块；

所述获取模块用于获取待识别数据；

所述识别模块用于将所述待识别数据输入识别模型中；其中，所述识别模型由与目标相关的第一训练数据和与目标无关的第二训练数据共同训练自注意力模型后获得；根据所述待识别数据和所述识别模型，确定所述待识别数据是否与所述目标相关。

11.一种识别装置，包括处理器，所述处理器用于执行如权利要求1～9任一项所述的识别方法。

12.一种计算机可读存储介质，所述存储介质存储计算机指令，当计算机读取存储介质中的计算机指令后，计算机执行如权利要求1～9任一项所述的识别方法。