CN111984779A

CN111984779A - 一种对话文本分析方法、装置、设备和可读介质

Info

Publication number: CN111984779A
Application number: CN202010945516.9A
Authority: CN
Inventors: 马振
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-09-10
Filing date: 2020-09-10
Publication date: 2020-11-24
Anticipated expiration: 2040-09-10
Also published as: CN111984779B

Abstract

本说明书实施例公开了一种对话文本分析方法、装置、设备和计算机可读介质。方案可以包括：获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对所述多媒体文件进行语音识别，得到对话文本；确定所述对话文本对应的业务场景信息；根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

Description

一种对话文本分析方法、装置、设备和可读介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种对话文本分析方法、装置、设备和计算机可读介质。

背景技术

随着互联网技术的普及，目前许多业务可以通过互联网进行，例如保险业务、理财业务等。在进行业务推广、办理等过程中，对工作人员的规范性有一定要求，例如，不能辱骂等；并且，有些业务具有强监管的属性，例如保险业务，对话术以及能够提及的信息都有界定，不能越过监管红线，否则会有合规风险。

为了实现对网络业务执行过程的规范管理，需要对网络业务执行过程中的信息进行分析，以识别出违法或违规行为。因此，需要提供一种能够对对话文本进行分析的方法。

发明内容

本说明书实施例提供一种对话文本分析方法、装置、设备和计算机可读介质，用于对网络业务中产生的对话文本进行分析，以检出不合规内容。

为解决上述技术问题，本说明书实施例是这样实现的：

本说明书实施例提供的一种对话文本分析方法，包括：获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对所述多媒体文件进行语音识别，得到对话文本；确定所述对话文本对应的业务场景信息；根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

本说明书实施例提供的一种对话文本分析装置，包括：多媒体文件获取模块，用于获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对话文本确定模块，用于对所述多媒体文件进行语音识别，得到对话文本；业务场景信息确定模块，用于确定所述对话文本对应的业务场景信息；分析规则集确定模块，用于根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；对话文本分析模块，用于采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

本说明书实施例提供的一种对话文本分析设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对所述多媒体文件进行语音识别，得到对话文本；确定所述对话文本对应的业务场景信息；根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

本说明书实施例提供的一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现一种对话文本分析方法：

取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；对所述多媒体文件进行语音识别，得到对话文本；确定所述对话文本对应的业务场景信息；根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

本说明书一个实施例至少能够达到以下有益效果：通过基于多媒体文件得到对话文本后，采用与对话文本的业务场景对应的分析规则，来分析该对话文本从而得到分析结果，使得，在实现对对话文本进行的分析的基础上，分业务场景来进行分析，提高了对对话文本中风险识别的准确性。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例提供的一种对话文本分析方法的流程示意图；

图2为本说明书实施例提供的对应于图1的一种对话文本分析装置的结构示意图；

图3为本说明书实施例提供的对应于图1的一种对话文本分析设备的结构示意图。

具体实施方式

为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书的一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书一个或多个实施例保护的范围。

应当理解，尽管在本申请文件中可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书实施例提供的一种对话文本分析方法的流程示意图。从程序角度而言，流程的执行主体可以为搭载于应用服务器或应用终端的程序。

如图1所示，该流程可以包括以下步骤：

步骤102：获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的。

在通过网络进行业务推广或办理等过程中，常常需要业务人员与客户之间进行交流，由此，可以生成用于记录交流内容的多媒体文件。所述多媒体文件可以用于后续对交流内容进行分析，以识别交流内容中是否存在不合规信息，所述不合规信息可以包括例如不符合服务规范或监管规定的信息。

在本申请的实施例中，所述多媒体文件可以包括音频文件或视频文件等。一个多媒体文件中可以包含一段完整的音频对话或视频对话，例如，可以是一次完整的客户来电的录音、一次完整的视频推广活动的视频等。

可选地，所述获取多媒体文件，可以是从数据库中获取预存的多媒体文件。例如，可以定期获取数据库中更新的多媒体文件。或者可选地，所述获取多媒体文件，可以在业务人员与客户沟通过程中实时获取产生的多媒体文件。

步骤104：对所述多媒体文件进行语音识别，得到对话文本。

获得多媒体文件后，可以从多媒体文件中提取出对话文本，并根据对话文本进行后续分析。在本申请的实施例中，所述对话文本中可以包括文本信息、对话角色信息等。

具体地，可以采用现有技术来将所述多媒体文件识别为对话文本，下面对其中的优选实施方案进行描述。

可选地，若所述多媒体文件为音频文件，则步骤104具体可以包括：通过语音识别，提取所述音频文件中的文本信息；通过音纹识别，确定所述文本信息对应的对话者；根据语义识别，确定所述对话者的角色信息。

其中，提取所述音频文件中的文本信息，可以是将音频信息转为文字信息。

其中，确定所述文本信息对应的对话者，可以是区分出对话文本中不同的说话者。例如，将对话文本识别为如下形式：

“话者1：对话内容1；

话者2：对话内容2；

话者1：对话内容3；

......”

其中，确定对话者的角色信息，可以是识别例如“话者1”、“话者2”的具体身份。在本申请的一个具体场景下，例如，需要识别出哪个话者是业务人员(客服)，哪个话者是客户。在实际应用中，可以采用角色识别模型来进行识别，所述角色识别模型可以是基于历史样本进行训练的，所述历史样本中标记了角色信息。所述角色识别模型的具体可以是例如Fasttext模型或朴素贝叶斯模型等。

例如，进行角色识别后的内容可以为如下形式：

“客户：对话内容1；

客服：对话内容2；

客户：对话内容3；

......”其中，将话者1识别为客户，将话者2识别为客服。

可选地，若所述多媒体文件为视频文件，则步骤104具体可以包括：从所述视频文件中分离出音频文件；通过语音识别，提取所述音频文件中的文本信息；通过音纹识别，确定所述文本信息对应的对话者；根据语义识别，确定所述对话者的角色信息。

在可选的实施例中，所述对话文本中还可以包含时间戳信息。所述时间戳信息可以用于表示对话文本的中，话者的每次发言内容对应的发言时间，所述发言时间可以是例如发言内容对应的起始时间，或者可以是例如起始时间至结束时间。

例如，包含时间戳的对话文本的内容可以为：

“时间戳1，客户：对话内容1；

时间戳2，客服：对话内容2；

时间戳3，客户：对话内容3；

......”

步骤106：确定所述对话文本对应的业务场景信息。

网络业务的种类是多种多样的，例如，可以包括保险业务、理财业务、医疗健康业务、交通出行业务等。在不同的业务场景下，可以具有部分相同的合规风险，通常也可以具有大量彼此不同的合规风险。例如，有些在保险业务中存在的合规风险，在交通出行业务中不一定存在，若都采用相同的规则来进行合规分析，会导致分析结果不准确或分析效率低的问题。在实际应用中，为了确保合规分析得到的分析结果的准确性且提高分析效率，在本申请的实施例中，采用不同的分析规则，来对不同的业务场景下的对话文本进行分析。因此，需要确定对话文本对应的业务场景信息。

所述业务场景信息可以是用于标识业务场景的信息，例如，可以是业务场景标识，不同的业务场景对应不同的业务场景标识。

步骤108：根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则。

在实际应用中，可以预先配置用于对某业务场景的对话文本进行分析的分析规则，并相应地存储该分析规则以及业务场景信息。由此，可以通过业务场景信息来查找到适用于所述业务场景信息表示的业务场景的分析规则。具体地，在步骤108之前，还可以包括：根据业务场景，配置适用于所述业务场景的至少一条分析规则；与所述至少一条分析规则对应地，存储用于表示所述业务场景的业务场景信息。

步骤110：采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

可选地，可以遍历分析规则集中的各个分析规则，依次采用所述各个分析规则对所述对话文本进行分析，得到与所述各个分析规则对应的分析结果，以得到包含各个分析规则对应的分析结果的分析规则集。

可选地，所述分析结果集中的分析结果可以唯一对应于所述分析规则集中的分析规则；而所述分析规则集中的分析规则可以对应于分析结果集中的一个或更多个分析结果。

在实际应用中，采用一个分析规则对所述对话文本进行分析，具体可以得到对应于所述对话文本中的不同发言内容的多个分析结果。例如，若所述对话文本中的两处发言内容均符合某分析规则，则使用该分析结果分析后，可以得到与该分析规则对应的两个分析结果。

在上述步骤中，各个步骤可以由相同或不同的服务器执行，本申请不对此进行具体限定。例如，步骤102和步骤104可以由第一服务器执行，步骤106、步骤108和步骤110可以由第二服务器执行。

应当理解，本说明书一个或多个实施例所述的方法中，部分步骤的顺序可以根据实际需要调整，或者可以省略部分步骤。

图1中的方法，通过从多媒体文件中识别出对话文本后，采用与对话文本的业务场景信息对应的分析规则集中的规则，来对对话文本是否合规进行分析，实现了对对话文本的合规分析，并且由于采用的是与业务场景对应的分析规则来分析对话文本，分析效率更高、分析结果的更准确。

基于图1的方法，本说明书实施例还提供了该方法的一些具体实施方案，下面进行说明。

在可选的实施例中，所述根据业务场景，配置适用于所述业务场景的至少一条分析规则，具体可以包括：对于配置一条分析规则：选定至少一个规则算子，所述规则算子包括基于正则表达式模型的算子或基于关键词模型的算子；基于所述至少一个规则算子，确定所述分析规则，所述分析规则为一个规则算子，或者，为由至少一个规则算子以及逻辑运算符构成逻辑表达式。

基于关键词模型的算子，可以用于识别是否包含特定的关键词，该特定的关键词可以是消极的，也可以是积极的或中性的，可以根据需要设定。例如，用于识别服务态度恶劣的分析规则，可以是检测句子中是否包含以下任意关键词的算子：如“傻”、“笨”、“疯”等。又如，用于识别具有贬低同行行为的分析规则，可以是检测句子中是否包含以下任意关键词的算子：如“保障不全面”、“小公司”、“规模小”、“业务员不靠谱”等。

上面给出了一个分析规则中包含一个规则算子的示例，在实际应用中，一个分析规则中可以包含至少一个规则算子以及逻辑运算符。

逻辑运算符可以包括，例如，逻辑非运算的运算符“！”，可以与一个规则算子联用；例如，逻辑与运算的运算符“&&”，可以与两个或更多个规则算子联用；例如，逻辑或运算的运算符“||”，可以与两个或更多个规则算子联用。

在一个分析规则中，可以同时使用不止一个相同或不同类型的逻辑运算符，所述不止一个相同或不同类型的逻辑运算符与规则算子共同构成逻辑运算符，以作为一条分析规则。

例如，用于识别具有贬低同行行为的分析规则中，可以包含算子1和算子2。其中，算子1可以是如下正则表达式算子：“(公司|保司|人保|人保|太平洋|天安|众安|天平|大地|国泰|阳光).*”；算子2可以是检测句子中是否包含以下任意关键词的算子：“不全面”、“小公司”、“规模小”、“理赔差”、“理赔慢”、“不靠谱”等。该分析规则具体可以是如下逻辑表达式：“算子1&&算子2”，用于表示同时满足算子1和算子2。

以上场景、规则算子、分析规则等均是为了说明的需要，是作为示例示出的，在本申请的实施例中，本申请的实际的应用范围不限于以上示例的范围。

在另外的可选的实施例中，所述根据预设的业务场景，配置适用于所述业务场景的至少一条分析规则，具体可以包括：根据业务场景，获取对应于所述业务场景的历史对话文本；所述历史对话文本携带有用于表示所述历史对话文本是否合规的标签；确定所述历史对话文本的特征信息；基于所述特征信息，训练分析规则模型；训练得到的所述分析规则模型用于识别对话文本中的目标内容是否合规。

其中，所述特征信息，可以包括例如，包含通用关键信息的出现频次、包含业务关键信息的出现频次等。所述通过关键信息可以包括例如不文明用语、绝对性用语等的数量。不同的业务场景，可以对应不同的所述业务关键信息。例如，对于保险业务场景，所述业务关键信息可以包括保险公司名称信息等。其中，所述分析规则模型可以包括例如二分类模型，更具体地，可以包括决策树模型、随机森林模型、贝叶斯分类模型等。可选地，所述分析规则模型也可以是多标签文本分类模型。

在实际应用中，分析系统的维护人员也可以根据实际的需要，配置或训练新的分析规则，并更新至分析规则库中。当步骤108中需要确定适用的分析规则集时，可以从更新后的分析规则库中获取所有适用的规则。基于本申请实施例的方案，使得，分析规则的更新以及应用非常便捷。

在实际应用中，为了进一步提高分析结果的准确性且提高分析效率，除可以设定分析规则的业务场景，以根据业务场景来选择分析规则外，还可以设定分析规则的适用范围，例如适用角色，以根据适用角色来使用分析规则。

可选地，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集(步骤110)，具体可以包括：解析所述对话文本，获得所述对话文本中对话角色的角色信息；从所述分析规则集中，确定对应于所述角色信息的分析规则子集；采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，所述分析规则子集用于表示所述对话文本中对应于所述对话角色的对话内容是否合规，所述分析规则子集是所述分析规则集的子集。

具体地，每个分析规则的适用角色用于表示，该分析规则可以用于分析哪些角色对应的内容。若一个分析规则中包含一个算子，该一个算子的适用角色即该分析规则的适用角色。若一个分析规则中包含多个规则算子，则可以认为该分析规则的适用范围是其包含的所述多个规则算子的适用角色的集合。

需要说明的是，在本申请的实施例中，尽管可以基于不同的角色来进行分析，但仍是针对对话文本整体进行分析，而不需要如现有技术中将对话文本进行拆分，例如，不需要将对话文本拆分为只包含角色1对应的对话内容的文本1和只包含角色2对应的对话内容的文本2。基于本申请实施例的方案，根据分析规则的适用角色来执行实际的分析，既提高了分析准确性，又避免进行文件拆分，提高了分析效率。

在实际应用时，例如，可以基于对话文本，对于识别到的角色1，则采用所述分析规则集中的适用于角色1的所有分析规则对角色1的对话内容进行分析；对于识别到的角色2，则采用所述分析规则中适用于角色2的所有分析规则对角色2的对话内容进行分析。同理，对话文本中若包含更多个角色，也可以采用适用于各个角色的分析规则分别对各个角色的对话内容进行分析。此外，也可以基于分析规则，对于每个分析规则，采用该分析规则对对话文本中符合该分析规则的适用范围的对话内容进行分析。

具体的分析执行过程不限于以上示例，在实际执行时，可以对对话文本进行遍历，依次对识别到的角色对应的各对话内容进行分析，或者遍历分析规则，依次采用各分析规则对对话文本进行分析。在本申请的实施例中，为了进一步提升分析效率，优选地，可以同时对对话文本中的各部分内容进行并行分析，也可以同时使用多个分析规则对对话文本进行分析。

在可选的实施例中，所述采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，具体可以包括：对于所述规则子集中的一条分析规则，执行：从所述对话文本中确定与所述角色信息对应的对话片段；采用所述分析规则，分析所述对话片段，得到与所述对话片段对应的分析结果；所述分析结果用于表示所述对话片段是否命中所述分析规则；所述分析结果为所述分析结果子集中的元素。

其中，一个对话片段可以是相应的角色的一次发言片段。例如，在如下对话文本的示例中，“对话内容1”、“对话内容2”、“对话内容3”各自为一个对话片段。

“时间戳1，客户：对话内容1；

时间戳2，客服：对话内容2；

时间戳3，客户：对话内容3；

......”

作为示例，沿用上文示例中用于识别具有劝转保的销售行为的分析规则，其适用角色可以是“客服”，即，采用“.*(停掉|中止|断掉|退保|退掉).*保险”这一正则表达式来识别对话文本中“客服”这一角色的说话内容，是否符合(即，命中)该分析规则。

在可选的实施例中，所述采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，具体可以包括：对于所述规则子集中的一条分析规则，执行：从所述对话文本中确定与所述角色信息对应的对话片段；基于所述对话片段，确定目标片段；所述目标片段包含所述对话片段以及所述对话片段的上文和/或下文；采用所述分析规则，分析所述目标片段，得到与所述目标片段对应的分析结果；所述分析结果用于表示所述目标片段是否命中所述分析规则；所述分析结果为所述分析结果子集中的元素。

其中，一个目标片段可以包含相应的角色的一次发言片段以及该发言片段的上文和/或下文。例如，在如下对话文本的示例中，若“对话内容2”为当前的对话片段，则，作为示例，可选地，“对话内容2”、“对话内容3”和“对话内容4”等可以共同构成一个目标片段；可选地，“对话内容2”、“对话内容4”和“对话内容6”等可以共同构成一个目标片段。以上仅是示例，目标片段的具体划定范围可以根据实际需要进行设定，可以设置为分析规则的适用范围。

“时间戳1，客户：对话内容1；

时间戳2，客服：对话内容2；

时间戳3，客户：对话内容3；

时间戳4，客服：对话内容4；

时间戳5，客户：对话内容5；

时间戳6，客服：对话内容6；

......”

作为示例，沿用上文示例中用于识别具有贬低同行行为的分析规则，该分析规则中包含两个算子，逻辑表达式为“算子1&&算子2”，即，若同时命中算子1和算子2，则认为命中该分析规则。在实际应用时，满足算子1和算子2的内容可以在同一个对话片段中，或者在多个对话片段中，若为后者，则该分析规则的分析对象可以为包含多个对话片段的目标片段。具体地，例如在上面的示例中，若检测到对话内容2命中算子1(即，符合“(公司|保司|人保|人保|太平洋|天安|众安|天平|大地|国泰|阳光).*”这一正则表达式)，且检测到对话内容4命中算子2(即，包含以下任意关键词：“不全面”、“小公司”、“规模小”、“理赔差”、“理赔慢”、“不靠谱”等)，则认为该对话文本命中了包含算子1和算子2的该分析规则。

在本申请的实施例中，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集(步骤110)，具体可以包括：对于所述分析规则集中的任一分析规则，执行：判断所述对话文本是否具有所述分析规则对应的风险，得到第一判断结果；若所述第一判断结果为是，确定所述分析规则对应的风险标签。在实际应用时，可以将命中分析规则的对话文本均标记相同的标签，也可以对于命中不同分析规则的对话文本标记不同的标签，一个对话文本可以标记多个标签。

得到所述风险标签后，可以存储该风险标签，以备后续查看或人工核检等。所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集(步骤110)之后，还可以包括：与所述对话文本对应地，存储所述风险标签。

可选地，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集(步骤110)之后，还可以包括：与所述对话文本对应地，存储所述风险标签和所述分析规则的标识信息。

在实际应用中，可以不仅进行打标，并且标记分析规则的标识信息，其作用在于：实现了风险类型定性，使得，后续查看或核检时，不仅可以得知该对话文本不合规，还能够得到其不合规的类型(即，具体命中了哪些规则)，能够提高后续基于该分析结果进一步实施数据分析处理的效率。

可选地，实施采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集(步骤110)之后，还可以包括：与所述对话文本对应地，存储所述风险标签、所述分析规则的标识信息以及风险定位信息；所述风险定位信息用于表示所述风险标签对应的对话内容在所述对话文本中的位置。由于所述对话文本中可以包含时间戳信息，在实际应用中，所述风险定位信息可以是所述风险标签对应的对话内容对应的时间戳信息。

在实际应用中，可以不仅进行打标，并标记分析规则的标识信息，还可以进一步标记该对话文本中具体不合规的内容的具体位置，其作用在于：实现了风险定位，使得，后续查看或核检时，不仅可以得知该对话文本不合规的类型，并且能够准确定位到具体的不合规内容，尤其是对于信息量较多的对话文本，能够进一步提高后续基于该分析结果进一步实施数据分析处理的效率。

基于同样的思路，本说明书实施例还提供了上述方法对应的装置。图2为本说明书实施例提供的对应于图1的一种对话文本分析装置的结构示意图。如图2所示，该装置可以包括：

多媒体文件获取模块202，用于获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；

对话文本确定模块204，用于对所述多媒体文件进行语音识别，得到对话文本；

业务场景信息确定模块206，用于确定所述对话文本对应的业务场景信息；

分析规则集确定模块208，用于根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；

对话文本分析模块210，用于采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

可选地，所述装置还可以包括分析规则配置模块，用于：根据业务场景，配置适用于所述业务场景的至少一条分析规则；与所述至少一条分析规则对应地，存储用于表示所述业务场景的业务场景信息。

可选地，所述分析规则配置模块，具体可以用于：对于配置一条分析规则：选定至少一个规则算子；所述规则算子包括基于正则表达式模型的算子或基于关键词模型的算子；基于所述至少一个规则算子，确定所述分析规则；所述分析规则为一个规则算子，或者，为由至少一个规则算子以及逻辑运算符构成逻辑表达式。

可选地，所述对话文本分析模块210，具体可以用于：解析所述对话文本，获得所述对话文本中对话角色的角色信息；从所述分析规则集中，确定对应于所述角色信息的分析规则子集；采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集；所述分析规则子集用于表示所述对话文本中对应于所述对话角色的对话内容是否合规；所述分析规则子集是所述分析规则集的子集。

可选地，所述对话文本分析模块210，具体可以用于：对于所述分析规则集中的任一分析规则，执行：判断所述对话文本是否具有所述分析规则对应的风险，得到第一判断结果；若所述第一判断结果为是，确定所述分析规则对应的风险标签。

可选地，所述装置还可以包括存储模块，用于：与所述对话文本对应地，存储所述风险标签。

所述存储模块，可以用于：与所述对话文本对应地，存储所述风险标签和所述分析规则的标识信息。

所述存储模块，可以用于：与所述对话文本对应地，存储所述风险标签、所述分析规则的标识信息以及风险定位信息；所述风险定位信息用于表示所述风险标签对应的对话内容在所述对话文本中的位置。

可选地，所述多媒体文件包括音频文件或视频文件。。

可以理解，上述的各模块是指计算机程序或者程序段，用于执行某一项或多项特定的功能。此外，上述各模块的区分并不代表实际的程序代码也必须是分开的。

基于同样的思路，本说明书实施例还提供了上述方法对应的设备。

图3为本说明书实施例提供的对应于图1的一种对话文本分析设备的结构示意图。如图3所示，设备300可以包括：

至少一个处理器310；以及，

与所述至少一个处理器通信连接的存储器330；其中，

所述存储器330存储有可被所述至少一个处理器310执行的指令320，所述指令被所述至少一个处理器310执行，以使所述至少一个处理器310能够：

获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；

对所述多媒体文件进行语音识别，得到对话文本；

确定所述对话文本对应的业务场景信息；

根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；

采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

基于同样的思路，本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现以下方法：

对所述多媒体文件进行语音识别，得到对话文本；

确定所述对话文本对应的业务场景信息；

上述对本说明书特定实施例进行了描述，在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可。

本说明书实施例提供的装置、设备与方法是对应的，因此，装置、设备也具有与对应方法类似的有益技术效果，由于上面已经对方法的有益技术效果进行了详细说明，因此，这里不再赘述对应装置、设备的有益技术效果。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、AtmelAT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字符多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种对话文本分析方法，包括：

对所述多媒体文件进行语音识别，得到对话文本；

确定所述对话文本对应的业务场景信息；

2.如权利要求1所述的方法，所述确定所述对话文本对应的业务场景信息之前，还包括：

根据业务场景，配置适用于所述业务场景的至少一条分析规则；

与所述至少一条分析规则对应地，存储用于表示所述业务场景的业务场景信息。

3.如权利要求2所述的方法，所述根据业务场景，配置适用于所述业务场景的至少一条分析规则，具体包括：

对于配置一条分析规则：

选定至少一个规则算子；所述规则算子包括基于正则表达式模型的算子或基于关键词模型的算子；

基于所述至少一个规则算子，确定所述分析规则；所述分析规则为一个规则算子，或者，为由至少一个规则算子以及逻辑运算符构成逻辑表达式。

4.如权利要求1所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集，具体包括：

解析所述对话文本，获得所述对话文本中对话角色的角色信息；

从所述分析规则集中，确定对应于所述角色信息的分析规则子集；

采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集；所述分析规则子集用于表示所述对话文本中对应于所述对话角色的对话内容是否合规；所述分析规则子集是所述分析规则集的子集。

5.如权利要求4所述的方法，所述采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，具体包括：

对于所述规则子集中的一条分析规则，执行：

从所述对话文本中确定与所述角色信息对应的对话片段；

采用所述分析规则，分析所述对话片段，得到与所述对话片段对应的分析结果；所述分析结果用于表示所述对话片段是否命中所述分析规则；所述分析结果为所述分析结果子集中的元素。

6.如权利要求4所述的方法，所述采用所述分析规则子集中的分析规则，分析所述对话文本，得到与所述对话文本对应的分析结果子集，具体包括：

对于所述规则子集中的一条分析规则，执行：

从所述对话文本中确定与所述角色信息对应的对话片段；

基于所述对话片段，确定目标片段；所述目标片段包含所述对话片段以及所述对话片段的上文和/或下文；

采用所述分析规则，分析所述目标片段，得到与所述目标片段对应的分析结果；所述分析结果用于表示所述目标片段是否命中所述分析规则；所述分析结果为所述分析结果子集中的元素。

7.如权利要求1所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集，具体包括：

对于所述分析规则集中的任一分析规则，执行：

判断所述对话文本是否具有所述分析规则对应的风险，得到第一判断结果；

若所述第一判断结果为是，确定所述分析规则对应的风险标签。

8.如权利要求7所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集之后，还包括：

与所述对话文本对应地，存储所述风险标签。

9.如权利要求7所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集之后，还包括：

与所述对话文本对应地，存储所述风险标签和所述分析规则的标识信息。

10.如权利要求7所述的方法，所述采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集之后，还包括：

与所述对话文本对应地，存储所述风险标签、所述分析规则的标识信息以及风险定位信息；所述风险定位信息用于表示所述风险标签对应的对话内容在所述对话文本中的位置。

11.如权利要求1所述的方法，所述多媒体文件包括音频文件或视频文件。

12.如权利要求11所述的方法，所述多媒体文件为音频文件，所述对所述多媒体文件进行语音识别，得到对话文本，具体包括：

通过语音识别，提取所述音频文件中的文本信息；

通过音纹识别，确定所述文本信息对应的对话者；

根据语义识别，确定所述对话者的角色信息。

13.如权利要求11所述的方法，所述多媒体文件为视频文件，所述对所述多媒体文件进行语音识别，得到对话文本，具体包括：

从所述视频文件中分离出音频文件；

通过语音识别，提取所述音频文件中的文本信息；

通过音纹识别，确定所述文本信息对应的对话者；

根据语义识别，确定所述对话者的角色信息。

14.一种对话文本分析装置，包括：

多媒体文件获取模块，用于获取多媒体文件；所述多媒体文件是由业务人员在工作期间与客户沟通产生的；

对话文本确定模块，用于对所述多媒体文件进行语音识别，得到对话文本；

业务场景信息确定模块，用于确定所述对话文本对应的业务场景信息；

分析规则集确定模块，用于根据所述业务场景信息，确定预设的适用于所述业务场景信息表示的业务场景的分析规则集；所述分析规则集中包含至少一条分析规则；

对话文本分析模块，用于采用所述分析规则集中的分析规则，分析所述对话文本，得到分析结果集；所述分析结果集用于表示所述对话文本是否合规。

15.如权利要求14所述的装置，还包括分析规则配置模块，用于：

16.如权利要求15所述的装置，所述分析规则配置模块，具体用于：

对于配置一条分析规则：

17.如权利要求14所述的装置，所述对话文本分析模块，具体用于：

18.如权利要求14所述的装置，所述对话文本分析模块，具体用于：

对于所述分析规则集中的任一分析规则，执行：

19.如权利要求18所述的装置，还包括存储模块，用于：

与所述对话文本对应地，存储所述风险标签。

20.如权利要求18所述的装置，还包括存储模块，用于：

21.如权利要求18所述的装置，还包括存储模块，用于：

22.如权利要求14所述的装置，所述多媒体文件包括音频文件或视频文件。

23.一种对话文本分析设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

对所述多媒体文件进行语音识别，得到对话文本；

确定所述对话文本对应的业务场景信息；

24.一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现权利要求1至13中任一项所述的对话文本分析方法。