CN110597964A

CN110597964A - 一种双录质检语义分析方法、装置及双录质检系统

Info

Publication number: CN110597964A
Application number: CN201910921638.1A
Authority: CN
Inventors: 温涛; 王江
Original assignee: SHENZHOU DIGITAL RONGXIN SOFTWARE Co Ltd
Current assignee: SHENZHOU DIGITAL RONGXIN SOFTWARE Co Ltd
Priority date: 2019-09-27
Filing date: 2019-09-27
Publication date: 2019-12-20
Anticipated expiration: 2039-09-27
Also published as: CN110597964B

Abstract

本发明公开了一种双录质检语义分析方法、装置及双录质检系统，所述方法包括:获取标准话术、目标文本、业务信息、违禁信息库并对标准话术及目标文本分别进行句子切分及对齐；进行单句质检，包括：违禁信息识别、参数类的业务信息的文本匹配、非参数类的必输关键话术信息的文本匹配、剩余句子与对应句子的语义相似度分析及与预设误导信息的语义相似度分析；再逐句质检得到最后结果。本发明的双录质检语义分析方法、装置及系统，可实现客观、可控的双录质检语义分析，降低了执行难度，提高了双录质检效率，且降低了双录的业务风险和操作风险，尤其适用于金融领域的双录质检场景。

Description

一种双录质检语义分析方法、装置及双录质检系统

技术领域

本发明涉及双录质检领域，特别是涉及一种双录质检语义分析方法、装置及双录质检系统。

背景技术

随着人工智能在NLP技术领域的逐渐成熟，以及金融领域监管部门在理财产品、保险产品等销售方面的严格监管，NLP自然而然的被应用到了双录质检领域。由于监管部门的监管要求，双录场景被翻译为一场“任务型”的自然语言对话。作为银行或保险公司的管理者如何确保任务是按照要求，同时又是高效执行的，需要同时做到考虑人性化的自然执行以及对关键风险点的把控。

在双录质检中，文本分析模块基于预先设定的标准话术，对目标文本进行逐句分析。文本分析的输入物为双录视频经过角色分离、语音识别等预处理过程产生的客户经理或销售人员和客户双角色的聊天式对话文本以及给定的标准话术信息。针对客户经理或销售人员的对话信息，现有的双录质检技术在语义分析层面大多分为两个极端，在对客户经理或销售人员的口语信息上或者是只做到对关键信息(业务信息)、违禁信息的检测，或者是对话术内容进行逐字匹配，逐字匹配固然可以降低风险，但是往往会导致质检报告的不通过率非常高，仍需引入大量的人工质检环节，同时也不符合人工在任务执行时的可操作性。只检测关键信息和违禁信息可以快速的完成检测但是无法确保其在完整语义上所述意思，最终也无法绕开风险。

由此可见，上述现有的双录质检语义分析方法，显然仍存在有不便与缺陷，而亟待加以进一步改进。如何能创设一种新的针对金融领域的双录质检场景语义分析的、客观可控的语义分析方法，成为当前业界急需改进的目标。

发明内容

本发明要解决的技术问题是提供一种客观、可控的双录质检语义分析方法，以降低执行难度、提高双录质检效率、降低双录的业务风险和操作风险；从而克服现有技术中的两种极端方法存在的高风险或高不通过率、高人工辅助率的缺陷。

为解决上述技术问题，本发明采用如下技术方案：

一方面，本发明提供了一种双录质检语义分析方法，包括:

获取标准话术、目标文本、业务信息、违禁信息库并对所述标准话术及目标文本分别进行句子切分及对齐；

进行单句质检，包括：将所述目标文本中的句子与违禁信息库对比进行违禁信息识别；将所述目标文本中抽取出的参数类的业务信息与预先获取的业务信息进行文本匹配；将目标文本抽取后剩余的句子与标准话术中对应的剩余句子进行语义相似度分析，并与设定的阈值对比，如果低于设定阈值，则进一步将目标文本抽取后剩余的句子与预设误导信息进行语义相似度分析；

逐句质检得到最后结果。

作为本发明进一步地改进，所述单句质检中，在进行语义相似度分析前，还包括：将所述目标文本中抽取出的非参数类的必输关键话术信息与标准话术中的非参数类的必输关键话术信息进行文本匹配。

进一步地，所述单句质检中，语义相似度分析的结果为：如相似度高于设定的阈值，分类为准确话术；如果相似度低于设定的阈值，则与预设误导信息进行相似度分析，如果相似度高于设定的阈值则分类为误导信息；如果相似度低于设定的阈值分类为无感多余信息，但部分内容存疑，返回存疑片段在文本中对应的下标。

进一步地，所述单句质检中：如果目标文本中出现违禁信息，分析结果为话术出现违禁信息，并返回相应下标；和/或对所述目标文本中抽取出的参数类的业务信息与业务信息进行文本匹配后，如果一致，分析结果为信息准确；如果不一致，分析结果为信息不准确，并返回相应下标；如果没有抽取到相应的参数类的业务信息，分析结果为信息缺失，并返回缺失信息项。

进一步地，所述单句质检中：如果目标文本中与标准话术对应的句子缺失，分类为缺失话术；和/或如果标准话术中的同一话术匹配到目标文本中的多个句子，分类为话术重复，并使用多个句子中的最后一个句子与标准话术进行匹配。

进一步地，在进行所述单句质检时，加入语音识别容错方法，对于所述目标文本中语音识别的错误，如果是拼音正确和汉字识别错误，则使用拼音作为计算匹配的基础，进行容错处理。

进一步地，所述违禁信息识别使用前缀树或AC自动机算法；和/或所述文本匹配采用字符串匹配方法；和/或所述语义相似度分析采用词频tf-idf、词嵌入求平均、doc2vec或词移距离的语义相似度计算方法，所述语义相似度计算方法均使用金融领域语料库。

进一步地，所述目标文本来自于双录视频经角色分离及语音识别预处理后获得的文本信息；所述目标文本为客户经理或销售人员对应的目标文本；所述参数类的业务信息包括产品信息、客户信息、客户经理或销售人员信息。

另一方面，本发明还提供了一种双录质检语义分析装置，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述的双录质检语义分析方法。

再一方面，本发明还提供了一种双录质检系统，包括语音识别模块及文本分析模块，所述文本分析模块包括一个或多个程序，当所述一个或多个程序被处理器执行时，实现上述的双录质检语义分析方法。

通过采用上述技术方案，本发明至少具有以下优点：

1、客观性：本发明的双录质检语义分析方法融入了语义相似度分析，一方面能够对标准话术内话术做相似度的分析，接受口语化的表述，降低用户在执行时的难度，提高双录效率；另一方面，对标准话术外话术做相似度分析，排除误导类话术的风险。对比文本逐字匹配的方式更加接近人工质检结果。

2、可控性：本发明既包括违禁信息的检测、关键信息的检测、单句文本匹配以及相似度分析，同时对整个双录语音文本进行检测，层层把关最终降低双录的业务风险和操作风险。

附图说明

上述仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，以下结合附图与具体实施方式对本发明作进一步的详细说明。

图1是本发明实施例中的双录质检语义分析方法流程图。

图2是本发明实施例提供的双录质检语义分析装置的结构图。

具体实施方式

对于金融领域的双录质检，其质检水平的高低应该体现在两个维度：

客观性：客观性体现在虽然客户经理或销售人员的话术没有完全按照监管所属的模板逐字逐句呈现，但其在人工审核或者客户意义上是没有风险的，即系统不会因为害怕遗漏风险而将任务定义的非常死板，而增加执行人员在执行难度。

可控性：可控性体现在对于使用者而言，检测结果是可信任的、风险是可控的，对于检测通过的报告不存在监管层面的风险。

双录质检虽然是任务型的业务，但是在真实的面对面双录场景中仍然充满了各种随机的干扰信息：客户的提问、客户经理或销售人员的解释性说明、第三方插话甚至客户经理或销售人员复杂的非词语性的误导信息，所以只简单的关键信息(业务信息)提取比对、违禁信息的识别或者单纯全部逐字的文本匹配，无法真正实现客观的、可控的真实性语义分析。

本发明的双录质检语义分析方法正是同时考虑了上述两个维度，对目标文本及标准话术分别进行处理，将每句话分成不同的组成部分，对不同部分分别采用文本匹配或语义相似度分析，语义相似度分析包括与标准话术以及预设误导信息进行语义相似度分析，最终做到语义理解层面上的全面质检，配合质检的系列规则生成客观可控的质检报告。

图1为本发明一实施例中的双录质检语义分析方法流程图，该方法包括：

S1、获取标准话术、目标文本、业务信息、违禁信息库并对标准话术及目标文本分别进行句子切分及对齐。

S11:获取标准话术、目标文本、业务信息、违禁信息库。

其中，标准话术来自于模板填充模块，以保险销售为例，标准话术示例如下：销售人员：XX先生/女士，您好！为规范保险销售从业人员的销售行为，也为了更好地保护您的合法权益，根据保监会有关规定，我们将以录音录像方式对我的销售过程关键环节予以记录。请问您是否同意？我是XX(机构名称)的XX(姓名)。这是我的XX证件，请您核对。您所购买的是XX(保险公司名称)的名为XX(产品全称)的保险产品。这份保险每XX(年/月)缴费一次，每期保费XX元，缴费期XX(年/月)，保险期间XX(年/月),等等。

目标文本来自于双录视频经角色分离及语音识别等预处理过程产生的客户经理或销售人员和客户双角色的聊天式对话文本，客户回复由于比较简短且为词语式的所以多数方式为穷尽可接受合规回答后，将答案文本与合规方案进行匹配即可，不是本发明关注的范围。本发明主要是获取其中客户经理或销售人员对应的目标文本。

业务信息可从业务系统中调取出来，业务信息(归类于参数类信息)包括但不限于产品信息、客户信息、客户经理或销售人员信息等。以上述保险销售为例，其中的产品信息包括：XX(保险公司名称)的名为XX(产品全称)的保险产品、每XX(年/月)缴费一次，每期保费XX元，缴费期XX(年/月)，保险期间XX(年/月)等等。客户信息包括客户身份证、手机号码等信息。

S12、对标准话术及目标文本分别进行句子切分及对齐：

将整个标准话术按照标点符号及字面信息，切分为若干个子句。将目标文本按照相同的方式切分为若干个子句。对于每个子句，还可使用分词工具将它切分为若干个短语或词语。按照专家定义和标注，将模板中的业务信息划分出来。

第一轮子句对齐时，采用启发式算法或动态规划算法，利用字面匹配信息，尽可能对齐相对应的子句。

可以理解的是，上述S11、S12仅是为了描述方便，不应限制为两个步骤的先后顺序，即可以先切分、对齐句子后再获取相应的业务信息及违禁信息库。

S2、进行单句质检；

在进行单句质检时，由于语音的识别问题，可能会出现一些语音识别错误问题，因此，优选的方式为在单句质检中加入语音识别容错方法，对于目标文本中语音识别的错误，如果是拼音正确和汉字识别错误，则使用拼音作为计算匹配的基础，进行容错处理，通过容错处理可以大大提高质检的准确性。

对于一个复杂的完整销售句子，其可能既包括参数类的业务信息，例如产品信息、客户信息、客户经理或销售人员信息，也包括非参数类的标准话术，此类话术中又可能包含有必需揭示的关键信息。而对整个句子的分析就分为对全句的违禁信息识别，对参数类的业务信息、非参数类的必输关键话术信息的文本匹配，以及对剩余句子的语义相似度分析。下面分别进行展开说明：

S11、违禁信息识别：将目标文本中的句子与违禁信息库对比进行违禁信息识别；违禁信息可为“利率”、“放心”等敏感词汇，违禁信息库可根据金融领域实际情况进行添加。进行对比识别后，如果目标文本中出现违禁信息，分析结果为话术出现违禁信息，并返回相应下标；可使用前缀树或AC自动机算法进行对比识别。

S22、将目标文本中抽取出的参数类的业务信息与预先获取的业务信息进行文本匹配；如果一致，分析结果为信息准确；如果不一致，分析结果为信息不准确，并返回相应下标；如果没有抽取到相应的参数类的业务信息，分析结果为信息缺失，并返回缺失信息项。

S23、将目标文本中抽取出的非参数类的必输关键话术信息与标准话术中的非参数类的必输关键话术信息进行文本匹配；以上述保险销售为例，“以录音录像方式对我的销售过程关键环节予以记录”就属于非参数类的必输关键话术信息。

上述S22、S23均采用抽取的方式，然后对抽取的信息进行文本匹配。

文本匹配用于识别目标文本中的话术，判断话术文本及关键信息是否与给定的业务信息相符合。原理是字符串匹配，算法例如最小编辑距离、正则表达式匹配等。严格基于字面信息逐字准确匹配。

文本匹配根据事先给定标准话术模板，并注明模板中的哪些内容属于必须完整准确的话术，哪些内容属于需要与业务信息相匹配的关键信息，并注明其文本格式或规则。按照专家定义和标注，定义文本匹配工具的规则。在匹配时，提供待匹配的业务信息，包括但不限于客户信息和产品信息。

针对表达方式相对固定的场景，此部分的原理是对信息进行规范化表示后，采用预定义的抽取规则模板，从符合上下文和格式规则的文本中抽取信息，同时为了提高准确性同时配套使用机器学习、深度学习的方法，训练基于文本特征的抽取模型。

S24、将目标文本抽取后剩余的句子与标准话术中对应的剩余句子进行语义相似度分析，并与设定的阈值对比，如相似度高于设定的阈值，分类为准确话术；如果低于设定阈值，则进一步将目标文本抽取后剩余的句子与预设误导信息进行语义相似度分析；如果相似度高于设定的阈值则分类为误导信息；如果相似度低于设定的阈值分类为无感多余信息，但部分内容存疑，返回存疑片段在文本中对应的下标。

语义相似度分析能够灵活计算两段文本之间的相似度，识别出语义是否相近，而不一定依赖于字面信息是否相似。

将文本投射到向量空间，计算对应向量之间的距离，算法例如tf-idf、词嵌入求平均、doc2vec、词移距离等。特点是不严格基于字面信息，适用于文本表述变化较为丰富、并拥有大量训练数据的场景。

由于不同领域具有不同的术语、句式和其他表述习惯，因此同样的输入句对在不同领域可能会得出不同的相似度。例如一般生活中，“好的”和“是的”都是肯定回答，语义相似度很高；但是在双录质检场景中，这两个回答不属于相似回答，语义相似度很低。因此，语义相似度重度依赖于特定的领域，其计算模型必须建立在特定领域的词库和语料库基础上，对计算资源和训练时间也有较高的要求。

语义相似度算法及模型，词频tf-idf方法，统计每个词在文档中出现的频率，及每个词在整个语料库中出现的次数之倒数，在词库大小为N的情况下，每个文档表示成N维的稀疏向量。向量之间计算余弦相似度或L1、L2距离，可用于计算语义相似度。

词嵌入求平均方法，使用两层前馈神经网络建立该领域的语言模型，通过词的共现情况预测每个词在给定上下文中出现的条件概率，从而获得词嵌入，即每个词的低维连续向量表示。对于较短的句子，其中出现的每个词嵌入向量加权求和，作为句子的向量表示。向量的余弦相似度可作为句子的语义相似度。

Doc2vec方法与词嵌入建立方式类似，将给定上下文扩充为每个词所在的句子或文档，从而在训练词嵌入的同时获得句子或文档的向量表示，计算余弦相似度作为语义相似度。

词移距离方法，词嵌入建立方式同前。对目标句子中的每个词，分别计算它与模板句子中所有词的最小距离，然后求和得到目标句子和模板句子的整体距离，进而求出句子的语义相似度。

以上方法都使用金融领域语料库，语料库的分布代表真实数据。

请注意，上述目标文本抽取后剩余的句子可以理解为：一个句子包含待抽取的信息，抽取相应信息后剩余的句子；或是一个句子中不包含待抽取的信息，抽取后剩余的句子实际上就是原句子。

另外，可以理解的是，上述各步骤S22、S23、S24的步骤在不同的情况下是可互换的，本发明不应受上述标号顺序的限制。如在上述单句质检过程中，除了违禁信息检测外，其话术检测和分类步骤可为：

(1)对于简单的、目标文本的句子中不含有参数类业务信息和非参数类的必输关键话术信息时，可直接进行语义相似度比对，如果目标文本片段与标准话术匹配相似，相似度高于设定的阈值，分类为准确话术；如果相似度低于设定的阈值，则与预设误导信息进行相似度分析，如果相似度高于设定的阈值则分类为误导信息，如果相似度低于设定的阈值分类为无感多余信息，但部分内容存疑，返回存疑片段在文本中对应的下标。而对于含有参数类和/或非参数类的必输关键话术信息的复杂句子时，可对抽取后的剩余句子做上述的语义相似度分析。

(2)在包含参数类的业务信息的话术中，根据业务信息进行进一步分类：如果关键信息与业务信息一致，分类为准确话术；如果模板话术出现，但是关键信息缺失，或者关键信息与业务信息不一致，分类为话术不准确。

另外，对于单个句子的质检还包括如下后处理步骤：

如果某个模板话术缺失，分类为缺失话术；如果标准话术中的同一话术匹配到目标文本中的多个句子，分类为话术重复，并使用多个句子中的最后一个句子与标准话术进行匹配。举例来说，销售人员由于口误，先说了一句：“每1年缴费一次”，发现错误后马上更改为“每2年缴费一次”，则进行匹配时，选择最后句更正后的句子来进行匹配。

另外，对于单个句子的质检还包括如下后处理步骤：记录分数，对标准话术单句进行逐句扫描，分别记录其与目标文本之间的匹配情况，并对不同的匹配情况赋予不同的分值，例如话术不完整或不准确为-1分，话术多余但不误导为0分，误导话术为-2,话术完整或准确为+1分等等。

上述违禁词检测、参数类的业务信息(关键信息)检测、非参数类的必输关键话术信息文本匹配和语义相似度分析结果根据单句质检规则最终综合得出单个句子的合规质检结果，一般出现违禁词、致命性关键信息(客户身份证号码、产品代码、销售人员姓名等)错误、出现误导信息、关键信息缺失均为不通过。

S3、逐句按照上述的单句质检的方法进行分析，得到最后结果。根据各个句子的质检结果，根据质检的系列规则整合输出整体的客观、可控的质检报告，输出单句检测结果为合规或不合规，并返回疑似不合规的子句及其分类。质检报告还包括致命信息种类设置、违禁词种类设置、相似度阈值设置、误导信息语义设置等。

另外，本发明实施例还提供了一种双录质检语义分析装置，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现上述的双录质检语义分析方法。

具体如图2所示，是本发明实施例提供的一种双录质检语义分析装置的结构图。参见图2，双录质检语义分析装置包括：中央处理单元(CPU)201，其可以根据存储在只读存储器(ROM)中的程序或者从存储部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM203中，还存储有系统操作所需的各种程序和数据。CPU 201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。

以下部件连接至I/O接口205：包括键盘、鼠标等的输入部分206；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207；包括硬盘等的存储部分208；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器210上，以便于从其上读出的计算机程序根据需要被安装入存储部分208。

本发明实施例还提供了一种双录质检系统，包括语音识别模块及文本分析模块，其中文本分析模块包括一个或多个程序，当所述一个或多个程序被处理器执行时，实现上述的双录质检语义分析方法。

综上所述，本发明的双录质检语义分析方法包括获取标准话术、目标文本、业务信息、违禁信息库并对标准话术及目标文本分别进行句子切分及对齐；进行单句质检，包括：违禁信息识别、参数类的业务信息的文本匹配、非参数类的必输关键话术信息的文本匹配、剩余句子与对应句子的语义相似度分析及与预设误导信息的语义相似度分析；再逐句质检得到最后结果。从客观性方面，本发明在双录质检语义分析中对单句进行分类，融入相似度分析，一方面能够对标准话术范围内话术做相似度的分析，接受口语化的表述，降低用户在执行时的难度，提高双录效率。另一方面，对标准话术范围外话术做相似度分析，排除误导类话术的风险。对比文本逐字匹配的方式更加接近人工质检结果。从可控性方面，本发明既包括违禁信息的检测、参数类的业务信息(关键信息)检测、单句文本匹配(非参数类的必输关键话术信息)以及语义相似度分析，同时对整个双录语音文本进行检测，层层把关最终降低双录的业务风险和操作风险。

以上所述，仅是本发明的较佳实施例而已，并非对本发明作任何形式上的限制，本领域技术人员利用上述揭示的技术内容做出些许简单修改、等同变化或修饰，均落在本发明的保护范围内。

Claims

1.一种双录质检语义分析方法，其特征在于，包括:

逐句质检得到最后结果。

2.根据权利要求1所述的双录质检语义分析方法，其特征在于，所述单句质检中，在进行语义相似度分析前，还包括：

将所述目标文本中抽取出的非参数类的必输关键话术信息与标准话术中的非参数类的必输关键话术信息进行文本匹配。

3.根据权利要求1或2所述的双录质检语义分析方法，其特征在于，所述单句质检中，语义相似度分析的结果为：

如相似度高于设定的阈值，分类为准确话术；如果相似度低于设定的阈值，则与预设误导信息进行相似度分析，如果相似度高于设定的阈值则分类为误导信息；如果相似度低于设定的阈值分类为无感多余信息，但部分内容存疑，返回存疑片段在文本中对应的下标。

4.根据权利要求1或2所述的双录质检语义分析方法，其特征在于，所述单句质检中：

如果目标文本中出现违禁信息，分析结果为话术出现违禁信息，并返回相应下标；

和/或对所述目标文本中抽取出的参数类的业务信息与业务信息进行文本匹配后，如果一致，分析结果为信息准确；如果不一致，分析结果为信息不准确，并返回相应下标；如果没有抽取到相应的参数类的业务信息，分析结果为信息缺失，并返回缺失信息项。

5.根据权利要求1或2所述的双录质检语义分析方法，其特征在于，所述单句质检中：

如果目标文本中与标准话术对应的句子缺失，分类为缺失话术；

和/或如果标准话术中的同一话术匹配到目标文本中的多个句子，分类为话术重复，并使用多个句子中的最后一个句子与标准话术进行匹配。

6.根据权利要求1或2所述的双录质检语义分析方法，其特征在于，在进行所述单句质检时，加入语音识别容错方法，对于所述目标文本中语音识别的错误，如果是拼音正确和汉字识别错误，则使用拼音作为计算匹配的基础，进行容错处理。

7.根据权利要求1或2所述的双录质检语义分析方法，其特征在于，所述违禁信息识别使用前缀树或AC自动机算法；

和/或所述文本匹配采用字符串匹配方法；

和/或所述语义相似度分析采用词频tf-idf、词嵌入求平均、doc2vec或词移距离的语义相似度计算方法，所述语义相似度计算方法均使用金融领域语料库。

8.根据权利要求1或2所述的双录质检语义分析方法，其特征在于，所述目标文本来自于双录视频经角色分离及语音识别预处理后获得的文本信息；所述目标文本为客户经理或销售人员对应的目标文本；所述参数类的业务信息包括产品信息、客户信息、客户经理或销售人员信息。

9.一种双录质检语义分析装置，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现权利要求1至8任一项所述的双录质检语义分析方法。

10.一种双录质检系统，包括语音识别模块及文本分析模块，其特征在于，所述文本分析模块包括一个或多个程序，当所述一个或多个程序被处理器执行时，实现权利要求1至8任一项所述的双录质检语义分析方法。