CN116092496A

CN116092496A - 一种话术表达完整性判别的方法与系统

Info

Publication number: CN116092496A
Application number: CN202211551039.3A
Authority: CN
Inventors: 张志坚; 陈友斌; 徐一波; 申意萍
Original assignee: Hubei Micropattern Technology Development Co ltd
Current assignee: Hubei Micropattern Technology Development Co ltd
Priority date: 2022-12-05
Filing date: 2022-12-05
Publication date: 2023-05-09
Anticipated expiration: 2042-12-05
Also published as: CN116092496B

Abstract

一种话术表达完整性判别的方法与系统，步骤1，根据工作人员某次双录销售过程所销售产品的特点制定标准话术，并把标准话术根据语义切分为至少一个话术环节，每个话术环节包含一个需要向客户说明的完整信息。步骤2，获取工作人员双录过程中的语音数据；步骤3，使用语音识别技术把语音数据转换为文本数据；步骤4，基于编辑距离算法完成话术表达完整性的判断，将步骤3中的文本数据和标准话术的每个话术环节进行编辑距离算法比较，根据比较结果判断工作人员的语音内容对于标准话术的表达是否完整。能够准确地判断工作人员的话术表达是否完整，省略了深度学习的训练过程，采用简单的编辑距离完成话术表达完整性判断，具有快速、准确的特点。

Description

一种话术表达完整性判别的方法与系统

技术领域

本发明涉及事后双录质检稽核、远程双录、临柜双录等相关领域，尤其是涉及一种双录过程中工作人员话术表达完整性判别的方法与系统。

背景技术

根据监管部门的要求，银行、证券、保险等金融机构在销售理财产品、贵重金属、保险产品时，需要实施专区“双录”管理，即设立销售专区，并在销售专区内装配电子系统，对每笔产品销售过程同步录音录像，以确保销售人员按程序、按规定介绍产品，使购买者更清楚地了解产品的性质和自身享有的权利、承担的责任和风险。除此之外，销售人员必须按照设定的话术模板向客户进行介绍。因此，银行、证券、保险等各种应用中，判断工作人员是否按照标准的话术和客户进行交流，具有非常重要的现实意义。

发明内容

为了解决现有技术中快速准确判断工作人员是否按照标准的话术和客户进行交流的问题，本发明提供一种话术表达完整性判别的方法与系统，采用如下的技术方案：

一种话术表达完整性判别的方法，步骤1，制定标准话术，并把标准话术根据语义切分为至少一个话术环节，每个话术环节包含一个需要向客户说明的完整信息；

步骤2，获取工作人员双录过程中的语音数据；

步骤3，使用语音识别技术把语音数据转换为文本数据；

步骤4，基于编辑距离算法完成话术表达完整性的判断，将步骤3中的文本数据和标准话术的每个话术环节进行编辑距离算法比较，根据比较结果判断工作人员的语音内容对于标准话术的表达是否完整。

通过采用上述技术方案，本系统分为标准话术结构分析和工作人员话术表达完整性判别两个部分。标准话术结构分析包含两个步骤：1)根据工作人员某次双录销售过程所销售产品的特点制定标准话术，2)话术结构分析，把标准话术根据语义切分为若干环节。工作人员话术表达完整性判别包含三个步骤：1)获取工作人员的语音数据，2)把语音数据转换为文本数据，3)把文本数据和标准话术的每个环节进行比较，判断工作人员的语音内容是否包含所有的环节。如包含所有的环节，则认为工作人员话术表达完整；如缺失某几个环节，则认为话术表达不完整且给出具体缺失的环节。

该方法具有高效准确的优点，能够准确地判断工作人员的话术表达是否完整。该方法具有两个特点：1)如果工作人员调整话术的顺序，该方法仍然可以对工作人员的话术表达完整性做出正确的判断。2)省略了深度学习的训练过程，采用简单的编辑距离完成话术表达完整性判断，具有快速、准确的特点。为实现上述功能，本发明还涉及一个系统如图2所示，录音设备负责录制工作人员的音频，存储器负责存储话术表达完整性的可执行程序以及录制的语音数据，处理器负责执行话术表达完整性程序，并把程序执行结果返回给存储器或者显示设备，显示设备负责显示程序执行结果。

通过上述技术方案，根据工作人员提供服务的种类、目的制定标准话术，包含所有需要向客户表达的内容信息。例如，商业银行的理财销售人员在面向个人客户营销推介自有理财及经商业银行准入的合作机构依法发行的金融产品(简称“代销产品”)时，需要对每笔产品销售过程关键环节进行同步录音录像。银行销售人员和消费者应采用问答式和叙述式的对话表述方式完成金融产品的销售。商业银行需要制定银行销售人员在销售过程中遵守的话术标准。

例如，商业银行制定的银行销售人员在销售过程的话术标准的内容应包括如下六个典型环节：销售人员和消费者的身份确认、消费者愿意录音录像、产品介绍(产品名称、产品类型、发行机构、风险等级、收益类型等)、风险揭示、自有产品或者代销产品的清楚说明、消费者的自主意愿等。对应的，本发明把话术标准分成6个环节。

用P＝{pi,i＝0,1,2,3,…,N-1}表示一个话术，其中N为该话术的环节个数，pi为第i个环节的文本。

步骤2中，直接从录音设备的数据接口获取工作人员的语音数据或从录制的视频中提取语音数据。

通过上述技术方案，可以采用各种不同的录音设备获取工作人员的语音数据，也可以从录制的视频中提取语音数据。

步骤3中，使用语音识别技术把语音数据转换为文本数据，设C＝{cj,j＝0,1,2,…,M-1}表示语音数据转文本数据，其中M是文本数据的字符数，cj是第j个字符。

通过上述技术方案，文本数据C便于后续快速进行相似度的比对。

步骤4中，基于编辑距离算法完成话术表达完整性的判断的方法是：

首先，在文本数据中按照步长step，step>1，进行快速判断话术表达中是否包含了标准话术P中的第i个环节；

其次，逐字符的精确判断话术表达中是否包含了标准话术中的第i个环节。

步骤4中，基于编辑距离算法完成话术表达完整性的判断的方法具体是：

设定Max_s1为最大相似度，且初始化为Max_s1＝0，设定Leni是pi的字符数，设定步长step＝max(2，取整(Leni/A)),A是提速比，从文本数据的第一个字符c0开始按照步长step取Leni长度的字符串设为temp，将temp与pi进行相似度比较，比较结果为s1＝Simi(temp,pi)，如果s1＞Max_s1，则更新Max_s1＝s1，且记录temp的起始位置为Index_s1，循环此过程直至遍历完整个文本数据；

设定阈值thr_1，如果Max_s1<thr_1，则判断结果为工作人员的话术表达中没有包含了标准话术P中的第i个环节，提前终止判断；

如果Max_s1>thr_1，则逐字符的精确判断文本数据C中是否包含了标准话术P中的第i个环节，具体步骤是：

设定Max_s2＝0，从文本数据的第Index_s1-Leni/B个字符开始按照步长1取Leni长度的字符串设为temp，将temp与pi进行相似度比较，比较结果为s2＝Simi(temp,pi)，如果s2＞Max_s2，则更新Max_s2＝s2，循环此过程直至从第Index_s1+Leni/B个字符取长度为Leni的字符串；

设定阈值thr_2，如果Max_s2<thr_2，则判断工作人员的话术表达文本数据C中没有包含标准话术P中的第i个环节，如果Max_s2>thr_2，则判断工作人员的话术表达文本数据C中包含了标准话术P中的第i个环节；

如果文本数据C中包含标准话术P中的所有环节，则判断话术表达完整。

通过上述技术方案，假设两个字符串A和B的字符串长度相等，设长度为L，定义字符串A和B的相似度为：

Simi(A,B)＝100(1–Levenshtein(A,B)/L)

其中，Levenshtein(A,B)为A和B的莱文斯坦距离(莱文斯坦距离是编辑距离的一种形式)，显然，Simi(A,B)越大，表示A和B的相似度越高；对应到本方案中的Max_s1和Max_s2越大，意味着对比相似度越高。

一种话术表达完整性判别系统，包括录音设备、处理器、存储器和显示设备，所述存储器内预装有根据权利要求1-6中任一项所述方法设计的话术表达完整性判别程序，所述录音设备采集语音数据储存在存储器，所述处理器运行存储器内的话术表达完整性判别程序完成对录音设备采集到的语音数据的话术表达完整性的判断，所述处理器通过显示设备显示表达完整性判别的程序运行界面和结果。

综上所述，本发明包括以下至少一种有益技术效果：

本发明的一种话术表达完整性判别的方法与系统，能够准确地判断工作人员的话术表达是否完整，如果工作人员调整话术的顺序，该方法仍然可以对工作人员的话术表达完整性做出正确的判断；省略了深度学习的训练过程，采用简单的编辑距离完成话术表达完整性判断，具有快速、准确的特点。

附图说明

图1是本发明一种话术表达完整性判别的方法的流程示意图；

图2是本发明一种话术表达完整性判别系统的结构原理示意图。

具体实施方式

以下结合附图1-图2对本发明作进一步详细说明。

本发明实施例公开一种话术表达完整性判别的方法及系统。

参照图1，一种话术表达完整性判别的方法，

步骤1，制定标准话术，并把标准话术根据语义切分为至少一个话术环节，每个话术环节包含一个需要向客户说明的完整信息；

步骤2，获取工作人员双录过程中的语音数据；

步骤3，使用语音识别技术把语音数据转换为文本数据；

步骤1中，根据工作人员提供服务的种类和目的制定标准话术，标准话术包含所有需要向客户表达的内容，对标准话术进行标号，并归集形成话术P，P＝{pi,i＝0,1,2,3,…,N-1}，其中N是话术P的环节个数，pi为第i个环节的文本数据。

根据工作人员提供服务的种类、目的制定标准话术，包含所有需要向客户表达的内容。例如，商业银行的理财销售人员在面向个人客户营销推介自有理财及经商业银行准入的合作机构依法发行的金融产品(简称“代销产品”)时，需要对每笔产品销售过程关键环节进行同步录音录像。银行销售人员和消费者应采用问答式和叙述式的对话表述方式完成金融产品的销售。商业银行需要制定银行销售人员在销售过程中遵守的话术标准。

可以采用各种不同的录音设备获取工作人员的语音数据，也可以从录制的视频中提取语音数据。

文本数据C便于后续快速进行相似度的比对。

假设两个字符串A和B的字符串长度相等，设长度为L，定义字符串A和B的相似度为：Simi(A,B)＝100(1–Levenshtein(A,B)/L)。可选的，可以把字符串A和字符串B转为拼音，或者去除标点符号，再计算相似度，以提高判断的精度。

其中，Levenshtein(A,B)为A和B的莱文斯坦距离，显然，Simi(A,B)越大，表示A和B的相似度越高；对应到本方案中的Max_s1和Max_s2值越大，意味着对比相似度越高。

一种话术表达完整性判别系统，包括录音设备、处理器、存储器和显示设备，存储器内预装有根据权利要求1-6中任一项方法设计的话术表达完整性判别程序，录音设备采集语音数据储存在存储器，处理器运行存储器内的话术表达完整性判别程序完成对录音设备采集到的语音数据的话术表达完整性的判断，处理器通过显示设备显示表达完整性判别的程序运行界面和结果。

以下内容为判断保险代理人向被保人销售保险的双录过程中话术是否完整的一个示例：

步骤1，对标准话术进行语义分析，得到话术环节：

环节0：为规范保险销售从业人员的销售行为，也为了更好地保护您的合法权益，根据相关监管规定，我们将以录音录像方式对销售过程关键环节予以记录。请问您是否同意？

环节1：需要提醒您的是，此次录音录像过程对于今后您维护权益非常关键。请您认真阅读您签署文件的具体内容，如实回答相关问题。请问我说清楚了吗？

环节2：您此次是自愿购买xxx保险有限公司的名为xxx的保险产品吗？在投保这份保险之前及本次投保过程中，请问是否有本公司任何人员对您进行误导或强制性购买？

环节3：根据保险法第十六条，您需要如实告知填写您的投保信息，投保人故意不履行如实告知义务的，或者投保人因重大过失未履行如实告知义务的，应承担相应法律后果。未如实告知事项对保险事故的发生有严重影响的，保险公司可能对发生的保险事故不承担赔偿或给付保险金的责任。前面我在销售过程中已详细询问了您的投保信息，请问您对这些投保信息的真实性可以确认吗？

环节4：除此之外请您关注，条款中的明确说明与如实告知年龄计算及错误处理保险事故的通知等内容，请问您对以上的所有险种展示的免责声明文件内容是否清楚？

环节5：我已向您介绍这份产品的保险责任免除事项，这是条款中的保险责任及责任免除，为保障您的权益，请您认真阅读，请问您清楚了吗？

环节6：请您依次浏览投保提示书、免除保险人责任条款的书面说明、投保单，您确认所有投保单证签字显示无误吗？

环节7：为保障您的权益，请您确认投保提示书、免除保险人责任条款的书面说明、投保单上的签字是您和被保险人本人签字的吗？

环节8：感谢您的配合。

经过步骤2和步骤3，我们获得销售人员在销售过程中的语音数据对应的文本数据，如下所示：

“王一女士，您好。为规范保险销售从业人员的销售行为，也为了更好地保护您的合法权益，根据相关监管规定，我们将以录音录像方式对销售过程关键环节予以记录。请问您是否同意？需要提醒您的是，此次录音录像过程对于今后您今后维权非常关键。请您认真阅读您签署文件的具体内容，如实回答所有问题。请问我说清楚了吗？向您销售的是微模式保险销售股份公司的张三，这是我的有效身份证请您核对。你凭什么上来我上哪一个啊谁知给你看一下嗯不用不用。这是我的保险销售从业人员职业证，请您核对。需求量这么厉害数据手册谁知跟这个没关系频繁数据地区。您是否确认刚刚向您介绍的位销售人员本人。请展示您的有效身份证件，对吗？您此次是自愿购买微模式人寿保险有限公司的名为微模式财富世家终身寿险的保险产品吗？在投保这份保险之前即本次投保过程中，请问是否由本公司任何人员对您进行误导或强制性购买？您已经充分了解这份保险是期交每期保费是2090204元，缴费期是三年，保险期间是一年期以上。您保持连续缴费，如果中途停止缴费会影响您的权益。请问我说清楚了吗？清楚。根据保险法第16条，您需要如实告知填写您的投保信息，投保人故意不履行如实告知义务的，或者投保人因重大过失未履行如实告知义务的，应承担相应法律后果，未如实告知事项对保险事故的发生有严重影响的，保险公司可能对发生的保险事故不承担赔偿或给付保险金的责任。前面我在销售过程中已详细询问了您的投保信息，请问您对这些投保信息的真实性可以确认吗？(以下省略)”

以判断话术表达中是否包含环节1为例：此时，p1＝“需要提醒您的是，此次录音录像过程对于今后您维护权益非常关键。请您认真阅读您签署文件的具体内容，如实回答相关问题。请问我说清楚了吗？”初始化Max_s1＝0，设定Leni＝65，设定A＝5，则step＝max(2，取整(65/5))＝13，然后进入迭代循环的过程。

从文本数据的第一个字符“王”开始连续取65个字符构成字符串temp＝“王一女士，您好。为规范保险销售从业人员的销售行为，也为了更好地保护您的合法权益，根据相关监管规定，我们将以录音录像方式对销售过程关”，将temp与p1进行相似度比较，比较结果为s1＝Simi(temp,pi)＝1.53，此时s1＞Max_s1，则更新Max_s1＝1.53，且记录temp的起始位置为Index_s1＝0；

从文本数据的第step＝13个字符开始连续取65个字符构成字符串temp＝“销售从业人员的销售行为，也为了更好地保护您的合法权益，根据相关监管规定，我们将以录音录像方式对销售过程关键环节予以记录。请问您是否”，将temp与p1进行相似度比较，比较结果为s1＝Simi(temp,pi)＝4.61，此时s1＞Max_s1，则更新Max_s1＝4.61，且记录temp的起始位置为Index_s1＝13；

依次进行迭代，最终得到的文本数据中和第1个话术环节最接近的为：Index_s1＝78,Max_s1＝81.53，对应的temp＝“同意？需要提醒您的是，此次录音录像过程对于今后您今后维权非常关键。请您认真阅读您签署文件的具体内容，如实回答所有问题。请问我说清楚”

设定阈值thr_1＝0.75,因为Max_s1>thr_1，所以进入逐字符的精确判断文本数据C中是否包含了标准话术P中的第1个环节，具体步骤是：

Leni＝65,设定Max_s2＝0，B＝10,Index_s1-Leni/B＝80-65/10＝73，进入循环

从文本数据的第73个字符开始取65个字符得到temp＝“请问您是否同意？需要提醒您的是，此次录音录像过程对于今后您今后维权非常关键。请您认真阅读您签署文件的具体内容，如实回答所有问题。请”，将temp与p1进行相似度比较，比较结果为s2＝Simi(temp,pi)＝66.15，此时s2＞Max_s2，则更新Max_s2＝66.15，且记录temp的起始位置为Index_s2＝73；

从文本数据的第74个字符开始取65个字符得到temp＝“问您是否同意？需要提醒您的是，此次录音录像过程对于今后您今后维权非常关键。请您认真阅读您签署文件的具体内容，如实回答所有问题。请问”，将temp与p1进行相似度比较，比较结果为s2＝Simi(temp,pi)＝69.23，此时s2＞Max_s2，则更新Max_s2＝69.23，且记录temp的起始位置为Index_s2＝69.23；

依次进行迭代，直至到从Index_s1+Leni/B＝87个字符取长度为Leni的字符串为止。

最终得到的文本数据中和第1个话术环节最接近的为：Index_s2＝81,Max_s2＝90.76，对应的temp＝“需要提醒您的是，此次录音录像过程对于今后您今后维权非常关键。请您认真阅读您签署文件的具体内容，如实回答所有问题。请问我说清楚了吗？”

设定thr_2＝0.85，因为Max_s2>thr_2，所以判断工作人员的话术表达文本数据C中包含了标准话术P中的第1个环节。

按照上述过程，可以判断出判断工作人员的话术表达文本数据C中包含了标准话术P中的第0-8个环节，进而得出结论：工作人员的话术表达完整。

以上均为本发明的较佳实施例，并非依此限制本发明的保护范围，故：凡依本发明的结构、形状、原理所做的等效变化，均应涵盖于本发明的保护范围之内。

Claims

1.一种话术表达完整性判别的方法，其特征在于：

步骤2，获取工作人员双录过程中的语音数据；

步骤3，使用语音识别技术把语音数据转换为文本数据；

2.根据权利要求1所述的一种话术表达完整性判别的方法，其特征在于：

步骤1中，根据工作人员提供服务的种类和目的制定标准话术，所述标准话术包含所有需要向客户表达的多个信息，对所述标准话术进行语义分析，形成话术P={pi,i=0,1,2,3,…,N-1}，其中N是话术P的环节个数，pi为第i个环节的文本数据，pi表示工作人员向客户表达的一个完整信息对应的文字。

3.根据权利要求1所述的一种话术表达完整性判别的方法，其特征在于：

4.根据权利要求1所述的一种话术表达完整性判别的方法，其特征在于：

步骤3中，使用语音识别技术把语音数据转换为文本数据C={cj,j=0,1,2,…,M-1}，其中M是文本数据的字符数，cj是第j个字符。

5.根据权利要求1-4所述的一种话术表达完整性判别的方法，其特征在于：

6.根据权利要求5所述的一种话术表达完整性判别的方法，其特征在于：

设定Max_s1为最大相似度，且初始化为Max_s1=0，设定Leni是pi的字符数，设定步长step=max(2，取整(Leni/A)),A是提速比，从文本数据的第一个字符c0开始按照步长step取Leni长度的字符串设为temp，将temp与pi进行相似度比较，比较结果为s1=Simi(temp,pi)，如果s1＞Max_s1，则更新Max_s1=s1，且记录temp的起始位置为Index_s1，循环此过程直至遍历完整个文本数据，遍历过程会不断地更新Max_s1和Index_s1；

设定Max_s2=0，从文本数据的第Index_s1-Leni/B个字符开始按照步长1取Leni长度的字符串设为temp，将temp与pi进行相似度比较，比较结果为s2=Simi(temp,pi)，如果s2＞Max_s2，则更新Max_s2=s2，循环此过程直至从第Index_s1+Leni/B个字符取长度为Leni的字符串；

7.一种话术表达完整性判别系统，其特征在于：包括录音设备、处理器、存储器和显示设备，所述存储器内预装有根据权利要求1-6中任一项所述方法设计的话术表达完整性判别程序，所述录音设备采集语音数据储存在存储器，所述处理器运行存储器内的话术表达完整性判别程序完成对录音设备采集到的语音数据的话术表达完整性的判断，所述处理器通过显示设备显示表达完整性判别的程序运行界面和结果。