CN112347237A

CN112347237A - 一种问答话术生成方法、装置、服务器以及可读存储介质

Info

Publication number: CN112347237A
Application number: CN202011297436.3A
Authority: CN
Inventors: 聂镭; 齐凯杰; 聂颖
Original assignee: Longma Zhixin Zhuhai Hengqin Technology Co ltd
Current assignee: Longma Zhixin Zhuhai Hengqin Technology Co ltd
Priority date: 2020-11-19
Filing date: 2020-11-19
Publication date: 2021-02-09

Abstract

本申请适用于自然语言处理技术领域，提供了一种问答话术生成方法、装置、服务器以及计算机可读存储介质，该方法包括：获取待处理语音文本；分割出待处理语音文本中的问题特征文本和回答特征文本，问题特征文本与回答特征文本一一对应；根据问题特征文本生成有项无环图；提炼出回答特征文本的决策点；将决策点加入至有项无环图，形成问答话术。可见，本申请实时可以支撑到智能客服机器人的运用，从而解决现有技术中依靠人工客服销售的沟通效率很低的问题。

Description

一种问答话术生成方法、装置、服务器以及可读存储介质

技术领域

本申请属于自然语言处理技术领域，尤其涉及一种话术生成方法、装置、服务器以及可读存储介质。

背景技术

电话销售在保险金融行业是非常重要的一环，给金融保险业带来了很多的订单和盈利。然而电话销售的面临的难题是转化率（即成单数/拨通数）过低，说服一个不愿意成单的客户时间成本过大，不如寻找到想要成单的客户，但是想要找出成单的客户只依靠人工客服销售的沟通效率很低，亟需可以智能客服机器人可以大批量拨打电话，提供销售效率，但是智能客服机器人的运用又必须依靠预先设计的话术。

发明内容

本申请实施例提供了一种问答话术生成方法及装置，可以解决现有技术中依靠人工客服销售的沟通效率很低的问题。

第一方面，本申请实施例提供了一种问答话术生成方法，包括：

获取待处理语音文本；

分割出所述待处理语音文本中的问题特征文本和回答特征文本，所述问题特征文本与所述回答特征文本一一对应；

根据所述问题特征文本生成有项无环图；

提炼出所述回答特征文本的决策点；

将所述决策点加入至所述有项无环图，形成问答话术。

在第一方面的一种可能的实现方式中，根据所述问题特征文本生成有项无环图，包括：

以所述问题特征文本作为顶点，基于所述问题特征文本之间的因果关系，生成有向无环图。

在第一方面的一种可能的实现方式中，以所述问题特征文本作为顶点，基于所述问题特征文本之间的因果关系，生成有向无环图，包括：

识别每个所述问题特征文本对应的问题类型序号；

计算每个所述问题特征文本的特征值；

按问题类型序号的排列顺序，以所述特征值为所述问题特征文本之间的边，生成有向无环图。

在第一方面的一种可能的实现方式中，提炼出所述回答特征文本的决策点，包括：

唤醒预设的决策策略；

根据预设的决策策略对所述回答特征文本进行类型分类；

基于所述类型分类的结果形成所述决策点。

第二方面，本申请实施例提供了一种问答话术生成装置，包括：

获取模块，用于获取待处理语音文本；

分割模块，用于分割出所述待处理语音文本中的问题特征文本和回答特征文本，所述问题特征文本与所述回答特征文本一一对应；

第一生成模块，用于根据所述问题特征文本生成有项无环图；

提炼模块，用于提炼出所述回答特征文本的决策点；

第二生成模块，用于将所述决策点加入至所述有项无环图，形成问答话术。

在第二方面的一种可能的实现方式中，所述第一生成模块，包括：

生成子模块，用于以所述问题特征文本作为顶点，基于所述问题特征文本之间的因果关系，生成有向无环图。

在第二方面的一种可能的实现方式中，所述生成子模块，包括：

识别单元，用于识别每个所述问题特征文本对应的问题类型序号；

计算单元，用于计算每个所述问题特征文本的特征值；

生成单元，用于按问题类型序号的排列顺序，以所述特征值为所述问题特征文本之间的边，生成有向无环图。

在第二方面的一种可能的实现方式中，所述提炼模块，包括：

唤醒子模块，用于唤醒预设的决策策略；

分类子模块，用于根据预设的决策策略对所述回答特征文本进行类型分类；

形成子模块，用于基于所述类型分类的结果形成所述决策点。

第三方面，本申请实施例提供了一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述第一方面所述的方法。

第四方面，本申请实施例提供了一种可读存储介质，所述计算机程序被处理器执行时实现如上述第一方面所述的方法。

本申请实施例与现有技术相比存在的有益效果是：

本申请实施例中，通过对待处理语音文本进行处理，分割出待处理语音文本中的问题特征文本和回答特征文本，根据问题特征文本生成有项无环图，提炼出所述回答特征文本的决策点，将决策点加入至有项无环图，形成问答话术，可以支撑到智能客服机器人的运用，从而解决现有技术中依靠人工客服销售的沟通效率很低的问题。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种问答话术生成方法的流程示意图；

图2是本申请实施例提供的一种问答话术生成装置的结构示意图；

图3是本申请实施例提供的服务器的结构示意图；

图4是本申请实施例提供的图1中有向无环图的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

下面通过各个实施例对申请进行介绍。

参见图1，为本申请实施例提供的一种问答话术生成方法的流程示意图，该方法应用于服务器，该方法包括以下步骤：

步骤S101、获取待处理语音文本。

具体应用中，本申请实施例可以从呼叫中心直接获取待处理语音音频，还可以从中转服务器间接获取待处理语音音频，即本申请实施例对待处理语音音频的获取来源不作限定。此外，本申请实施例对待处理语音音频的数量不作限制，例如，待处理语音音频的数量可以是500通客服人员与客户的语音通话。

步骤S102、分割出待处理语音文本中的问题特征文本和回答特征文本。

其中，问题特征文本与回答特征文本一一对应，问题特征文本可以是指客服人员对应的语音文本，回答特征文本可以是指客户对应的语音文本。

具体应用中，可以运用SCD语音角色分割技术，分割出待处理语音文本中的问题特征文本和回答特征文本。或者，使用双声道录制的音频的话，使用音轨分离出待处理语音文本中的问题特征文本和回答特征文本。

步骤S103、根据问题特征文本生成有项无环图。

作为示例而非限定，根据问题特征文本生成有项无环图包括：以问题特征文本作为顶点，基于问题特征文本之间的因果关系，生成有向无环图。

具体地，以问题特征文本作为顶点，基于问题特征文本之间的因果关系，生成有向无环图，包括：

第一步、识别每个问题特征文本对应的问题类型序号。

客服的问题大致如以下形式：需要人工进行一部分数据的打标签，对客服问题标记它为第几类问题。例如，先生您需要办卡吗，对应为1类；先生您的身份证号是多少，对应为2类；先生您的月收入是多少， 3类。

每个流程都拥有独立的一个标签（1,2，...）。不需要的废话则使用标签4。标记完标签之后，使用n-gram进行分词提取文本特征。此时我们的数据变成如下形式：

先生，您，需要，办卡，吗。1类

先生，您，的，身份证号，是，多少。2类

分词结束之后，我们计算每个词的tf-idf值。tf-dif是指在一份给定的文件里面，词频（term frequency，tf）指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数（term count）的归一化，以防止它偏向长的文件。（同一个词语在长文件中可能会比短文件有更高的词数，而不管该词语重要与否。）对于在某一特定文件里的词语来说，它的重要性可表示为：tf值 = 词在本句子中出现的次数/词在所有句子中出现的次数。

逆向文件频率（inverse document frequency，idf）是一个词语普遍重要性的度量。某一特定词语的idf，可以由总文件数目除以包含该词语之文件的数目，再将得到的商取以10为底的对数得到：

idf = log10(总的句子数目/包含该词的句子数目)

最后将tf和idf值相乘：tf-idf值 = tf值×idf值。tf-idf值可以表示此词在此句子中的重要程度。这个对于我们后续的文本分类非常的重要。使用tfidf提取特征之后，数据变成如下形式：

例句1：“先生（0.25），您（0.1），需要（0.4），办卡（0.7），吗（0.2）”为1类

例句2：“先生（0.25），您（0.2），的（0.1），身份证号（0.5），是（0.21），多少（0.4）”为2类

再然后对分词提取词的tfidf，对文本进行编码，会造成向量位数过大。一共1000个句子，一共包含2000词，tf-idf将句子编码则会成为2000维的向量。向量长度过长，过于稀疏（中间存在很多0）不利于计算。所以需要使用lsi技术（潜在语义分析）对2000维的词进行降维。把所有2000维的向量全部降低成为同一个维度。我们这里选取的维度为200。降为的维度大小跟词的数量有关。之后将所以提取好特征的句子输入模型，重复一次提取特征的过程（句子---分词成为词组列表---计算TFIDF值---lsi向量降维）。将所有提取好特征的句子输入adaboost tree（现有技术）进行训练。训练后使用adaboost tree将所有的话术进行分类。一问一答对的回答部分，也进行相应的操作，但是回答的分类应该为2分类。只区分肯定回答，否定回答，肯定回答问题继续，否定回答问题结束，通话结束。（因为电话销售和电话客服的本质是不同的，即使是人工电话销售转化率低，所以电话销售的目的在于找到潜在愿意购买的客户，而不是劝服客户购买，所以电话销售的重点在于广撒网，提高拨打效率。

第二步、计算每个问题特征文本的特征值。

其中，特征只可以是指每个问题特征文本的沟通时长和沟通成功率对应的数值，例如，可以用onehot编码方式对特征值进行量化。

具体应用中，下面介绍统计每个问题特征文本的沟通时长。

例如，一种情况是：从客服人员结束问题2，紧接着提出问题1；另一种情况是：客服人员结束问题3，紧接着提出问题1。这两种情况中问题1是同一种问题类型，即问题1对应的问题特征文本的问题类型序号是相同的。第一种情况中，问题1的前一个问题是问题2；第二种情况中，问题1的前一个问题是问题3。可见，问题2和问题3对问题1造成不了不同的影响。通过步骤S103中的第一步对问题特征文本进行分类，可以得到每一种问题类型序号的音频历史数据，统计历史音频数据的音频总时长，去除异常值（过高或者过低等离群点）从而得出每个问题特征文本的沟通时长。

具体应用中，下面介绍统计每个问题特征文本的沟通成功率。

通过步骤S103中的第一步对问题特征文本进行分类，可以得到每个问题特征文本对应的客户的回答结果，其中，回答结果包括肯定回答（即沟通成功同意购买）以及否定回答（即沟通失败不同意购买的）的回答比例，得到每个问题特征文本的沟通成功率。

第三步、按问题类型序号的排列顺序，以特征值为问题特征文本之间的边，生成有向无环图。

具体应用中，此处我们将各个问题特征文本作为图的一个点，每个问题类型，都能通往任何一个问题类型，以问题类型序号为1.2.3……这样的顺序进行排列，从而形成有项无环图。每个问题类型通向下一个问题的边的权重=沟通成功率×沟通时长。即问题的花费代价。所以可以转换成为旅行商问题来解决问答流程的构建。每个问题类型相当于旅行商问题中的一个城市，每个问题类型（城市）都能直接去往其他问题（城市），去往其他城市的花费为：沟通成功率×沟通时长。

然后，需要对每个问题特征文本进行裁剪，修正。对此，采用分支界限法作为解决方法。具体做法如下，使用贪心算法定义上界。从每个问题类型开始，只去往花费最低的问题类型，直到遍历所有问题。选择最小值作为上界。下界取每个问题类型的两个最小花费值除以2是因为：对每去往的下一个的问题，必从花费最小的上一个问题而来，再到下一个花费最小的问题去。这样取得的下界肯定是小于等于最优解。定义完成上界与下界之后，用穷举法开始任务，每完成一个问题，去往下一个问题，则用使用的两个问题间的花费，代替分支界限法的花费，计算出最终花费，大于下界，则进行停止/剪枝。所有分支完成，选取最小花费的问题顺序作为话术的构建顺序即可。

步骤S104、提炼出回答特征文本的决策点。

具体应用中，提炼出回答特征文本的决策点包括：

第一步、唤醒预设的决策策略。

可以理解的是，唤醒的机制可以是一个预设的进程，在满足有新的有项无环图生成时，执行唤醒动作。

第二步、根据预设的决策策略对回答特征文本进行类型分类。

其中，预设的决策策略可以是指决策树，例如，adaboost tree决策树。

第三步、基于类型分类的结果形成决策点。

其中，决策点包括肯定回答和否定回答。

例如，可以如图4所示，每个固定话术表示一个类型的问题文本特征的集合，根据决策点的不同流向不同的固定话术。

步骤S105、将决策点加入至有项无环图，形成问答话术。

可以理解的是，最后得到的问答话术可以是如图4所示的问题话术。

本申请实施例中，通过对待处理语音文本进行处理，分割出待处理语音文本中的问题特征文本和回答特征文本，根据问题特征文本生成有项无环图，提炼出所述回答特征文本的决策点，将决策点加入至有项无环图，形成问答话术，从而支撑到智能客服机器人的运用。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例所述的问答话术生成方法，图2示出了本申请实施例提供的问答话术生成装置的结构框图，为了便于说明，仅示出了与本申请实施例相关的部分。

参照图2，该装置包括：

获取模块21，用于获取待处理语音文本；

分割模块22，用于分割出所述待处理语音文本中的问题特征文本和回答特征文本，所述问题特征文本与所述回答特征文本一一对应；

第一生成模块23，用于根据所述问题特征文本生成有项无环图；

提炼模块，用于提炼出所述回答特征文本的决策点；

第二生成模块24，用于将所述决策点加入至所述有项无环图，形成问答话术。

在一种可能的实现方式中，所述第一生成模块，包括：

在一种可能的实现方式中，所述生成子模块，包括：

计算单元，用于计算每个所述问题特征文本的特征值；

在一种可能的实现方式中，所述提炼模块，包括：

唤醒子模块，用于唤醒预设的决策策略；

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

图3为本申请提供的服务器的结构示意图。如图3所示，该实施例的服务器3包括：至少一个处理器30、存储器31以及存储在所述存储器31中并可在所述至少一个处理器30上运行的计算机程序32，所述处理器30执行所述计算机程序32时实现上述方法实施例中的各个步骤。

该服务器可包括，但不仅限于，处理器30、存储器31。本领域技术人员可以理解，图3仅仅是服务器3的举例，并不构成对服务器3的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如还可以包括输入输出设备、网络接入设备等。

所称处理器30可以是中央处理单元(Central Processing Unit，CPU)，该处理器30还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路 (Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器31在一些实施例中可以是所述服务器3的内部存储单元，例如服务器3的硬盘或内存。所述存储器31在另一些实施例中也可以是所述服务器6的外部存储设备，例如所述服务器3上配备的插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（Flash Card）等。进一步地，所述存储器31还可以既包括所述服务器3的内部存储单元也包括外部存储设备。所述存储器31用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等，例如所述计算机程序的程序代码等。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本申请实施例还提供了一种可读存储介质，所述可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/服务器的任何实体或装置、记录介质、计算机存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random AccessMemory）、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种问答话术生成方法，其特征在于，包括：

获取待处理语音文本；

根据所述问题特征文本生成有项无环图；

提炼出所述回答特征文本的决策点；

将所述决策点加入至所述有项无环图，形成问答话术。

2.如权利要求1所述的问答话术生成方法，其特征在于，根据所述问题特征文本生成有项无环图，包括：

3.如权利要求2所述的问答话术生成方法，其特征在于，以所述问题特征文本作为顶点，基于所述问题特征文本之间的因果关系，生成有向无环图，包括：

识别每个所述问题特征文本对应的问题类型序号；

计算每个所述问题特征文本的特征值；

4.如权利要求1所述的问答话术生成方法，其特征在于，提炼出所述回答特征文本的决策点，包括：

唤醒预设的决策策略；

根据预设的决策策略对所述回答特征文本进行类型分类；

基于所述类型分类的结果形成所述决策点。

5.一种问答话术生成装置，其特征在于，包括：

获取模块，用于获取待处理语音文本；

提炼模块，用于提炼出所述回答特征文本的决策点；

6.一种服务器，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的方法。

7.一种可读存储介质，所述可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至4任一项所述的方法。