CN115878764A

CN115878764A - 语音回访问卷调查方法及系统、计算设备、存储介质

Info

Publication number: CN115878764A
Application number: CN202210216390.0A
Authority: CN
Inventors: 段兴涛; 赵国庆; 蒋宁
Original assignee: Beijing Zhongguancun Kejin Technology Co Ltd
Current assignee: Beijing Zhongguancun Kejin Technology Co Ltd
Priority date: 2022-03-07
Filing date: 2022-03-07
Publication date: 2023-03-31
Anticipated expiration: 2042-03-07
Also published as: CN115878764B

Abstract

本申请提供了一种语音回访问卷调查方法及系统、计算设备、存储介质，在本申请提供的方法中，先利用智能外呼设备拨打至少一被采访用户的联系电话；再通过语音向被采访用户提问问卷调查的多个问卷调查问题，并保存智能外呼设备和被采访用户之间的语音通话数据；然后对语音通话数据进行ASR识别并转换为文本通话数据；最后获取各问卷调查问题对应的预设答复文本，对预设答复文本和答复文本数据进行匹配，得出问卷调查的结果。基于本申请提供的语音回访问卷调查方法及系统、计算设备、存储介质，相对于已有的模型更加适配问卷文本匹配的灵活性，并且可以覆盖到90％的文本情况，同时质量效果相对于现有的模型也提高10％个点。

Description

语音回访问卷调查方法及系统、计算设备、存储介质

技术领域

本申请涉及数据处理技术领域，特别是涉及一种语音回访问卷调查方法及系统、计算设备、存储介质。

背景技术

伴随着AI产品在我们生活中越来越普遍，例如谷歌翻译、百度翻译、百度小度、小米小爱、以及商场中的智能导航等等。机器回访问卷调查在企业中也越来越多的被应用，例如广东中医院的医疗问卷就是让机器自动拨打病人电话，对病人近期健康状态进行访问，可以追踪病人的病情记录以及采取更加措施治疗病人，也可以让医务人员从繁杂的人力劳动中脱离出来，节省效率。

问卷调查的任务可以划分为TTS(英文全称Text To Speech，将提前编写的文本转义为语音)、ASR(英文全称Automatic Speech Recognition，将语音转义为文本信息)、文本匹配。由于问卷调查方式的灵活性，使得文本匹配的任务难度提高几个数量级，变得非常棘手，难以解决。在NLP(英文全称Natural Language Processing，自然语言处理)领域，针对文本匹配任务大部分都是将文本进行向量化，然后再利用相似度距离度量文本之间的匹配度，然后选择最匹配的文本。

常见的文本匹配的技术有基于TF-IDF(英文全称term frequency–inversedocument frequency)的向量化、基于Word2Vec的向量化和基于BERT(英文全称Bidirectional Encoder Representation from Transformers)的向量化，对一些注重语义的文本匹配效果也不太好，对个别词具有极大权重的文本效果，不适用于问卷调查的灵活性。

发明内容

本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。

根据本申请的一个方面，提供了一种语音回访问卷调查方法，包括：

利用智能外呼设备拨打至少一被采访用户的联系电话；

在所述智能外呼设备和所述被采访对象建立语音通话后，通过语音向所述被采访用户提问问卷调查的多个问卷调查问题，并保存所述智能外呼设备和所述被采访用户之间的语音通话数据；

对所述语音通话数据进行ASR识别，以将所述语音通话数据转换为文本通话数据；所述文本通话数据包括对应各所述问卷调查问题的答复文本数据；

获取各所述问卷调查问题对应的预设答复文本，对所述预设答复文本和所述答复文本数据进行匹配，得出所述问卷调查的结果。

可选地，所述获取各所述问卷调查问题对应的预设答复文本，对所述预设答复文本和所述答复文本数据进行匹配，得出所述问卷调查的结果，包括：

对于每个所述问卷调查问题，对所述问卷调查问题对应的答复文本数据进行预处理，并按照字粒度进行分词并构建文本数据词库；

利用TF-IDF将所述文本数据词库进行向量化得到第一向量；

将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算，根据相似度计算结果确定所述问卷调查问题对应的结果；

整合所述多个问卷调查问题对应的结果，得出所述问卷调查的结果。

可选地，所述将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算，根据相似度计算结果确定所述问卷调查问题对应的结果，包括：

将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算，得到对应各所述预设答复文本的第一相似度得分；

判断至少一所述第一相似度得分大于或等于第一预设阈值时，根据所述第一相似度得分确定所述问卷调查问题对应的结果并返回；

判断所述第一相似度得分均小于所述第一预设阈值时，将所述答复文本数据转为拼音数据，利用Glove算法学习所述拼音数据得到所述问题对应的结果。

可选地，所述将所述答复文本数据转为拼音数据，利用Glove算法学习所述拼音数据得到所述问题对应的结果，包括：

将所述答复文本数据转换为拼音数据，并按照空格分割所述拼音数据，构造共现矩阵；

利用Glove算法基于所述共现矩阵学习所述拼音数据对应的第二向量；

将所述第二向量分别与所述问题对应的多个预设答复文本进行相似度计算,得到对应各所述预设答复文本的第二相似度得分；

判断至少一所述第二相似度得分大于或等于第二预设阈值时，根据所述第二相似度得分确定所述问卷调查问题对应的结果并返回；

判断所述第二相似度得分均小于所述第二预设阈值时，将所述答复文本数据输入实体识别模型，利用所述实体识别模型得出所述问题对应的结果；

可选地，所述将所述答复文本数据输入实体识别模型，利用所述实体识别模型得出所述问题对应的结果，包括：

将所述答复文本数据输入预先训练好的实体识别模型，利用所述实体识别模型挖掘出至少一个实体知识点；所述实体知识点的类型包括但不限于时间副词、频度副词、情感极性词、实体名词、程度副词；

获取预先创建的问卷调查模板，基于所述实体知识点对所述问卷调查模板进行槽位填充，生成多条候选选项；

对所述答复文本数据和所述多条候选选项进行交并比计算，根据计算结果从所述多条候选选项中选出所述答复文本数据对应的等价文本数据；

将所述等价文本数据与各所述预设答复文本对应的等效候选选项进行交并比计算，得到第三相似度得分；

判断至少一所述第三相似度得分大于或等于第三预设阈值时，根据所述第三相似度得分确定所述问卷调查问题对应的结果并返回；

判断所述第三相似度得分均小于所述预设三阈值时，将所述答复文本数据输入预先训练好的文本匹配双塔模型，利用所述的文本匹配双塔模型得到所述问题对应的结果。

可选地，所述将所述答复文本数据输入预先训练好的文本匹配双塔模型，利用所述的文本匹配双塔模型得到所述问题对应的结果，包括：

获取所述被采访用户的用户维度特征，在所述等价文本数据中添加所述用户维度特征；

将添加有所述用户维度特征的所述等价文本数据和各所述预设答复文本组成多组文本组，并分别输入预先训练好的文本匹配双塔模型；

利用所述文本匹配双塔模型从所述多组文本组中选取并输出匹配度最高的目标文本组，将所述目标文本组包含的预设答复文本作为所述问卷调查问题对应的结果并返回。

可选地，所述获取各所述问卷调查问题对应的预设答复文本之前，所述方法还包括：

获取预先创建的语料集；

从所述语料集中随机选择预设数量的样本数据，并结合所述样本数据的数据特点及业务经验知识建立包括多条问卷调查规则的问卷调查规则库；

基于至少一条所述问卷调查规则建立问卷调查模板，以生成问卷调查模板库；

获取各所述样本数据对应用户的用户维度特征；

基于所述问卷调查规则库、问卷调查模板库和对应用户的用户维度特征，训练预设的实体识别模型和文本匹配双塔模型。

根据本申请的另一个方面，提供了一种语音回访问卷调查系统，包括：

电话拨打模块，其配置成利用智能外呼设备拨打至少一被采访用户的联系电话；

数据记录模块，其配置成在所述智能外呼设备和所述被采访对象建立语音通话后，通过语音向所述被采访用户提问问卷调查的多个问卷调查问题，并保存所述智能外呼设备和所述被采访用户之间的语音通话数据；

数据转换模块，其配置成对所述语音通话数据进行ASR识别，以将所述语音通话数据转换为文本通话数据；所述文本通话数据包括对应各所述问卷调查问题的答复文本数据；

调查结果获取模块，其配置成获取各所述问卷调查问题对应的预设答复文本，对所述预设答复文本和所述答复文本数据进行匹配，得出所述问卷调查的结果。

可选地，所述调查结果获取模块，其还可以配置成：

利用TF-IDF将所述文本数据词库进行向量化得到第一向量；

可选地，所述调查结果获取模块，其还可以配置成：

可选地，所述调查结果获取模块之前，还包括模型训练模块，其可以配置成：

获取预先创建的语料集；

获取各所述样本数据对应用户的用户维度特征；

根据本发明的另一方面，还提供了一种计算设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如上述任一项所述的语音回访问卷调查方法。

根据本发明的另一方面，还提供了一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，所述计算机程序在由处理器执行时实现如上述任一项所述的语音回访问卷调查方法。

根据下文结合附图对本申请的具体实施例的详细描述，本领域技术人员将会更加明了本申请的上述以及其他目的、优点和特征。

附图说明

后文将参照附图以示例性而非限制性的方式详细描述本申请的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解，这些附图未必是按比例绘制的。附图中：

图1是根据本申请实施例的基于TF-IDF对文本向量化流程框图；

图2是根据本申请实施例的基于Word2Vec对文本向量化流程框图；

图3是根据本申请实施例的基于BERT对文本向量化流程框图；

图4是根据本申请实施例的语音回访文件调查方法流程示意图；

图5是根据本申请实施例的语音回访文件调查的整理流程示意图；

图6是根据本申请实施例的语音回访文件调查系统结构示意图；

图7是根据本申请可选实施例的语音回访文件调查系统结构示意图；

图8是根据本申请可选实施例的计算设备结构示意图；

图9是根据本申请实施例的计算机可读存储介质示意图。

具体实施方式

目前问卷调查的技术有三种：第一种如图1所示，利用TF-IDF对短文本进行向量化，然后再对TF-IDF向量进行余弦相似度计算作为衡量文本的相似度，这种技术文本相似度的质量好坏完全依赖于TF-IDF质量的好坏，而TF-IDF忽略了文本语义信息，不适用于问卷调查，主要在于问卷调查中的文本灵活性；第二种如图2所示，利用Word2Vec对短文本进行向量化，然后再对Word2Vec向量进行余弦相似度计算作为衡量文本的相似度，这种技术文本匹配的质量好坏依赖于Word2Vec文本的向量好坏，而Word2Vec向量主要是基于静态局部文本，对一些注重语义的文本匹配效果也不太好，同样不适用于问卷调查的灵活性；第三种如图3所示，利用BERT对短文本进行向量化，然后再对BERT向量进行余弦相似度计算作为衡量文本的相似度，这种技术文本匹配质量的好坏依赖于BERT度量文本质量的好坏，BERT向量是基于语义的向量，对个别词具有极大权重的文本效果。同样不适用于问卷调查的灵活性要求。

图4是根据本申请实施例的语音回访文件调查方法流程示意图。参见图4所知，本申请实施例提供的语音回访文件调查方法至少可以包括以下步骤S401～S404。

步骤S401：利用智能外呼设备拨打至少一被采访用户的联系电话。

步骤S402：在智能外呼设备和被采访对象建立语音通话后，通过语音向被采访用户提问问卷调查的多个问卷调查问题，并保存智能外呼设备和被采访用户之间的语音通话数据；

步骤S403：对语音通话数据进行ASR(自动语音识别技术，Automatic SpeechRecognition)识别，以将语音通话数据转换为文本通话数据；

步骤S404：获取各问卷调查问题对应的预设答复文本，对预设答复文本和答复文本数据进行匹配，得出问卷调查的结果。

本申请提供了一种语音回访问卷调查方法，在本申请提供的方法中，先利用智能外呼设备拨打至少一被采访用户的联系电话；再通过语音向被采访用户提问问卷调查的多个问卷调查问题，并保存智能外呼设备和被采访用户之间的语音通话数据；然后对语音通话数据进行ASR识别并转换为文本通话数据；最后获取各问卷调查问题对应的预设答复文本，对预设答复文本和答复文本数据进行匹配，得出问卷调查的结果。基于本申请提供的语音回访问卷调查方法，相对于已有的模型更加适配问卷文本匹配的灵活性，并且可以覆盖到90％的文本情况，同时质量效果相对于现有的模型也提高10％个点。

总体来讲，利用智能人外呼设备问卷调查的流程大致按照如下方式进行:

(1)提前预定好问卷调查的问题与答案；

(2)机器拨打被采访用户的电话；

(3)机器和被采访用户进行语音通话；

(4)将通话数据进行ASR识别转移成文本；

(5)对被采访用户的文本与事先制定好的答案文本进行文本匹配。

下面结合图5对本申请实施例提及的方法进行详细说明。

首先，如步骤S401所述，利用智能外呼设备拨打至少一被采访用户的联系电话。

智能外呼指的是电话通过电脑或机器人自动往外拨打客户电话，作用是让机器代替人工，只要有数据就可以不间断工作，而且没有任何情绪化，完全按照规范的话术进行提问，这样可以大大地降低人工成本，提高工作效率。并且，被采访用户的联系电话是在该用户授权情况下获得的。

接着如步骤S402所述，在智能外呼设备和被采访对象建立语音通话后，通过语音向被采访用户提问问卷调查的多个问卷调查问题，并保存智能外呼设备和被采访用户之间的语音通话数据。

本申请实施例中的多个问卷调查问题是结合自身业务的数据特点针对回访目的预先设定好的，智能外呼设备和被采访用户之间的语音通话数据需要保存以为接下来将被采访用户的回答与针对预先设定的问题的答案进行比对和匹配。

在这个过程中难点是被采访对象的回答具有强烈的灵活性，文本匹配难度相当大，针对这一点我们对问卷调查的问题、被采访用户的回答以及问卷问题下面对应的答案进行理解和知识抽取，根据问卷语料制作规则库和模板库，加入被采访对象的信息比如年龄、性别、地域、体质等特征信息进行文本匹配。

举实例来说，首先先预定问题及问题的答案：

示例一:

与一年前相比，你如何评价现在的健康状况？

(1)比一年前好多了

(2)比一年前好一点

(3)比一年前差一点

(4)比一年前差多了

示例二：

您对慢病管理门诊医护人员的服务满意吗？

(1)很满意

(2)满意

(3)一般

(4)不满意

(5)很不满意

示例三：

进食改变？

(1)好，无变化/轻度，短期变化

(2)正常下限或在减少(变差)/减少(差)但在增加

(3)差并在减少/差，无变化

获取到语音通话数据后，执行步骤S403，对语音通话数据进行ASR识别，以将语音通话数据转换为文本通话数据。其中，文本通话数据包括对应各问卷调查问题的答复文本数据。

最后执行步骤S404，获取各问卷调查问题对应的预设答复文本，对预设答复文本和答复文本数据进行匹配，得出问卷调查的结果。即，通过机器拨打电话获取被采访用户的回答文本数据，再和答案文本进行文本匹配。

在做文本匹配任务前，需要提前准备好规则库、模板库、用户维度特征以便提供与后续工作，并且训练好Glove词向量模型、实体识别模型、以及文本匹配双塔模型。

可选地，本实施例在获取各问卷调查问题对应的预设答复文本之前，还可以包括：

A1，获取预先创建的语料集；本实施例的语料集可以包括不同业务不同场景下的可能出现的对话语料，以及用于表示不同满意程度不同用户情绪的情感极性词、实体名词、程度副词，以及、时间副词、频度副词等等。

A2，从语料集中随机选择预设数量的样本数据，并结合样本数据的数据特点及业务经验知识建立包括多条问卷调查规则的问卷调查规则库；

A3，基于至少一条问卷调查规则建立问卷调查模板，以生成问卷调查模板库；

A4，获取各样本数据对应用户的用户维度特征；

A5，基于问卷调查规则库、问卷调查模板库和对应用户的用户维度特征，训练预设的实体识别模型和文本匹配双塔模型。

制作规则库的方法策略是：获取到全部语料集，再次从全部语料集中随机选择2万条样本数据，然后结合数据特点以及业务经验知识准备规则库，例如在示例一中可以制作出“比”+“一年前”+“好”+一点”制作的标准是规则简练不重复、规则之间交集越少越好、能覆盖大部分业务即可。

制作模板库方法策略是在规则库的基础上，用槽位去填充例如{比较词}+{时间词}+{情感极性词}+{程度词}，当然模板的槽位可以变换移动。用户维度特征我们只用了性别、年龄、体质(这个是做的二分类，上游已经做完).然后分别选择不同模型进行训练。

进一步地，上述步骤S404获取各问卷调查问题对应的预设答复文本，对预设答复文本和答复文本数据进行匹配，得出问卷调查的结果可以进一步包括：

A1，对于每个问卷调查问题，对问卷调查问题对应的答复文本数据进行预处理，并按照字粒度进行分词并构建文本数据词库。

对问卷调查问题对应的答复文本数据之后，可对数据进行预处理，然后进行分词，本实施例中直接按照字粒度进行。例如示例一中，按照字粒度处理变为[[“比”,“一”,“年”,“前”，“好”,“多”,“了”],[“比”，“一”，“年”,“前”，“好”,“一”,“点”],[“比”，“一”，“年”,“前”，“差”,“一”,“点”],[“比”,“一”,“年”,“差”,“多”,“了”]]，然后构建词库[“比”,“一”,“年”,“前”，“好”,“差”,“多”,“了”，“点”]。

A2，利用TF-IDF将文本数据词库进行向量化得到第一向量。

TF-IDF是一种用于信息检索与数据挖掘的常用加权技术，也是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。其中，TF是词频，IDF是逆文本频率指数。

对于上述分词之后的文本数据词库，可以然后按照TF-IDF公式进行向量化，得到词库中各个词对应的第一向量。TF-IDF公式如下：

其中：

表示在第i篇文章中的第j个字Word；

N_total表示文章的总数；

表示出现Word出现的文章数量。

经过TF-IDF向量化之后的第一向量示意如下：[[0，0，0，0，0.05，0，0.05，0.05，0]，[0，0，0，0，0.05，0，0，0，0.05]，[0，0，0，0，0，0.05，0，0，0.05]，[0，0，0，0，0，0.05，0.05，0.05，0]]。

A3，将第一向量与问卷调查问题对应的多个预设答复文本分别进行相似度计算，根据相似度计算结果确定问卷调查问题对应的结果。

在本申请一可选实施例中，上述步骤A3可以进一步包括：

A3-1，将第一向量与问卷调查问题对应的多个预设答复文本分别进行相似度计算，得到对应各预设答复文本的第一相似度得分；

A3-2，判断至少一第一相似度得分是否大于或等于第一预设阈值时，根据第一相似度得分确定问卷调查问题对应的结果并返回。对生成的向量进行相似度计算，如果相似度得分大于预先制定的阈值则找出最佳答案并返回，可选地，可以将第一相似度得分最高的作为最佳答案并返回。第一预设阈值本实施例记为ts1，具体可以根据实际需求设置，本实施例对其具体值不做具体限定。

A3-3，判断第一相似度得分均小于第一预设阈值时，将答复文本数据转为拼音数据，利用Glove(英文全称Global Vectors)算法学习拼音数据得到问题对应的结果。Glove算法是一种基于全局词频统计的回归算法。它不是基于神经网络的，而是基于最小二乘原理的回归方法，它的核心就是损失函数。

在基于TF-IDF对文本数据词库向量化后，形成第一向量与预设答复文本进行相似度比对，比对通过的即确定为问卷调查问题对应的结果返回；如果比对不通过，则将答复文本数据转为拼音数据进行匹配。

进一步地，上述步骤A3-3可以包括：

A3-3-1，将答复文本数据转换为拼音数据，并按照空格分割拼音数据，构造共现矩阵；

A3-3-2，利用Glove算法基于共现矩阵学习拼音数据对应的第二向量；

A3-3-3，将第二向量分别与问题对应的多个预设答复文本进行相似度计算，得到对应各预设答复文本的第二相似度得分；,

A3-3-4，判断至少一第二相似度得分大于或等于第二预设阈值时，根据第二相似度得分确定问卷调查问题对应的结果并返回；,

A3-3-5，判断第二相似度得分均小于第二预设阈值时，将答复文本数据输入实体识别模型，利用实体识别模型得出问题对应的结果。

如果相似度小于预先指定的第一预设阈值，则进入拼音相似度计算流程，该相似度流程需要提前将文本转为拼音(转为拼音原因是经过ASR识别之后可能会带来一定的错误)，转为拼音可以调用python内置包pypinyin，比如对“比一年前好点”转为拼音之后变为“bi yi nian qianhao dian”，然后按照空格分割拼音，构造共现矩阵，再调用gensim模型里的glove算法并进行训练，经过glove向量之后对示例一得到如下向量表示[[0.3,0.4,0.6,0.5]，[0.3,0.2,0.1,0.7]，[0.5,0.4,0.2,0.3]，[0.1,0.6,0.5,0.7]]，然后对向量进行相似度计算，可以按照余弦相似度计算，得到相似度得分，得到第二相似度得分。如果第二相似度得分大于预先制定的阈值，则选择最佳匹配答案并返回，同理，可以将第二相似度得分最高的作为最佳答案并返回。如果全小于第二预设阈值，则利用接下来的实体识别模型进行匹配，进入实体抽取和模板填充流程。第二预设阈值本实施例记为ts2，具体可以根据实际需求设置，本实施例对其具体值不做具体限定。

命名实体识别(英文全称Named Entity Recognition)，又被称作“专名识别”，是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。通常包括两部分：(1)实体边界识别(2)确定实体类别(人名、地名、机构名或其他)。

具体地，利用实体识别模型匹配文本时，可以包括以下步骤：

B1，将答复文本数据输入预先训练好的实体识别模型，利用实体识别模型挖掘出至少一个实体知识点；其中，实体知识点的类型包括但不限于时间副词、频度副词、情感极性词、实体名词、程度副词；

B2，获取预先创建的问卷调查模板，基于实体知识点对所述问卷调查模板进行槽位填充，生成多条候选选项；

B3，对答复文本数据和多条候选选项进行交并比计算，根据计算结果从多条候选选项中选出答复文本数据对应的等价文本数据；

B4，将等价文本数据与各预设答复文本对应的等效候选选项进行交并比计算，得到第三相似度得分；

B5，判断至少一第三相似度得分大于或等于第三预设阈值时，根据第三相似度得分确定问卷调查问题对应的结果并返回；第三预设阈值本实施例记为ts3，具体可以根据实际需求设置，本实施例对其具体值不做具体限定。

B6，判断第三相似度得分均小于预设三阈值时，将答复文本数据输入预先训练好的文本匹配双塔模型，利用的文本匹配双塔模型得到问题对应的结果。

实体抽取提前要指定哪些实体需要抽取，本申请实施例定义了时间副词、频度副词、情感极性词、实体名词、程度副词作为实体，定义实体的原则是结合自己的业务知识以及自己的问卷语料集，目的是定义的实体可以覆盖业务知识点，接下来选择实体识别模型，选择通用Bi-LSTM+CRF模型识别。Bi-LSTM+CRF模型是将Bi-LSTM与CRF的有益结合。

制作样本可以使用自己定义的规则库去挖掘实体知识点并加以人工进行审核，接下来将制作的样本输入到Bi-LSTM+CRF模型中训练模型，待模型训练好之后对问卷的问题、答案和被采访用户的话输入到模型中，提取实体点知识，如果Bi-LSTM+CRF提取不到实体使用已定义好的规则库去挖掘实体点知识这个可以直接通过python内置的re库进行挖掘，挖掘好实体知识之后再对制作的模板库进行槽位填充，对填充好槽位的模板作为候选集，这样会对每一条文本生成多条候选集。

例如会对示例中的“一般”生成“一般满意”，“我一般满意”等多条候选集，然后对每一条候选选项和文本进行交并比计算得出得分(对候选选项和文本转为set集合)，按照得分从高到低进行排序，选取得分最高的一条候选选项来作为文本等价的文本，从而对示例2中的每条文本都用一个等效候选选项，然后计算候选选项的相似度来作为文本之间的相似度，如果计算出的相似度得分大于预先指定的阈值，则选择最匹配的文本作为答案返回并结束，反之进入双塔模型推理流程。

也就是说，若实体识别模型仍然匹配不成功，则要进入到双塔模型进行匹配。双塔模型主要通过对两段文本进行编码为固定长度的向量，然后通过两个向量间进行计算相似度来计算两文本之间的关系。

进一步地，上述B6可以包括：

B6-1，利用双塔模型匹配文本，要获取被采访用户的用户维度特征，在等价文本数据中添加用户维度特征；

B6-2，将添加有用户维度特征的等价文本数据和各预设答复文本组成多组文本组，并分别输入预先训练好的文本匹配双塔模型；

B6-3，利用文本匹配双塔模型从多组文本组中选取并输出匹配度最高的目标文本组，将目标文本组包含的预设答复文本作为问卷调查问题对应的结果并返回。

在进入双塔模型后，对接收到的候选选项加入用户特征例如性别、年龄、用户体质(性别进行one-hot编码，年龄先分区然后再one-hot编码，用户体质为二分类分类器得到的两个选项进行one-hot编码)，这样每一条问卷答案和被采访对象话的文本组成两条文本，然后选择sim-bert模型作为双塔模型(每一个塔可以提取不同的特征)最后对最后一层进行向量预先、向量一范式距离、向量欧氏距离作为特征，输入到全连接网络中进行分类器分类，选择最匹配的文本作为和被采访对象的最相似答案进行返回，至此结束全部流程。最后，整合多个问卷调查问题对应的结果，得出最终的问卷调查的结果。

基于同一发明构思，本申请实施例还提供了一种语音回访问卷调查系统，如图6所示，可以包括：

电话拨打模块610，其配置成利用智能外呼设备拨打至少一被采访用户的联系电话；

数据记录模块620，其配置成在智能外呼设备和所述被采访对象建立语音通话后，通过语音向所述被采访用户提问问卷调查的多个问卷调查问题，并保存智能外呼设备和被采访用户之间的语音通话数据；

数据转换模块630，其配置成对语音通话数据进行ASR识别，以将语音通话数据转换为文本通话数据；文本通话数据包括对应各所述问卷调查问题的答复文本数据；

调查结果获取模块640，其配置成获取各问卷调查问题对应的预设答复文本，对预设答复文本和答复文本数据进行匹配，得出问卷调查的结果。

本申请一可选实施例中，调查结果获取模块640，其还可以配置成：

对于每个问卷调查问题，对问卷调查问题对应的答复文本数据进行预处理，并按照字粒度进行分词并构建文本数据词库；

利用TF-IDF将文本数据词库进行向量化得到第一向量；

将第一向量与问卷调查问题对应的多个预设答复文本分别进行相似度计算，根据相似度计算结果确定问卷调查问题对应的结果；

整合多个问卷调查问题对应的结果，得出问卷调查的结果。

将第一向量与问卷调查问题对应的多个预设答复文本分别进行相似度计算，得到对应各预设答复文本的第一相似度得分；

判断至少一第一相似度得分大于或等于第一预设阈值时，根据第一相似度得分确定问卷调查问题对应的结果并返回；

判断第一相似度得分均小于第一预设阈值时，将答复文本数据转为拼音数据，利用Glove算法学习拼音数据得到问题对应的结果。

将答复文本数据转换为拼音数据，并按照空格分割拼音数据，构造共现矩阵；

利用Glove算法基于共现矩阵学习拼音数据对应的第二向量；

将第二向量分别与问题对应的多个预设答复文本进行相似度计算,得到对应各预设答复文本的第二相似度得分；

判断至少一第二相似度得分大于或等于第二预设阈值时，根据第二相似度得分确定问卷调查问题对应的结果并返回；

判断第二相似度得分均小于所述第二预设阈值时，将答复文本数据输入实体识别模型，利用实体识别模型得出问题对应的结果；

将答复文本数据输入预先训练好的实体识别模型，利用实体识别模型挖掘出至少一个实体知识点；实体知识点的类型包括但不限于时间副词、频度副词、情感极性词、实体名词、程度副词；

获取预先创建的问卷调查模板，基于实体知识点对问卷调查模板进行槽位填充，生成多条候选选项；

对答复文本数据和多条候选选项进行交并比计算，根据计算结果从多条候选选项中选出答复文本数据对应的等价文本数据；

将等价文本数据与各预设答复文本对应的等效候选选项进行交并比计算，得到第三相似度得分；

判断至少一所述第三相似度得分大于或等于第三预设阈值时，根据第三相似度得分确定问卷调查问题对应的结果并返回；

判断第三相似度得分均小于预设三阈值时，将答复文本数据输入预先训练好的文本匹配双塔模型，利用文本匹配双塔模型得到问题对应的结果。

获取被采访用户的用户维度特征，在等价文本数据中添加用户维度特征；

将添加有用户维度特征的等价文本数据和各预设答复文本组成多组文本组，并分别输入预先训练好的文本匹配双塔模型；

利用文本匹配双塔模型从多组文本组中选取并输出匹配度最高的目标文本组，将目标文本组包含的预设答复文本作为问卷调查问题对应的结果并返回。

本申请一可选实施例中，如图7所示，还包括模型训练模块650，其可以配置成：

获取预先创建的语料集；

从语料集中随机选择预设数量的样本数据，并结合样本数据的数据特点及业务经验知识建立包括多条问卷调查规则的问卷调查规则库；

基于至少一条问卷调查规则建立问卷调查模板，以生成问卷调查模板库；

获取各样本数据对应用户的用户维度特征；

基于问卷调查规则库、问卷调查模板库和对应用户的用户维度特征，训练预设的实体识别模型和文本匹配双塔模型。

本申请实施例还提供了一种计算设备，包括存储器、处理器和存储在存储器内并能由处理器运行的计算机程序，其中，处理器执行计算机程序时实现如上述任一项所述的语音回访问卷调查方法。

本申请实施例还提供了一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，计算机程序在由处理器执行时实现如上述任一项所述的语音回访问卷调查方法。

本申请实施例还提供了一种计算设备，参照图8，该计算设备包括存储器820、处理器810和存储在所述存储器820内并能由所述处理器810运行的计算机程序，该计算机程序存储于存储器820中的用于程序代码的空间830，该计算机程序在由处理器810执行时实现用于执行任一项根据本申请实施例的方法步骤831。

本申请实施例还提供了一种计算机可读存储介质。参照图9，该计算机可读存储介质包括用于程序代码的存储单元，该存储单元设置有用于执行根据本申请实施例的方法步骤的程序831′，该程序被处理器执行。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、获取其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令处理器完成，所述的程序可以存储于计算机可读存储介质中，所述存储介质是非短暂性(英文：non-transitory)介质，例如随机存取存储器，只读存储器，快闪存储器，硬盘，固态硬盘，磁带(英文：magnetic tape)，软盘(英文：floppy disk)，光盘(英文：optical disc)及其任意组合。

以上所述，仅为本申请较佳的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种语音回访问卷调查方法，包括：

利用智能外呼设备拨打至少一被采访用户的联系电话；

2.根据权利要求1所述的方法，其特征在于，所述获取各所述问卷调查问题对应的预设答复文本，对所述预设答复文本和所述答复文本数据进行匹配，得出所述问卷调查的结果，包括：

利用TF-IDF将所述文本数据词库进行向量化得到第一向量；

3.根据权利要求2所述的方法，其特征在于，所述将所述第一向量与所述问卷调查问题对应的多个预设答复文本分别进行相似度计算，根据相似度计算结果确定所述问卷调查问题对应的结果，包括：

4.根据权利要求3所述的方法，其特征在于，所述将所述答复文本数据转为拼音数据，利用Glove算法学习所述拼音数据得到所述问题对应的结果，包括：

判断所述第二相似度得分均小于所述第二预设阈值时，将所述答复文本数据输入实体识别模型，利用所述实体识别模型得出所述问题对应的结果。

5.根据权利要求4所述的方法，其特征在于，所述将所述答复文本数据输入实体识别模型，利用所述实体识别模型得出所述问题对应的结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述将所述答复文本数据输入预先训练好的文本匹配双塔模型，利用所述的文本匹配双塔模型得到所述问题对应的结果，包括：

7.根据权利要求1所述的方法，其特征在于，所述获取各所述问卷调查问题对应的预设答复文本之前，所述方法还包括：

获取预先创建的语料集；

获取各所述样本数据对应用户的用户维度特征；

8.一种语音回访问卷调查系统，包括：

9.一种计算设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，优选为非易失性可读存储介质，其内存储有计算机程序，所述计算机程序在由处理器执行时实现如权利要求1-7中任一项所述的方法。