WO2020207025A1

WO2020207025A1 - 基于语音交互的语音外呼方法、装置及终端

Info

Publication number: WO2020207025A1
Application number: PCT/CN2019/120613
Authority: WO
Inventors: 姬小玉; 郑如刚; 徐志成
Original assignee: 深圳壹账通智能科技有限公司
Priority date: 2019-04-12
Filing date: 2019-11-25
Publication date: 2020-10-15
Also published as: CN110113497B; CN110113497A

Abstract

本申请实施例公开了一种基于语音交互的语音外呼方法、装置及终端，其中，终端对应的用户可以预先设置语音外呼条件，当终端检测到当前满足语音外呼条件时，终端获取语音外呼条件对应的外呼号码，并向该外呼号码对应的终端设备发送通信请求，在与该终端设备建立通信连接之后，获取外呼号码对应的终端设备当前所处环境的环境音量值，并根据获取到的环境音量值确定需要向该终端设备发送的语音内容。通过实施上述方法，可以根据获取到的环境音量调整发送语音的内容，提升了语音外呼的智能性。

Description

基于语音交互的语音外呼方法、装置及终端

本申请要求于2019年4月12日提交中国专利局、申请号为2019103015548、申请名称为“基于语音交互的语音外呼方法、装置及终端”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种基于语音交互的语音外呼方法、装置及终端。

背景技术

随着技术的发展，自动语音外呼已经实现了快捷、方便、高效的特征，同时因其拥有省时、省力、低成本等天然的优点，很多企业用户都建立起自己的电话营销系统平台，用以扩大和维护客户，增加企业效益。同时，自动语音外呼的应用场景越来越多，包括电话营销、市场调查、欠款催收等场景。

目前，自动语音外呼的内容固定语音，无法根据用户的终端设备返回的信息而改变呼出语音的内容，语音外呼的智能性较低。

发明内容

本申请实施例提供一种基于语音交互的语音外呼方法、装置及终端，可以为根据获取到的环境音量调整输出语音的内容，提升了语音外呼的智能性。

第一方面，本申请实施例提供了一种基于语音交互的语音外呼方法，所述方法包括：

获取系统环境信息，并检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

向所述外呼号码对应的终端设备发送通信请求；

若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值，并根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

向所述终端设备发送所述目标外呼语音。

第二方面，本申请实施例提供了一种基于语音交互的语音外呼装置，所述装置包括：

获取模块，用于获取系统环境信息；

检测模块，用于检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

所述获取模块，还用于当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

发送模块，用于向所述外呼号码对应的终端设备发送通信请求；

所述获取模块，还用于若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值；

确定模块，用于根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

所述发送模块，还用于向所述终端设备发送所述目标外呼语音。

第三方面，本申请实施例提供了一种终端，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行第一方面所述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行第一方面所述的方法。

本申请实施例中，终端可以根据获取到的环境音量调整输出语音的内容，提升了语音外呼的智能性。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图进行说明。

图1是本申请实施例中的一种基于语音交互的语音外呼方法的流程示意图；

图2是本申请实施例中的另一种基于语音交互的语音外呼方法的流程示意图；

图3是本申请实施例中的一种基于语音交互的语音外呼装置的结构示意图；

图4是本申请实施例中的一种终端的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

本申请实施例提供的语音外呼方法实现于终端，所述终端包括智能手机、平板电脑、数字音视频播放器、电子阅读器、手持游戏机或车载电子设备等电子设备。

图1是本申请实施例中一种基于语音交互的语音外呼方法的流程示意图。如图1所示，本实施例中的基于语音交互的语音外呼方法的流程可以包括：

S101、终端获取系统环境信息，并检测系统环境信息是否满足预设的语音外呼条件。

本申请实施例中，系统环境信息包括系统时间、系统负载，其中，系统时间为终端记录的当前的时间，系统负载包括系统当前处理的外呼任务的数量等。或者，系统负载也可以为终端当前处理的外呼任务数量与终端能同时处理的最大外呼数量的比值，终端包括手机、电脑、平板电脑等电子设备。终端获取到系统环境信息之后，将检测该系统环境信息是否满足预设的语音外呼条件。具体实现中，语音外呼条件可以由该终端对应的用户预先设定，如用户将预设时间点作为语音外呼条件，则当终端检测到时间到达该预设时间点时，确定系统环境信息满足预设的外呼条件。或者，用户将预设时间点以及负载量阈值作为语音外呼条件，即当终端检测当时间到达预设时间点，且负载量小于负载量阈值时，终端确定系统环境信息满足语音外呼条件。

S102、当终端检测到系统环境信息满足预设的语音外呼条件时，获取与语音外呼条件对应的外呼方案，外呼方案包括外呼号码以及至少一种外呼语音。

本申请实施例中，终端检测到系统环境信息满足预设的外呼条件时，将获取该语音外呼条件对应的外呼方案，其中，每个语音外呼条件对应一个或多个外呼方案，其中，外呼方案包括外呼号码以及至少一种外呼语音，需要说明的是，同一外呼方案中的至少一种外呼语音用于表达相同的语义，但在语速、语音音量值或语音的时长、内容的简洁程度上存在差异，具体可以由终端对应的用户预先设置。

S103、终端向外呼号码对应的终端设备发送通信请求。

本申请实施例中，终端确定了语音外呼条件对应的外呼方案之后，将向外呼方案中外呼号码对应的终端设备发送通信请求，其中，外呼号码可以为一个，也可以是多个，具体可以由终端对应的用户预先设置。

S104、若成功与外呼号码对应的终端设备建立通信连接，则获取终端设备的环境音量值，并根据环境音量值从至少一种外呼语音中确定目标外呼语音。

本申请实施例中，终端向外呼号码对应的终端设备发送通信请求之后，若被呼叫用户在终端设备上输出了相应的接收操作，使得终端与外呼号码对应的终端设备建立了通信连接，则终端获取终端设备的环境音量值(即噪音音量值)，其中，被呼叫用户为外呼号码对应的终端设备的用户。具体的，当终端与外呼号码对应的终端设备建立了通信连接之后，可以获取到外呼号码对应的终端设备发送的环境音量值，其中，环境音量值具体可以为外呼号码对应的终端设备所处环境中噪声的音量值。终端获取到外呼号码对应的终端设备的环境音量值之后，将根据获取到的环境音量值从至少一种外呼语音中确定目标外呼语音。

在一种实现方式中，外呼方案中至少一种外呼语音包括第一外呼语音和第二外呼语音，其中，第一外呼语音的时长大于第二外呼语音的时长，第一外呼语音的输出音量值小于第二外呼语音的输出音量值。终端获取到外呼号码对应的终端设备发送的环境音量值之后，将检测该环境音量值是否小于预设音量值，若该环境音量值小于预设音量值，则将第一外呼语音确定为目标外呼语音，若环境音量值大于或等于预设音量值，则将第二外呼语音确定为目标外呼语音。

举例说明，第一外呼语音和第二外呼语音的语义都为车险简介，第一外呼语音的具体内容为“您好，车辆保险，即机动车辆保险，简称车险，也称作汽车保险。它是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险。汽车保险是财产保险的一种，在财产保险领域中，汽车保险属于一个相对年轻的险种，这是由于汽车保险是伴随着汽车的出现和普及而产生和发展的。”第一外呼语音的时长为30秒，且输出音量值为30分贝。第二外呼语音的具体内容为“您好，车辆保险，即机动车辆保险，简称车险，也称作汽车保险它是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险”，第二外呼语音的时长为15秒，且输出音量值为60分贝。预设音量值为40分贝，当终端检测到外呼号码对应的终端设备发送的环境音量值小于40分贝时，则确定第一外呼语音作为目标外呼语音，当终端检测到外呼号码对应的终端设备返回的音量值大于或等于40分贝时，则确定第二外呼语音作为目标外呼语音。

在一种实现方式中，外呼方案包括的至少一种外呼语音包括外呼语音1、外呼语音2…外呼语音N，其中，N为正整数，具体可以由终端对应的用户在配置外呼方案时预先设置。其中，外呼方案中配置的外呼语音具体如表1所示：

表1

编号	时长	输出音量值	环境音量值
外呼语音1	60秒	30分贝	0-10分贝
外呼语音2	50秒	40分贝	11-20分贝
外呼语音3	40秒	50分贝	21-30分贝
…	…	…	…
外呼语音N	20秒	70分贝	>60分贝

需要说明的是，表1中外呼语音1、外呼语音2…外呼语音N中每种外呼语音的文字内容可以不同，但都用于表示相同的语义，如用于欠款催收、业务介绍、市场调查等，随着外呼语音的编号的增加，外呼语音对应的文字内容可以越来越简洁，输出时长越短，且输出音量值越来越大。由表1可知，当终端检测到环境音量值在0-10分贝之间时，则将外呼语音1确定为目标外呼语音，当终端检测到环境音量值在10-20分贝之间时，则将外呼语音2确定为目标外呼语音。

S105、终端向外呼号码对应的终端设备发送目标外呼语音。

本申请实施例中，终端确定了目标外呼语音之后，将向外呼号码对应的终端设备发送该目标外呼语音。

本申请实施例中，终端在与外呼号码对应的终端设备建立通信连接之后，将获取到该终端设备发送的环境音量值。终端根据接收到的环境音量值确定需要针对外呼号码对应的设备输出的语音内容，若终端获取到的环境音量值较大，则输出简洁的语音方案，并采用较大的音量值进行语音输出，使得被呼叫用户可以听清终端发送的语音内容。若终端获取到的环境音量值较小，则终端可以输出详细的语音方案，并采用适中的音量值进行语音输出。通过上述方式，可以保证被呼叫用户即使处于噪音较大的环境中也能听清终端发送的语音内容，在噪音较小的环境中可以接收到详细的语音介绍，提升了用户体验以及语音外呼的智能性。

图2是本申请实施例中另一种基于语音交互的语音外呼方法的流程示意图。如图2所示，本实施例中的基于语音交互的语音外呼方法的流程可以包括：

S201、终端获取系统环境信息，并检测系统环境信息是否满足预设的语音外呼条件。

本申请实施例中，终端系统环境信息包括系统时间和系统负载，其中，系统负载可以为终端当前处理的外呼任务数量与终端能同时处理的最大外呼任务数量的比值，预设语音外呼条件具体可以预设时间点和预设负载。当终端检测到当前系统时间到达预设时间点且当前负载小于预设负载率时，则确定系统环境信息满足预设外呼条件。

S202、当终端检测到系统环境信息满足预设的语音外呼条件时，获取与语音外呼条件对应的外呼方案，外呼方案包括外呼号码以及至少一种外呼语音。

本申请实施例中，终端检测到系统环境信息满足预设的外呼条件时，将获取语音外呼条件对应的外呼方案，其中，每个语音外呼条件可以对应多个外呼方案，进一步的，每个外呼方案中包含一个或多个外呼号码，以及针对该外呼号码需要输出的至少一种语音。

S203、终端向外呼号码对应的终端设备发送通信请求。

本申请实施例中，终端检测到系统环境信息满足预设的语音外呼条件时，将确定该外呼条件对应的外呼方案中的外呼号码，并向该外呼号码对应的终端设备发送通信请求。

若与外呼号码对应的终端设备建立通信连接失败，即被呼叫用户未接听该通信请求，则终端检测该通信请求的呼叫时长是否大于第三预设时长，其中，呼叫时长可以为外呼号码对应的终端设备响铃的时长，第三预设时长可以为15秒、20秒等，具体可以由终端对应的用户预先设置。若终端检测到呼叫时长大于第三预设时长，则终端检测预设时间段内向该外呼号码对应的终端设备发送通信请求的次数，其中，预设时间段可以是当前时间节点的之前的2小时、1小时等，若终端确定呼叫次数小于预设次数，则终端向该外呼号码对应的终端设备发送通信请求。通过上述方式，可以将第三预设时长确定为终端设备的最长响铃时长，即终端设备响铃超过最长响铃时长时会自动断开通信请求，终端判断呼叫时长是否大于第三预设时长，若是，则终端判定被呼叫用户可能是因终端设备不在身边而导致通信连接失败，终端继续检测到之前向该被呼叫用户发送通信请求的次数小于预设次数，则终端可以在间隔一段时间后向该终端设备再次发送通信请求。若呼叫时长小于第三预设时长，则终端判定被呼叫用户拒绝接收该通信请求，终端可以在一段时间内不再与该被呼叫终端设备发送通信请求。

若成功与所述终端设备建立通信连接，则执行步骤S204。

S204、若成功与外呼号码对应的终端设备建立通信连接，则获取终端设备的环境音量值，并根据环境音量值从至少一种外呼语音中确定目标外呼语音。

本申请实施中，终端向外呼号码对应的终端设备发送通信请求之后，若被呼叫用户在终端设备上输出了相应的接收操作，使得终端与外呼号码对应的终端设备建立了通信连接，则终端获取终端设备的环境音量值(即噪音音量值)，具体的，当终端与外呼号码对应的终端设备建立了通信连接之后，可以获取到外呼号码对应的终端设备发送的环境音量值，其中，环境音量值具体可以为外呼号码对应的终端设备所处环境中噪声的音量值。终端获取到外呼号码对应的终端设备的环境音量值之后，将根据获取到的环境音量值从至少一种外呼语音中确定目标外呼语音。

S205、终端向外呼号码对应的终端设备发送目标外呼语音。

S206、若终端接收到终端设备返回的语音信息，则根据语音信息以及环境音量值确定针对终端设备的目标语音答复，并输出该目标语音答复。

本申请实施例中，终端向外呼号码对应的终端设备发送目标外呼语音之后，若接收到终端设备返回的语音信息，则将根据语音信息以及环境音量值确定针对终端设备的目标语音答复。具体实现中，终端将接收到的语音信息转化为文本信息，并计算该文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度。其中，相似度的具体计算方式包括终端分别对文本信息以及预先存储的至少一个参考文本信息中每个参考文本信息进行分词处理，得到文本信息对应的第一词组集以及每个参考文本信息对应的第二词组集，终端检测第一词组集以及每个第二词组集中包含的相同词组的数量，并将每个第二词组集对应的相同词组的数量与每个第二词组集中词组总数量的比值确定为文本信息与每个参考文本信息的相似度。

举例说明，终端将接收到的语音信息转化为文本信息后得到的内容为“车辆保险金额”，数据库中预先存储参考文本信息包括“车辆保险类型、车辆保险金额、医疗保险金额”，则每个参考文本信息的分词结果以及与文本信息的相似度如表2所示：

表2

名称	内容	分词结果	相似度
文本信息	车辆保险金额	车辆、保险、金额
参考文本信息1	车辆保险类型	车辆、保险、类型	66.7％
参考文本信息2	车辆保险金额	车辆、保险、金额	100％
参考文本信息3	医疗保险金额	医疗、保险、金额	66.7％

由表2可知，参考文本信息2与文本信息的相似度最高，终端确定每个参考文本信息与文本信息的相似度之后，还将确定至少一个参考文本信息中与文本信息相似度最高的参考文本信息，并获取预设的与文本信息相似度最高的参考文本信息对应的至少一种语音答复，终端根据环境音量值从至少一种语音答复中确定目标语音答复。进一步的，终端根据环境音量值从至少一种语音答复中确定目标语音答复。例如，参考文本信息2与文本信息的相似度最高，终端获取到参考文本信息2对应的至少一种语音答复如表3所示：

表3

编号	时长	输出音量值	环境音量值
语音答复1	60秒	30分贝	0-10分贝
语音答复2	50秒	40分贝	11-20分贝
语音答复3	40秒	50分贝	21-30分贝
…	…	…	…
语音答复N	20秒	70分贝	>60分贝

其中，表3中语音答复1、语音答复2…语音答复N中每种语音答复的文字内容可以由终端对应的用户预先设置，随着语音答复的编号的增加，语音答复对应的文字内容可以越来越简洁，输出时长越短，且输出音量值越来越大。由表3可知，当终端检测到环境音量值在0-10分贝之间时，则将语音答复1确定为目标语音答复，当终端检测到环境音量值在10-20分贝之间时，则将语音答复2确定为目标语音答复。

S207、若终端检测到与外呼号码对应的终端设备的通信断开，则获取此次通信的通信内容。

本申请实施例中，终端检测到与外呼号码对应的终端设备的通信断开之后，将获取此次通信的通信内容，其中，通信内容包括通信的持续时长和目标外呼语音的类型。目标外呼语音的类型包括催收型、业务推荐型等，催收型目标外呼语音用于对欠款进行催收，业务推荐型目标外呼语音用于对不同类型的业务进行推荐。需要说明的是，目标外呼语音的类型还可以包括市场调查型、电话营销型等，本申请实施例不做限定。

S208、终端根据通信的通信内容确定外呼号码对应的终端设备的下一次外呼方案。

在一种实现方式中，终端检测到与外呼号码对应的终端设备通信断开之后，从通信内容中目标外呼语音的类型为催收型，则终端检测此次通信的时长是否小于第一预设时长，若终端检测到此次通信的持续时长小于第一预设时长，则终端需要再次向该终端设备发送通信请求，并在于该终端设备建立通信连接后向该终端设备发送目标外呼语音。其中，第一预设时长可以为10秒、15秒等，具体可以由研发人员预先设置。通过上述方式，可以确保被呼叫用户接收到目标外呼语音中的核心内容，达到电话催收的目的。

在一种实现方式中，终端检测到与外呼号码对应的终端设备通信断开之后，从通信内容中确定目标外呼语音的类型为业务推荐型，终端检测此次通信的持续时长是否大于第二预设时长，若此次通信的持续时长大于第二预设时长，则终端在预设时间间隔后再次向该终端设备发送通信请求，并在与终端设备建立通信连接后向终端设备发送目标外呼语音。其中，第一预设时长可以为30秒、60秒等，预设时间间隔可以为10天、15天等，具体可以由研发人员预先设置。通过上述方式，可以根据通信时长确定出被呼叫用户对于推荐业务的兴趣度，若通信时长较长，则说明被呼叫用户对推荐的业务感兴趣，终端在可以间隔一段时间后再次对该被呼叫用户进行业务推荐。进一步的，终端还可以将该外呼号码存储于优先区域，当有新业务需要进行推荐时，终端可以优先对优先区域存储的外呼号码对应的终端设备进行呼叫，提升业务推荐的精准性。

本申请实施例中，终端在与外呼号码对应的终端设备建立通信连接之后，将获取到该终端设备发送的环境音量值。终端根据接收到的环境音量值确定需要针对外呼号码对应的设备输出的语音内容，若终端获取到的环境音量值较大，则输出简洁的语音方案，并采用较大的音量值进行语音输出，使得被呼叫用户可以听清终端发送的语音内容。若终端获取到的环境音量值较小，则终端可以输出详细的语音方案，并采用适中的音量值进行语音输出。进一步的，当终端接收到被呼叫用户输出的语音时，可以根据相似度算法以及环境音量值确定针对该语音的语音答复，在于该被呼叫用户的通信结束后，根据此次通话的时长确定针对该被呼叫用户的下一次呼叫方案，提升了语音外呼的智能性。

下面将结合附图3对本申请实施例提供的基于语音交互的语音外呼装置进行详细介绍。需要说明的是，附图3所示的基于语音交互的语音外呼装置，用于执行本申请图1-图2所示实施例的方法，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，经参照本申请图1-图2所示的实施例。

请参见图3，为本申请提供的一种基于语音交互的语音外呼装置的结构示意图，该基于语音交互的语音外呼装置30可包括：获取模块301、检测模块302、发送模块303、确定模块304、转化模块305、计算模块306。

获取模块301，用于获取系统环境信息；

检测模块302，用于检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

所述获取模块301，还用于当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

发送模块303，用于向所述外呼号码对应的终端设备发送通信请求；

所述获取模块301，还用于若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值；

确定模块304，用于根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

所述发送模块303，还用于向所述终端设备发送所述目标外呼语音。

在一种实现方式中，所述至少一种外呼语音包括第一外呼语音和第二外呼语音，所述第一外呼语音的时长大于所述第二外呼语音的时长，所述第一外呼语音的输出音量值小于所述第二外呼语音的输出音量值，所述确定模块304具体用于：

检测所述环境音量值是否小于预设音量值；

若所述环境音量值小于所述预设音量值，则将所述第一外呼语音确定为目标外呼语音；

若所述环境音量值大于或等于所述预设音量值，则将所述第二外呼语音确定为目标外呼语音。

在一种实现方式中，所述转换模块305，用于若接收到所述终端设备返回的语音信息，则将所述语音信息转化为文本信息；

所述计算模块306，用于计算所述文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度；

所述确定模块304，用于确定所述至少一个参考文本信息中与所述文本信息相似度最高的参考文本信息，并获取预设的与所述文本信息相似度最高的参考文本信息对应的至少一种语音答复；

所述确定模块304，用于根据所述环境音量值从所述至少一种语音答复中确定目标语音答复；

所述发送模块303，用于向所述终端设备发送所述目标语音答复。

在一种实现方式中，所述计算模块306，具体用于：

分别对所述文本信息以及预先存储的至少一个参考文本信息中每个参考文本信息进行分词处理，得到所述文本信息对应的第一词组集以及每个所述参考文本信息对应的第二词组集；

检测所述第一词组集以及每个所述第二词组集中包含的相同词组的数量；

将每个所述第二词组集对应的相同词组的数量与每个所述第二词组集中词组总数量的比值确定为所述文本信息与每个所述参考文本信息的相似度。

在一种实现方式中，所述获取模块301，还用于若检测到与所述终端设备的通信断开，则获取所述通信的通信内容，所述通信内容包括所述通信的持续时长和所述目标外呼语音的类型；

所述检测模块302，还用于若所述目标外呼语音的类型为催收型，则检测所述通信的持续时长是否小于第一预设时长，所述催收型目标外呼语音用于对欠款进行催收；

所述发送模块303，还用于若所述通信的持续时长小于所述第一预设时长，则向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。

在一种实现方式中，所述检测模块302，还用于若所述目标外呼语音的类型为业务推荐型，则检测所述通信的持续时长是否大于第二预设时长，所述业务推荐型目标外呼语音用于对不同种类的业务进行推荐；

所述发送模块303，还用于若所述通信的持续时长大于所述第二预设时长，则在预设时间间隔后向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。

在一种实现方式中，所述检测模块302，还用于若与所述终端设备建立通信连接失败，则检测所述通信请求的呼叫时长是否大于第三预设时长；

所述检测模块302，还用于若所述呼叫时长大于所述第三预设时长，则检测预设时间段内向所述终端设备发送通信请求的次数；

所述发送模块303，还用于若所述次数小于预设次数，则向所述终端设备发送通信请求。

本申请实施例中，获取模块301获取系统环境信息；检测模块302检测所述系统环境信息是否满足预设的语音外呼条件，当检测到所述系统环境信息满足预设的语音外呼条件时，获取模块301获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；发送模块303向所述外呼号码对应的终端设备发送通信请求；若成功与所述终端设备建立通信连接，则获取模块301获取所述终端设备的环境音量值；确定模块304根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；发送模块向所述终端设备发送所述目标外呼语音。通过上述方式，可以保证被呼叫用户即使处于噪音较大的环境中也能听清终端发送的语音内容，在噪音较小的环境中可以接收到详细的语音介绍，提升了用户体验以及语音外呼的智能性。

请参见图4，为本申请实施例提供了一种终端的结构示意图。如图4所示，该终端包括：至少一个处理器401，输入设备403，输出设备404，存储器405，至少一个通信总线402。其中，通信总线402用于实现这些组件之间的连接通信。其中，输入设备403可以是控制面板或者麦克风等，输出设备404可以是显示屏等。其中，存储器405可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器405可选的还可以是至少一个位于远离前述处理器401的存储装置。其中处理器401可以结合图3所描述的装置，存储器405中存储一组程序代码，且处理器401，输入设备403，输出设备404调用存储器405中存储的程序代码，用于执行以下操作：

处理器401，用于获取系统环境信息，并检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

处理器401，用于当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

输出设备404，用于向所述外呼号码对应的终端设备发送通信请求；

输入设备403，用于若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值；

处理器401，用于根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

输出设备404，用于向所述终端设备发送所述目标外呼语音。

在一种实现方式中，所述至少一种外呼语音包括第一外呼语音和第二外呼语音，所述第一外呼语音的时长大于所述第二外呼语音的时长，所述第一外呼语音的输出音量值小于所述第二外呼语音的输出音量值，处理器401，具体用于：

检测所述环境音量值是否小于预设音量值；

在一种实现方式中，处理器401，具体用于：

若接收到所述终端设备返回的语音信息，则将所述语音信息转化为文本信息；

计算所述文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度；

确定所述至少一个参考文本信息中与所述文本信息相似度最高的参考文本信息，并获取预设的与所述文本信息相似度最高的参考文本信息对应的至少一种语音答复；

根据所述环境音量值从所述至少一种语音答复中确定目标语音答复，并向所述终端设备发送所述目标语音答复。

在一种实现方式中，处理器401，具体用于：

若检测到与所述终端设备的通信断开，则获取所述通信的通信内容，所述通信内容包括所述通信的持续时长和所述目标外呼语音的类型；

若所述目标外呼语音的类型为催收型，则检测所述通信的持续时长是否小于第一预设时长，所述催收型目标外呼语音用于对欠款进行催收；

输出设备404，还用于若所述通信的持续时长小于所述第一预设时长，则向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。

在一种实现方式中，处理器401，还用于若所述目标外呼语音的类型为业务推荐型，则检测所述通信的持续时长是否大于第二预设时长，所述业务推荐型目标外呼语音用于对不同种类的业务进行推荐；

输出设备404，还用于若所述通信的持续时长大于所述第二预设时长，则在预设时间间隔后向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。

在一种实现方式中，处理器401，具体用于：

若与所述终端设备建立通信连接失败，则检测所述通信请求的呼叫时长是否大于第三预设时长；

若所述呼叫时长大于所述第三预设时长，则检测预设时间段内向所述终端设备发送通信请求的次数；

输出设备404，还用于若所述次数小于预设次数，则向所述终端设备发送通信请求。

本申请实施例中，处理器401获取系统环境信息，并检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；当检测到所述系统环境信息满足预设的语音外呼条件时，处理器401获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；输出设备404向所述外呼号码对应的终端设备发送通信请求；若成功与所述终端设备建立通信连接，则输入设备403获取所述终端设备的环境音量值；处理器401根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；输出设备404向所述终端设备发送所述目标外呼语音。通过实施上述方法，可以根据获取到的环境音量调整输出语音的内容，提升了语音外呼的智能性。

本申请实施例中所述模块，可以通过通用集成电路，例如CPU(Central Processing Unit，中央处理器)，或通过ASIC(Application Specific Integrated Circuit，专用集成电路)来实现。

应当理解，在本申请实施例中，所称处理器401可以是中央处理模块(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

总线402可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互联(Peripheral Component，PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture，EISA)总线等，该总线402可以分为地址总线、数据总线、控制总线等，为便于表示，图4仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于计算机可读存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

Claims

一种基于语音交互的语音外呼方法，其特征在于，所述方法包括：

获取系统环境信息，并检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

向所述外呼号码对应的终端设备发送通信请求；

若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值，并根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

向所述终端设备发送所述目标外呼语音。
根据权利要求1所述的方法，其特征在于，所述至少一种外呼语音包括第一外呼语音和第二外呼语音，所述第一外呼语音的时长大于所述第二外呼语音的时长，所述第一外呼语音的输出音量值小于所述第二外呼语音的输出音量值；所述根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音，包括：

检测所述环境音量值是否小于预设音量值；

若所述环境音量值小于所述预设音量值，则将所述第一外呼语音确定为目标外呼语音；

若所述环境音量值大于或等于所述预设音量值，则将所述第二外呼语音确定为目标外呼语音。
根据权利要求1所述的方法，其特征在于，所述向所述终端设备发送所述目标外呼语音之后，所述方法还包括：

若接收到所述终端设备返回的语音信息，则将所述语音信息转化为文本信息；

计算所述文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度；

确定所述至少一个参考文本信息中与所述文本信息相似度最高的参考文本信息，并获取预设的与所述文本信息相似度最高的参考文本信息对应的至少一种语音答复；

根据所述环境音量值从所述至少一种语音答复中确定目标语音答复，并向所述终端设备发送所述目标语音答复。
根据权利要求3所述的方法，其特征在于，所述计算所述文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度，包括：

分别对所述文本信息以及预先存储的至少一个参考文本信息中每个参考文本信息进行分词处理，得到所述文本信息对应的第一词组集以及每个所述参考文本信息对应的第二词组集；

检测所述第一词组集以及每个所述第二词组集中包含的相同词组的数量；

将每个所述第二词组集对应的相同词组的数量与每个所述第二词组集中词组总数量的比值确定为所述文本信息与每个所述参考文本信息的相似度。
根据权利要求1-4任一项所述的方法，其特征在于，所述方法还包括：

若检测到与所述终端设备的通信断开，则获取所述通信的通信内容，所述通信内容包括所述通信的持续时长和所述目标外呼语音的类型；

若所述目标外呼语音的类型为催收型，则检测所述通信的持续时长是否小于第一预设时长，所述催收型目标外呼语音用于对欠款进行催收；

若所述通信的持续时长小于所述第一预设时长，则向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。
根据权利要求5所述的方法，其特征在于，所述获取所述通信的通信内容之后，所述方法还包括：

若所述目标外呼语音的类型为业务推荐型，则检测所述通信的持续时长是否大于第二预设时长，所述业务推荐型目标外呼语音用于对不同种类的业务进行推荐；

若所述通信的持续时长大于所述第二预设时长，则在预设时间间隔后向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。
根据权利要求1所述的方法，其特征在于，所述向所述外呼号码对应的终端设备发送通信请求之后，所述方法还包括：

若与所述终端设备建立通信连接失败，则检测所述通信请求的呼叫时长是否大于第三预设时长；

若所述呼叫时长大于所述第三预设时长，则检测预设时间段内向所述终端设备发送通信请求的次数；

若所述次数小于预设次数，则向所述终端设备发送通信请求。
一种基于语音交互的语音外呼装置，其特征在于，所述装置包括：

获取模块，用于获取系统环境信息；

检测模块，用于检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

所述获取模块，还用于当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

发送模块，用于向所述外呼号码对应的终端设备发送通信请求；

所述获取模块，还用于若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值；

确定模块，用于根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

所述发送模块，还用于向所述终端设备发送所述目标外呼语音。
根据权利要求8所述的装置，其特征在于，所述至少一种外呼语音包括第一外呼语音和第二外呼语音，所述第一外呼语音的时长大于所述第二外呼语音的时长，所述第一外呼语音的输出音量值小于所述第二外呼语音的输出音量值，所述确定模块具体用于：

检测所述环境音量值是否小于预设音量值；

若所述环境音量值小于所述预设音量值，则将所述第一外呼语音确定为目标外呼语音；

若所述环境音量值大于或等于所述预设音量值，则将所述第二外呼语音确定为目标外呼语音。
根据权利要求8所述的装置，其特征在于，所述装置还包括转换模块和计算模块，

所述转换模块，用于若接收到所述终端设备返回的语音信息，则将所述语音信息转化为文本信息；

所述计算模块，用于计算所述文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度；

所述确定模块，用于确定所述至少一个参考文本信息中与所述文本信息相似度最高的参考文本信息，并获取预设的与所述文本信息相似度最高的参考文本信息对应的至少一种语音答复；

所述确定模块，用于根据所述环境音量值从所述至少一种语音答复中确定目标语音答复；

所述发送模块，用于向所述终端设备发送所述目标语音答复。
根据权利要求10所述的装置，其特征在于，所述计算模块，具体用于：

分别对所述文本信息以及预先存储的至少一个参考文本信息中每个参考文本信息进行分词处理，得到所述文本信息对应的第一词组集以及每个所述参考文本信息对应的第二词组集；

检测所述第一词组集以及每个所述第二词组集中包含的相同词组的数量；

将每个所述第二词组集对应的相同词组的数量与每个所述第二词组集中词组总数量的比值确定为所述文本信息与每个所述参考文本信息的相似度。
根据权利要求8-11任一项所述的装置，其特征在于，

所述获取模块，还用于若检测到与所述终端设备的通信断开，则获取所述通信的通信内容，所述通信内容包括所述通信的持续时长和所述目标外呼语音的类型；

所述检测模块，还用于若所述目标外呼语音的类型为催收型，则检测所述通信的持续时长是否小于第一预设时长，所述催收型目标外呼语音用于对欠款进行催收；

所述发送模块，还用于若所述通信的持续时长小于所述第一预设时长，则向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。
根据权利要求12所述的装置，其特征在于，

所述检测模块，还用于若所述目标外呼语音的类型为业务推荐型，则检测所述通信的持续时长是否大于第二预设时长，所述业务推荐型目标外呼语音用于对不同种类的业务进行推荐；

所述发送模块，还用于若所述通信的持续时长大于所述第二预设时长，则在预设时间间隔后向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。
根据权利要求8所述的装置，其特征在于，

所述检测模块，还用于若与所述终端设备建立通信连接失败，则检测所述通信请求的呼叫时长是否大于第三预设时长；

所述检测模块，还用于若所述呼叫时长大于所述第三预设时长，则检测预设时间段内向所述终端设备发送通信请求的次数；

所述发送模块，还用于若所述次数小于预设次数，则向所述终端设备发送通信请求。
一种终端，其特征在于，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下步骤：

获取系统环境信息，并检测所述系统环境信息是否满足预设的语音外呼条件，所述系统环境信息包括系统时间和/或系统负载；

当检测到所述系统环境信息满足预设的语音外呼条件时，获取与所述语音外呼条件对应的外呼方案，所述外呼方案包括外呼号码以及至少一种外呼语音；

向所述外呼号码对应的终端设备发送通信请求；

若成功与所述终端设备建立通信连接，则获取所述终端设备的环境音量值，并根据所述环境音量值从所述至少一种外呼语音中确定目标外呼语音；

向所述终端设备发送所述目标外呼语音。
根据权利要求15所述的终端，其特征在于，所述至少一种外呼语音包括第一外呼语音和第二外呼语音，所述第一外呼语音的时长大于所述第二外呼语音的时长，所述第一外呼语音的输出音量值小于所述第二外呼语音的输出音量值；所述处理器还用于调用所述程序指令执行以下步骤：

检测所述环境音量值是否小于预设音量值；

若所述环境音量值小于所述预设音量值，则将所述第一外呼语音确定为目标外呼语音；

若所述环境音量值大于或等于所述预设音量值，则将所述第二外呼语音确定为目标外呼语音。
根据权利要求15所述的终端，其特征在于，所述处理器还用于调用所述程序指令执行以下步骤：

若接收到所述终端设备返回的语音信息，则将所述语音信息转化为文本信息；

计算所述文本信息与数据库中预先存储的至少一个参考文本信息中每个参考文本信息的相似度；

确定所述至少一个参考文本信息中与所述文本信息相似度最高的参考文本信息，并获取预设的与所述文本信息相似度最高的参考文本信息对应的至少一种语音答复；

根据所述环境音量值从所述至少一种语音答复中确定目标语音答复，并向所述终端设备发送所述目标语音答复。
根据权利要求17所述的终端，其特征在于，所述处理器还用于调用所述程序指令执行以下步骤：

分别对所述文本信息以及预先存储的至少一个参考文本信息中每个参考文本信息进行分词处理，得到所述文本信息对应的第一词组集以及每个所述参考文本信息对应的第二词组集；

检测所述第一词组集以及每个所述第二词组集中包含的相同词组的数量；

将每个所述第二词组集对应的相同词组的数量与每个所述第二词组集中词组总数量的比值确定为所述文本信息与每个所述参考文本信息的相似度。
根据权利要求15-18任一项所述的终端，其特征在于，所述处理器还用于调用所述程序指令执行以下步骤：

若检测到与所述终端设备的通信断开，则获取所述通信的通信内容，所述通信内容包括所述通信的持续时长和所述目标外呼语音的类型；

若所述目标外呼语音的类型为催收型，则检测所述通信的持续时长是否小于第一预设时长，所述催收型目标外呼语音用于对欠款进行催收；

若所述通信的持续时长小于所述第一预设时长，则向所述终端设备发送通信请求，并在与所述终端设备建立通信连接后向所述终端设备发送所述目标外呼语音。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。