CN113271382B

CN113271382B - 一种ai语音通信方法、设备和服务器

Info

Publication number: CN113271382B
Application number: CN202110360789.1A
Authority: CN
Inventors: 曹阳
Original assignee: Zhejiang Baiying Technology Co Ltd
Current assignee: Zhejiang Baiying Technology Co Ltd
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2023-05-16
Anticipated expiration: 2041-04-02
Also published as: CN113271382A

Abstract

本公开披露一种AI语音通信方法、设备和服务器，属于AI语音通信技术领域。该AI语音通信方法包括：在预先设置的闲时时段，自动触发扫描是否有尚未执行的通信任务；若扫描到尚未执行的通信任务，且当前仍处于所述闲时时段，则抽取一个未执行的通信任务i，将该通信任务i的待合成的通信内容合成为AI语音数据并保存；在执行所述通信任务时，查询其通信内容是否存在对应的AI语音数据，若存在，则直接调用完成通信。通过实施本公开实施例的技术方案，可大幅提升AI外呼效率。

Description

一种AI语音通信方法、设备和服务器

技术领域

本公开涉及AI语音通信技术，尤其涉及一种AI语音通信方法、设备和服务器。

背景技术

目前，AI外呼业务中，通常是将需要AI播报的文本转化为AI语音数据。一般，在电话接通前，需要完成全部AI语音的合成，因此，每通AI语音电话都要耗费一定得时间去完成语音素材，这无疑会影响外呼的效率。

另外，在大部分场景下，AI外呼需要的通话上下文信息在外呼前都已经确定，且AI外呼业务并不是24小时不间断进行的，有一部分的时间段处于闲置状态，该时段造成了资源闲置。

发明内容

有鉴于此，本公开实施例披露一种AI语音通信方法、设备和服务器，可大幅提升AI外呼效率，以至少解决现有技术中存在的以上技术问题。

根据本公开的第一方面，披露一种AI语音通信方法，该方法包括：

在预先设置的闲时时段，自动触发扫描是否有尚未执行的通信任务；

若扫描到尚未执行的通信任务，且当前仍处于所述闲时时段，则抽取一个未执行的通信任务i，将该通信任务i的待合成的通信内容合成为AI语音数据并保存；

在执行所述通信任务时，查询其通信内容是否存在对应的AI语音数据，若存在，则直接调用完成通信。

作为本公开的一种实施方式，上述AI语音通信方法还可包括：

若扫描到未执行的通信任务，判断当前是否仍处于所述闲时时段，若当前已不处于所述闲时时段，则退出闲时合成扫描进程，等待下一个闲时时段自动触发扫描进程。

作为本公开的一种实施方式，所述将该通信任务i的待合成的通信内容合成为AI语音数据，进一步包括：

获取所述通信任务i中待合成语音的文本请求信息；

遍历所述文本请求信息，从所述文本请求信息中选出最大暂停时长；

根据所述最大暂停时长设置拆合标识符，并在相邻两个所述文本请求信息之间设置所述拆合标识符；

根据预设通信规则，将所述文本请求信息进行合并，生成合并请求语句；

基于所述合并请求语句发送语音合成服务请求，获取对应的合成语音信息。

作为本公开的一种实施方式，所述通信内容包括均未语音合成的固定信息和变量信息，则所述文本请求信息包括固定文本信息和变量文本信息；根据所述拆合标识符，拆分所述合成语音信息，得到与所述文本请求信息对应的AI语音信息。

作为本公开的一种实施方式，所述通信内容包括已合成为AI语音的固定信息和未语音合成的变量信息，所述文本请求信息包括变量文本信息；提取语音通信任务中的所述变量信息，形成所述变量文本信息；根据所述拆合标识符，拆分所述合成语音信息，得到与所述变量文本信息对应的变量语音信息，并将所述变量语音信息对应回填到通信内容中所述变量信息的对应位置处，得到完整合成为AI语音的通信内容。

作为本公开的一种实施方式，所述根据预设通信规则，将所述文本请求信息进行合并，生成合并请求语句进一步包括：

计算N+1个所述文本请求信息合并得到的所述合并请求语句的字数与预设的单次合并字数阈值的字数差；其中N为大于或等于零的整数；

判断第N+2个所述文本请求信息的字数是否超过所述字数差，若没有超过，则继续将所述第N+2个所述文本请求信息合并至当前的合并请求语句中；

若所述第N+2个所述文本请求信息的字数超过所述字数差，则新增一个以所述第N+2个所述文本请求信息为起始的合并请求语句，直到所有所述文本请求信息全部完成合并。

执行所述当前的AI语音通信任务时，根据预设的数据收集模板，收集与所述变量文本信息对应的反馈数据；

根据收集到的所述反馈数据，生成采集数据表单，并输出。

作为本公开的一种实施方式，所述根据所述最大暂停时长设置拆合标识符，进一步包括：

遍历N个所述文本请求信息，判断所述文本请求信息中是否包含有暂停节点，在遍历到所述暂停节点时，提取所述暂停节点对应的暂停空白音时长，并在所遍历到的暂停空白音时长中选出最大暂停时长；

根据所述最大暂停时长MaxDefine，设置所述拆合标识符<s,spliter>的分割间隔阈值spliter；其中，spliter＝MaxDefine+Space，Space为增设的分割间隔时长。

根据本公开的第二方面，披露一种AI语音通信设备，该AI语音通信设备包括：

触发模块，用于预先设置的闲时时段，自动触发闲时合成扫描进程，扫描到未执行的通信任务；

提取模块，用于从未执行的AI语音通信任务中，获取AI语音通信任务中待合成语音的文本请求信息；

处理模块，用于遍历所述文本请求信息，从所述文本请求信息中选出最大暂停时长；以及，用于根据所述最大暂停时长设置拆合标识符，并在相邻两个所述文本请求信息之间设置所述拆合标识符；

合并模块，用于根据预设通信规则，将所述文本请求信息进行合并，生成合并请求语句；

请求模块，用于基于所述合并请求语句发送语音合成服务请求，获取对应的合成语音信息；

拆分模块，用于根据所述拆合标识符，拆分所述合成语音信息，得到与所述文本请求信息对应的AI语音信息；

通信模块，用于根据所述AI语音信息，执行并完成对应的AI语音通信任务。

作为本公开的一种实施方式，上述AI语音通信设备还可包括：

收集模块，用于执行所述当前的AI语音通信任务时，根据预设的数据收集模板，收集与所述变量文本信息对应的反馈数据；以及，根据收集到的所述反馈数据，生成采集数据表单，并输出。

根据本公开的第三方面，披露一种AI语音通信服务器，该AI语音通信服务器包括：

提取模块，用于从未执行的AI语音通信任务中，获取通信内容中待合成语音的文本请求信息；

合成模块，用于将所述文本请求信息对应地转换为AI语音信息；

数据库，用于存储通信语料的AI语音信息；以及，用于存储AI语音通信任务中收集生成的采集数据表单

与现有技术相比，本公开披露的技术方案具有以下有益的技术效果：

通过实施本公开的技术方案，设置外呼系统闲时时段，利用闲时合成AI播报语料素材，可以避免在通话前再合成AI外呼需要的语音，不仅可以有效利用闲时语音合成服务，提高语音合成服务的利用率，还可以减少AI外呼通话过程中合成AI语料的时间，从而提高外呼效率，除此之外还能减少外呼任务过程中语音合成的压力。

需要理解的是，本公开的教导并不需要实现上面所述的全部有益效果，而是特定的技术方案可以实现特定的技术效果，并且本公开的其他实施方式还能够实现上面未提到的有益效果。

附图说明

通过参考附图阅读下文的详细描述，本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本公开的若干实施方式，其中：

在附图中，相同或对应的标号表示相同或对应的部分。

图1为本公开实施例披露的一种AI语音通信方法流程示意图；

图2为本公开实施例披露的一种AI语音通信设备的组成框图；

图3为本公开实施例披露的一种AI语音通信服务器的组成框图；以及

图4本公开实施例披露的另一种AI语音通信服务器的组成框图。

具体实施方式

下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好的理解进而实现本公开，而并非以任何方式限制本公开的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整的传达给本领域的技术人员。

下面结合附图和具体实施例对本公开的技术方案进一步详细阐述。

方法实施例：

本实施例披露一种AI语音通信方法，该方法包括以下步骤：

S100：开启定时任务，判断当前是否处于闲时时段，如果处于闲时时段，则执行S110；

S110：在预先设置的闲时时段，自动触发扫描是否有尚未执行的通信任务；若扫描到尚未执行的通信任务，则执行S120；

S120：判断当前是否仍处于闲时时段，若是则执行S130；

S130：抽取一个未执行的通信任务i，将该通信任务i的待合成的通信内容合成为AI语音数据，并保存；

其中，对扫描到的待呼叫的通信任务，将其需要播报的内容合成AI语音数据，合成后语音数据保护至系统服务器。

S140：在执行通信任务时，查询其通信内容是否存在对应的AI语音数据，若存在，则执行S150；

S150：直接调用查询到的AI语音数据，完成通信。

本实施例中，通过设置外呼系统闲时时段，保证设置的闲时时段内不会执行通信任务，或者通信任务的数量低于设置阈值。这样，AI播报语料可以直接查询合成的语音中是否存在对应的语音，如果用则可以直接使用，而不需要在通话前进行合成。因此，闲时合成可以避免在通话前再合成AI外呼需要的语音，不仅可以有效利用闲时语音合成服务，提高语音合成服务的利用率，还可以减少AI外呼通话过程中合成AI语料的时间，从而提高外呼效率，除此之外还能减少外呼任务过程中语音合成的压力。

作为一种可选的实现方式，上述AI语音通信方法还可包括以下步骤：

若扫描到未执行的通信任务，判断当前是否仍处于闲时时段，若当前已不处于闲时时段，则执行S160；

S160：退出闲时合成扫描进程，等待下一个闲时时段自动触发扫描进程。

在一可选实施例中，上述S130中，将该通信任务i的待合成的通信内容合成为AI语音数据，进一步包括以下步骤：

S131：获取通信任务i中待合成语音的文本请求信息；

S132：遍历文本请求信息，从文本请求信息中选出最大暂停时长；

S133：根据最大暂停时长设置拆合标识符，并在相邻两个文本请求信息之间设置拆合标识符；

S134：根据预设通信规则，将文本请求信息进行合并，生成合并请求语句；

S135：基于合并请求语句发送语音合成服务请求，获取对应的合成语音信息。

本实施例中，通过将多个文本请求信息进行合并，形成合并请求语句，可通过一次或多次合并，请求获取合成语音信息，有效减少了语音合成请求量，减轻语音服务器负载，提升语音服务器的服务量。

作为一种可选的实现方式，在上述实施例中，当通信内容包括：均未语音合成的固定信息和变量信息，则文本请求信息包括固定文本信息和变量文本信息。这种情况下，本实施例的AI语音通信方法可进一步包括：

S136：根据拆合标识符，拆分合成语音信息，得到与文本请求信息对应的AI语音信息。

本实施例中，将AI呼叫内容中的固定信息和变量信息，作为文本请求信息，将呼叫内容整体合成AI语音，不作区分，例如，一次性或临时发起的呼叫任务，采用这种方式，简单便捷。

作为一种可选的实现方式，在上述实施例中，当通信内容包括：已合成为AI语音的固定信息和未语音合成的变量信息，文本请求信息包括变量文本信息。这种情况下，本实施例的AI语音通信方法可进一步包括：

S137：提取语音通信任务中的变量信息，形成变量文本信息。

S138：根据拆合标识符，拆分合成语音信息，得到与变量文本信息对应的变量语音信息；

S139：将变量语音信息对应回填到通信内容中变量信息的对应位置处，得到完整合成为AI语音的通信内容。

作为一种可选的实现方式，在上述实施例S134中，根据预设通信规则，将文本请求信息进行合并，生成合并请求语句，可进一步包括：

S1341：计算N+1个文本请求信息合并得到的合并请求语句的字数与预设的单次合并字数阈值的字数差；其中N为大于或等于零的整数；

S1342：判断第N+2个文本请求信息的字数是否超过字数差；若没有超过，则执行S1343；

S1343：继续将第N+2个文本请求信息合并至当前的合并请求语句中；

若第N+2个文本请求信息的字数超过字数差，则执行S1344；

S1344：新增一个以第N+2个文本请求信息为起始的合并请求语句；

如此迭代N值，执行S1341，直到所有文本请求信息全部完成合并。

作为一种可选的实现方式，上述AI语音通信方法还可包括：

S200：执行当前的AI语音通信任务时，根据预设的数据收集模板，收集与变量文本信息对应的反馈数据；

S210：根据收集到的反馈数据，生成采集数据表单，并输出。

作为一种可选的实现方式，上述实施例S133中，根据最大暂停时长设置拆合标识符，可进一步包括以下步骤：

S1331：遍历N个文本请求信息，判断文本请求信息中是否包含有暂停节点；

S1332：在遍历到暂停节点时，提取暂停节点对应的暂停空白音时长，并在所遍历到的暂停空白音时长中选出最大暂停时长；

S1333：根据最大暂停时长MaxDefine，设置拆合标识符<s,spliter>的分割间隔阈值spliter。其中，spliter＝MaxDefine+Space，Space为增设的分割间隔时长。

本步骤中，当前扫描到的最大空白音，记为MaxDefine，单位为ms，则空白音分割间隔可以设为spliter＝MaxDefine+1000ms，此处，Space为1000ms，也可以根据需求设置为其他时长的空白音作为分隔符。

本实施例中，通过将多个请求变量进行合并成单句话进行合成，中间利用空白音作为分割符，考虑到语音服务器单次合成有最长字数限制，可以将合并超长的字数进行拆分，多次合并。即使考虑到单次合成的字数限制，多次合并请求语音合成的效果，也比之前单个变量信息分别请求合成的效果好。

下面结合图1的示例，对上述实施例作进一步说明：

S300：定时启动闲时合成扫描进程；

其中，设置外呼系统闲时时间，闲时时段内不会有任务执行或执行任务所占用的资源低于资源占用阈值。

S301：开启定时任务，判断当前是否处于闲时时段，如果在闲时时段，则执行S302；否则，执行S303：等待下一次扫描；

S302：扫描后续需要拨打的通话任务；

S304：扫描到拨打任务时，判断当前是否仍处于闲时时段，若仍处于闲时时段，则执行S305；

S305：从闲时任务队列中抽取一个通信任务，判断当前是否仍处于闲时时段，若仍处于闲时时段，则执行S306；

S306：将通信任务中需要合成AI播报的内容，合成AI语音数据；

S307：合成语音数据保存到系统服务器。

通过上述方法，后续通信任务中需要AI播报的语料，可以直接查询合成的语音中是否存在对应的语音数据，如果有，则可以直接使用，而不需要在通话前进行合成。因此，闲时合成可以避免在通话前再合成AI外呼需要的语音，一方面可以有效利用闲时(非外呼时间段)语音合成服务，提高语音合成服务的利用率和使用效率，一方面减少AI外呼通话过程中的合成需要语料的时间，从而提高外呼效率，除此之外还能减少外呼任务过程中语音合成服务的压力。

产品实施例：

为实现上述方法，本实施例披露一种AI语音通信设备，如图2所示，该AI语音通信设备包括以下组成：

处理模块，用于遍历文本请求信息，从文本请求信息中选出最大暂停时长；以及，用于根据最大暂停时长设置拆合标识符，并在相邻两个文本请求信息之间设置拆合标识符；

合并模块，用于根据预设通信规则，将文本请求信息进行合并，生成合并请求语句；

请求模块，用于基于合并请求语句发送语音合成服务请求，获取对应的合成语音信息；

拆分模块，用于根据拆合标识符，拆分合成语音信息，得到与文本请求信息对应的AI语音信息；

通信模块，用于根据AI语音信息，执行并完成对应的AI语音通信任务。

本实施例通过利用闲时时段完成语音合成，不仅可提高语音合成的资源利用率，还能够减少AI外呼通话过程中的合成需要语料的时间，从而提高外呼效率，有效减少了AI语音外呼任务过程中语音合成服务的压力。

并且，本实施例还通过将多个文本请求信息进行合并，形成合并请求语句，可通过一次或多次合并，请求获取合成语音信息，有效减少了语音合成请求量，减轻语音服务器负载，从而提升外呼效率。

作为一种可选的实现方式，上述AI语音通信设备还可包括：收集模块，用于执行当前的AI语音通信任务时，根据预设的数据收集模板，收集与变量文本信息对应的反馈数据；以及，根据收集到的反馈数据，生成采集数据表单，并输出。

相应地，本公开还披露一种AI语音通信服务器，如图3所示，该AI语音通信服务器包括以下组成：

合成模块，用于将文本请求信息对应地转换为AI语音信息；

数据库，用于存储通信语料的AI语音信息；以及，用于存储AI语音通信任务中收集生成的采集数据表单。该数据库可包括合成语音数据库和信息收集数据库。

本实施例中，AI语音通信服务器的合成模块具备AI语音合成功能，通过利用闲时时段进行语料合成，能减少语音合成服务的负载压力，同时还可以提升服务合成的效率，减少合成时间。

本实施例中，AI语音通信设备包括通信模块和收集模块。通过通信模块根据AI语音信息，执行并完成对应的AI语音通信任务，完成呼叫及播报。通过收集模块根据预设的数据收集模板，收集与变量文本信息对应的反馈数据；以及，根据收集到的反馈数据，生成采集数据表单，并输出给服务器进行存储。

相应地，本公开还披露一种AI语音通信服务器，该语音通信服务器可借助其他设备如语音合成服务器来合成通信语料。如图4所示，该AI语音通信服务器包括以下组成：

本实施例可以减少语音合成服务的请求数量，减少语音合成服务的负载压力，同时还可以提升服务合成的效率，减少合成时间。

这里需要指出的是：以上实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果，因此不做赘述。对于本公开实施例中未披露的技术细节，请参照本公开方法实施例的描述而理解，为节约篇幅，因此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种AI语音通信方法，其特征在于，包括：

在执行所述通信任务时，查询其通信内容是否存在对应的AI语音数据，若存在，则直接调用完成通信；

其中，所述将该通信任务i的待合成的通信内容合成为AI语音数据，进一步包括：

获取所述通信任务i中待合成语音的文本请求信息；

基于所述合并请求语句发送语音合成服务请求，获取对应的合成语音信息；

基于所述合成语音信息，得到AI语音数据。

2.根据权利要求1所述的AI语音通信方法，其特征在于，还包括：

3.根据权利要求1所述的AI语音通信方法，其特征在于：

所述通信内容包括均未语音合成的固定信息和变量信息，则所述文本请求信息包括固定文本信息和变量文本信息；根据所述拆合标识符，拆分所述合成语音信息，得到与所述文本请求信息对应的AI语音信息；或者，

所述通信内容包括已合成为AI语音的固定信息和未语音合成的变量信息，所述文本请求信息包括变量文本信息；提取语音通信任务中的所述变量信息，形成所述变量文本信息；根据所述拆合标识符，拆分所述合成语音信息，得到与所述变量文本信息对应的变量语音信息，并将所述变量语音信息对应回填到通信内容中所述变量信息的对应位置处，得到完整合成为AI语音的通信内容。

4.根据权利要求3所述的AI语音通信方法，其特征在于，所述根据预设通信规则，将所述文本请求信息进行合并，生成合并请求语句进一步包括：

5.根据权利要求1至4任一项所述的AI语音通信方法，其特征在于，还包括：

执行所述当前的AI语音通信任务时，根据预设的数据收集模板，收集与所述文本请求信息包括的变量文本信息对应的反馈数据；

根据收集到的所述反馈数据，生成采集数据表单，并输出。

6.根据权利要求5所述的AI语音通信方法，其特征在于，所述根据所述最大暂停时长设置拆合标识符，进一步包括：

7.一种AI语音通信设备，其特征在于，包括：

8.根据权利要求7所述的AI语音通信设备，其特征在于，还包括：

收集模块，用于执行当前的所述AI语音通信任务时，根据预设的数据收集模板，收集与所述文本请求信息包括的变量文本信息对应的反馈数据；以及，根据收集到的所述反馈数据，生成采集数据表单，并输出。

9.一种AI语音通信服务器，其特征在于，包括：

合成模块，用于基于所述合成语音信息，得到AI语音数据，以将所述文本请求信息对应地转换为AI语音数据；

数据库，用于存储通信语料的AI语音数据；以及，用于存储AI语音通信任务中收集生成的采集数据表单。