CN111312242A

CN111312242A - 一种不影响对话管理的意图打断智能语音机器人方案

Info

Publication number: CN111312242A
Application number: CN202010089897.5A
Authority: CN
Inventors: 朱敬礼; 周园园
Original assignee: Shanghai Kaian Information Technology Co ltd
Current assignee: Shanghai Kaian Information Technology Co ltd
Priority date: 2020-02-13
Filing date: 2020-02-13
Publication date: 2020-06-19

Abstract

本发明公开了一种不影响对话管理的意图打断智能语音机器人方案，包括外呼控制中心、NLU模块、DM模块、NLG模块、TTS模块，还包括带标示位的ASR模块：在原有语音转文字功能上添加了标示位，通过标示位区分当前ASR结果；打断过滤模块：当所述带标示位的ASR模块的playStatus为1时，通过相应方法，将ASR结果进行意图过滤，对用户打断意图检测。本发明，通过修改ASR模块和添加打断过滤模块，解决了传统基于音量检测(VAD)无法却分噪声和客户声音的问题，根据客户的意图进行准确高效的打断，提升了智能语音外呼机器人的对话效率和客户体验；同时支持根据客户类别配置不同的打断意图，实现了多样化和个性化，极大提高了系统的集成性和可维护性，降低了系统的维护成本。

Description

一种不影响对话管理的意图打断智能语音机器人方案

技术领域

本发明涉及产品软件和应用软件技术领域，具体为一种不影响对话管理的意图打断智能语音机器人方案。

背景技术

目前，现有的智能语音外呼机器人在实现打断时，智能外呼机器人并不能根据意图打断，而是基于当说话人音量高于某个阀值后打断。由于外呼场景下，通话人所处环境的多样性和通信设备质量不一，这种打断方式显的很不实用。2.目前也有少数公司实现了基于关键词的打断用于解决问题1，常规的实现方法是在自动外呼系统侧实现，这种方式优点是简单易实现：只有携带关键词的ASR结果才会发送给NLU、DM等模块处理。这不仅会导致系统的集成性低、运行和维护成本高而且不能差异化配置。

发明内容

本发明的目的在于提供一种不影响对话管理的意图打断智能语音机器人方案，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：一种不影响对话管理的意图打断智能语音机器人方案，包括外呼控制中心、NLU模块、DM模块、NLG模块、TTS模块，还包括：

带标示位的ASR模块：在原有语音转文字功能上添加了标示位，通过标示位区分当前ASR结果；

打断过滤模块：当所述带标示位的ASR模块的playStatus为1时，通过相应方法，将ASR结果进行意图过滤，对用户打断意图检测。

优选的，所述相应方法为意图分类算法或者关键词匹配方法。

优选的，所述打断过滤模块和带标示位的ASR模块均包括用户类别区分模块，所述用户类别区分模块是根据配置的打断参数来对用户进行区分。

优选的，所述标示位为1时表示机器人正在说话，所述标示位为0时表示机器人当前没有说话。

与现有技术相比，本发明的有益效果是：

本发明，本发明通过修改ASR模块和添加打断过滤模块，解决了传统基于音量检测(VAD)无法却分噪声和客户声音的问题，根据客户的意图进行准确高效的打断，提升了智能语音外呼机器人的对话效率和客户体验；同时支持根据客户类别配置不同的打断意图，实现了多样化和个性化，极大提高了系统的集成性和可维护性，降低了系统的维护成本。

附图说明

图1为本发明的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种技术方案：一种不影响对话管理的意图打断智能语音机器人方案，包括外呼控制中心、NLU(语音理解)模块、DM(对话管理)模块、NLG(语音生成)模块、TTS(语音合成)模块，还包括：

带标示位的ASR(语音识别)模块，在原有语音转文字功能上添加了标示位，通过标示位区分当前ASR结果，例如，ASR结果:

{

"text":"喂，你好"，

"enterpriseId":7000002,

"cno":"2000",

"uniqueId":"xxxxxx101",

"extraParams":"ivrId＝1&cutomerNumber＝139xxxxxxx",

"playStatus":"1"

}

若"playStatus":"1"，"text":"喂，你好"则表示：机器人正在说话时，对方说"喂，你好"；相应的若"playStatus":"0"，"text":"喂，你好"则表示：机器人当前没有说话，对方说"喂，你好"。其中，ivrId表示当前用户的分类，用于区分不同的客户类群，实现对不同客户的多样化设置；

打断过滤模块，当带标示位的ASR模块的playStatus为1时，通过相应方法，将ASR结果进行意图过滤，对用户打断意图检测。

优选的，相应方法为意图分类算法或者关键词匹配方法。

具体的，打断过滤模块和带标示位的ASR模块均包括用户类别区分模块，用户类别区分模块是根据配置的打断参数来对用户进行区分，带标示位的ASR(语音识别)模块中playStatus为1时，该模块工作：主要通过意图分类算法或者关键词匹配方法，将ASR结果进行简单意图过滤，针对需要打断的ASR结果进入后续智能机器人NLU和DM等模块参与真正的对话；针对一些不在打断意图范围内的ASR结果，则不进入智能机器人，以免影响机器人的对话轮次和上下文管理的状态，假如，我配置了打断意图参数如{"ivrId_1":["你好","你说什么","好的"],"ivrId_2":["等一下"]}，

当ASR结果：

{

"text":"我在测试打断"，

"enterpriseId":7000002,

"cno":"2000",

"uniqueId":"xxxxxx101",

"extraParams":"ivrId＝1&cutomerNumber＝139xxxxxxx",

"playStatus":"1"

}

该例子表示：客户类别为1类，机器人正在说话，客户说了："我在测试打断"；但由于该类用户配置的打断意图中没有"我在测试打断"相关的意图，所以相应的ASR结果被过滤掉，机器人不会有任何反应，继续说当前未说完的话。

当ASR结果：

{

"text":"你能等一下吗"，

"enterpriseId":7000002,

"cno":"2000",

"uniqueId":"xxxxxx101",

"extraParams":"ivrId＝2&cutomerNumber＝139xxxxxxx",

"playStatus":"1"

}

该例子表示：客户类别为2类，机器人正在说话，客户说了："你能等一下吗"；该类用户配置的打断意图中有"等一下"相关的意图，所以相应的ASR结果不会被过滤掉，当前的文本："你能等一下吗"会进入机器人的NLU等后续模块，参与对话，机器人会立刻返回回复该文本的TTS结果，外呼控制中心，播放相应的TTS音频，从而实现了打断。

当"playStatus":"0"时，带标示位ASR模块和原来ASR模块功能一致。

另外，我们可以看到，该实现方式可以针对不同的用户群体配置不同的打断意图或者关键词，可以做到多样化和个性型化配置，解决了关键词配置在外呼控制中心侧，只能所有打断相关功能必须全局的问题。

综上，整个过程的实现逻辑如下：

if playStatus是1：

if在相应客户分类中判断当前文本内容是存在：

进入机器人NLU，DM等后续模块，参与对话

else：

进入机器人NLU，DM等后续模块，参与对话。

具体的，标示位为1时表示机器人正在说话，标示位为0时表示机器人当前没有说话。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种不影响对话管理的意图打断智能语音机器人方案，包括外呼控制中心、NLU模块、DM模块、NLG模块、TTS模块，其特征在于还包括：

2.根据权利要求1所述的一种不影响对话管理的意图打断智能语音机器人方案，其特征在于：所述相应方法为意图分类算法或者关键词匹配方法。

3.根据权利要求1所述的一种不影响对话管理的意图打断智能语音机器人方案，其特征在于：所述打断过滤模块和带标示位的ASR模块均包括用户类别区分模块，所述用户类别区分模块是根据配置的打断参数来对用户进行区分。

4.根据权利要求1所述的一种不影响对话管理的意图打断智能语音机器人方案，其特征在于：所述标示位为1时表示机器人正在说话，所述标示位为0时表示机器人当前没有说话。