CN110059161A

CN110059161A - 一种基于文本分类技术的电话语音机器人系统

Info

Publication number: CN110059161A
Application number: CN201910330593.0A
Authority: CN
Inventors: 陈捷
Original assignee: Shenzhen Dazhong Communication Technology Co Ltd
Current assignee: Shenzhen Dazhong Communication Technology Co Ltd
Priority date: 2019-04-23
Filing date: 2019-04-23
Publication date: 2019-07-26

Abstract

本发明公开了一种基于文本分类技术的电话语音机器人系统，包括语音网关、呼叫与媒体服务器、语音识别服务器、对话服务器及分类模块，本发明的文本分类方法包括以下步骤：S1，获取语音识别文本；S2，将所述文本进行预处理，删除非标准字符；S3，调用分词工具进行分词；S4，删除高词频的停用词；S5，使用预先训练完成的模型对文本进行分类。本发明通过对用户语音识别文本进行准确分类，增强了关键词的匹配度，能够有效识别同音字及近音字，支持多个关键词相关文本的正确分类，提高了电话语音机器人对客户问题的理解能力。

Description

一种基于文本分类技术的电话语音机器人系统

技术领域

本发明涉及通信技术领域，特别是涉及一种基于文本分类技术电话语音机器人系统。

背景技术

传统呼叫中心的话务员工作简单重复、工作压力大、效率低，随着经济发展，人力成本上升得非常快，因此越来越多的呼叫中心采用电话机器人来部分取代这些简单重复的话务员工作。

目前，也有一些电话机器人开始投入使用，但是目前的电话机器人存在以下问题：

1、电话机器人并不能理解客户的问题，只是对语音识别后的文字进行关键词匹配，搜寻现有答案。

2、语音识别准确度普遍不高，有一定概率的识别错误或者识别成同音词的情况，会使关键词匹配错误，导致所答非所问。

3、关键词匹配不能根据语义进行匹配，客户同一个语义的不同表述方式不能进行正确匹配。

4、关键词匹配目前大都只能支持单关键词，对于多个关键词的情况，无法正确匹配。

发明内容

本发明的目的是克服现有技术中的不足之处，提供一种基于文本分类技术电话语音机器人系统，以解决上述背景技术中存在的问题。

为解决上述技术问题，本发明通过下述技术方案来解决：

一种基于文本分类技术的电话语音机器人系统，包括：

呼叫与媒体服务器，用于根据对话服务器的指令通过语音网关向用户终端发起语音呼叫，并接收用户终端发送的语音，以及将所接收到的语音发送至语音识别服务器进行语音识别；

所述语音识别服务器，用于将所接收到的语音进行识别，生成文本，以及将所述识别得到的文本发送至所述对话服务器；

所述对话服务器，用于调用分类模块对所述识别文本进行分类，并根据分类结果以及当前系统状态向用户播放不同语音，然后进行状态迁移；

所述分类模块，用于在离线状态以预训练词向量为基础，使用人工生成的小样本数据进行分类训练，并根据分类训练得到的模型对所述识别文本进行在线分类处理。

进一步的，所述对话服务器向用户播放的语音通知为预先录制的语音或文本转换的语音。

本发明还提供了一种应用于所述的一种基于文本分类技术的电话语音机器人系统的文本分类方法，包括以下步骤：

S1，获取语音识别后得到的识别结果文本；

S2，将所述文本进行预处理，删除非标准字符；

S3，调用分词工具进行分词；

S4，删除高词频的停用词；

S5，使用预先训练完成的模型对文本进行分类。

其中，步骤S5中的所述预先训练完成的模型通过以下步骤获得：

S51，获取预训练词向量；

S52，制作文本分类所需的数据集，将电话语音机器人与用户的对话内容分成问答序列，每一个不同回答作为一个单独类别；

S53，文本分类以预训练词向量为基础，以手工制作的小样本数据集进行分类训练。

其中，步骤S53中，分类训练采用的分类器为fasttext，算法为CBOW(连续词袋)+softmax。

本发明相比现有技术具有以下优点及有益效果：

1，本发明的电话语音机器人系统包括用分类模块，通过对用户语音信号的识别文本进行准确分类，增强了关键词的匹配度，提高了电话语音机器人对客户意图的理解能力。

2，本发明语音识别的文本分类方法中，以预训练词向量作为训练样本进行分类训练，将对话机器人与客户的对话内容分成问答序列，每一个不同回答作为一个单独类别，并手工制作分类训练的数据集，然后根据分类训练得到的模型对所述识别文本进行分类处理，分类过程中，具有一定的容错能力，对词义相似但表达不同的文本也能完成准确分类，使电话语音机器人能够对客户的意图进行准确识别，有效避免了答非所问。

3.本发明语音识别的文本分类方法能够支持多个关键词相关文本的正确分类，在通话过程中，可对多个关键词正确匹配，避免了现有技术中只能支持单个关键词的缺陷，提高电话语音机器人的语音识别效率。

4.本发明语音识别的文本分类方法中，使用预先训练完成的模型对文本进行分类，在电话机器人与客户的通话过程中，对于个别语音识别错误、同音字、近音字识别错误的情况，只要将错误识别的数据写入分类训练的数据集进行重新训练，也能够保证正确分类，进一步提高了对客户意图理解的准确性。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为一种基于文本分类技术的电话语音机器人系统架构图。

图2为一种基于文本分类技术的电话语音机器人系统的工作流程图。

图3为一种基于文本分类技术的电话语音机器人系统的文本分类方法流程图。

图4为一种基于文本分类技术的电话语音机器人系统的文本分类方法训练流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

本发明的具体实施过程如下：

如图1所示，一种基于文本分类技术的电话语音机器人系统，包括：

呼叫与媒体服务器2，用于根据对话服务器3的指令通过语音网关1向用户终端发起语音呼叫，并接收用户终端发送的语音，以及将所接收到的语音发送至语音识别服务器4进行语音识别；

所述语音识别服务器4，用于将所接收到的语音进行识别，并生成文本，以及将所述识别生成文本发送至所述对话服务器3；

所述对话服务器3，用于调用分类模块对所述识别文本进行分类处理，并根据分类处理结果以及系统状态向用户播放不同的语音通知，之后进行状态迁移，本实施例中，所述语音通知为预先录制的语音或文本转换的语音；

所述分类模块，以预训练词向量为基础使用手工生成的小样本数据进行分类训练，并根据分类训练得到的模型对所述识别文本进行分类处理。

请参考图2，本实施例中的电话语音机器人系统的工作过程如下:

(1)对话服务器向呼叫与媒体服务器发出指令以发起呼叫；

(2)呼叫与媒体服务器发送SIP invite消息给语音网关，语音网关通过运营商电信网络发起呼叫；

(3)用户应答后，语音网关返回SIP 200 OK响应给呼叫与媒体服务器，并转发至对话服务器；

(4)呼叫进入通话状态；

(5)呼叫与媒体服务器接收到用户终端发送的语音，并将语音媒体流发送到语音识别服务器进行语音识别；

(6)语音识别服务器对所述语音进行识别并向呼叫与媒体服务器反馈语音识别结果，所述识别结果是将所述语音进行识别后得到的文本；

(7)呼叫与媒体服务器将所述识别文本转发至对话服务器；

(8)对话服务器调用分类模块对所述识别文本进行分类；

(9)对话服务器查询状态，根据分类结果和状态决定播放的语音通知类型和新状态迁移；

(10)对话服务器执行向用户发送语音通知以及状态迁移的动作；

(11)重复(5)至(10)的步骤以持续通话。

请参考图3，本发明还提供了一种应用于所述的一种基于文本分类技术的电话语音机器人系统的文本分类方法，包括以下步骤：

S1，获取语音识别文本；

S2，将所述文本进行预处理，删除非标准字符，仅保留中英文和数字；

S3，调用分词工具进行分词；

S4，删除高词频的停用词；

S5，使用预先训练完成的模型对文本进行分类，分类器可使用fasttext。

进一步的，请参考图4，步骤S5中的所述预先训练完成的模型通过以下步骤获得：

S51，获取预训练词向量，所述预训练词向量可以是现有的，目前有多个自然语言处理相关的互联网站提供工业级预训练词向量的下载，若无法获取，也可以下载维基百科或其他语料使用word2vec或者fasttext工具进行训练获得词向量。

S52，手工制作文本分类所需的数据集，将电话语音机器人与用户的对话内容分成问答序列，每一个不同回答作为一个单独类别；

进一步的，步骤S53中，分类训练采用的分类器为fasttext，算法为CBOW(连续词袋)+softmax。通过上述分类模型的训练，使本发明在语音识别的过程中，对于个别语音识别错误、同音字、近音字识别错误的情况，只要将错误识别的数据写入分类训练的数据集进行重新训练，也能够保证正确分类，能够提高了语音识别的准确性。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于文本分类技术的电话语音机器人系统，其特征在于，包括：

所述语音识别服务器，用于将所接收到的语音进行识别，并生成文本，以及将所述识别得到的文本发送至所述对话服务器；

所述对话服务器，用于调用分类模块对所述语音识别服务器识别的文本进行分类，并根据分类结果以及当前系统状态向用户播放不同语音，然后进行状态迁移；

所述分类模块，用于在离线状态以预训练词向量为基础，使用人工生成的小样本数据进行分类训练，并根据分类训练得到的模型对所述识别到的文本进行在线分类处理。

2.根据权利要求1所述的一种基于文本分类技术的电话语音机器人系统，其特征在于：所述对话服务器向用户播放的语音为预先录制的语音或文本转换的语音。

3.一种应用于权利要求1至2任一项所述的一种基于文本分类技术的电话语音机器人系统的文本分类方法，其特征在于，包括以下步骤：

S1，获取语音识别后得到的识别结果文本；

S2，将所述文本进行预处理，删除非标准字符；

S3，调用分词工具进行分词；

S4，删除高词频的停用词；

S5，使用预先训练完成的模型对文本进行分类。

4.根据权利要求3所述的方法，其特征在于：步骤S5中的所述预先训练完成的模型通过以下步骤获得：

S51，获取预训练词向量；

5.根据权利要求4所述的方法，其特征在于：步骤S53中，分类训练采用的分类器为fasttext，算法为CBOW+softmax。