CN113707139A

CN113707139A - 一种人工智能机器人的语音沟通交流服务系统

Info

Publication number: CN113707139A
Application number: CN202010908282.0A
Authority: CN
Inventors: 郑钰
Original assignee: Nanning Xuanniao Network Technology Co Ltd
Current assignee: Nanning Xuanniao Network Technology Co Ltd
Priority date: 2020-09-02
Filing date: 2020-09-02
Publication date: 2021-11-26
Anticipated expiration: 2040-09-02
Also published as: CN113707139B

Abstract

本发明公开了一种人工智能机器人的语音沟通交流服务系统，包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块，所述AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行，所述语音接收模块接收来自用户的语音信息，所述语音识别模块用于接收来自语音接收模块的语音信息并进行识别，所述语音分析模块用于分析语音识别模块发送的语音信息的类别。本发明可以在机器人与用于沟通期间采用多种回答方法回答重复问题，且能够根据用户音色进行智能音色切换，提高亲和度，此外还能够根据用户周围环境截取有效音频信息，避免出现回答错误的情况。

Description

一种人工智能机器人的语音沟通交流服务系统

技术领域

本发明涉及人机交互领域，具体涉及一种人工智能机器人的语音沟通交流服务系统。

背景技术

人工智能机器人的语音沟通交流服务系统是一种用于机器人与用户对话的系统，其主要用于用户在办理业务时对业务疑问进行应答，以及用户与机器人之间的对话，采用AI智能控制，使用方便。

现有的人工智能机器人的语音沟通交流服务系统，在用户使用时，系统容易受到外界其他声音源的干扰，而导致系统会出现不能准确识别用户语音的情况，且系统在回答用户重复问题时回答方式单一，导致用户响应程度一般，系统音色比较单一，不能根据用户音色进行转换匹配，缺乏趣味性，导致整个人工智能机器人的语音沟通交流服务系统使用效果不够突出。

发明内容

本发明所要解决的技术问题在于：如何解决系统容易受到外界其他声音源的干扰，而导致系统会出现不能准确识别用户语音的情况，且系统在回答用户重复问题时回答方式单一，导致用户响应程度一般，系统音色比较单一，不能根据用户音色进行转换匹配，缺乏趣味性，导致整个人工智能机器人的语音沟通交流服务系统使用效果不够突出。

本发明是通过以下技术方案解决上述技术问题的，一种人工智能机器人的语音沟通交流服务系统，包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块；

所述AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行；

所述语音接收模块接收来自用户的语音信息；

所述语音识别模块用于接收来自语音接收模块的语音信息并进行识别；

所述语音分析模块用于分析语音识别模块发送的语音信息的类别；

所述应答模块根据语音分析模块分析接结果作出应答；

所述播报模块用于播报应答模块应答结果。

优选的，所述语音接收模块包括分贝识别模块、筛选模块和截取模块，分贝识别模块用于识别用户语音分贝大小，筛选模块用于筛选最大分贝的语音音频，截取模块用于截取出最大分贝的语音音频。

优选的，所述语音识别模块包括转换模块、音轨识别模块、音轨数据库和音色切换模块,转换模块用于将语音信息转换为数字音频信息，音轨识别模块用于识别转换后的数字音频信息所处的音轨区间，音轨数据库提供各类音轨区间的参数，音色切换模块根据音轨识别模块所识别的音轨区间进行音色切换；

优选的，所述应答模块包括答复数据库和提取模块，答复数据库用于各类答复信息的储存，提取模块针对所语音分析模块分析结果结合答复数据库比对提取答复数字音频信息。

优选的，所述答复数据库包括数据区间、分类单元、标记单元和循环单元，其中数据区间对各类数字音频信息进行分区，分类单元对各个区间每同一类数字音频信息进行分类，标记单元对每同一类数字音频信息进行标记，依次标记为YP1、YP2...YPN，循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环，由提取模块按照顺序提取。

优选的，所述音色切换模块包括有内置音色数据库，音色数据库与音轨数据库相适配，音频识别模块根据音轨识别数据库识别的音轨与内置音色数据库匹配。

本发明相比现有技术具有以下优点：本发明通过设置分贝识别模块配合筛选模块和截取模块，分贝识别模块针对所识别的用户语音进行分别识别，并结合用户环境，对除用户语音外其他语音分别进行识别，筛序模块根据分贝识别模块所识别的用户语音分贝和其他语音分贝进行筛选，选出分贝最大的语音信息，截取模块对分贝最大的语音信息进行截取，从而可以正确的获取客户音频信息，减小外界环境中其他声音信息的干扰，导致机器人获取信息错误而出现误答的情况，极大的提高机器人与用户之间语音沟通的准确性；

通过设置音轨识别模块配合音色切换模块，音轨识别模块接收转换所转换的数字音频信息，并结合音轨数据库识别该数字音频信息所述的音轨区间，音色切换模块根据该数字音频信息所处的音轨区间对音色进行配置并切换，从而可以根据不同年龄段和不同音色的客户去匹配用户声音，从而使得机器人的生意更具有亲和力，音色自由切换，提高了该机器人的语音沟通交流服务系统的适用范围；

通过设置答复数据库配合提取模块，答复数据库中数据区间对各类数字音频信息进行分区，分类单元对各个区间每同一类数字音频信息进行分类，标记单元对每同一类数字音频信息进行标记，依次标记为YP1、YP2...YPN，循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环，提取模块根据语音分析模块分析语音信息的类别提取来组答复数据库中相应答复并提交给播报模块，从而针对相同用户提出的同种问题该机器人的语音沟通交流服务系统可以做出不同的回答，提高了整个机器人的语音沟通交流服务系统趣味性，更能吸引用户的注意力。

附图说明

图1是本发明的系统框图；

图2是本发明中语音接收模块的系统框图；

图3是本发明中语音识别模块的系统框图；

图4是本发明中应答模块的系统框图。

具体实施方式

下面对本发明的实施例作详细说明，本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

如图1-4所示，本实施例提供一种技术方案：一种人工智能机器人的语音沟通交流服务系统，包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块；

AI芯片用于控制语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块处理结果的执行；

语音接收模块接收来自用户的语音信息；

语音识别模块用于接收来自语音接收模块的语音信息并进行识别；

语音分析模块用于分析语音识别模块发送的语音信息的类别；

应答模块根据语音分析模块分析接结果作出应答；

播报模块用于播报应答模块应答结果。

语音接收模块包括分贝识别模块、筛选模块和截取模块，分贝识别模块用于识别用户语音分贝大小，筛选模块用于筛选最大分贝的语音音频，截取模块用于截取出最大分贝的语音音频；

语音接收模块具体处理步骤如下：

步骤一：分贝识别模块针对所识别的用户语音进行分别识别，并结合用户环境，对除用户语音外其他语音分别进行识别；

步骤二：筛序模块根据分贝识别模块所识别的用户语音分贝和其他语音分贝进行筛选，选出分贝最大的语音信息；

步骤三：截取模块对分贝最大的语音信息进行截取，提取出分贝最大的语音信息并默认为用户语音信息。

语音识别模块包括转换模块、音轨识别模块、音轨数据库和音色切换模块,转换模块用于将语音信息转换为数字音频信息，音轨识别模块用于识别转换后的数字音频信息所处的音轨区间，音轨数据库提供各类音轨区间的参数，音色切换模块根据音轨识别模块所识别的音轨区间进行音色切换；

语音识别模块具体识别步骤如下：

S1：转换模块将来自语音接收模块最终识别的用户语音信息进行转换，于将语音信息转换为数字音频信息；

S2：音轨识别模块接收转换所转换的数字音频信息，并结合音轨数据库识别该数字音频信息所述的音轨区间；

S3：音色切换模块根据该数字音频信息所处的音轨区间对音色进行配置并切换。

应答模块包括答复数据库和提取模块，答复数据库用于各类答复信息的储存，提取模块针对所语音分析模块分析结果结合答复数据库比对提取答复数字音频信息。

答复数据库包括数据区间、分类单元、标记单元和循环单元，其中数据区间对各类数字音频信息进行分区，分类单元对各个区间每同一类数字音频信息进行分类，标记单元对每同一类数字音频信息进行标记，依次标记为YP1、YP2...YPN，循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环，由提取模块按照顺序提取。

应答模块具体处理步骤如下：

A1：答复数据库中数据区间对各类数字音频信息进行分区，分类单元对各个区间每同一类数字音频信息进行分类，标记单元对每同一类数字音频信息进行标记，依次标记为YP1、YP2...YPN，循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环；

A2：提取模块根据语音分析模块分析语音信息的类别提取来组答复数据库中相应答复并提交给播报模块。

音色切换模块包括有内置音色数据库，音色数据库与音轨数据库相适配，音频识别模块根据音轨识别数据库识别的音轨与内置音色数据库匹配。

综上，本发明在使用时，由AI芯片对整个语音沟通交流服务系统的执行进行控制，用户语音首先由语音接收模块进行接收，分贝识别模块针对所识别的用户语音进行分别识别，并结合用户环境，对除用户语音外其他语音分别进行识别，筛序模块根据分贝识别模块所识别的用户语音分贝和其他语音分贝进行筛选，选出分贝最大的语音信息，截取模块对分贝最大的语音信息进行截取，提取出分贝最大的语音信息并默认为用户语音信息，转换模块将来自语音接收模块最终识别的用户语音信息进行转换，于将语音信息转换为数字音频信息，音轨识别模块接收转换所转换的数字音频信息，并结合音轨数据库识别该数字音频信息所述的音轨区间，音色切换模块根据该数字音频信息所处的音轨区间对音色进行配置并切换，之后由语音识别模块进行识别，随后由语音分析模块对所识别的音频信息进行分析，识别出用户音频信息所属的类别，之后应答模块进行应答处理，答复数据库中数据区间对各类数字音频信息进行分区，分类单元对各个区间每同一类数字音频信息进行分类，标记单元对每同一类数字音频信息进行标记，依次标记为YP1、YP2...YPN，循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环，提取模块根据语音分析模块分析语音信息的类别提取来组答复数据库中相应答复并提交给播报模块，最终由播报模块进行播报，整个操作过程结束。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种人工智能机器人的语音沟通交流服务系统，其特征在于，包括AI芯片、语音接收模块、语音识别模块、语音分析模块、应答模块和播报模块；

所述语音接收模块接收来自用户的语音信息；

所述应答模块根据语音分析模块分析接结果作出应答；

所述播报模块用于播报应答模块应答结果。

2.根据权利要求1所述的一种人工智能机器人的语音沟通交流服务系统，其特征在于：所述语音接收模块包括分贝识别模块、筛选模块和截取模块，分贝识别模块用于识别用户语音分贝大小，筛选模块用于筛选最大分贝的语音音频，截取模块用于截取出最大分贝的语音音频。

3.根据权利要求1所述的一种人工智能机器人的语音沟通交流服务系统，其特征在于：所述语音识别模块包括转换模块、音轨识别模块、音轨数据库和音色切换模块,转换模块用于将语音信息转换为数字音频信息，音轨识别模块用于识别转换后的数字音频信息所处的音轨区间，音轨数据库提供各类音轨区间的参数，音色切换模块根据音轨识别模块所识别的音轨区间进行音色切换。

4.根据权利要求1所述的一种人工智能机器人的语音沟通交流服务系统，其特征在于：所述应答模块包括答复数据库和提取模块，答复数据库用于各类答复信息的储存，提取模块针对所语音分析模块分析结果结合答复数据库比对提取答复数字音频信息。

5.根据权利要求4所述的一种人工智能机器人的语音沟通交流服务系统，其特征在于：所述答复数据库包括数据区间、分类单元、标记单元和循环单元，其中数据区间对各类数字音频信息进行分区，分类单元对各个区间每同一类数字音频信息进行分类，标记单元对每同一类数字音频信息进行标记，依次标记为YP1、YP2...YPN，循环单元根据同一类数字音频信息标记根据用户相同提问依照YP1、YP2...YPN顺序依次择取数字音频信息并循环，由提取模块按照顺序提取。

6.根据权利要求3所述的一种人工智能机器人的语音沟通交流服务系统，其特征在于：所述音色切换模块包括有内置音色数据库，音色数据库与音轨数据库相适配，音频识别模块根据音轨识别数据库识别的音轨与内置音色数据库匹配。