CN111816188A

CN111816188A - 用于智能机器人的人机语音交互方法

Info

Publication number: CN111816188A
Application number: CN202010581588.XA
Authority: CN
Inventors: 王俊清
Original assignee: Zhangzhou Longwenweike Information Technology Co Ltd
Current assignee: Zhangzhou Longwenweike Information Technology Co Ltd
Priority date: 2020-06-23
Filing date: 2020-06-23
Publication date: 2020-10-23

Abstract

本发明公开了用于智能机器人的人机语音交互方法，包括：获取多个用户输入的语音信息，建立声纹特征数据库；判断用户所属的年龄段，分别划分到成年人组和未成年人组；若某用户属于未成人年组，则在获取到该用户的语音指令时，智能机器人的人机语音交互模式自动切换至未成年人模式；当接收到某一用户输入的语音指令时，将其与声纹特征数据库中进行匹配，并定义同一用户；为每个用户赋予一个唯一身份序列号；建立针对用户的个性化信息库。本发明在对用户根据年龄进行分类的同时，还根据用户的声纹特征和使用习惯建立个个性化数据化，不仅保护了用户接受信息的安全，更方便了用户的学习和生活。

Description

用于智能机器人的人机语音交互方法

技术领域

本发明属于智能机器人技术领域，涉及用于智能机器人的人机语音交互方法。

背景技术

随着科技的发展，智能化设备的智能化程度越来越高，产品类型越来越多，应用越来越广泛。比如目前日益火爆的天猫精灵、小度、小爱同学等产品，可以连接家中很多常用设备，无需自我操作，语音交互即可实现对设备的操作。并且，也可通过语音交互点播用户喜爱的视频、音乐等项目，因此，受到广大家庭的极大喜爱，正逐步走进人们的生活。然而，家庭成员中有成人也有儿童，现有的诸如以上提及的智能机器人设置在进行人机交互时，并不能根据用户的年龄不同而提供相适宜的语音交互内容，这势必会影响与之交互的少年儿童的健康发育。此外，智能机器人还存在时时刻刻开机自动获取语音信息的状态，这是极大的个人隐私可能会泄露的隐患。因此，对其进行改造以满足用户的需求和保护用户的隐私是目前亟需解决的重大问题。

发明内容

本发明的一个目的是解决至少上述问题和/或缺陷，并提供至少后面将说明的优点。

本发明还有一个目的是提供用于智能机器人的人机语音交互方法。

为此，本发明提供的技术方案为：

用于智能机器人的人机语音交互方法，包括：

步骤一、获取多个用户输入的语音信息，并提取用户的声纹特征建立声纹特征数据库；

步骤二、根据多个所述用户的语音信息的声纹特征判断用户所属的年龄段，依据用户所属的年龄段将所述用户分别划分到成年人组和未成年人组；

步骤三、若某用户属于未成人年组，则在获取到该用户的语音指令时，智能机器人的人机语音交互模式自动切换至未成年人模式；

步骤四、当所述智能机器人接收到某一用户输入的语音指令时，将其声纹特征与所述智能机器人声纹特征数据库中已有的声纹特征数据进行匹配，并将能够匹配上的多个声纹特征数据定义为同一用户；

步骤五、建立唯一身份序列号信息表，并为每个用户赋予一个唯一身份序列号；

步骤六、建立针对用户的个性化信息库，并且将该用户的唯一身份序列号与其个性化信息相关联，其中，所述个性化信息库包括每个用户的个人语音搜索语义记录、点播记录和使用时间记录。

优选的是，所述的用于智能机器人的人机语音交互方法，还包括：

接收用户设定开关机的时间段的语音指令，所述智能机器人在用户设定的开关机的时间段外部启动休眠模式，不主动获取用户的语音信息。

优选的是，所述的用于智能机器人的人机语音交互方法中，所述声纹特征数据库的更新周期为20-30天。

接收用户设定本地语音信息是否上传智能机器人云端的语音指令，若用户不发出本地语音信息不上传智能机器人云端的语音指令，则默认执行本地语音信息不上传智能机器人云端。

优选的是，所述的用于智能机器人的人机语音交互方法中，所述智能机器人内设置有存储介质，所述存储介质用于存储用户输入的语音信息，所述语音信息包括所述语音指令。

优选的是，所述的用于智能机器人的人机语音交互方法中，当用户发出本地语音信息上传至智能机器人云端的语音指令时，所述智能机器人同时发出索取上传云端的密码的语音信息，当接收到正确的密码语音指令时，所述智能机器人将本地语音信息上传至其云端。

优选的是，所述的用于智能机器人的人机语音交互方法中，所述正确的密码语音指令包括发出指令的用户的声纹特征。

优选的是，所述的用于智能机器人的人机语音交互方法中，所述声纹特征包括音色、语速、音调、语言种类、频谱和口音中的任意一种或多种。

优选的是，所述的用于智能机器人的人机语音交互方法中，所述未成人组还包括1-6岁少儿组和7-17岁青少年组。

优选的是，所述的用于智能机器人的人机语音交互方法中，所述正确的密码语音指令的发出者为所述成人组的用户。

本发明至少包括以下有益效果：

本发明首先能根据语音信息将用户区分为未成人组或成年人组，对未成年人组开启未成年人模式，避免未成年人在与智能机器人交互过程中，接触到对未成年人不适宜的信息。然后，本发明还根据用户的声纹特征区分不同用户，将依据其历史语音信息情况为其建立个人偏好的个性化信息，以使智能机器人“更懂”用户需求，方便用户的需求。

本发明在对用户根据年龄进行分类的同时，还根据用户的声纹特征和使用习惯建立个个性化数据化，不仅保护了用户接受信息的安全，更方便了用户的学习和生活。

此外，本发明接收用户设定开关机的时间段的语音指令，所述智能机器人在用户设定的开关机的时间段外部启动休眠模式，不主动获取用户的语音信息。以保证用户的语音信息的安全，避免生活受到干扰。声纹特征数据库的更新周期为20-30天。加快信息更替，符合用户的生活和学习习惯，并且，更新周期较短，也确保了系统的快速便捷相应，避免存储了过多数据影响智能机器人的运行速度。

本发明的其它优点、目标和特征将部分通过下面的说明体现，部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。

具体实施方式

下面对本发明做进一步的详细说明，以令本领域技术人员参照说明书文字能够据以实施。

应当理解，本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。

本发明提供用于智能机器人的人机语音交互方法，包括：

在本发明的其中一个实施例中，作为优选，还包括：

接收用户设定开关机的时间段的语音指令，所述智能机器人在用户设定的开关机的时间段外部启动休眠模式，不主动获取用户的语音信息。以保证用户的语音信息的安全，避免生活受到干扰。

在本发明的其中一个实施例中，作为优选，所述声纹特征数据库的更新周期为20-30天。加快信息更替，符合用户的生活和学习习惯，并且，更新周期较短，也确保了系统的快速便捷相应，避免存储了过多数据影响智能机器人的运行速度。

在本发明的其中一个实施例中，作为优选，还包括：

接收用户设定本地语音信息是否上传智能机器人云端的语音指令，若用户不发出本地语音信息不上传智能机器人云端的语音指令，则默认执行本地语音信息不上传智能机器人云端。以进一步保证用户的隐私安全。

在上述方案中，作为优选，所述智能机器人内设置有存储介质，所述存储介质用于存储用户输入的语音信息，所述语音信息包括所述语音指令。用户可根据使用频率和使用人数等选择合适存储容量的存储介质，以满足需求，使其方便快捷。

在本发明的其中一个实施例中，作为优选，当用户发出本地语音信息上传至智能机器人云端的语音指令时，所述智能机器人同时发出索取上传云端的密码的语音信息，当接收到正确的密码语音指令时，所述智能机器人将本地语音信息上传至其云端。进一步确保上传到智能机器人云端存储的数据是用户需要保存的，保证其隐私安全。

在本发明的其中一个实施例中，作为优选，所述正确的密码语音指令包括发出指令的用户的声纹特征。更优选得，所述正确的密码语音指令的发出者为所述成人组的用户。以增强保密效果，避免青少年的误传数据操作。

在本发明的其中一个实施例中，作为优选，所述声纹特征包括音色、语速、音调、语言种类、频谱和口音中的任意一种或多种。以便能够对声纹特征进行准确分析和匹配。

在本发明的其中一个实施例中，作为优选，所述未成人组还包括1-6岁少儿组和7-17岁青少年组。以便更加有针对性的搜索和推送节目。

为使本领域技术人员更好地理解本发明的技术方案，现提供如下的实施例进行说明：

用于智能机器人的人机语音交互方法，包括如下步骤：

步骤一、获取多个用户输入的语音信息，并提取用户的声纹特征建立声纹特征数据库，所述声纹特征数据库的更新周期为20-30天。

步骤二、根据多个所述用户的语音信息的声纹特征判断用户所属的年龄段，依据用户所属的年龄段将所述用户分别划分到成年人组和未成年人组；所述未成人组包括1-6岁少儿组和7-17岁青少年组。

还包括如下步骤：

接收用户设定本地语音信息是否上传智能机器人云端的语音指令，若用户不发出本地语音信息不上传智能机器人云端的语音指令，则默认执行本地语音信息不上传智能机器人云端。所述智能机器人内设置有存储介质，所述存储介质用于存储用户输入的语音信息，所述语音信息包括所述语音指令。当用户发出本地语音信息上传至智能机器人云端的语音指令时，所述智能机器人同时发出索取上传云端的密码的语音信息，当接收到正确的密码语音指令时，所述智能机器人将本地语音信息上传至其云端。所述正确的密码语音指令包括发出指令的用户的声纹特征。所述正确的密码语音指令的发出者为所述成人组的用户。所述声纹特征包括音色、语速、音调、语言种类、频谱和口音中的任意一种或多种。

这里说明的模块数量和处理规模是用来简化本发明的说明的。对本发明的用于智能机器人的人机语音交互方法的应用、修改和变化对本领域的技术人员来说是显而易见的。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用，它完全可以被适用于各种适合本发明的领域，对于熟悉本领域的人员而言，可容易地实现另外的修改，因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节。

Claims

1.用于智能机器人的人机语音交互方法，其特征在于，包括如下步骤：

2.如权利要求1所述的用于智能机器人的人机语音交互方法，其特征在于，还包括如下步骤：

3.如权利要求1所述的用于智能机器人的人机语音交互方法，其特征在于，所述声纹特征数据库的更新周期为20-30天。

4.如权利要求1所述的用于智能机器人的人机语音交互方法，其特征在于，还包括：

5.如权利要求4所述的用于智能机器人的人机语音交互方法，其特征在于，所述智能机器人内设置有存储介质，所述存储介质用于存储用户输入的语音信息，所述语音信息包括所述语音指令。

6.如权利要求4所述的用于智能机器人的人机语音交互方法，其特征在于，当用户发出本地语音信息上传至智能机器人云端的语音指令时，所述智能机器人同时发出索取上传云端的密码的语音信息，当接收到正确的密码语音指令时，所述智能机器人将本地语音信息上传至其云端。

7.如权利要求4所述的用于智能机器人的人机语音交互方法，其特征在于，所述正确的密码语音指令包括发出指令的用户的声纹特征。

8.如权利要求1所述的用于智能机器人的人机语音交互方法，其特征在于，所述声纹特征包括音色、语速、音调、语言种类、频谱和口音中的任意一种或多种。

9.如权利要求1所述的用于智能机器人的人机语音交互方法，其特征在于，所述未成人组还包括1-6岁少儿组和7-17岁青少年组。

10.如权利要求7所述的用于智能机器人的人机语音交互方法，其特征在于，所述正确的密码语音指令的发出者为所述成人组的用户。