CN111805558B

CN111805558B - 一种具有记忆识别功能的自学式老年护理机器人系统

Info

Publication number: CN111805558B
Application number: CN202010769286.5A
Authority: CN
Inventors: 彭志峰; 彭水平; 孙伟红; 刘少科
Original assignee: Shenzhen As Technology Co ltd
Current assignee: Shenzhen As Technology Co ltd
Priority date: 2020-08-03
Filing date: 2020-08-03
Publication date: 2021-10-08
Anticipated expiration: 2040-08-03
Also published as: CN111805558A

Abstract

本发明公开了一种具有记忆识别功能的自学式老年护理机器人系统，涉及老年护理机器人领域；为了提升交互体验；具体包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库，所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块，声纹分析模块包括特征提取单元和声纹比对单元；所述语音库包括语音存储模块、声纹存储模块和检索模块。本发明通过设置语音拼接单元用于拼接智能处理模块输出的应答语音数据，进而由声纹调节单元调节至设定的声纹，最后通过语音输出模块输出，实现了交互时能够根据交互者声纹识别其身份，并根据设定值合成对应的声纹后输出的目的，解决了交互过程生硬、死板的问题，提升了使用体验。

Description

一种具有记忆识别功能的自学式老年护理机器人系统

技术领域

本发明涉及老年护理机器人技术领域，尤其涉及一种具有记忆识别功能的自学式老年护理机器人系统。

背景技术

随着科技的进步，人们的生活也不断地朝着智能化发展，在老年护理方面上，也出现了各种老年护理机器人，一般的护理机器人可以实现简单的语音交互，提升使用趣味性，但目前的护理机器人虽具备语音交互功能，但交互过程较为生硬，并不能满足老年人的交流需求，影响使用体验。

经检索，中国专利申请号为201610596044.4的专利，公开了一种具有自学习功能的智能机器人及其自学习方法，包括异常问题识别系统、异常问题统计系统、异常问题次数比较系统、数据库以及控制器：异常问题识别系统用于将顾客所提问的问题与数据库中存在的问题进行相似度对比，如果数据库中不存在与顾客所提问的问题相似或相同的问题，则将顾客所提问的问题标示为异常问题；上述专利中的智能机器人存在以下不足：该智能机器人虽具备一定的自学习功能，但是，不能够针对不同的受众来实现个性化交互，导致答复颇为生硬，影响使用体验。

发明内容

本发明的目的是为了解决现有技术中存在的缺点，而提出的一种具有记忆识别功能的自学式老年护理机器人系统。

为了实现上述目的，本发明采用了如下技术方案：

一种具有记忆识别功能的自学式老年护理机器人系统，包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库，所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块，声纹分析模块包括特征提取单元和声纹比对单元；所述语音库包括语音存储模块、声纹存储模块和检索模块，老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块；所述语音输出部包括语音合成模块和语音输出模块，所述语音合成模块包括语音拼接单元和声纹调节单元。

优选地：所述语音存储模块包括语音片段单元和语音数据单元，语音片段单元内基于声纹身份划分有对应的个性化片段区，语音数据单元包括初始数据区和个性化数据区。

优选地：所述工作模式包括交互模式、自学习模式和个性化语音录入模式；所述交互模式的交互流程依次包括下列步骤：

S1：声音提取模块提取外界声音，并转化为电信号发送至声音处理模块；

S2：声音处理模块对声音进行降噪处理，清除非连续性声纹，将处理后的语音传送至智能处理模块和声纹分析模块；

S3：声纹分析模块对声纹进行分析，并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配；

S4：智能处理模块对语音语义进行分析，并向检索模块发出检索指令；

S5：检索模块的声纹匹配单元识别匹配信息，并选择与其身份对应的个性化数据区和初始数据区一并作为检索库，若匹配不成功则仅选择初始数据区作为检索库，搜索单元对检索库进行检索；

S6：智能处理模块对检索结果进行提取，并传输至语音拼接单元进行拼接，声纹调节单元基于用户声纹信息，按照其匹配的设定值进行个性化声纹调节；

S7：语音输出模块将调节后的语音输出，完成交互。

优选地：所述特征提取单元将输入语音中声纹的特征点进行放大时，先取电信号振幅平均值，提取振幅大于平均值1.5倍或小于平均值0.5倍的波段，将该波段提取作为特征点一，再取电信号频率平均值，提取频率大于平均值1.5倍或小于平均值0.5倍的波段，将该波段提取作为特征点二，声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。

优选地：所述老年护理机器人系统还包括网络交互模块，网络交互模块包括数据搜索单元和数据处理单元；网络交互模块与控制模块电信号连接，且网络交互模块的信号输入端接入5G网络。

优选地：所述S5步骤中，搜索单元对检索库进行检索，检索失败时进行联网查询，其具体步骤为：

S51：智能处理模块根据语音输入部输入的语音分析语义，并通过数据搜索单元通过5G联网搜索应答语句，

S52：数据处理单元对搜索结果进行处理，并将处理后的数据传输至智能处理模块，

S53：智能处理模块对数据信息进行提取，并传输至语音拼接单元进行拼接，声纹调节单元基于用户声纹信息，按照其匹配的设定值进行个性化声纹调节；

S54：语音输出模块将调节后的语音输出，完成交互。

优选地：所述自学习模式的自学习流程依次包括下列步骤：

S11：使用者通过控制模块将系统调至自学习模式；

S12：声音提取模块提取外界声音，并转化为电信号发送至声音处理模块；

S13：声音处理模块对声音进行降噪处理，清除非连续性声纹，将处理后的语音传送至智能处理模块和声纹分析模块；

S14：声纹分析模块对声纹进行分析，并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配；

S15：智能处理模块对语音语义进行分析，得出分析结果，通过检索模块的声纹匹配单元识别匹配信息，并选择与其身份对应的个性化数据区和初始数据区一并作为检索库，若匹配不成功则仅选择初始数据区作为检索库，搜索单元对检索库进行同步检索；

S16：检索结果若未能检索到匹配的分析结果，则智能处理模块将对应语音数据录入语音存储模块中；若检索到匹配的分析结果，则不予存储。

优选地：所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能，且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区。

优选地：所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤：

S21：使用者通过控制模块将系统调至个性化语音录入模式，并选定对应的编号调出个性化片段区；

S22：使用者说出或播放出需录入的语音片段；

S23：声音提取模块提取外界声音，并转化为电信号发送至智能处理模块；

S24：智能处理模块将语音片段存入至对应的个性化片段区。

优选地：所述S6步骤中，智能处理模块根据检索提取结果进行分析，分析结果与个性化片段区匹配时，将语音片段取代对应的语音数据，后同步发送至语音拼接单元进行拼接。

本发明的有益效果为：

1.本发明通过设置语音拼接单元用于拼接智能处理模块输出的应答语音数据，进而由声纹调节单元调节至设定的声纹，最后通过语音输出模块输出，实现了交互时能够根据交互者声纹识别其身份，并根据设定值合成对应的声纹后输出的目的，解决了交互过程生硬、死板的问题，提升了使用体验。

2.本发明通过设置特征提取单元用于提取输入语音中声纹的特征点，从而便于对声纹进行区分，声纹比对单元用于比对被特征提取单元处理后的波段信号，从而进行可靠的匹配，通过对振幅和频率进行放大处理后再进行匹配，提升了匹配的容错率，保障了可靠性。

3.本发明通过设置语音片段单元用于存储声音提取模块提取的原始语音片段，语音数据单元用于存储处理后待合成的语音数据；其中初始数据区为基础语音存储区，个性化数据区基于不同声纹身份划分用于存储个性化语音数据；个性化语音数据包括符合对应声纹身份使用者的语音数据，如特定的语气助词、使用频率高的词汇、网络热词等，能够面对不同的受众，且更符合用户的交互需求，进一步提升使用体验。

4.本发明通过设置自学习模式，能够不断完善交互功能，提升交互效果，与时俱进，尽可能满足了用户需求，通过设置个性化语音录入模式，能够便于录入亲朋好友的语音片段，并运用与语音交互中，进一步加强了使用体验。

附图说明

图1为本发明提出的一种具有记忆识别功能的自学式老年护理机器人系统的框架图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。

实施例1：

一种具有记忆识别功能的自学式老年护理机器人系统，包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库，所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块，声纹分析模块包括特征提取单元和声纹比对单元；特征提取单元用于提取输入语音中声纹的特征点，从而便于对声纹进行区分，声纹比对单元用于比对被特征提取单元处理后的波段信号，从而进行可靠的匹配，所述语音库包括语音存储模块、声纹存储模块和检索模块，老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块；语音存储模块用于储存语音信息，声纹存储模块用于存储声纹信息，使得声纹对比单元能够依据声纹信息进行可靠的匹配，所述语音输出部包括语音合成模块和语音输出模块，所述语音合成模块包括语音拼接单元和声纹调节单元；语音拼接单元用于拼接智能处理模块输出的应答语音数据，进而由声纹调节单元调节至设定的声纹，最后通过语音输出模块输出，实现了交互时能够根据交互者声纹识别其身份，并根据设定值合成对应的声纹后输出的目的，解决了交互过程生硬、死板的问题，提升了使用体验。

所述语音存储模块包括语音片段单元和语音数据单元，语音片段单元内基于声纹身份划分有对应的个性化片段区，语音数据单元包括初始数据区和个性化数据区；语音片段单元用于存储声音提取模块提取的原始语音片段，语音数据单元用于存储处理后待合成的语音数据；其中初始数据区为基础语音存储区，个性化数据区基于不同声纹身份划分用于存储个性化语音数据；个性化语音数据包括符合对应声纹身份使用者的语音数据，如特定的语气助词、使用频率高的词汇、网络热词等。

所述工作模式包括交互模式、自学习模式和个性化语音录入模式；所述交互模式的交互流程依次包括下列步骤：

S7：语音输出模块将调节后的语音输出，完成交互。

所述特征提取单元将输入语音中声纹的特征点进行放大时，先取电信号振幅平均值，提取振幅大于平均值1.5倍或小于平均值0.5倍的波段，将该波段提取作为特征点一，再取电信号频率平均值，提取频率大于平均值1.5倍或小于平均值0.5倍的波段，将该波段提取作为特征点二，声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。

所述老年护理机器人系统还包括网络交互模块，网络交互模块包括数据搜索单元和数据处理单元；网络交互模块与控制模块电信号连接，且网络交互模块的信号输入端接入5G网络。

所述S5步骤中，搜索单元对检索库进行检索，检索失败时进行联网查询，其具体步骤为：

S54：语音输出模块将调节后的语音输出，完成交互。

实施例2：

一种具有记忆识别功能的自学式老年护理机器人系统，包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库，所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块，声纹分析模块包括特征提取单元和声纹比对单元，所述语音库包括语音存储模块、声纹存储模块和检索模块，老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块，所述语音输出部包括语音合成模块和语音输出模块，所述语音合成模块包括语音拼接单元和声纹调节单元。

所述语音存储模块包括语音片段单元和语音数据单元，语音片段单元内基于声纹身份划分有对应的个性化片段区，语音数据单元包括初始数据区和个性化数据区。

S7：语音输出模块将调节后的语音输出，完成交互。

S54：语音输出模块将调节后的语音输出，完成交互。

所述自学习模式的自学习流程依次包括下列步骤：

S11：使用者通过控制模块将系统调至自学习模式；

实施例3：

S7：语音输出模块将调节后的语音输出，完成交互。

S54：语音输出模块将调节后的语音输出，完成交互。

所述自学习模式的自学习流程依次包括下列步骤：

S11：使用者通过控制模块将系统调至自学习模式；

所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能，且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区。

所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤：

S22：使用者说出或播放出需录入的语音片段；

S24：智能处理模块将语音片段存入至对应的个性化片段区。

所述S6步骤中，智能处理模块根据检索提取结果进行分析，分析结果与个性化片段区匹配时，将语音片段取代对应的语音数据，后同步发送至语音拼接单元进行拼接。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种具有记忆识别功能的自学式老年护理机器人系统，其特征在于，包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库，所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块，声纹分析模块包括特征提取单元和声纹比对单元；所述语音库包括语音存储模块、声纹存储模块和检索模块，老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块；所述语音输出部包括语音合成模块和语音输出模块，所述语音合成模块包括语音拼接单元和声纹调节单元；所述语音存储模块包括语音片段单元和语音数据单元，语音片段单元内基于声纹身份划分有对应的个性化片段区，语音数据单元包括初始数据区和个性化数据区；

S7：语音输出模块将调节后的语音输出，完成交互；

所述老年护理机器人系统还包括网络交互模块，网络交互模块包括数据搜索单元和数据处理单元；网络交互模块与控制模块电信号连接，且网络交互模块的信号输入端接入5G网络，所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能，且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区，所述S6步骤中，智能处理模块根据检索提取结果进行分析，分析结果与个性化片段区匹配时，将语音片段取代对应的语音数据，后同步发送至语音拼接单元进行拼接。

2.根据权利要求1所述的一种具有记忆识别功能的自学式老年护理机器人系统，其特征在于，所述特征提取单元将输入语音中声纹的特征点进行放大时，先取电信号振幅平均值，提取振幅大于平均值1.5倍或小于平均值0.5倍的波段，将该波段提取作为特征点一，再取电信号频率平均值，提取频率大于平均值1.5倍或小于平均值0.5倍的波段，将该波段提取作为特征点二，声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。

3.根据权利要求2所述的一种具有记忆识别功能的自学式老年护理机器人系统，其特征在于，所述S5步骤中，搜索单元对检索库进行检索，检索失败时进行联网查询，其具体步骤为：

S54：语音输出模块将调节后的语音输出，完成交互。

4.根据权利要求3所述的一种具有记忆识别功能的自学式老年护理机器人系统，其特征在于，所述自学习模式的自学习流程依次包括下列步骤：

S11：使用者通过控制模块将系统调至自学习模式；

5.根据权利要求4所述的一种具有记忆识别功能的自学式老年护理机器人系统，其特征在于，所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤：

S22：使用者说出或播放出需录入的语音片段；

S24：智能处理模块将语音片段存入至对应的个性化片段区。