CN111805558B - 一种具有记忆识别功能的自学式老年护理机器人系统 - Google Patents
一种具有记忆识别功能的自学式老年护理机器人系统 Download PDFInfo
- Publication number
- CN111805558B CN111805558B CN202010769286.5A CN202010769286A CN111805558B CN 111805558 B CN111805558 B CN 111805558B CN 202010769286 A CN202010769286 A CN 202010769286A CN 111805558 B CN111805558 B CN 111805558B
- Authority
- CN
- China
- Prior art keywords
- voice
- voiceprint
- module
- unit
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006870 function Effects 0.000 title claims abstract description 27
- 230000000474 nursing effect Effects 0.000 title claims description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 49
- 230000003993 interaction Effects 0.000 claims abstract description 48
- 238000000605 extraction Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000002452 interceptive effect Effects 0.000 claims abstract description 16
- 230000008569 process Effects 0.000 claims abstract description 15
- 230000004044 response Effects 0.000 claims abstract description 12
- 239000000284 extract Substances 0.000 claims description 26
- 239000012634 fragment Substances 0.000 claims description 24
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 230000006855 networking Effects 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 9
- 238000004148 unit process Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000003672 processing method Methods 0.000 abstract description 2
- 230000002159 abnormal effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J11/00—Manipulators not otherwise provided for
- B25J11/008—Manipulators for service tasks
- B25J11/009—Nursing, e.g. carrying sick persons, pushing wheelchairs, distributing drugs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Nursing (AREA)
- Robotics (AREA)
- Mechanical Engineering (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Manipulator (AREA)
Abstract
本发明公开了一种具有记忆识别功能的自学式老年护理机器人系统,涉及老年护理机器人领域;为了提升交互体验;具体包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;所述语音库包括语音存储模块、声纹存储模块和检索模块。本发明通过设置语音拼接单元用于拼接智能处理模块输出的应答语音数据,进而由声纹调节单元调节至设定的声纹,最后通过语音输出模块输出,实现了交互时能够根据交互者声纹识别其身份,并根据设定值合成对应的声纹后输出的目的,解决了交互过程生硬、死板的问题,提升了使用体验。
Description
技术领域
本发明涉及老年护理机器人技术领域,尤其涉及一种具有记忆识别功能的自学式老年护理机器人系统。
背景技术
随着科技的进步,人们的生活也不断地朝着智能化发展,在老年护理方面上,也出现了各种老年护理机器人,一般的护理机器人可以实现简单的语音交互,提升使用趣味性,但目前的护理机器人虽具备语音交互功能,但交互过程较为生硬,并不能满足老年人的交流需求,影响使用体验。
经检索,中国专利申请号为201610596044.4的专利,公开了一种具有自学习功能的智能机器人及其自学习方法,包括异常问题识别系统、异常问题统计系统、异常问题次数比较系统、数据库以及控制器:异常问题识别系统用于将顾客所提问的问题与数据库中存在的问题进行相似度对比,如果数据库中不存在与顾客所提问的问题相似或相同的问题,则将顾客所提问的问题标示为异常问题;上述专利中的智能机器人存在以下不足:该智能机器人虽具备一定的自学习功能,但是,不能够针对不同的受众来实现个性化交互,导致答复颇为生硬,影响使用体验。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种具有记忆识别功能的自学式老年护理机器人系统。
为了实现上述目的,本发明采用了如下技术方案:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块;所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元。
优选地:所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区。
优选地:所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
优选地:所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
优选地:所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
优选地:所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
优选地:所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
优选地:所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能,且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区。
优选地:所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤:
S21:使用者通过控制模块将系统调至个性化语音录入模式,并选定对应的编号调出个性化片段区;
S22:使用者说出或播放出需录入的语音片段;
S23:声音提取模块提取外界声音,并转化为电信号发送至智能处理模块;
S24:智能处理模块将语音片段存入至对应的个性化片段区。
优选地:所述S6步骤中,智能处理模块根据检索提取结果进行分析,分析结果与个性化片段区匹配时,将语音片段取代对应的语音数据,后同步发送至语音拼接单元进行拼接。
本发明的有益效果为:
1.本发明通过设置语音拼接单元用于拼接智能处理模块输出的应答语音数据,进而由声纹调节单元调节至设定的声纹,最后通过语音输出模块输出,实现了交互时能够根据交互者声纹识别其身份,并根据设定值合成对应的声纹后输出的目的,解决了交互过程生硬、死板的问题,提升了使用体验。
2.本发明通过设置特征提取单元用于提取输入语音中声纹的特征点,从而便于对声纹进行区分,声纹比对单元用于比对被特征提取单元处理后的波段信号,从而进行可靠的匹配,通过对振幅和频率进行放大处理后再进行匹配,提升了匹配的容错率,保障了可靠性。
3.本发明通过设置语音片段单元用于存储声音提取模块提取的原始语音片段,语音数据单元用于存储处理后待合成的语音数据;其中初始数据区为基础语音存储区,个性化数据区基于不同声纹身份划分用于存储个性化语音数据;个性化语音数据包括符合对应声纹身份使用者的语音数据,如特定的语气助词、使用频率高的词汇、网络热词等,能够面对不同的受众,且更符合用户的交互需求,进一步提升使用体验。
4.本发明通过设置自学习模式,能够不断完善交互功能,提升交互效果,与时俱进,尽可能满足了用户需求,通过设置个性化语音录入模式,能够便于录入亲朋好友的语音片段,并运用与语音交互中,进一步加强了使用体验。
附图说明
图1为本发明提出的一种具有记忆识别功能的自学式老年护理机器人系统的框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;特征提取单元用于提取输入语音中声纹的特征点,从而便于对声纹进行区分,声纹比对单元用于比对被特征提取单元处理后的波段信号,从而进行可靠的匹配,所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块;语音存储模块用于储存语音信息,声纹存储模块用于存储声纹信息,使得声纹对比单元能够依据声纹信息进行可靠的匹配,所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元;语音拼接单元用于拼接智能处理模块输出的应答语音数据,进而由声纹调节单元调节至设定的声纹,最后通过语音输出模块输出,实现了交互时能够根据交互者声纹识别其身份,并根据设定值合成对应的声纹后输出的目的,解决了交互过程生硬、死板的问题,提升了使用体验。
所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区;语音片段单元用于存储声音提取模块提取的原始语音片段,语音数据单元用于存储处理后待合成的语音数据;其中初始数据区为基础语音存储区,个性化数据区基于不同声纹身份划分用于存储个性化语音数据;个性化语音数据包括符合对应声纹身份使用者的语音数据,如特定的语气助词、使用频率高的词汇、网络热词等。
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
实施例2:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元,所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块,所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元。
所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区。
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
实施例3:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元,所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块,所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元。
所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区。
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能,且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区。
所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤:
S21:使用者通过控制模块将系统调至个性化语音录入模式,并选定对应的编号调出个性化片段区;
S22:使用者说出或播放出需录入的语音片段;
S23:声音提取模块提取外界声音,并转化为电信号发送至智能处理模块;
S24:智能处理模块将语音片段存入至对应的个性化片段区。
所述S6步骤中,智能处理模块根据检索提取结果进行分析,分析结果与个性化片段区匹配时,将语音片段取代对应的语音数据,后同步发送至语音拼接单元进行拼接。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块;所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元;所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区;
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互;
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络,所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能,且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区,所述S6步骤中,智能处理模块根据检索提取结果进行分析,分析结果与个性化片段区匹配时,将语音片段取代对应的语音数据,后同步发送至语音拼接单元进行拼接。
2.根据权利要求1所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
3.根据权利要求2所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
4.根据权利要求3所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
5.根据权利要求4所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤:
S21:使用者通过控制模块将系统调至个性化语音录入模式,并选定对应的编号调出个性化片段区;
S22:使用者说出或播放出需录入的语音片段;
S23:声音提取模块提取外界声音,并转化为电信号发送至智能处理模块;
S24:智能处理模块将语音片段存入至对应的个性化片段区。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010769286.5A CN111805558B (zh) | 2020-08-03 | 2020-08-03 | 一种具有记忆识别功能的自学式老年护理机器人系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010769286.5A CN111805558B (zh) | 2020-08-03 | 2020-08-03 | 一种具有记忆识别功能的自学式老年护理机器人系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111805558A CN111805558A (zh) | 2020-10-23 |
CN111805558B true CN111805558B (zh) | 2021-10-08 |
Family
ID=72863515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010769286.5A Active CN111805558B (zh) | 2020-08-03 | 2020-08-03 | 一种具有记忆识别功能的自学式老年护理机器人系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111805558B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962217A (zh) * | 2018-07-28 | 2018-12-07 | 华为技术有限公司 | 语音合成方法及相关设备 |
CN109147800A (zh) * | 2018-08-30 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 应答方法和装置 |
CN109129509A (zh) * | 2018-09-17 | 2019-01-04 | 金碧地智能科技(珠海)有限公司 | 一种基于屏幕智能交互的养老陪护机器人 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10134400B2 (en) * | 2012-11-21 | 2018-11-20 | Verint Systems Ltd. | Diarization using acoustic labeling |
-
2020
- 2020-08-03 CN CN202010769286.5A patent/CN111805558B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962217A (zh) * | 2018-07-28 | 2018-12-07 | 华为技术有限公司 | 语音合成方法及相关设备 |
CN109147800A (zh) * | 2018-08-30 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 应答方法和装置 |
CN109129509A (zh) * | 2018-09-17 | 2019-01-04 | 金碧地智能科技(珠海)有限公司 | 一种基于屏幕智能交互的养老陪护机器人 |
Also Published As
Publication number | Publication date |
---|---|
CN111805558A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8712774B2 (en) | Systems and methods for generating a hybrid text string from two or more text strings generated by multiple automated speech recognition systems | |
US20180308487A1 (en) | Dialogue System Incorporating Unique Speech to Text Conversion Method for Meaningful Dialogue Response | |
US6751595B2 (en) | Multi-stage large vocabulary speech recognition system and method | |
US7089184B2 (en) | Speech recognition for recognizing speaker-independent, continuous speech | |
EP1282113B1 (en) | Method for detecting emotions from speech using speaker identification | |
US6119086A (en) | Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens | |
EP0549265A2 (en) | Neural network-based speech token recognition system and method | |
CN106157956A (zh) | 语音识别的方法及装置 | |
EP1204091A3 (en) | A system and method of pattern recognition in very high-dimensional space | |
JPS58130393A (ja) | 音声認識装置 | |
CN102404278A (zh) | 一种基于声纹识别的点歌系统及其应用方法 | |
EP1022725A1 (en) | Selection of acoustic models using speaker verification | |
CN110428853A (zh) | 语音活性检测方法、语音活性检测装置以及电子设备 | |
JP4408490B2 (ja) | データベース照会を実行する方法及びその装置 | |
WO2004049308A1 (en) | Speech recognition device and method | |
CN109065026B (zh) | 一种录音控制方法及装置 | |
CN111805558B (zh) | 一种具有记忆识别功能的自学式老年护理机器人系统 | |
JP5723711B2 (ja) | 音声認識装置および音声認識プログラム | |
CN108091336A (zh) | 辅助练习普通话的智能机器人 | |
EP0177854A1 (en) | Keyword recognition system using template-concatenation model | |
CN106971734A (zh) | 一种可根据模型的提取频率训练识别模型的方法及系统 | |
JP3727436B2 (ja) | 音声原稿最適照合装置および方法 | |
Lashkari et al. | NMF-based cepstral features for speech emotion recognition | |
CA2597826C (en) | Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance | |
JPH06175698A (ja) | 音声検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |