CN111805558B - 一种具有记忆识别功能的自学式老年护理机器人系统 - Google Patents

一种具有记忆识别功能的自学式老年护理机器人系统 Download PDF

Info

Publication number
CN111805558B
CN111805558B CN202010769286.5A CN202010769286A CN111805558B CN 111805558 B CN111805558 B CN 111805558B CN 202010769286 A CN202010769286 A CN 202010769286A CN 111805558 B CN111805558 B CN 111805558B
Authority
CN
China
Prior art keywords
voice
voiceprint
module
unit
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010769286.5A
Other languages
English (en)
Other versions
CN111805558A (zh
Inventor
彭志峰
彭水平
孙伟红
刘少科
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen As Technology Co ltd
Original Assignee
Shenzhen As Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen As Technology Co ltd filed Critical Shenzhen As Technology Co ltd
Priority to CN202010769286.5A priority Critical patent/CN111805558B/zh
Publication of CN111805558A publication Critical patent/CN111805558A/zh
Application granted granted Critical
Publication of CN111805558B publication Critical patent/CN111805558B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J11/00Manipulators not otherwise provided for
    • B25J11/008Manipulators for service tasks
    • B25J11/009Nursing, e.g. carrying sick persons, pushing wheelchairs, distributing drugs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Nursing (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Manipulator (AREA)

Abstract

本发明公开了一种具有记忆识别功能的自学式老年护理机器人系统,涉及老年护理机器人领域;为了提升交互体验;具体包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;所述语音库包括语音存储模块、声纹存储模块和检索模块。本发明通过设置语音拼接单元用于拼接智能处理模块输出的应答语音数据,进而由声纹调节单元调节至设定的声纹,最后通过语音输出模块输出,实现了交互时能够根据交互者声纹识别其身份,并根据设定值合成对应的声纹后输出的目的,解决了交互过程生硬、死板的问题,提升了使用体验。

Description

一种具有记忆识别功能的自学式老年护理机器人系统
技术领域
本发明涉及老年护理机器人技术领域,尤其涉及一种具有记忆识别功能的自学式老年护理机器人系统。
背景技术
随着科技的进步,人们的生活也不断地朝着智能化发展,在老年护理方面上,也出现了各种老年护理机器人,一般的护理机器人可以实现简单的语音交互,提升使用趣味性,但目前的护理机器人虽具备语音交互功能,但交互过程较为生硬,并不能满足老年人的交流需求,影响使用体验。
经检索,中国专利申请号为201610596044.4的专利,公开了一种具有自学习功能的智能机器人及其自学习方法,包括异常问题识别系统、异常问题统计系统、异常问题次数比较系统、数据库以及控制器:异常问题识别系统用于将顾客所提问的问题与数据库中存在的问题进行相似度对比,如果数据库中不存在与顾客所提问的问题相似或相同的问题,则将顾客所提问的问题标示为异常问题;上述专利中的智能机器人存在以下不足:该智能机器人虽具备一定的自学习功能,但是,不能够针对不同的受众来实现个性化交互,导致答复颇为生硬,影响使用体验。
发明内容
本发明的目的是为了解决现有技术中存在的缺点,而提出的一种具有记忆识别功能的自学式老年护理机器人系统。
为了实现上述目的,本发明采用了如下技术方案:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块;所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元。
优选地:所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区。
优选地:所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
优选地:所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
优选地:所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
优选地:所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
优选地:所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
优选地:所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能,且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区。
优选地:所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤:
S21:使用者通过控制模块将系统调至个性化语音录入模式,并选定对应的编号调出个性化片段区;
S22:使用者说出或播放出需录入的语音片段;
S23:声音提取模块提取外界声音,并转化为电信号发送至智能处理模块;
S24:智能处理模块将语音片段存入至对应的个性化片段区。
优选地:所述S6步骤中,智能处理模块根据检索提取结果进行分析,分析结果与个性化片段区匹配时,将语音片段取代对应的语音数据,后同步发送至语音拼接单元进行拼接。
本发明的有益效果为:
1.本发明通过设置语音拼接单元用于拼接智能处理模块输出的应答语音数据,进而由声纹调节单元调节至设定的声纹,最后通过语音输出模块输出,实现了交互时能够根据交互者声纹识别其身份,并根据设定值合成对应的声纹后输出的目的,解决了交互过程生硬、死板的问题,提升了使用体验。
2.本发明通过设置特征提取单元用于提取输入语音中声纹的特征点,从而便于对声纹进行区分,声纹比对单元用于比对被特征提取单元处理后的波段信号,从而进行可靠的匹配,通过对振幅和频率进行放大处理后再进行匹配,提升了匹配的容错率,保障了可靠性。
3.本发明通过设置语音片段单元用于存储声音提取模块提取的原始语音片段,语音数据单元用于存储处理后待合成的语音数据;其中初始数据区为基础语音存储区,个性化数据区基于不同声纹身份划分用于存储个性化语音数据;个性化语音数据包括符合对应声纹身份使用者的语音数据,如特定的语气助词、使用频率高的词汇、网络热词等,能够面对不同的受众,且更符合用户的交互需求,进一步提升使用体验。
4.本发明通过设置自学习模式,能够不断完善交互功能,提升交互效果,与时俱进,尽可能满足了用户需求,通过设置个性化语音录入模式,能够便于录入亲朋好友的语音片段,并运用与语音交互中,进一步加强了使用体验。
附图说明
图1为本发明提出的一种具有记忆识别功能的自学式老年护理机器人系统的框架图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
实施例1:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;特征提取单元用于提取输入语音中声纹的特征点,从而便于对声纹进行区分,声纹比对单元用于比对被特征提取单元处理后的波段信号,从而进行可靠的匹配,所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块;语音存储模块用于储存语音信息,声纹存储模块用于存储声纹信息,使得声纹对比单元能够依据声纹信息进行可靠的匹配,所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元;语音拼接单元用于拼接智能处理模块输出的应答语音数据,进而由声纹调节单元调节至设定的声纹,最后通过语音输出模块输出,实现了交互时能够根据交互者声纹识别其身份,并根据设定值合成对应的声纹后输出的目的,解决了交互过程生硬、死板的问题,提升了使用体验。
所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区;语音片段单元用于存储声音提取模块提取的原始语音片段,语音数据单元用于存储处理后待合成的语音数据;其中初始数据区为基础语音存储区,个性化数据区基于不同声纹身份划分用于存储个性化语音数据;个性化语音数据包括符合对应声纹身份使用者的语音数据,如特定的语气助词、使用频率高的词汇、网络热词等。
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
实施例2:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元,所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块,所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元。
所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区。
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
实施例3:
一种具有记忆识别功能的自学式老年护理机器人系统,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元,所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块,所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元。
所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区。
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互。
所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络。
所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能,且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区。
所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤:
S21:使用者通过控制模块将系统调至个性化语音录入模式,并选定对应的编号调出个性化片段区;
S22:使用者说出或播放出需录入的语音片段;
S23:声音提取模块提取外界声音,并转化为电信号发送至智能处理模块;
S24:智能处理模块将语音片段存入至对应的个性化片段区。
所述S6步骤中,智能处理模块根据检索提取结果进行分析,分析结果与个性化片段区匹配时,将语音片段取代对应的语音数据,后同步发送至语音拼接单元进行拼接。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (5)

1.一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,包括语音输入部、语音输出部、具有更改工作模式功能的控制模块和语音库,所述语音输入部包括声音提取模块、声音处理模块和声纹分析模块,声纹分析模块包括特征提取单元和声纹比对单元;所述语音库包括语音存储模块、声纹存储模块和检索模块,老年护理机器人系统还包括用于理解语音输入部输入语音语义以及从检索模块的检索结果中筛选出对应应答语音数据的智能处理模块;所述语音输出部包括语音合成模块和语音输出模块,所述语音合成模块包括语音拼接单元和声纹调节单元;所述语音存储模块包括语音片段单元和语音数据单元,语音片段单元内基于声纹身份划分有对应的个性化片段区,语音数据单元包括初始数据区和个性化数据区;
所述工作模式包括交互模式、自学习模式和个性化语音录入模式;所述交互模式的交互流程依次包括下列步骤:
S1:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S2:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S3:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S4:智能处理模块对语音语义进行分析,并向检索模块发出检索指令;
S5:检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行检索;
S6:智能处理模块对检索结果进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S7:语音输出模块将调节后的语音输出,完成交互;
所述老年护理机器人系统还包括网络交互模块,网络交互模块包括数据搜索单元和数据处理单元;网络交互模块与控制模块电信号连接,且网络交互模块的信号输入端接入5G网络,所述护理机器人系统的控制模块提供根据声纹身份进行编号设定的功能,且基于设定的编号通过控制模块直接调试至该编号对应的个性化数据区和个性化片段区,所述S6步骤中,智能处理模块根据检索提取结果进行分析,分析结果与个性化片段区匹配时,将语音片段取代对应的语音数据,后同步发送至语音拼接单元进行拼接。
2.根据权利要求1所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述特征提取单元将输入语音中声纹的特征点进行放大时,先取电信号振幅平均值,提取振幅大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点一,再取电信号频率平均值,提取频率大于平均值1.5倍或小于平均值0.5倍的波段,将该波段提取作为特征点二,声纹比对单元依据特征点一和特征点二与声纹存储模块中存储的声纹进行比对。
3.根据权利要求2所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述S5步骤中,搜索单元对检索库进行检索,检索失败时进行联网查询,其具体步骤为:
S51:智能处理模块根据语音输入部输入的语音分析语义,并通过数据搜索单元通过5G联网搜索应答语句,
S52:数据处理单元对搜索结果进行处理,并将处理后的数据传输至智能处理模块,
S53:智能处理模块对数据信息进行提取,并传输至语音拼接单元进行拼接,声纹调节单元基于用户声纹信息,按照其匹配的设定值进行个性化声纹调节;
S54:语音输出模块将调节后的语音输出,完成交互。
4.根据权利要求3所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述自学习模式的自学习流程依次包括下列步骤:
S11:使用者通过控制模块将系统调至自学习模式;
S12:声音提取模块提取外界声音,并转化为电信号发送至声音处理模块;
S13:声音处理模块对声音进行降噪处理,清除非连续性声纹,将处理后的语音传送至智能处理模块和声纹分析模块;
S14:声纹分析模块对声纹进行分析,并通过声纹比对单元与声纹存储模块中的声纹信息进行匹配;
S15:智能处理模块对语音语义进行分析,得出分析结果,通过检索模块的声纹匹配单元识别匹配信息,并选择与其身份对应的个性化数据区和初始数据区一并作为检索库,若匹配不成功则仅选择初始数据区作为检索库,搜索单元对检索库进行同步检索;
S16:检索结果若未能检索到匹配的分析结果,则智能处理模块将对应语音数据录入语音存储模块中;若检索到匹配的分析结果,则不予存储。
5.根据权利要求4所述的一种具有记忆识别功能的自学式老年护理机器人系统,其特征在于,所述个性化语音录入模式的个性化语音录入流程依次包括下列步骤:
S21:使用者通过控制模块将系统调至个性化语音录入模式,并选定对应的编号调出个性化片段区;
S22:使用者说出或播放出需录入的语音片段;
S23:声音提取模块提取外界声音,并转化为电信号发送至智能处理模块;
S24:智能处理模块将语音片段存入至对应的个性化片段区。
CN202010769286.5A 2020-08-03 2020-08-03 一种具有记忆识别功能的自学式老年护理机器人系统 Active CN111805558B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010769286.5A CN111805558B (zh) 2020-08-03 2020-08-03 一种具有记忆识别功能的自学式老年护理机器人系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010769286.5A CN111805558B (zh) 2020-08-03 2020-08-03 一种具有记忆识别功能的自学式老年护理机器人系统

Publications (2)

Publication Number Publication Date
CN111805558A CN111805558A (zh) 2020-10-23
CN111805558B true CN111805558B (zh) 2021-10-08

Family

ID=72863515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010769286.5A Active CN111805558B (zh) 2020-08-03 2020-08-03 一种具有记忆识别功能的自学式老年护理机器人系统

Country Status (1)

Country Link
CN (1) CN111805558B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962217A (zh) * 2018-07-28 2018-12-07 华为技术有限公司 语音合成方法及相关设备
CN109147800A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 应答方法和装置
CN109129509A (zh) * 2018-09-17 2019-01-04 金碧地智能科技(珠海)有限公司 一种基于屏幕智能交互的养老陪护机器人

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10134400B2 (en) * 2012-11-21 2018-11-20 Verint Systems Ltd. Diarization using acoustic labeling

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962217A (zh) * 2018-07-28 2018-12-07 华为技术有限公司 语音合成方法及相关设备
CN109147800A (zh) * 2018-08-30 2019-01-04 百度在线网络技术(北京)有限公司 应答方法和装置
CN109129509A (zh) * 2018-09-17 2019-01-04 金碧地智能科技(珠海)有限公司 一种基于屏幕智能交互的养老陪护机器人

Also Published As

Publication number Publication date
CN111805558A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
US8712774B2 (en) Systems and methods for generating a hybrid text string from two or more text strings generated by multiple automated speech recognition systems
US20180308487A1 (en) Dialogue System Incorporating Unique Speech to Text Conversion Method for Meaningful Dialogue Response
US6751595B2 (en) Multi-stage large vocabulary speech recognition system and method
US7089184B2 (en) Speech recognition for recognizing speaker-independent, continuous speech
EP1282113B1 (en) Method for detecting emotions from speech using speaker identification
US6119086A (en) Speech coding via speech recognition and synthesis based on pre-enrolled phonetic tokens
EP0549265A2 (en) Neural network-based speech token recognition system and method
CN106157956A (zh) 语音识别的方法及装置
EP1204091A3 (en) A system and method of pattern recognition in very high-dimensional space
JPS58130393A (ja) 音声認識装置
CN102404278A (zh) 一种基于声纹识别的点歌系统及其应用方法
EP1022725A1 (en) Selection of acoustic models using speaker verification
CN110428853A (zh) 语音活性检测方法、语音活性检测装置以及电子设备
JP4408490B2 (ja) データベース照会を実行する方法及びその装置
WO2004049308A1 (en) Speech recognition device and method
CN109065026B (zh) 一种录音控制方法及装置
CN111805558B (zh) 一种具有记忆识别功能的自学式老年护理机器人系统
JP5723711B2 (ja) 音声認識装置および音声認識プログラム
CN108091336A (zh) 辅助练习普通话的智能机器人
EP0177854A1 (en) Keyword recognition system using template-concatenation model
CN106971734A (zh) 一种可根据模型的提取频率训练识别模型的方法及系统
JP3727436B2 (ja) 音声原稿最適照合装置および方法
Lashkari et al. NMF-based cepstral features for speech emotion recognition
CA2597826C (en) Method, software and device for uniquely identifying a desired contact in a contacts database based on a single utterance
JPH06175698A (ja) 音声検索装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant