CN107331388A - 一种基于养老机器人的方言收集系统 - Google Patents

一种基于养老机器人的方言收集系统 Download PDF

Info

Publication number
CN107331388A
CN107331388A CN201710453084.8A CN201710453084A CN107331388A CN 107331388 A CN107331388 A CN 107331388A CN 201710453084 A CN201710453084 A CN 201710453084A CN 107331388 A CN107331388 A CN 107331388A
Authority
CN
China
Prior art keywords
old man
voice
unit
dialect
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710453084.8A
Other languages
English (en)
Inventor
潘晓明
彭罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CHONGQING YOUBAN SCIENCE & TECHNOLOGY Co Ltd
Original Assignee
CHONGQING YOUBAN SCIENCE & TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CHONGQING YOUBAN SCIENCE & TECHNOLOGY Co Ltd filed Critical CHONGQING YOUBAN SCIENCE & TECHNOLOGY Co Ltd
Priority to CN201710453084.8A priority Critical patent/CN107331388A/zh
Publication of CN107331388A publication Critical patent/CN107331388A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0631Creating reference templates; Clustering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • G10L2015/0638Interactive procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明涉及养老机器人技术领域,具体涉及一种基于养老机器人的方言收集系统,包括位于机器人本体内的数据处理模块,所述数据处理模块包括微控制器、语音收集单元、扬声器、匹配单元和存储单元,先由语音收集单元记录下老人诵读文章或词组词语的语音信息,语音收集单元将语音信息传递给微控制器,微控制器识别语音信息中的词汇并向匹配单元传递匹配信号,匹配单元对存储单元中的普通话词汇进行配对,配对成功后,匹配单元向微控制器传递播放信号,微控制器向扬声器传递启动信号,扬声器处播放出与方言对应的普通话。本发明让照顾老人的护工能够明白老人的话语,也能让与老人交流的让明白老人的意思,改善老人的社交情况,减少老人的孤独感。

Description

一种基于养老机器人的方言收集系统
技术领域
本发明涉及养老机器人技术领域,具体涉及一种基于养老机器人的方言收集系统。
背景技术
我国已成为世界上老年人口最多的国家,也是人口老龄化发展速度最快的国家之一,老年人口数量巨大,主要通过三种方式赡养老年人:一是老年人与子女共同居住的家庭养老,二是老年人在敬老院等的养老机构居住,由护工进行照料;三是老人独自居住,子女给予一定钱财物资或靠邻居照料,所以养老问题越来越突出。
而且人体的各项机能随着年龄的增大而逐渐下降,老年人因为头脑反应较为迟缓而使语言的逻辑差,再加上有的老人没有了牙齿说话漏风,或者戴着假牙说话,导致老人说话口齿不清。老年人普遍都有家乡情结,老人在说话时不再愿意迁就他人而说普通话,而是说自己比较熟悉的家乡的方言,养老过程中的这种语言问题普遍存在。
现有的养老机器人主要功能是智能看护、亲情互动和远程医疗等,而在护工照顾老人时,需要问明白老人各方面的需求,如果护工不是和老人来自同一个地方,护工通常无法准确了解老人的需求,这种情况通常是靠护工多问几遍老人,再加上护工的猜测才能理解老人的话语,老人在与他人交流时不能被人理解,导致老人与他人的交流存在巨大的障碍,让老人更孤独,让养老过程中的语言问题转变成了沟通问题。
所以基于上述情况,现在急需一种能够识别老人话语中方言的机器人,让护工或与老人交流的人能够懂得老人的言语,以改善老人的社交情况。
发明内容
本发明意在提供一种帮助护工听懂老人言语的基于养老机器人的方言收集系统。
本方案中的基于养老机器人的方言收集系统,包括位于机器人本体上的数据处理模块,所述数据处理模块包括微控制器、语音收集单元、扬声器、匹配单元和存储单元:
微控制器,用于识别所述语音收集单元中老人戴假牙语音和不戴假牙语音信息中的方言词汇,并根据识别出的方言词汇向匹配单元传递匹配信号,还用于根据匹配单元的播放信号向扬声器传递启动信号;
语音收集单元,用于多次采集老人在戴假牙和不戴假牙时诵读的语音并传递给所述微控制器;
扬声器,用于根据所述微控制器的语音信号进行提示音和朗读音的播放;
匹配单元,用于根据微控制器的匹配信号将语音收集到的方言词汇与所述存储单元中的普通话词汇进行匹配,并在匹配完成后向微控制器传递播放信号;
存储单元,用于储存多种方言词汇,并在存储单元中设置与方言词汇对应的普通话词汇。
本方案的工作原理及有益效果是,先将固定的词组词语让老人以方言进行诵读,由语音收集单元记录下老人诵读的语音信息,语音收集单元将语音信息传递给微控制器,微控制器识别语音信息中的词汇并向匹配单元传递匹配信号,匹配单元将收集得到的词汇与存储单元中的普通话词汇进行配对,配对成功后,匹配单元向微控制器传递播放信号,由微控制器向扬声器传递启动信号,从扬声器处播放出与方言对应的普通话。
在语音收集单元记录老人诵读词组词语的语音时,先让同一口音的无牙且未戴假牙的老人进行诵读,获得固定词组词语的无牙漏风的方言口音,然后再让同一口音的戴假牙的老人进行诵读,获得固定词组词语的戴假牙的方言口音,并将两种情况下的方言口音与存储单元中的普通话词汇进行匹配,匹配成功后直接从扬声器处读出该方言的普通话词汇。
采集了老人无牙漏风和戴假牙情况下的话语信息,从话语信息中采集出难以被人理解的方言词语,给照顾老人的护工提供了理解老人话语的参照,使老人的话语能更容易被周围的听懂,方便护工了解老人的需求以便于照顾老人,方便老人与他人的交流。
当老人的日常生活中说话时,由语音收集单元获得老人话语中的关键词,然后在匹配成功后从扬声器读出方言词汇对应的普通话词汇,让照顾老人的护工能够明白老人的话语,也能让与老人交流的让明白老人的意思,改善老人的社交情况,减少老人的孤独感。
进一步,还包括用于识别语音中词语的情绪信息的语音识别单元。
由于一些方言词语在不同的情感状况下代表不同的语义,通过语音识别单元识别出老人话语中关键词汇的情感,以更容易获得老人的方言词语,让解读老人方言理解老人意图更准确,避免因为误解老人的意图而对老人照顾的不周到。
进一步,还包括情绪标签单元,所述情绪标签单元用于根据语音识别单元给词语添加情绪信息,所述情绪标签单元中集成有用于发送添加了情绪标签后词语的发射单元。
将识别出的老人话语中的方言词语加上一定的情绪标签,并将添加了情绪标签后的词语发射出去以便于储存,添加了情绪标签后的词语方便在老人的不同心情状况下准确匹配出方言的普通话词语,让他人更清楚老人的需求或表达的情绪,让老人得到更好的照顾。
进一步,还包括服务器,所述服务器用于存储添加了情绪标签后的词语,所述服务器无线接收来自发射单元的添加了标签后的词语。
服务器将添加了情绪标签后词语收集起来,方便分析不同语境情况下的方言对应的普通话,以给语音的分析提供依据,使方言也能记录入库,使语言文化的收录更有依据。
进一步,还包括用于储存来自匹配单元匹配失败的方言词汇的学习模块,所述学习模块中设置有匹配失败的方言词汇对应的普通话词语。
针对老人言语中未被记录到的方言词汇,在匹配失败后,储存该未被收录到的方言词汇,使方言词汇的记录更完善,让他人更容易理解老人的话语,方便老人的交流,该学习模块让养老机器人学习一定的方言词汇,更智能。
进一步,所述学习模块中集成有无线发射单元,所述无线发射单元用于无线发送所述学习模块中匹配失败的词语。
学习模块收集到老人言语中的方言词汇后再发送给后台,可方便对方言词汇的收录,让语言文化更丰富,也方便学者对语言的考证。
附图说明
图1为本发明实施例的示意性框图。
具体实施方式
下面通过具体实施方式对本发明作进一步详细的说明。
基于养老机器人的方言收集系统如图1所示:包括设置在机器人本体上的数据处理模块,数据处理模块中的语音收集单元用于收集老人的带方言的语音信息,语音识别单元用于识别语音信息中方言词语的被说出时的情绪,例如情绪可以是“欢喜”、“悲伤”、“愤怒”或“惊奇”,微控制器对语音信息中的关键词汇进行识别并向匹配单元发送匹配信号,由匹配单元将识别出的方言词语与存储单元中的普通话词语进行匹配, 当匹配成功时,匹配单元向微控制器传递播放信号,由微控制器向扬声器传递启动信号,该启动信号是音频信号,由扬声器播放出方言词语匹配后对应的普通话词语。
当语音识别单元识别出某个方言词语具有情绪时,由情绪标签单元给该方言词语加上情绪标签,例如四川方言中的“等哈儿”在普通话中表示“等一会儿”的意思,方言词语中的“等哈儿”可以根据老人的语气判断出“愤怒”的情绪,可以根据老人的语气判断出“高兴”的情绪。
当方言词语被标上情绪标签后,由情绪标签单元内置的发射单元将添加了情绪标签后的方言词语通过无线网络传递给服务器,由服务器储存带情绪的方言词汇。
当方言与存储单元中普通话词汇匹配失败后,匹配单元向微控制器传递学习信号,将匹配失败的方言词语传递给学习模块,并在学习模块中设置匹配失败后的方言词语对应的普通话词语。
给老人一段文章或词语词组让老人以自己的方言进行诵读,通过语音收集单元收集老人诵读时的语音,如可读报纸,或者收集的日常生活中常用到的词语词组。
在让老人诵读一段文章或词语词组时,先对没有牙齿且未戴假牙的老人的诵读语音进行收集,再对戴假牙的老人的诵读语音进行收集,在对比没有牙齿且未戴假牙和戴假牙的老人的方言语音时,老人都具有同样的口音,即老人来自同一个地方,由语音收集单元分别对这两种情况下的语音信息进行收集,并将两种方言口音与存储单元中的普通话词汇进行匹配,匹配成功后从扬声器播放出该方言的普通话词汇,当匹配失败时,将方言词汇传送给服务器存放。
多数学者认为人们的情绪一般包括六种基本的情绪:快乐、兴趣、厌恶、恐惧、痛苦(悲伤)和愤怒,人的语音中一般有四种情绪:中性、快乐、悲伤和愤怒,在语音识别单元识别语音信息中词语被老人说出时的情绪信息时,例如重庆方言中“千翻儿”对着小孩子被说出时可代表老人“快乐”的情绪,也可以代表老人“愤怒”的情绪。
语音具有以下的韵律特征,音量、能量和语速等,例如当语速较快,能量增大,音量较大时,表示“快乐”;当语速缓慢,能量较为平静,音量较小时,通常表示悲伤;当语速很快,能量提高很多,当方言词语“千翻儿”分别表现出“快乐”和“愤怒”的情绪时,根据词语“千翻儿”发出的音的语速、能量和音量判断词语代表的情绪。
对老人的方言进行收集并读出该方言对应的普通话,让老人周围的人及护工了解老人的话语,使他人清楚老人的需求,让老人得到更好的照顾。
对没有牙齿且未戴假牙的老人和戴假牙的老人的方言进行收集,并得到该方言词语对应的普通话词语,方便理解老人的话语,使老人的需求更容易得到满足,让老人生活更舒适。
以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims (6)

1.一种基于养老机器人的方言收集系统,其特征在于,包括位于机器人本体上的数据处理模块,所述数据处理模块包括微控制器、语音收集单元、扬声器、匹配单元和存储单元:
微控制器,用于识别所述语音收集单元中老人戴假牙语音和不戴假牙语音信息中的方言词汇,并根据识别出的方言词汇向匹配单元传递匹配信号,还用于根据匹配单元的播放信号向扬声器传递启动信号;
语音收集单元,用于多次采集老人在戴假牙和不戴假牙时诵读的语音并传递给所述微控制器;
扬声器,用于根据所述微控制器的语音信号进行提示音和朗读音的播放;
匹配单元,用于根据微控制器的匹配信号将语音收集到的方言词汇与所述存储单元中的普通话词汇进行匹配,并在匹配完成后向微控制器传递播放信号;
存储单元,用于储存多种方言词汇,并在存储单元中设置与方言词汇对应的普通话词汇。
2.根据权利要求1所述的基于养老机器人的方言收集系统,其特征在于:还包括用于识别语音中词语的情绪信息的语音识别单元。
3.根据权利要求2所述的基于养老机器人的方言收集系统,其特征在于:还包括情绪标签单元,所述情绪标签单元用于根据语音识别单元给词语添加情绪信息,所述情绪标签单元中集成有用于发送添加了情绪标签后词语的发射单元。
4.根据权利要求2所述的基于养老机器人的方言收集系统,其特征在于:还包括服务器,所述服务器用于存储添加了情绪标签后的词语,所述服务器无线接收来自发射单元的添加了标签后的词语。
5.根据权利要求1所述的基于养老机器人的方言收集系统,其特征在于:还包括用于储存来自匹配单元匹配失败的方言词汇的学习模块,所述学习模块中设置有匹配失败的方言词汇对应的普通话词语。
6.根据权利要求5所述的基于养老机器人的方言收集系统,其特征在于:所述学习模块中集成有无线发射单元,所述无线发射单元用于无线发送所述学习模块中匹配失败的词语。
CN201710453084.8A 2017-06-15 2017-06-15 一种基于养老机器人的方言收集系统 Pending CN107331388A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710453084.8A CN107331388A (zh) 2017-06-15 2017-06-15 一种基于养老机器人的方言收集系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710453084.8A CN107331388A (zh) 2017-06-15 2017-06-15 一种基于养老机器人的方言收集系统

Publications (1)

Publication Number Publication Date
CN107331388A true CN107331388A (zh) 2017-11-07

Family

ID=60194937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710453084.8A Pending CN107331388A (zh) 2017-06-15 2017-06-15 一种基于养老机器人的方言收集系统

Country Status (1)

Country Link
CN (1) CN107331388A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112086091A (zh) * 2020-09-18 2020-12-15 南京孝德智能科技有限公司 一种智能化养老服务系统及方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101393740A (zh) * 2008-10-31 2009-03-25 清华大学 一种计算机多方言背景的汉语普通话语音识别的建模方法
CN201403118Y (zh) * 2008-12-12 2010-02-10 康佳集团股份有限公司 具有翻译方言功能的装置和移动终端
CN101751923A (zh) * 2008-12-03 2010-06-23 财团法人资讯工业策进会 语音情绪的分类方法及其情绪语意模型的建立方法
CN102568472A (zh) * 2010-12-15 2012-07-11 盛乐信息技术(上海)有限公司 说话人可选的语音合成系统及其实现方法
CN102930866A (zh) * 2012-11-05 2013-02-13 广州市神骥营销策划有限公司 一种用于口语练习的学生朗读作业的评判方法
CN103455530A (zh) * 2012-10-25 2013-12-18 河南省佰腾电子科技有限公司 随身携带式创建个性化语音对应文本文字数据库的装置
CN103593340A (zh) * 2013-10-28 2014-02-19 茵鲁维夫有限公司 自然表达信息处理方法、处理及回应方法、设备及系统
CN104464724A (zh) * 2014-12-08 2015-03-25 南京邮电大学 一种针对刻意伪装语音的说话人识别方法
CN104715752A (zh) * 2015-04-09 2015-06-17 刘文军 语音识别方法、装置及系统
CN204463573U (zh) * 2015-02-02 2015-07-08 黑龙江商业职业学院 一种新型普通话训练装置
US20150364141A1 (en) * 2014-06-16 2015-12-17 Samsung Electronics Co., Ltd. Method and device for providing user interface using voice recognition
CN105654950A (zh) * 2016-01-28 2016-06-08 百度在线网络技术(北京)有限公司 自适应语音反馈方法和装置
CN105991847A (zh) * 2015-02-16 2016-10-05 北京三星通信技术研究有限公司 通话方法和电子设备
CN106128450A (zh) * 2016-08-31 2016-11-16 西北师范大学 一种汉藏双语跨语言语音转换的方法及其系统
CN106328125A (zh) * 2016-10-28 2017-01-11 许昌学院 一种河南方言语音识别系统
CN106802722A (zh) * 2017-01-13 2017-06-06 河源市汉祖文化科技有限公司 一种基于三笔数码输入法的语音输入方法及系统

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101393740A (zh) * 2008-10-31 2009-03-25 清华大学 一种计算机多方言背景的汉语普通话语音识别的建模方法
CN101751923A (zh) * 2008-12-03 2010-06-23 财团法人资讯工业策进会 语音情绪的分类方法及其情绪语意模型的建立方法
CN201403118Y (zh) * 2008-12-12 2010-02-10 康佳集团股份有限公司 具有翻译方言功能的装置和移动终端
CN102568472A (zh) * 2010-12-15 2012-07-11 盛乐信息技术(上海)有限公司 说话人可选的语音合成系统及其实现方法
CN103455530A (zh) * 2012-10-25 2013-12-18 河南省佰腾电子科技有限公司 随身携带式创建个性化语音对应文本文字数据库的装置
CN102930866A (zh) * 2012-11-05 2013-02-13 广州市神骥营销策划有限公司 一种用于口语练习的学生朗读作业的评判方法
CN103593340A (zh) * 2013-10-28 2014-02-19 茵鲁维夫有限公司 自然表达信息处理方法、处理及回应方法、设备及系统
US20150364141A1 (en) * 2014-06-16 2015-12-17 Samsung Electronics Co., Ltd. Method and device for providing user interface using voice recognition
CN104464724A (zh) * 2014-12-08 2015-03-25 南京邮电大学 一种针对刻意伪装语音的说话人识别方法
CN204463573U (zh) * 2015-02-02 2015-07-08 黑龙江商业职业学院 一种新型普通话训练装置
CN105991847A (zh) * 2015-02-16 2016-10-05 北京三星通信技术研究有限公司 通话方法和电子设备
CN104715752A (zh) * 2015-04-09 2015-06-17 刘文军 语音识别方法、装置及系统
CN105654950A (zh) * 2016-01-28 2016-06-08 百度在线网络技术(北京)有限公司 自适应语音反馈方法和装置
CN106128450A (zh) * 2016-08-31 2016-11-16 西北师范大学 一种汉藏双语跨语言语音转换的方法及其系统
CN106328125A (zh) * 2016-10-28 2017-01-11 许昌学院 一种河南方言语音识别系统
CN106802722A (zh) * 2017-01-13 2017-06-06 河源市汉祖文化科技有限公司 一种基于三笔数码输入法的语音输入方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112086091A (zh) * 2020-09-18 2020-12-15 南京孝德智能科技有限公司 一种智能化养老服务系统及方法

Similar Documents

Publication Publication Date Title
US11580991B2 (en) Speaker based anaphora resolution
CN1655235B (zh) 基于话音特征自动标识电话呼叫者
WO2022057712A1 (zh) 电子设备及其语义解析方法、介质和人机对话系统
CN101105894B (zh) 多功能语言学习机
US11837225B1 (en) Multi-portion spoken command framework
CN107154260A (zh) 一种领域自适应语音识别方法和装置
US10963497B1 (en) Multi-stage query processing
CN112750465A (zh) 一种云端语言能力评测系统及可穿戴录音终端
US11093110B1 (en) Messaging feedback mechanism
CN110047481A (zh) 用于语音识别的方法和装置
CN111192572A (zh) 语义识别的方法、装置及系统
CN111128175B (zh) 口语对话管理方法及系统
Rytting et al. Segmenting words from natural speech: subsegmental variation in segmental cues
CN108364655A (zh) 语音处理方法、介质、装置和计算设备
KR20190032557A (ko) 음성 기반 통신
Bernstein et al. Speech recognition by computer
Patel et al. Development of Large Vocabulary Speech Recognition System with Keyword Search for Manipuri.
CN107331388A (zh) 一种基于养老机器人的方言收集系统
Thennattil et al. Phonetic engine for continuous speech in Malayalam
Rudzionis et al. Comparative analysis of adapted foreign language and native Lithuanian speech recognizers for voice user interface
Nahid et al. Comprehending real numbers: Development of bengali real number speech corpus
CN111489742B (zh) 声学模型训练方法、语音识别方法、装置及电子设备
US11176930B1 (en) Storing audio commands for time-delayed execution
CN110085212A (zh) 一种用于cnc程序控制器的语音识别方法
Seneff The use of subword linguistic modeling for multiple tasks in speech recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171107