CN111899763B - 基于音频分析的护理识别评价方法 - Google Patents

基于音频分析的护理识别评价方法 Download PDF

Info

Publication number
CN111899763B
CN111899763B CN202010702815.XA CN202010702815A CN111899763B CN 111899763 B CN111899763 B CN 111899763B CN 202010702815 A CN202010702815 A CN 202010702815A CN 111899763 B CN111899763 B CN 111899763B
Authority
CN
China
Prior art keywords
service
service type
audio
sound effect
content audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010702815.XA
Other languages
English (en)
Other versions
CN111899763A (zh
Inventor
翟振刚
陆晓英
陈媛
周姝妍
顾哲航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Jiake Intelligent Elderly Care Service Co ltd
Original Assignee
Zhejiang Jiake Intelligent Elderly Care Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Jiake Intelligent Elderly Care Service Co ltd filed Critical Zhejiang Jiake Intelligent Elderly Care Service Co ltd
Priority to CN202010702815.XA priority Critical patent/CN111899763B/zh
Publication of CN111899763A publication Critical patent/CN111899763A/zh
Application granted granted Critical
Publication of CN111899763B publication Critical patent/CN111899763B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于音频分析的护理识别评价方法,包括步骤S1:语音识别器接收待检测的服务播报音频,将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器,以确定后续的服务类型;步骤S2:标志音效分类器接收待检测的服务内容音频,并且输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果。本发明公开的一种基于音频分析的护理识别评价方法,在保护被护理人如失去生活自理能力、患病人员或老年人隐私的前提下,自动监测人工护理服务质量。

Description

基于音频分析的护理识别评价方法
技术领域
本发明属于音频分析处理技术领域,具体涉及一种基于音频分析的护理识别评价方法。
背景技术
现有的护理服务质量通常是由家属、监护人或被护理人打分测得,此评价方式很难客观公正。护理服务的音频含有大量护理行为信息,并且包括被护理人的隐私。
但是现在缺少对护理人员在护理时提供的音频进行分析处理,从而用于自动监测人工护理的服务质量,以此客观公正地评价护理人员的护理行为,此方法的核心部分是行为音频的分析,最接近的技术是非语音音频识别技术,即环境音识别。
公开号为:CN109920448A,主题名称为一种自动驾驶车辆交通环境特种声音的识别系统及方法的发明专利,其技术方案公开了“包括信息采集单元、信息处理单元、声音识别单元、存储单元和控制单元,所述信息采集单元用于采集交通环境声音信号,并将声音信号转化成数字信号,传输给信息处理单元;所述信息处理单元的输入端与信息采集单元相连、输出端与声音识别单元相连,用于处理传输过来的交通环境声音数字信号,检测环境声音数字信号中是否具有的异常声音信号,并提取异常声音段的特征参数,将特征参数传输给声音识别单元;声音识别单元用于识别出声源的运动状态及包括何种特种声音信号;所述存储单元包括声音状态存储区和声音特征参数存储区,分别用于存储声音运动状态和声音特征参数;所述声音识别单元、存储单元分别与控制单元相连,控制单元能够调用存储单元中存储的数据用于训练和更新识别模型”。
以上述发明专利为例,其虽然提及了环境特种声音的识别,但是其无论是技术领域还是技术方案均与本发明不同。因此,针对上述问题,予以进一步改进。
发明内容
本发明的主要目的在于提供基于音频分析的护理识别评价方法,在保护被护理人如失去生活自理能力、患病人员或老年人隐私的前提下,自动监测人工护理服务质量,使得管理人员可以客观、公正、高效的监测人工护理的服务情况,其先确定后续服务的类型,再通过所确定的服务类型进行环境音识别,从而判断服务是否是所播报的服务类型,并评价服务质量。
为达到以上目的,本发明提供一种基于音频分析的护理识别评价方法,用于自动监测人工护理的服务质量,包括以下步骤:
步骤S1:语音识别器接收待检测的服务播报音频,将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器,以确定后续的服务类型(在线系统);
步骤S2:标志音效分类器接收待检测的服务内容音频,并且输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果(离线系统);
步骤S3:对于通过服务类型判决器验证的标志性动作音效数据集,服务类型判决器输出不同类型的标志性动作音效数据集的实际服务类别和服务持续时间(用于评价人工护理的服务质量)。
作为上述技术方案的进一步优选的技术方案,步骤S1具体实施为以下步骤:
步骤S1.1:服务播报音频输入语音识别器;
步骤S1.2:将语音识别器识别获得的文本识别结果输入服务类型匹配器;
步骤S1.3:服务类型匹配器将获得的文本识别结果与数据库中的预先录入的服务类型的文本进行匹配。
作为上述技术方案的进一步优选的技术方案,步骤S1.3具体实施为以下步骤:
步骤S1.3.1:如果文本识别结果与数据库中的服务类型的文本相匹配,则记录反馈信息用于服务分段,并且执行步骤S2(用于离线系统中的服务类型的判决);
步骤S1.3.2:如果文本识别结果与数据库中的服务类型的文本不匹配,则记录未检测到的服务语音播报信息,并且执行步骤S2(用于离线系统中的服务类型的判决)。
作为上述技术方案的进一步优选的技术方案,步骤S2具体实施为以下步骤:
步骤S2.1:生成标志音效分类器并且接收待检测的服务内容音频;
步骤S2.2:输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果。
作为上述技术方案的进一步优选的技术方案,步骤S2.1具体实施为以下步骤(标志音效分类器的生成):
步骤S2.1.1:经标准化程序采集得到的服务内容音频先由人工进行服务类型分类,以生成若干类(优选为L类)不同类型的服务内容音频数据集(通过幅度动态标准化和声道、量化位数的统一得到标准化的不同类型的服务内容音频数据集);
步骤S2.1.2:在其中一类服务内容音频数据集中标注出人耳可辨识的标志性动作音效(标志性工作音效的类型与标志性动作音效数据集的类型相同),以获得若干类不同类型(优选为K类)的标志性动作音效数据集(在标准化音频中通过语音活动检测得到语音播报音频的候选音频短片段,通过语音识别器和特定语音播报筛选得到服务起始点(即首先开始的标志性动作音效),将音频分割成若干服务音频段落,即若干类不同类型(优选为K类)的标志性动作音效数据集);
步骤S2.1.3:标志性动作音效所对应的环境识别器通过标志性动作音效数据集设计、训练和评估,(经过设计、训练和评估的环境识别器)以生成与标志性动作音效数据集相同数量类型的标志音效分类器(优选为K类)。
作为上述技术方案的进一步优选的技术方案,步骤S2.2具体实施为以下步骤(服务类型判决器的生成):
步骤S2.2.1:将设计、训练和评估完成的(K类)标志音效分类器重新作用于服务内容音频数据集;
步骤S2.2.2:被重新作用的服务内容音频数据集用于设计、训练和评估服务类型分类器,(经过设计、训练和评估的服务类型分类器)以生成最终的服务类型判决器;
步骤S2.2.3:最终的服务类型判决器获得最终的服务内容音频所属的服务类型的判决结果。
具体实施方式
以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
在本发明的优选实施例中,本领域技术人员应注意,本发明所涉及的K类、L类(即代表一定数量)等可被视为现有技术。
优选实施例。
本发明公开了一种基于音频分析的护理识别评价方法,用于自动监测人工护理的服务质量,包括以下步骤:
步骤S1:语音识别器接收待检测的服务播报音频,将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器,以确定后续的服务类型(在线系统);
步骤S2:标志音效分类器接收待检测的服务内容音频,并且输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果(离线系统);
步骤S3:对于通过服务类型判决器验证的标志性动作音效数据集,服务类型判决器输出不同类型的标志性动作音效数据集的实际服务类别和服务持续时间(用于评价人工护理的服务质量)。
具体的是,步骤S1具体实施为以下步骤:
步骤S1.1:服务播报音频输入语音识别器;
步骤S1.2:将语音识别器识别获得的文本识别结果输入服务类型匹配器;
步骤S1.3:服务类型匹配器将获得的文本识别结果与数据库中的预先录入的服务类型的文本进行匹配。
更具体的是,步骤S1.3具体实施为以下步骤:
步骤S1.3.1:如果文本识别结果与数据库中的服务类型的文本相匹配,则记录反馈信息用于服务分段,并且执行步骤S2(用于离线系统中的服务类型的判决);
步骤S1.3.2:如果文本识别结果与数据库中的服务类型的文本不匹配,则记录未检测到的服务语音播报信息,并且执行步骤S2(用于离线系统中的服务类型的判决)。
进一步的是,步骤S2具体实施为以下步骤:
步骤S2.1:生成标志音效分类器并且接收待检测的服务内容音频;
步骤S2.2:输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果。
更进一步的是,步骤S2.1具体实施为以下步骤(标志音效分类器的生成):
步骤S2.1.1:经标准化程序采集得到的服务内容音频先由人工进行服务类型分类,以生成若干类(优选为L类)不同类型的服务内容音频数据集(通过幅度动态标准化和声道、量化位数的统一得到标准化的不同类型的服务内容音频数据集);
步骤S2.1.2:在其中一类服务内容音频数据集中标注出人耳可辨识的标志性动作音效(标志性工作音效的类型与标志性动作音效数据集的类型相同),以获得若干类不同类型(优选为K类)的标志性动作音效数据集(在标准化音频中通过语音活动检测得到语音播报音频的候选音频短片段,通过语音识别器和特定语音播报筛选得到服务起始点(即首先开始的标志性动作音效),将音频分割成若干服务音频段落,即若干类不同类型(优选为K类)的标志性动作音效数据集);
步骤S2.1.3:标志性动作音效所对应的环境识别器通过标志性动作音效数据集设计、训练和评估,(经过设计、训练和评估的环境识别器)以生成与标志性动作音效数据集相同数量类型的标志音效分类器(优选为K类)。
优选地,步骤S2.2具体实施为以下步骤(服务类型判决器的生成):
步骤S2.2.1:将设计、训练和评估完成的(K类)标志音效分类器重新作用于服务内容音频数据集;
步骤S2.2.2:被重新作用的服务内容音频数据集用于设计、训练和评估服务类型分类器,(经过设计、训练和评估的服务类型分类器)以生成最终的服务类型判决器;
步骤S2.2.3:最终的服务类型判决器获得最终的服务内容音频所属的服务类型的判决结果。
优选地,服务判定模块基于(非语音)环境音识别技术,护理服务过程中夹杂了许多非服务相关的音频,如对话、环境噪音等,识别难度仍然较大,本发明通过如下方案:
1.在该方法中服务判定模块以在每个服务项目中的人耳可辨识的标志性动作的音效为主要判定依据,此设计避免了将与服务无关的音频数据引入判定算法,进一步降低了识别难度,并有效的增加了系统的可解释性;
2.通过采用统一规格的音频采集设备并标准化采集服务音频数据流程,服务音频的差异性被有效地减少,降低了识别难度;
3.设计统计实验,使用大量采集并标注数据训练并客观评价每一个标志性动作音效所对应的分类器。
优选地,标志音效分类器与服务类型判决器预先已设计、训练与评估完成。
值得一提的是,本发明专利申请涉及的K类、L类(即代表一定数量)等技术特征应被视为现有技术,这些技术特征的具体结构、工作原理以及可能涉及到的控制方式、空间布置方式采用本领域的常规选择即可,不应被视为本发明专利的发明点所在,本发明专利不做进一步具体展开详述。
对于本领域的技术人员而言,依然可以对前述各实施例所记载的技术方案进行修改,或对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围。

Claims (3)

1.一种基于音频分析的护理识别评价方法,用于自动监测人工护理的服务质量,其特征在于,包括以下步骤:
步骤S1:语音识别器接收待检测的服务播报音频,将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器,以确定后续的服务类型;
步骤S2: 标志音效分类器接收待检测的服务内容音频,服务内容音频包括环境音,并且输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果,从而判断服务内容音频所属的服务类型是否是所播报的服务类型;
步骤S3:对于通过服务类型判决器验证的标志性动作音效数据集,服务类型判决器输出不同类型的标志性动作音效数据集的实际服务类别和服务持续时间,用于评价人工护理的服务质量;
步骤S2具体实施为以下步骤:
步骤S2.1:生成标志音效分类器并且接收待检测的服务内容音频;
步骤S2.2:输入服务类型判决器,以获得最终的服务内容音频所属的服务类型的判决结果;
步骤S2.1具体实施为以下步骤:
步骤S2.1.1:经标准化程序采集得到的服务内容音频先由人工进行服务类型分类,以生成若干类不同类型的服务内容音频数据集;
步骤S2.1.2:在其中一类服务内容音频数据集中标注出人耳可辨识的标志性动作音效,以获得若干类不同类型的标志性动作音效数据集;
步骤S2.1.3:标志性动作音效所对应的环境识别器通过标志性动作音效数据集设计、训练和评估,以生成与标志性动作音效数据集相同数量类型的标志音效分类器;
步骤S2.2具体实施为以下步骤:
步骤S2.2.1:将设计、训练和评估完成的标志音效分类器重新作用于服务内容音频数据集;
步骤S2.2.2:被重新作用的服务内容音频数据集用于设计、训练和评估服务类型分类器,以生成最终的服务类型判决器;
步骤S2.2.3:最终的服务类型判决器获得最终的服务内容音频所属的服务类型的判决结果。
2.根据权利要求1所述的一种基于音频分析的护理识别评价方法,其特征在于,步骤S1具体实施为以下步骤:
步骤S1.1:服务播报音频输入语音识别器;
步骤S1.2:将语音识别器识别获得的文本识别结果输入服务类型匹配器;
步骤S1.3:服务类型匹配器将获得的文本识别结果与数据库中的预先录入的服务类型的文本进行匹配。
3.根据权利要求2所述的一种基于音频分析的护理识别评价方法,其特征在于,步骤S1.3具体实施为以下步骤:
步骤S1.3.1:如果文本识别结果与数据库中的服务类型的文本相匹配,则记录反馈信息用于服务分段,并且执行步骤S2;
步骤S1.3.2:如果文本识别结果与数据库中的服务类型的文本不匹配,则记录未检测到的服务语音播报信息,并且执行步骤S2。
CN202010702815.XA 2020-07-18 2020-07-18 基于音频分析的护理识别评价方法 Active CN111899763B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010702815.XA CN111899763B (zh) 2020-07-18 2020-07-18 基于音频分析的护理识别评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010702815.XA CN111899763B (zh) 2020-07-18 2020-07-18 基于音频分析的护理识别评价方法

Publications (2)

Publication Number Publication Date
CN111899763A CN111899763A (zh) 2020-11-06
CN111899763B true CN111899763B (zh) 2022-06-10

Family

ID=73189654

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010702815.XA Active CN111899763B (zh) 2020-07-18 2020-07-18 基于音频分析的护理识别评价方法

Country Status (1)

Country Link
CN (1) CN111899763B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114241270A (zh) * 2022-02-25 2022-03-25 动联(山东)电子科技有限公司 一种家庭护理智能监督方法、系统及装置
CN114781805B (zh) * 2022-03-24 2023-09-15 江苏中科西北星信息科技有限公司 基于大数据的护理人员护理技能评估方法、系统及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968987A (zh) * 2012-11-19 2013-03-13 百度在线网络技术(北京)有限公司 一种语音识别方法及系统
CN108694942A (zh) * 2018-04-02 2018-10-23 浙江大学 一种基于家居智能服务机器人的智能家居交互问答系统
CN110334198A (zh) * 2019-07-09 2019-10-15 国网河北省电力有限公司邢台供电分公司 机器人智能服务方法、系统及终端设备
CN110633912A (zh) * 2019-09-20 2019-12-31 苏州思必驰信息科技有限公司 监测服务人员服务质量的方法及系统
CN110718293A (zh) * 2019-10-23 2020-01-21 合肥盛东信息科技有限公司 一种护理员服务质量监测评价系统
CN111311327A (zh) * 2020-02-19 2020-06-19 平安科技(深圳)有限公司 基于人工智能的服务评价方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111899763A (zh) 2020-11-06

Similar Documents

Publication Publication Date Title
CN111899763B (zh) 基于音频分析的护理识别评价方法
CN109461446B (zh) 一种识别用户目标请求的方法、装置、系统及存储介质
CN108229441B (zh) 一种基于图像和语音分析的课堂教学自动反馈系统和反馈方法
CN112504673B (zh) 基于机器学习的托辊故障诊断方法、系统及存储介质
CN109460728A (zh) 一种基于情绪识别的大数据安防管理平台
CN106328134A (zh) 监狱语音数据识别及监测预警系统
CN110136696B (zh) 音频数据的监控处理方法和系统
CN110797032B (zh) 一种声纹数据库建立方法及声纹识别方法
CN103778917A (zh) 一种在电话满意度调查中检测身份冒充的系统与方法
CN108776452B (zh) 一种特种设备现场维保监控方法及系统
CN114373452A (zh) 基于深度学习的嗓音异常识别和评价的方法及系统
CN117198338B (zh) 一种基于人工智能的对讲机声纹识别方法及系统
CN117456995A (zh) 一种养老服务机器人的交互方法及系统
KR20170086233A (ko) 라이프 음성 로그 및 라이프 영상 로그를 이용한 점증적 음향 모델 및 언어 모델 학습 방법
CN108403119A (zh) 一种咳嗽检测方法
CN114252906A (zh) 声音事件的检测方法和装置、计算机设备和存储介质
CN113345210B (zh) 一种基于音视频智能判断呼救的方法及装置
Fogel et al. Evolutionary programming for voice feature analysis
CN115100701A (zh) 一种基于人工智能技术的会议发言人身份识别方法
CN113810548A (zh) 基于iot的智能通话质检方法系统
CN115953874B (zh) 一种音箱智能告警方法
CN115238706B (zh) 一种芯片检测及处理方法及系统
CN112992150B (zh) 话术模板使用效果评价方法及装置
US11830519B2 (en) Multi-channel acoustic event detection and classification method
CN117357104B (zh) 一种基于用户特征的音频分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220517

Address after: 314001 No. 310, Hongbo Road, Nanhu District, Jiaxing City, Zhejiang Province

Applicant after: Zhejiang Jiake intelligent Elderly Care Service Co.,Ltd.

Address before: 314031 room 413, floor 4, building 10, China Electronics Technology (Jiaxing) smart Industrial Park, No. 587 Taoyuan Road, Gaozhao street, Xiuzhou District, Jiaxing City, Zhejiang Province

Applicant before: Zhejiang Changhu Information Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant