CN111899763B

CN111899763B - 基于音频分析的护理识别评价方法

Info

Publication number: CN111899763B
Application number: CN202010702815.XA
Authority: CN
Inventors: 翟振刚; 陆晓英; 陈媛; 周姝妍; 顾哲航
Original assignee: Zhejiang Jiake Intelligent Elderly Care Service Co ltd
Current assignee: Zhejiang Jiake Intelligent Elderly Care Service Co ltd
Priority date: 2020-07-18
Filing date: 2020-07-18
Publication date: 2022-06-10
Anticipated expiration: 2040-07-18
Also published as: CN111899763A

Abstract

本发明公开了一种基于音频分析的护理识别评价方法，包括步骤S1：语音识别器接收待检测的服务播报音频，将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器，以确定后续的服务类型；步骤S2：标志音效分类器接收待检测的服务内容音频，并且输入服务类型判决器，以获得最终的服务内容音频所属的服务类型的判决结果。本发明公开的一种基于音频分析的护理识别评价方法，在保护被护理人如失去生活自理能力、患病人员或老年人隐私的前提下，自动监测人工护理服务质量。

Description

基于音频分析的护理识别评价方法

技术领域

本发明属于音频分析处理技术领域，具体涉及一种基于音频分析的护理识别评价方法。

背景技术

现有的护理服务质量通常是由家属、监护人或被护理人打分测得，此评价方式很难客观公正。护理服务的音频含有大量护理行为信息，并且包括被护理人的隐私。

但是现在缺少对护理人员在护理时提供的音频进行分析处理，从而用于自动监测人工护理的服务质量，以此客观公正地评价护理人员的护理行为，此方法的核心部分是行为音频的分析，最接近的技术是非语音音频识别技术，即环境音识别。

公开号为：CN109920448A，主题名称为一种自动驾驶车辆交通环境特种声音的识别系统及方法的发明专利，其技术方案公开了“包括信息采集单元、信息处理单元、声音识别单元、存储单元和控制单元，所述信息采集单元用于采集交通环境声音信号，并将声音信号转化成数字信号，传输给信息处理单元；所述信息处理单元的输入端与信息采集单元相连、输出端与声音识别单元相连，用于处理传输过来的交通环境声音数字信号，检测环境声音数字信号中是否具有的异常声音信号，并提取异常声音段的特征参数，将特征参数传输给声音识别单元；声音识别单元用于识别出声源的运动状态及包括何种特种声音信号；所述存储单元包括声音状态存储区和声音特征参数存储区，分别用于存储声音运动状态和声音特征参数；所述声音识别单元、存储单元分别与控制单元相连，控制单元能够调用存储单元中存储的数据用于训练和更新识别模型”。

以上述发明专利为例，其虽然提及了环境特种声音的识别，但是其无论是技术领域还是技术方案均与本发明不同。因此，针对上述问题，予以进一步改进。

发明内容

本发明的主要目的在于提供基于音频分析的护理识别评价方法，在保护被护理人如失去生活自理能力、患病人员或老年人隐私的前提下，自动监测人工护理服务质量，使得管理人员可以客观、公正、高效的监测人工护理的服务情况，其先确定后续服务的类型，再通过所确定的服务类型进行环境音识别，从而判断服务是否是所播报的服务类型，并评价服务质量。

为达到以上目的，本发明提供一种基于音频分析的护理识别评价方法，用于自动监测人工护理的服务质量，包括以下步骤：

步骤S1：语音识别器接收待检测的服务播报音频，将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器，以确定后续的服务类型(在线系统)；

步骤S2：标志音效分类器接收待检测的服务内容音频，并且输入服务类型判决器，以获得最终的服务内容音频所属的服务类型的判决结果(离线系统)；

步骤S3：对于通过服务类型判决器验证的标志性动作音效数据集，服务类型判决器输出不同类型的标志性动作音效数据集的实际服务类别和服务持续时间(用于评价人工护理的服务质量)。

作为上述技术方案的进一步优选的技术方案，步骤S1具体实施为以下步骤：

步骤S1.1：服务播报音频输入语音识别器；

步骤S1.2：将语音识别器识别获得的文本识别结果输入服务类型匹配器；

步骤S1.3：服务类型匹配器将获得的文本识别结果与数据库中的预先录入的服务类型的文本进行匹配。

作为上述技术方案的进一步优选的技术方案，步骤S1.3具体实施为以下步骤：

步骤S1.3.1：如果文本识别结果与数据库中的服务类型的文本相匹配，则记录反馈信息用于服务分段，并且执行步骤S2(用于离线系统中的服务类型的判决)；

步骤S1.3.2：如果文本识别结果与数据库中的服务类型的文本不匹配，则记录未检测到的服务语音播报信息，并且执行步骤S2(用于离线系统中的服务类型的判决)。

作为上述技术方案的进一步优选的技术方案，步骤S2具体实施为以下步骤：

步骤S2.1：生成标志音效分类器并且接收待检测的服务内容音频；

步骤S2.2：输入服务类型判决器，以获得最终的服务内容音频所属的服务类型的判决结果。

作为上述技术方案的进一步优选的技术方案，步骤S2.1具体实施为以下步骤(标志音效分类器的生成)：

步骤S2.1.1：经标准化程序采集得到的服务内容音频先由人工进行服务类型分类，以生成若干类(优选为L类)不同类型的服务内容音频数据集(通过幅度动态标准化和声道、量化位数的统一得到标准化的不同类型的服务内容音频数据集)；

步骤S2.1.2：在其中一类服务内容音频数据集中标注出人耳可辨识的标志性动作音效(标志性工作音效的类型与标志性动作音效数据集的类型相同)，以获得若干类不同类型(优选为K类)的标志性动作音效数据集(在标准化音频中通过语音活动检测得到语音播报音频的候选音频短片段，通过语音识别器和特定语音播报筛选得到服务起始点(即首先开始的标志性动作音效)，将音频分割成若干服务音频段落，即若干类不同类型(优选为K类)的标志性动作音效数据集)；

步骤S2.1.3：标志性动作音效所对应的环境识别器通过标志性动作音效数据集设计、训练和评估，(经过设计、训练和评估的环境识别器)以生成与标志性动作音效数据集相同数量类型的标志音效分类器(优选为K类)。

作为上述技术方案的进一步优选的技术方案，步骤S2.2具体实施为以下步骤(服务类型判决器的生成)：

步骤S2.2.1：将设计、训练和评估完成的(K类)标志音效分类器重新作用于服务内容音频数据集；

步骤S2.2.2：被重新作用的服务内容音频数据集用于设计、训练和评估服务类型分类器，(经过设计、训练和评估的服务类型分类器)以生成最终的服务类型判决器；

步骤S2.2.3：最终的服务类型判决器获得最终的服务内容音频所属的服务类型的判决结果。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例，本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。

在本发明的优选实施例中，本领域技术人员应注意，本发明所涉及的K类、L类(即代表一定数量)等可被视为现有技术。

优选实施例。

本发明公开了一种基于音频分析的护理识别评价方法，用于自动监测人工护理的服务质量，包括以下步骤：

具体的是，步骤S1具体实施为以下步骤：

步骤S1.1：服务播报音频输入语音识别器；

更具体的是，步骤S1.3具体实施为以下步骤：

进一步的是，步骤S2具体实施为以下步骤：

更进一步的是，步骤S2.1具体实施为以下步骤(标志音效分类器的生成)：

优选地，步骤S2.2具体实施为以下步骤(服务类型判决器的生成)：

优选地，服务判定模块基于(非语音)环境音识别技术，护理服务过程中夹杂了许多非服务相关的音频，如对话、环境噪音等，识别难度仍然较大，本发明通过如下方案：

1.在该方法中服务判定模块以在每个服务项目中的人耳可辨识的标志性动作的音效为主要判定依据，此设计避免了将与服务无关的音频数据引入判定算法，进一步降低了识别难度，并有效的增加了系统的可解释性；

2.通过采用统一规格的音频采集设备并标准化采集服务音频数据流程，服务音频的差异性被有效地减少，降低了识别难度；

3.设计统计实验，使用大量采集并标注数据训练并客观评价每一个标志性动作音效所对应的分类器。

优选地，标志音效分类器与服务类型判决器预先已设计、训练与评估完成。

值得一提的是，本发明专利申请涉及的K类、L类(即代表一定数量)等技术特征应被视为现有技术，这些技术特征的具体结构、工作原理以及可能涉及到的控制方式、空间布置方式采用本领域的常规选择即可，不应被视为本发明专利的发明点所在，本发明专利不做进一步具体展开详述。

对于本领域的技术人员而言，依然可以对前述各实施例所记载的技术方案进行修改，或对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围。

Claims

1.一种基于音频分析的护理识别评价方法，用于自动监测人工护理的服务质量，其特征在于，包括以下步骤：

步骤S1：语音识别器接收待检测的服务播报音频，将语音识别器识别获得的文本识别结果输入服务类型匹配器并且导出对应的服务类型判决器，以确定后续的服务类型；

步骤S2：标志音效分类器接收待检测的服务内容音频，服务内容音频包括环境音，并且输入服务类型判决器，以获得最终的服务内容音频所属的服务类型的判决结果，从而判断服务内容音频所属的服务类型是否是所播报的服务类型；

步骤S3：对于通过服务类型判决器验证的标志性动作音效数据集，服务类型判决器输出不同类型的标志性动作音效数据集的实际服务类别和服务持续时间，用于评价人工护理的服务质量；

步骤S2具体实施为以下步骤：

步骤S2.2：输入服务类型判决器，以获得最终的服务内容音频所属的服务类型的判决结果；

步骤S2.1具体实施为以下步骤：

步骤S2.1.1：经标准化程序采集得到的服务内容音频先由人工进行服务类型分类，以生成若干类不同类型的服务内容音频数据集；

步骤S2.1.2：在其中一类服务内容音频数据集中标注出人耳可辨识的标志性动作音效，以获得若干类不同类型的标志性动作音效数据集；

步骤S2.1.3：标志性动作音效所对应的环境识别器通过标志性动作音效数据集设计、训练和评估，以生成与标志性动作音效数据集相同数量类型的标志音效分类器；

步骤S2.2具体实施为以下步骤：

步骤S2.2.1：将设计、训练和评估完成的标志音效分类器重新作用于服务内容音频数据集；

步骤S2.2.2：被重新作用的服务内容音频数据集用于设计、训练和评估服务类型分类器，以生成最终的服务类型判决器；

2.根据权利要求1所述的一种基于音频分析的护理识别评价方法，其特征在于，步骤S1具体实施为以下步骤：

步骤S1.1：服务播报音频输入语音识别器；

3.根据权利要求2所述的一种基于音频分析的护理识别评价方法，其特征在于，步骤S1.3具体实施为以下步骤：

步骤S1.3.1：如果文本识别结果与数据库中的服务类型的文本相匹配，则记录反馈信息用于服务分段，并且执行步骤S2；

步骤S1.3.2：如果文本识别结果与数据库中的服务类型的文本不匹配，则记录未检测到的服务语音播报信息，并且执行步骤S2。