CN113488071A

CN113488071A - 一种猪只咳嗽识别方法、装置、设备及可读存储介质

Info

Publication number: CN113488071A
Application number: CN202110808150.5A
Authority: CN
Inventors: 张玉良; 翁晓瑶; 彭勃; 彭佳勇
Original assignee: Henan Muyuan Intelligent Technology Co Ltd
Current assignee: Henan Muyuan Intelligent Technology Co Ltd
Priority date: 2021-07-16
Filing date: 2021-07-16
Publication date: 2021-10-08

Abstract

本发明公开了一种猪只咳嗽识别方法，该方法通过获取待识别的生硬数据，提取其中的有效声音并分为小声音片段进行特征提取，可以提升识别咳嗽的精度，根据提取的特征使用神经网络模型进行分类识别来感知猪只的声音状态，生成是否咳嗽的分类结果，调用卷积神经网络实现对于猪只咳嗽的识别，相比传统方法中采用的模板匹配方法可以极大地提升识别咳嗽的精度，同时也减少了数据标记的困难，而且还方法通过设备的自动化处理，可以代替人工的巡检，节省人力，并减少人与猪只的接触，防止传染病的传播，保证猪只的健康。本发明还公开了一种猪只咳嗽识别装置、设备及可读存储介质，具有相应的技术效果。

Description

一种猪只咳嗽识别方法、装置、设备及可读存储介质

技术领域

本发明涉及智能养殖技术领域，特别是涉及一种猪只咳嗽识别方法、装置、设备及可读存储介质。

背景技术

随着畜牧业生产规模的扩大化趋势，智能化猪只养殖的需求越来越高。出于猪只健康成长的管理需求，需要对猪只进行健康监控。

猪只咳嗽是呼吸道疾病最为常见的症状之一，经常会有猪只存在呼吸等方面的疾患，往往不会引起足够的关注，使猪只疾患由咳嗽发展为猪喘等混合型呼吸困难症，导致病情严重，加大了诊治难度，猪只死亡率也随之上升，通过感知猪只的咳嗽可以判断猪只的相关状态，及时调整猪只的生存环境，提高生产效率。因此，对于猪只咳嗽的检测对于猪只健康监控来说是十分重要的部分。

目前，传统方法中采用模板匹配的方法，对采集的声音数据进行特征提取，然后根据提取的特征与预先建立的咳嗽模板进行匹配，若匹配成功，判定咳嗽。该方法特别依赖先验知识，并且泛化性弱，对于数据样本的采集要求较高，一旦出现与训练样本差别大的声音，就可能出现误识别，该方法的准确率也不高，实际应用时会出现很多漏识别和误识别。

综上所述，如何提升咳嗽识别精准度，是目前本领域技术人员急需解决的技术问题。

发明内容

本发明的目的是提供一种猪只咳嗽识别方法、装置、设备及可读存储介质，以提高识别精准度。

为解决上述技术问题，本发明提供如下技术方案：

一种猪只咳嗽识别方法，包括：

获取待识别的声音数据；

对所述声音数据进行有效声音提取，得到有效声音片段；

对所述有效声音片段进行特征提取，得到片段特征；

将所述片段特征输入至预训练的卷积神经网络中进行声音分类，得到分类结果；其中，所述分类结果包括：咳嗽以及非咳嗽；

根据各所述有效声音片段的时间信息按时间顺序统计所述分类结果，作为时序结果；

根据所述时序结果进行咳嗽识别，生成咳嗽识别结果。

可选地，所述对所述声音数据进行有效声音提取，包括：

对所述声音数据进行环境噪音去除处理，得到降噪声音数据；

提取所述降噪声音数据的短时能量特征以及短时过零率特征，得到短时能量以及短时过零率；

根据所述短时能量确定所述降噪声音数据对应的短时能量阈值，根据所述短时过零率确定所述降噪声音数据对应的短时过零率阈值；

根据所述短时过零率阈值对所述降噪声音数据进行短时过零率过滤，并获取短时过零率超过所述短时过零率阈值的声音数据，作为初步过滤声音数据；

根据所述短时能量阈值对所述初步过滤声音数据进行数据扩充，并将扩充后的声音数据作为所述有效声音片段。

可选地，所述获取待识别的声音数据，包括：

获取设置于猪只栏位上方预设高度的四麦克风阵列采集的pcm数据，作为所述声音数据。

可选地，所述获取设置于猪只栏位上方预设高度的四麦克风阵列采集的pcm数据，包括：

获取设置于猪只栏位上方预设高度的四麦克风阵列循环采集的pcm数据。

可选地，所述对所述有效声音片段进行特征提取，包括：

对所述有效声音片段进行Mel频谱特征提取。

可选地，所述根据所述时序结果进行咳嗽识别，包括：

根据所述时序结果识别出所述有效声音片段中的咳嗽次数以及频率，作为所述咳嗽识别结果。

一种猪只咳嗽识别装置，包括：

数据获取单元，用于获取待识别的声音数据；

有效提取单元，用于对所述声音数据进行有效声音提取，得到有效声音片段；

特征提取单元，用于对所述有效声音片段进行特征提取，得到片段特征；

分类识别单元，用于将所述片段特征输入至预训练的卷积神经网络中进行声音分类，得到分类结果；其中，所述分类结果包括：咳嗽以及非咳嗽；

时序统计单元，用于根据各所述有效声音片段的时间信息按时间顺序统计所述分类结果，作为时序结果；

时序识别单元，用于根据所述时序结果进行咳嗽识别，生成咳嗽识别结果。

可选地，所述有效提取单元，包括：

降噪子单元，用于对所述声音数据进行环境噪音去除处理，得到降噪声音数据；

特征提取子单元，用于提取所述降噪声音数据的短时能量特征以及短时过零率特征，得到短时能量以及短时过零率；

阈值生成子单元，用于根据所述短时能量确定所述降噪声音数据对应的短时能量阈值，根据所述短时过零率确定所述降噪声音数据对应的短时过零率阈值；

过滤子单元，用于根据所述短时过零率阈值对所述降噪声音数据进行短时过零率过滤，并获取短时过零率超过所述短时过零率阈值的声音数据，作为所述有效声音片段。

一种计算机设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现上述猪只咳嗽识别方法的步骤。

一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述猪只咳嗽识别方法的步骤。

本发明实施例所提供的方法，通过获取待识别的生硬数据，提取其中的有效声音并分为小声音片段进行特征提取，可以提升识别咳嗽的精度，根据提取的特征使用神经网络模型进行分类识别来感知猪只的声音状态，生成是否咳嗽的分类结果，调用卷积神经网络实现对于猪只咳嗽的识别，相比传统方法中采用的模板匹配方法可以极大地提升识别咳嗽的精度，同时也减少了数据标记的困难，而且还方法通过设备的自动化处理，可以代替人工的巡检，节省人力，并减少人与猪只的接触，防止传染病的传播，保证猪只的健康。

相应地，本发明实施例还提供了与上述猪只咳嗽识别方法相对应的猪只咳嗽识别装置、设备和可读存储介质，具有上述技术效果，在此不再赘述。

附图说明

为了更清楚地说明本发明实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种猪只咳嗽识别方法的实施流程图；

图2为本发明实施例中一种CNN网络结构示意图；

图3为本发明实施例中一种猪只咳嗽识别装置的结构示意图；

图4为本发明实施例中一种计算机设备的结构示意图。

具体实施方式

本发明的核心是提供一种猪只咳嗽识别方法，识别精准度高。

为了使本技术领域的人员更好地理解本发明方案，下面结合附图和具体实施方式对本发明作进一步的详细说明。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，图1为本发明实施例中一种猪只咳嗽识别方法的流程图，该方法包括以下步骤：

S101、获取待识别的声音数据；

获取待进行猪只的咳嗽检测的声音数据，可以直接获取猪只养殖的现场采集声音，作为待识别的声音数据，也可以接收预先采集的猪只声音数据，作为待识别的声音数据，本实施例中对此不做限定。

声音数据中需包含猪只的声音，声音越清晰，后续检测识别效果越好。本实施例中对于声音数据的具体采集实现过程不做限定。为保证获取的声音数据中有清晰的猪只声音，同时尽量减少环境噪音，可选地，获取待识别的声音数据的过程具体可以为：获取设置于猪只栏位上方预设高度的四麦克风阵列采集的pcm数据(指通过麦克风采集的原始数据)，作为声音数据。其中，在猪只的养殖现场使用四麦克风阵列进行实时声音的采集可以还原出清晰不失真的现场声音，声音音质较高，本实施例中仅以上述声音采集设备为例进行介绍，也可以采用其它声音采集设备，在此对于声音采集设备的类型不做限定。为避免环境噪音过大，声音采集设备可以固定于猪只栏位上方，比如可以架设于猪的栏位上方距离地面1.8米(一种预设高度)的位置，具体声音采集设备的架设高度和架设位置可以根据实际采集以及安装情况进行设定，本实施例中对此不做限定。

另外，本实施例中对于猪只的声音采集设备的采集策略不做限定，可以根据实际数据采集需要进行设定。比如出于对于猪只的持续监测的需要，声音采集设备24小时循环采集，从而获取长时间持续采集的声音数据。而由于循环采集时生成的数据量较大，后续声音检测的工作量较大，为减少数据量，可以间歇性抽样采集，比如每采集3分钟的音频，就停止3分钟，以此循环，本实施例中仅以上述采集策略为例进行介绍，其它情况在此不再赘述，均可参照本实施例的介绍。

S102、对声音数据进行有效声音提取，得到有效声音片段；

其中有效声音指猪只声音，即排除声音数据中其它声音的影响，提取其中的猪只声音，从而进一步对猪只声音进行咳嗽的识别。而其它声音比如静音、环境音等。有效声音片段指猪只声音的小片段，本实施例中使用静音端点检测的方法，将声音分成一个个小片段，再对片段进行识别分类，可以提升识别咳嗽的精度。

而本实施例中对于对声音数据进行有效声音提取的具体实现方式不做限定，比如可以调用VAD算法(有话帧检测，Voice activity detection)将进行识别，得到n个1秒左右的有效声音片段等，当然，也可以采取其它的声音提取方法，可以根据实际应用场景的需要以及实际使用需求进行相应的设定，在此不再赘述。

另外，由于本实施例中需要调用卷积神经网络进行特征的分类识别，所以需要保证输入的声音片段的时间尽量短，以满足卷积神经网络的输出要求，一般有效声音片段可以为1s左右的片段。

S103、对有效声音片段进行特征提取，得到片段特征；

对有效声音片段进行特征提取，以便于后续卷积神经网络基于片段特征进行咳嗽的分类识别。而本步骤中对于特征提取中采用的方法不做限定，可以参照相关技术中对声音片段进行声音特征提取的方法，可选地，可以对有效声音片段进行Mel(Mel倒谱系数)频谱特征提取。该特征提取方法提取的特征细节还原性好，可以保证后续咳嗽分析的精准度。本实施例中仅以上述特征提取方法为例进行介绍，其它特征提取方法均可参照本实施例的介绍，在此不再赘述。

S104、将片段特征输入至预训练的卷积神经网络中进行声音分类，得到分类结果；

预训练一个卷积神经网络用于实现基于声音片段特征的咳嗽分类，本实施例中调用卷积神经网络实现对于猪只咳嗽的识别，相比传统方法中采用的模板匹配方法可以极大地提升识别咳嗽的精度，同时也减少了数据标记的困难。

本实施例中对于预训练的卷积神经网络的具体网络结构不做限定，可以根据实际分类识别的精准度要求进行相应设定，如图2所示为一种5层的CNN网络模型示意图，本实施例中仅以上述模型结构为例进行介绍，其它模型结构下的猪只咳嗽识别方法均可参照本实施例的介绍，在此不再赘述。同时本实施例中对于卷积神经网络的训练过程不做限定，可以参照相关技术中的实现方式，使用标记好的现场数据，进行训练，直至得到一个合适的卷积神经网络。

在调用预训练的卷积神经网络时，直接将提取的片段特征输入至卷积神经网络中，网络会输出对应的分类结果，本实施例中用于对猪只咳嗽进行识别，因此可以采用二分类模型，输出二分类结果，即咳嗽以及非咳嗽即可。当然，也可以采取其它的分类模型进行精准的声音识别，本实施例中对此不做限定。

S105、根据各有效声音片段的时间信息按时间顺序统计分类结果，作为时序结果；

输出的分类结果为针对每个有效声音片段的分类结果，为了实现对于声音数据的整体分析，需要结合各有效声音片段的时间信息，将各分类结果保存为一组时序结果，即按照声音片段的先后顺序统计各分类结果，生成的时序结果比如1s咳嗽，2s咳嗽，3s非咳嗽，4s非咳嗽，10s咳嗽，11s咳嗽，12s非咳嗽，13s非咳嗽，14s非咳嗽。

S106、根据时序结果进行咳嗽识别，生成咳嗽识别结果。

时序结果中显示了每个时间节点下的咳嗽识别结果，由于一次完整的咳嗽可能横跨多个时间节点，因此需要根据时序结果进行咳嗽整体行为的识别，而具体识别的项目本实施例中不做限定，比如可以根据时序结果识别出有效声音片段中的咳嗽次数以及频率等相关信息，作为咳嗽识别结果，对于其他的分析项目可以根据实际使用需求进行相应的设定，比如还可以进一步识别咳嗽的时间长短、最大分贝等，在此不再赘述。

为加深理解，以针对一个养猪场栏位进行采集识别的整体过程进行介绍，假设一个栏位有10头猪，使用一个麦克风阵列放在栏位中进行声音采集。设备通电后，开始实时对栏位中的声音进行采集，当声音信号长度到达1分钟后进行处理。将这1分钟的声音信息进行有效声音的提取，得到若干长度为1s的有效声音片段，再对有效声音片段使用Mel频谱特征进行特征提取，得到片段特征，再将片段特征放入提前训练好的神经网络模型中进行识别，得到在5s处、32s处有咳嗽，即该1分钟，10头猪咳嗽了2次的咳嗽识别结果。

基于上述介绍，本发明实施例所提供的技术方案，通过获取待识别的生硬数据，提取其中的有效声音并分为小声音片段进行特征提取，可以提升识别咳嗽的精度，根据提取的特征使用神经网络模型进行分类识别来感知猪只的声音状态，生成是否咳嗽的分类结果，调用卷积神经网络实现对于猪只咳嗽的识别，相比传统方法中采用的模板匹配方法可以极大地提升识别咳嗽的精度，同时也减少了数据标记的困难，而且还方法通过设备的自动化处理，可以代替人工的巡检，节省人力，并减少人与猪只的接触，防止传染病的传播，保证猪只的健康。

需要说明的是，基于上述实施例，本发明实施例还提供了相应的改进方案。在优选/改进实施例中涉及与上述实施例中相同步骤或相应步骤之间可相互参考，相应的有益效果也可相互参照，在本文的优选/改进实施例中不再一一赘述。

上述实施例中对于对声音数据进行有效声音提取的具体实现方式不做限定，本实施例中介绍一种可以精准提取猪只声音的方法，具体包括如下步骤：

(1)对声音数据进行环境噪音去除处理，得到降噪声音数据；

得到采集的声音数据后，由于其中除了猪只的声音之外，还包含大量的环境噪音(指除了猪只以外的声音)，为避免这些环境噪音对于后续声音检测识别的影响，进而影响识别精准度，在进行猪只声音的特征识别之前，需要对声音数据进行环境噪音去除处理，尽量去掉环境的噪声干扰，保留纯净的猪只声音信号。

而本实施例中对于环境噪音去除处理的具体实现步骤不做限定，可以根据实际识别的需要选用相关的噪声去除算法。

(2)提取降噪声音数据的短时能量特征以及短时过零率特征，得到短时能量以及短时过零率；

降噪处理后，对降噪声音数据进行特征提取。本实施例中主要提取两种特征——短时能量特征以及短时过零率特征。

其中，短时能量是一种反应信号幅度变化的有效描述方法，其在端点检测中可用于判定有声段和无声段，也作为表示语音信号能量大小的特征参数。

短时过零率是指声音振动方向持续变化的信号在一个短时帧长内通过横坐标轴的次数。由过零率的定义可知，信号高频率段具有高过零率，低频率段具有低过零率，因此，过零率可以在一定程度上反映信号的频率特性。本实施例中利用过零率(zero-crossingrate，ZCR)描述动物声音在时域上波动的激烈程度。

(3)根据短时能量确定降噪声音数据对应的短时能量阈值，根据短时过零率确定降噪声音数据对应的短时过零率阈值；

本实施例中根据每个检测对象(每段降噪声音数据)设置对应的阈值(包括短时能量阈值以及短时过零率阈值)，则针对不同的检测对象，其阈值也不同。通过将阈值根据检测对象进行自适应调整，可以使每个阈值都能贴合对应检测对象的实际声音特征，实现精准检测。相比目前针对所有检测对象的固定阈值检测可以显著提升检测对象的检测精准度，本实施例提供的自适应阈值调整策略可以提升猪只声音的提取精度。

(4)根据短时过零率阈值对降噪声音数据进行短时过零率过滤，并获取短时过零率超过短时过零率阈值的声音数据，作为初步过滤声音数据；

在得到两阈值后，本实施例中先根据短时过零率阈值进行过滤筛选，得到初步过滤声音数据，再根据短时能量阈值对初步过滤声音数据进行处理。申请人经过大量数据研究以及测试发现，先通过短时过零率进行筛选，再通过短时能量特征进行筛选，可以显著提升对于猪声音检测的精准度，实现精准切分。

(5)根据短时能量阈值对初步过滤声音数据进行数据扩充，并将扩充后的声音数据作为有效声音片段。

经过短时过零率筛选后，得到初步过滤声音数据，再对初步过滤声音数据进行短时能量过滤，具体地，使用短时能量特征，用短时能量阈值对初步过滤声音数据的头尾进行扩充，以便于扩充后的数据覆盖有效声音(指咳嗽)。

本实施例提供的有效声音提取方法中首先对声音数据进行环境噪音去除，排除环境噪音对于后续检测识别的干扰，然后先根据短时过零率阈值进行过滤筛选，得到初步过滤声音数据，再根据短时能量阈值对初步过滤声音数据进行扩充处理，该种处理顺序的配置可以显著提升对于猪声音检测的精准度，实现精准切分；同时在进行过滤筛选以及扩充处理中使用的阈值为根据每段降噪声音数据自适应调整生成的阈值，通过将阈值根据检测对象进行自适应调整，可以使每个阈值都能贴合对应检测对象的实际声音特征，实现精准检测，从而提升猪只声音的提取精度。

相应于上面的方法实施例，本发明实施例还提供了一种猪只咳嗽识别装置，下文描述的猪只咳嗽识别装置与上文描述的猪只咳嗽识别方法可相互对应参照。

参见图3所示，该装置包括以下模块：

数据获取单元110主要用于获取待识别的声音数据；

有效提取单元120主要用于对声音数据进行有效声音提取，得到有效声音片段；

特征提取单元130主要用于对有效声音片段进行特征提取，得到片段特征；

分类识别单元140主要用于将片段特征输入至预训练的卷积神经网络中进行声音分类，得到分类结果；其中，分类结果包括：咳嗽以及非咳嗽；

时序统计单元150主要用于根据各有效声音片段的时间信息按时间顺序统计分类结果，作为时序结果；

时序识别单元160主要用于根据时序结果进行咳嗽识别，生成咳嗽识别结果。

在本发明的一种具体实施方式中，有效提取单元，包括：

降噪子单元，用于对声音数据进行环境噪音去除处理，得到降噪声音数据；

特征提取子单元，用于提取降噪声音数据的短时能量特征以及短时过零率特征，得到短时能量以及短时过零率；

阈值生成子单元，用于根据短时能量确定降噪声音数据对应的短时能量阈值，根据短时过零率确定降噪声音数据对应的短时过零率阈值；

过滤子单元，用于根据短时过零率阈值对降噪声音数据进行短时过零率过滤，并获取短时过零率超过短时过零率阈值的声音数据，作为有效声音片段。

相应于上面的方法实施例，本发明实施例还提供了一种计算机设备，下文描述的一种计算机设备与上文描述的一种猪只咳嗽识别方法可相互对应参照。

该计算机设备包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现上述方法实施例的猪只咳嗽识别方法的步骤。

具体的，请参考图4，为本实施例提供的一种计算机设备的具体结构示意图，该计算机设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)322(例如，一个或一个以上处理器)和存储器332，存储器332存储有一个或一个以上的计算机应用程序342或数据344。其中，存储器332可以是短暂存储或持久存储。存储在存储器332的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对数据处理设备中的一系列指令操作。更进一步地，中央处理器322可以设置为与存储器332通信，在计算机设备301上执行存储器332中的一系列指令操作。

计算机设备301还可以包括一个或一个以上电源326，一个或一个以上有线或无线网络接口350，一个或一个以上输入输出接口358，和/或，一个或一个以上操作系统341。

上文所描述的猪只咳嗽识别方法中的步骤可以由计算机设备的结构实现。

相应于上面的方法实施例，本发明实施例还提供了一种可读存储介质，下文描述的一种可读存储介质与上文描述的一种猪只咳嗽识别方法可相互对应参照。

一种可读存储介质，可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述方法实施例的猪只咳嗽识别方法的步骤。

该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。

本领域技术人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

Claims

1.一种猪只咳嗽识别方法，其特征在于，包括：

获取待识别的声音数据；

对所述声音数据进行有效声音提取，得到有效声音片段；

对所述有效声音片段进行特征提取，得到片段特征；

根据所述时序结果进行咳嗽识别，生成咳嗽识别结果。

2.根据权利要求1所述的猪只咳嗽识别方法，其特征在于，所述对所述声音数据进行有效声音提取，包括：

3.根据权利要求1所述的猪只咳嗽识别方法，其特征在于，所述获取待识别的声音数据，包括：

4.根据权利要求3所述的猪只咳嗽识别方法，其特征在于，所述获取设置于猪只栏位上方预设高度的四麦克风阵列采集的pcm数据，包括：

5.根据权利要求1所述的猪只咳嗽识别方法，其特征在于，所述对所述有效声音片段进行特征提取，包括：

对所述有效声音片段进行Mel频谱特征提取。

6.根据权利要求1所述的猪只咳嗽识别方法，其特征在于，所述根据所述时序结果进行咳嗽识别，包括：

7.一种猪只咳嗽识别装置，其特征在于，包括：

数据获取单元，用于获取待识别的声音数据；

8.根据权利要求7所述的猪只咳嗽识别装置，其特征在于，所述有效提取单元，包括：

9.一种计算机设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至6任一项所述猪只咳嗽识别方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述猪只咳嗽识别方法的步骤。