CN114330454A - 一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 - Google Patents
一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 Download PDFInfo
- Publication number
- CN114330454A CN114330454A CN202210004800.5A CN202210004800A CN114330454A CN 114330454 A CN114330454 A CN 114330454A CN 202210004800 A CN202210004800 A CN 202210004800A CN 114330454 A CN114330454 A CN 114330454A
- Authority
- CN
- China
- Prior art keywords
- probability
- cough
- convolutional neural
- sound
- coughing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于DS证据理论融合特征的生猪咳嗽声音识别方法,包括:提取语料库中生猪咳嗽声音和非咳嗽声音的线性预测倒谱系数和对数梅尔谱图,将特征图像分成训练集和测试集,分别将训练集中的线性预测倒谱系数和对数梅尔谱图输入两路并行的卷积神经网络提取深度特征,将提取的深度特征送入全连接层和softmax分类器进行二分类,将分类后的结果送入DS证据理论特征融合层,将融合后的结果输入分类器再次进行二分类,实现对生猪咳嗽声音的识别。本发明利用两路卷积神经网络对不同的图像特征提取深度特征,利用DS证据理论对深度特征进行融合,相比于常规的声音识别方法,该方法可有效提升咳嗽声音的识别精度。
Description
技术领域
本发明属于语音信号处理领域,特别是涉及一种基于DS证据理论融合特征的生猪咳嗽声音识别方法。
背景技术
生猪叫声包含丰富的信息,读懂生猪叫声可以更好的了解生猪的生长及健康状况。生猪群发性呼吸道疾病是集约式养殖环境下的一种多发疾病,严重影响生猪养殖的经济效益。咳嗽是呼吸道疾病前期的显著特征之一,因此通过非接触式的音频监测的方法可以实现对生猪呼吸道疾病的预警,而其中关键技术就是对生猪咳嗽声音的识别。生猪咳嗽声音识别的关键技术包括特征提取和声音信号分类技术,已有方法大多都使用单一的特征进行分类识别,且常用用于语音识别的梅尔频率倒谱系数或者语谱图作为特征,而这些方法对于生猪咳嗽声音的识别,很难达到语音信号的识别精度。因此,本发明提出了一种基于DS证据理论融合特征的生猪咳嗽声音识别方法,该方法采用了对于生猪咳嗽声音识别分类精度较高的两种特征作为输入特征,采用多层卷积神经网络提取深度特征,然后对不同特征的分类结果进行DS证据理论特征融合,从而实现高精度的生猪咳嗽声音识别。
发明内容
本发明的目的是提供一种基于DS证据理论融合特征的生猪咳嗽声音识别方法,以解决上述现有技术存在的问题。
为实现上述目的,本发明提供了一种基于DS证据理论融合特征的生猪咳嗽声音识别方法,包括:
对生猪的咳嗽声音和非咳嗽声进行特征提取并保存;
将特征图像分为训练集和测试集,将所述训练集中的数据输入两路并行的卷积神经网络提取深度特征并分类;
基于分类结果获得两路网络中咳嗽声和非咳嗽声的概率,并输入到DS证据理论特征融合层进行融合,将融合后的特征输入分类器进行分类;
完成训练后,将所述测试集的数据输入训练好模型进行生猪咳嗽声音的识别。
可选的,对生猪的咳嗽声音和非咳嗽声进行特征提取并保存之前还需进行预处理,所述预处理过程包括:
基于带通滤波器对声音信号进行滤波,频率为100Hz~16kHz;
对滤波后的信号进行分帧和加窗处理,其中帧长为20ms,重叠长度为10ms,所述加窗处理采用的窗函数为汉宁窗。
可选的,对生猪的咳嗽声音和非咳嗽声进行特征提取并保存的过程中包括:
提取线性预测倒谱系数和对数梅尔谱图,其中,提取所述线性预测倒谱系数的阶数为24;
将提取的特征保存成尺寸为227×227×3像素尺寸的彩色图片。
可选的,将所述训练集中的数据输入两路并行的卷积神经网络提取深度特征并分类的过程中包括:
所述两路并行的卷积神经网络的两路均包括五个卷积、两个全连接层和一个分类器;
基于五个所述卷积层对训练集中的数据进行处理,将提取的深度特征输入两个所述全连接层中进行处理;
处理结束后输入所述分类器进行分类,其中所述分类器为softmax分类器。
可选的,基于五个所述卷积层对训练集中的数据进行处理的过程包括:
所述卷积层采用迁移学习的方法预加载ImageNet数据集上训练好的权重;
基于交叉熵损失函数和随机梯度下降法对所述全连接层进行模型的训练和权重的更新。
可选的,基于所述交叉熵损失函数进行计算的过程中,采用如下公式进行计算:
可选的,基于分类结果获得两路网络中咳嗽声和非咳嗽声的概率的过程中包括:
基于第一路卷积神经网络的分类器进行分类,并获得第一生猪咳嗽声概率和第一生猪非咳嗽声概率;
基于第二路卷积神经网路的分类器进行分类,并获得第二生猪咳嗽声概率和第二生猪非咳嗽声概率。
可选的,输入到DS证据理论特征融合层进行融合的过程中,采用了如下公式:
式中m1代表第一路卷积神经网络输出的咳嗽声和非咳嗽声事件的基本概率分配函数,m2代表第二路卷积神经网络输出的咳嗽声和非咳嗽声事件的基本概率分配函数,Ai代表经过DS证据理论特征层融合后的对应事件,Bi表示从第一路卷积神经网络输出的概率,其中B1代表所述第一生猪咳嗽声概率,B2代表所述第一生猪非咳嗽声概率,Ci表示从第二路卷积神经网络输出的概率,其中C1代表所述第二生猪咳嗽声概率,C2代表所述第二生猪非咳嗽声概率,m1(B1)=B1,m1(B2)=B2,m2(C1)=C1,m2(C2)=C2,
本发明的技术效果为:
两路卷积神经网络对不同的图像特征提取深度特征,获得咳嗽声的深度特征和非咳嗽声的深度特征,通过DS证据理论对深度特征进行融合,并基于咳嗽声音概率、非咳嗽声音概率进行处理,相比于常规的声音识别方法,本发明提升了对生猪咳嗽声的识别准确率。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明实施例中的线性预测倒谱系数提取过程图;
图2为本发明实施例中的对数梅尔谱提取过程图;
图3为本发明实施例中的DS证据理论特征融合流程图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
如图1所示,本实施例中提供一种基于DS证据理论融合特征的生猪咳嗽声音识别方法,包括:
语料库为实际猪舍内采集的标注好的咳嗽声音和非咳嗽声音片段,从语料库中随机选取896个咳嗽声音和非咳嗽声音作为训练集样本,随机选取192个咳嗽声音和非咳嗽声音作为测试集样本。提取生猪咳嗽声音和非咳嗽声音的特征。首先将声音信号进行预处理,预处理过程包括:先将声音信号进行滤波,带通滤波器频率为100Hz~16kHz,然后进行分帧和加窗处理,帧长为20ms,重叠长度为10ms,窗函数为汉宁窗。然后分别提取线性预测倒谱系数和对数梅尔谱图,提取过程分别如图1和图2所示,提取线性预测倒谱系数的阶数为24,将提取的特征保存成尺寸为227×227×3像素尺寸的彩色图片,保存图片时,颜色设置为“viridis”,保存图片格式为“png”格式。
分别将线性预测倒谱系数和对数梅尔谱图输入如图3所示的网络中,其中,第一个卷积层的卷积核数量为96,卷积核大小为11×11×3,第二个卷积层的卷积核数量为256,卷积核大小为5×5×48,前两个卷积层后进行局部响应归一化(LRN)和最大池化处理,第三个卷积层的卷积核数量为384,卷积核大小为3×3×256,第四个卷积层的卷积核数量为384,卷积核大小为3×3,第五个卷积层的卷积核数量为256,卷积核大小为3×3,第6,7,8层为全连接层,其中前两个全连接层神经元个数为4096,第三个全连接层为softmax分类器,输出神经元个数为2。
假设第一路卷积神经网络经过第一个分类器后输出数据为B=[B1,B2],其中B1代表咳嗽声概率,B2代表非咳嗽声概率,第二路卷积神经网络经过第二个分类器输出数据为C=[C1,C2],其中C1代表咳嗽声概率,C2代表非咳嗽声概率,则构造的两个基本概率分配函数如下所示:
m1(B1)=B1,m1(B2)=B2
m2(C1)=C1,m2(C2)=C2
其中,基本概率分配函数满足条件:
m1(B1)+m1(B2)=1,m2(C1)+m2(C2)=1;
DS证据理论特征融合过程如下所示:
式中m1代表第一路卷积神经网络输出的咳嗽声和非咳嗽声事件的基本概率分配函数,m2代表第二路卷积神经网络输出的咳嗽声和非咳嗽声事件的基本概率分配函数,Ai代表经过DS证据理论特征层融合后的对应事件,Bi表示从第一路卷积神经网络输出的概率,其中B1代表所述第一生猪咳嗽声概率,B2代表所述第一生猪非咳嗽声概率,Ci表示从第二路卷积神经网络输出的概率,其中C1代表所述第二生猪咳嗽声概率,C2代表所述第二生猪非咳嗽声概率,m1(B1)=B1,m1(B2)=B2,m2(C1)=C1,m2(C2)=C2,。
将融合后的数据输入一个softmax分类器进行二分类,可以得到分类结果。在模型训练过程中,需要对网络权重进行更新,其中前五层卷积层采用迁移学习的方法预加载ImageNet数据集上训练好的权重,采用交叉熵损失函数和随机梯度下降法对全连接层进行模型的训练和权重的更新,损失函数计算方法具体如下:
其中,N为输入样本数量。L1用于第一路网络全连接层的权重更新,L2用于第二路网络全连接层的权重更新。
完成模型的训练后,保存模型,将测试集内的数据输入已经训练好的模型,输出结果即为咳嗽声和非咳嗽声的标签,实现对生猪咳嗽声音的识别。
以上所述,仅为本申请较佳的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (8)
1.一种基于DS证据理论融合特征的生猪咳嗽声音识别方法,其特征在于,包括以下步骤:
对生猪的咳嗽声音和非咳嗽声进行特征提取并保存;
将特征图像分为训练集和测试集,将所述训练集中的数据输入两路并行的卷积神经网络提取深度特征并分类;
基于分类结果获得两路网络中咳嗽声和非咳嗽声的概率,并输入到DS证据理论特征融合层进行融合,将融合后的特征输入分类器进行分类;
完成训练后,将所述测试集的数据输入训练好的模型进行生猪咳嗽声音的识别。
2.根据权利要求1所述的方法,其特征在于,对生猪的咳嗽声音和非咳嗽声进行特征提取并保存之前还需进行预处理,所述预处理过程包括:
基于带通滤波器对声音信号进行滤波,频率为100Hz~16kHz;
对滤波后的信号进行分帧和加窗处理,其中帧长为20ms,重叠长度为10ms,所述加窗处理采用的窗函数为汉宁窗。
3.根据权利要求1所述的方法,其特征在于,对生猪的咳嗽声音和非咳嗽声进行特征提取并保存的过程中包括:
提取线性预测倒谱系数和对数梅尔谱图,其中,提取所述线性预测倒谱系数的阶数为24;
将提取的特征保存成尺寸为227×227×3像素尺寸的彩色图片。
4.根据权利要求1所述的方法,其特征在于,将所述训练集中的数据输入两路并行的卷积神经网络提取深度特征并分类的过程中包括:
所述两路并行的卷积神经网络的两路均包括五个卷积、两个全连接层和一个分类器;
基于五个所述卷积层对训练集中的数据进行处理,将提取的深度特征输入两个所述全连接层中进行处理;
处理结束后输入所述分类器进行分类,其中所述分类器为softmax分类器。
5.根据权利要求4所述的方法,其特征在于,基于五个所述卷积层对训练集中的数据进行处理的过程包括:
所述卷积层采用迁移学习的方法预加载ImageNet数据集上训练好的权重;
基于交叉熵损失函数和随机梯度下降法对所述全连接层进行模型的训练和权重的更新。
7.根据权利要求1所述的方法,其特征在于,基于分类结果获得两路网络中咳嗽声和非咳嗽声的概率的过程中包括:
基于第一路卷积神经网络的分类器进行分类,并获得第一生猪咳嗽声概率和第一生猪非咳嗽声概率;
基于第二路卷积神经网路的分类器进行分类,并获得第二生猪咳嗽声概率和第二生猪非咳嗽声概率。
8.根据权利要求7所述的方法,其特征在于,输入到DS证据理论特征融合层进行融合的过程中,采用了如下公式:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210004800.5A CN114330454A (zh) | 2022-01-05 | 2022-01-05 | 一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210004800.5A CN114330454A (zh) | 2022-01-05 | 2022-01-05 | 一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114330454A true CN114330454A (zh) | 2022-04-12 |
Family
ID=81023881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210004800.5A Pending CN114330454A (zh) | 2022-01-05 | 2022-01-05 | 一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330454A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115273908A (zh) * | 2022-08-05 | 2022-11-01 | 东北农业大学 | 一种基于分类器融合的生猪咳嗽声音识别方法 |
CN115457966A (zh) * | 2022-09-16 | 2022-12-09 | 东北农业大学 | 基于改进ds证据理论多分类器融合的猪咳嗽声识别方法 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107491726A (zh) * | 2017-07-04 | 2017-12-19 | 重庆邮电大学 | 一种基于多通道并行卷积神经网络的实时表情识别方法 |
CN108701469A (zh) * | 2017-07-31 | 2018-10-23 | 深圳和而泰智能家居科技有限公司 | 咳嗽声音识别方法、设备和存储介质 |
CN108717568A (zh) * | 2018-05-16 | 2018-10-30 | 陕西师范大学 | 一种基于三维卷积神经网络的图像特征提取与训练方法 |
CN109345508A (zh) * | 2018-08-31 | 2019-02-15 | 北京航空航天大学 | 一种基于两阶段神经网络的骨龄评价方法 |
CN109377441A (zh) * | 2018-08-20 | 2019-02-22 | 清华大学 | 具有隐私保护功能的舌像采集方法和系统 |
CN109493874A (zh) * | 2018-11-23 | 2019-03-19 | 东北农业大学 | 一种基于卷积神经网络的生猪咳嗽声音识别方法 |
CN111401145A (zh) * | 2020-02-26 | 2020-07-10 | 三峡大学 | 一种基于深度学习与ds证据理论的可见光虹膜识别方法 |
CN111445010A (zh) * | 2020-03-26 | 2020-07-24 | 南京工程学院 | 一种基于证据理论融合量子网络的配网电压趋势预警方法 |
US20200387785A1 (en) * | 2019-06-05 | 2020-12-10 | Wuhan University | Power equipment fault detecting and positioning method of artificial intelligence inference fusion |
CN112472065A (zh) * | 2020-11-18 | 2021-03-12 | 天机医用机器人技术(清远)有限公司 | 基于咳嗽声识别的病症检测方法及其相关设备 |
CN112686093A (zh) * | 2020-12-02 | 2021-04-20 | 重庆邮电大学 | 一种基于ds证据理论的融合局部放电类型识别方法 |
CN112784920A (zh) * | 2021-02-03 | 2021-05-11 | 湖南科技大学 | 云边端协同的旋转部件对抗域自适应故障诊断方法 |
CN112800875A (zh) * | 2021-01-14 | 2021-05-14 | 北京理工大学 | 一种混合特征融合和决策融合的多模态情感识别方法 |
CN113011302A (zh) * | 2021-03-11 | 2021-06-22 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种基于卷积神经网络的雷声信号识别系统及方法 |
CN113449672A (zh) * | 2021-07-07 | 2021-09-28 | 中国人民解放军国防科技大学 | 基于双线性孪生架构的遥感场景分类方法和装置 |
-
2022
- 2022-01-05 CN CN202210004800.5A patent/CN114330454A/zh active Pending
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107491726A (zh) * | 2017-07-04 | 2017-12-19 | 重庆邮电大学 | 一种基于多通道并行卷积神经网络的实时表情识别方法 |
CN108701469A (zh) * | 2017-07-31 | 2018-10-23 | 深圳和而泰智能家居科技有限公司 | 咳嗽声音识别方法、设备和存储介质 |
CN108717568A (zh) * | 2018-05-16 | 2018-10-30 | 陕西师范大学 | 一种基于三维卷积神经网络的图像特征提取与训练方法 |
CN109377441A (zh) * | 2018-08-20 | 2019-02-22 | 清华大学 | 具有隐私保护功能的舌像采集方法和系统 |
CN109345508A (zh) * | 2018-08-31 | 2019-02-15 | 北京航空航天大学 | 一种基于两阶段神经网络的骨龄评价方法 |
CN109493874A (zh) * | 2018-11-23 | 2019-03-19 | 东北农业大学 | 一种基于卷积神经网络的生猪咳嗽声音识别方法 |
US20200387785A1 (en) * | 2019-06-05 | 2020-12-10 | Wuhan University | Power equipment fault detecting and positioning method of artificial intelligence inference fusion |
CN111401145A (zh) * | 2020-02-26 | 2020-07-10 | 三峡大学 | 一种基于深度学习与ds证据理论的可见光虹膜识别方法 |
CN111445010A (zh) * | 2020-03-26 | 2020-07-24 | 南京工程学院 | 一种基于证据理论融合量子网络的配网电压趋势预警方法 |
CN112472065A (zh) * | 2020-11-18 | 2021-03-12 | 天机医用机器人技术(清远)有限公司 | 基于咳嗽声识别的病症检测方法及其相关设备 |
CN112686093A (zh) * | 2020-12-02 | 2021-04-20 | 重庆邮电大学 | 一种基于ds证据理论的融合局部放电类型识别方法 |
CN112800875A (zh) * | 2021-01-14 | 2021-05-14 | 北京理工大学 | 一种混合特征融合和决策融合的多模态情感识别方法 |
CN112784920A (zh) * | 2021-02-03 | 2021-05-11 | 湖南科技大学 | 云边端协同的旋转部件对抗域自适应故障诊断方法 |
CN113011302A (zh) * | 2021-03-11 | 2021-06-22 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种基于卷积神经网络的雷声信号识别系统及方法 |
CN113449672A (zh) * | 2021-07-07 | 2021-09-28 | 中国人民解放军国防科技大学 | 基于双线性孪生架构的遥感场景分类方法和装置 |
Non-Patent Citations (2)
Title |
---|
张振华等: "猪咳嗽声特征参数提取与识别的研究", 《黑龙江畜牧兽医》 * |
祁雪梅等: "《煤层气储层地震属性响应特征及应用》", 31 January 2017, 徐州:中国矿业大学出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115273908A (zh) * | 2022-08-05 | 2022-11-01 | 东北农业大学 | 一种基于分类器融合的生猪咳嗽声音识别方法 |
CN115457966A (zh) * | 2022-09-16 | 2022-12-09 | 东北农业大学 | 基于改进ds证据理论多分类器融合的猪咳嗽声识别方法 |
CN115457966B (zh) * | 2022-09-16 | 2023-05-12 | 东北农业大学 | 基于改进ds证据理论多分类器融合的猪咳嗽声识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105976809B (zh) | 基于语音和面部表情的双模态情感融合的识别方法及系统 | |
CN112465008B (zh) | 一种基于自监督课程学习的语音和视觉关联性增强方法 | |
CN105957531B (zh) | 基于云平台的演讲内容提取方法及装置 | |
CN114330454A (zh) | 一种基于ds证据理论融合特征的生猪咳嗽声音识别方法 | |
CN110148408A (zh) | 一种基于深度残差的中文语音识别方法 | |
CN102201237B (zh) | 基于模糊支持向量机的可靠性检测的情感说话人识别方法 | |
CN111508480A (zh) | 音频识别模型的训练方法、音频识别方法、装置及设备 | |
CN109410956A (zh) | 一种音频数据的对象识别方法、装置、设备及存储介质 | |
CN110473571A (zh) | 基于短视频语音的情感识别方法和装置 | |
CN112183107A (zh) | 音频的处理方法和装置 | |
CN117198468B (zh) | 基于行为识别和数据分析的干预方案智慧化管理系统 | |
CN115101076B (zh) | 一种基于多尺度通道分离卷积特征提取的说话人聚类方法 | |
CN106910495A (zh) | 一种应用于异常声音检测的音频分类系统和方法 | |
CN115565540B (zh) | 一种侵入式脑机接口汉语发音解码方法 | |
CN117765981A (zh) | 一种基于语音文本跨模态融合的情感识别方法及系统 | |
CN112183582A (zh) | 一种多特征融合的水下目标识别方法 | |
CN116758451A (zh) | 基于多尺度和全局交叉注意力的视听情感识别方法及系统 | |
Bai et al. | Multimodal urban sound tagging with spatiotemporal context | |
CN112466284B (zh) | 一种口罩语音鉴别方法 | |
CN109584861A (zh) | 基于深度学习的阿尔茨海默症语音信号的筛查方法 | |
CN110807370B (zh) | 一种基于多模态的会议发言人身份无感确认方法 | |
Sangeetha et al. | Analysis of machine learning algorithms for audio event classification using Mel-frequency cepstral coefficients | |
CN108629024A (zh) | 一种基于声音识别的教学考勤方法 | |
CN115700880A (zh) | 一种行为监测方法、装置、电子设备及存储介质 | |
CN113571050A (zh) | 一种基于Attention与Bi-LSTM的语音抑郁状态识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220412 |