CN109473120A - 一种基于卷积神经网络的异常声音信号识别方法 - Google Patents

一种基于卷积神经网络的异常声音信号识别方法 Download PDF

Info

Publication number
CN109473120A
CN109473120A CN201811350942.7A CN201811350942A CN109473120A CN 109473120 A CN109473120 A CN 109473120A CN 201811350942 A CN201811350942 A CN 201811350942A CN 109473120 A CN109473120 A CN 109473120A
Authority
CN
China
Prior art keywords
convolutional neural
neural networks
sampling
layer
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811350942.7A
Other languages
English (en)
Inventor
姜彦吉
荆德吉
葛少成
郭羽含
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Technical University
Original Assignee
Liaoning Technical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Technical University filed Critical Liaoning Technical University
Priority to CN201811350942.7A priority Critical patent/CN109473120A/zh
Publication of CN109473120A publication Critical patent/CN109473120A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks

Abstract

本发明提供一种基于卷积神经网络的异常声音信号识别方法,涉及声信号分类与识别技术领域。该方法首先利用现有的异常声音库采集6种异常声音样本,构成样本声音库,并形成带噪样本;然后对样本声音库中的声音进行预处理,并按照在时间和频域两个维度上排列成为二维的声音特征图,作为卷积神经网络模型的输入;使用代价函数计算训练集的实际输出结果与标签结果之间的误差,利用反向传播算法传递差值,并更新卷积神经网络的全连接层中的权值向量;使用监督学习方法训练卷积神经网络模型;最后输入测试集中的数据,验证卷积神经网络模型的准确性。本发明提供的基于卷积神经网络的异常声音信号识别方法,能够更加高效准确的识别出异常声音信号。

Description

一种基于卷积神经网络的异常声音信号识别方法
技术领域
本发明涉及声信号分类与识别技术领域,尤其涉及一种基于卷积神经网络的异常声音信号识别方法。
背景技术
工业生产过程中持续产生的噪声会对人体造成多方面的伤害,对人体的听力系统、神经系统有长期不可逆损伤;另一方面持续大量的噪声会淹没生产中有用的声信号,比如发生事故或危险后无法及时听到报警信号,铃声等,不能及时主动逃脱危险,对现场人们造成更大伤害,因此除了需要应用各种技术手段消除或减小工作环境中的噪声之外,对于难以彻底消除的噪声,要能在噪声环境中及时监控并辨别各类危险信号或警报声音信号,提高预警危险事件的准确率。对此类警示性声音识别中的采集过程相对于图像识别过程相比,更为容易简单,存储需求也更小,因此,对于声音信号的识别与分类的计算复杂度相对较低,效率也可以有效的提高,亦可以用于隐私性较高的环境。
发明内容
本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于卷积神经网络的异常声音信号识别方法,实现对异常声音的分类。
为解决上述技术问题,本发明所采取的技术方案是:一种基于卷积神经网络的异常声音信号识别方法,包括以下步骤:
步骤1、通过语音采集系统对声音进行采集,利用现有的异常声音库,共采集爆炸声、建筑坍塌声、撞击声、警报声、铃声、呼救声6种异常声音,每种声音采集N个样本,共采集6N个样本,构成样本声音库,其中包括五种不同的信噪比,分别为0dB、5dB、10dB、15dB与无噪声;并将采集的样本利用babble噪声形成带噪样本,加噪公式如下公式所示:
f(t)=h1*S(t)+h2*n(t)
其中,f(t)表示带噪声音信号,S(t)表示未带噪声音信号,n(t)表示babble噪声,h1、h2均为根据信噪比来决定的混合矩阵,*表示线性卷积;
将这些带噪样本分为测试集与训练集两部分,根据五种不同的信噪比,分别对每种声音随机抽取70%作为卷积神经网络中的训练集,随机抽取50%作为网络中的测试集;
步骤2、对样本声音库中的声音进行预处理;利用动态时间规整方法将样本声音库中所有异常声音规整为相同帧数,选择帧长256个采样点,帧移为128个采样点以及汉明窗进行分帧加窗操作,每一帧提取36维MFCC特征参数,其中包括MFCC系数、ΔMFCC和ΔΔMFCC,保证异常样本数量的特征向量排列成为相同的特征图输入到卷积神经网络;
步骤3、将步骤2预处理的异常声音信号按照在时间和频域两个维度上排列成为二维的声音特征图,作为卷积神经网络模型的输入,具体方法为:
所述卷积神经网络模型包括依序连接的两个卷积层、一个子采样层、一个卷积层、一个子采样层、一个全连接层以及一个Softmax分类层,具体为:
(1)卷积层C1,卷积核大小为2*2,步长为1,卷积核个数为10,无填充;
(2)子采样层S1,子采样窗口大小为2*2,步长为1,采样方法采用最大值采样方法;
(3)卷积层C3,卷积核大小为2*2,步长为1,卷积核个数为10,无填充;
(4)子采样层S2,子采样窗口大小为2*2,步长为1,采样方法采用最大值采样方法;
(5)全连接层,将子采样层S2的输出特征图转化为一维向量;
(6)Softmax分类层,采用六个神经元,与全连接层中的神经元进行全连接,得到六个预测值;
步骤3.1、将训练集中的声音特征图进行卷积运算操作,将2*2卷积核从左上端开始卷积,每次操作完成后,根据步长为1开始卷积操作,直至遍历整个声音特征图,最后得到一个二维的卷积特征图;
所述卷积层第l层的j个特征图的输出函数如下公式所示:
其中,l表示第l层,即为当前层,l-1即表示前一层;表示第l层的排列顺序为j的特征图;wi,j表示当前层与前一层特征图的卷积核;表示当前层的排列顺序为j的特征图的偏置;表示前一层第i个特征图;θ()为激励函数;M表示当前层特征图个数;表示当前层第j个特征图连接前一层特征图的数量;
为保证卷积神经网络被快速训练,减少网络的参数个数,将设置为0,激励函数θ()采用ReLUs函数,解决Sigmoid与Tanh函数极易出现梯度消失现象,卷积神经网络模型无法收敛的问题;所述ReLUs函数如下公式所示:
f(y)=max(0,y)
其中,y表示的值,ReLUs函数将该值与0作比较,解决了梯度消失的现象;
步骤3.2、利用最大值采样方法对步骤3.1得到的卷积特征图进行处理,减少卷积特征图的参数数量,如下公式所示:
其中,Ri表示第i个子采样区域,ai表示在Ri范围内的特征图,Si为第i个子采用区域的最大值;最大子采样法是挑选概率值ai中最大的值作为最终的子采样结果;
步骤3.3、重复步骤3.1与3.2,得到最终的子采样结果,并通过全连接层将子采样结果中的二维向量转化为一维向量;
所述全连接层的输入公式如下公式所示:
Hw,b(x)=δ(WTx+b)
其中,Hw,b(x)表示全连接层的输出,x表示全连接层输入的一个特征向量,W为全连接层的权值向量;b表示偏置向量,δ()表示全连接层的激励函数,如下公式所示:
步骤3.4、将全连接层中的一维向量输入到Softmax分类器中,得到六个预测值,作为最终的分类结果;
步骤4、使用代价函数计算训练集的实际输出结果与标签结果之间的误差,利用反向传播算法传递差值,并通过权值更新公式更新卷积神经网络的全连接层中的权值向量W,如下公式所示:
其中,J(W,b)表示代价函数,hw,b(xij)表示样本的实际输出值,yi为该样本的标签值,m表示训练集中的语音信号数量,xij表示语音信号中的幅值;
使用监督学习方法训练卷积神经网络模型,训练完后,保存训练完成的网络模型,设定监督学习方法的迭代次数为10次;
步骤5、输入测试集中的数据,计算出识别率,验证卷积神经网络模型的准确性。
采用上述技术方案所产生的有益效果在于:本发明提供的一种基于卷积神经网络的异常声音信号识别方法,将卷积神经网络应用于声音信号辨别中,得到对于声音信号的分类结果。由一对或多对卷积层与采样层代替全连接的隐藏层,这样在输出结果时,利用全连接层将所有频带的特征信息连接起来整合成一维的特征向量,对于分类结果具有更高的准确率。最终通过这种方法达到识别异常声音信号的效果。同时,卷积神经网络采用局部感受野的连接方式,降低了网络的复杂度,加快了模型的收敛速度。
附图说明
图1为本发明实施例提供的一种基于卷积神经网络的异常声音信号识别方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
一种基于卷积神经网络的异常声音信号识别方法,如图1所示,包括以下步骤:
步骤1、通过语音采集系统对声音进行采集,利用现有的异常声音库,共采集爆炸声、建筑坍塌声、撞击声、警报声、铃声、呼救声6种异常声音,每种声音采集1500个样本,共采集9000个样本,构成样本声音库,其中包括五种不同的信噪比,分别为0dB、5dB、10dB、15dB与无噪声;将采集的样本利用babble噪声形成带噪样本,加噪公式如下公式所示:
f(t)=h1*S(t)+h2*n(t)
其中,f(t)表示带噪声音信号,S(t)表示未带噪声音信号,n(t)表示babble噪声,h1、h2均为根据信噪比来决定的混合矩阵,*表示线性卷积;
将这些带噪样本分为测试集与训练集两部分,根据五种不同的信噪比,分别对每种声音随机抽取70%作为卷积神经网络中的训练集,随机抽取50%作为网络中的测试集;
步骤2、对样本声音库中的声音进行预处理;由于声音信号具有很大的随机性,每个异常声音样本时间长度不一致,所以每个异常声音样本的帧数也不相同,因此,利用动态时间规整方法将样本声音库中所有异常声音规整为相同帧数,选择帧长256个采样点,帧移为128个采样点以及汉明窗进行分帧加窗操作,每一帧提取36维MFCC特征参数,其中包括MFCC系数、ΔMFCC和ΔΔMFCC,保证异常样本数量的特征向量排列成为相同的特征图输入到卷积神经网络;
步骤3、由于卷积神经网络的输入向量为二维向量,因此,将步骤2预处理的异常声音信号按照在时间和频域两个维度上排列成为二维的声音特征图,作为卷积神经网络模型的输入,具体方法为:
所述卷积神经网络模型包括依序连接的两个卷积层、一个子采样层、一个卷积层、一个子采样层、一个全连接层以及一个Softmax分类层,具体为:
(1)卷积层C1,卷积核大小为2*2,步长为1,卷积核个数为10,无填充;
(2)子采样层S1,子采样窗口大小为2*2,步长为1,采样方法采用最大值采样方法;
(3)卷积层C3,卷积核大小为2*2,步长为1,卷积核个数为10,无填充;
(4)子采样层S2,子采样窗口大小为2*2,步长为1,采样方法采用最大值采样方法;
(5)全连接层,将子采样层S2的输出特征图转化为一维向量;
(6)Softmax分类层,采用六个神经元,与全连接层中的神经元进行全连接,得到六个预测值;
步骤3.1、将训练集中的声音特征图进行卷积运算操作,将2*2卷积核从左上端开始卷积,每次操作完成后,根据步长为1开始卷积操作,直至遍历整个声音特征图,最后得到一个二维的卷积特征图;卷积层第l层的j个特征图的输出函数如下公式所示:
其中,l表示第l层,即为当前层,l-1即表示前一层;表示第l层的排列顺序为j的特征图;wi,j表示当前层与前一层特征图的卷积核;表示当前层的排列顺序为j的特征图的偏置;表示前一层第i个特征图;θ()为激励函数;M表示当前层特征图个数;表示当前层第j个特征图连接前一层特征图的数量;
为保证卷积神经网络被快速训练,减少网络的参数个数,将设置为0,激励函数θ()采用ReLUs函数,解决Sigmoid与Tanh函数极易出现梯度消失现象,卷积神经网络模型无法收敛的问题;所述ReLUs函数如下公式所示:
f(y)=max(0,y)
其中,y表示的值,ReLUs函数将该值与0作比较,解决了梯度消失的现象;
步骤3.2、利用最大值采样方法对步骤3.1得到的卷积特征图进行处理,减少卷积特征图的参数数量,如下公式所示:
其中,Ri表示第i个子采样区域,ai表示在Ri范围内的特征图,Si为第i个子采用区域的最大值;最大子采样法是挑选概率值ai中最大的值作为最终的子采样结果;
步骤3.3、重复步骤3.1与3.2,得到最终的子采样结果,并通过全连接层将子采样结果中的二维向量转化为一维向量;
所述全连接层的输入公式如下公式所示:
Hw,b(x)=δ(WTx+b)
其中,Hw,b(x)表示全连接层的输出,x表示全连接层输入的一个特征向量,W为全连接层的权值向量;b表示偏置向量,δ()表示全连接层的激励函数,如下公式所示:
本实施例中,根据实验验证,α取0.005。
步骤3.4、将全连接层中的一维向量输入到Softmax分类器中,得到六个预测值,作为最终的分类结果;
步骤4、使用代价函数计算训练集的实际输出结果与标签结果之间的误差,利用反向传播算法传递差值,并通过权值更新公式更新卷积神经网络的全连接层中的权值向量W,如下公式所示:
其中,J(W,b)表示代价函数,hw,b(xij)表示样本的实际输出值,yi为该样本的标签值,m表示训练集中的语音信号数量,xij表示语音信号中的幅值;
使用监督学习方法训练卷积神经网络模型,训练完后,保存训练完成的网络模型,设定监督学习方法的迭代次数为10次;
步骤5、输入测试集中的数据,计算出识别率,验证卷积神经网络模型的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。

Claims (4)

1.一种基于卷积神经网络的异常声音信号识别方法,其特征在于:包括以下步骤:
步骤1、通过语音采集系统对声音进行采集,利用现有的异常声音库,共采集爆炸声、建筑坍塌声、撞击声、警报声、铃声、呼救声6种异常声音,每种声音采集N个样本,共采集6N个样本,构成样本声音库,其中包括五种不同的信噪比,分别为0dB、5dB、10dB、15dB与无噪声;并将采集的样本利用babble噪声形成带噪样本;
将这些带噪样本分为测试集与训练集两部分,根据五种不同的信噪比,分别对每种声音随机抽取70%作为卷积神经网络中的训练集,随机抽取50%作为网络中的测试集;
步骤2、对样本声音库中的声音进行预处理;利用动态时间规整方法将样本声音库中所有异常声音规整为相同帧数,选择帧长256个采样点,帧移为128个采样点以及汉明窗进行分帧加窗操作,每一帧提取36维MFCC特征参数,其中包括MFCC系数、ΔMFCC和ΔΔMFCC,保证异常样本数量的特征向量排列成为相同的特征图输入到卷积神经网络;
步骤3、将步骤2预处理的异常声音信号按照在时间和频域两个维度上排列成为二维的声音特征图,作为卷积神经网络模型的输入,具体方法为:
步骤3.1、将训练集中的声音特征图进行卷积运算操作,将2*2卷积核从左上端开始卷积,每次操作完成后,根据步长为1开始卷积操作,直至遍历整个声音特征图,最后得到一个二维的卷积特征图;
所述卷积层第l层的j个特征图的输出函数如下公式所示:
其中,l表示第l层,即为当前层,l-1即表示前一层;表示第l层的排列顺序为j的特征图;wi,j表示当前层与前一层特征图的卷积核;表示当前层的排列顺序为j的特征图的偏置;表示前一层第i个特征图;θ()为激励函数;M表示当前层特征图个数;表示当前层第j个特征图连接前一层特征图的数量;
步骤3.2、利用最大值采样方法对步骤3.1得到的卷积特征图进行处理,减少卷积特征图的参数数量,如下公式所示:
其中,Ri表示第i个子采样区域,ai表示在Ri范围内的特征图,Si为第i个子采用区域的最大值;最大子采样法是挑选概率值ai中最大的值作为最终的子采样结果;
步骤3.3、重复步骤3.1与3.2,得到最终的子采样结果,并通过全连接层将子采样结果中的二维向量转化为一维向量;
所述全连接层的输入公式如下公式所示:
Hw,b(x)=δ(WTx+b)
其中,Hw,b(x)表示全连接层的输出,x表示全连接层输入的一个特征向量,W为全连接层的权值向量;b表示偏置向量,δ()表示全连接层的激励函数,如下公式所示:
步骤3.4、将全连接层中的一维向量输入到Softmax分类器中,得到六个预测值,作为最终的分类结果;
步骤4、使用代价函数计算训练集的实际输出结果与标签结果之间的误差,利用反向传播算法传递差值,并通过权值更新公式更新卷积神经网络的全连接层中的权值向量W,如下公式所示:
其中,J(W,b)表示代价函数,hw,b(xij)表示样本的实际输出值,yi为该样本的标签值,m表示训练集中的语音信号数量,xij表示语音信号中的幅值;
使用监督学习方法训练卷积神经网络模型,训练完后,保存训练完成的网络模型,设定监督学习方法的迭代次数为10次;
步骤5、输入测试集中的数据,计算出识别率,验证卷积神经网络模型的准确性。
2.根据权利要求1所述的一种基于卷积神经网络的异常声音信号识别方法,其特征在于:步骤1所述将采集的样本利用babble噪声形成带噪样本,加噪公式如下公式所示:
f(t)=h1*S(t)+h2*n(t)
其中,f(t)表示带噪声音信号,S(t)表示未带噪声音信号,n(t)表示babble噪声,h1、h2均为根据信噪比来决定的混合矩阵,*表示线性卷积。
3.根据权利要求1所述的一种基于卷积神经网络的异常声音信号识别方法,其特征在于:所述卷积神经网络模型包括依序连接的两个卷积层、一个子采样层、一个卷积层、一个子采样层、一个全连接层以及一个Softmax分类层,具体为:
(1)卷积层C1,卷积核大小为2*2,步长为1,卷积核个数为10,无填充;
(2)子采样层S1,子采样窗口大小为2*2,步长为1,采样方法采用最大值采样方法;
(3)卷积层C3,卷积核大小为2*2,步长为1,卷积核个数为10,无填充;
(4)子采样层S2,子采样窗口大小为2*2,步长为1,采样方法采用最大值采样方法;
(5)全连接层,将子采样层S2的输出特征图转化为一维向量;
(6)Softmax分类层,采用六个神经元,与全连接层中的神经元进行全连接,得到六个预测值。
4.根据权利要求1所述的一种基于卷积神经网络的异常声音信号识别方法,其特征在于:所述步骤3.1为保证卷积神经网络被快速训练,减少网络的参数个数,将设置为0,激励函数θ()采用ReLUs函数,解决Sigmoid与Tanh函数极易出现梯度消失现象,卷积神经网络模型无法收敛的问题;所述ReLUs函数如下公式所示:
f(y)=max(0,y)
其中,y表示的值,ReLUs函数将该值与0作比较,解决了梯度消失的现象。
CN201811350942.7A 2018-11-14 2018-11-14 一种基于卷积神经网络的异常声音信号识别方法 Pending CN109473120A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811350942.7A CN109473120A (zh) 2018-11-14 2018-11-14 一种基于卷积神经网络的异常声音信号识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811350942.7A CN109473120A (zh) 2018-11-14 2018-11-14 一种基于卷积神经网络的异常声音信号识别方法

Publications (1)

Publication Number Publication Date
CN109473120A true CN109473120A (zh) 2019-03-15

Family

ID=65672554

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811350942.7A Pending CN109473120A (zh) 2018-11-14 2018-11-14 一种基于卷积神经网络的异常声音信号识别方法

Country Status (1)

Country Link
CN (1) CN109473120A (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033785A (zh) * 2019-03-27 2019-07-19 深圳市中电数通智慧安全科技股份有限公司 一种呼救识别方法、装置、可读存储介质及终端设备
CN110047512A (zh) * 2019-04-25 2019-07-23 广东工业大学 一种环境声音分类方法、系统及相关装置
CN110070888A (zh) * 2019-05-07 2019-07-30 颐保医疗科技(上海)有限公司 一种基于卷积神经网络的帕金森语音识别方法
CN110189769A (zh) * 2019-05-23 2019-08-30 复钧智能科技(苏州)有限公司 基于多个卷积神经网络模型结合的异常声音检测方法
CN110222841A (zh) * 2019-06-17 2019-09-10 苏州思必驰信息科技有限公司 基于间距损失函数的神经网络训练方法和装置
CN110322894A (zh) * 2019-06-27 2019-10-11 电子科技大学 一种基于声音的波形图生成及大熊猫检测方法
CN110322896A (zh) * 2019-06-26 2019-10-11 上海交通大学 一种基于卷积神经网络的变压器故障声音识别方法
CN110706720A (zh) * 2019-08-16 2020-01-17 广东省智能制造研究所 一种端到端无监督深度支撑网络的声学异常检测方法
CN110751957A (zh) * 2019-09-25 2020-02-04 电子科技大学 一种使用堆叠多尺度模块的语音增强方法
CN110880328A (zh) * 2019-11-20 2020-03-13 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质
CN111009261A (zh) * 2019-12-10 2020-04-14 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质
CN111049997A (zh) * 2019-12-25 2020-04-21 携程计算机技术(上海)有限公司 电话背景音乐检测模型方法、系统、设备及介质
CN111445926A (zh) * 2020-04-01 2020-07-24 杭州叙简科技股份有限公司 一种基于声音的农村道路交通事故警情识别方法
CN111460932A (zh) * 2020-03-17 2020-07-28 哈尔滨工程大学 基于自适应卷积的水声信号分类识别方法
CN111476102A (zh) * 2020-03-11 2020-07-31 华中科技大学鄂州工业技术研究院 一种安全防护方法、中控设备及计算机存储介质
CN111489739A (zh) * 2020-04-17 2020-08-04 杭州嘉楠耘智信息科技有限公司 音素识别方法、装置及计算机可读存储介质
CN111770427A (zh) * 2020-06-24 2020-10-13 杭州海康威视数字技术股份有限公司 麦克风阵列的检测方法、装置、设备以及存储介质
CN111782860A (zh) * 2020-06-08 2020-10-16 Oppo广东移动通信有限公司 一种音频检测方法及装置、存储介质
CN111968613A (zh) * 2020-08-24 2020-11-20 湖南工业大学 一种主动控制车辆全局空间噪声的卷积-模糊神经网络方法
CN112325936A (zh) * 2020-10-30 2021-02-05 北京印刷学院 一种物流环境检测识别方法及系统
CN112418181A (zh) * 2020-12-13 2021-02-26 西北工业大学 一种基于卷积神经网络的人员落水检测方法
CN112560674A (zh) * 2020-12-15 2021-03-26 北京天泽智云科技有限公司 一种声音信号质量的检测方法及系统
CN113223507A (zh) * 2021-04-14 2021-08-06 重庆交通大学 基于双输入互干扰卷积神经网络的异常语音识别方法
CN113327632A (zh) * 2021-05-13 2021-08-31 南京邮电大学 一种基于字典学习的无监督异常声检测方法和装置
CN113791727A (zh) * 2021-08-10 2021-12-14 广东省科学院智能制造研究所 一种应用于工业声学智能感知的边端采集设备
CN114013957A (zh) * 2021-11-29 2022-02-08 天津电子信息职业技术学院 基于声音信号的输送带纵向撕裂检测方法及相关设备
CN114131202A (zh) * 2021-12-30 2022-03-04 华中科技大学 激光-电弧复合焊时异常声信号的提取方法、系统及装置
CN114861835A (zh) * 2022-07-04 2022-08-05 浙江大学 一种基于非对称卷积的噪声性听力损失预测系统
CN117809853A (zh) * 2024-02-29 2024-04-02 首都医科大学附属北京友谊医院 一种肝细胞癌病理识别模型的构建方法及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140288928A1 (en) * 2013-03-25 2014-09-25 Gerald Bradley PENN System and method for applying a convolutional neural network to speech recognition
CN106846803A (zh) * 2017-02-08 2017-06-13 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
US20170193362A1 (en) * 2016-01-03 2017-07-06 Gracenote, Inc. Responding to remote media classification queries using classifier models and context parameters
CN107545890A (zh) * 2017-08-31 2018-01-05 桂林电子科技大学 一种声音事件识别方法
CN108630226A (zh) * 2018-05-08 2018-10-09 上海极歌企业管理咨询中心(有限合伙) 无人停车库运维安全的人工智能检测方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140288928A1 (en) * 2013-03-25 2014-09-25 Gerald Bradley PENN System and method for applying a convolutional neural network to speech recognition
US20170193362A1 (en) * 2016-01-03 2017-07-06 Gracenote, Inc. Responding to remote media classification queries using classifier models and context parameters
CN106846803A (zh) * 2017-02-08 2017-06-13 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
CN107545890A (zh) * 2017-08-31 2018-01-05 桂林电子科技大学 一种声音事件识别方法
CN108630226A (zh) * 2018-05-08 2018-10-09 上海极歌企业管理咨询中心(有限合伙) 无人停车库运维安全的人工智能检测方法及装置

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
FOGGIA, PASQUALE,PETKOV,等: "Reliable detection of audio events in highly noisy environments", 《PATTERN RECOGNITION LETTERS》 *
MCLOUGHLIN, IAN,ZHANG,等: "Robust Sound Event Classification Using Deep Neural Networks", 《IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 *
刘鹏: "《重庆大学硕士学位论文》", 30 November 2012 *
张文涛等: "基于卷积神经网络的交通声音事件识别方法", 《现代电子技术》 *
胡涛: "《安徽大学硕士学位论文》", 20 September 2018 *
胡涛等: "卷积神经网络在异常声音识别中的研究", 《信号处理》 *
陈秋菊: "基于卷积神经网络的声音场景识别", 《信息与电脑(理论版)》 *

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110033785A (zh) * 2019-03-27 2019-07-19 深圳市中电数通智慧安全科技股份有限公司 一种呼救识别方法、装置、可读存储介质及终端设备
CN110047512A (zh) * 2019-04-25 2019-07-23 广东工业大学 一种环境声音分类方法、系统及相关装置
CN110070888A (zh) * 2019-05-07 2019-07-30 颐保医疗科技(上海)有限公司 一种基于卷积神经网络的帕金森语音识别方法
CN110189769B (zh) * 2019-05-23 2021-11-19 复钧智能科技(苏州)有限公司 基于多个卷积神经网络模型结合的异常声音检测方法
CN110189769A (zh) * 2019-05-23 2019-08-30 复钧智能科技(苏州)有限公司 基于多个卷积神经网络模型结合的异常声音检测方法
CN110222841A (zh) * 2019-06-17 2019-09-10 苏州思必驰信息科技有限公司 基于间距损失函数的神经网络训练方法和装置
CN110322896A (zh) * 2019-06-26 2019-10-11 上海交通大学 一种基于卷积神经网络的变压器故障声音识别方法
CN110322894A (zh) * 2019-06-27 2019-10-11 电子科技大学 一种基于声音的波形图生成及大熊猫检测方法
CN110322894B (zh) * 2019-06-27 2022-02-11 电子科技大学 一种基于声音的波形图生成及大熊猫检测方法
CN110706720A (zh) * 2019-08-16 2020-01-17 广东省智能制造研究所 一种端到端无监督深度支撑网络的声学异常检测方法
CN110706720B (zh) * 2019-08-16 2022-04-22 广东省智能制造研究所 一种端到端无监督深度支撑网络的声学异常检测方法
CN110751957A (zh) * 2019-09-25 2020-02-04 电子科技大学 一种使用堆叠多尺度模块的语音增强方法
CN110880328A (zh) * 2019-11-20 2020-03-13 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质
CN111009261A (zh) * 2019-12-10 2020-04-14 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质
WO2021115232A1 (zh) * 2019-12-10 2021-06-17 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质
CN111009261B (zh) * 2019-12-10 2022-11-15 Oppo广东移动通信有限公司 到站提醒方法、装置、终端及存储介质
CN111049997A (zh) * 2019-12-25 2020-04-21 携程计算机技术(上海)有限公司 电话背景音乐检测模型方法、系统、设备及介质
CN111476102A (zh) * 2020-03-11 2020-07-31 华中科技大学鄂州工业技术研究院 一种安全防护方法、中控设备及计算机存储介质
CN111460932B (zh) * 2020-03-17 2022-06-21 哈尔滨工程大学 基于自适应卷积的水声信号分类识别方法
CN111460932A (zh) * 2020-03-17 2020-07-28 哈尔滨工程大学 基于自适应卷积的水声信号分类识别方法
CN111445926B (zh) * 2020-04-01 2023-01-03 杭州叙简科技股份有限公司 一种基于声音的农村道路交通事故警情识别方法
CN111445926A (zh) * 2020-04-01 2020-07-24 杭州叙简科技股份有限公司 一种基于声音的农村道路交通事故警情识别方法
CN111489739B (zh) * 2020-04-17 2023-06-16 嘉楠明芯(北京)科技有限公司 音素识别方法、装置及计算机可读存储介质
CN111489739A (zh) * 2020-04-17 2020-08-04 杭州嘉楠耘智信息科技有限公司 音素识别方法、装置及计算机可读存储介质
CN111782860A (zh) * 2020-06-08 2020-10-16 Oppo广东移动通信有限公司 一种音频检测方法及装置、存储介质
CN111770427A (zh) * 2020-06-24 2020-10-13 杭州海康威视数字技术股份有限公司 麦克风阵列的检测方法、装置、设备以及存储介质
CN111968613A (zh) * 2020-08-24 2020-11-20 湖南工业大学 一种主动控制车辆全局空间噪声的卷积-模糊神经网络方法
CN111968613B (zh) * 2020-08-24 2023-09-19 湖南工业大学 一种主动控制车辆全局空间噪声的卷积-模糊神经网络方法
CN112325936A (zh) * 2020-10-30 2021-02-05 北京印刷学院 一种物流环境检测识别方法及系统
CN112418181B (zh) * 2020-12-13 2023-05-02 西北工业大学 一种基于卷积神经网络的人员落水检测方法
CN112418181A (zh) * 2020-12-13 2021-02-26 西北工业大学 一种基于卷积神经网络的人员落水检测方法
CN112560674B (zh) * 2020-12-15 2024-02-23 北京天泽智云科技有限公司 一种声音信号质量的检测方法及系统
CN112560674A (zh) * 2020-12-15 2021-03-26 北京天泽智云科技有限公司 一种声音信号质量的检测方法及系统
CN113223507B (zh) * 2021-04-14 2022-06-24 重庆交通大学 基于双输入互干扰卷积神经网络的异常语音识别方法
CN113223507A (zh) * 2021-04-14 2021-08-06 重庆交通大学 基于双输入互干扰卷积神经网络的异常语音识别方法
CN113327632B (zh) * 2021-05-13 2023-07-28 南京邮电大学 一种基于字典学习的无监督异常声检测方法和装置
CN113327632A (zh) * 2021-05-13 2021-08-31 南京邮电大学 一种基于字典学习的无监督异常声检测方法和装置
CN113791727A (zh) * 2021-08-10 2021-12-14 广东省科学院智能制造研究所 一种应用于工业声学智能感知的边端采集设备
CN113791727B (zh) * 2021-08-10 2023-03-24 广东省科学院智能制造研究所 一种应用于工业声学智能感知的边端采集设备
CN114013957A (zh) * 2021-11-29 2022-02-08 天津电子信息职业技术学院 基于声音信号的输送带纵向撕裂检测方法及相关设备
CN114131202A (zh) * 2021-12-30 2022-03-04 华中科技大学 激光-电弧复合焊时异常声信号的提取方法、系统及装置
CN114861835A (zh) * 2022-07-04 2022-08-05 浙江大学 一种基于非对称卷积的噪声性听力损失预测系统
CN117809853A (zh) * 2024-02-29 2024-04-02 首都医科大学附属北京友谊医院 一种肝细胞癌病理识别模型的构建方法及电子设备

Similar Documents

Publication Publication Date Title
CN109473120A (zh) 一种基于卷积神经网络的异常声音信号识别方法
CN110491416B (zh) 一种基于lstm和sae的电话语音情感分析与识别方法
CN110189769B (zh) 基于多个卷积神经网络模型结合的异常声音检测方法
CN110245608B (zh) 一种基于半张量积神经网络的水下目标识别方法
CN109493874A (zh) 一种基于卷积神经网络的生猪咳嗽声音识别方法
CN106710599A (zh) 一种基于深度神经网络的特定声源检测方法与系统
CN110308485B (zh) 基于深度学习的微震信号分类方法、装置及存储介质
CN108875592A (zh) 一种基于注意力的卷积神经网络优化方法
CN113643723B (zh) 一种基于注意力CNN Bi-GRU融合视觉信息的语音情感识别方法
CN108899051A (zh) 一种基于联合特征表示的语音情感识别模型及识别方法
CN108520753A (zh) 基于卷积双向长短时记忆网络的语音测谎方法
CN110070895B (zh) 一种基于监督变分编码器因素分解的混合声音事件检测方法
CN109243494A (zh) 基于多重注意力机制长短时记忆网络的儿童情感识别方法
CN111341319B (zh) 一种基于局部纹理特征的音频场景识别方法及系统
CN106898354B (zh) 基于dnn模型和支持向量机模型的说话人个数估计方法
CN113205820B (zh) 一种用于声音事件检测的声音编码器的生成方法
CN111986679A (zh) 一种应对复杂声学环境的说话人确认方法、系统及存储介质
CN114220458B (zh) 基于阵列水听器的声音识别方法和装置
CN112183582A (zh) 一种多特征融合的水下目标识别方法
CN113191178A (zh) 一种基于听觉感知特征深度学习的水声目标识别方法
CN115862684A (zh) 一种基于音频的双模式融合型神经网络的抑郁状态辅助检测的方法
CN111243621A (zh) 一种用于合成语音检测的gru-svm深度学习模型的构造方法
CN116778956A (zh) 一种变压器声学特征提取及故障识别方法
Whitehill et al. Whosecough: In-the-wild cougher verification using multitask learning
Xiao et al. AMResNet: An automatic recognition model of bird sounds in real environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190315

RJ01 Rejection of invention patent application after publication