CN111354366B - 一种异常声音检测方法及异常声音检测装置 - Google Patents
一种异常声音检测方法及异常声音检测装置 Download PDFInfo
- Publication number
- CN111354366B CN111354366B CN201811561607.1A CN201811561607A CN111354366B CN 111354366 B CN111354366 B CN 111354366B CN 201811561607 A CN201811561607 A CN 201811561607A CN 111354366 B CN111354366 B CN 111354366B
- Authority
- CN
- China
- Prior art keywords
- audio
- detected
- audio signal
- abnormal sound
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 123
- 238000001514 detection method Methods 0.000 title claims abstract description 46
- 230000005236 sound signal Effects 0.000 claims abstract description 118
- 238000000034 method Methods 0.000 claims description 21
- 238000013145 classification model Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 11
- 238000012706 support-vector machine Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 238000012850 discrimination method Methods 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明提供了一种异常声音检测方法,包括将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进行异常声音准确判定;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则进行异常声音准确判定。异常声音准确判定是一个基于双层结构的分类器,能够实现异常声音信号的类型判定。同时本发明还提供了一种异常声音检测装置。本发明提供的异常声音检测方法和异常声音检测装置,能够实时、快速的判断待测音频信号是正常音频信号还是异常音频信号。
Description
技术领域
本发明涉及音频信号处理领域,特别涉及一种异常声音检测方法和异常声音检测装置。
背景技术
随着生产制造领域技术的提升,越来越多的大型设备得以进入生产车间。但因其高精度、高复杂度、高昂的维护费用,及非常规性停机造成巨大的经济损失。因此,需要通过自动化方法进行实时监控当前设备的运行状态。传统的基于传感器和视频监控目前得到了广泛的应用,但通常情况下传感器由于种种故障而先于设备失效,而视频监控更大的意义在于对设备出现故障后进行回看检查。基于异常声音检测的方法能够实时地捕获设备由于非正常工作所产生的异常声音。基于异常声音的检测方法是通过分析设备运行时声音特征,跟设备正常运行时声音特征进行对比,如果两种声音信号区别较大,则表明当前设备处于异常状态;否则,当前设备处于正常状态。当系统判定出设备处于异常工作状态时,能够及时准确地给出报警提示。
目前主流的异常声音检测的技术方案是利用分类的方法对捕获的音频信号与正常工作状态下的信号进行对比分析。其中,在音频信号的特征抽取中,过零率,Mel倒谱系数(MFCC)及其导数,小波系数及其以均值、方差为代表的统计学参数,信号能量等属性应用广泛;在参数抽取中以Gaussian混合模型和隐马尔科夫模型应用最为广泛;在分类过程中,以人工神经网络和支持向量机最为应用广泛。
这些分类方法在固定数据集经过一定次数的训练后,基本上都能够取得较好的分类效果。但在实际应用中,分类方法存在一个典型的缺点,需要使用分类器结合训练数据集进行相关的训练,而在实际环节中,因设备的异常状态而产生的异常声音在获取时有一定的难度,且在训练前需要使用多个类型的异常数据,这在客观情况下增加了问题的难度。
发明内容
本发明旨在至少解决上述技术问题之一,提供一种能够实时、快速的判断待测音频信号是正常音频信号还是异常音频信号的异常声音检测方法和异常声音检测装置。
为实现上述目的,本发明采用以下技术方案:
本发明提供了一种异常声音检测方法,包括以下步骤:
步骤一,建立音频库;建立正常音频特征标准库和异常音频特征标准库;
步骤二,采集分析音频信号;采集待测音频信号,去除噪声,获取有效待测音频信号;抽取有效待测音频信号的待测音频特征参数;
步骤三,快速判定异常声音;将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进一步执行异常声音准确判定;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则进行异常声音准确判定;
步骤四,进行异常声音准确判定;使用正常声音数据特征和异常声音数据特征训练一个基于分层结构的分类模型,如果分类模型准确率能够达到预先设定的指标,则认为分类模型训练完成;
将待测音频特征参数输入训练好的分类模型进行异常声音判定;
若判定结果为异常音频信号,则输出当前待测音频信号为异常信号;
若判定结果为正常音频信号,则输出当前待测音频信号为正常信号。
一些实施例中,采集待测音频信号后,去除噪声,通过待测音频信号的短时能量和平均过零率,判断待测音频信号是否为有效待测音频信号;然后获取有效待测音频信号。
一些实施例中,所述待测音频特征参数、标准音频特征参数和异常音频特征参数为:通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数,并利用Gaussian进行参数拟合,获取的音频数据的均值和方差。
一些实施例中,所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为:
KL(P,Q)=1/2(KL(P,Q)+KL(Q,P))。
其中,KL散度的计算公式为KL(P,Q)=∑[P(x)log(P(x)/Q(x))]。
一些实施例中,所述基于分层结构的分类模型为,特征信号输入至第一分类层,该层分类方法包括支持向量机、奇异值分解的组合,经第一层分类后的特征,结合原始特征,共同作为第二层分类器的输入特征值,第二层分类器使用支持向量机进行分类。
一些实施例中,采集待测音频信号后,将待测音频信号分为10ms为一帧的声音片段,计算每帧的短时能量和过零率,使用两级判别法进行有效声音的端点检测,进而获取有效待测音频信号。
一些实施例中,所述梅尔倒谱系数使用13维度作为特征参数,并使用15ms作为一帧数据,利用Gaussian进行参数拟合,获取音频数据的均值和方差。
本发明还提供了一种异常声音检测装置,包括:
音频特征标准库建立单元,用于建立正常音频特征标准库和异常声音特征标准库;
音频采集单元,用于采集待测音频信号;
有效音频检测单元,用于根据采集到的待测音频信号,获取有效待测音频信号;
音频特征提取单元,用于抽取有效待测音频信号的待测音频特征参数;
音频特征判定单元,用于将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进行异常声音准确判定;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则给出需要进行异常声音准确判定的输出结果;
音频特征分类单元,用于当音频特征判定单元的输出结果为需要进行异常声音准确判定时,将待测音频特征参数输入异常音频判定模型进行判定,判定待测音频信号是否为正常音频信号;若判定结果认定待测音频信号为异常音频信号,则将待测音频特征参数与异常音频特征标准库中的异常音频特征参数进行对比,判定异常音频信号的类型。
一些实施例中,所述异常声音检测装置还包括异常报警单元,所述异常报警单元用于根据音频特征分类单元输出的异常音频信号的类型,给出与该类型对应的报警提示。
本发明的有益效果在于:本发明提供的异常声音检测方法,在异常声音检测过程中,先对待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,以判定是否需要进行异常声音准确判定;通过该步骤的初步判定,若判定结果为正常音频信号,则不用再进行后续的判定过程;能够通过该步骤,实时、快速的进行异常声音检测。同时,本发明提供的异常声音检测装置中,加入了音频特征判定单元,进行KL散度的对比。
附图说明
图1是本发明一个实施例中,异常声音检测方法的检测流程示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“设置”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面将结合附图1详细说明一下本发明提供的异常声音检测方法。
如图1所示,本发明提供的异常声音检测方法,包括以下步骤:
步骤一,建立音频库;建立正常音频特征标准库和异常音频特征标准库;
步骤二,采集分析音频信号;采集待测音频信号,去除噪声,获取有效待测音频信号;抽取有效待测音频信号的待测音频特征参数;
步骤三,快速判定异常声音;将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进一步执行异常声音准确判定;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则进行异常声音准确判定;
步骤四,进行异常声音准确判定;使用正常声音数据特征和异常声音数据特征训练一个基于分层结构的分类模型,如果分类模型准确率能够达到预先设定的指标,则认为分类模型训练完成;
将待测音频特征参数输入训练好的分类模型进行异常声音判定;
若判定结果为异常音频信号,则输出当前待测音频信号为异常信号;
若判定结果为正常音频信号,则输出当前待测音频信号为正常信号。
通过在异常声音检测过程中,先对待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,以判定是否需要进行异常声音准确判定;通过该步骤的初步判定,若判定结果为正常音频信号,则不用再进行后续的判定过程;能够通过该步骤,实时、快速的进行异常声音检测。
在数据采集、特征抽取和数据分类的基础上,增加了一个数据预处理的阶段,通过计算数据之间的KL散度差值,快速比对并给出判定结果,能够有效提升处理的效率;尤其是针对实时数据处理时,对能够直接判定为正常声音的数据,降低了处理的复杂度,提高了工作效率。
本发明的一个实施例中,采集待测音频信号后,去除噪声,通过待测音频信号的短时能量和平均过零率,判断待测音频信号是否为有效待测音频信号;然后获取有效待测音频信号。通过待测音频信号的短时能量和平均过零率的计算,判断待测音频信号是否为有效待测音频信号,若判定结果为是,则获取有效待测音频信号。
更具体的,一个实施例中,采集待测音频信号后,将待测音频信号分为10ms为一帧的声音片段,计算每帧的短时能量和过零率,使用两级判别法进行有效声音的端点检测,进而获取有效待测音频信号。
在采集待测音频信号后,获取有效待测音频信号,可以去除噪声及无效音频信号,确保了异常声音检测的准确性。
本发明的一个实施例中,待测音频特征参数、标准音频特征参数和异常音频特征参数采用相同的方法获取,以保证各参数之间的一致性和可对比性。具体的,通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数,并利用Gaussian进行参数拟合,获取的音频数据的均值和方差。在本发明中,均值和方差都是统计学特征,保证了特征参数的有效性和准确性;有效防止了个别特征不准确的问题。
本发明一个实施例中,所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为:
KL(P,Q)=1/2(KL(P,Q)+KL(Q,P))。
其中,KL散度的计算公式为KL(P,Q)=∑[P(x)log(P(x)/Q(x))]。
本发明一个实施例中,所述基于分层结构的分类模型为,特征信号输入至第一分类层,该层分类方法包括支持向量机、奇异值分解的组合,经第一层分类后的特征,结合原始特征,共同作为第二层分类器的输入特征值,第二层分类器使用支持向量机进行分类。
一个具体实施例中,采集待测音频信号后,将待测音频信号分为10ms为一帧的声音片段,计算每帧的短时能量和过零率,使用两级判别法进行有效声音的端点检测,进而获取有效待测音频信号。
一个具体实施例中,所述梅尔倒谱系数使用13维度作为特征参数,并使用15ms作为一帧数据,利用Gaussian进行参数拟合,获取音频数据的均值和方差。此外,梅尔倒谱系数一阶导数也使用13维度作为特征参数。
在本发明中,异常音频特征标准库的建立,基于包括电机发生异常声音、设备不能自主行走等情况下,检测到的异常音频特征。并且,通过对全体数据进行训练,使得分层SVM模型具有较高的分类准确率,提高了相关特征参数的准确性和稳定性。其中,90%的数据用于训练,10%的数据用于测试和对比。并且通过多次重复,保证系统能够取得较好的准确性和效果。
为了便于实现本发明提供的异常声音检测方法,本发明还提供了一种异常声音检测装置,包括,
音频特征标准库建立单元,用于建立正常音频特征标准库和异常声音特征标准库;
音频采集单元,用于采集待测音频信号;
有效音频检测单元,用于根据采集到的待测音频信号,获取有效待测音频信号;
音频特征提取单元,用于抽取有效待测音频信号的待测音频特征参数;
音频特征判定单元,用于将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进行异常声音准确判定;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则给出需要进行异常声音准确判定的输出结果;
音频特征分类单元,用于当音频特征判定单元的输出结果为需要进行异常声音准确判定时,将待测音频特征参数输入异常音频判定模型进行判定,判定待测音频信号是否为正常音频信号;若判定结果认定待测音频信号为异常音频信号,则将待测音频特征参数与异常音频特征标准库中的异常音频特征参数进行对比,判定异常音频信号的类型。
同时,本发明提供的异常声音检测装置中还包括异常报警单元,用于根据音频特征分类单元输出的异常音频信号的类型,给出与该类型对应的报警提示。具体的,不同的异常声音类型,对应给出不同的报警提示,以方便操作人员获知异常声音的类型,更加方便检测和确认。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (9)
1.一种异常声音检测方法,其特征在于,包括以下步骤:
步骤一,建立音频库;建立正常音频特征标准库和异常音频特征标准库;
步骤二,采集分析音频信号;采集待测音频信号,去除噪声,获取有效待测音频信号;抽取有效待测音频信号的待测音频特征参数;
步骤三,快速判定异常声音;将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进一步执行异常声音准确判定;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;
若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则进行异常声音准确判定;
步骤四,进行异常声音准确判定;使用正常声音数据特征和异常声音数据特征训练一个基于分层结构的分类模型,如果分类模型准确率能够达到预先设定的指标,则认为分类模型训练完成;
将待测音频特征参数输入训练好的分类模型进行异常声音判定;
若判定结果为异常音频信号,则输出当前待测音频信号为异常信号;
若判定结果为正常音频信号,则输出当前待测音频信号为正常信号。
2.根据权利要求1所述的异常声音检测方法,其特征在于,采集待测音频信号后,去除噪声,通过待测音频信号的短时能量和平均过零率,判断待测音频信号是否为有效待测音频信号;然后获取有效待测音频信号。
3.根据权利要求1所述的异常声音检测方法,其特征在于,所述待测音频特征参数、标准音频特征参数和异常音频特征参数为:通过提取待测音频信号的梅尔倒谱系数、梅尔倒谱系数一阶导数、小波变换系数、能量值、过零率和傅里叶系数,并利用Gaussian进行参数拟合,获取的音频数据的均值和方差。
4.根据权利要求3所述的异常声音检测方法,其特征在于,所述待测音频特征参数的KL散度与标准音频特征参数的KL散度差值计算公式为:
KL(P,Q)=1/2(KL(P,Q)+KL(Q,P));
其中,KL散度的计算公式为KL(P,Q)=∑[P(x)log(P(x)/Q(x))]。
5.根据权利要求1所述的异常声音检测方法,其特征在于,所述基于分层结构的分类模型为,特征信号输入至第一分类层,该层分类方法包括支持向量机、奇异值分解的组合,经第一层分类后的特征,结合原始特征,共同作为第二层分类器的输入特征值,第二层分类器使用支持向量机进行分类。
6.根据权利要求2所述的异常声音检测方法,其特征在于,采集待测音频信号后,将待测音频信号分为10ms为一帧的声音片段,计算每帧的短时能量和过零率,使用两级判别法进行有效声音的端点检测,进而获取有效待测音频信号。
7.根据权利要求3所述的异常声音检测方法,其特征在于,所述梅尔倒谱系数使用13维度作为特征参数,并使用15ms作为一帧数据,利用Gaussian进行参数拟合,获取音频数据的均值和方差。
8.一种异常声音检测装置,其特征在于,包括,
音频特征标准库建立单元,用于建立正常音频特征标准库和异常声音特征标准库;
音频采集单元,用于采集待测音频信号;
有效音频检测单元,用于根据采集到的待测音频信号,获取有效待测音频信号;
音频特征提取单元,用于抽取有效待测音频信号的待测音频特征参数;
音频特征判定单元,用于将待测音频特征参数与正常音频特征标准库中的标准音频特征参数进行KL散度对比,判定是否需要进行异常声音准确判定;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值小于预设阈值,则输出待测音频信号为正常音频信号的结果;若待测音频特征参数的KL散度与标准音频特征参数的KL散度差值大于预设阈值,则给出需要进行异常声音准确判定的输出结果;
音频特征分类单元,用于当音频特征判定单元的输出结果为需要进行异常声音准确判定时,将待测音频特征参数输入异常音频判定模型进行判定,判定待测音频信号是否为正常音频信号;若判定结果认定待测音频信号为异常音频信号,则将待测音频特征参数与异常音频特征标准库中的异常音频特征参数进行对比,判定异常音频信号的类型。
9.根据权利要求8所述的异常声音检测装置,其特征在于,还包括异常报警单元,所述异常报警单元用于根据音频特征分类单元输出的异常音频信号的类型,给出与该类型对应的报警提示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811561607.1A CN111354366B (zh) | 2018-12-20 | 2018-12-20 | 一种异常声音检测方法及异常声音检测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811561607.1A CN111354366B (zh) | 2018-12-20 | 2018-12-20 | 一种异常声音检测方法及异常声音检测装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111354366A CN111354366A (zh) | 2020-06-30 |
CN111354366B true CN111354366B (zh) | 2023-06-16 |
Family
ID=71195262
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811561607.1A Active CN111354366B (zh) | 2018-12-20 | 2018-12-20 | 一种异常声音检测方法及异常声音检测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111354366B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112484234A (zh) * | 2020-12-08 | 2021-03-12 | 上海应用技术大学 | 一种基于数字特征的空调异响检测方法及系统 |
CN112466290B (zh) * | 2021-02-02 | 2021-05-28 | 鹏城实验室 | 异常声音检测模型的训练方法、装置和计算机存储介质 |
CN113423052B (zh) * | 2021-05-24 | 2023-03-14 | 深圳市维仕声学有限公司 | 一种音频检测的方法及终端 |
CN113670434B (zh) * | 2021-06-21 | 2023-05-02 | 深圳供电局有限公司 | 变电站设备声音异常识别方法、装置和计算机设备 |
CN113484416A (zh) * | 2021-07-05 | 2021-10-08 | 北京房江湖科技有限公司 | 瓷砖空鼓检测方法和装置、存储介质、电子设备 |
CN113409818A (zh) * | 2021-08-18 | 2021-09-17 | 宁波帅特龙集团有限公司 | 一种基于声音传感器的生产设备预测性维修方法与系统 |
CN114781424B (zh) * | 2022-02-11 | 2023-04-18 | 中国石油大学(北京) | 一种基于小波分解的水力压裂信号分析方法、装置和设备 |
CN114882860B (zh) * | 2022-06-14 | 2023-04-07 | 南京工程学院 | 一种基于聚类分析的充电桩降噪控制方法、装置和系统 |
CN115035913B (zh) * | 2022-08-11 | 2022-11-11 | 合肥中科类脑智能技术有限公司 | 一种声音异常检测方法 |
CN115512688A (zh) * | 2022-09-02 | 2022-12-23 | 广东美云智数科技有限公司 | 异音检测方法及装置 |
CN115602196B (zh) * | 2022-12-12 | 2023-04-07 | 杭州兆华电子股份有限公司 | 一种固定转速电机的异响声识别系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163427A (zh) * | 2010-12-20 | 2011-08-24 | 北京邮电大学 | 一种基于环境模型的音频异常事件检测方法 |
CN103198838A (zh) * | 2013-03-29 | 2013-07-10 | 苏州皓泰视频技术有限公司 | 一种用于嵌入式系统的异常声音监控方法和监控装置 |
CN108320734A (zh) * | 2017-12-29 | 2018-07-24 | 安徽科大讯飞医疗信息技术有限公司 | 语音信号处理方法及装置、存储介质、电子设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007199017A (ja) * | 2006-01-30 | 2007-08-09 | Omron Corp | 異音明瞭化方法、異音明瞭化装置および異音検査装置 |
US10014003B2 (en) * | 2015-10-12 | 2018-07-03 | Gwangju Institute Of Science And Technology | Sound detection method for recognizing hazard situation |
-
2018
- 2018-12-20 CN CN201811561607.1A patent/CN111354366B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102163427A (zh) * | 2010-12-20 | 2011-08-24 | 北京邮电大学 | 一种基于环境模型的音频异常事件检测方法 |
CN103198838A (zh) * | 2013-03-29 | 2013-07-10 | 苏州皓泰视频技术有限公司 | 一种用于嵌入式系统的异常声音监控方法和监控装置 |
CN108320734A (zh) * | 2017-12-29 | 2018-07-24 | 安徽科大讯飞医疗信息技术有限公司 | 语音信号处理方法及装置、存储介质、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111354366A (zh) | 2020-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111354366B (zh) | 一种异常声音检测方法及异常声音检测装置 | |
CN110514957A (zh) | 变电站自动巡检方法和平台 | |
CN110867196A (zh) | 一种基于深度学习及声音识别的机器设备状态监测系统 | |
CN109352416B (zh) | 一种机床主轴夹屑和/或刀具缠屑的报警方法及装置 | |
CN106649755B (zh) | 一种多维度实时变电设备数据的阈值自适应设置异常检测方法 | |
CN112504673B (zh) | 基于机器学习的托辊故障诊断方法、系统及存储介质 | |
CN102706560B (zh) | 一种风力发电机组的状态监测方法和装置 | |
CN115409131B (zh) | 基于spc过程管控系统的生产线异常检测方法 | |
CN112193959A (zh) | 电梯异响检测方法及系统 | |
CN105626502B (zh) | 基于小波包和拉普拉斯特征映射的柱塞泵健康评估方法 | |
CN112487708A (zh) | 一种基于集成学习的电阻点焊质量预测方法 | |
CN110231529A (zh) | 一种控制柜智能故障诊断系统及故障诊断方法 | |
CN110378618A (zh) | 基于在线烟丝表面缺陷检测的质量评价方法及系统 | |
CN105302123B (zh) | 在线测量数据的监控方法 | |
CN116383633A (zh) | 一种多因素综合分析的机制砂振动筛故障检测方法及系统 | |
CN108470570B (zh) | 电机异音检测方法 | |
CN103941722A (zh) | 通过部件特征倍频幅值趋势监测和诊断设备故障的方法 | |
CN116778964A (zh) | 一种基于声纹识别的变电设备故障监测系统及方法 | |
CN115618205A (zh) | 一种便携式声纹故障检测系统及方法 | |
CN114462475A (zh) | 一种基于单分类算法的无监督机器异常声检测方法和装置 | |
CN112711850A (zh) | 一种基于大数据的机组在线监测方法 | |
CN109598309B (zh) | 一种金属包装冲压机的检测系统及其监测方法 | |
CN103821750B (zh) | 一种基于电流的通风机失速和喘振监测及诊断方法 | |
DE112019007899T5 (de) | System und Methode für die Vorhersage von Gerätefehler mittels akustischer Signale im Ultraschallfrequenzband | |
TWI628021B (zh) | 用於放電加工機之精度預測的特徵萃取方法及預測方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |