CN111048114A - 一种设备异常声音检测的设备及方法 - Google Patents
一种设备异常声音检测的设备及方法 Download PDFInfo
- Publication number
- CN111048114A CN111048114A CN201911424237.1A CN201911424237A CN111048114A CN 111048114 A CN111048114 A CN 111048114A CN 201911424237 A CN201911424237 A CN 201911424237A CN 111048114 A CN111048114 A CN 111048114A
- Authority
- CN
- China
- Prior art keywords
- audio
- data
- equipment
- module
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 32
- 239000002245 particle Substances 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000005457 optimization Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims abstract description 4
- 238000011161 development Methods 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 18
- 238000004891 communication Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 13
- 238000007405 data analysis Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 239000002184 metal Substances 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000009713 electroplating Methods 0.000 claims description 2
- 230000018109 developmental process Effects 0.000 claims 8
- 230000011218 segmentation Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 7
- 230000009467 reduction Effects 0.000 abstract description 4
- 238000011156 evaluation Methods 0.000 abstract description 3
- 238000001228 spectrum Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/72—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for transmitting results of analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
一种设备异常声音检测的设备,包括设备主体,其特征在于:设备主体包括前端数据采集器和边缘计算容器;前端数采集器是一个能采集音频特征并将数据信号压缩、传输和存储的设备;其技术要点为,在音频数据处理中将数据切片处理后,MFCC方法提取出的音频特征,将所得每一片特征向量矩阵拉直,对其进行降维处理,提取出的音频特征更优,聚类效果更加显著;采用基于粒子群优化的自组织特征映射神经网络(PSO-SOM)的聚类算法无需知道数据的标签,在一段较长的设备运行声音数据中默认将数据量较大的一类归为正常运行声音,SO-SOM算法在聚类效果评价指标(AVQ、UTE、LWDI)上均优于SOM基本算法,所得网络质量较好,错聚率较低。
Description
技术领域
本发明属于声音检测技术领域,具体是一种设备异常声音检测的设备及方法。
背景技术
音频监控技术是监控应用中最重要的组成部分之一,实现智能化音频监控的关键是从环境背景声音中自动地检测出异常声音。对异常声音识别需要从多个叠加在设备运行环境背景声音中区分出异常声音,有效对目标场景进行实时检测,智能化音频监控的实时大大减少对设备检测所需的人力、物力、财力。
目前异常声音检测已应用到安全监控、工业生产、医疗等领域,通过音频监控能够达到实时报警的目的,使人类现代化生活更加便捷。异常声音检测实质上是属于模式分类问题,将声音信号分为异常声音和环境背景声音,是一个二分类问题,目的是将异常声音片段从环境背景声音中截取出来。
检测方法主要集中在提取音频信号中不同类型的特征,用机器学习算法训练有效的分类器进行识别。异常声音检测的效果基本上取决于提取的特征的质量,想要达到精确的检测效果,提取的音频特征要能很好地表示数据。在提取到有效特征后,要训练一个分类器使其学习到训练数据中的共性规律,并利用学习到的规律对未知样本进行预测。
现有的相近研究提出基于MFCC算法和SVM算法对异常声音进行预测,该研究在数据预处理、提取音频信号特征上存在缺陷,没有消除采集过程中声音样本之间的数值量级的差异,样本数据转化后的音频特征不突出,致使在多个环境背景声音下无法区分出异常声音,此外基于粒子群优化和SOM的算法明显优于SVM算法。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种设备异常声音检测的设备及方法。
为实现上述目的,本发明采用了如下技术方案:
一种设备异常声音检测的设备,包括设备主体,其特征在于:所述设备主体包括前端数据采集器和边缘计算容器;
所述前端数采集器是一个能采集音频特征并将数据信号压缩、传输和存储的设备,该设备包含音频采集模块、音频服务模块以及存储模块;
所述边缘计算容器是一个能获取数据并具有计算分析能力的设备,该设备包含arm开发板、网络通讯模块、报警模块以及电源模块。
优选的,所述音频采集模块采用拾音器设备,拾音器设备可实现户外、远距离环境的高保真录音操作,采用金属外壳,并在其表面电镀处理。
优选的,所述音频服务模块与音频采集模块通过设置导线连接,且音频服务模块用于接受拾音器的音频数据,完成数字信号压缩和传输作业。
优选的,所述音频存储模块与边缘计算容器通过设置导线连接,且音频存储模块用于存储异常状态下音频特征库、音频识别后的结果,以及操作系统内核和文件系统。
优选的,所述所述arm开发板采用arm中央处理器,且arm开发板内置音频数据特征转化和对音频数据分析的运算程序,实时接收并分析各种音频数据;
所述运算程序为,通过改进的MFCC算法对音频数据特征进行提取并转化,通过基于粒子群优化的自组织特征映射神经网络算法训练模型,利用训练好的模型识别设备主体运行声音,若存在设备异常运行声音,将结果进行储存、传输到上位机并进行报警。
优选的,所述网络通讯模块用于与外置的上位机进行连接和数据传输,且网络通讯模块采用有线或无线的方式与外置的上位机远程连接。
优选的,所述报警模块与arm开发板通过设置导线连接,若是数据分析结果发现设备主体存在异常状态时,所述报警模块进行报警。
优选的,一种设备异常声音检测的设备的使用方法,该方法的步骤为:
S1、启动异常声音检测设备;
S2、异常声音检测设备无需紧贴被检测设备,放在靠近被检测设备的一端,触发音频采集模块的启动端,音频采集模块实时采集被检测设备的音频数据;
S3、采用音频服务模块接收音频采集模块的音频数据,进行数字信号压缩和传输;
S4、将压缩后的数字信号传至边缘计算容器里arm开发板;针对应用场景的模型化及噪声识别,进入训练程序,arm开发板对正常的设备运行数据进行训练,自适应提取数据特征,生成机器噪声基础特征集,通过PSO-SOM神经网络算法学习计算权重和配比,所得模型和数据特征存储于arm开发板的计算程序中;
当训练好模型后,进入识别程序,先提取当前采集的音频数据特征,用训练好的模型对音频数据特征进行测试;
S5、当测试结果显示设备存在异常状态时,报警模块发出警告,音频存储模块存储异常状态时的数据特征等信息;
S6、通过网络通讯模块上传数据分析结果至外置的上位机,该处的上位机使用电脑或手机登陆控制平台可视化边缘计算容器处理分析后的结果并进行相关的操作处理。
优选的,在上述步骤S3后,通过前端数据采集器对运行设备的音频数据进行实时采集,将音频数据进行切片处理,并在步骤S4中使用arm开发板对切片后的数据进行处理;上述作业的具体步骤为:
A、获取并整合所需检测的设备运行声音信息,建立音频数据库。
B、对音频数据库中的数据读取,包括分割训练-测试集,对数据进行切片,设置滑动时间。
C、结合Mel Frequency Cepstral Coefficient算法提取出音频数据特征,对提取后的特征向量矩阵进行处理。
D、基于粒子群优化和SOM模型对特征筛选后的数据进行预测,结合预测的准确率,进行算法的优化和改进。
与现有技术相比,本发明提供了一种设备异常声音检测的设备及方法,具有如下有益效果:
该设备利用边缘计算容器直接对获取到的数据进行处理,无需将数据传输到后台并进行分析设备运行状态,大大减少了数据传送的时间;
检测人员可以通过使用手机、平板以及电脑等方式登陆可视化控制平台界面,便于检测人员进行监测设备运行状态。
该设备通过前端数据采集器对运行设备的音频数据进行实时采集,将音频数据进行切片处理,分析切片后的音频数据特征与实验数据中设备正常运行特征进行对比,准确识别运行设备故障时的异常声音。本专利将切片后的数据利用MFCC算法提取音频特征,对音频特征进行改进后获得最优音频特征,基于粒子群优化和SOM算法能更好地应用于从复杂的设备运行环境背景声音识别出异常声音,协助相关人员准确定位故障设备并及时维护设备的正常运行。
1.在音频数据处理中将数据切片处理后,MFCC方法提取出的音频特征,将所得每一片特征向量矩阵拉直,对其进行降维处理,提取出的音频特征更优,聚类效果更加显著;
2.采用基于粒子群优化的自组织特征映射神经网络(PSO-SOM)的聚类算法无需知道数据的标签,在一段较长的设备运行声音数据中默认将数据量较大的一类归为正常运行声音,SO-SOM算法在聚类效果评价指标(AVQ、UTE、LWDI)上均优于SOM基本算法,所得网络质量较好,错聚率较低,所得错聚率也低于其他分类算法(SVM、GMM、CNN等)。
附图说明
图1是本发明的设备主体结构示意图;
图2是本发明的设备主体内部结构示意图;
图3是本发明的原理框图;
图4是本发明的检测方法流程图;
图5是本发明的SOM结构图;
图6是本发明中使用arm开发板的具体检测流程图;
图7是本发明的粒子最优化和SOM算法流程图。
附图标记:1、设备主体;2、音频采集模块;3、音频服务模块;4、音频存储模块;5、arm开发板;6、网络通讯模块;7、报警模块;8、电源模块。
具体实施方式
以下结合附图1,进一步说明本发明一种设备异常声音检测的设备及方法的具体实施方式。本发明一种设备异常声音检测的设备及方法不限于以下实施例的描述。
实施例1:
本实施例给出一种设备异常声音检测的设备的具体结构,如图1-3所示,一种设备异常声音检测的设备,包括设备主体1,设备主体1包括前端数据采集器和边缘计算容器;
前端数采集器是一个能采集音频特征并将数据信号压缩、传输和存储的设备,该设备包含音频采集模块2、音频服务模块3以及存储模块4;
边缘计算容器是一个能获取数据并具有计算分析能力的设备,该设备包含arm开发板5、网络通讯模块6、报警模块7以及电源模块8。
如图2和3所示,音频采集模块2采用拾音器设备,拾音器设备可实现户外、远距离环境的高保真录音操作,采用金属外壳,并在其表面电镀处理;具有防水防潮、高保真、低噪声的特点,为后续的音频信号处理提供可靠的音频数据。
如图2和3所示,音频服务模块3与音频采集模块2通过设置导线连接,且音频服务模块3用于接受拾音器的音频数据,完成数字信号压缩和传输作业;压缩格式采用a律PCM音频格式,传输方式采用TCP/IP协议传输标准。
如图2和3所示,音频存储模块4与边缘计算容器通过设置导线连接,且音频存储模块4用于存储异常状态下音频特征库、音频识别后的结果,以及操作系统内核和文件系统。
如图2和3所示,arm开发板5采用arm中央处理器,该处理器具有低功耗高运算性能处理的特点。且arm开发板5内置音频数据特征转化和对音频数据分析的运算程序,实时接收并分析各种音频数据;
运算程序为,通过改进的MFCC算法对音频数据特征进行提取并转化,通过基于粒子群优化的自组织特征映射神经网络PSO-SOM算法训练模型,利用训练好的模型识别设备主体1运行声音,若存在设备异常运行声音,将结果进行储存、传输到上位机并进行报警。
如图2和3所示,网络通讯模块6用于与外置的上位机进行连接和数据传输,考虑到存在设备运行环境封闭,信号传输能力较弱的情形,该网络通讯模块6采用有线或无线的方式与外置的上位机远程连接。网线和4G网络相结合的方式,当网线传输中断时,启用4G网络传输,从而实现边缘计算容器与上位机的远程连接。
如图2和3所示,报警模块7与arm开发板5通过设置导线连接,若是数据分析结果发现设备主体1存在异常状态时,报警模块7进行报警。
实施例2:
本实施例给出一种设备异常声音检测的设备及方法的具体使用方法和检测步骤,如图4所示,按照下述步骤进行:
(1)启动异常声音检测设备;
(2)异常声音检测设备无需紧贴被检测设备,放在靠近被检测设备的一端,触发音频采集模块2的启动端,音频采集模块2实时采集被检测设备的音频数据;
(3)采用音频服务模块3接收音频采集模块2的音频数据,进行数字信号压缩和传输;
(4)将压缩后的数字信号传至边缘计算容器里arm开发板5;针对应用场景的模型化及噪声识别,进入训练程序,arm开发板5对正常的设备运行数据进行训练,自适应提取数据特征,生成机器噪声基础特征集,通过PSO-SOM神经网络算法学习计算权重和配比,所得模型和数据特征存储于arm开发板5的计算程序中;
当训练好模型后,进入识别程序,先提取当前采集的音频数据特征,用训练好的模型对音频数据特征进行测试;
(5)当测试结果显示设备存在异常状态时,报警模块7发出警告,音频存储模块4存储异常状态时的数据特征等信息;
(6)通过网络通讯模块6上传数据分析结果至外置的上位机,该处的上位机使用电脑或手机登陆控制平台可视化边缘计算容器处理分析后的结果并进行相关的操作处理。
实施例3:
本实施例给出通过前端数据采集器对运行设备的音频数据进行实时采集,将音频数据进行切片处理,分析切片后的音频数据特征与实验数据中设备正常运行特征进行对比,准确识别运行设备故障时的异常声音的具体步骤,如图5-7所示,
在步骤S3后,通过前端数据采集器对运行设备的音频数据进行实时采集,将音频数据进行切片处理,并在步骤S4中使用arm开发板5对切片后的数据进行处理;如图5-7所示,上述作业的具体步骤为,
A、获取并整合所需检测的设备运行声音信息,建立音频数据库。
B、对音频数据库中的数据读取,包括分割训练-测试集,对数据进行切片,设置滑动时间。
该步骤具体包括:(1)选取部分样本数据作为后续模型检验的测试集;
(2)读取测试音频数据,根据读取数据的帧数和频率,对测试音频数据按每5s进行切片,滑动时间设置为1s。
C、结合Mel Frequency Cepstral Coefficient(MFCC)算法提取出音频数据特征,对提取后的特征向量矩阵进行处理。
该步骤具体包括,(1)预加重:提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,消除发生过程中声带和嘴唇效应,补偿语音信号中收到发音系统所抑制的高频部分,突出高频的共振峰,
S1(n)=S(n)-αS(n-1)
其中:一般α取值为:0.95,S(n)为读取信号的Signal数组。
(2)分帧:将N个采样点集合成一个观测单位,称为帧。通常情况下N的值为256或512,涵盖的时间约为20-30ms左右。为避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域,重叠区域包含M个采样点,通常M的值约为N的1/2或1/3。
(3)加窗:汉明窗函数是一个余弦函数,作用是为了缓解频率混叠。
假设一帧内信号是S(n),n=O,1,…,N-1,则乘上汉明窗后为:
S′(n)=S(n)*W(n)
(4)离散傅里叶变换(DFT):进行快速傅里叶变换得到各帧的频谱,对语音信号的频谱取模平方得到语音信号的功率谱,则语音信号的DFT为:
其中:x(n)为输入的语音信号,N表示傅里叶变换的点数。
(5)三角带通滤波器:将能量谱通过一组Mel尺度的三角形滤波器组,定义一个有M个滤波器的滤波器组(滤波器的个数和临界带的个数相近),采用的滤波器为三角滤波器,中心频率为。M通常取22-26。各f(m)之间的间隔随着m值的减小而缩小,随着m值的增大而增宽。三角滤波器的频率相应定义为:
(6)计算每个滤波器组输出的对数能量为:
(7)经离散余弦变换(DCT)得到MFCC系数:
(8)基于MFCC算法提取音频特征向量矩阵后,得到MN*13的特征向量矩阵,其中M为片数,N为一片数据对应特征向量的长度,将每一片特征向量矩阵拉直获得M*13N的特征向量矩阵,对新的特征向量矩阵进行降维处理,获得最终的特征向量矩阵。
D、基于粒子群优化和SOM模型对特征筛选后的数据进行预测,结合预测的准确率,进行算法的优化和改进。
该步骤具体包括:
假设在D维搜索空间中,有m个粒子组成一群体,第i个粒子在D维空间中的位置表示为xi=(xi1,xi2,...,xiD),第i个粒子经历过的最好位置记为Pi=(pi1,pi2,...,piD),第i个粒子的飞行速度记为Vi=(vi1,vi2,...,viD)。在整个群体中,所有粒子经历过的最好位置为,
Pg=(pg1,pg2,...,pgD),vid=ωvid+c1r1(pid-xid)+c2r2(pgd-xid)
x’id=xid+vid。
(1)初始化设置SOM网络的结构、目标函数等;
(2)初始化设置粒子群的规模、惯性权值、学习因子、最大允许迭代次数或适应度误差范围、各粒子的初始位置和初始速度等;
(3)对每个粒子,寻找获胜神经元,并计算相应权值的适应度;
(4)对粒子群中的所有粒子,执行如下操作:
a.根据上述,更新粒子的诶之和速度,
b.若粒子适应度优于个体极值pbest,则pbest设置为新位置,
c.如果粒子适应度优于全局极值gbest,则pbest设置为新位置。
(5)对每一步的最优粒子和最差粒子进行处理;
(6)若满足停止条件,则搜索停止,输出全局最优位置,即为所求SOM网络的最佳权值;gbest否则返回步骤3继续搜索。
上述提及的Mel Frequency Cepstral Coefficient(MFCC)的通俗解释:在语言识别领域,将语音物理信息(频谱包络和细节)进行编码运算得到的一组特征向量。它有13个系数都是通过离散余弦变换(DCT)而来,并取13个系数。DCT的作用是为了获得频谱的倒谱,倒谱的低频分量就是频谱的包络,倒谱的高频分量就是频谱的细节,这些都是语音识别上十分有效的语音物理信息。但语音识别是对机器来说的,所以我们必须对物理信息进行某种“编码”,得到的就是MFCC13维特征向量。
上述提及的基于粒子群优化的自组织特征映射神经网络(PSO-SOM)的通俗解释:每个数据特征都被看成空间中的一个粒子,所有的粒子都有一个由被优化函数。每个粒子都会不断更新速度和位置,计算出粒子的适应度,追踪记录每个粒子的个体极值和整个粒子群的全局极值,最终得到的粒子适应度大于全局极值,则设置成为SOM的最佳权值。
如图5所示,输入层和竞争层分为位于上下两层,其中输入层包含位于上层的三组节点,竞争层包含位于下层的四组节点;
输入层和竞争层是全连接的,每个输入层神经元节点都有对应的权值和偏差,在激活函数的作用下输出对应的输出。基于粒子群优化的自组织特征映射神经网络,对应的权值由改进的粒子群算法所确定,传统的粒子群算法会陷入局部极值且收敛速度慢。PSO-SOM算法在聚类效果评价指标(AVQ、UTE、LWDI)上均优于SOM基本算法,所得网络质量较好,错误率较低。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种设备异常声音检测的设备,包括设备主体(1),其特征在于:所述设备主体(1)包括前端数据采集器和边缘计算容器;
所述前端数采集器是一个能采集音频特征并将数据信号压缩、传输和存储的设备,该设备包含音频采集模块(2)、音频服务模块(3)以及存储模块(4);
所述边缘计算容器是一个能获取数据并具有计算分析能力的设备,该设备包含arm开发板(5)、网络通讯模块(6)、报警模块(7)以及电源模块(8)。
2.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:所述音频采集模块(2)采用拾音器设备,拾音器设备可实现户外、远距离环境的高保真录音操作,采用金属外壳,并在其表面电镀处理。
3.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:所述音频服务模块(3)与音频采集模块(2)通过设置导线连接,且音频服务模块(3)用于接受拾音器的音频数据,完成数字信号压缩和传输作业。
4.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:所述音频存储模块(4)与边缘计算容器通过设置导线连接,且音频存储模块(4)用于存储异常状态下音频特征库、音频识别后的结果,以及操作系统内核和文件系统。
5.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:所述所述arm开发板(5)采用arm中央处理器,且arm开发板(5)内置音频数据特征转化和对音频数据分析的运算程序,实时接收并分析各种音频数据;
所述运算程序为,通过改进的MFCC算法对音频数据特征进行提取并转化,通过基于粒子群优化的自组织特征映射神经网络(PSO-SOM)算法训练模型,利用训练好的模型识别设备主体(1)运行声音,若存在设备异常运行声音,将结果进行储存、传输到上位机并进行报警。
6.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:所述网络通讯模块(6)用于与外置的上位机进行连接和数据传输,且网络通讯模块(6)采用有线或无线的方式与外置的上位机远程连接。
7.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:所述报警模块(7)与arm开发板(5)通过设置导线连接,若是数据分析结果发现设备主体(1)存在异常状态时,所述报警模块(7)进行报警。
8.如权利要求1所述的一种设备异常声音检测的设备,其特征在于:还包括上述设备的使用方法,该方法的步骤为:
S1、启动异常声音检测设备;
S2、异常声音检测设备无需紧贴被检测设备,放在靠近被检测设备的一端,触发音频采集模块(2)的启动端,音频采集模块(2)实时采集被检测设备的音频数据;
S3、采用音频服务模块(3)接收音频采集模块(2)的音频数据,进行数字信号压缩和传输;
S4、将压缩后的数字信号传至边缘计算容器里arm开发板(5);针对应用场景的模型化及噪声识别,进入训练程序,arm开发板(5)对正常的设备运行数据进行训练,自适应提取数据特征,生成机器噪声基础特征集,通过PSO-SOM神经网络算法学习计算权重和配比,所得模型和数据特征存储于arm开发板(5)的计算程序中;
当训练好模型后,进入识别程序,先提取当前采集的音频数据特征,用训练好的模型对音频数据特征进行测试;
S5、当测试结果显示设备存在异常状态时,报警模块(7)发出警告,音频存储模块(4)存储异常状态时的数据特征等信息;
S6、通过网络通讯模块(6)上传数据分析结果至外置的上位机,该处的上位机使用电脑或手机登陆控制平台可视化边缘计算容器处理分析后的结果并进行相关的操作处理。
9.如权利要求8所述的一种设备异常声音检测的设备,其特征在于:在上述步骤S3后,通过前端数据采集器对运行设备的音频数据进行实时采集,将音频数据进行切片处理,并在步骤S4中使用arm开发板(5)对切片后的数据进行处理;上述作业的具体步骤为:
A、获取并整合所需检测的设备运行声音信息,建立音频数据库;
B、对音频数据库中的数据读取,包括分割训练-测试集,对数据进行切片,设置滑动时间;
C、结合Mel Frequency Cepstral Coefficient(MFCC)算法提取出音频数据特征,对提取后的特征向量矩阵进行处理;
D、基于粒子群优化和SOM模型对特征筛选后的数据进行预测,结合预测的准确率,进行算法的优化和改进。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911424237.1A CN111048114A (zh) | 2019-12-30 | 2019-12-30 | 一种设备异常声音检测的设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911424237.1A CN111048114A (zh) | 2019-12-30 | 2019-12-30 | 一种设备异常声音检测的设备及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111048114A true CN111048114A (zh) | 2020-04-21 |
Family
ID=70243409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911424237.1A Pending CN111048114A (zh) | 2019-12-30 | 2019-12-30 | 一种设备异常声音检测的设备及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111048114A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112165608A (zh) * | 2020-09-22 | 2021-01-01 | 长城汽车股份有限公司 | 停车安全监控方法、装置、存储介质以及车辆 |
CN112215927A (zh) * | 2020-09-18 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 人脸视频的合成方法、装置、设备及介质 |
CN112420074A (zh) * | 2020-11-18 | 2021-02-26 | 麦格纳(太仓)汽车科技有限公司 | 一种汽车后视镜电机异响声音的诊断方法 |
CN112700790A (zh) * | 2020-12-11 | 2021-04-23 | 广州市申迪计算机系统有限公司 | 一种idc机房声音处理方法、系统、设备及计算机存储介质 |
CN112967478A (zh) * | 2021-02-01 | 2021-06-15 | 绍兴隆芙力智能科技发展有限公司 | 设备预期维护预警系统及其预警装置 |
CN113380273A (zh) * | 2020-08-10 | 2021-09-10 | 腾擎科研创设股份有限公司 | 异常声音检测及判断形成原因的系统 |
CN113380261A (zh) * | 2021-05-26 | 2021-09-10 | 特斯联科技集团有限公司 | 一种人工智能语音采集处理器及方法 |
CN113409818A (zh) * | 2021-08-18 | 2021-09-17 | 宁波帅特龙集团有限公司 | 一种基于声音传感器的生产设备预测性维修方法与系统 |
CN113763986A (zh) * | 2021-09-07 | 2021-12-07 | 山东大学 | 一种基于声音分类模型的空调内机异常声音检测方法 |
WO2022076108A1 (en) * | 2020-10-07 | 2022-04-14 | Google Llc | Enhanced computing device representation of audio |
CN114927141A (zh) * | 2022-07-19 | 2022-08-19 | 中国人民解放军海军工程大学 | 异常水声信号的检测方法及系统 |
CN115171721A (zh) * | 2022-07-03 | 2022-10-11 | 北京星汉博纳医药科技有限公司 | 一种音频数据切片识别处理方法 |
CN117151198A (zh) * | 2023-09-06 | 2023-12-01 | 广东海洋大学 | 基于自组织竞争型神经网络的水声被动定位方法及装置 |
CN117854245A (zh) * | 2023-12-25 | 2024-04-09 | 北京谛声科技有限责任公司 | 一种基于设备运行音频的异常设备监控方法及系统 |
-
2019
- 2019-12-30 CN CN201911424237.1A patent/CN111048114A/zh active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113380273A (zh) * | 2020-08-10 | 2021-09-10 | 腾擎科研创设股份有限公司 | 异常声音检测及判断形成原因的系统 |
CN112215927B (zh) * | 2020-09-18 | 2023-06-23 | 腾讯科技(深圳)有限公司 | 人脸视频的合成方法、装置、设备及介质 |
CN112215927A (zh) * | 2020-09-18 | 2021-01-12 | 腾讯科技(深圳)有限公司 | 人脸视频的合成方法、装置、设备及介质 |
CN112165608A (zh) * | 2020-09-22 | 2021-01-01 | 长城汽车股份有限公司 | 停车安全监控方法、装置、存储介质以及车辆 |
WO2022076108A1 (en) * | 2020-10-07 | 2022-04-14 | Google Llc | Enhanced computing device representation of audio |
CN112420074A (zh) * | 2020-11-18 | 2021-02-26 | 麦格纳(太仓)汽车科技有限公司 | 一种汽车后视镜电机异响声音的诊断方法 |
CN112700790A (zh) * | 2020-12-11 | 2021-04-23 | 广州市申迪计算机系统有限公司 | 一种idc机房声音处理方法、系统、设备及计算机存储介质 |
CN112967478A (zh) * | 2021-02-01 | 2021-06-15 | 绍兴隆芙力智能科技发展有限公司 | 设备预期维护预警系统及其预警装置 |
CN113380261A (zh) * | 2021-05-26 | 2021-09-10 | 特斯联科技集团有限公司 | 一种人工智能语音采集处理器及方法 |
CN113380261B (zh) * | 2021-05-26 | 2021-12-31 | 特斯联科技集团有限公司 | 一种人工智能语音采集处理器及方法 |
CN113409818A (zh) * | 2021-08-18 | 2021-09-17 | 宁波帅特龙集团有限公司 | 一种基于声音传感器的生产设备预测性维修方法与系统 |
CN113763986A (zh) * | 2021-09-07 | 2021-12-07 | 山东大学 | 一种基于声音分类模型的空调内机异常声音检测方法 |
CN113763986B (zh) * | 2021-09-07 | 2024-02-02 | 山东大学 | 一种基于声音分类模型的空调内机异常声音检测方法 |
CN115171721A (zh) * | 2022-07-03 | 2022-10-11 | 北京星汉博纳医药科技有限公司 | 一种音频数据切片识别处理方法 |
CN115171721B (zh) * | 2022-07-03 | 2023-10-17 | 北京星汉博纳医药科技有限公司 | 一种音频数据切片识别处理方法 |
CN114927141A (zh) * | 2022-07-19 | 2022-08-19 | 中国人民解放军海军工程大学 | 异常水声信号的检测方法及系统 |
CN117151198A (zh) * | 2023-09-06 | 2023-12-01 | 广东海洋大学 | 基于自组织竞争型神经网络的水声被动定位方法及装置 |
CN117151198B (zh) * | 2023-09-06 | 2024-04-09 | 广东海洋大学 | 基于自组织竞争型神经网络的水声被动定位方法及装置 |
CN117854245A (zh) * | 2023-12-25 | 2024-04-09 | 北京谛声科技有限责任公司 | 一种基于设备运行音频的异常设备监控方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111048114A (zh) | 一种设备异常声音检测的设备及方法 | |
CN111325095B (zh) | 基于声波信号的设备健康状态智能检测方法和系统 | |
US11386916B2 (en) | Segmentation-based feature extraction for acoustic scene classification | |
CN105841961A (zh) | 一种基于Morlet小波变换和卷积神经网络的轴承故障诊断方法 | |
WO2019023877A1 (zh) | 特定声音识别方法、设备和存储介质 | |
CN112735473B (zh) | 基于声音识别无人机的方法及系统 | |
CN109044396A (zh) | 一种基于双向长短时记忆神经网络的智能心音识别方法 | |
CN104795064A (zh) | 低信噪比声场景下声音事件的识别方法 | |
Leonid et al. | Retracted article: statistical–model based voice activity identification for human-elephant conflict mitigation | |
CN110992985A (zh) | 识别跑步机异音的识别模型确定方法、识别方法、系统 | |
CN114023354A (zh) | 基于聚焦损失函数的指导型声学事件检测模型训练方法 | |
CN115101076B (zh) | 一种基于多尺度通道分离卷积特征提取的说话人聚类方法 | |
CN110610722B (zh) | 短时能量及梅尔倒谱系数联合新型矢量量化的低复杂度危险声场景判别方法 | |
CN116842460A (zh) | 基于注意力机制与残差神经网络的咳嗽关联疾病识别方法和系统 | |
CN115510909A (zh) | 一种dbscan进行异常声音特征的无监督算法 | |
CN116741148A (zh) | 一种基于数字孪生的语音识别系统 | |
CN113707175B (zh) | 基于特征分解分类器与自适应后处理的声学事件检测系统 | |
Smailov et al. | A Novel Deep CNN-RNN Approach for Real-time Impulsive Sound Detection to Detect Dangerous Events | |
Peng et al. | An acoustic signal processing system for identification of queen-less beehives | |
CN117037847B (zh) | 一种端到端社区噪音监测方法、装置及相关组件 | |
CN117116293A (zh) | 一种复杂声场环境中机器设备故障诊断系统 | |
CN114121025A (zh) | 一种面向变电站设备的声纹故障智能检测方法及装置 | |
Estrebou et al. | Voice recognition based on probabilistic SOM | |
CN112687290A (zh) | 一种经过压缩的咳嗽自动检测方法及嵌入式设备 | |
CN112259126B (zh) | 一种自闭症语音特征辅助识别机器人及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |