CN115631765A - 一种基于深度学习的皮带托辊声音异常检测方法 - Google Patents
一种基于深度学习的皮带托辊声音异常检测方法 Download PDFInfo
- Publication number
- CN115631765A CN115631765A CN202211158508.5A CN202211158508A CN115631765A CN 115631765 A CN115631765 A CN 115631765A CN 202211158508 A CN202211158508 A CN 202211158508A CN 115631765 A CN115631765 A CN 115631765A
- Authority
- CN
- China
- Prior art keywords
- sound
- audio
- neural network
- prediction result
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 18
- 238000013135 deep learning Methods 0.000 title claims abstract description 16
- 238000013528 artificial neural network Methods 0.000 claims abstract description 46
- 230000002159 abnormal effect Effects 0.000 claims abstract description 24
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 11
- 230000005856 abnormality Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 6
- 238000000034 method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- Emergency Management (AREA)
- General Physics & Mathematics (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及计算机音频分类技术领域,具体涉及一种基于深度学习的皮带托辊声音异常检测方法,采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用处理数据训练神经网络,得到音频分类神经网络;对拾音器音频流进行预处理后输入音频分类神经网络进行预测,得到预测结果;基于预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因,该方法通过采集音频流进行声音预处理,基于音频分类的音频算法实时识别皮带托辊声音是否异常,及时发现托辊故障,提供故障时间和故障频率,通过训练不同故障声音的数据,推断托辊故障可能的原因,当发现皮带托辊运行声音发生异常时触发报警。
Description
技术领域
本发明涉及计算机音频分类技术领域,尤其涉及一种基于深度学习的皮带托辊声音异常检测方法。
背景技术
当前电厂皮带托辊声音异常查看主要通过人工巡检,人工巡检对皮带托辊状况检测的实时性较低,人工只能发现当前巡视的故障点,不能24小时实时监测,不能在最早的时间点发现问题,且每个人的听觉能力各不相同,听觉的敏感度各不相同,不能统一标准进行判断托辊是否故障,而且人耳能听到的声音范围也是有限的,因为人类对于高频和低频的声音无法听到,所以也就不能进行故障的判断。
因为皮带距离长,托辊数量数量又多,所以人工巡检任务繁重,巡检十分困难,巡检存在死角,人工巡检只能听到近距离的问题点,加上工厂环境声音嘈杂大大降低了工人判断故障声音的能力,各种原因造成人工不能大范围的判断声音。
发明内容
本发明的目的在于提供一种基于深度学习的皮带托辊声音异常检测方法,旨在解决现有人工巡检不能准确判断皮带托辊声音异常的问题。
为实现上述目的,本发明提供了一种基于深度学习的皮带托辊声音异常检测方法,包括以下步骤:
采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用所述处理数据训练神经网络,得到音频分类神经网络;
对拾音器音频流进行预处理后输入所述音频分类神经网络进行预测,得到预测结果;
基于所述预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因。
其中,所述采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用所述处理数据训练神经网络,得到音频分类神经网络的具体方式:
通过拾音器实时采集现场正常和非正常声音数据,得到采集音频;
分割所述采集音频并按照不同故障声音进行分类,得到所述处理数据;
搭建神经网络;
使用所述处理数据对所述神经网络进行迭代训练,得到音频分类神经网络。
其中,所述对拾音器音频流进行预处理后输入所述音频分类神经网络进行预测,得到预测结果的具体方式:
读取拾音器音频流;
对所述音频流分割片段,得到片段音频;
对所述片段音频进行特征提取,得到音频特征;
将所述音频特征输入所述音频分类神经网络进行预测,得到预测结果。
其中,所述基于所述预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因的具体方式:
基于所述预测结果判断声音是否正常,声音异常触发报警上传服务器,通知安全人员;
通过所述预测结果推断拖棍故障原因。
其中,所述音频分类神经网络为时延神经网络。
本发明的一种基于深度学习的皮带托辊声音异常检测方法,采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用所述处理数据训练神经网络,得到音频分类神经网络;对拾音器音频流进行预处理后输入所述音频分类神经网络进行预测,得到预测结果;基于所述预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因,该方法通过采集音频流进行声音预处理,基于音频分类的音频算法实时识别皮带托辊声音是否异常,及时发现托辊故障,并能提供故障时间和故障频率,通过训练不同故障声音的数据,推断托辊故障可能的原因,当发现皮带托辊运行声音发生异常时触发报警,通知安全人员解决隐患,该方法硬件开销少,稳定高、环境要求低并且相比现有的皮带托辊声音检测,可实时调整检测区域,操作方便;且能预测造成故障声音出现的可能原因,给客户直观的感受;当皮带托辊发生故障时能及时通知员工,对皮带采取相应的处理措施,解决现有人工巡检不能准确判断皮带托辊声音异常的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是ECAPA-TDNN架构的SE-Res2BlockD示意图。
图2是ECAPA-TDNN的网络拓扑的示意图。
图3是分类的音频数据的示意图。
图4是过梅尔滤波后提取的特征的示意图。
图5是本发明提供的一种基于深度学习的皮带托辊声音异常检测方法的系统流程图。
图6是本发明提供的一种基于深度学习的皮带托辊声音异常检测方法的系统结构示意图。
图7是本发明提供的一种基于深度学习的皮带托辊声音异常检测方法的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
请参阅图1至图7,本发明提供一种基于深度学习的皮带托辊声音异常检测方法,包括以下步骤:
S1采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用所述处理数据训练神经网络,得到音频分类神经网络;
具体的,所需要的硬件为定向拾音器和X86平台PC,通过采集现场正常和非正常的声音数据,人工裁剪成合适的大小后进行分类。
具体方式:
S11通过拾音器实时采集现场正常和非正常声音数据,得到采集音频;
S12分割所述采集音频并按照不同故障声音进行分类,得到所述处理数据;
S13搭建音频分类神经网络;
S14使用所述处理数据对所述神经网络进行迭代训练,得到音频分类神经网络。
S2对拾音器音频流进行预处理后输入所述音频分类神经网络进行预测,得到预测结果;
具体的,通过搭建TDNN音频分类神经网络训练不同的声音数据,然后预测当前声音可能的类型,TDNN时延神经网络是卷积神经网络的前身:Time-Delay Neural Network,它被Hinton组于1989年提出,初衷是为了解决语音识别中传统方法HMM无法适应语音信号中的动态时域变化,并且该结构参数较少,进行语音识别不需要预先将音标与音频在时间线上进行对齐,实验证明TDNN相比HMM表现更好,传统的x-vector的frame-layers只考虑了15帧的信息,为了考虑全局的信息,因此使用了 Squeeze-Excitation (SE) blocks。
首先是squeeze操作,将每一帧 frame-level features按时间取平均。
之后是excitation操作。
最后再将其与输入点乘相当于每个通道分别乘上一个权值。
整个Res2Blocks如图1,网络拓扑如图2。
具体方式:
S21读取拾音器音频流;
S22对所述音频流分割片段,得到片段音频;
具体的,所述音频分类神经网络为时延神经网络,开源的神经网络框架,专门针对GPU 加速的深度神经网络(DNN)编程。
Torch 是一个经典的对多维矩阵数据进行操作的张量(tensor)库,在机器学习和其他数学密集型应用有广泛应用,按照不同故障声音类别将音频数据分别放入不同文件夹,经过梅尔滤波后提取的特征,用于分类算法分类,梅尔滤波后提取的特征转成Tensor格式送入神经网络。
S23对所述片段音频进行特征提取,得到音频特征;
S24将所述音频特征输入所述音频分类神经网络进行预测,得到预测结果。
S3基于所述预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因。
具体方式:
S31基于所述预测结果据判断声音是否正常,声音异常触发报警上传服务器,通知安全人员;
S32通过所述预测结果推断拖棍故障原因。
以上所揭露的仅为本发明一种专利名称较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (5)
1.一种基于深度学习的皮带托辊声音异常检测方法,其特征在于,包括以下步骤:
采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用所述处理数据训练神经网络,得到音频分类神经网络;
对拾音器音频流进行预处理后输入所述音频分类神经网络进行预测,得到预测结果;
基于所述预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因。
2.如权利要求1所述的一种基于深度学习的皮带托辊声音异常检测方法,其特征在于,
所述采集现场正常和非正常声音数据进行预处理,得到处理数据,并使用所述处理数据训练神经网络,得到音频分类神经网络的具体方式:
通过拾音器实时采集现场正常和非正常声音数据,得到采集音频;
分割所述采集音频并按照不同故障声音进行分类,得到所述处理数据;
搭建神经网络;
使用所述处理数据对所述神经网络进行迭代训练,得到音频分类神经网络。
3.如权利要求1所述的一种基于深度学习的皮带托辊声音异常检测方法,其特征在于,
所述对拾音器音频流进行预处理后输入所述音频分类神经网络进行预测,得到预测结果的具体方式:
读取拾音器音频流;
对所述音频流分割片段,得到片段音频;
对所述片段音频进行特征提取,得到音频特征;
将所述音频特征输入所述音频分类神经网络进行预测,得到预测结果。
4.如权利要求1所述的一种基于深度学习的皮带托辊声音异常检测方法,其特征在于,
所述基于所述预测结果判断声音是否正常,若声音异常,则进行报警,并推断拖棍故障原因的具体方式:
基于所述预测结果判断声音是否正常,声音异常触发报警上传服务器,通知安全人员;
通过所述预测结果推断拖棍故障原因。
5.如权利要求1所述的一种基于深度学习的皮带托辊声音异常检测方法,其特征在于,
所述音频分类神经网络为时延神经网络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211158508.5A CN115631765A (zh) | 2022-09-22 | 2022-09-22 | 一种基于深度学习的皮带托辊声音异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211158508.5A CN115631765A (zh) | 2022-09-22 | 2022-09-22 | 一种基于深度学习的皮带托辊声音异常检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115631765A true CN115631765A (zh) | 2023-01-20 |
Family
ID=84903038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211158508.5A Pending CN115631765A (zh) | 2022-09-22 | 2022-09-22 | 一种基于深度学习的皮带托辊声音异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115631765A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116168727A (zh) * | 2023-04-26 | 2023-05-26 | 智洋创新科技股份有限公司 | 一种变压器异常声音检测方法、系统、设备及存储介质 |
CN116403605A (zh) * | 2023-06-08 | 2023-07-07 | 宁德时代新能源科技股份有限公司 | 设备故障预测方法、堆垛机故障预测方法及相关装置 |
-
2022
- 2022-09-22 CN CN202211158508.5A patent/CN115631765A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116168727A (zh) * | 2023-04-26 | 2023-05-26 | 智洋创新科技股份有限公司 | 一种变压器异常声音检测方法、系统、设备及存储介质 |
CN116403605A (zh) * | 2023-06-08 | 2023-07-07 | 宁德时代新能源科技股份有限公司 | 设备故障预测方法、堆垛机故障预测方法及相关装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115631765A (zh) | 一种基于深度学习的皮带托辊声音异常检测方法 | |
CN110890102A (zh) | 一种基于rnn声纹识别的发动机缺陷检测算法 | |
CN112660745B (zh) | 托辊故障智能诊断方法、系统及可读存储介质 | |
FR2944903A1 (fr) | Systeme et methode pour detecter des evenements audio anormaux | |
CN112735383A (zh) | 语音信号的处理方法、装置、设备及存储介质 | |
CN110852215A (zh) | 一种多模态情感识别方法、系统及存储介质 | |
CN112504673A (zh) | 基于机器学习的托辊故障诊断方法、系统及存储介质 | |
CN115424635B (zh) | 一种基于声音特征的水泥厂设备故障诊断方法 | |
Lu et al. | Real-time unsupervised speaker change detection | |
US20200409653A1 (en) | Intelligent Audio Analytic Apparatus (IAAA) and Method for Space System | |
CN116778964A (zh) | 一种基于声纹识别的变电设备故障监测系统及方法 | |
CN111600878A (zh) | 一种基于maf-adm的低速率拒绝服务攻击检测方法 | |
CN113707175B (zh) | 基于特征分解分类器与自适应后处理的声学事件检测系统 | |
CN111968628B (zh) | 一种用于语音指令捕捉的信号精确度调节系统及方法 | |
CN111445924A (zh) | 基于自回归模型系数检测定位语音片段内平滑处理的方法 | |
CN116128546A (zh) | 一种电力行业对外服务窗口的ai舆情监测系统和方法 | |
Arslan | A new approach to real time impulsive sound detection for surveillance applications | |
CN112660746B (zh) | 基于大数据技术的托辊故障诊断方法、系统及存储介质 | |
Estrebou et al. | Voice recognition based on probabilistic SOM | |
CN111931511A (zh) | 一种基于广域分布式架构的语义分析方法及系统 | |
Morovati | Increase the accuracy of speech signal categories in high noise environments | |
Lee et al. | Evaluation of Grinding Wheel Wear Based on Machining Sound and Deep Learning | |
CN116147944A (zh) | 基于音频分析和机器学习的机器运行异常检测系统及方法 | |
Catanghal Jr et al. | Meta-analysis of acoustic feature extraction for Machine Listening Systems | |
Pradeep et al. | Smart Factory Setting Awareness by Noise-Pattern Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |