CN115440242A - 输送带纵向撕裂检测方法及相关设备 - Google Patents

输送带纵向撕裂检测方法及相关设备 Download PDF

Info

Publication number
CN115440242A
CN115440242A CN202211074065.1A CN202211074065A CN115440242A CN 115440242 A CN115440242 A CN 115440242A CN 202211074065 A CN202211074065 A CN 202211074065A CN 115440242 A CN115440242 A CN 115440242A
Authority
CN
China
Prior art keywords
sound
sound signal
mel
layer
cepstrum coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211074065.1A
Other languages
English (en)
Inventor
苗笛
王以民
李士心
杨素君
弓之箭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Heng Yi Mechanical And Electronic Technology Co ltd
Tianjin University of Technology
Original Assignee
Tianjin Heng Yi Mechanical And Electronic Technology Co ltd
Tianjin University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Heng Yi Mechanical And Electronic Technology Co ltd, Tianjin University of Technology filed Critical Tianjin Heng Yi Mechanical And Electronic Technology Co ltd
Priority to CN202211074065.1A priority Critical patent/CN115440242A/zh
Publication of CN115440242A publication Critical patent/CN115440242A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • G10L25/30Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G43/00Control devices, e.g. for safety, warning or fault-correcting
    • B65G43/02Control devices, e.g. for safety, warning or fault-correcting detecting dangerous physical condition of load carriers, e.g. for interrupting the drive in the event of overheating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65GTRANSPORT OR STORAGE DEVICES, e.g. CONVEYORS FOR LOADING OR TIPPING, SHOP CONVEYOR SYSTEMS OR PNEUMATIC TUBE CONVEYORS
    • B65G2203/00Indexing code relating to control or detection of the articles or the load carriers during conveying
    • B65G2203/02Control or detection
    • B65G2203/0266Control or detection relating to the load carrier(s)
    • B65G2203/0275Damage on the load carrier

Abstract

本申请提供一种输送带纵向撕裂检测方法及相关设备,所述方法包括:获取带式输送机的声音信号,并对所述声音信号进行预处理;提取预处理后声音信号的动态声音样本特征;构建改进的DenseNet卷积神经网络模型;根据所述声音特征训练所述改进的DenseNet卷积神经网络模型;利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。本申请的方法能够在短时间内根据声音准确地检测出纵向撕裂故障,减少带式输送机输送带由于纵向撕裂带来的损失。

Description

输送带纵向撕裂检测方法及相关设备
技术领域
本申请涉及输送带检测技术领域,尤其涉及一种输送带纵向撕裂检测方法及相关设备。
背景技术
带式输送机输送带在使用过程中经常产生故障,其故障可分为两类,一类是输送带的内部故障,主要是钢丝绳芯输送带的钢丝绳芯故障,包括钢丝绳芯接头搭接不规范、拉伸,锈蚀、断裂和划伤等,另一类是输送带的表面故障,主要包括跑偏、表面损伤和纵向撕裂等,跑偏和纵向撕裂故障是经常发生的故障,也是重点防治的故障。
采用机器视觉技术方法进行输送带纵向撕裂检测,检测系统都比较复杂,安装成本高。随着声音检测技术的发展,多通道的声音采集设备由于其技术的稳定成熟已广泛应用到各行业中。采用声音检测技术去检测异物及故障已经得到应用。目前声音检测主要采用特征参数提取与分类器结合的方法,因此特征参数提取方法与分类器的选择将会直接影响异物声音的识别率。利用声音和图像结合能够检测输送带撕裂,但是也存在采用机器视觉技术检测输送带纵向撕裂的不足,并且检测系统过于复杂,声音检测准确性差。
发明内容
有鉴于此,本申请的目的在于提出一种解决上述问题的输送带纵向撕裂检测方法及相关设备。
基于上述目的,本申请第一方面提供一种输送带纵向撕裂检测方法,包括:
获取带式输送机的声音信号,并对所述声音信号进行预处理;
提取预处理后声音信号的动态声音样本特征;
构建改进的DenseNet卷积神经网络模型;
根据所述声音特征训练所述改进的DenseNet卷积神经网络模型;
利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。
进一步地,所述改进的DenseNet卷积神经网络模型包括三个稠密块层Dense_block和三个过渡层Transition_layer,每个Dense_block包括六个第一网络层组和六个第二网络层组。
进一步地,所述第一网络层组包括一个BN层、一个ReLU层和一个1*1的卷积层;
所述第二网络层组包括一个BN层、一个ReLU层和一个3*3的卷积层;
所述Transition_layer包括一个1*1的卷积层和一个2*2的平均池化层。
进一步地,所述提取预处理后声音信号的动态声音样本特征包括:
对预处理后的声音信号进行快速傅里叶变换,得到频域信号;
利用Mel滤波器组对所述频域信号进行过滤处理,得到每帧声音信号的帧能量;
将每帧声音信号的帧能量带入离散余弦变换,得到第一梅尔频率倒谱系数MFCC;
对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数;
根据所述第一梅尔频率倒谱系数、所述第二梅尔频率倒谱系数和所述第三梅尔频率倒谱系数,动态声音样本特征。
进一步地,所述对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数包括:
对所述梅尔频率倒谱系数进行一阶差分运算,得到第一动态梅尔频率倒谱系数;
对所述第一动态梅尔频率倒谱系数进行一阶差分运算,得到第二动态梅尔频率倒谱系数。
进一步地,所述一阶差分运算的表达式如下:
Figure BDA0003830733830000021
其中,dt表示第t个一阶差分,表示第t个梅尔频率倒谱系数,Q表示梅尔频率倒谱系数的阶数,K表示一阶导数的时间差,且K=2。
进一步地,所述对所述声音信号进行预处理包括:
对所述声音信号进行预加重处理;
对所述声音信号进行分帧处理;
对所述声音信号进行加窗处理。
基于同一发明构思,本申请第二方面提供一种输送带纵向撕裂检测装置,包括:
获取模块,被配置为获取带式输送机的声音信号;
预处理模块,被配置为对所述声音信号进行预处理;
特征提取模块,被配置为提取预处理后声音信号的动态声音样本特征;
模型构建模块,被配置为构建改进的DenseNet卷积神经网络模型;
模型训练模块,被配置为根据所述声音特征训练所述改进的DenseNet卷积神经网络模型;
检测模块,被配置为利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。
基于同一发明构思,本申请第三方面提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法。
基于同一发明构思,本申请第四方面提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行第一方面所述的方法。
从上面所述可以看出,本申请提供的输送带纵向撕裂检测方法及相关设备,利用输送带纵向撕裂声音的特征,基于梅尔频率倒谱系数对声音特征进行有效提取,通过改进的DenseNet网络模型对带式输送机输送带纵向撕裂准确、快速地进行检测,能够减少带式输送机输送带由于纵向撕裂带来的损失,具有较好的实时性,能够满足生产的要求。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的输送带纵向撕裂检测方法流程图;
图2为本申请实施例的实验数据结构示意图;
图3为本申请实施例的SVM分类器验证MFCC和动态MFCC特征提取识别混淆矩阵示意图;
图4为本申请实施例的改进的DenseNet网络的准确率和损失率示意图;
图5为本申请实施例的输送带纵向撕裂检测装置结构示意图;
图6为本申请实施例的电子设备结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术部分所述,相关技术中的输送带纵向撕裂检测方案还难以满足需要。随着机器视觉技术的发展,计算机视觉技术被广泛应用于安防、农业生产、智能交通等领域。因此也成为纵向撕裂检测的主流方向。但是采用机器视觉技术方法进行输送带纵向撕裂检测,检测系统都比较复杂,安装成本高。而且因为现场环境环境恶劣,存在大量粉尘,导致相机和光源经常因沾污而无法正常工作,故障率和维护成本高。在实际工作现场中,带式输送机输送带纵向撕裂往往是通过附近工人听到异常声音发现的。因此,通过声音来检测输送带纵向撕裂的思路是可行的。将机器视觉技术和声音检测技术进行结合以对带式输送机输送带纵向撕裂进行检测。
带式输送机输送带在使用过程中经常产生故障,其故障可分为两类,一类是输送带的内部故障,主要是钢丝绳芯输送带的钢丝绳芯故障,包括钢丝绳芯接头搭接不规范、拉伸,锈蚀、断裂和划伤等,钢丝绳芯接头是整条钢丝绳芯输送带抗拉强度最低,最为薄弱的环节,其故障造成的断带事故时有发生;另一类是输送带的表面故障,主要包括跑偏、表面损伤和纵向撕裂等,跑偏和纵向撕裂故障是经常发生的故障,也是重点防治的故障。造成输送带故障的原因有多种,其主要原因是长期在恶劣环境下使用使输送带老化,载荷量增加,接头搭接和硫化不好,被废钢铁或煤矸石等异物或障碍物划伤,皮带输送机的安装调整不当,转载点处落料位置不正造成的负载不均匀等。由于故障得不到及时检测和处理,带式输送机输送带纵向撕裂等重大安全事故时有发生,导致运输煤炭损耗和停产,造成了严重的经济损失。
传统的输送带纵向撕裂主要检测方法有机械检测法、超声波检测法、电磁检测法。机械检测方法必须有异物掉落出动检测装置进行检测,容易出现漏检或者误报,检测效率低;超声波检测方法对检测环境要求较高,对输送带震动产生的干扰敏感,系统误报严重;电磁检测法是先将感应线圈嵌入到输送带中。当发生撕裂时,通过检测感应线圈回路是否断开来检测撕裂。但存在易损坏、成本高、通用性差的缺点。
有鉴于此,本申请实施例提供一种输送带纵向撕裂检测方法,基于梅尔频率倒谱系数对声音特征进行有效提取,并通过改进的DenseNet网络模型对带式输送机输送带纵向撕裂进行检测,并通过相关实验数据来验证本申请提供的方法的准确性。
以下,通过具体实施例来详细说明本申请的技术方案。
参考图1,本申请一个实施例提供的一种输送带纵向撕裂检测方法,具体包括以下步骤:
步骤S101,获取带式输送机的声音信号,并对所述声音信号进行预处理。
本步骤中,需要在带式输送机工作现场中进行声音采集,设定声音采集的采样频率为48kHz,每段声音采集时长约为2s。由于带式输送机在不同带速下工作声音会出现差异,因此本文选择在3m/s、5m/s带速下进行声音采集。采集声音数据集包括带式输送机空载运行声音、负载运行声音、运行时混合人声、运行时输送带撕裂声音四类。采样频率选择48k,每种类型声音采集300段,共1200段声音数据集。每种声音类型选取一个声音文件为例,绘制声音文件的幅值波形图。带式输送机运行时声音较大掩盖了人声以及输送带撕裂的声音,因此通过每种声音的幅值波形图无法直接进行区分空载运行声音、负载运行声音、运行时混合人声和运行时输送带撕裂声音。
步骤S102,提取预处理后声音信号的动态声音样本特征。
本步骤中,声音信号的幅值波形图虽然能够有效的表述出声音信号的特点,但是对于声音信号的识别与处理,时域分析对所有的信息都具有同等的信息量,恰好带式输送机工作环境复杂,所提取的声音信号是多种信号叠加而成,而输送带撕裂声音都是混杂在复杂的声音信号中,因此想要有效的提取输送带撕裂声音信号需要直接关注输送带撕裂声音的信号频率,将音频信号转换到频域上,从频域上通过滤除其他频率信息来截取输送带撕裂的声音信号。
步骤S103,构建改进的DenseNet卷积神经网络模型。
本步骤中,DenseNet网络主要由(Dense_block)稠密块和(Transition_layer)过渡层组成。DenseNet的网络结构中,每一层的输入来都自前面所有层的输出,通过Dense_block中每层均以密集连接的方式连接到后续所有层。稠密块用于定义输入输出之间的连接关系,过渡层用来控制通道数量。通过在Transition_layer加入1*1卷积做降维处理。有效的解决了Dense_block输出维度大的问题。
步骤S104,根据所述声音特征训练所述改进的DenseNet卷积神经网络模型。
本步骤中,将声音划分为训练集与测试集,训练集1000段,测试集200段。利用训练集对改进的DenseNet卷积神经网络模型进行训练,直至达到预设的预测准确率或达到预设的迭代次数。通过测试集验证模型的预测准确率。
步骤S105,利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。
本步骤中,能够根据来自带式输送机的声音信号得到输送带纵向撕裂的概率,或设置概率阈值将预测结果划分为“输送带撕裂”和“输送带未撕裂”。
可见,本实施例提供的输送带纵向撕裂检测方法,利用输送带纵向撕裂声音的特征,基于梅尔频率倒谱系数对声音特征进行有效提取,通过改进的DenseNet网络模型对带式输送机输送带纵向撕裂准确、快速地进行检测,能够减少带式输送机输送带由于纵向撕裂带来的损失,具有较好的实时性,能够满足生产的要求。
在一些实施例中,所述改进的DenseNet卷积神经网络模型包括三个稠密块层Dense_block和三个过渡层Transition_layer,每个Dense_block包括六个第一网络层组和六个第二网络层组。所述第一网络层组包括一个BN层、一个ReLU层和一个1*1的卷积层;所述第二网络层组包括一个BN层、一个ReLU层和一个3*3的卷积层;所述Transition_layer包括一个1*1的卷积层和一个2*2的平均池化层。
具体的,改进的DenseNet卷积神经网络结构如下表所示:
Figure BDA0003830733830000071
在一些实施例中,对所述声音信号进行预处理具体包括以下步骤:
(1)对所述声音信号进行预加重处理。
预加重是使用高通滤波器来提升信号高频部分,使频谱更平坦,这样可以保证在低频到高频的整个频带中可以用同样的信噪比来求频谱,高通滤波器如下所示:
H(z)=1-uz-1
其中,z表示声音信号,u表示高通滤波系数,其值为介于0.9-1.0之间的常数。
(2)对所述声音信号进行分帧处理。
分帧是将较长的声音信号分成多个小段。一帧涵盖的时间通常为20~30ms,为了避免相邻两帧的变化过大,要让两个相邻帧之间有一段重叠区域(一般为帧长的一半),本实施例将每1200个采样信号作为一帧,则每帧数据时长25ms。
(3)对所述声音信号进行加窗处理。
加窗是为了避免每帧信号的两端可能会出现信号不连续现象。常用的窗函数有方窗、Hamming窗和Hanning窗等。相比之下,Hamming窗适合处理频谱表现复杂、存在多个频谱分量的信号,因此本实施例选择Hamming窗进行数据加窗,每一帧信号为:S(i),i=0,1,....I-1,I为帧的大小,加窗后数据如下所示:
S'(i)=S(i)×W(i)
其中,S'(i)表示增加Hamming窗后的声音信号,S(i)表示未增加Hamming窗的声音信号。
具体的,W(i)为Hamming窗且如下所示:
Figure BDA0003830733830000081
其中,a表示Hamming窗调节系数,I表示窗口长度。
在一些实施例中,对于前述实施例中的步骤S102,其还可以包括以下步骤:
步骤S1021,对预处理后的声音信号进行快速傅里叶变换,得到频域信号。
本步骤中,由于分析时域上的信号特性比较困难,因此需要通常利用快速傅里叶变换(FFT)将信号转换到频域上进行分析。本实施例对预处理后的数据进行快速傅里叶变换(DFT),第i帧信号的DFT如下所示:
Figure BDA0003830733830000082
其中,x(i)表示输入的声音信号I表示快速傅里叶变换的点数,j为整数。
步骤S1022,利用Mel滤波器组对所述频域信号进行过滤处理,得到每帧声音信号的帧能量。
本步骤中,由于传感器对不同频率声音的敏感度不同,为了使对采集到的声音信号在识别与处理中不受到音调的影响,需要设计滤波器组来对频谱信号进行处理,本实施例定义一个有M个滤波器的滤波器组,作为梅尔滤波器组,其中每个滤波器组的响应函数如下所示:
Figure BDA0003830733830000091
在声音信号的特征提取中需要通过信号的能量来区分声音的特征,因此本实施例采用计算声音的短时能量的方法。其中,第i帧信号的能量谱Ei(k)如下所示:
Ei(k)=|Xi(k)|2
每帧信号的能量经过Mel滤波器得到最终的帧能量,如下所示:
Figure BDA0003830733830000092
步骤S1023,将每帧声音信号的帧能量带入离散余弦变换,得到第一梅尔频率倒谱系数MFCC。
本步骤中,离散余弦变换(DCT)用于压缩数据或压缩图像,具有良好的去相关性。对第i帧信号进行离散余弦变换来得到梅尔频率倒谱参数,其公式为:
Figure BDA0003830733830000093
其中,Si(m)表示第N个滤波器输出的帧能量,M表示滤波器的个数,L表示特征维度。
步骤S1024,对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数。
步骤S1025,根据所述第一梅尔频率倒谱系数、所述第二梅尔频率倒谱系数和所述第三梅尔频率倒谱系数,动态声音样本特征。
在一些实施例中,对与前述实施例中的步骤S1024,其还可以包括以下步骤:
步骤S10241,对所述梅尔频率倒谱系数进行一阶差分运算,得到第一动态梅尔频率倒谱系数。
本步骤中,所述一阶差分运算的表达式如下:
Figure BDA0003830733830000101
其中,dt表示第t个一阶差分,表示第t个梅尔频率倒谱系数,Q表示梅尔频率倒谱系数的阶数,K表示一阶导数的时间差,且K=2。
步骤S10242,对所述第一动态梅尔频率倒谱系数进行一阶差分运算,得到第二动态梅尔频率倒谱系数。
步骤S10243,根据所述第一动态梅尔频率倒谱系数和所述第二动态梅尔频率倒谱系数,得到所述动态梅尔频率倒谱系数。
具体的,梅尔频率倒谱系数取特征明显的前40维特征,第一动态梅尔频率倒谱系数和第二动态梅尔频率倒谱系数均提取前10维特征,最终得到60维的声音特征。
下面,结合以上实施例通过具体实验来说明本方法的有效性。
实验环境选择Windows10操作系统,I7-6800K@3.4GHz CPU,GTX1080显卡,16G内存,基于jupyter平台,搭建开源深度学习Tensorflow2.0框架,使用Python3.7进行程序编写。实验选取带式输送机现场采集声音数据集包括带式输送机空载运行声音、负载运行声音、运行时混合人声、运行时输送带撕裂声音四类,数据结构如图2所示。
基于jupyter平台使用sklearn库建立SVM分类器,对MFCC和动态声音样本特征提取结果进行验证。分别得到识别的混淆矩阵如图3所示。由图3可以得到MFCC特征提取使用SVM分类器的识别率为88.8%,而动态声音样本特征提取使用SVM分类器的识别率为91%。经过对此验证取平均,MFCC特征提取的识别率能够稳定在88%,而使用动态声音样本特征提取的识别率却能够达到90%,因此可以看出使用动态MFCC进行声音样本特征提取的识别率要优于MFCC特征提取的结果。
使用前述实施例所述改进的DenseNet卷积神经网络模型进行训练,数据批次选择128,迭代200个周期,可以得到识别率及损失率如图4所示。
为验证改进的DenseNet卷积神经网络模型对带式输送机纵向撕裂声音的识别效果,设计对比试验,分别使用基于jupyter平台使用sklearn库建立随机森林分类器、建立SVM分类器、搭建LSTM神经网络与本文模型进行识别效果对比实验。实验结果如表2所示:
表2
Figure BDA0003830733830000111
可见,基于改进DenseNet的声音的输送带纵向撕裂检测方法在输送带纵向撕裂声音检测的识别率能够达到93.92%,比使用随机森林、SVM分类器以及LSTM模型准确率分别高13.86%、2.87%和5.46%,因此使用本申请的方法对纵向撕裂声音识别效果更好。
利用本申请方法进行测试,平均每段音频检测时间为29.76ms,因此表明在带式输送机发生纵向撕裂时,能够在很短的时间内根据声音准确地检测出纵向撕裂故障,减少带式输送机纵向撕裂带来的损失,说明本申请提出的方法具有很好的实时性,能够满足生产的要求。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种输送带纵向撕裂检测装置。
参考图5,所述输送带纵向撕裂检测装置,包括:
获取模块501,被配置为获取带式输送机的声音信号。
预处理模块502,被配置为对所述声音信号进行预处理。
特征提取模块503,被配置为提取预处理后声音信号的动态声音样本特征。
模型构建模块504,被配置为构建改进的DenseNet卷积神经网络模型。
模型训练模块505,被配置为根据所述声音特征训练所述改进的DenseNet卷积神经网络模型。
检测模块506,被配置为利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。
作为一个可选的实施例,所述改进的DenseNet卷积神经网络模型包括三个稠密块层Dense_block和三个过渡层Transition_layer,每个Dense_block包括六个第一网络层组和六个第二网络层组。
作为一个可选的实施例,所述第一网络层组包括一个BN层、一个ReLU层和一个1*1的卷积层;所述第二网络层组包括一个BN层、一个ReLU层和一个3*3的卷积层;所述Transition_layer包括一个1*1的卷积层和一个2*2的平均池化层。
作为一个可选的实施例,所述提取预处理后声音信号的动态声音样本特征包括:对预处理后的声音信号进行快速傅里叶变换,得到频域信号;利用Mel滤波器组对所述频域信号进行过滤处理,得到每帧声音信号的帧能量;将每帧声音信号的帧能量带入离散余弦变换,得到第一梅尔频率倒谱系数MFCC;对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数;根据所述第一梅尔频率倒谱系数、所述第二梅尔频率倒谱系数和所述第三梅尔频率倒谱系数,动态声音样本特征。
作为一个可选的实施例,所述对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数包括:对所述梅尔频率倒谱系数进行一阶差分运算,得到第一动态梅尔频率倒谱系数;对所述第一动态梅尔频率倒谱系数进行一阶差分运算,得到第二动态梅尔频率倒谱系数。
作为一个可选的实施例,所述一阶差分运算的表达式如下:
Figure BDA0003830733830000121
其中,dt表示第t个一阶差分,表示第t个梅尔频率倒谱系数,Q表示梅尔频率倒谱系数的阶数,K表示一阶导数的时间差,且K=2。
作为一个可选的实施例,所述对所述声音信号进行预处理包括:对所述声音信号进行预加重处理;对所述声音信号进行分帧处理;对所述声音信号进行加窗处理。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的输送带纵向撕裂检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的输送带纵向撕裂检测方法。
图6示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的输送带纵向撕裂检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的输送带纵向撕裂检测方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的输送带纵向撕裂检测方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种输送带纵向撕裂检测方法,其特征在于,包括:
获取带式输送机的声音信号,并对所述声音信号进行预处理;
提取预处理后声音信号的动态声音样本特征;
构建改进的DenseNet卷积神经网络模型;
根据所述声音特征训练所述改进的DenseNet卷积神经网络模型;
利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。
2.根据权利要求1所述的检测,其特征在于,所述改进的DenseNet卷积神经网络模型包括三个稠密块层Dense_block和三个过渡层Transition_layer,每个Dense_block包括六个第一网络层组和六个第二网络层组。
3.根据权利要求2所述的检测,其特征在于,所述第一网络层组包括一个BN层、一个ReLU层和一个1*1的卷积层;
所述第二网络层组包括一个BN层、一个ReLU层和一个3*3的卷积层;
所述Transition_layer包括一个1*1的卷积层和一个2*2的平均池化层。
4.根据权利要求1所述的检测,其特征在于,所述提取预处理后声音信号的动态声音样本特征包括:
对预处理后的声音信号进行快速傅里叶变换,得到频域信号;
利用Mel滤波器组对所述频域信号进行过滤处理,得到每帧声音信号的帧能量;
将每帧声音信号的帧能量带入离散余弦变换,得到第一梅尔频率倒谱系数MFCC;
对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数;
根据所述第一梅尔频率倒谱系数、所述第二梅尔频率倒谱系数和所述第三梅尔频率倒谱系数,动态声音样本特征。
5.根据权利要求4所述的检测,其特征在于,所述对所述第一梅尔频率倒谱系数进行差分运算,得到第二梅尔频率倒谱系数和第三梅尔频率倒谱系数包括:
对所述梅尔频率倒谱系数进行一阶差分运算,得到第一动态梅尔频率倒谱系数;
对所述第一动态梅尔频率倒谱系数进行一阶差分运算,得到第二动态梅尔频率倒谱系数。
6.根据权利要求5所述的检测,其特征在于,所述一阶差分运算的表达式如下:
Figure FDA0003830733820000021
其中,dt表示第t个一阶差分,表示第t个梅尔频率倒谱系数,Q表示梅尔频率倒谱系数的阶数,K表示一阶导数的时间差,且K=2。
7.根据权利要求1所述的检测,其特征在于,所述对所述声音信号进行预处理包括:
对所述声音信号进行预加重处理;
对所述声音信号进行分帧处理;
对所述声音信号进行加窗处理。
8.一种输送带纵向撕裂检测装置,其特征在于,包括:
获取模块,被配置为获取带式输送机的声音信号;
预处理模块,被配置为对所述声音信号进行预处理;
特征提取模块,被配置为提取预处理后声音信号的动态声音样本特征;
模型构建模块,被配置为构建改进的DenseNet卷积神经网络模型;
模型训练模块,被配置为根据所述声音特征训练所述改进的DenseNet卷积神经网络模型;
检测模块,被配置为利用训练好的DenseNet卷积神经网络模型对待检测声音信号进行检测,得到输送带纵向撕裂检测结果。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7任一所述方法。
CN202211074065.1A 2022-09-02 2022-09-02 输送带纵向撕裂检测方法及相关设备 Pending CN115440242A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211074065.1A CN115440242A (zh) 2022-09-02 2022-09-02 输送带纵向撕裂检测方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211074065.1A CN115440242A (zh) 2022-09-02 2022-09-02 输送带纵向撕裂检测方法及相关设备

Publications (1)

Publication Number Publication Date
CN115440242A true CN115440242A (zh) 2022-12-06

Family

ID=84246413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211074065.1A Pending CN115440242A (zh) 2022-09-02 2022-09-02 输送带纵向撕裂检测方法及相关设备

Country Status (1)

Country Link
CN (1) CN115440242A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115848938A (zh) * 2022-12-29 2023-03-28 重庆大学 适用于带式输送机的声光巡检方法、终端及可读存储介质
CN116579663A (zh) * 2023-07-05 2023-08-11 江苏慧远智能科技有限公司 一种粉罐车卸料过程中异常预警方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115848938A (zh) * 2022-12-29 2023-03-28 重庆大学 适用于带式输送机的声光巡检方法、终端及可读存储介质
CN116579663A (zh) * 2023-07-05 2023-08-11 江苏慧远智能科技有限公司 一种粉罐车卸料过程中异常预警方法
CN116579663B (zh) * 2023-07-05 2023-10-20 江苏慧远智能科技有限公司 一种粉罐车卸料过程中异常预警方法

Similar Documents

Publication Publication Date Title
CN115440242A (zh) 输送带纵向撕裂检测方法及相关设备
CN114013957B (zh) 基于声音信号的输送带纵向撕裂检测方法及相关设备
US11386916B2 (en) Segmentation-based feature extraction for acoustic scene classification
CN112735473B (zh) 基于声音识别无人机的方法及系统
JP6527187B2 (ja) 学習モデル構築装置、異常検出装置、異常検出システム及びサーバ
US11947863B2 (en) Intelligent audio analytic apparatus (IAAA) and method for space system
CN110239914B (zh) 红外视听频谱融合输送带纵向撕裂检测预警装置及方法
US20150016617A1 (en) Modified mel filter bank structure using spectral characteristics for sound analysis
CN110390942A (zh) 基于婴儿哭声的情绪检测方法及其装置
EP3759789B1 (en) System and method for audio and vibration based power distribution equipment condition monitoring
Che et al. Longitudinal tear detection method of conveyor belt based on audio-visual fusion
Pan et al. Cognitive acoustic analytics service for Internet of Things
US20140079323A1 (en) Classification apparatus and non-transitory computer readable medium
JP2012018066A (ja) 異常検査装置
CN111986699A (zh) 基于全卷积网络的声音事件检测方法
CN106203437A (zh) 个体驾驶行为特征识别方法和装置
DE102020125613A1 (de) Leichtgewichtige audioquellen-ortserfassung über vollständige 360 ° mit zwei mikrofonen
CN116778956A (zh) 一种变压器声学特征提取及故障识别方法
CN105810222A (zh) 一种音频设备的缺陷检测方法、装置及系统
CN115910097A (zh) 一种高压断路器潜伏性故障可听声信号识别方法及系统
CN114023353A (zh) 基于聚类分析和相似度计算的变压器故障分类方法及系统
Miao et al. Sound-based improved densenet conveyor belt longitudinal tear detection
CN117110744A (zh) 一种基于声纹分析的变压器故障诊断方法及系统
CN113963719A (zh) 基于深度学习的声音分类方法和装置、存储介质和计算机
Yang et al. A deep learning-based framework for damage detection with time series

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination