CN109272987A

CN109272987A - 一种分选煤和矸石的声音识别方法

Info

Publication number: CN109272987A
Application number: CN201811114326.1A
Authority: CN
Inventors: 邓小伟; 张传祥; 邢宝林; 程敢
Original assignee: Henan University of Technology
Current assignee: Henan University of Technology
Priority date: 2018-09-25
Filing date: 2018-09-25
Publication date: 2019-01-25

Abstract

本发明公开了一种分选煤和矸石的声音识别方法，依据煤和矸石的声音特征差异，利用计算机声音处理技术，分别提取煤和矸石声音特征参数：频率方差、频率偏度、频率峰度、波长、传播速度和频率共生矩阵的11个特征参数，总共的16个特征参数，选取足够量的煤和矸石的样品，对样品编号并提取每个样品的5个主成分特征参数，依次对神经网络进行训练，达到训练要求误差。在训练好的BP神经网络中，输入任何一段煤和矸石声音片段，即可从输出层得到识别结果。在训练BP神经网络中，输入任何一段声音片段中提取的特征参数，即可从输出层得到识别的结果。本发明有助于煤和矸石的分选，自动化程度和分选精度高。

Description

一种分选煤和矸石的声音识别方法

技术领域

本发明涉及煤炭分选工艺技术领域，特别是一种分选煤和矸石的声音识别方法。

背景技术

传统煤炭分选过程中以水为工作介质的“洗煤”方式占主导地位。重介质分选和跳汰分选是最常用的两种方法。由于水介质的作用，造成分选工艺复杂成本较高和环境保护的压力大。随着节能降耗和绿色分选的发展，以及自动化和智能化分选方式的提出，使得新型选煤方法收到社会和行业的重视。主要体现在：一方面不借助水介质的干法分选方式收到人们青睐；另一方面光、电等技术在选煤方面的应用受到人们的重视。

近年来，一些新的分选方法也有面世，如干法分选、光电和射线等分选方法。但除尘、处理能力、分选精度控制等问题解决的仍不理想，而利用声音识别技术实现煤炭分选能较好的解决这些问题提供了新思路。

发明内容

本发明的目的是要解决现有技术中存在的不足，提供一种分选煤和矸石的声音识别方法。

为达到上述目的，本发明是按照以下技术方案实施的：

一种分选煤和矸石的声音识别方法，包括以下步骤：

步骤一、在分选煤和矸石的分选过程中，用敲击装置来敲击煤和矸石产生不同的声音，采用一个精密声级拾音器提取敲击煤和矸石产生的声音片段，并对采集的所有声音片段进行前处理，所述前处理包括对所有声音片段的语音降噪、滤波消噪；

步骤二、将经前处理的声音片段经A/D采样后存储于计算机，通过计算机对经前处理的声音片段再次进行滤波和降噪处理；

步骤三、对步骤二处理过的声音片段提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵共5个特征参数，共生矩阵的特征参数包括对比度、相关、逆差距、能量、中值、协方差、反差、差异性、二阶矩、熵、自相关共11个特征参数；

步骤四、通过主成分分析法对提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵的特征参数进行降维处理；

步骤五、选取降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数用于输入BP神经网络的输入层，输出层神经元的个数为1，设定隐含层神经元的个数为4；设定BP神经网络最大训练次数为80000次，使最小均方差为0.0001；设定输入层的转换函数为tansig、输出层的转换函数为purelin、BP神经网络的训练函数为traingdm，权值和阈值的学习函数为learngdm；在输出层中，煤用“1”表示，矸石用“0”表示，即在识别时，输出值与数值“1”接近的即认为是煤，输出值与数值“0”接近的即认为是矸石，然后开始对BP神经网络进行训练；

步骤六、BP神经网络训练完成后，将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中，从而识别出煤和矸石。

进一步，所述步骤一中，所述精密声级拾音器放置于敲击装置上方20cm处，采集1s时长的煤和矸石产生的声音片段。

进一步，所述步骤四中降维处理具体为：采用db5小波对声音片段进行4层分解，得到16个等分的频率段，然后求出每个频率段的能量，然后将各段声音信号能量归一化后构成特征向量，该特征向量可表示为:

式中，E₁，E₂，……，E₁₃，E₁₄为每个频率段能量，E为信号总能量。

进一步，所述步骤五中，分别用［1 0 0 0 0］、［0 1 0 0 0］、［0 0 1 0 0］、［0 0 01 0］和［0 0 0 0 1］来表示降维后的每段声音的频率方差、频率偏度、频率峰度、波长、传播速度。

与现有技术相比，本发明通过煤和矸石敲击时发出的声音差别，通过神经网络训练和实现煤和矸石的自动识别；针对声音数据而言，其识别过程不依赖水介质，方法上减少了一相使得分选工艺流程可大为简化；同时其音频数据采集对环境光照无特殊需求，使声音识别技术更具优势。由于声音在煤和矸石中传播的特性差异，可为煤和矸石的声音识别后分离打下基础。BP神经网络是一种新的信息处理科学，它能模拟人脑并行处理方式，具有惊人的自学习、思维推理、判断和记忆的功能。选取足够量的煤和矸石的样品，对样品编号并提取每个样品的5个主成分特征参数，依次对神经网络进行训练，达到训练要求误差。在训练好的BP神经网络中，输入任何一段煤和矸石声音片段，即可从输出层得到识别结果。本发明有助于煤和矸石的分选，自动化程度和分选精度高。

附图说明

图1为本发明的流程图。

图2 为BP神经网络结构图。

图3为多元神经单层神经网络示意图。

具体实施方式

下面结合具体实施例对本发明作进一步描述，在此发明的示意性实施例以及说明用来解释本发明，但并不作为对本发明的限定。

如图1所示，本实施例的一种分选煤和矸石的声音识别方法，具体步骤如下所示：

在分选煤和矸石的分选过程中，用敲击装置来敲击煤和矸石产生不同的声音，其中，敲击装置可以直接使用现有技术中能够连续对煤和矸石进行敲击的装置即可，本实施例不再赘述；然后采用精密声级拾音器放置于敲击装置上方20cm处，采集1s时长的煤和矸石产生的声音片段，并对采集的所有声音片段进行前处理，所述前处理包括采用MINI DSP音频处理器，DSP语音降噪算法，LD-2L滤波消噪电流声抗干扰器对所有声音片段的语音降噪、滤波消噪。

这些声音信号在输入BP神经网络前需经分析处理，以获取利于识别的有效特征，这是决定BP网络输入层节点数和网络识别精度的关键。前面采集并存储于计算机的声音是离散的时域信号，可对敲击煤或矸石产生的声音的进行频谱等特征分析，以提取相关的特征参数，从而建立煤和矸石的声音特征差异与灰分之间的对应关系。

进一步，将经前处理的声音片段经A/D采样后存储于计算机，通过计算机对经前处理的声音片段再次进行滤波和降噪处理。

进一步，对处理过的声音片段提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵共5个特征参数即是对声音片段进行后处理，共生矩阵的特征参数包括对比度、相关、逆差距、能量、中值、协方差、反差、差异性、二阶矩、熵、自相关共11个特征参数。

进一步，由于不同煤和矸石的声音信号的功率谱不同，通过主成分分析法对提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵的特征参数进行降维处理，具体方法为：采用db5小波对声音片段进行4层分解，得到16个等分的频率段，然后求出每个频率段的能量，然后将各段声音信号能量归一化后构成特征向量，该特征向量可表示为:

BP神经网络是采用误差反向传播算法的多层前馈神经网络，它包含输入层、输出层和一个或多个隐层，如图3所示。各层神经元仅与相邻层神经元之间相互全连接，同层神经元之间无连接。输入信号从输入层节点(神经元)依次传过各隐层节点，再传到输出节点，每一层节点的输出只影响下一层节点的输出，然后按照误差减少的原则，从输出层经隐层向输入层逐层修正权值，这种逆向误差传播修正不断进行，直到达到所要求的学习目标。

进一步，构建BP神经网络，包含输入层节点数、输出层节点数和网络层数的确定。通过BP神经网络中大量的节点之间相互联接关系。使每个节点代表声音特定的激励函数。每两个节点间的连接代表一个对于通过该连接信号的加权值，通过对预先采集的声音片段进行深度学习，使预判声音片段中的权重值随激励函数不同而变化。其中输入层节点数和输出层节点数是由实际问题本身决定的。如图2所示，选取降维处理后的声音片段的5个主成分特征参数：频率方差、频率偏度、频率峰度、波长、传播速度的特征参数用于输入BP神经网络的输入层，分别用［1 0 0 0 0］、［0 1 0 0 0］、［0 0 1 0 0］、［0 0 0 1 0］和［0 0 0 01］来表示降维后的每段声音的频率方差、频率偏度、频率峰度、波长、传播速度，输出层神经元的个数为1，设定隐含层神经元的个数为4；设定BP神经网络最大训练次数为80000次，使最小均方差为0.0001；设定输入层的转换函数为tansig、输出层的转换函数为purelin、BP神经网络的训练函数为traingdm，权值和阈值的学习函数为learngdm；在输出层中，煤用“1”表示，矸石用“0”表示，即在识别时，输出值与数值“1”接近的即认为是煤，输出值与数值“0”接近的即认为是矸石，然后开始对BP神经网络进行训练。

进一步，BP神经网络训练完成后，将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中，从而识别出煤和矸石。

为了进一步验证本实施例的可行性，BP神经网络训练完成后，选取另外的待识别的10个煤试样和10个矸石试样，将每个试样的5个主成分特征参数输入到训练好的BP神经网络中，即得到如表1的输出结果。

表1 BP神经网络测试结果

试样编号	对应特征	测试结果	试样编号	对应特征	测试结果
						1	频率方差	［1 0 0 0 0］	11	频率峰度	［0 0 1 0 0］
2	频率方差	［1 0 0 0 0］	12	频率峰度	［0 0 1 0 0］
						3	频率方差	［1 0 0 0 0］	13	波长	［0 0 0 1 0］
4	频率方差	［1 0 0 0 0］	14	波长	［0 0 0 1 0］
						5	频率偏度	［0 1 0 0 0］	15	波长	［0 0 0 1 0］
6	频率偏度	［0 1 0 0 0］	16	波长	［0 0 0 1 0］
						7	频率偏度	［0 1 0 0 0］	17	传播速度	［0 0 0 0 1］
8	频率偏度	［0 1 0 0 0］	18	传播速度	［0 0 0 0 1］
						9	频率峰度	［0 0 1 0 0］	19	传播速度	［0 0 0 0 1］
10	频率峰度	［0 0 1 0 0］	20	传播速度	［0 0 0 0 1］

从表1中可以看出，将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中，可以快速识别出煤和矸石。

本发明的技术方案不限于上述具体实施例的限制，凡是根据本发明的技术方案做出的技术变形，均落入本发明的保护范围之内。

Claims

1.一种分选煤和矸石的声音识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的分选煤和矸石的声音识别方法，其特征在于：所述步骤一中，所述精密声级拾音器放置于敲击装置上方20cm处，采集1s时长的煤和矸石产生的声音片段。

3.根据权利要求1所述的分选煤和矸石的声音识别方法，其特征在于：所述步骤四中降维处理具体为：采用db5小波对声音片段进行4层分解，得到16个等分的频率段，然后求出每个频率段的能量，然后将各段声音信号能量归一化后构成特征向量，该特征向量可表示为:

4.根据权利要求1所述的分选煤和矸石的声音识别方法，其特征在于：所述步骤五中，分别用［1 0 0 0 0］、［0 1 0 0 0］、［0 0 1 0 0］、［0 0 0 1 0］和［0 0 0 0 1］来表示降维后的每段声音的频率方差、频率偏度、频率峰度、波长、传播速度。