CN109272987A - 一种分选煤和矸石的声音识别方法 - Google Patents
一种分选煤和矸石的声音识别方法 Download PDFInfo
- Publication number
- CN109272987A CN109272987A CN201811114326.1A CN201811114326A CN109272987A CN 109272987 A CN109272987 A CN 109272987A CN 201811114326 A CN201811114326 A CN 201811114326A CN 109272987 A CN109272987 A CN 109272987A
- Authority
- CN
- China
- Prior art keywords
- frequency
- spoil
- sound
- coal
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003245 coal Substances 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000013528 artificial neural network Methods 0.000 claims abstract description 34
- 238000012549 training Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 15
- 238000002203 pretreatment Methods 0.000 claims description 11
- 210000002569 neuron Anatomy 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 4
- 238000000354 decomposition reaction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000000513 principal component analysis Methods 0.000 claims description 3
- 238000011946 reduction process Methods 0.000 claims description 3
- 238000010079 rubber tapping Methods 0.000 claims description 3
- 230000001902 propagating effect Effects 0.000 claims description 2
- 238000000926 separation method Methods 0.000 abstract description 10
- 238000005516 engineering process Methods 0.000 abstract description 6
- 238000001228 spectrum Methods 0.000 abstract description 4
- 239000010410 layer Substances 0.000 description 33
- 239000012736 aqueous medium Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 230000005622 photoelectricity Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B07—SEPARATING SOLIDS FROM SOLIDS; SORTING
- B07B—SEPARATING SOLIDS FROM SOLIDS BY SIEVING, SCREENING, SIFTING OR BY USING GAS CURRENTS; SEPARATING BY OTHER DRY METHODS APPLICABLE TO BULK MATERIAL, e.g. LOOSE ARTICLES FIT TO BE HANDLED LIKE BULK MATERIAL
- B07B13/00—Grading or sorting solid materials by dry methods, not otherwise provided for; Sorting articles otherwise than by indirectly controlled devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种分选煤和矸石的声音识别方法,依据煤和矸石的声音特征差异,利用计算机声音处理技术,分别提取煤和矸石声音特征参数:频率方差、频率偏度、频率峰度、波长、传播速度和频率共生矩阵的11个特征参数,总共的16个特征参数,选取足够量的煤和矸石的样品,对样品编号并提取每个样品的5个主成分特征参数,依次对神经网络进行训练,达到训练要求误差。在训练好的BP神经网络中,输入任何一段煤和矸石声音片段,即可从输出层得到识别结果。在训练BP神经网络中,输入任何一段声音片段中提取的特征参数,即可从输出层得到识别的结果。本发明有助于煤和矸石的分选,自动化程度和分选精度高。
Description
技术领域
本发明涉及煤炭分选工艺技术领域,特别是一种分选煤和矸石的声音识别方法。
背景技术
传统煤炭分选过程中以水为工作介质的“洗煤”方式占主导地位。重介质分选和跳汰分选是最常用的两种方法。由于水介质的作用,造成分选工艺复杂成本较高和环境保护的压力大。随着节能降耗和绿色分选的发展,以及自动化和智能化分选方式的提出,使得新型选煤方法收到社会和行业的重视。主要体现在:一方面不借助水介质的干法分选方式收到人们青睐;另一方面光、电等技术在选煤方面的应用受到人们的重视。
近年来,一些新的分选方法也有面世,如干法分选、光电和射线等分选方法。但除尘、处理能力、分选精度控制等问题解决的仍不理想,而利用声音识别技术实现煤炭分选能较好的解决这些问题提供了新思路。
发明内容
本发明的目的是要解决现有技术中存在的不足,提供一种分选煤和矸石的声音识别方法。
为达到上述目的,本发明是按照以下技术方案实施的:
一种分选煤和矸石的声音识别方法,包括以下步骤:
步骤一、在分选煤和矸石的分选过程中,用敲击装置来敲击煤和矸石产生不同的声音,采用一个精密声级拾音器提取敲击煤和矸石产生的声音片段,并对采集的所有声音片段进行前处理,所述前处理包括对所有声音片段的语音降噪、滤波消噪;
步骤二、将经前处理的声音片段经A/D采样后存储于计算机,通过计算机对经前处理的声音片段再次进行滤波和降噪处理;
步骤三、对步骤二处理过的声音片段提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵共5个特征参数,共生矩阵的特征参数包括对比度、相关、逆差距、能量、中值、协方差、反差、差异性、二阶矩、熵、自相关共11个特征参数;
步骤四、通过主成分分析法对提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵的特征参数进行降维处理;
步骤五、选取降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数用于输入BP神经网络的输入层,输出层神经元的个数为1,设定隐含层神经元的个数为4;设定BP神经网络最大训练次数为80000次,使最小均方差为0.0001;设定输入层的转换函数为tansig、输出层的转换函数为purelin、BP神经网络的训练函数为traingdm,权值和阈值的学习函数为learngdm;在输出层中,煤用“1”表示,矸石 用“0”表示,即在识别时,输出值与数值“1”接近的即认为是煤,输出值与数值“0”接近的即认为是矸石,然后开始对BP神经网络进行训练;
步骤六、BP神经网络训练完成后,将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中,从而识别出煤和矸石。
进一步,所述步骤一中,所述精密声级拾音器放置于敲击装置上方20cm处,采集1s时长的煤和矸石产生的声音片段。
进一步,所述步骤四中降维处理具体为:采用db5小波对声音片段进行4层分解,得到16个等分的频率段,然后求出每个频率段的能量,然后将各段声音信号能量归一化后构成特征向量,该特征向量可表示为:
式中,E1,E2,……,E13,E14为每个频率段能量,E为信号总能量。
进一步,所述步骤五中,分别用[1 0 0 0 0]、[0 1 0 0 0]、[0 0 1 0 0]、[0 0 01 0]和[0 0 0 0 1]来表示降维后的每段声音的频率方差、频率偏度、频率峰度、波长、传播速度。
与现有技术相比,本发明通过煤和矸石敲击时发出的声音差别,通过神经网络训练和实现煤和矸石的自动识别;针对声音数据而言,其识别过程不依赖水介质,方法上减少了一相使得分选工艺流程可大为简化;同时其音频数据采集对环境光照无特殊需求,使声音识别技术更具优势。由于声音在煤和矸石中传播的特性差异,可为煤和矸石的声音识别后分离打下基础。BP神经网络是一种新的信息处理科学,它能模拟人脑并行处理方式,具有惊人的自学习、思维推理、判断和记忆的功能。选取足够量的煤和矸石的样品,对样品编号并提取每个样品的5个主成分特征参数,依次对神经网络进行训练,达到训练要求误差。在训练好的BP神经网络中,输入任何一段煤和矸石声音片段,即可从输出层得到识别结果。本发明有助于煤和矸石的分选,自动化程度和分选精度高。
附图说明
图1为本发明的流程图。
图2 为BP神经网络结构图。
图3为多元神经单层神经网络示意图。
具体实施方式
下面结合具体实施例对本发明作进一步描述,在此发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
如图1所示,本实施例的一种分选煤和矸石的声音识别方法,具体步骤如下所示:
在分选煤和矸石的分选过程中,用敲击装置来敲击煤和矸石产生不同的声音,其中,敲击装置可以直接使用现有技术中能够连续对煤和矸石进行敲击的装置即可,本实施例不再赘述;然后采用精密声级拾音器放置于敲击装置上方20cm处,采集1s时长的煤和矸石产生的声音片段,并对采集的所有声音片段进行前处理,所述前处理包括采用MINI DSP音频处理器,DSP语音降噪算法,LD-2L滤波消噪电流声抗干扰器对所有声音片段的语音降噪、滤波消噪。
这些声音信号在输入BP神经网络前需经分析处理,以获取利于识别的有效特征,这是决定BP网络输入层节点数和网络识别精度的关键。前面采集并存储于计算机的声音是离散的时域信号,可对敲击煤或矸石产生的声音的进行频谱等特征分析,以提取相关的特征参数,从而建立煤和矸石的声音特征差异与灰分之间的对应关系。
进一步,将经前处理的声音片段经A/D采样后存储于计算机,通过计算机对经前处理的声音片段再次进行滤波和降噪处理。
进一步,对处理过的声音片段提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵共5个特征参数即是对声音片段进行后处理,共生矩阵的特征参数包括对比度、相关、逆差距、能量、中值、协方差、反差、差异性、二阶矩、熵、自相关共11个特征参数。
进一步,由于不同煤和矸石的声音信号的功率谱不同,通过主成分分析法对提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵的特征参数进行降维处理,具体方法为:采用db5小波对声音片段进行4层分解,得到16个等分的频率段,然后求出每个频率段的能量,然后将各段声音信号能量归一化后构成特征向量,该特征向量可表示为:
式中,E1,E2,……,E13,E14为每个频率段能量,E为信号总能量。
BP神经网络是采用误差反向传播算法的多层前馈神经网络,它包含输入层、输出层和一个或多个隐层,如图3所示。各层神经元仅与相邻层神经元之间相互全连接,同层神经元之间无连接。输入信号从输入层节点(神经元)依次传过各隐层节点,再传到输出节点,每一层节点的输出只影响下一层节点的输出,然后按照误差减少的原则,从输出层经隐层向输入层逐层修正权值,这种逆向误差传播修正不断进行,直到达到所要求的学习目标。
进一步,构建BP神经网络,包含输入层节点数、输出层节点数和网络层数的确定。通过BP神经网络中大量的节点之间相互联接关系。使每个节点代表声音特定的激励函数。每两个节点间的连接代表一个对于通过该连接信号的加权值,通过对预先采集的声音片段进行深度学习,使预判声音片段中的权重值随激励函数不同而变化。其中输入层节点数和输出层节点数是由实际问题本身决定的。如图2所示,选取降维处理后的声音片段的5个主成分特征参数:频率方差、频率偏度、频率峰度、波长、传播速度的特征参数用于输入BP神经网络的输入层,分别用[1 0 0 0 0]、[0 1 0 0 0]、[0 0 1 0 0]、[0 0 0 1 0]和[0 0 0 01]来表示降维后的每段声音的频率方差、频率偏度、频率峰度、波长、传播速度,输出层神经元的个数为1,设定隐含层神经元的个数为4;设定BP神经网络最大训练次数为80000次,使最小均方差为0.0001;设定输入层的转换函数为tansig、输出层的转换函数为purelin、BP神经网络的训练函数为traingdm,权值和阈值的学习函数为learngdm;在输出层中,煤用“1”表示,矸石 用“0”表示,即在识别时,输出值与数值“1”接近的即认为是煤,输出值与数值“0”接近的即认为是矸石,然后开始对BP神经网络进行训练。
进一步,BP神经网络训练完成后,将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中,从而识别出煤和矸石。
为了进一步验证本实施例的可行性,BP神经网络训练完成后,选取另外的待识别的10个煤试样和10个矸石试样,将每个试样的5个主成分特征参数输入到训练好的BP神经网络中,即得到如表1的输出结果。
表1 BP神经网络测试结果
试样编号 | 对应特征 | 测试结果 | 试样编号 | 对应特征 | 测试结果 |
1 | 频率方差 | [1 0 0 0 0] | 11 | 频率峰度 | [0 0 1 0 0] |
2 | 频率方差 | [1 0 0 0 0] | 12 | 频率峰度 | [0 0 1 0 0] |
3 | 频率方差 | [1 0 0 0 0] | 13 | 波长 | [0 0 0 1 0] |
4 | 频率方差 | [1 0 0 0 0] | 14 | 波长 | [0 0 0 1 0] |
5 | 频率偏度 | [0 1 0 0 0] | 15 | 波长 | [0 0 0 1 0] |
6 | 频率偏度 | [0 1 0 0 0] | 16 | 波长 | [0 0 0 1 0] |
7 | 频率偏度 | [0 1 0 0 0] | 17 | 传播速度 | [0 0 0 0 1] |
8 | 频率偏度 | [0 1 0 0 0] | 18 | 传播速度 | [0 0 0 0 1] |
9 | 频率峰度 | [0 0 1 0 0] | 19 | 传播速度 | [0 0 0 0 1] |
10 | 频率峰度 | [0 0 1 0 0] | 20 | 传播速度 | [0 0 0 0 1] |
从表1中可以看出,将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中,可以快速识别出煤和矸石。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。
Claims (4)
1.一种分选煤和矸石的声音识别方法,其特征在于,包括以下步骤:
步骤一、在分选煤和矸石的分选过程中,用敲击装置来敲击煤和矸石产生不同的声音,采用一个精密声级拾音器提取敲击煤和矸石产生的声音片段,并对采集的所有声音片段进行前处理,所述前处理包括对所有声音片段的语音降噪、滤波消噪;
步骤二、将经前处理的声音片段经A/D采样后存储于计算机,通过计算机对经前处理的声音片段再次进行滤波和降噪处理;
步骤三、对步骤二处理过的声音片段提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵共5个特征参数,共生矩阵的特征参数包括对比度、相关、逆差距、能量、中值、协方差、反差、差异性、二阶矩、熵、自相关共11个特征参数;
步骤四、通过主成分分析法对提取频率方差、频率偏度、频率峰度、波长、传播速度的特征参数和频率共生矩阵的特征参数进行降维处理;
步骤五、选取降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数用于输入BP神经网络的输入层,输出层神经元的个数为1,设定隐含层神经元的个数为4;设定BP神经网络最大训练次数为80000次,使最小均方差为0.0001;设定输入层的转换函数为tansig、输出层的转换函数为purelin、BP神经网络的训练函数为traingdm,权值和阈值的学习函数为learngdm;在输出层中,煤用“1”表示,矸石用“0”表示,即在识别时,输出值与数值“1”接近的即认为是煤,输出值与数值“0”接近的即认为是矸石,然后开始对BP神经网络进行训练;
步骤六、BP神经网络训练完成后,将待识别的煤和矸石的降维处理后的声音片段的频率方差、频率偏度、频率峰度、波长、传播速度的特征参数输入到训练好的BP神经网络中,从而识别出煤和矸石。
2.根据权利要求1所述的分选煤和矸石的声音识别方法,其特征在于:所述步骤一中,所述精密声级拾音器放置于敲击装置上方20cm处,采集1s时长的煤和矸石产生的声音片段。
3.根据权利要求1所述的分选煤和矸石的声音识别方法,其特征在于:所述步骤四中降维处理具体为:采用db5小波对声音片段进行4层分解,得到16个等分的频率段,然后求出每个频率段的能量,然后将各段声音信号能量归一化后构成特征向量,该特征向量可表示为:
式中,E1,E2,……,E13,E14为每个频率段能量,E为信号总能量。
4.根据权利要求1所述的分选煤和矸石的声音识别方法,其特征在于:所述步骤五中,分别用[1 0 0 0 0]、[0 1 0 0 0]、[0 0 1 0 0]、[0 0 0 1 0]和[0 0 0 0 1]来表示降维后的每段声音的频率方差、频率偏度、频率峰度、波长、传播速度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811114326.1A CN109272987A (zh) | 2018-09-25 | 2018-09-25 | 一种分选煤和矸石的声音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811114326.1A CN109272987A (zh) | 2018-09-25 | 2018-09-25 | 一种分选煤和矸石的声音识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109272987A true CN109272987A (zh) | 2019-01-25 |
Family
ID=65197973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811114326.1A Pending CN109272987A (zh) | 2018-09-25 | 2018-09-25 | 一种分选煤和矸石的声音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109272987A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111613245A (zh) * | 2020-05-25 | 2020-09-01 | 长沙理工大学 | 基于声音信号处理的矿石品性分析方法及设备 |
CN115301552A (zh) * | 2022-09-29 | 2022-11-08 | 河南亿卓机械设备有限公司 | 一种智能分级选矸机智能控制方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
CN102521572A (zh) * | 2011-12-09 | 2012-06-27 | 中国矿业大学 | 一种煤和矸石的图像识别方法 |
CN104347066A (zh) * | 2013-08-09 | 2015-02-11 | 盛乐信息技术(上海)有限公司 | 基于深层神经网络的婴儿啼哭声识别方法及系统 |
CN104637484A (zh) * | 2015-02-03 | 2015-05-20 | 宁波大学 | 一种基于共生矩阵分析的mp3音频隐写检测方法 |
US20170330071A1 (en) * | 2016-05-10 | 2017-11-16 | Google Inc. | Audio processing with neural networks |
-
2018
- 2018-09-25 CN CN201811114326.1A patent/CN109272987A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070083365A1 (en) * | 2005-10-06 | 2007-04-12 | Dts, Inc. | Neural network classifier for separating audio sources from a monophonic audio signal |
CN102521572A (zh) * | 2011-12-09 | 2012-06-27 | 中国矿业大学 | 一种煤和矸石的图像识别方法 |
CN104347066A (zh) * | 2013-08-09 | 2015-02-11 | 盛乐信息技术(上海)有限公司 | 基于深层神经网络的婴儿啼哭声识别方法及系统 |
CN104637484A (zh) * | 2015-02-03 | 2015-05-20 | 宁波大学 | 一种基于共生矩阵分析的mp3音频隐写检测方法 |
US20170330071A1 (en) * | 2016-05-10 | 2017-11-16 | Google Inc. | Audio processing with neural networks |
Non-Patent Citations (1)
Title |
---|
林巍: "低信噪比环境声音识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111613245A (zh) * | 2020-05-25 | 2020-09-01 | 长沙理工大学 | 基于声音信号处理的矿石品性分析方法及设备 |
CN111613245B (zh) * | 2020-05-25 | 2023-08-18 | 长沙理工大学 | 基于声音信号处理的矿石品性分析方法及设备 |
CN115301552A (zh) * | 2022-09-29 | 2022-11-08 | 河南亿卓机械设备有限公司 | 一种智能分级选矸机智能控制方法及系统 |
CN115301552B (zh) * | 2022-09-29 | 2022-12-20 | 河南亿卓机械设备有限公司 | 一种智能分级选矸机智能控制方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105611477B (zh) | 数字助听器中深度和广度神经网络相结合的语音增强算法 | |
CN113707176B (zh) | 一种基于声信号及深度学习技术的变压器故障检测方法 | |
Zhao et al. | Robust speaker identification in noisy and reverberant conditions | |
CN108847238B (zh) | 一种服务机器人语音识别方法 | |
CN109767785A (zh) | 基于卷积神经网络的环境噪声识别分类方法 | |
CN110718232B (zh) | 一种基于二维语谱图和条件生成对抗网络的语音增强方法 | |
CN112017682B (zh) | 一种单通道语音同时降噪和去混响系统 | |
CN109890043A (zh) | 一种基于生成式对抗网络的无线信号降噪方法 | |
CN108630209B (zh) | 一种基于特征融合与深度置信网络的海洋生物识别方法 | |
CN108922513A (zh) | 语音区分方法、装置、计算机设备及存储介质 | |
CN111238814A (zh) | 一种基于短时希尔伯特变换的滚动轴承故障诊断方法 | |
CN101366078A (zh) | 从单音音频信号分离音频信源的神经网络分类器 | |
CN113488060B (zh) | 一种基于变分信息瓶颈的声纹识别方法及系统 | |
CN110491406B (zh) | 一种多模块抑制不同种类噪声的双噪声语音增强方法 | |
CN111081223B (zh) | 一种语音识别方法、装置、设备和存储介质 | |
CN103021405A (zh) | 基于music和调制谱滤波的语音信号动态特征提取方法 | |
CN109272987A (zh) | 一种分选煤和矸石的声音识别方法 | |
CN111968666A (zh) | 基于深度域自适应网络的助听器语音增强方法 | |
CN113191178A (zh) | 一种基于听觉感知特征深度学习的水声目标识别方法 | |
CN113707158A (zh) | 一种基于VGGish迁移学习网络的电网危害鸟种鸣声识别方法 | |
CN115062678A (zh) | 设备故障检测模型的训练方法、故障检测方法及装置 | |
CN112133326A (zh) | 一种基于对抗神经网络的枪声数据增广与检测方法 | |
CN111462770A (zh) | 一种基于lstm的后期混响抑制方法及系统 | |
CN115293214A (zh) | 一种基于样本扩充网络的水声目标识别模型优化方法 | |
CN115472168A (zh) | 耦合bgcc和pwpe特征的短时语音声纹识别方法、系统及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190125 |
|
WD01 | Invention patent application deemed withdrawn after publication |