CN104952458A - 一种噪声抑制方法、装置及系统 - Google Patents
一种噪声抑制方法、装置及系统 Download PDFInfo
- Publication number
- CN104952458A CN104952458A CN201510312269.8A CN201510312269A CN104952458A CN 104952458 A CN104952458 A CN 104952458A CN 201510312269 A CN201510312269 A CN 201510312269A CN 104952458 A CN104952458 A CN 104952458A
- Authority
- CN
- China
- Prior art keywords
- noise
- signal
- internal
- voice
- external
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001629 suppression Effects 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000007246 mechanism Effects 0.000 claims abstract description 53
- 238000013507 mapping Methods 0.000 claims abstract description 49
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000012549 training Methods 0.000 claims description 77
- 238000013528 artificial neural network Methods 0.000 claims description 41
- 238000001228 spectrum Methods 0.000 claims description 33
- 239000013598 vector Substances 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000008054 signal transmission Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 9
- 239000002184 metal Substances 0.000 description 7
- 210000002569 neuron Anatomy 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3038—Neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
Abstract
本发明实施例公开了一种噪声抑制方法、装置及系统,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题。本发明实施例的噪声抑制方法包括:S1:当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;S2:提取内部噪声对应的内部信号特征;S3:根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征;S4:通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值;S5:将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
Description
技术领域
本发明涉及语音信号处理技术领域,尤其涉及一种噪声抑制方法、装置及系统。
背景技术
在具有语音交互功能的设备中往往有许多机械部件,这些机械部件在工作时产生大量的快速变化的非平稳的机器噪声、冲击噪声。这些噪声通过设备上的拾音器进入到系统中会严重影响语音交互的效果。传统的基于噪声功率谱估计的噪声抑制方法对这种快速变化的非平稳的机器噪声、冲击噪声的滤除效果非常差。已有发明中,对于环境噪声的滤除常采用双麦克风降噪装置。装置中有主麦克风用于接收环境噪声和语音,另外还有参考麦克风用于接收环境噪声,然后两路声音信号通过公知有源噪声对消方法(Active NoiseCancellation,以下简称为ANC)抑制噪声。但是ANC方法要求噪声基本通过相同的声场环境到达主麦克风和噪声参考麦克风,这样主麦克风和参考麦克风接收到的噪声信号呈现高度线性相关关系,ANC方法能够正常工作,而当这一条件不满足时双麦克风噪声抑制方法往往不能正常工作。但是,设备往往具有一个相对封闭的外壳,噪声参考麦克风需要装在壳内接收机器噪声,主麦克风需要接收语音,一般安装在外部或者外壳面板开孔处,这样参考麦克风和主麦克风的声场环境将差异较大,这时直接采用ANC方法将性能很差甚至不能工作。
因此,为了解决上述的由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题,成为了本领域技术人员亟待解决的技术问题。
发明内容
本发明实施例提供了一种噪声抑制方法、装置及系统,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题。
本发明实施例提供的一种噪声抑制方法,包括:
S1:当语音信号输入时,所述噪声抑制装置接收到所述参考语音采集机构采集的内部噪声和所述主语音采集机构采集的包含有外部噪声的语音信号;
S2:提取所述内部噪声对应的内部信号特征,所述内部信号特征为功率谱帧序列;
S3:根据所述内部信号特征,并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征,所述外部近似特征为功率谱形式的帧序列;
S4:通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值;
S5:将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
优选地,
步骤S1之前还包括:
对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定所述映射公式。
优选地,
所述预置自编码神经网络结构的训练步骤具体包括:
S6:对所述噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息,所述样本帧的特征为功率谱形式;
S7:将所述样本帧的特征作为所述预置自编码神经网络结构的样本输入x(n)和期望输出o(n),确定训练样本集
S8:对所述训练样本集中的训练样本一一进行训练,确定所述训练样本集对应的权重向量和偏置参数;
S9:将确定后的所述权重向量和所述偏置参数与所述自编码神经网络的结构求和,计算得到所述训练样本集的所述映射公式。
优选地,
步骤S5具体包括:
将所述噪声信号估计与采集的包含有所述内部噪声的语音信号进行ANC噪声对消方式处理,获取噪声抑制后的所述去噪语音信号。
优选地,
所述预置自编码神经网络结构为5层结构,第一层和第五层为输入输出层,第二层、第三层和第四层为隐含层。
本发明实施例中提供的一种噪声抑制装置,包括:
接收单元,用于当语音信号输入时,接收所述参考语音采集机构采集的内部噪声和所述主语音采集机构采集的包含有外部噪声的语音信号;
提取单元,用于提取所述内部噪声对应的内部信号特征,所述内部信号特征为功率谱帧序列;
获取单元,用于根据所述内部信号特征,并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征,所述外部近似特征为功率谱形式的帧序列;
转换单元,用于通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值;
去噪单元,用于将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
优选地,
所述的噪声抑制装置还包括:
训练单元,用于对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定所述映射公式。
优选地,
所述训练单元具体包括:
变换子单元,用于对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息,所述样本特征帧的为功率谱形式;
第一确定子单元,用于将所述样本帧的特征作为所述预置自编码神经网络结构的样本输入x(n)和期望输出o(n),确定训练样本集
第二确定子单元,用于对所述训练样本集中的训练样本一一进行训练,确定所述训练样本集对应的权重向量和偏置参数;
计算子单元,用于将确定后的所述权重向量和所述偏置参数与所述自编码神经网络的结构求和,计算得到所述训练样本集的所述映射公式。
本发明实施例中提供的一种噪声抑制系统,包括:
参考语音采集机构、主语音采集机构,以及本发明实施例中提及的任意一种所述的噪声抑制装置;
所述参考语音采集机构、所述主语音采集机构分别与所述噪声抑制装置建立有信号传输连接关系;
其中,所述参考语音采集机构,用于采集内部噪声信号;
所述噪声抑制装置,用于当语音信号输入时,接收所述内部噪声和包含有外部噪声的语音信号,然后提取所述内部噪声对应的内部信号特征,接着根据所述内部信号特征,并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征,再接着通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值,最后将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号;
所述主语音采集机构,用于采集包含有所述内部噪声的所述语音信号。
其中,所述内部信号特征为功率谱帧序列,所述外部近似特征为功率谱形式的帧序列。
优选地,
所述主语音采集机构,还用于采集未输入所述语音信号时的所述外部噪声,使得所述噪声抑制装置对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定所述映射公式。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中提供的一种噪声抑制方法、装置及系统,其中,噪声抑制方法包括:S1:当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;S2:提取内部噪声对应的内部信号特征,内部信号特征为功率谱帧序列;S3:根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征,外部近似特征为功率谱形式的帧序列;S4:通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值;S5:将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。本实施例中,通过提取内部噪声对应的内部信号特征,结合预置的映射公式以获取与外部噪声相对应的外部近似特征,最后将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理,便实现了外部声场环境差异大的不受限的功能,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1本发明实施例中提供的一种噪声抑制方法的一个实施例的流程示意图;
图2本发明实施例中提供的一种噪声抑制方法的另一个实施例的流程示意图;
图3本发明实施例中提供的一种噪声抑制装置的一个实施例的结构示意图;
图4本发明实施例中提供的一种噪声抑制装置的另一个实施例的结构示意图;
图5本发明实施例中提供的一种噪声抑制系统的一个实施例的结构示意图;
图6本发明实施例中提供的一种噪声抑制系统的自编码神经网络连接示意图。
具体实施方式
本发明实施例提供了一种噪声抑制方法、装置及系统,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中提供的一种噪声抑制方法的一个实施例包括:
S1:当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;
当需要对语音信号进行去噪处理时,当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号。
S2:提取内部噪声对应的内部信号特征;
当噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号之后,提取内部噪声对应的内部信号特征,内部信号特征为功率谱帧序列。
S3:根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征;
当提取内部噪声对应的内部信号特征之后,根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征,外部近似特征为功率谱形式的帧序列。
S4:通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值;
当根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征之后,通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值。
S5:将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
当通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值之后,将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
本实施例中,通过提取内部噪声对应的内部信号特征,结合预置的映射公式以获取与外部噪声相对应的外部近似特征,最后将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理,便实现了外部声场环境差异大的不受限的功能,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题。
上面是对噪声抑制方法的过程进行详细的描述,下面将对自编码神经网络的训练过程进行详细的描述,请参阅图2,本发明实施例中提供的一种噪声抑制方法的另一个实施例包括:
201、当语音信号未输入时,对获取到的噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息;
当需要对语音信号进行去噪处理之前,需要当未输入语音信号时,对内部噪声和外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定映射公式,前述的预置自编码神经网络结构可以是当语音信号未输入时,对获取到的噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息。
例如未接收语音信号前,通过参考语音采集机构(如参考麦克风)和主语音采集机构(如主麦克风)同时采集大于100小时的设备内部机器噪声和设备泄露到外部的机器噪声,组成噪声信号样本,前述的设备可以是安装有噪声抑制装置的设备,例如远程智能柜员机,对采集到的噪声信号样本使用8kHz采样,然后使用32ms的Hamming窗(汉明窗)对噪声信号样本加窗处理,处理后得到帧序列,每帧256个采样点,然后对每一帧噪声信号样本做傅立叶变换,对变换后的傅立叶系数取平方后的到噪声信号样本的功率谱S(ω)和角度angle(ω),功率谱S(ω)作为内部特征,角度angle(ω)在从内部特征还原成信号时使用。
202、将样本帧的特征作为自编码神经网络的样本输入x(n)和期望输出o(n),确定训练样本集
当对获取到的噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息之后,需要将样本帧的特征作为自编码神经网络的样本输入x(n)和期望输出o(n),确定训练样本集例如,最后将每段参考麦克风和主麦克风接收的噪声信号内部特征中的相继5帧对数功率谱S(ω)作为声音信号的内部特征并作为自编码神经网络的输入和期望输出,将预先采集所有的主麦克风信号和参考麦克风5帧信号特征组成训练样本集用于执行步骤203。
203、对训练样本集中的训练样本一一进行训练,获取训练样本集对应的权重向量和偏置参数;
当将样本帧的特征作为自编码神经网络的样本输入x(n)和期望输出o(n),确定训练样本集之后,需要对训练样本集中的训练样本一一进行训练,获取训练样本集对应的权重向量和偏置参数。
例如预置自编码神经网络结构采用5层结构,其中第1、5层为输入输出层,每层有1280个节点,5帧信号特征的维数。第2、3、4层为隐含层,每层有1024个节点。隐含层数越多,节点数越多网络的表达映射越精确,但是同时运算量越大且所需样本越多,需要说明的是,前述的隐含层数和每层节点数是权衡两者后才能确定的。网络为全连接网络。将x(n)作为网络输入,o(n)作为网络期望输出,必须说明的是,前述的神经网络结构可以是如图6所示。
设第n个训练样本的输入为向量x(n),期望输出为向量o(n),输入层的神经元输出向量为
训练的最终结果是根据输入和期望输出样本集计算得到自编码神经网络的权重和偏置参数wl,l=2,3,4,5,bl,l=2,3,4,5。
网络训练过程如下:
A)根据自编码神经网络结构随机选取初始权重值wl,l=2,3,4,5,设置偏置值bl,l=2,3,4,5为0。取训练样本集中第一个样本,设置n=1。
B)根据公式y1(n)=x(n),将输入向量x(n)映射为网络输入层神经元输出向量y1(n)。
C)根据映射关系计算公式,将输入层神经元输出向量映射为第一层隐含层神经元输出向量,第一层隐含层神经元输出向量映射为第二层隐含层神经元输出向量映射,第二隐含层映射为第三隐含层,及第三隐含层映射为输出层。
映射关系计算公式如下:
yl(n)=σ(ul(n))
ul(n)=wlyl-1(n)+bl,l=2,3,4,5;
其中,e为自然对数的底数,wl为第l层的权重向量,bl为偏置系数。l=2时为输入层映射为一层隐含层神经元输出向量,l=3,4时为第一隐含层映射到第二隐含层及第二隐含层映射为第三隐含层,l=5时是将第三隐含层映射为输出层向量。
D)根据输出层向量和期望输出向量o(n),以公式计算误差函数(即衡量网络输出的准确性函数)。
E)根据导数计算公式,计算误差函数相对每一层权重和偏置的导数。
导数计算公式如下:
其中对于隐含层δl=(wl+1)T·δl+1·σ'(ul),l=2,3,4,对于输出层,l=5,δ5=σ'(u5)·(y5(n)-o(n));
F)根据误差函数相对每一层权重和偏置的导数计算新的权重和偏置,计算公式如下:
其中,l=5,4,3,2,为权重和偏置变化量。η为学习率,η太大容易导致新权重和偏置震荡,太小容易导致学习过慢,本发明是权衡两者后确定η=0.05。
G)将新的权重向量和偏置参数设置为自编码神经网的权重和偏置参数值,公式如下:
l=2,3,4,5;
l=2,3,4,5;
H)如果所有权重向量和偏置参数改变量(Δwl,l=2,3,4,5,Δbl,l=2,3,4,5,计算公式参见F)小于给定阈值Th则训练结束,否则取下一个样本,设置n=n+1,跳转到步骤202,继续下一个样本训练。阈值Th太大容易导致训练不充分,太小导致训练时间过长,本发明是权衡两者后确定Th=0.001。
204、将确定后的权重向量和偏置参数与自编码神经网络的结构求和,计算得到训练样本集的映射公式;
当对训练样本集中的训练样本一一进行训练,获取训练样本集对应的权重向量和偏置参数之后,需要将确定后的权重向量和偏置参数与自编码神经网络的结构求和,计算得到训练样本集的映射公式。
最后的到的权重和偏置数据加上神经网络结构即为内部噪声信号特征和外部噪声的信号特征的映射关系,映射公式为o=σ(w5σ(w4σ(w3σ(w2x+b2)+b3)+b4)+b5)。
205、当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;
当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号。
需要说明的是,前述的设备工作时,参考麦克风采集内部机械噪声,主麦克风采集含有机械噪声的语音信号,根据步骤202,首先对参考麦克风采集的噪声信号提取特征,得到功率谱帧序列,角度序列信息。
206、提取内部噪声对应的内部信号特征;
当噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号之后,提取内部噪声对应的内部信号特征,内部信号特征为功率谱帧序列。
例如将相继5帧信号内部特征输入到训练好的自编码神经网络,根据步骤203最后的映射公式,网络输出为主麦克风接收的噪声信号外部近似特征。
207、根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征;
当提取内部噪声对应的内部信号特征之后,根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征,外部近似特征为功率谱形式的帧序列。
例如对自编码神经网络输出的噪声信号估计加上对应帧的角度做逆傅立叶变换得到噪声信号估计
208、通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值;
当根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征之后,通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值。
209、将噪声信号估计与采集的包含有内部噪声的语音信号进行ANC噪声对消方式处理,获取噪声抑制后的去噪语音信号。
当通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值之后,需要将噪声信号估计与采集的包含有内部噪声的语音信号进行ANC噪声对消方式处理,获取噪声抑制后的去噪语音信号。
前述的ANC噪声对消方式处理如下:
设在时刻n主麦克风接收的前m个时间点的噪声信号估计组成的向量为主麦克风采集含有机械噪声的时刻n语音信号为d(n),W=(w(1),w(2),...,w(m))T为滤波器的权重系数。T为向量的转置。m太大导致计算量过大,太小容易导致噪声抑制效果变差,本发明取m=32。
a)在初始时刻n=1时随机选取滤波器的权重系数初始权重值W。
b)根据公式计算得到n时刻的噪声抑制后的语音信号
c、)根据公式Wnew=W+2μ(d(n)-WTX)X,计算新的滤波器的权重系数Wnew。参数μ是权重系数的学习率,过大或者过小都容易导致噪声抑制效果变差,本发明取μ=0.05。
d)将新的权重Wnew设置为滤波器的权重系数,即:W=Wnew。
e)取下一个时刻的噪声信号估计和含有机械噪声的语音信号,设n=n+1转到b)。
ANC方法每个时刻计算得到作为ANC输出的该时刻噪声抑制后的语音信号。
本实施例中,通过提取内部噪声对应的内部信号特征,结合预置的映射公式以获取与外部噪声相对应的外部近似特征,最后将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理,便实现了外部声场环境差异大的不受限的功能,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题,以及神经网络和ANC方法的结合,大大地提高了语音信号的去噪效果。
请参阅图3,本发明实施例中提供的一种噪声抑制装置的一个实施例包括:
接收单元301,用于当语音信号输入时,接收参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;
提取单元302,用于提取内部噪声对应的内部信号特征,内部信号特征为功率谱帧序列;
获取单元303,用于根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征,外部近似特征为功率谱形式的帧序列;
转换单元304,用于通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值;
去噪单元305,用于将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
本实施例中,通过提取单元302提取内部噪声对应的内部信号特征,获取单元303结合预置的映射公式以获取与外部噪声相对应的外部近似特征,最后去噪单元305将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理,便实现了外部声场环境差异大的不受限的功能,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题。
上面是对噪声抑制装置的各单元进行详细的描述,下面将对附加单元进行详细的描述,请参阅图4,本发明实施例中提供的一种噪声抑制装置的另一个实施例包括:
训练单元401,用于当未输入语音信号时,对内部噪声和外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定映射公式。
训练单元401具体包括:
变换子单元4011,用于当未输入语音信号时,对内部噪声和外部噪声组成的噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息,样本帧的特征为功率谱形式;
第一确定子单元4012,用于将样本帧的特征作为预置自编码神经网络结构的样本输入x(n)和期望输出o(n),确定训练样本集
第二确定子单元4013,用于对训练样本集中的训练样本一一进行训练,确定训练样本集对应的权重向量和偏置参数;
计算子单元4014,用于将确定后的权重向量和偏置参数与自编码神经网络的结构求和,计算得到训练样本集的映射公式。
接收单元402,用于当语音信号输入时,接收参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;
提取单元403,用于提取内部噪声对应的内部信号特征,内部信号特征为功率谱帧序列;
获取单元404,用于根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征,外部近似特征为功率谱形式的帧序列;
转换单元405,用于通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值;
去噪单元406,用于将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
本实施例中,通过提取单元403提取内部噪声对应的内部信号特征,获取单元404结合预置的映射公式以获取与外部噪声相对应的外部近似特征,最后去噪单元406将外部近似特征转换为噪声信号估计值与语音信号进行去噪处理,便实现了外部声场环境差异大的不受限的功能,解决了目前由于参考麦克风和主麦克风的声场环境较大的差异,而导致的采用ANC方法将性能差的技术问题,以及神经网络和ANC方法的结合,大大地提高了语音信号的去噪效果。
请参阅图5,本发明实施例中提供的一种噪声抑制系统的一个实施例包括:
参考语音采集机构51、主语音采集机构52,以及图3和图4所示的实施例中提及的噪声抑制装置53;
参考语音采集机构51、主语音采集机构52分别与噪声抑制装置53建立有信号传输连接关系;
其中,参考语音采集机构51,用于采集内部噪声信号,例如远程智能柜员机的内部噪声信号;
噪声抑制装置53,用于当语音信号输入时,接收内部噪声和包含有外部噪声的语音信号,然后提取内部噪声对应的内部信号特征,接着根据内部信号特征,并结合预置的映射公式获取与外部噪声相对应的外部近似特征,再接着通过傅里叶逆变换将外部近似特征转换为对应的噪声信号估计值,最后将噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号;
主语音采集机构52,用于采集包含有内部噪声的语音信号,主语音采集机构52,还用于采集未输入语音信号时的外部噪声,使得噪声抑制装置53对未输入语音信号时,对内部噪声和外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定映射公式。
其中,内部信号特征为功率谱帧序列,外部近似特征为功率谱形式的帧序列。
进一步地,参考语音采集机构51和主语音采集机构52可以是麦克风,此处具体不做限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种噪声抑制方法,其特征在于,包括:
S1:当语音信号输入时,噪声抑制装置接收到参考语音采集机构采集的内部噪声和主语音采集机构采集的包含有外部噪声的语音信号;
S2:提取所述内部噪声对应的内部信号特征,所述内部信号特征为功率谱帧序列;
S3:根据所述内部信号特征,并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征,所述外部近似特征为功率谱形式的帧序列;
S4:通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值;
S5:将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
2.根据权利要求1所述的噪声抑制方法,其特征在于,步骤S1之前还包括:
对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定所述映射公式。
3.根据权利要求2所述的噪声抑制方法,其特征在于,所述预置自编码神经网络结构的训练步骤具体包括:
S6:对所述噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息,所述样本帧的特征为功率谱形式;
S7:将所述样本帧的特征作为所述预置自编码神经网络结构的样本输入x(n)和期望输出o(n),确定训练样本集
S8:对所述训练样本集中的训练样本一一进行训练,确定所述训练样本集对应的权重向量和偏置参数;
S9:将确定后的所述权重向量和所述偏置参数与所述自编码神经网络的结构求和,计算得到所述训练样本集的所述映射公式。
4.根据权利要求1至3中任意一项所述的噪声抑制方法,其特征在于,步骤S5具体包括:
将所述噪声信号估计与采集的包含有所述内部噪声的语音信号进行ANC噪声对消方式处理,获取噪声抑制后的所述去噪语音信号。
5.根据权利要求2或3所述的噪声抑制方法,其特征在于,所述预置自编码神经网络结构为5层结构,第一层和第五层为输入输出层,第二层、第三层和第四层为隐含层。
6.一种噪声抑制装置,其特征在于,包括:
接收单元,用于当语音信号输入时,接收所述参考语音采集机构采集的内部噪声和所述主语音采集机构采集的包含有外部噪声的语音信号;
提取单元,用于提取所述内部噪声对应的内部信号特征,所述内部信号特征为功率谱帧序列;
获取单元,用于根据所述内部信号特征,并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征,所述外部近似特征为功率谱形式的帧序列;
转换单元,用于通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值;
去噪单元,用于将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号。
7.根据权利要求6所述的噪声抑制装置,其特征在于,所述的噪声抑制装置还包括:
训练单元,用于对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定所述映射公式。
8.根据权利要求6或7所述的噪声抑制装置,其特征在于,所述训练单元具体包括:
变换子单元,用于对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行每一个预置帧的傅里叶变换,获取对应的样本帧的特征和样本角度信息,所述样本帧的特征为功率谱形式;
第一确定子单元,用于将所述样本帧的特征作为所述预置自编码神经网络结构的样本输入x(n)和期望输出o(n),确定训练样本集
第二确定子单元,用于对所述训练样本集中的训练样本一一进行训练,确定所述训练样本集对应的权重向量和偏置参数;
计算子单元,用于将确定后的所述权重向量和所述偏置参数与所述自编码神经网络的结构求和,计算得到所述训练样本集的所述映射公式。
9.一种噪声抑制系统,其特征在于,包括:
参考语音采集机构、主语音采集机构,以及如权利要求6至8中任意一项所述的噪声抑制装置;
所述参考语音采集机构、所述主语音采集机构分别与所述噪声抑制装置建立有信号传输连接关系;
其中,所述参考语音采集机构,用于采集内部噪声信号;
所述噪声抑制装置,用于当语音信号输入时,接收所述内部噪声和包含有外部噪声的语音信号,然后提取所述内部噪声对应的内部信号特征,接着根据所述内部信号特征,并结合预置的映射公式获取与所述外部噪声相对应的外部近似特征,再接着通过傅里叶逆变换将所述外部近似特征转换为对应的噪声信号估计值,最后将所述噪声信号估计与采集的包含有内部噪声的语音信号进行预置噪声对消方式处理,获取噪声抑制后的去噪语音信号;
所述主语音采集机构,用于采集包含有所述内部噪声的所述语音信号。
其中,所述内部信号特征为功率谱帧序列,所述外部近似特征为功率谱形式的帧序列。
10.根据权利要求9所述的噪声抑制系统,其特征在于,
所述主语音采集机构,还用于采集未输入所述语音信号时的所述外部噪声,使得所述噪声抑制装置对未输入所述语音信号时,对所述内部噪声和所述外部噪声组成的噪声信号样本进行预置自编码神经网络结构的训练,以确定所述映射公式。
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510312269.8A CN104952458B (zh) | 2015-06-09 | 2015-06-09 | 一种噪声抑制方法、装置及系统 |
TR2019/03255T TR201903255T4 (tr) | 2015-06-09 | 2016-05-24 | Gürültü bastırmak için yöntem, cihaz ve sistem. |
RU2017144022A RU2685391C1 (ru) | 2015-06-09 | 2016-05-24 | Способ, устройство и система для подавления шума |
US15/574,193 US20180137877A1 (en) | 2015-06-09 | 2016-05-24 | Method, device and system for noise suppression |
PCT/CN2016/083084 WO2016197811A1 (zh) | 2015-06-09 | 2016-05-24 | 一种噪声抑制方法、装置及系统 |
EP16806709.8A EP3309782B1 (en) | 2015-06-09 | 2016-05-24 | Method, device and system for noise suppression |
ZA2017/08508A ZA201708508B (en) | 2015-06-09 | 2017-12-14 | Method, device and system for noise suppression |
HK18111355.6A HK1252025B (zh) | 2015-06-09 | 2018-09-05 | 一種噪聲抑制方法、裝置及系統 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510312269.8A CN104952458B (zh) | 2015-06-09 | 2015-06-09 | 一种噪声抑制方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104952458A true CN104952458A (zh) | 2015-09-30 |
CN104952458B CN104952458B (zh) | 2019-05-14 |
Family
ID=54167069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510312269.8A Active CN104952458B (zh) | 2015-06-09 | 2015-06-09 | 一种噪声抑制方法、装置及系统 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20180137877A1 (zh) |
EP (1) | EP3309782B1 (zh) |
CN (1) | CN104952458B (zh) |
HK (1) | HK1252025B (zh) |
RU (1) | RU2685391C1 (zh) |
TR (1) | TR201903255T4 (zh) |
WO (1) | WO2016197811A1 (zh) |
ZA (1) | ZA201708508B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016197811A1 (zh) * | 2015-06-09 | 2016-12-15 | 广州广电运通金融电子股份有限公司 | 一种噪声抑制方法、装置及系统 |
CN107277654A (zh) * | 2017-07-05 | 2017-10-20 | 深圳市捷高电子科技有限公司 | 一种麦克风背景噪音消除的方法 |
CN107967920A (zh) * | 2017-11-23 | 2018-04-27 | 哈尔滨理工大学 | 一种改进的自编码神经网络语音增强算法 |
CN108391190A (zh) * | 2018-01-30 | 2018-08-10 | 努比亚技术有限公司 | 一种降噪方法、耳机及计算机可读存储介质 |
CN109728860A (zh) * | 2018-12-25 | 2019-05-07 | 江苏益邦电力科技有限公司 | 一种基于采集终端检测装置的通讯干扰抑制方法 |
CN110164425A (zh) * | 2019-05-29 | 2019-08-23 | 北京声智科技有限公司 | 一种降噪方法、装置及可实现降噪的设备 |
CN110580910A (zh) * | 2018-06-08 | 2019-12-17 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN110599997A (zh) * | 2019-09-25 | 2019-12-20 | 西南交通大学 | 一种鲁棒性强的冲击噪声有源控制方法 |
CN110889197A (zh) * | 2019-10-31 | 2020-03-17 | 佳禾智能科技股份有限公司 | 基于神经网络的自适应前馈式主动降噪方法、计算机可读存储介质、电子设备 |
CN112017678A (zh) * | 2019-05-29 | 2020-12-01 | 北京声智科技有限公司 | 一种可实现降噪的设备及其降噪方法和装置 |
WO2021062706A1 (zh) * | 2019-09-30 | 2021-04-08 | 大象声科(深圳)科技有限公司 | 近距离交谈场景下双麦克风移动电话的实时语音降噪方法 |
CN114265373A (zh) * | 2021-11-22 | 2022-04-01 | 煤炭科学研究总院 | 综采面一体式操控台控制系统 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10614827B1 (en) * | 2017-02-21 | 2020-04-07 | Oben, Inc. | System and method for speech enhancement using dynamic noise profile estimation |
US11037330B2 (en) * | 2017-04-08 | 2021-06-15 | Intel Corporation | Low rank matrix compression |
US10599975B2 (en) * | 2017-12-15 | 2020-03-24 | Uber Technologies, Inc. | Scalable parameter encoding of artificial neural networks obtained via an evolutionary process |
CN110348566B (zh) * | 2019-07-15 | 2023-01-06 | 上海点积实业有限公司 | 一种生成神经网络训练用数字信号的方法和系统 |
CN110610715B (zh) * | 2019-07-29 | 2022-02-22 | 西安工程大学 | 一种基于cnn-dnn混合神经网络的降噪方法 |
CN110689905B (zh) * | 2019-09-06 | 2021-12-21 | 西安合谱声学科技有限公司 | 一种用于视频会议系统的语音活动检测系统 |
EP3809410A1 (en) * | 2019-10-17 | 2021-04-21 | Tata Consultancy Services Limited | System and method for reducing noise components in a live audio stream |
CN113393857B (zh) * | 2021-06-10 | 2024-06-14 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音乐信号的人声消除方法、设备及介质 |
CN115659150B (zh) * | 2022-12-23 | 2023-03-14 | 中国船级社 | 一种信号处理方法、装置及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132076A1 (en) * | 2011-11-23 | 2013-05-23 | Creative Technology Ltd | Smart rejecter for keyboard click noise |
CN103187067A (zh) * | 2011-12-27 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 汽车内外音效增强系统 |
CN103700373A (zh) * | 2013-12-21 | 2014-04-02 | 刘兴超 | 一种穿戴式设备的声音降噪系统及其降噪处理方法 |
CN103959814A (zh) * | 2011-12-08 | 2014-07-30 | 索尼公司 | 耳孔可佩戴式声音收集设备,信号处理设备和声音收集方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
CN101763858A (zh) * | 2009-10-19 | 2010-06-30 | 瑞声声学科技(深圳)有限公司 | 双麦克风信号处理方法 |
KR20110073882A (ko) * | 2009-12-24 | 2011-06-30 | 삼성전자주식회사 | 듀얼 스탠바이 이동통신 단말기에서 음성 신호 처리 장치 및 방법 |
CN102376309B (zh) * | 2010-08-17 | 2013-12-04 | 骅讯电子企业股份有限公司 | 降低环境噪音的系统、方法与应用的装置 |
EP2458586A1 (en) * | 2010-11-24 | 2012-05-30 | Koninklijke Philips Electronics N.V. | System and method for producing an audio signal |
EP2774147B1 (en) * | 2011-10-24 | 2015-07-22 | Koninklijke Philips N.V. | Audio signal noise attenuation |
CN104754430A (zh) * | 2013-12-30 | 2015-07-01 | 重庆重邮信科通信技术有限公司 | 终端麦克风降噪装置和方法 |
CN104952458B (zh) * | 2015-06-09 | 2019-05-14 | 广州广电运通金融电子股份有限公司 | 一种噪声抑制方法、装置及系统 |
-
2015
- 2015-06-09 CN CN201510312269.8A patent/CN104952458B/zh active Active
-
2016
- 2016-05-24 RU RU2017144022A patent/RU2685391C1/ru active
- 2016-05-24 EP EP16806709.8A patent/EP3309782B1/en not_active Not-in-force
- 2016-05-24 WO PCT/CN2016/083084 patent/WO2016197811A1/zh active Application Filing
- 2016-05-24 TR TR2019/03255T patent/TR201903255T4/tr unknown
- 2016-05-24 US US15/574,193 patent/US20180137877A1/en not_active Abandoned
-
2017
- 2017-12-14 ZA ZA2017/08508A patent/ZA201708508B/en unknown
-
2018
- 2018-09-05 HK HK18111355.6A patent/HK1252025B/zh unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132076A1 (en) * | 2011-11-23 | 2013-05-23 | Creative Technology Ltd | Smart rejecter for keyboard click noise |
CN103959814A (zh) * | 2011-12-08 | 2014-07-30 | 索尼公司 | 耳孔可佩戴式声音收集设备,信号处理设备和声音收集方法 |
CN103187067A (zh) * | 2011-12-27 | 2013-07-03 | 上海博泰悦臻电子设备制造有限公司 | 汽车内外音效增强系统 |
CN103700373A (zh) * | 2013-12-21 | 2014-04-02 | 刘兴超 | 一种穿戴式设备的声音降噪系统及其降噪处理方法 |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016197811A1 (zh) * | 2015-06-09 | 2016-12-15 | 广州广电运通金融电子股份有限公司 | 一种噪声抑制方法、装置及系统 |
CN107277654A (zh) * | 2017-07-05 | 2017-10-20 | 深圳市捷高电子科技有限公司 | 一种麦克风背景噪音消除的方法 |
CN107967920A (zh) * | 2017-11-23 | 2018-04-27 | 哈尔滨理工大学 | 一种改进的自编码神经网络语音增强算法 |
CN108391190A (zh) * | 2018-01-30 | 2018-08-10 | 努比亚技术有限公司 | 一种降噪方法、耳机及计算机可读存储介质 |
CN108391190B (zh) * | 2018-01-30 | 2019-09-20 | 努比亚技术有限公司 | 一种降噪方法、耳机及计算机可读存储介质 |
CN110580910A (zh) * | 2018-06-08 | 2019-12-17 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN110580910B (zh) * | 2018-06-08 | 2024-04-26 | 北京搜狗科技发展有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
CN109728860B (zh) * | 2018-12-25 | 2021-08-06 | 江苏益邦电力科技有限公司 | 一种基于采集终端检测装置的通讯干扰抑制方法 |
CN109728860A (zh) * | 2018-12-25 | 2019-05-07 | 江苏益邦电力科技有限公司 | 一种基于采集终端检测装置的通讯干扰抑制方法 |
CN110164425A (zh) * | 2019-05-29 | 2019-08-23 | 北京声智科技有限公司 | 一种降噪方法、装置及可实现降噪的设备 |
CN112017678A (zh) * | 2019-05-29 | 2020-12-01 | 北京声智科技有限公司 | 一种可实现降噪的设备及其降噪方法和装置 |
WO2020238203A1 (zh) * | 2019-05-29 | 2020-12-03 | 北京声智科技有限公司 | 降噪方法、降噪装置及可实现降噪的设备 |
CN110599997A (zh) * | 2019-09-25 | 2019-12-20 | 西南交通大学 | 一种鲁棒性强的冲击噪声有源控制方法 |
CN110599997B (zh) * | 2019-09-25 | 2022-04-12 | 西南交通大学 | 一种鲁棒性强的冲击噪声有源控制方法 |
WO2021062706A1 (zh) * | 2019-09-30 | 2021-04-08 | 大象声科(深圳)科技有限公司 | 近距离交谈场景下双麦克风移动电话的实时语音降噪方法 |
CN110889197B (zh) * | 2019-10-31 | 2023-04-21 | 佳禾智能科技股份有限公司 | 基于神经网络的自适应前馈式主动降噪方法、计算机可读存储介质、电子设备 |
CN110889197A (zh) * | 2019-10-31 | 2020-03-17 | 佳禾智能科技股份有限公司 | 基于神经网络的自适应前馈式主动降噪方法、计算机可读存储介质、电子设备 |
CN114265373A (zh) * | 2021-11-22 | 2022-04-01 | 煤炭科学研究总院 | 综采面一体式操控台控制系统 |
Also Published As
Publication number | Publication date |
---|---|
RU2685391C1 (ru) | 2019-04-17 |
HK1252025A1 (zh) | 2019-05-10 |
EP3309782A1 (en) | 2018-04-18 |
TR201903255T4 (tr) | 2019-03-21 |
WO2016197811A1 (zh) | 2016-12-15 |
EP3309782A4 (en) | 2018-04-18 |
CN104952458B (zh) | 2019-05-14 |
EP3309782B1 (en) | 2019-02-27 |
US20180137877A1 (en) | 2018-05-17 |
HK1252025B (zh) | 2020-03-20 |
ZA201708508B (en) | 2018-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104952458B (zh) | 一种噪声抑制方法、装置及系统 | |
CN107845389B (zh) | 一种基于多分辨率听觉倒谱系数和深度卷积神经网络的语音增强方法 | |
CN109841206B (zh) | 一种基于深度学习的回声消除方法 | |
CN106486131B (zh) | 一种语音去噪的方法及装置 | |
KR101934636B1 (ko) | 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치 | |
CN110867181B (zh) | 基于scnn和tcnn联合估计的多目标语音增强方法 | |
CN108172231B (zh) | 一种基于卡尔曼滤波的去混响方法及系统 | |
CN112863535B (zh) | 一种残余回声及噪声消除方法及装置 | |
US20150262590A1 (en) | Method and Device for Reconstructing a Target Signal from a Noisy Input Signal | |
CN111899756B (zh) | 一种单通道语音分离方法和装置 | |
CN111785285A (zh) | 面向家居多特征参数融合的声纹识别方法 | |
GB2560174A (en) | A feature extraction system, an automatic speech recognition system, a feature extraction method, an automatic speech recognition method and a method of train | |
CN106875938A (zh) | 一种改进的非线性自适应语音端点检测方法 | |
CN113077806B (zh) | 音频处理方法及装置、模型训练方法及装置、介质和设备 | |
CN112885368B (zh) | 基于改进胶囊网络的多频带谱减法振动信号去噪方法 | |
CN106373559A (zh) | 一种基于对数谱信噪比加权的鲁棒特征提取方法 | |
CN115223583A (zh) | 一种语音增强方法、装置、设备及介质 | |
Kantamaneni et al. | Speech enhancement with noise estimation and filtration using deep learning models | |
JP4348393B2 (ja) | 信号歪み除去装置、方法、プログラム及びそのプログラムを記録した記録媒体 | |
CN114566179A (zh) | 一种时延可控的语音降噪方法 | |
Astudillo et al. | Uncertainty propagation | |
Schmidt et al. | Reduction of non-stationary noise using a non-negative latent variable decomposition | |
CN108573698B (zh) | 一种基于性别融合信息的语音降噪方法 | |
CN112687284B (zh) | 混响语音的混响抑制方法及装置 | |
Mallidi et al. | Robust speaker recognition using spectro-temporal autoregressive models. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |