WO2021128670A1 - 降低噪声的方法、装置、电子设备及可读存储介质 - Google Patents

降低噪声的方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
WO2021128670A1
WO2021128670A1 PCT/CN2020/086639 CN2020086639W WO2021128670A1 WO 2021128670 A1 WO2021128670 A1 WO 2021128670A1 CN 2020086639 W CN2020086639 W CN 2020086639W WO 2021128670 A1 WO2021128670 A1 WO 2021128670A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound signal
signal
frequency domain
sound
interference
Prior art date
Application number
PCT/CN2020/086639
Other languages
English (en)
French (fr)
Inventor
康力
Original Assignee
紫光展锐(重庆)科技有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 紫光展锐(重庆)科技有限公司 filed Critical 紫光展锐(重庆)科技有限公司
Priority to EP20905296.8A priority Critical patent/EP4075431A4/en
Publication of WO2021128670A1 publication Critical patent/WO2021128670A1/zh
Priority to US17/850,936 priority patent/US20220328058A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Definitions

  • the noise of the surrounding environment will have a greater impact on the quality of the voice collected by the electronic device, affect the voice communication quality or the voice interaction process, and reduce the user experience and communication efficiency.
  • the surrounding environmental noise will inevitably be collected by the voice sending end. If the voice signal collected by the voice sending end is not processed and sent to the voice receiving end, the voice receiving end user will It will be interfered by these environmental noises, which will affect normal communication. If not handled properly, it will distort the voice information sent by the voice transmitter and affect the intelligibility of the voice.
  • voice recognition is performed without processing the voice signal collected by the electronic device, the accuracy of the voice recognition will be affected, and erroneous responses will occur.
  • the embodiments of the present application provide a method, a device, an electronic device, and a readable storage medium for reducing noise, which can effectively suppress noise while ensuring that the voice is not distorted.
  • the embodiments of the present application provide a method for reducing noise.
  • the method can be applied to an electronic device.
  • the electronic device includes a first sound collector and a second sound collector.
  • the first sound collector and The installation positions of the second sound collector are different, and the method includes:
  • incoherent noise suppression processing is performed on the third sound signal to obtain a target sound signal.
  • the determining the desired sound signal and the interference sound signal according to the first sound signal and the second sound signal includes:
  • Spatial filtering is performed on the first frequency domain signal and the second frequency domain signal to obtain the desired sound signal and the interference sound signal.
  • a fixed beamforming filter is used to spatially filter the first frequency domain signal and the second frequency domain signal to obtain the desired sound signal
  • a blocking matrix filter is used to perform spatial filtering on the first frequency domain signal.
  • the signal in the second frequency domain is spatially filtered with the signal in the second frequency domain to obtain the interference sound signal.
  • the fixed beamforming filter is used to spatially filter the first frequency domain signal and the second frequency domain signal according to the delay time to obtain the desired sound signal
  • the blocking matrix filter spatially filtering the first frequency domain signal and the second frequency domain signal to obtain the interference sound signal includes:
  • the expected sound signal F out ( ⁇ ) is calculated according to the following formula:
  • the expected sound signal F out ( ⁇ ) is calculated according to the following formula:
  • the determining the desired sound signal and the interference sound signal according to the first sound signal and the second sound signal includes:
  • the second frequency domain signal is determined as the desired sound signal, and the first frequency domain signal is determined as the interference sound signal.
  • the performing coherent noise cancellation processing on the desired sound signal based on the interfering sound signal to obtain a third sound signal includes:
  • the third sound signal Y D (k) is calculated using the following formula:
  • F out (k) represents the desired sound signal
  • B out (k) represents the interference sound signal
  • k represents the k-th frequency point
  • W(k) represents the adaptive filter coefficient
  • a second determining module configured to determine a first frequency domain signal of the first sound signal in the frequency domain, and a second frequency domain signal of the second sound signal in the frequency domain;
  • a second calculation module configured to determine the non-existence probability of a priori speech corresponding to the third sound signal according to the smoothed power spectrum
  • the third calculation module is configured to determine the posterior speech existence probability corresponding to the third sound signal according to the prior speech non-existence probability
  • a gain determination module configured to determine the incoherent noise signal existing in the third sound signal by using the posterior speech existence probability, and determine the effective gain function corresponding to the third sound signal according to the incoherent noise signal;
  • the noise suppression module is configured to use the effective gain function to perform incoherent noise suppression processing on the third sound signal.
  • an embodiment of the present application provides an electronic device, including: at least one processor and a memory, and a first sound collector and a second sound collector, the first sound collector and the second sound collector The installation position of the device is different;
  • the at least one processor executes the computer-executable instructions stored in the memory, so that the at least one processor executes the method for reducing noise provided in the first aspect.
  • an embodiment of the present application provides a computer-readable storage medium that stores computer-executable instructions in the computer-readable storage medium.
  • the processor executes the computer-executable instructions, the reduction provided in the first aspect is achieved. Noise method.
  • the noise reduction method, device, electronic equipment, and readable storage medium use a first sound collector and a second sound collector to determine the desired sound signal and the interference sound signal, and are based on the interference sound Signal to perform coherent noise cancellation processing on the desired sound signal to obtain a third sound signal, and then perform incoherent noise suppression processing on the third sound signal according to the probability of speech in the third sound signal to obtain the target sound signal. That is, in the embodiment of the present application, based on the interference sound signal, coherent noise cancellation processing is performed on the desired sound signal, and the third sound signal after the coherent noise cancellation processing is subjected to incoherent noise processing again, which can effectively reduce the target sound signal. In addition, since incoherent noise suppression processing is performed, the probability of speech in the third sound signal is estimated, so that incoherent noise suppression processing can effectively ensure that the voice is not distorted.
  • FIG. 1 is a first schematic flowchart of a method for reducing noise provided by an embodiment of this application;
  • FIG. 3 is a second schematic flowchart of a method for reducing noise provided by an embodiment of the application
  • the first sound collector and the second sound collector collect sounds in the surrounding environment at the same time, and then the electronic device will acquire the first sound collector to collect The first sound signal received, and the second sound signal collected by the second sound collector.
  • S102 Determine a desired sound signal and an interference sound signal according to the first sound signal and the second sound signal.
  • the sound collector will receive sounds from various directions in the process of collecting sounds, including near-field noise and far-field noise.
  • FIG. 2 is a schematic diagram of the spatial distribution of the sound collected by the sound collector in the embodiment of the present application.
  • the sound collector uses an omnidirectional microphone array.
  • the noise propagation path is mainly a direct path, which can be regarded as point source noise .
  • the common interference caused by people around is regarded as near-field interference.
  • the long-distance noise source whose propagation path is dominated by multipath reflection and reverberation, can be regarded as diffuse field noise, common crowd noise, vehicle noise, etc., are regarded as far-field noise.
  • the point source noise in the near field has strong directivity, that is, the noise energy received by the microphone array in a specific direction is much greater than the noise energy in other directions.
  • the diffuse field noise in the far field does not have obvious directivity, that is, the noise energy reaching the microphone array from all directions has little difference.
  • the first sound signal and the second sound signal can also be spatially filtered to enhance the sound signal from the desired direction in the second sound signal, and attenuate the sound in other directions.
  • Signal to obtain the desired sound signal attenuate the sound signal from the desired direction in the first sound signal, and enhance the sound signal in other directions to obtain the interference sound signal.
  • S103 Perform coherent noise cancellation processing on the desired sound signal based on the interference sound signal to obtain a third sound signal.
  • S104 Perform incoherent noise suppression processing on the third sound signal according to the probability of the presence of speech in the third sound signal to obtain a target sound signal.
  • FIG. 3 is a second schematic flowchart of the method for reducing noise provided by the embodiment of the present application.
  • a fixed beamforming (FBF) filter may be used to spatially filter the first sound signal
  • a Block Matrix (BM) filter may be used to perform spatial filtering on the second sound signal. Perform spatial filtering. It is also possible to use a fixed beamforming filter to spatially filter the second sound signal, and use a blocking matrix filter to spatially filter the first sound signal.
  • the spatial filtering processing of the above-mentioned first sound signal and the second sound signal can be performed in the frequency domain.
  • the frequency domain implementation has three advantages: first, the delay setting of spatial filtering is more convenient, and the delay in time domain is more convenient. Limited by the sampling rate, the minimum delay is one sampling period, and the delay less than one sampling period needs to be obtained by changing the sampling rate. The second is that the amount of calculation for adaptive filtering is less, the filtering in the time domain is a convolution operation, and the filtering in the frequency domain is a direct multiplication operation. Third, the granularity of incoherent noise suppression is finer, and noise estimation and noise suppression can be processed separately for each frequency point.
  • the first frequency domain signal in the frequency domain may be performed to obtain the first frequency domain signal of the first sound signal in the frequency domain.
  • the delay time between the collection moment of the first sound signal and the collection moment of the second sound signal may be determined first, and then according to the delay Time length, using a fixed beamforming filter to spatially filter the first frequency domain signal and the second frequency domain signal to obtain the desired sound signal, using a blocking matrix filter to spatially filter the first frequency domain signal and the second frequency domain signal, Obtain interference sound signals.
  • the wireless headset includes a microphone X 1 and a microphone X 2 , and the distance between the microphone X 1 and the microphone X 2 is d.
  • the direction of the desired voice of the wireless headset is fixed, and the incident angle is ⁇ , that is, in actual use, the microphone X 1 is closer to the position of the human mouth than the microphone X 2.
  • the signal obtained is X 0 ( ⁇ )
  • the first frequency domain signal X 1 ( ⁇ ) and the second frequency domain signal X 2 ( ⁇ ) are respectively The advance and delay of the signal X 0 ( ⁇ ), where ⁇ represents the wavelength of the sound wave.
  • the desired sound signal F out ( ⁇ ) can be calculated according to the following formula:
  • X 1 ( ⁇ ) represents the above-mentioned first frequency domain signal
  • X 2 ( ⁇ ) represents the above-mentioned second frequency domain signal
  • represents the delay time
  • FIG. 4b is a second schematic diagram of filtering in the method for reducing noise in the embodiment of the present application.
  • a wireless headset is still taken as an example.
  • the wireless headset includes a microphone X 1 and a microphone X 2 , and the distance between the microphone X 1 and the microphone X 2 is d.
  • the direction of the desired voice of the wireless headset is fixed, and the incident angle is ⁇ , that is, in actual use, the microphone X 2 is closer to the position of the human mouth than the microphone X 1.
  • the signal obtained is X 0 ( ⁇ )
  • the first frequency domain signal X 2 ( ⁇ ) and the second frequency domain signal X 1 ( ⁇ ) are respectively The advance and delay of the signal X 0 ( ⁇ ), where ⁇ represents the wavelength of the sound wave.
  • X 1 ( ⁇ ) represents the above-mentioned first frequency domain signal
  • X 2 ( ⁇ ) represents the above-mentioned second frequency domain signal
  • represents the delay time
  • FIG. 5 is a schematic diagram of the beam of the desired sound signal in the embodiment of the present application.
  • FIG. 6 is a schematic diagram of a beam interfering with a sound signal in an embodiment of the application.
  • the second sound signal picked up by the second sound collector close to the mouth will be significantly more expected than the interfering sound signal;
  • the expected sound signal in the first sound signal picked up by the first sound collector of the mouth is significantly less than the interference sound signal.
  • the second sound signal can be subjected to coherent noise cancellation processing to obtain the third sound signal, and then according to the probability of speech in the third sound signal, incoherent noise suppression processing is performed on the third sound signal , Get the target sound signal.
  • ⁇ 0 represents the update step size
  • ⁇ SIR represents the variable update step size
  • the variable update step size ⁇ SIR varies with the power ratio of the desired sound signal to the interfering sound signal
  • is the preset parameter
  • B out ( k) Y D (k) * represents the conjugate correlation between the interference sound signal Bout (k) and the third sound signal Y D (k).
  • the power ratio of the desired sound signal to the interference sound signal can be used as a control condition for coherent noise update, and the ratio can be approximated as a signal to interference ratio (SIR).
  • SIR signal to interference ratio
  • ⁇ 0 is a fixed update step size, and the value is generally between 0.01 and 0.1, which is a fixed value.
  • ⁇ SIR is a variable update step size that varies with SIR, and is negatively correlated with SIR. The larger the SIR, the smaller the ⁇ SIR, and the slower the coefficient update.
  • the value of ⁇ SIR is between 0 and 1.
  • the denominator is the energy of the interference sound signal Bout(k) plus a fixed value ⁇ . The value of ⁇ ranges from 1e-5 to 1e-10, which can prevent the denominator from being 0.
  • the ratio of the approximate signal-to-interference ratio is used for control. If the signal interference is relatively high, it means that the current is a speech signal, then the adaptive filtering is reduced or even not updated; if the signal interference is relatively low, it means that the current is an interference signal and the adaptive filter coefficients need to be updated.
  • FIG. 7 is a schematic diagram of the second flow of the method for reducing noise provided by an embodiment of this application.
  • the incoherent noise suppression processing on the third sound signal specifically includes:
  • S704 Determine an incoherent noise signal existing in the third sound signal by using the posterior speech existence probability, and determine an effective gain function corresponding to the third sound signal according to the incoherent noise signal.
  • S705 Perform incoherent noise suppression processing on the third sound signal by using the effective gain function.
  • the third sound signal is X(k,t), which represents the value of the third sound signal at the k-th frequency point and t frame
  • first calculate the instantaneous power spectrum of the third sound signal and then calculate it from the instantaneous power spectrum
  • t-1 represents the value of the previous frame.
  • ⁇ 1 is the smoothing coefficient, generally 0.8 ⁇ 0.95.
  • the posterior speech existence probability p(k,t) After obtaining the a priori speech nonexistence probability q(k,t), the posterior speech existence probability p(k,t) can be obtained, and the formula is as follows:
  • ⁇ (k,t) ⁇ s (k,t)/ ⁇ n (k,t)
  • ⁇ s (k,t) is the estimated clean speech power
  • ⁇ n (k,t) is the estimated power The noise voice power
  • v(k,t) ⁇ (k,t) ⁇ (k,t)/[1+ ⁇ (k,t)].
  • ⁇ n (k,t) is the smoothing coefficient, which is related to p(k,t), and its formula is:
  • ⁇ n (k, t) ⁇ 2 + (1- ⁇ 2 ) ⁇ p(k, t).
  • ⁇ 2 is 0.8 to 0.95.
  • Estimating the current frame noise ⁇ n (k, t) can obtain the prior signal-to-noise ratio ⁇ (k,t) and the posterior signal-to-noise ratio ⁇ (k,t) of the current frame, and further calculate the gain g(k ,t).
  • gain calculation such as Wiener gain and Optimally Modified Log-Spectral Amplitude Estimator (OMLSA) gain, etc., which are not limited here.
  • minimum statistical MS
  • minimum controlled recursive average noise estimation algorithm Minima-Controlled Recursive Averaging, MCRA
  • improved minimum controlled recursive average noise estimation algorithm improved minimum controlled recursive averaging
  • the noise estimation uses the probability p(k,t) of the existence of speech. If p(k,t) is large, it indicates that the speech exists, and the update of the noise estimate is weakened or even not updated, reducing distortion. Otherwise, the noise power is updated.
  • the method for reducing noise provided in this embodiment takes into account the probability of speech existence, priori SNR and posterior SNR when performing incoherent noise suppression processing, so that noise estimation is more accurate, and gain calculation is also More perfect, this can greatly improve the noise suppression ability and maintain the fidelity of the voice.
  • an embodiment of the present application also provides a device for reducing noise.
  • the device is applied to an electronic device.
  • the electronic device includes a first sound collector and a second sound collector.
  • the first sound collector The installation position is different from the second sound collector.
  • the acquiring module 801 is configured to acquire the first sound signal collected by the first sound collector and the second sound signal collected by the second sound collector.
  • the determining module 802 is configured to determine the desired sound signal and the interference sound signal according to the first sound signal and the second sound signal.
  • the coherent processing module 803 performs coherent noise cancellation processing on the desired sound signal based on the interference sound signal to obtain a third sound signal.
  • the incoherent processing module 804 performs incoherent noise suppression processing on the third sound signal according to the probability of speech in the third sound signal to obtain the target sound signal.
  • the determining module 802 specifically includes:
  • the first determining module is used to determine the first frequency domain signal of the first sound signal in the frequency domain and the second frequency domain signal of the second sound signal in the frequency domain.
  • the spatial filtering module is used to spatially filter the first frequency domain signal and the second frequency domain signal to obtain the desired sound signal and the interference sound signal.
  • a fixed beamforming filter is used to spatially filter the first frequency domain signal and the second frequency domain signal to obtain the desired sound signal
  • a blocking matrix filter is used to perform spatial filtering on the first frequency domain signal.
  • the signal in the second frequency domain is spatially filtered with the signal in the second frequency domain to obtain the interference sound signal.
  • the coherent processing module 803 is specifically configured to:
  • the third sound signal Y D (k) is calculated using the following formula:
  • ⁇ 0 represents an update step size
  • ⁇ SIR represents a variable update step size
  • the variable update step size ⁇ SIR varies with the power ratio of the desired sound signal to the interference sound signal
  • is the preset Assuming a parameter
  • B out (k) Y D (k) * represents the conjugate correlation between the interference sound signal Bout (k) and the third sound signal Y D (k).
  • the non-coherent processing module 804 specifically includes:
  • the first calculation module is used to determine the smooth power spectrum corresponding to the third sound signal.
  • the second calculation module is used to determine the non-existence probability of a priori speech corresponding to the third sound signal according to the smoothed power spectrum.
  • the third calculation module is used to determine the posterior speech existence probability corresponding to the third sound signal according to the prior speech non-existence probability.
  • the gain determination module is used to determine the incoherent noise signal existing in the third sound signal by using the posterior speech existence probability, and determine the effective gain function corresponding to the third sound signal according to the incoherent noise signal.
  • the noise suppression module is used to perform incoherent noise suppression processing on the third sound signal by using an effective gain function.
  • the noise reduction device adopts a first sound collector and a second sound collector to determine the desired sound signal and the interference sound signal, and performs coherent noise cancellation on the desired sound signal based on the interference sound signal
  • the third sound signal is obtained, and then according to the probability of speech in the third sound signal, incoherent noise suppression processing is performed on the third sound signal to obtain the target sound signal, which can effectively reduce the noise in the target sound signal; in addition, Since the probability of speech in the third sound signal is estimated during the incoherent noise suppression processing, it can effectively ensure that the speech is not distorted during the incoherent noise suppression processing.
  • An embodiment of the present application also provides an electronic device, including: at least one processor and a memory, and a first sound collector and a second sound collector, and the installation of the first sound collector and the second sound collector The locations are different; the memory stores computer-executable instructions; at least one processor executes the computer-executable instructions stored in the memory, so that at least one processor executes the method for reducing noise as described in the foregoing embodiments.
  • the memory 902 is used to store computer execution instructions
  • the processor 901 is configured to execute computer-executable instructions stored in the memory to implement each step executed by the electronic device in the foregoing embodiment. For details, please refer to the relevant description in the foregoing method embodiment.
  • the memory 902 may be independent or integrated with the processor 901.
  • the electronic device further includes a bus 903 for connecting the memory 902 and the processor 901.
  • An embodiment of the present application also provides a computer-readable storage medium, in which computer-executable instructions are stored, and when the processor executes the computer-executable instructions, the method for reducing noise as described above is implemented.
  • the disclosed device and method may be implemented in other ways.
  • the device embodiments described above are merely illustrative.
  • the division of the modules is only a logical function division, and there may be other divisions in actual implementation, for example, multiple modules can be combined or integrated. To another system, or some features can be ignored, or not implemented.
  • the displayed or discussed mutual coupling or direct coupling or communication connection may be indirect coupling or communication connection through some interfaces, devices or modules, and may be in electrical, mechanical or other forms.
  • the functional modules in the various embodiments of the present application may be integrated into one processing unit, or each module may exist alone physically, or two or more modules may be integrated into one unit.
  • the units formed by the above-mentioned modules can be implemented in the form of hardware, or in the form of hardware plus software functional units.
  • the above-mentioned integrated modules implemented in the form of software functional modules may be stored in a computer readable storage medium.
  • the above-mentioned software function module is stored in a storage medium and includes a number of instructions to make a computer device (which may be a personal computer, a server, or a network device, etc.) or a processor (English: processor) execute the various embodiments of the present application Part of the method.
  • the bus can be an Industry Standard Architecture (ISA) bus, Peripheral Component (PCI) bus, or Extended Industry Standard Architecture (EISA) bus, etc.
  • ISA Industry Standard Architecture
  • PCI Peripheral Component
  • EISA Extended Industry Standard Architecture
  • the bus can be divided into address bus, data bus, control bus and so on.
  • the buses in the drawings of this application are not limited to only one bus or one type of bus.
  • a person of ordinary skill in the art can understand that all or part of the steps in the foregoing method embodiments can be implemented by a program instructing relevant hardware.
  • the aforementioned program can be stored in a computer readable storage medium. When the program is executed, it executes the steps including the foregoing method embodiments; and the foregoing storage medium includes: ROM, RAM, magnetic disk, or optical disk and other media that can store program codes.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种降低噪声的方法、装置、电子设备及可读存储介质,应用于电子设备上,该电子设备包括第一声音采集器和第二声音采集器,第一声音采集器和第二声音采集器的安装位置不同;上述方法包括:基于第一声音采集器采集到的第一声音信号与第二声音采集器采集到的第二声音信号,确定出期望声音信号与干扰声音信号(S102),基于该干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号(S103),然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号(S104)。该方法不仅能够有效的降低目标声音信号中的噪声,还能有效保证目标声音信号中的语音不失真。

Description

降低噪声的方法、装置、电子设备及可读存储介质 技术领域
本申请实施例涉及降噪技术领域,尤其涉及一种降低噪声的方法、装置、电子设备及可读存储介质。
背景技术
随着科技的发展,人们对生活品质的要求越来越高,通过电子产品来进行语音通信、语音交互的方式也已越来越普遍。
当电子设备处于嘈杂的环境中时,周围环境的噪声会对电子设备采集到的语音质量造成较大影响,影响语音通信质量或语音交互过程,降低了用户体验和沟通效率。例如,在实时语音通信过程中,周围的环境噪声总会不可避免的被语音发送端采集到,若不对语音发送端采集到的语音信号进行处理就发送至语音接收端,则语音接收端用户就会受到这些环境噪声的干扰,影响正常交流,若处理不当则反而会使语音发送端发送的语音信息失真,影响语音的可懂度。再例如,在人机交互领域,若不对电子设备采集到的语音信号进行处理就进行语音识别,则会影响语音识别的准确率,出现错误的响应。
因此,目前亟需一种降低噪声的方法,能够在有效抑制噪声的同时,还能保证语音不失真。
发明内容
本申请实施例提供一种降低噪声的方法、装置、电子设备及可读存储介质,可以在有效抑制噪声的同时,还能保证语音不失真。
第一方面,本申请实施例提供一种降低噪声的方法,该方法可应用于电子设备上,所述电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述方法包括:
获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在一种可能的设计中,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
在一种可能的设计中,所述对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号,包括:
确定所述第一声音信号的采集时刻与所述第二声音信号的采集时刻之间的延迟时长;
根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号。
在一种可能的设计中,所述根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号,包括:
按照以下公式计算所述期望声音信号F out(ω):
Figure PCTCN2020086639-appb-000001
按照以下公式计算所述干扰声音信号B out(ω):
Figure PCTCN2020086639-appb-000002
或者,
按照以下公式计算所述期望声音信号F out(ω):
Figure PCTCN2020086639-appb-000003
按照以下公式计算所述干扰声音信号B out(ω):
Figure PCTCN2020086639-appb-000004
其中,X 1(ω)表示所述第一频域信号,X 2(ω)表示所述第二频域信号,τ表示所述延迟时长。
在一种可能的设计中,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
在一种可能的设计中,所述基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号,包括:
利用以下公式计算得到所述第三声音信号Y D(k):
Y D(k)=F out(k)-W(k)·B out(k);
其中,F out(k)表示所述期望声音信号,B out(k)表示所述干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure PCTCN2020086639-appb-000005
其中,μ 0表示更新步长,μ SIR表示可变更新步长,所述可变更新步长μ SIR随所述期望声音信号与所述干扰声音信号的功率比值的变化而变化,δ为预设参数,B out(k)Y D(k) *表示所述干扰声音信号Bout(k)和所述第三声音信号Y D(k)的共轭相关。
在一种可能的设计中,所述根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,包括:
确定所述第三声音信号对应的平滑功率谱;
根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
利用所述后验语音存在概率,确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
第二方面,本申请实施例提供一种降低噪声的装置,该装置应用于电子设备,该电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述装置包括:
获取模块,用于获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
确定模块,用于根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
相干处理模块,基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
非相干处理模块,根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在一种可能的设计中,所述确定模块具体包括:
第一确定模块,用于确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
空间滤波模块,用于对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
在一种可能的设计中,所述确定模块具体包括:
第二确定模块,用于确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
第三确定模块,用于将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
在一种可能的设计中,所述非相干处理模块具体包括:
第一计算模块,用于确定所述第三声音信号对应的平滑功率谱;
第二计算模块,用于根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
第三计算模块,用于根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
增益确定模块,用于利用所述后验语音存在概率确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
噪声抑制模块,用于利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器和存储器,以及第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面提供的降低噪声的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面提供的降低噪声的方法。
本申请实施例所提供的降低噪声的方法、装置、电子设备及可读存储介质,采用了第一声音采集器与第二声音采集器,来确定期望声音信号与干扰声音信号,并基于干扰声音信号来对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。即在本申请实施例中,基于干扰声音信号,来对期望声音信号进行相干噪声消除处理,以及对相干噪声消除处理后的第三声音信号再次进行非相干噪声处理,可以有效降低目标声音信号中的噪声;另外,由于在进行非相干噪声抑制处理时,对第三声音信号中存在语音的概率进行了估计,使得在进行非相干噪声抑制处理时,还能有效保证语音不失真。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的降低噪声的方法的流程示意图一;
图2为本申请实施例中声音采集器采集到的声音在空间上的分布示意图;
图3为本申请实施例提供的降低噪声的方法的流程示意图二;
图4a为本申请实施例中降低噪声的方法中的空间滤波示意图一;
图4b为本申请实施例中降低噪声的方法中的空间滤波示意图二;
图5为本申请实施例中期望声音信号的波束示意图;
图6为本申请实施例中干扰声音信号的波束示意图;
图7为本申请实施例提供的降低噪声的方法的流程示意图二;
图8为本申请实施例提供的降低噪声的装置的程序模块示意图
图9为本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种降低噪声的方法,该方法应用于电子设备上,该电子设备包括第一声音采集器和第二声音采集器,第一声音采集器和第二声音采集器的安装位置不同。
在一种可行的实施方式中,电子设备在正常使用时,第一声音采集器处于靠近人体嘴的位置,第二声音采集器处于远离人体嘴的位置。
在另一种可行的实施方式中,电子设备在正常使用时,第一声音采集器处于远离人体嘴的位置,第二声音采集器处于靠近人体嘴的位置。
其中,上述电子设备可以包括手机、平板电脑、智能手表等移动终端,也可以包括耳机、智能音响、电视机、车载终端等,本申请实施例在此不做限制,只要上述电子设备具备声音采集功能即可。
其中,上述电子设备可以包括两个声音采集器,即第一声音采集器和第二声音采集器;也可以包括两个以上声音采集器。本申请实施例所描述的声音采集器可以是麦克风阵列,也可以是其它具有声音采集功能的器件。
可选的,上述降低噪声的方法的应用场景包括无线耳机场景,例如,用户在佩戴无线耳机时,通过无线耳机来与其他用户进行语音通话的场景。
可选的,上述降低噪声的方法的应用场景还包括手持移动终端场景,例如,用户手持移动终端时,将嘴靠近第一声音采集器来与其他用户进行语音通话的场景。
参照图1,图1为本申请实施例提供的降低噪声的方法的流程示意图一,本实施例的执行主体可以为图1所示实施例中的电子设备,该方法包括:
S101、获取第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号。
在本申请实施例中,当电子设备进入通话模式或者语音交互模式时,第一声音采集器与第二声音采集器同时采集周围环境的中的声音,然后电子设备会获取第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号。
S102、根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号。
在本申请实施例中,声音采集器在采集声音的过程中,会接收到来自各个方向的声音,包括近场噪声与远场噪声。为了更好的理解本申请实施例,参照图2,图2为本申请实施例中声音采集器采集到的声音在空间上的分布示意图。
在图2中,声音采集器采用全指向的麦克风阵列,在采集声音的过程中,对于距离麦克风阵列较近的噪声源,其噪声的传播路径以直达路径为主,可以看成是点源噪声,常见的有周围的人说话产生的干扰等,视为近场干扰。而距离较远的噪声源,其传播路径以多径反射和混响为主,可以 看成是扩散场噪声,常见的有人群的噪声,车辆噪声等,视为远场噪声。其中,近场的点源噪声具有较强的指向性,即麦克风阵列接收到特定方向的噪声能量远远大于其他方向的噪声能量。远场的扩散场噪声,不具有明显的指向性,即从各个方向到达麦克风阵列的噪声能量差别不大。
本实施例中,上述麦克风阵列的期望方向是固定的,在第一声音采集器处于靠近人体嘴的位置时,对于近场的点源噪声,可以利用麦克风阵列的指向性,对第一声音信号与第二声音信号进行空间滤波,增强第一声音信号中来自期望方向的声音信号,衰减其它方向的声音信号,来得到期望声音信号;以及衰减第二声音信号中来自期望方向的声音信号,增强其它方向的声音信号,来得到干扰声音信号。
另外,在第二声音采集器处于靠近人体嘴的位置时,也可以对第一声音信号与第二声音信号进行空间滤波,增强第二声音信号中来自期望方向的声音信号,衰减其它方向的声音信号,来得到期望声音信号;衰减第一声音信号中来自期望方向的声音信号,增强其它方向的声音信号,来得到干扰声音信号。
S103、基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号。
本实施例中,在得到上述期望声音信号与干扰声音信号之后,即可基于该干扰声音信号对期望声音信号进行相干噪声消除处理,衰减期望声音信号中的干扰声音信号,进而得到第三声音信号。
S104、根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在实际场景中,在对期望声音信号进行相干噪声消除处理后,得到的第三声音信号中还会有大量的非相干噪声需要抑制。本实施例中,为了在进行非相干噪声抑制处理时,减少对第三声音信号中语音信号的影响,先确定出第三声音信号中存在语音的概率,然后根据该概率,对第三声音信号进行非相干噪声抑制处理,进而得到目标声音信号。
其中,如果存在语音的概率较大,说明第三声音信号中存在语音,则噪声估计的更新减弱甚至不更新,从而防止语音信号的失真;如果存在语音的概率较小,则说明第三声音信号中可能不存在语音,则更新噪声估计。
在进行非相干噪声抑制处理时,基于估计的噪声信号确定有效增益函数,并利用该有效增益函数,对第三声音信号进行非相干噪声抑制处理。为了更好的理解本申请实施例,参照图3,图3为本申请实施例提供的降低噪声的方法的流程示意图二。
图3中,对第一声音信号与第二声音信号分别进行空间滤波之后,得到期望声音信号与干扰声音信号,然后基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号,最后根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
可选的,本实施例中,可以采用固定波束形成(Fixed Beamforming,简称FBF)滤波器来对第一声音信号进行空间滤波,采用阻塞矩阵(Block Matrix,简称BM)滤波器对第二声音信号进行空间滤波。也可以采用固定波束形成滤波器来对第二声音信号进行空间滤波,采用阻塞矩阵滤波器对第一声音信号进行空间滤波。
本申请实施例所提供的降低噪声的方法,采用了第一声音采集器与第二声音采集器,来确定期望声音信号与干扰声音信号,并基于干扰声音信号来对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号,可以有效降低目标声音信号中的噪声;另外,由于在进行非相干噪声抑制处理时,对第三声音信号中存在语音的概率进行了估计,使得在进行非相干噪声抑制处理时,还能有效保证语音不失真。
基于上述实施例所描述的内容,在一种可行的实施方式中,上述步骤S102中根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号,具体包括:
确定第一声音信号在频域上的第一频域信号,以及第二声音信号在频域上的第二频域信号;对第一频域信号与第二频域信号进行空间滤波,得到期望声音信号与干扰声音信号。
在本申请实施例中,对上述第一声音信号与第二声音信号的空间滤波处理可以在频域上进行,频域实现有三个优点:一是空间滤波的延迟设置更方便,时域的延迟受限于采样率,最小的延迟为一个采样周期,而小于 一个采样周期的延迟需要通过改变采样率来获得。二是自适应滤波的运算量更少,时域的滤波是卷积运算,频域的滤波是直接乘法运算。三是非相干噪声抑制颗粒度更细,对于每一个频点的噪声估计和噪声抑制可以单独进行处理。
可选的,可以通过对第一声音信号进行短时傅立叶变换,得到第一声音信号在频域上的第一频域信号;对第二声音信号进行短时傅立叶变换,得到第二声音信号在频域上的第一频域信号。
可选的,在对第一频域信号与第二频域信号进行空间滤波时,可以先确定第一声音信号的采集时刻与第二声音信号的采集时刻之间的延迟时长,然后根据该延迟时长,利用固定波束形成滤波器对第一频域信号与第二频域信号进行空间滤波,得到期望声音信号,利用阻塞矩阵滤波器对第一频域信号与第二频域信号进行空间滤波,得到干扰声音信号。
在本申请一种可行的实施例中,参照图4a,图4a为本申请实施例中降低噪声的方法中的滤波示意图一。
在图4a中,以无线耳机为例,该无线耳机包括麦克风X 1和麦克风X 2,且麦克风X 1和麦克风X 2之间的距离为d。另外,该无线耳机的期望语音的方向是固定的,入射角为θ,即在实际使用时,麦克风X 1相较于麦克风X 2更靠近与人体嘴的位置。当入射角θ=0°时,声音信号在麦克风X1和麦克风X2之间的延迟为τ A=d/c(c表示声速)。
假设麦克风X 1和麦克风X 2中间有一个虚拟麦克风X 0,得到信号为X 0(ω),则第一频域信号信号X 1(ω)和第二频域信号X 2(ω)分别是信号X 0(ω)的提前和延迟,其中
Figure PCTCN2020086639-appb-000006
λ表示声波波长。
Figure PCTCN2020086639-appb-000007
Figure PCTCN2020086639-appb-000008
可选的,可以按照以下公式计算期望声音信号F out(ω):
Figure PCTCN2020086639-appb-000009
按照以下公式计算干扰声音信号B out(ω):
Figure PCTCN2020086639-appb-000010
其中,X 1(ω)表示上述第一频域信号,X 2(ω)表示上述第二频域信号,τ表示延迟时长。
在本申请另一种可行的实施例中,参照图4b,图4b为本申请实施例中降低噪声的方法中的滤波示意图二。
在图4b中,仍以无线耳机为例,该无线耳机包括麦克风X 1和麦克风X 2,且麦克风X 1和麦克风X 2之间的距离为d。另外,该无线耳机的期望语音的方向是固定的,入射角为θ,即在实际使用时,麦克风X 2相较于麦克风X 1更靠近与人体嘴的位置。当入射角θ=0°时,声音信号在麦克风X1和麦克风X2之间的延迟为τ A=d/c(c表示声速)。
假设麦克风X 1和麦克风X 2中间有一个虚拟麦克风X 0,得到信号为X 0(ω),则第一频域信号信号X 2(ω)和第二频域信号X 1(ω)分别是信号X 0(ω)的提前和延迟,其中
Figure PCTCN2020086639-appb-000011
λ表示声波波长。
Figure PCTCN2020086639-appb-000012
Figure PCTCN2020086639-appb-000013
可选的,可以按照以下公式计算期望声音信号F out(ω):
Figure PCTCN2020086639-appb-000014
按照以下公式计算干扰声音信号B out(ω):
Figure PCTCN2020086639-appb-000015
其中,X 1(ω)表示上述第一频域信号,X 2(ω)表示上述第二频域信号,τ表示延迟时长。
为了更好的理解本申请实施例,参照图5,图5为本申请实施例中期望声音信号的波束示意图。
在图5中,取延迟时长τ=τ A,当期望语音信号从0°±30°范围的方向传播过来时,其他方向的声音信号可以认为是干扰信号。从得到的波束图可以看出,在0°±30°的范围增益为0dB,其他方向有不同程度的衰减,并在180°方向衰减最大。
参照图6,图6为本申请实施例中干扰声音信号的波束示意图。
在图6中,同样取延迟时长τ=τ A,假设期望语音信号从0°±30°范围的方向传播过来,而其他方向的声音信号认为是干扰信号。从得到的波束图可以看出,干扰声音信号在0°方向衰减最大,180°方向的衰减最小。
即本申请实施例所提供的降低噪声的方法,对第一声音信号与第二声音信号进行空间滤波后,可以有效衰减期望声音信号中的干扰声音信号分量,以及衰减干扰声音信号中的期望声音信号分量,从而在基于干扰声音信号,对期望声音信号进行相干噪声消除处理时,能够有效滤除期望声音信号中的相干噪声。
基于上述实施例所描述的内容,在一种可行的实施方式中,上述步骤S102中根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号,具体还包括:
确定第一声音信号在频域上的第一频域信号与第二声音信号在频域上的第二频域信号,并将第一频域信号确定为期望声音信号,将第二频域信号确定为干扰声音信号;或者,将第二频域信号确定为期望声音信号,将第一频域信号确定为干扰声音信号。
即本申请实施例所提供的方法还适用于手持电子设备的场景,例如,用户在手持电子设备时,并将嘴靠近第一声音采集器时,靠近嘴的第一声音采集器拾取到的第一声音信号中期望声音信号会明显多于干扰声音信号;而远离嘴的第二声音采集器拾取到的第二声音信号中期望声音信号会明显少于干扰声音信号。此时,可以基于第二声音信号,对第一声音信号进行相干噪声消除处理,得到第三声音信号,然后根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
再例如,用户在手持电子设备时,并将嘴靠近第二声音采集器时,靠近嘴的第二声音采集器拾取到的第二声音信号中期望声音信号会明显多于干扰声音信号;而远离嘴的第一声音采集器拾取到的第一声音信号中期望声音信号会明显少于干扰声音信号。此时,可以基于第一声音信号,对第二声音信号进行相干噪声消除处理,得到第三声音信号,然后根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
即在本申请一种可行的实施方式中,可以不对第一声音信号与第二声 音信号进行空间滤波,只进行相干噪声处理与非相干噪声抑制,即可有效降低得到的目标声音信号中的噪声。
基于上述实施例所描述的内容,在一种可行的实施方式中,上述步骤S103中基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号,具体包括:
利用以下公式计算得到第三声音信号Y D(k):
Y D(k)=F out(k)-W(k)·B out(k);
其中,F out(k)表示期望声音信号,B out(k)表示干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure PCTCN2020086639-appb-000016
其中,μ 0表示更新步长,μ SIR表示可变更新步长,可变更新步长μ SIR随期望声音信号与干扰声音信号的功率比值的变化而变化,δ为预设参数,B out(k)Y D(k) *表示干扰声音信号Bout(k)和第三声音信号Y D(k)的共轭相关。
其中,期望声音信号与干扰声音信号的功率比值可以作为相干噪声更新的控制条件,该比值可近似看做信干比(Signal to Interference Ratio,简称SIR)。
可选的,μ 0为固定更新步长,取值一般在0.01~0.1之间,是一个定值。μ SIR是一个随SIR变化的可变更新步长,与SIR呈负相关,SIR越大,μ SIR越小,系数更新越慢。μ SIR取值在0~1之间。分母是干扰声音信号Bout(k)的能量加上一个固定值δ,δ取值范围在1e-5~1e-10之间,能够避免分母为0。
即本实施例在自适应滤波器的系数更新时,使用了近似信干比的比值来进行控制。如果信干比较高,表示当前是语音信号,则自适应滤波减少更新甚至不更新;如果信干比较低,则表示当前是干扰信号,需要更新自适应滤波系数。
基于上述实施例所描述的内容,在一种可行的实施方式中,参照图7,图7为本申请实施例提供的降低噪声的方法的流程示意图二,上述步骤S104中根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,具体包括:
S701、确定第三声音信号对应的平滑功率谱。
S702、根据平滑功率谱,确定第三声音信号对应的先验语音不存在概率。
S703、根据先验语音不存在概率,确定第三声音信号对应的后验语音存在概率。
S704、利用后验语音存在概率确定第三声音信号中存在的非相干噪声信号,并根据非相干噪声信号确定第三声音信号对应的有效增益函数。
S705、利用有效增益函数,对第三声音信号进行非相干噪声抑制处理。
具体的,假设第三声音信号为X(k,t),代表第三声音信号在第k个频点和t帧的值,先对第三声音信号计算瞬时功率谱,然后由瞬时功率谱计算第三声音信号对应的平滑功率谱S 1(k,t):
S 1(k,t)=α 1·S 1(k,t-1)+(1-α 1)·|X(k,t)| 2
其中t-1代表前一帧的数值。而α 1为平滑系数,一般取0.8~0.95。
然后使用平滑后的功率谱S 1(k,t)和功率谱的最小值S min(k,t)做比值:
Figure PCTCN2020086639-appb-000017
通过上述比值的范围计算先验语音不存在概率q(k,t)的公式如下:
Figure PCTCN2020086639-appb-000018
其中,δ min和δ max为预设值,一般分别取1和3。
得到先验语音不存在概率q(k,t)后,可以求得后验语音存在概率p(k,t),公式如下:
Figure PCTCN2020086639-appb-000019
其中,ξ(k,t)=λ s(k,t)/λ n(k,t),λ s(k,t)是估计出来的干净语音功率,λ n(k,t)是估计出来的噪声语音功率。而v(k,t)=γ(k,t)·ξ(k,t)/[1+ ξ(k,t)]。
使用后验语音存在概率p(k,t)更新噪声:
λ n(k,t)=α n(k,t)·λ n(k,t-1)+[1-α n(k,t)]·|X(k,t)| 2
其中,α n(k,t)是平滑系数,与p(k,t)相关,其公式为:
α n(k,t)=α 2+(1-α 2)·p(k,t)。
其中,α 2取值为0.8~0.95。
估计出当前帧噪声λ n(k,t)可以得出当前帧的先验信噪比ξ(k,t)和后验信噪比γ(k,t),并进一步计算得到增益g(k,t)。增益计算有多种方法,如维纳增益和最优修正对数谱幅度估计(Optimally Modified Log-Spectral Amplitude Estimator,OMLSA)增益等,在此不做限制。
另外,还可以采用最小值统计(Minima Statistical,MS)、最小值控制递归平均噪声估计算法(Minima-Controlled Recursive Averaging,MCRA)、改进的最小值控制的递归平均噪声估计算法(improved minima controlled recursive averaging,IMCRA)等,来进行上述噪声估计,在此同样不做限制。
本实施例中,在非相干噪声抑制过程中,噪声的估计使用了存在语音的概率p(k,t)。如果p(k,t)较大,说明语音存在,则噪声估计的更新减弱甚至不更新,减少失真。反之,则更新噪声功率。
即本实施例所提供的降低噪声的方法,在进行非相干噪声抑制处理时,考虑了语音存在概率,先验信噪比和后验信噪比,使噪声的估计更加准确,增益的计算也更加的完善,这样能够极大地提高噪声抑制能力,并保持语音的保真度。
基于上述实施例所描述的内容,本申请实施例还提供一种降低噪声的装置,该装置应用于电子设备,该电子设备包括第一声音采集器和第二声音采集器,第一声音采集器和第二声音采集器的安装位置不同。
参照图8,图8为本申请实施例提供的降低噪声的装置的程序模块示意图,该装置包括:
获取模块801,用于获取第一声音采集器采集到的第一声音信号,以 及第二声音采集器采集到的第二声音信号。
确定模块802,用于根据第一声音信号与第二声音信号,确定出期望声音信号与干扰声音信号。
相干处理模块803,基于干扰声音信号,对期望声音信号进行相干噪声消除处理,得到第三声音信号。
非相干处理模块804,根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
在一种可行的实施方式中,确定模块802具体包括:
第一确定模块,用于确定第一声音信号在频域上的第一频域信号,以及第二声音信号在频域上的第二频域信号。
空间滤波模块,用于对第一频域信号与第二频域信号进行空间滤波,得到期望声音信号与干扰声音信号。
在一种可行的实施方式中,空间滤波模块具体用于:
确定第一声音信号的采集时刻与第二声音信号的采集时刻之间的延迟时长;
根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号。
在一种可行的实施方式中,按照以下公式计算上述期望声音信号F out(ω):
Figure PCTCN2020086639-appb-000020
按照以下公式计算所述干扰声音信号B out(ω):
Figure PCTCN2020086639-appb-000021
其中,X 1(ω)表示第一频域信号,X 2(ω)表示第二频域信号,τ表示上述延迟时长。
在另一种可行的实施方式中,按照以下公式计算期望声音信号F out(ω):
Figure PCTCN2020086639-appb-000022
按照以下公式计算所述干扰声音信号B out(ω):
Figure PCTCN2020086639-appb-000023
其中,X 1(ω)表示第一频域信号,X 2(ω)表示第二频域信号,τ表示上述延迟时长。
在一种可行的实施方式中,确定模块802具体包括:
第二确定模块,用于确定第一声音信号在频域上的第一频域信号与第二声音信号在频域上的第二频域信号。
第三确定模块,用于将第一频域信号确定为期望声音信号,将第二频域信号确定为干扰声音信号;或者,
将第二频域信号确定为期望声音信号,将第一频域信号确定为干扰声音信号。
在一种可行的实施方式中,相干处理模块803,具体用于:
利用以下公式计算得到所述第三声音信号Y D(k):
Y D(k)=F out(k)-W(k)·B out(k);
其中,F out(k)表示所述期望声音信号,B out(k)表示所述干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
Figure PCTCN2020086639-appb-000024
其中,μ 0表示更新步长,μ SIR表示可变更新步长,所述可变更新步长μ SIR随所述期望声音信号与所述干扰声音信号的功率比值的变化而变化,δ为预设参数,B out(k)Y D(k) *表示所述干扰声音信号Bout(k)和所述第三声音信号Y D(k)的共轭相关。
在一种可行的实施方式中,非相干处理模块804具体包括:
第一计算模块,用于确定第三声音信号对应的平滑功率谱。
第二计算模块,用于根据平滑功率谱,确定第三声音信号对应的先验语音不存在概率。
第三计算模块,用于根据先验语音不存在概率,确定第三声音信号对应的后验语音存在概率。
增益确定模块,用于利用后验语音存在概率确定第三声音信号中存在的非相干噪声信号,并根据非相干噪声信号确定第三声音信号对应的有效增益函数。
噪声抑制模块,用于利用有效增益函数,对第三声音信号进行非相干噪声抑制处理。
可以理解的是,本实施例提供的上述降低噪声的装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,具体可参照上述方法实施例中的描述,本实施例此处不再赘述。
本申请实施例所提供的降低噪声的装置,采用了第一声音采集器与第二声音采集器,来确定期望声音信号与干扰声音信号,并基于干扰声音信号来对期望声音信号进行相干噪声消除处理,得到第三声音信号,然后再根据第三声音信号中存在语音的概率,对第三声音信号进行非相干噪声抑制处理,得到目标声音信号,可以有效降低目标声音信号中的噪声;另外,由于在进行非相干噪声抑制处理时,对第三声音信号中存在语音的概率进行了估计,使得在进行非相干噪声抑制处理时,还能有效保证语音不失真。
本申请实施例还提供一种电子设备,包括:至少一个处理器和存储器,以及第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同;存储器存储计算机执行指令;至少一个处理器执行所述存储器存储的计算机执行指令,使得至少一个处理器执行如上述实施例在所描述的降低噪声的方法。
具体可参照图9,图9为本申请实施例提供的电子设备的硬件结构示意图。如图9所示,本实施例的电子设备90包括:处理器901以及存储器902;其中
存储器902,用于存储计算机执行指令;
处理器901,用于执行存储器存储的计算机执行指令,以实现上述实施例中电子设备所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。
可选地,存储器902既可以是独立的,也可以跟处理器901集成在一起。
当存储器902独立设置时,该电子设备还包括总线903,用于连接所述存储器902和处理器901。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实 现如上所述的降低噪声的方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘 或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (13)

  1. 一种降低噪声的方法,其特征在于,所述方法应用于电子设备上,所述电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述方法包括:
    获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
    根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
    基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
    根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
  2. 根据权利要求1所述的方法,其特征在于,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
    确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
    对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
  3. 根据权利要求2所述的方法,其特征在于,所述对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号,包括:
    确定所述第一声音信号的采集时刻与所述第二声音信号的采集时刻之间的延迟时长;
    根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述干扰声音信号。
  4. 根据权利要求3所述的方法,其特征在于,所述根据所述延迟时长,利用固定波束形成滤波器对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号,利用阻塞矩阵滤波器对所述第一频域信 号与所述第二频域信号进行空间滤波,得到所述干扰声音信号,包括:
    按照以下公式计算所述期望声音信号F out(ω):
    Figure PCTCN2020086639-appb-100001
    按照以下公式计算所述干扰声音信号B out(ω):
    Figure PCTCN2020086639-appb-100002
    或者,
    按照以下公式计算所述期望声音信号F out(ω):
    Figure PCTCN2020086639-appb-100003
    按照以下公式计算所述干扰声音信号B out(ω):
    Figure PCTCN2020086639-appb-100004
    其中,X 1(ω)表示所述第一频域信号,X 2(ω)表示所述第二频域信号,τ表示所述延迟时长。
  5. 根据权利要求1所述的方法,其特征在于,所述根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号,包括:
    确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
    将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
    将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
  6. 根据权利要求4或5所述的方法,其特征在于,所述基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号,包括:
    利用以下公式计算得到所述第三声音信号Y D(k):
    Y D(k)=F out(k)-W(k)·B out(k);
    其中,F out(k)表示所述期望声音信号,B out(k)表示所述干扰声音信号,k表示第k个频点,W(k)表示自适应滤波系数,且:
    Figure PCTCN2020086639-appb-100005
    其中,μ 0表示更新步长,μ SIR表示可变更新步长,所述可变更新步长μ SIR随所述期望声音信号与所述干扰声音信号的功率比值的变化而变化,δ为预设参数,B out(k)Y D(k) *表示所述干扰声音信号Bout(k)和所述第三声音信号Y D(k)的共轭相关。
  7. 根据权利要求6所述的方法,其特征在于,所述根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,包括:
    确定所述第三声音信号对应的平滑功率谱;
    根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
    根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
    利用所述后验语音存在概率,确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
    利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
  8. 一种降低噪声的装置,其特征在于,所述装置应用于电子设备,所述电子设备包括第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同,所述装置包括:
    获取模块,用于获取所述第一声音采集器采集到的第一声音信号,以及第二声音采集器采集到的第二声音信号;
    确定模块,用于根据所述第一声音信号与所述第二声音信号,确定出期望声音信号与干扰声音信号;
    相干处理模块,基于所述干扰声音信号,对所述期望声音信号进行相干噪声消除处理,得到第三声音信号;
    非相干处理模块,根据所述第三声音信号中存在语音的概率,对所述第三声音信号进行非相干噪声抑制处理,得到目标声音信号。
  9. 根据权利要求8所述的装置,其特征在于,所述确定模块具体包括:
    第一确定模块,用于确定所述第一声音信号在频域上的第一频域信号,以及所述第二声音信号在频域上的第二频域信号;
    空间滤波模块,用于对所述第一频域信号与所述第二频域信号进行空间滤波,得到所述期望声音信号与所述干扰声音信号。
  10. 根据权利要求8所述的装置,其特征在于,所述确定模块具体包括:
    第二确定模块,用于确定所述第一声音信号在频域上的第一频域信号,与所述第二声音信号在频域上的第二频域信号;
    第三确定模块,用于将所述第一频域信号确定为所述期望声音信号,将所述第二频域信号确定为所述干扰声音信号;或者,
    将所述第二频域信号确定为所述期望声音信号,将所述第一频域信号确定为所述干扰声音信号。
  11. 根据权利要求8至10任一项所述的装置,其特征在于,所述非相干处理模块具体包括:
    第一计算模块,用于确定所述第三声音信号对应的平滑功率谱;
    第二计算模块,用于根据所述平滑功率谱,确定所述第三声音信号对应的先验语音不存在概率;
    第三计算模块,用于根据所述先验语音不存在概率,确定所述第三声音信号对应的后验语音存在概率;
    增益确定模块,用于利用所述后验语音存在概率确定所述第三声音信号中存在的非相干噪声信号,并根据所述非相干噪声信号确定所述第三声音信号对应的有效增益函数;
    噪声抑制模块,用于利用所述有效增益函数,对所述第三声音信号进行非相干噪声抑制处理。
  12. 一种电子设备,其特征在于,包括:至少一个处理器和存储器,以及第一声音采集器和第二声音采集器,所述第一声音采集器和所述第二声音采集器的安装位置不同;
    所述存储器存储计算机执行指令;
    所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1至7任一项所述的降低噪声的方法。
  13. 一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1至7任一项所述的降低噪声的方法。
PCT/CN2020/086639 2019-12-26 2020-04-24 降低噪声的方法、装置、电子设备及可读存储介质 WO2021128670A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP20905296.8A EP4075431A4 (en) 2019-12-26 2020-04-24 NOISE REDUCTION METHOD, DEVICE, ELECTRONIC DEVICE AND READABLE STORAGE MEDIA
US17/850,936 US20220328058A1 (en) 2019-12-26 2022-06-27 Method and apparatus of noise reduction, electronic device and readable storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201911368908.7 2019-12-26
CN201911368908.7A CN111063366A (zh) 2019-12-26 2019-12-26 降低噪声的方法、装置、电子设备及可读存储介质

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/850,936 Continuation US20220328058A1 (en) 2019-12-26 2022-06-27 Method and apparatus of noise reduction, electronic device and readable storage medium

Publications (1)

Publication Number Publication Date
WO2021128670A1 true WO2021128670A1 (zh) 2021-07-01

Family

ID=70303963

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/086639 WO2021128670A1 (zh) 2019-12-26 2020-04-24 降低噪声的方法、装置、电子设备及可读存储介质

Country Status (4)

Country Link
US (1) US20220328058A1 (zh)
EP (1) EP4075431A4 (zh)
CN (1) CN111063366A (zh)
WO (1) WO2021128670A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681665A (zh) * 2020-05-20 2020-09-18 浙江大华技术股份有限公司 一种全向降噪方法、设备及存储介质
CN112669869B (zh) * 2020-12-23 2022-10-21 紫光展锐(重庆)科技有限公司 噪声抑制方法、设备、装置及存储介质
CN112802486B (zh) * 2020-12-29 2023-02-14 紫光展锐(重庆)科技有限公司 一种噪声抑制方法、装置及电子设备
CN113223552B (zh) * 2021-04-28 2023-06-13 锐迪科微电子(上海)有限公司 语音增强方法、装置、设备、存储介质及程序
CN115481649A (zh) * 2021-05-26 2022-12-16 中兴通讯股份有限公司 信号滤波方法及装置、存储介质、电子装置
WO2022246737A1 (zh) * 2021-05-27 2022-12-01 深圳市韶音科技有限公司 一种语音增强方法和系统
CN113347544A (zh) * 2021-06-03 2021-09-03 中国科学院声学研究所 助听器的信号处理方法、装置及助听器
CN113539291A (zh) * 2021-07-09 2021-10-22 北京声智科技有限公司 音频信号的降噪方法、装置、电子设备及存储介质
CN114724574A (zh) * 2022-02-21 2022-07-08 大连理工大学 一种期望声源方向可调的双麦克风降噪方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009043066A1 (en) * 2007-10-02 2009-04-09 Akg Acoustics Gmbh Method and device for low-latency auditory model-based single-channel speech enhancement
CN105590630A (zh) * 2016-02-18 2016-05-18 南京奇音石信息技术有限公司 基于指定带宽的定向噪音抑制方法
CN106653043A (zh) * 2016-12-26 2017-05-10 上海语知义信息技术有限公司 降低语音失真的自适应波束形成方法
CN107993670A (zh) * 2017-11-23 2018-05-04 华南理工大学 基于统计模型的麦克风阵列语音增强方法
CN109308904A (zh) * 2018-10-22 2019-02-05 上海声瀚信息科技有限公司 一种阵列语音增强算法
CN109994120A (zh) * 2017-12-29 2019-07-09 福州瑞芯微电子股份有限公司 基于双麦的语音增强方法、系统、音箱及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105940445B (zh) * 2016-02-04 2018-06-12 曾新晓 一种语音通信系统及其方法
CN109473118B (zh) * 2018-12-24 2021-07-20 思必驰科技股份有限公司 双通道语音增强方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009043066A1 (en) * 2007-10-02 2009-04-09 Akg Acoustics Gmbh Method and device for low-latency auditory model-based single-channel speech enhancement
CN105590630A (zh) * 2016-02-18 2016-05-18 南京奇音石信息技术有限公司 基于指定带宽的定向噪音抑制方法
CN106653043A (zh) * 2016-12-26 2017-05-10 上海语知义信息技术有限公司 降低语音失真的自适应波束形成方法
CN107993670A (zh) * 2017-11-23 2018-05-04 华南理工大学 基于统计模型的麦克风阵列语音增强方法
CN109994120A (zh) * 2017-12-29 2019-07-09 福州瑞芯微电子股份有限公司 基于双麦的语音增强方法、系统、音箱及存储介质
CN109308904A (zh) * 2018-10-22 2019-02-05 上海声瀚信息科技有限公司 一种阵列语音增强算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MCAULAY R.J., MALPASS M. L.: "SPEECH ENHANCEMENT USING A SOFT-DECISION NOISE SUPPRESSION FILTER.", IEEE TRANSACTIONS ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING., IEEE INC. NEW YORK., USA, vol. ASSP-28., no. 02., 1 April 1980 (1980-04-01), USA, pages 137 - 145., XP000647165, ISSN: 0096-3518, DOI: 10.1109/TASSP.1980.1163394 *
NI ZHONG: "The Research of Speech Enhancement Method Based on Microphone Array", MASTER THESIS, TIANJIN POLYTECHNIC UNIVERSITY, CN, 1 January 2018 (2018-01-01), CN, XP055827299, ISSN: 1674-0246 *

Also Published As

Publication number Publication date
EP4075431A4 (en) 2023-01-11
CN111063366A (zh) 2020-04-24
EP4075431A1 (en) 2022-10-19
US20220328058A1 (en) 2022-10-13

Similar Documents

Publication Publication Date Title
WO2021128670A1 (zh) 降低噪声的方法、装置、电子设备及可读存储介质
CN111418010B (zh) 一种多麦克风降噪方法、装置及终端设备
EP3542547B1 (en) Adaptive beamforming
US8787587B1 (en) Selection of system parameters based on non-acoustic sensor information
EP3413589A1 (en) A microphone system and a hearing device comprising a microphone system
US7206418B2 (en) Noise suppression for a wireless communication device
JP2021500634A (ja) マイク・アレイに基づく対象音声取得方法及び装置
US20150163587A1 (en) Audio Information Processing Method and Apparatus
US20130066628A1 (en) Apparatus and method for suppressing noise from voice signal by adaptively updating wiener filter coefficient by means of coherence
US20110058676A1 (en) Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
EP3704874B1 (en) Method of operating a hearing aid system and a hearing aid system
WO2013049737A1 (en) Processing signals
KR20120114327A (ko) 레벨 큐를 사용한 적응형 잡음 감소
JP5785674B2 (ja) デュアルマイクに基づく音声残響低減方法及びその装置
US9330677B2 (en) Method and apparatus for generating a noise reduced audio signal using a microphone array
CN112802486B (zh) 一种噪声抑制方法、装置及电子设备
CN106161751A (zh) 一种噪声抑制方法及装置
CN111681665A (zh) 一种全向降噪方法、设备及存储介质
WO2019086439A1 (en) Method of operating a hearing aid system and a hearing aid system
CN112735370B (zh) 一种语音信号处理方法、装置、电子设备和存储介质
CN111445916B (zh) 一种会议系统中音频去混响方法、装置及存储介质
JP2020504966A (ja) 遠距離音の捕捉
CN112669869B (zh) 噪声抑制方法、设备、装置及存储介质
CN112785997B (zh) 一种噪声估计方法、装置、电子设备和可读存储介质
Wang et al. A robust generalized sidelobe canceller controlled by a priori sir estimate

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20905296

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020905296

Country of ref document: EP

Effective date: 20220712

NENP Non-entry into the national phase

Ref country code: DE