JP2022038610A5 - - Google Patents

Download PDF

Info

Publication number
JP2022038610A5
JP2022038610A5 JP2020143203A JP2020143203A JP2022038610A5 JP 2022038610 A5 JP2022038610 A5 JP 2022038610A5 JP 2020143203 A JP2020143203 A JP 2020143203A JP 2020143203 A JP2020143203 A JP 2020143203A JP 2022038610 A5 JP2022038610 A5 JP 2022038610A5
Authority
JP
Japan
Prior art keywords
noise
audio signal
parameter
updating
processing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020143203A
Other languages
Japanese (ja)
Other versions
JP2022038610A (en
Filing date
Publication date
Application filed filed Critical
Priority to JP2020143203A priority Critical patent/JP2022038610A/en
Priority claimed from JP2020143203A external-priority patent/JP2022038610A/en
Priority to US17/410,592 priority patent/US11729548B2/en
Publication of JP2022038610A publication Critical patent/JP2022038610A/en
Publication of JP2022038610A5 publication Critical patent/JP2022038610A5/ja
Pending legal-status Critical Current

Links

Description

環境音を取得するための第一のマイクと、ノイズ源からの音を取得するための第二のマイクと、前記第一のマイクからの音声信号をフーリエ変換し、周波数領域の第一の音声信号を生成する第一の変換手段と、前記第二のマイクからの音声信号をフーリエ変換し、周波数領域の第二の音声信号を生成する第二の変換手段と、前記第二の音声信号と、前記ノイズ源のノイズに係る第一のパラメータとを演算し、ノイズデータを生成する生成手段と、前記ノイズデータを用いて、前記第一の音声信号に含まれる前記ノイズ源からのノイズを低減し、ノイズが低減された音声信号を出力するノイズ低減手段と、前記ノイズ低減手段から出力された前記ノイズ低減された周波数領域の音声信号を逆フーリエ変換し、ノイズが低減された時間領域の音声信号を出力する第三の変換手段と、前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを新たに生成し、新たに生成したパラメータを用いて前記パラメータを更新する更新手段と、を有し、前記生成手段は、前記更新手段により前記第一のパラメータが更新された場合、前記更新手段により更新された前記第一のパラメータと、前記第二の音声信号とを演算し、前記ノイズデータを生成する。
a first microphone for acquiring environmental sound; a second microphone for acquiring sound from a noise source; a first transformation means for generating a signal; a second transformation means for Fourier transforming an audio signal from said second microphone to generate a frequency domain second audio signal; and said second audio signal. and a generating means for generating noise data by calculating a first parameter related to noise of said noise source, and reducing noise from said noise source contained in said first audio signal using said noise data. a noise reduction means for outputting a noise-reduced audio signal; and an inverse Fourier transform of the noise-reduced frequency-domain audio signal output from the noise reduction means to obtain noise-reduced time-domain audio. Using a third conversion means for outputting a signal, the first audio signal and the second audio signal, newly generating a parameter related to the noise of the noise source, and using the newly generated parameter and updating means for updating the parameter by means of the updating means, and the generating means, when the first parameter is updated by the updating means, the first parameter updated by the updating means and the first The noise data is generated by computing the two audio signals.

Claims (13)

環境音を取得するための第一のマイクと、
ノイズ源からの音を取得するための第二のマイクと、
前記第一のマイクからの音声信号をフーリエ変換し、周波数領域の第一の音声信号を生成する第一の変換手段と、
前記第二のマイクからの音声信号をフーリエ変換し、周波数領域の第二の音声信号を生成する第二の変換手段と、
前記第二の音声信号と、前記ノイズ源のノイズに係る第一のパラメータとを演算し、ノイズデータを生成する生成手段と、
前記ノイズデータを用いて、前記第一の音声信号に含まれる前記ノイズ源からのノイズを低減し、ノイズが低減された音声信号を出力するノイズ低減手段と、
前記ノイズ低減手段から出力された前記ノイズ低減された周波数領域の音声信号を逆フーリエ変換し、ノイズが低減された時間領域の音声信号を出力する第三の変換手段と、
前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを新たに生成し、前記新たに生成したパラメータを用いて前記第一のパラメータを更新する更新手段と、
を有し、
前記生成手段は、前記更新手段により前記第一のパラメータが更新された場合、前記更新手段により更新された前記第一のパラメータと、前記第二の音声信号とを演算し、前記ノイズデータを生成することを特徴とする音声処理装置。
a first microphone for capturing ambient sound;
a second microphone for capturing sound from a noise source;
a first transformation means for Fourier transforming the audio signal from the first microphone to generate a first audio signal in the frequency domain ;
a second transformation means for Fourier transforming the audio signal from the second microphone to generate a second audio signal in the frequency domain ;
generating means for generating noise data by computing the second audio signal and a first parameter related to the noise of the noise source;
noise reduction means for reducing noise from the noise source contained in the first audio signal using the noise data and outputting a noise-reduced audio signal;
third transforming means for performing an inverse Fourier transform on the noise-reduced frequency-domain audio signal output from the noise reduction means , and outputting a noise-reduced time-domain audio signal ;
Updating of generating new parameters related to noise of the noise source using the first audio signal and the second audio signal, and updating the first parameters using the newly generated parameters means and
has
When the first parameter is updated by the updating means, the generating means calculates the first parameter updated by the updating means and the second audio signal to generate the noise data. A voice processing device characterized by:
前記更新手段は、前記新たに生成したパラメータの値が、前記第一のパラメータの値よりも小さくない場合、前記パラメータの更新を行わない
ことを特徴とする請求項1に記載の音声処理装置。
The updating means does not update the parameter when the value of the newly generated parameter is not smaller than the value of the first parameter.
2. The audio processing device according to claim 1, wherein:
前記更新手段は、前記新たに生成したパラメータが生成されたときの環境音の振幅が、前記第一のパラメータが生成されたときの環境音の振幅よりも小さい場合、前記新たに生成したパラメータを用いて、前記第一のパラメータを更新する
ことを特徴とする請求項1または2に記載の音声処理装置。
When the amplitude of the environmental sound when the newly generated parameter is generated is smaller than the amplitude of the environmental sound when the first parameter is generated, the updating means updates the newly generated parameter to 3. The speech processing device according to claim 1, wherein the first parameter is updated using
前記第一のパラメータは前記第二の音声信号の周波数スペクトルに対応した複数の周波数スペクトルの値を有し、
前記更新手段は、前記新たに生成したパラメータに基づいて、前記第一のパラメータを周波数スペクトルごとに更新する
ことを特徴とする請求項1から3のいずれか1項に記載の音声処理装置。
the first parameter has a plurality of frequency spectrum values corresponding to the frequency spectrum of the second audio signal;
The speech processing apparatus according to any one of claims 1 to 3, wherein the updating means updates the first parameter for each frequency spectrum based on the newly generated parameter.
前記ノイズ源としての駆動手段を有し、
前記更新手段は、前記駆動手段が駆動している間において、前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを生成する
ことを特徴とする請求項1から4の何れか1項に記載の音声処理装置。
Having driving means as the noise source,
The updating means generates a parameter related to the noise of the noise source using the first audio signal and the second audio signal while the driving means is driving. The audio processing device according to any one of claims 1 to 4.
前記更新手段は、前記駆動手段が駆動している間において複数のパラメータを生成した場合、前記複数のパラメータのうち、生成されたときの環境音の振幅が小さいパラメータを用いて、前記第一のパラメータを更新するための処理を実行する
ことを特徴とする請求項5に記載の音声処理装置。
When the update means generates a plurality of parameters while the driving means is driving, the update means uses, among the plurality of parameters, a parameter for which the amplitude of the environmental sound when generated is small to update the first 6. The speech processing device according to claim 5, wherein processing for updating parameters is executed.
撮像手段をさらに有し、
前記駆動手段は、前記撮像手段における撮像において駆動する
ことを特徴とする請求項5または6に記載の音声処理装置。
further comprising imaging means;
7. The sound processing apparatus according to claim 5, wherein the driving means drives when the image pickup means picks up an image.
前記更新手段は、前記音声処理装置の電源がオンされてから前記撮像手段により撮像された画像の記録が開始される前に、前記更新を実行する
ことを特徴とする請求項7に記載の音声処理装置。
8. The sound according to claim 7, wherein the updating means executes the updating after the power of the sound processing device is turned on and before recording of the image captured by the imaging means is started. processing equipment.
前記更新手段は、前記駆動手段が交換された場合、前記更新手段により更新された前記第一のパラメータを初期値に変更する
ことを特徴とする請求項5から8のいずれか1項に記載の音声処理装置。
9. The apparatus according to any one of claims 5 to 8 , wherein said updating means changes said first parameter updated by said updating means to an initial value when said driving means is replaced. audio processor.
記録手段をさらに有し、
前記更新手段により更新された前記第一のパラメータは、前記音声処理装置の電源がオフにされた場合でも、前記記録手段によって保持される
ことを特徴とする請求項1から9のいずれか1項に記載の音声処理装置。
further comprising recording means;
10. The first parameter updated by the updating means is retained by the recording means even when the power of the speech processing device is turned off. 3. The audio processing device according to .
前記第一のパラメータは前記第一の音声信号および前記第二の音声信号の振幅の比であることを特徴とする請求項1から12のいずれか1項に記載の音声処理装置。 13. The audio processing apparatus according to any one of claims 1 to 12, wherein said first parameter is a ratio of amplitudes of said first audio signal and said second audio signal. 環境音を取得するための第一のマイクと、
ノイズ源からの音を取得するための第二のマイクとを有する音声処理装置の制御方法であって、
前記第一のマイクからの音声信号をフーリエ変換し、周波数領域の第一の音声信号を生成するステップと、
前記第二のマイクからの音声信号をフーリエ変換し、周波数領域の第二の音声信号を生成するステップと、
前記第二の音声信号と、前記ノイズ源のノイズに係る第一のパラメータとを演算し、ノイズデータを生成する生成ステップと、
前記ノイズデータを用いて、前記第一の音声信号に含まれる前記ノイズ源からのノイズを低減し、ノイズが低減された周波数領域の音声信号を出力するノイズ低減ステップと、
前記ノイズ低減ステップによって出力された、前記ノイズが低減された周波数領域の音声信号を逆フーリエ変換し、ノイズが低減された時間領域の音声信号を出力するステップと、
前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを新たに生成し、前記新たに生成したパラメータを用いて前記第一のパラメータを更新する更新ステップと、を有し、
前記生成ステップでは、前記更新ステップにおいて前記第一のノイズパラメータが更新された場合、前記更新ステップにおいて更新された前記第一のノイズパラメータと、前記第二の音声信号と、を演算し、前記ノイズデータを生成する
ことを特徴とする制御方法。
a first microphone for capturing ambient sound;
a second microphone for capturing sound from a noise source; and a control method for an audio processing device comprising:
Fourier transforming an audio signal from the first microphone to generate a first audio signal in the frequency domain ;
Fourier transforming the audio signal from the second microphone to generate a second audio signal in the frequency domain ;
a generation step of generating noise data by computing the second audio signal and a first parameter related to the noise of the noise source;
a noise reduction step of using the noise data to reduce noise from the noise source contained in the first audio signal and outputting a noise-reduced frequency domain audio signal;
performing an inverse Fourier transform on the noise-reduced frequency-domain audio signal output by the noise reduction step , and outputting a noise-reduced time-domain audio signal ;
Updating of generating new parameters related to noise of the noise source using the first audio signal and the second audio signal, and updating the first parameters using the newly generated parameters and
In the generating step, when the first noise parameter is updated in the updating step, the first noise parameter updated in the updating step and the second audio signal are calculated, and the noise A control method characterized by generating data.
コンピュータを請求項1から11のいずれか1項に記載の音声処理装置の各手段として機能させるための、コンピュータが読み取り可能なプログラム。 A computer-readable program for causing a computer to function as each means of the speech processing apparatus according to any one of claims 1 to 11 .
JP2020143203A 2020-08-27 2020-08-27 Sound processor, control method, and program Pending JP2022038610A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020143203A JP2022038610A (en) 2020-08-27 2020-08-27 Sound processor, control method, and program
US17/410,592 US11729548B2 (en) 2020-08-27 2021-08-24 Audio processing apparatus, control method, and storage medium, each for performing noise reduction using audio signals input from plurality of microphones

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020143203A JP2022038610A (en) 2020-08-27 2020-08-27 Sound processor, control method, and program

Publications (2)

Publication Number Publication Date
JP2022038610A JP2022038610A (en) 2022-03-10
JP2022038610A5 true JP2022038610A5 (en) 2023-08-18

Family

ID=80498020

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020143203A Pending JP2022038610A (en) 2020-08-27 2020-08-27 Sound processor, control method, and program

Country Status (1)

Country Link
JP (1) JP2022038610A (en)

Similar Documents

Publication Publication Date Title
US8219394B2 (en) Adaptive ambient sound suppression and speech tracking
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
US20150030171A1 (en) Acoustic signal processing device and acoustic signal processing method
JP7218391B2 (en) NOISE REDUCTION METHOD, APPARATUS, ELECTRONIC DEVICE, STORAGE MEDIUM, AND PROGRAM FOR IN-VEHICLE ENVIRONMENT
JP2013527493A5 (en)
JP6485711B2 (en) Sound field reproduction apparatus and method, and program
JP2012252240A5 (en)
WO2006117915A1 (en) Active noise suppressor
WO2010058804A1 (en) Noise gate, sound collection device, and noise removal method
JP6371516B2 (en) Acoustic signal processing apparatus and method
JP6764923B2 (en) Speech processing methods, devices, devices and storage media
KR102191736B1 (en) Method and apparatus for speech enhancement with artificial neural network
US10937418B1 (en) Echo cancellation by acoustic playback estimation
TW202133950A (en) Vibration controlling apparatus, program for controlling vibration, and method for controlling vibration
CN107452398B (en) Echo acquisition method, electronic device and computer readable storage medium
US11380312B1 (en) Residual echo suppression for keyword detection
WO2023287773A1 (en) Speech enhancement
JP2013236272A (en) Voice processing device and voice processing method and program
JP2016038551A (en) Noise suppression device, method, and program
JP2022038610A5 (en)
JP2006234888A (en) Device, method, and program for removing reverberation, and recording medium
JP5985306B2 (en) Noise reduction apparatus and noise reduction method
JP2008072600A (en) Acoustic signal processing apparatus, acoustic signal processing program, and acoustic signal processing method
JP2022038611A5 (en)
EP4371311A1 (en) Data augmentation for speech enhancement