JP2022038610A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2022038610A5 JP2022038610A5 JP2020143203A JP2020143203A JP2022038610A5 JP 2022038610 A5 JP2022038610 A5 JP 2022038610A5 JP 2020143203 A JP2020143203 A JP 2020143203A JP 2020143203 A JP2020143203 A JP 2020143203A JP 2022038610 A5 JP2022038610 A5 JP 2022038610A5
- Authority
- JP
- Japan
- Prior art keywords
- noise
- audio signal
- parameter
- updating
- processing device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Description
環境音を取得するための第一のマイクと、ノイズ源からの音を取得するための第二のマイクと、前記第一のマイクからの音声信号をフーリエ変換し、周波数領域の第一の音声信号を生成する第一の変換手段と、前記第二のマイクからの音声信号をフーリエ変換し、周波数領域の第二の音声信号を生成する第二の変換手段と、前記第二の音声信号と、前記ノイズ源のノイズに係る第一のパラメータとを演算し、ノイズデータを生成する生成手段と、前記ノイズデータを用いて、前記第一の音声信号に含まれる前記ノイズ源からのノイズを低減し、ノイズが低減された音声信号を出力するノイズ低減手段と、前記ノイズ低減手段から出力された前記ノイズ低減された周波数領域の音声信号を逆フーリエ変換し、ノイズが低減された時間領域の音声信号を出力する第三の変換手段と、前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを新たに生成し、新たに生成したパラメータを用いて前記パラメータを更新する更新手段と、を有し、前記生成手段は、前記更新手段により前記第一のパラメータが更新された場合、前記更新手段により更新された前記第一のパラメータと、前記第二の音声信号とを演算し、前記ノイズデータを生成する。
a first microphone for acquiring environmental sound; a second microphone for acquiring sound from a noise source; a first transformation means for generating a signal; a second transformation means for Fourier transforming an audio signal from said second microphone to generate a frequency domain second audio signal; and said second audio signal. and a generating means for generating noise data by calculating a first parameter related to noise of said noise source, and reducing noise from said noise source contained in said first audio signal using said noise data. a noise reduction means for outputting a noise-reduced audio signal; and an inverse Fourier transform of the noise-reduced frequency-domain audio signal output from the noise reduction means to obtain noise-reduced time-domain audio. Using a third conversion means for outputting a signal, the first audio signal and the second audio signal, newly generating a parameter related to the noise of the noise source, and using the newly generated parameter and updating means for updating the parameter by means of the updating means, and the generating means, when the first parameter is updated by the updating means, the first parameter updated by the updating means and the first The noise data is generated by computing the two audio signals.
Claims (13)
ノイズ源からの音を取得するための第二のマイクと、
前記第一のマイクからの音声信号をフーリエ変換し、周波数領域の第一の音声信号を生成する第一の変換手段と、
前記第二のマイクからの音声信号をフーリエ変換し、周波数領域の第二の音声信号を生成する第二の変換手段と、
前記第二の音声信号と、前記ノイズ源のノイズに係る第一のパラメータとを演算し、ノイズデータを生成する生成手段と、
前記ノイズデータを用いて、前記第一の音声信号に含まれる前記ノイズ源からのノイズを低減し、ノイズが低減された音声信号を出力するノイズ低減手段と、
前記ノイズ低減手段から出力された前記ノイズ低減された周波数領域の音声信号を逆フーリエ変換し、ノイズが低減された時間領域の音声信号を出力する第三の変換手段と、
前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを新たに生成し、前記新たに生成したパラメータを用いて前記第一のパラメータを更新する更新手段と、
を有し、
前記生成手段は、前記更新手段により前記第一のパラメータが更新された場合、前記更新手段により更新された前記第一のパラメータと、前記第二の音声信号とを演算し、前記ノイズデータを生成することを特徴とする音声処理装置。 a first microphone for capturing ambient sound;
a second microphone for capturing sound from a noise source;
a first transformation means for Fourier transforming the audio signal from the first microphone to generate a first audio signal in the frequency domain ;
a second transformation means for Fourier transforming the audio signal from the second microphone to generate a second audio signal in the frequency domain ;
generating means for generating noise data by computing the second audio signal and a first parameter related to the noise of the noise source;
noise reduction means for reducing noise from the noise source contained in the first audio signal using the noise data and outputting a noise-reduced audio signal;
third transforming means for performing an inverse Fourier transform on the noise-reduced frequency-domain audio signal output from the noise reduction means , and outputting a noise-reduced time-domain audio signal ;
Updating of generating new parameters related to noise of the noise source using the first audio signal and the second audio signal, and updating the first parameters using the newly generated parameters means and
has
When the first parameter is updated by the updating means, the generating means calculates the first parameter updated by the updating means and the second audio signal to generate the noise data. A voice processing device characterized by:
ことを特徴とする請求項1に記載の音声処理装置。 The updating means does not update the parameter when the value of the newly generated parameter is not smaller than the value of the first parameter.
2. The audio processing device according to claim 1, wherein:
ことを特徴とする請求項1または2に記載の音声処理装置。 When the amplitude of the environmental sound when the newly generated parameter is generated is smaller than the amplitude of the environmental sound when the first parameter is generated, the updating means updates the newly generated parameter to 3. The speech processing device according to claim 1, wherein the first parameter is updated using
前記更新手段は、前記新たに生成したパラメータに基づいて、前記第一のパラメータを周波数スペクトルごとに更新する
ことを特徴とする請求項1から3のいずれか1項に記載の音声処理装置。 the first parameter has a plurality of frequency spectrum values corresponding to the frequency spectrum of the second audio signal;
The speech processing apparatus according to any one of claims 1 to 3, wherein the updating means updates the first parameter for each frequency spectrum based on the newly generated parameter.
前記更新手段は、前記駆動手段が駆動している間において、前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを生成する
ことを特徴とする請求項1から4の何れか1項に記載の音声処理装置。 Having driving means as the noise source,
The updating means generates a parameter related to the noise of the noise source using the first audio signal and the second audio signal while the driving means is driving. The audio processing device according to any one of claims 1 to 4.
ことを特徴とする請求項5に記載の音声処理装置。 When the update means generates a plurality of parameters while the driving means is driving, the update means uses, among the plurality of parameters, a parameter for which the amplitude of the environmental sound when generated is small to update the first 6. The speech processing device according to claim 5, wherein processing for updating parameters is executed.
前記駆動手段は、前記撮像手段における撮像において駆動する
ことを特徴とする請求項5または6に記載の音声処理装置。 further comprising imaging means;
7. The sound processing apparatus according to claim 5, wherein the driving means drives when the image pickup means picks up an image.
ことを特徴とする請求項7に記載の音声処理装置。 8. The sound according to claim 7, wherein the updating means executes the updating after the power of the sound processing device is turned on and before recording of the image captured by the imaging means is started. processing equipment.
ことを特徴とする請求項5から8のいずれか1項に記載の音声処理装置。 9. The apparatus according to any one of claims 5 to 8 , wherein said updating means changes said first parameter updated by said updating means to an initial value when said driving means is replaced. audio processor.
前記更新手段により更新された前記第一のパラメータは、前記音声処理装置の電源がオフにされた場合でも、前記記録手段によって保持される
ことを特徴とする請求項1から9のいずれか1項に記載の音声処理装置。 further comprising recording means;
10. The first parameter updated by the updating means is retained by the recording means even when the power of the speech processing device is turned off. 3. The audio processing device according to .
ノイズ源からの音を取得するための第二のマイクとを有する音声処理装置の制御方法であって、
前記第一のマイクからの音声信号をフーリエ変換し、周波数領域の第一の音声信号を生成するステップと、
前記第二のマイクからの音声信号をフーリエ変換し、周波数領域の第二の音声信号を生成するステップと、
前記第二の音声信号と、前記ノイズ源のノイズに係る第一のパラメータとを演算し、ノイズデータを生成する生成ステップと、
前記ノイズデータを用いて、前記第一の音声信号に含まれる前記ノイズ源からのノイズを低減し、ノイズが低減された周波数領域の音声信号を出力するノイズ低減ステップと、
前記ノイズ低減ステップによって出力された、前記ノイズが低減された周波数領域の音声信号を逆フーリエ変換し、ノイズが低減された時間領域の音声信号を出力するステップと、
前記第一の音声信号と前記第二の音声信号とを用いて、前記ノイズ源のノイズに係るパラメータを新たに生成し、前記新たに生成したパラメータを用いて前記第一のパラメータを更新する更新ステップと、を有し、
前記生成ステップでは、前記更新ステップにおいて前記第一のノイズパラメータが更新された場合、前記更新ステップにおいて更新された前記第一のノイズパラメータと、前記第二の音声信号と、を演算し、前記ノイズデータを生成する
ことを特徴とする制御方法。 a first microphone for capturing ambient sound;
a second microphone for capturing sound from a noise source; and a control method for an audio processing device comprising:
Fourier transforming an audio signal from the first microphone to generate a first audio signal in the frequency domain ;
Fourier transforming the audio signal from the second microphone to generate a second audio signal in the frequency domain ;
a generation step of generating noise data by computing the second audio signal and a first parameter related to the noise of the noise source;
a noise reduction step of using the noise data to reduce noise from the noise source contained in the first audio signal and outputting a noise-reduced frequency domain audio signal;
performing an inverse Fourier transform on the noise-reduced frequency-domain audio signal output by the noise reduction step , and outputting a noise-reduced time-domain audio signal ;
Updating of generating new parameters related to noise of the noise source using the first audio signal and the second audio signal, and updating the first parameters using the newly generated parameters and
In the generating step, when the first noise parameter is updated in the updating step, the first noise parameter updated in the updating step and the second audio signal are calculated, and the noise A control method characterized by generating data.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020143203A JP2022038610A (en) | 2020-08-27 | 2020-08-27 | Sound processor, control method, and program |
US17/410,592 US11729548B2 (en) | 2020-08-27 | 2021-08-24 | Audio processing apparatus, control method, and storage medium, each for performing noise reduction using audio signals input from plurality of microphones |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020143203A JP2022038610A (en) | 2020-08-27 | 2020-08-27 | Sound processor, control method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022038610A JP2022038610A (en) | 2022-03-10 |
JP2022038610A5 true JP2022038610A5 (en) | 2023-08-18 |
Family
ID=80498020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020143203A Pending JP2022038610A (en) | 2020-08-27 | 2020-08-27 | Sound processor, control method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022038610A (en) |
-
2020
- 2020-08-27 JP JP2020143203A patent/JP2022038610A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8219394B2 (en) | Adaptive ambient sound suppression and speech tracking | |
US8391471B2 (en) | Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium | |
US20150030171A1 (en) | Acoustic signal processing device and acoustic signal processing method | |
JP7218391B2 (en) | NOISE REDUCTION METHOD, APPARATUS, ELECTRONIC DEVICE, STORAGE MEDIUM, AND PROGRAM FOR IN-VEHICLE ENVIRONMENT | |
JP2013527493A5 (en) | ||
JP6485711B2 (en) | Sound field reproduction apparatus and method, and program | |
JP2012252240A5 (en) | ||
WO2006117915A1 (en) | Active noise suppressor | |
WO2010058804A1 (en) | Noise gate, sound collection device, and noise removal method | |
JP6371516B2 (en) | Acoustic signal processing apparatus and method | |
JP6764923B2 (en) | Speech processing methods, devices, devices and storage media | |
KR102191736B1 (en) | Method and apparatus for speech enhancement with artificial neural network | |
US10937418B1 (en) | Echo cancellation by acoustic playback estimation | |
TW202133950A (en) | Vibration controlling apparatus, program for controlling vibration, and method for controlling vibration | |
CN107452398B (en) | Echo acquisition method, electronic device and computer readable storage medium | |
US11380312B1 (en) | Residual echo suppression for keyword detection | |
WO2023287773A1 (en) | Speech enhancement | |
JP2013236272A (en) | Voice processing device and voice processing method and program | |
JP2016038551A (en) | Noise suppression device, method, and program | |
JP2022038610A5 (en) | ||
JP2006234888A (en) | Device, method, and program for removing reverberation, and recording medium | |
JP5985306B2 (en) | Noise reduction apparatus and noise reduction method | |
JP2008072600A (en) | Acoustic signal processing apparatus, acoustic signal processing program, and acoustic signal processing method | |
JP2022038611A5 (en) | ||
EP4371311A1 (en) | Data augmentation for speech enhancement |