JP2022011892A - Noise suppression circuit - Google Patents

Noise suppression circuit Download PDF

Info

Publication number
JP2022011892A
JP2022011892A JP2020113300A JP2020113300A JP2022011892A JP 2022011892 A JP2022011892 A JP 2022011892A JP 2020113300 A JP2020113300 A JP 2020113300A JP 2020113300 A JP2020113300 A JP 2020113300A JP 2022011892 A JP2022011892 A JP 2022011892A
Authority
JP
Japan
Prior art keywords
frequency
noise
suppression
amplitude spectrum
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020113300A
Other languages
Japanese (ja)
Inventor
康二郎 今里
Kojiro Imazato
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Radio Co Ltd
Original Assignee
Japan Radio Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Radio Co Ltd filed Critical Japan Radio Co Ltd
Priority to JP2020113300A priority Critical patent/JP2022011892A/en
Publication of JP2022011892A publication Critical patent/JP2022011892A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

To provide a noise suppression circuit that is used in a noise reduction circuit suppressing a high frequency component of remaining noise displeasing to ears and reducing a displeasing level of the remaining noise.SOLUTION: A noise suppression circuit 7 has: a suppression coefficient calculation unit 71 that calculates a suppression coefficient Gi(f) for suppressing a noise component; an average suppression coefficient calculation unit 72 that calculates an average suppression coefficient GM serving as an average value of a suppression coefficient Gi(f) ranging from a high frequency threshold frequency f1 to a maximum frequency f2 of a frequency f of an amplitude spectrum; a first suppression unit 73 that multiplies the suppression coefficient Gi(f) with a signal corresponding to the amplitude spectrum for a frequency band less than the high frequency threshold frequency f1, and calculates a post-subtraction processed amplitude spectrum Si(f); and a second suppression unit 74 that multiplies the average suppression coefficient GM with the signal corresponding to the amplitude spectrum for a frequency band equal to and more than the high frequency threshold frequency f1, and calculates a post-subtraction processed amplitude spectrum Si(f).SELECTED DRAWING: Figure 2

Description

この発明は、ノイズ抑圧回路に関し、例えば、高周波信号を送受信する無線機に組み込まれるノイズリダクション回路に用いられ得るノイズ抑圧回路に関する。 The present invention relates to a noise suppression circuit, for example, a noise suppression circuit that can be used in a noise reduction circuit incorporated in a radio that transmits and receives high frequency signals.

音声信号に含まれる雑音成分を抑圧する手法としてスペクトル減算法(Spectral Subtraction)が知られている(例えば、特許文献1、非特許文献1参照)。 A spectral subtraction method is known as a method for suppressing a noise component contained in an audio signal (see, for example, Patent Document 1 and Non-Patent Document 1).

特開平4-238399号公報Japanese Unexamined Patent Publication No. 4-238399

P.Scalart and J.Vieira Filho「Speech Enhancement Based on a Priori Signal to Noise Estimation」,IEEE International Conference on.Acoustics,Speech,Signal Processing,Atlanta,GA,USA,vol.2,pp.629-632,1996年P. Scalart and J. Vieira Filho "Speech Enhancement Based on a Priori Signal to Noise Estimation", IEEE International Conference on. Acoustics, Speech, Signal Progressing, Atlanta, GA, USA, vol. 2, pp. 629-632, 1996

ところで、スペクトル減算法などによって雑音成分を抑圧した後の残留ノイズに高周波成分があり耳障りであると感じ易い、という問題がある。特に無音声区間において、この問題が顕著に現れる。 By the way, there is a problem that there is a high frequency component in the residual noise after suppressing the noise component by a spectrum subtraction method or the like, and it is easy to feel that it is jarring. This problem is particularly noticeable in the non-voiced section.

そこでこの発明は、残留ノイズの耳につく高周波成分を適切に抑圧して残留ノイズの耳障りの程度を低減することが可能な、ノイズ抑圧回路を提供することを目的とする。 Therefore, an object of the present invention is to provide a noise suppression circuit capable of appropriately suppressing a high frequency component of residual noise attached to the ear to reduce the degree of residual noise that is offensive to the ear.

上記課題を解決するために、請求項1に記載の発明は、処理対象の信号の周波数スペクトルのうちの振幅成分を含む振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための、前記振幅スペクトルの周波数ごとの抑圧係数を算出する抑圧係数算出部と、前記振幅スペクトルの前記周波数の帯域を高周波帯域とその他の周波帯域とに区分する周波数である高周波閾値周波数から前記振幅スペクトルの前記周波数のうちの最大の周波数までの範囲についての、前記振幅スペクトルの前記周波数ごとの前記抑圧係数の平均値である平均抑圧係数を算出する平均抑圧係数算出部と、前記高周波閾値周波数未満の周波数帯域について、前記抑圧係数と前記振幅スペクトルに該当する信号とを乗じて、前記振幅スペクトルの前記周波数ごとに減算処理後の振幅スペクトルを算出する第1の抑圧部と、前記高周波閾値周波数以上の周波数帯域について、前記平均抑圧係数と前記振幅スペクトルに該当する信号とを乗じて、前記振幅スペクトルの前記周波数ごとに減算処理後の振幅スペクトルを算出する第2の抑圧部と、を有する、ことを特徴とするノイズ抑圧回路である。 In order to solve the above problems, the invention according to claim 1 is the amplitude for suppressing a noise component included in a signal corresponding to an amplitude spectrum including an amplitude component in the frequency spectrum of the signal to be processed. The suppression coefficient calculation unit that calculates the suppression coefficient for each frequency of the spectrum, and the high frequency threshold frequency that divides the frequency band of the amplitude spectrum into the high frequency band and other frequency bands to the frequency of the amplitude spectrum. Regarding the range up to the maximum frequency, the average suppression coefficient calculation unit that calculates the average suppression coefficient, which is the average value of the suppression coefficients for each frequency of the amplitude spectrum, and the frequency band below the high frequency threshold frequency. Regarding the first suppression unit that multiplies the suppression coefficient and the signal corresponding to the amplitude spectrum to calculate the amplitude spectrum after subtraction processing for each frequency of the amplitude spectrum, and the frequency band above the high frequency threshold frequency. Noise characterized by having a second suppression unit for multiplying the average suppression coefficient and a signal corresponding to the amplitude spectrum to calculate the amplitude spectrum after subtraction processing for each frequency of the amplitude spectrum. It is a suppression circuit.

請求項2に記載の発明は、請求項1に記載のノイズ抑圧回路において、前記高周波閾値周波数が、1.2~1.8kHzの範囲のうちのいずれかの値である、ことを特徴とする。 The invention according to claim 2 is characterized in that, in the noise suppression circuit according to claim 1, the high frequency threshold frequency is a value in the range of 1.2 to 1.8 kHz. ..

請求項1に記載の発明によれば、残留ノイズの耳につく高周波成分を適切に抑圧することができ、残留ノイズの耳障りの程度を低減させることが可能となる。 According to the first aspect of the present invention, it is possible to appropriately suppress the high frequency component of the residual noise that is attached to the ear, and it is possible to reduce the degree of the residual noise that is offensive to the ear.

請求項2に記載の発明によれば、振幅スペクトルの周波数帯域を高周波帯域とその他周波帯域とに区分する周波数を適切に設定することができ、残留ノイズの耳につく高周波成分の抑圧を一層適切に行うことが可能となる。 According to the invention according to claim 2, the frequency for dividing the frequency band of the amplitude spectrum into the high frequency band and the other frequency band can be appropriately set, and the suppression of the high frequency component attached to the ear of the residual noise is more appropriate. It becomes possible to do it.

この発明の実施の形態に係るノイズ抑圧回路を含むノイズリダクション回路の概略構成を示す機能ブロック図である。It is a functional block diagram which shows the schematic structure of the noise reduction circuit including the noise suppression circuit which concerns on embodiment of this invention. 実施の形態に係るノイズ抑圧回路の概略構成を示す機能ブロック図である。It is a functional block diagram which shows the schematic structure of the noise suppression circuit which concerns on embodiment.

以下、この発明を図示の実施の形態に基づいて説明する。 Hereinafter, the present invention will be described based on the illustrated embodiment.

図1は、この発明の実施の形態に係るノイズ抑圧回路7を含むノイズリダクション回路1の概略構成を示す機能ブロック図である。図2は、実施の形態に係るノイズ抑圧回路7の概略構成を示す機能ブロック図である。 FIG. 1 is a functional block diagram showing a schematic configuration of a noise reduction circuit 1 including a noise suppression circuit 7 according to an embodiment of the present invention. FIG. 2 is a functional block diagram showing a schematic configuration of the noise suppression circuit 7 according to the embodiment.

ノイズリダクション回路1は、例えば、高周波信号を送受信する無線機に組み込まれて、音声信号に含まれる雑音成分を抑圧する手法であるスペクトル減算法(Spectral Subtraction)を実現する回路であり、主として、プリエンファシス回路2と、窓処理部3と、時間周波数変換部4と、変換結果出力部5と、音声区間検出・ノイズ更新部6と、ノイズ抑圧回路7と、合成部8と、周波数時間変換部9と、ディエンファシス回路10と、を有する。 The noise reduction circuit 1 is, for example, a circuit incorporated in a radio device that transmits and receives high-frequency signals to realize a spectrum subtraction method (Spectral Reduction), which is a method of suppressing noise components contained in an audio signal, and is mainly a pre. Emphasis circuit 2, window processing unit 3, time-frequency conversion unit 4, conversion result output unit 5, voice section detection / noise update unit 6, noise suppression circuit 7, synthesis unit 8, frequency-time conversion unit 9 and a de-emphasis circuit 10.

プリエンファシス(Pre-Emphasis:PE)回路2は、アンテナから受信した高周波信号を復調した音声信号に対して高周波成分の相対強度を予め増幅する高域強調処理を施して、高域強調処理後の信号を出力する。 The pre-emphasis (PE) circuit 2 performs high-frequency enhancement processing for pre-amplifying the relative intensity of high-frequency components on an audio signal demodulated from a high-frequency signal received from an antenna, and after high-frequency enhancement processing. Output a signal.

窓処理部3は、プリエンファシス回路2から出力される高域強調処理後の信号の入力を受け、入力された前記信号から所定の時間長さのフレームを抽出する(例えば、12.5msごとに25ms分の時間波形を抽出する)とともに、各フレームに対して例えばハニング窓などの窓関数を乗じて窓処理を施す。窓処理部3は、各フレームに対して窓処理を施すたびに、窓処理後のフレームを出力する。 The window processing unit 3 receives the input of the signal after the high frequency enhancement processing output from the pre-emphasis circuit 2, and extracts a frame having a predetermined time length from the input signal (for example, every 12.5 ms). A time waveform for 25 ms is extracted), and each frame is subjected to window processing by multiplying it by a window function such as a Hanning window. The window processing unit 3 outputs the frame after the window processing each time the window processing is performed on each frame.

時間周波数変換部4は、窓処理部3から出力される窓処理後のフレームの入力を受け、前記フレームの入力を受けるたびに、前記フレームに対して時間領域の信号から周波数領域の信号への変換処理を施し、複数の周波数それぞれについての振幅成分と位相成分とを含む周波数スペクトルを計算して、実数と虚数との周波数スペクトルの信号を出力する。時間周波数変換部4は、例えば離散フーリエ変換(Discrete Fourier Transform)や高速フーリエ変換(Fast Fourier Transform)により、時間周波数変換を実行して周波数スペクトルを計算する。 The time-frequency conversion unit 4 receives the input of the window-processed frame output from the window processing unit 3, and each time the input of the frame is received, the time-frequency conversion unit 4 changes the signal in the time domain to the signal in the frequency domain with respect to the frame. The conversion process is performed, a frequency spectrum including an amplitude component and a phase component for each of a plurality of frequencies is calculated, and a signal of the frequency spectrum of a real number and an imaginary number is output. The time-frequency transform unit 4 executes a time-frequency transform and calculates a frequency spectrum by, for example, a discrete Fourier transform or a fast Fourier transform.

変換結果出力部5は、時間周波数変換部4から出力されるフレームごとの(例えば、12.5ms程度の間隔で)周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルのうちの各周波数の振幅成分を含む振幅スペクトルに該当する信号をノイズ抑圧回路7に対して出力するとともに、入力された前記周波数スペクトルのうちの各周波数の位相成分を含む位相スペクトルに該当する信号を合成部8に対して出力する。 The conversion result output unit 5 receives the input of the signal of the frequency spectrum for each frame (for example, at intervals of about 12.5 ms) output from the time-frequency conversion unit 4, and for each frame, the input of the frequency spectrum. A signal corresponding to the amplitude spectrum including the amplitude component of each frequency is output to the noise suppression circuit 7, and a signal corresponding to the phase spectrum including the phase component of each frequency in the input frequency spectrum is output. Output to the synthesizer 8.

音声区間検出・ノイズ更新部6は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受け、入力された前記振幅スペクトルに該当する信号を用いて、周波数ごとの雑音成分を表すノイズスペクトルを更新する。 The voice section detection / noise update unit 6 receives an input of a signal corresponding to the amplitude spectrum for each frame output from the conversion result output unit 5 and branched, and uses the input signal corresponding to the amplitude spectrum to be used. Update the noise spectrum that represents the noise component for each frequency.

音声区間検出・ノイズ更新部6は、まず、入力された前記振幅スペクトルに該当する信号について、フレームごとに、ノイズ成分のみのフレームであるのか、音声成分を含むフレームであるのか、の判定を行う。 The voice section detection / noise update unit 6 first determines, for each frame, whether the input signal corresponding to the amplitude spectrum is a frame containing only a noise component or a frame containing a voice component. ..

音声区間検出・ノイズ更新部6における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法は、特定の手順や手法に限定されるものではなく、従来もしくは新規の手順や手法の中から適当な手順や手法が適宜選択され得る。 The method of determining whether the frame to be processed contains only the noise component or the voice component in the voice section detection / noise update unit 6 is not limited to a specific procedure or method, and is not limited to a specific procedure or method, and is a conventional or new procedure. An appropriate procedure or method can be appropriately selected from the methods and methods.

音声区間検出・ノイズ更新部6における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法として、例えば、音声の非恒常性に着目して、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が直近のフレームにおいて複数回(例えば、3~5回程度)連続して所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記以外のときは処理対象のフレームには音声成分があると判定する手法や、あるいは、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記平均や分散の値が前記閾値以上であるときは処理対象のフレームには音声成分があると判定する手法などが用いられ得る。 As a method of determining whether the frame to be processed contains only a noise component or a noise component in the voice section detection / noise update unit 6, for example, focusing on the non-constancy of the voice, each frequency of the amplitude spectrum is used. When the average or dispersion value related to the magnitude of the amplitude is less than a predetermined threshold multiple times (for example, about 3 to 5 times) in a row in the latest frame, it is determined that the frame to be processed is only a noise component. , A method of determining that the frame to be processed has an audio component in cases other than the above, or processing when the value of the average or dispersion regarding the magnitude of the amplitude of each frequency of the amplitude spectrum is less than a predetermined threshold value. A method may be used in which it is determined that the target frame has only a noise component, and when the average or dispersion value is equal to or greater than the threshold value, it is determined that the target frame has an audio component.

音声区間検出・ノイズ更新部6は、続いて、過去に計算された周波数ごとの雑音成分を表すノイズスペクトルに、現フレーム(別言すると、処理対象のフレーム、最新のフレーム)の振幅スペクトル、すなわち、入力された前記振幅スペクトルに該当する信号を加味することにより、最新のノイズスペクトルへの更新を行う。 The voice section detection / noise update unit 6 subsequently adds the amplitude spectrum of the current frame (in other words, the frame to be processed, the latest frame) to the noise spectrum representing the noise component for each frequency calculated in the past, that is, , The latest noise spectrum is updated by adding the input signal corresponding to the amplitude spectrum.

音声区間検出・ノイズ更新部6における、周波数ごとの雑音成分を表すノイズスペクトルの更新の仕法は、特定の手順や手法に限定されるものではなく、従来もしくは新規の手順や手法の中から適当な手順や手法が適宜選択され得る。 The method of updating the noise spectrum representing the noise component for each frequency in the voice section detection / noise update unit 6 is not limited to a specific procedure or method, and is appropriate from conventional or new procedures and methods. Procedures and methods can be selected as appropriate.

音声区間検出・ノイズ更新部6における、周波数ごとの雑音成分を表すノイズスペクトルの更新の仕法として、例えば、入力された前記振幅スペクトルに該当する信号を用いて、更新後のノイズスペクトルNi(f)を、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかに応じて下記の数式1または数式2に従って算出する手法が用いられ得る。なお、以降の数式における添字iは、時系列の順序を表す順序数であり、すべての数式に共通して適用される順序を表す。また、以降の数式におけるfは、入力された前記振幅スペクトルにおける周波数を表す。 As a method for updating the noise spectrum representing the noise component for each frequency in the voice section detection / noise update unit 6, for example, using the input signal corresponding to the amplitude spectrum, the updated noise spectrum Ni (f). Can be calculated according to the following formula 1 or formula 2 depending on whether the frame to be processed contains only a noise component or a sound component. The subscript i in the following mathematical formulas is an ordinal number representing the order of the time series, and represents the order that is commonly applied to all the mathematical formulas. Further, f in the following mathematical formulas represents the frequency in the input amplitude spectrum.

具体的には、処理対象のフレームがノイズ成分のみである場合には、入力された前記振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIR(Infinite Impulse Response の略;無限インパルス応答)フィルタである以下の数式1に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する。数式1や数式2におけるNi-1(f)は、更新の1フレーム前のノイズスペクトルを表す。

Figure 2022011892000002
Specifically, when the frame to be processed contains only noise components, the input signal corresponding to the amplitude spectrum is used as the input signal spectrum Yi (f), which is an abbreviation for IIR (Infinite Impulse Response; infinite impulse response). ) The updated noise spectrum Ni (f) is calculated for each frequency f according to the following equation 1 which is a filter. Ni-1 (f) in Equation 1 and Equation 2 represents the noise spectrum one frame before the update.
Figure 2022011892000002

数式1におけるKは、処理対象のフレーム(別言すると、現フレーム、最新のフレーム)がノイズ成分のみのフレームである場合の、前記処理対象のフレームの振幅スペクトルである入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数である。定数Kは、0以上の整数であれば特定の値に限定されるものではなく、具体的には例えば、IIRフィルタの時定数の0.06~0.20秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてK=5~16程度の範囲)のうちのいずれかの値に設定されることが考えられ、特にIIRフィルタの時定数の0.1秒程度に相当する値(例えば、フレーム間隔12.5msにおいてK=8程度)に設定されることが考えられる。 K in Equation 1 is an input signal spectrum Yi (f) which is an amplitude spectrum of the frame to be processed when the frame to be processed (in other words, the current frame and the latest frame) is a frame containing only a noise component. It is a constant that determines the weighting of the noise spectrum Ni-1 (f) one frame before the update. The constant K is not limited to a specific value as long as it is an integer of 0 or more, and specifically, for example, a range corresponding to about 0.06 to 0.20 seconds of the time constant of the IIR filter (for example, It is conceivable that the value is set to any of K = 5 to 16 in the frame interval of 12.5 ms, and in particular, the value corresponding to the time constant of the IIR filter of about 0.1 second (for example). It is conceivable that K = 8) is set at a frame interval of 12.5 ms.

また、処理対象のフレームが音声成分を含む場合には、以下の数式2に従って周波数fごとに更新後のノイズスペクトルNi(f)を決定する。

Figure 2022011892000003
When the frame to be processed contains an audio component, the updated noise spectrum Ni (f) is determined for each frequency f according to the following mathematical formula 2.
Figure 2022011892000003

音声区間検出・ノイズ更新部6は、各フレームについて、更新後の、周波数fごとのノイズスペクトルNi(f)に該当する信号をノイズ抑圧回路7に対して出力する。 The voice section detection / noise update unit 6 outputs the updated signal corresponding to the noise spectrum Ni (f) for each frequency f to the noise suppression circuit 7 for each frame.

ノイズ抑圧回路7は、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、音声区間検出・ノイズ更新部6から出力されるフレームごとの更新後のノイズスペクトルに該当する信号の入力を受け、各フレームについて、入力された前記振幅スペクトルに該当する信号から、周波数ごとに(別言すると、スペクトルごとに)、入力された前記更新後のノイズスペクトルに該当する信号を減算する。 The noise suppression circuit 7 receives the input of the signal corresponding to the amplitude spectrum for each frame output from the conversion result output unit 5, and the updated noise spectrum for each frame output from the voice section detection / noise update unit 6. In response to the input of the signal corresponding to, for each frame, from the signal corresponding to the input amplitude spectrum, it corresponds to the updated noise spectrum input for each frequency (in other words, for each spectrum). Subtract the signal.

合成部8は、変換結果出力部5から出力されるフレームごとの位相スペクトルに該当する信号の入力を受けるとともに、ノイズ抑圧回路7から出力されるフレームごとの減算処理後の振幅スペクトルに該当する信号の入力を受け、フレームごとに、入力された前記位相スペクトルに該当する信号と前記振幅スペクトルに該当する信号とを合成して周波数スペクトルを生成して、実数と虚数との周波数スペクトルの信号を出力する。 The synthesizing unit 8 receives the input of the signal corresponding to the phase spectrum for each frame output from the conversion result output unit 5, and the signal corresponding to the amplitude spectrum after the subtraction processing for each frame output from the noise suppression circuit 7. Is received, and for each frame, the input signal corresponding to the phase spectrum and the signal corresponding to the amplitude spectrum are combined to generate a frequency spectrum, and a signal having a frequency spectrum of a real number and an imaginary number is output. do.

周波数時間変換部9は、合成部8から出力されるフレームごとの周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルの信号に対して周波数領域の信号から時間領域の信号への変換処理、すなわち時間周波数変換部4における変換処理の逆変換処理を施して、音声信号を出力する。周波数時間変換部9は、例えば逆離散フーリエ変換や逆高速フーリエ変換により、周波数時間変換を実行して音声信号を生成する。 The frequency-time conversion unit 9 receives the input of the frequency spectrum signal for each frame output from the synthesis unit 8, and for each frame, the signal in the frequency region to the signal in the time region with respect to the input signal of the frequency spectrum. The audio signal is output by performing the conversion process to, that is, the reverse conversion process of the conversion process in the time-frequency conversion unit 4. The frequency-time conversion unit 9 executes frequency-time conversion by, for example, inverse discrete Fourier transform or inverse fast Fourier transform to generate an audio signal.

ディエンファシス(De-Emphasis:DE)回路10は、周波数時間変換部9から出力される音声信号の入力を受け、入力された前記音声信号に対して高周波成分の相対強度を減衰させる高域減衰処理、すなわちプリエンファシス回路2の逆フィルタによる減衰処理を施して、高域減衰処理後の音声信号を出力する。 The De-Emphasis (DE) circuit 10 receives the input of the audio signal output from the frequency-time conversion unit 9, and attenuates the relative intensity of the high-frequency component with respect to the input audio signal. That is, the attenuation processing by the inverse filter of the pre-emphasis circuit 2 is performed, and the audio signal after the high frequency attenuation processing is output.

そして、実施の形態に係るノイズ抑圧回路7は、処理対象の信号の周波数スペクトルのうちの振幅成分を含む振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための、振幅スペクトルの周波数fごとの抑圧係数Gi(f)を算出する抑圧係数算出部71と、振幅スペクトルの周波数fの帯域を高周波帯域とその他の周波帯域とに区分する周波数である高周波閾値周波数f1から振幅スペクトルの周波数fのうちの最大の周波数f2までの範囲についての、振幅スペクトルの周波数fごとの抑圧係数Gi(f)の平均値である平均抑圧係数GMを算出する平均抑圧係数算出部72と、高周波閾値周波数f1未満の周波数帯域について、抑圧係数Gi(f)と振幅スペクトルに該当する信号とを乗じて、振幅スペクトルの周波数fごとに減算処理後の振幅スペクトルSi(f)を算出する第1の抑圧部73と、高周波閾値周波数f1以上の周波数帯域について、平均抑圧係数GMと振幅スペクトルに該当する信号とを乗じて、振幅スペクトルの周波数fごとに減算処理後の振幅スペクトルSi(f)を算出する第2の抑圧部74と、を有する、ようにしている。 Then, the noise suppression circuit 7 according to the embodiment suppresses the noise component included in the signal corresponding to the amplitude spectrum including the amplitude component in the frequency spectrum of the signal to be processed, for each frequency f of the amplitude spectrum. The suppression coefficient calculation unit 71 that calculates the suppression coefficient Gi (f) of The average suppression coefficient calculation unit 72 for calculating the average suppression coefficient GM , which is the average value of the suppression coefficients Gi (f) for each frequency f of the amplitude spectrum in the range up to the maximum frequency f2, and the high frequency threshold frequency f1. First suppression unit 73 for calculating the subtraction-processed amplitude spectrum Si (f) for each frequency f of the amplitude spectrum by multiplying the suppression coefficient Gi (f) and the signal corresponding to the amplitude spectrum for the frequency band less than And, for the frequency band above the high frequency threshold frequency f1, the average suppression coefficient GM and the signal corresponding to the amplitude spectrum are multiplied to calculate the subtraction-processed amplitude spectrum Si (f) for each frequency f of the amplitude spectrum. It has 2 suppression portions 74 and.

ノイズ抑圧回路7は、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号から、音声区間検出・ノイズ更新部6から出力されるフレームごとの更新後のノイズスペクトルに該当する信号を減算するものであり、抑圧係数算出部71と、平均抑圧係数算出部72と、第1の抑圧部73と、第2の抑圧部74と、を有する。 The noise suppression circuit 7 is a signal corresponding to the updated noise spectrum for each frame output from the voice section detection / noise update unit 6 from the signal corresponding to the amplitude spectrum for each frame output from the conversion result output unit 5. It has a suppression coefficient calculation unit 71, an average suppression coefficient calculation unit 72, a first suppression unit 73, and a second suppression unit 74.

抑圧係数算出部71における処理の一例として、以下の数式3を使用することにより、周波数fごとに抑圧係数Gi(f)を算出することができる。

Figure 2022011892000004
As an example of the processing in the suppression coefficient calculation unit 71, the suppression coefficient Gi (f) can be calculated for each frequency f by using the following mathematical formula 3.
Figure 2022011892000004

数式3におけるXi(f)は、事前SNR(Signal to Noise Ratio)であり、以下の数式4に従って算出される。

Figure 2022011892000005
Xi (f) in the formula 3 is a prior SNR (Signal to Noise Ratio), and is calculated according to the following formula 4.
Figure 2022011892000005

数式4における変数はそれぞれ以下のとおりである。
Gi-1(f):時系列において現在の(別言すると、最新の)抑圧係数Gi(f)の更新の1フレーム前の抑圧係数である。なお、抑圧係数Gi(f)の初期値は例えば1に設定される。
Γi(f):事後SNRであり、以下の数式5に従って算出される。
Γi-1(f):時系列において現在の(別言すると、最新の)事後SNRΓi(f)の更新の1フレーム前の事後SNRである。
α:忘却係数とも呼ばれ、0≦α<1であり、例えば0.999程度の値に設定される。
max[ ]:[ ]内の複数の数値のうちの最大値を選択する演算子である。
The variables in Equation 4 are as follows.
Gi-1 (f): The suppression coefficient one frame before the update of the current (in other words, the latest) suppression coefficient Gi (f) in the time series. The initial value of the suppression coefficient Gi (f) is set to, for example, 1.
Γi (f): Subsequent SNR, calculated according to Equation 5 below.
Γi-1 (f): Current (in other words, latest) posterior SNR in time series The posterior SNR one frame before the update of Γi (f).
α: Also called a forgetting coefficient, 0 ≦ α <1, and is set to a value of, for example, about 0.999.
max []: An operator that selects the maximum value among multiple numerical values in [].

Figure 2022011892000006
Figure 2022011892000006

数式5における変数はそれぞれ以下のとおりである。
Yi(f):入力信号スペクトルとしての、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号である。
λDi(f):音声区間検出・ノイズ更新部6からフレームごとに出力される更新後のノイズスペクトルNi(f)の周波数ごとの分散(即ち、周波数方向の分散ではなく、時間方向/フレーム方向の分散)である。
The variables in Equation 5 are as follows.
Yi (f): A signal corresponding to the amplitude spectrum for each frame output from the conversion result output unit 5 as the input signal spectrum.
λDi (f): Dispersion of the updated noise spectrum Ni (f) output for each frame from the voice section detection / noise update unit 6 for each frequency (that is, not the dispersion in the frequency direction, but in the time direction / frame direction). Dispersion).

抑圧係数算出部71は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、抑圧係数Gi(f)を算出する。 The suppression coefficient calculation unit 71 calculates the suppression coefficient Gi (f) each time a signal corresponding to the amplitude spectrum for each frame is input.

平均抑圧係数算出部72は、抑圧係数算出部71によって算出される抑圧係数Gi(f)を用いて、以下の数式6に従って平均抑圧係数GMを算出する。平均抑圧係数GMは、すなわち、周波数f1からf2までの範囲についての、抑圧係数Gi(f)の周波数軸方向における平均値である。

Figure 2022011892000007
The average suppression coefficient calculation unit 72 calculates the average suppression coefficient GM according to the following equation 6 using the suppression coefficient Gi (f) calculated by the suppression coefficient calculation unit 71. The average suppression coefficient GM is, that is, the average value of the suppression coefficient Gi (f) in the frequency axis direction in the range of frequencies f1 to f2.
Figure 2022011892000007

数式6における、f1は高周波閾値周波数であり、f2は振幅スペクトルにおける最大の周波数であり(即ち、f1<f2である)、f1やf2は、具体的には、時間周波数変換部4での時間周波数変換における周波数(周波数ビン)の値である。また、Fnは、高周波閾値周波数f1から最大の周波数f2までの範囲における周波数(周波数ビン)の個数を表す。周波数の個数Fnは、すなわち、時間周波数変換部4での時間周波数変換における、周波数f1から周波数f2までの範囲における周波数(周波数ビン)の個数である。 In Equation 6, f1 is the high frequency threshold frequency, f2 is the maximum frequency in the amplitude spectrum (that is, f1 <f2), and f1 and f2 are specifically the times in the time-frequency conversion unit 4. It is a value of frequency (frequency bin) in frequency conversion. Further, Fn represents the number of frequencies (frequency bins) in the range from the high frequency threshold frequency f1 to the maximum frequency f2. The number of frequencies Fn is, that is, the number of frequencies (frequency bins) in the range from frequency f1 to frequency f2 in the time-frequency conversion in the time-frequency conversion unit 4.

高周波閾値周波数f1は、残留ノイズとして耳障りな雑音となる高周波成分とその他の成分とを区分する(言い換えると、振幅スペクトルの周波数の帯域を高周波帯域とその他周波帯域とに区分する)ための周波数値であり、特定の値に限定されるものではなく、特に耳障りな雑音となる高周波成分とその他の成分とを適切に区分する値(もしくは、区分すると考えられる値)に適宜設定される。高周波閾値周波数f1は、例えば、1.2~1.8kHz程度の範囲のうちのいずれかの値に設定されることが考えられ、特に1.5kHz程度に設定されることが考えられる。 The high frequency threshold frequency f1 is a frequency value for separating a high frequency component that becomes annoying noise as residual noise and other components (in other words, dividing the frequency band of the amplitude spectrum into a high frequency band and another frequency band). The value is not limited to a specific value, and is appropriately set to a value (or a value considered to be classified) that appropriately classifies the high frequency component and other components that cause particularly jarring noise. The high frequency threshold frequency f1 may be set to any value in the range of, for example, 1.2 to 1.8 kHz, and may be set to about 1.5 kHz in particular.

平均抑圧係数算出部72は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、抑圧係数算出部71によって算出される抑圧係数Gi(f)を用いて、平均抑圧係数GMを算出する。 The average suppression coefficient calculation unit 72 calculates the average suppression coefficient GM using the suppression coefficient Gi (f) calculated by the suppression coefficient calculation unit 71 each time a signal corresponding to the amplitude spectrum for each frame is input. do.

そのうえで、ノイズ抑圧回路7へと入力された振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに、前記周波数fの値に応じて下記の〈ア〉または〈イ〉の処理が行われる。 Then, the signal corresponding to the amplitude spectrum input to the noise suppression circuit 7 is set as the input signal spectrum Yi (f), and the following <a> or <b> is used for each frequency f according to the value of the frequency f. Processing is done.

〈ア〉高周波閾値周波数未満の周波数帯域について(即ち、f<f1)
第1の抑圧部73が、以下の数式7に従って、すなわち、抑圧係数Gi(f)と入力信号スペクトルYi(f)とを乗じることにより、減算処理後の振幅スペクトルSi(f)を算出する。

Figure 2022011892000008
<A> For frequency bands below the high frequency threshold frequency (that is, f <f1)
The first suppression unit 73 calculates the amplitude spectrum Si (f) after the subtraction process according to the following mathematical formula 7, that is, by multiplying the suppression coefficient Gi (f) and the input signal spectrum Yi (f).
Figure 2022011892000008

〈イ〉高周波閾値周波数以上の周波数帯域について(即ち、f≧f1)
第2の抑圧部74が、以下の数式8に従って、すなわち、平均抑圧係数GMと入力信号スペクトルYi(f)とを乗じることにより、減算処理後の振幅スペクトルSi(f)を算出する。

Figure 2022011892000009
<A> For frequency bands above the high frequency threshold frequency (that is, f ≧ f1)
The second suppression unit 74 calculates the amplitude spectrum Si (f) after the subtraction process according to the following formula 8, that is, by multiplying the average suppression coefficient GM by the input signal spectrum Yi (f).
Figure 2022011892000009

すなわち、振幅スペクトルのうちの高周波成分に対しては、抑圧係数Gi(f)の代わりに、抑圧係数Gi(f)の周波数軸方向における平均値である平均抑圧係数GMが用いられることにより、残留ノイズの耳につく高周波成分が適切に抑圧され、残留ノイズの耳障りの程度が低減する。 That is, for the high frequency component of the amplitude spectrum, the average suppression coefficient GM, which is the average value of the suppression coefficient Gi (f) in the frequency axis direction, is used instead of the suppression coefficient Gi (f). The high-frequency component of the residual noise attached to the ear is appropriately suppressed, and the degree of the residual noise that is offensive to the ear is reduced.

ノイズ抑圧回路7は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、減算処理後の、周波数fごとの振幅スペクトルSi(f)に該当する信号を出力する。 Each time the noise suppression circuit 7 receives an input of a signal corresponding to the amplitude spectrum for each frame, the noise suppression circuit 7 outputs a signal corresponding to the amplitude spectrum Si (f) for each frequency f after the subtraction process.

上記のようなノイズ抑圧回路7によれば、残留ノイズの耳につく高周波成分を適切に抑圧することができ、残留ノイズの耳障りの程度を低減させることが可能となる。 According to the noise suppression circuit 7 as described above, the high frequency component of the residual noise attached to the ear can be appropriately suppressed, and the degree of the residual noise that is offensive to the ear can be reduced.

以上、この発明の実施の形態について説明したが、具体的な構成は、上記の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。例えば、上記の実施の形態では図1に概略構成を示すノイズリダクション回路1に対してこの発明に係るノイズ抑圧回路7が適用される場合を例に挙げて説明しているが、この発明が適用され得るノイズリダクション回路の構成は図1に示す例には限定されない。さらに言えば、この発明が適用され得る回路は、ノイズリダクション回路には限定されない。すなわち、この発明は、雑音成分を抑圧することが必要とされる種々の回路に対して適用され得る。 Although the embodiment of the present invention has been described above, the specific configuration is not limited to the above-described embodiment, and even if there is a design change or the like within a range that does not deviate from the gist of the present invention. Included in the invention. For example, in the above embodiment, the case where the noise suppression circuit 7 according to the present invention is applied to the noise reduction circuit 1 whose schematic configuration is shown in FIG. 1 is described as an example, but the present invention is applied. The possible configuration of the noise reduction circuit is not limited to the example shown in FIG. Furthermore, the circuits to which the present invention can be applied are not limited to noise reduction circuits. That is, the present invention can be applied to various circuits in which noise components are required to be suppressed.

また、この発明の要点は入力信号スペクトルとしての振幅スペクトルに該当する信号に含まれる雑音成分を抑圧する際に高周波閾値周波数未満の周波数帯域については抑圧係数と入力信号スペクトルとを乗じる一方で高周波閾値周波数以上の周波数帯域については前記抑圧係数の周波数軸方向における平均値と入力信号スペクトルとを乗じるようにする点であり、抑圧係数の算出の仕法は、上記の実施の形態における手順・手法に限定されるものではなく、周波数fごとの抑圧係数が算出される手順や手法であればどのようなものであってもよい。 Further, the main point of the present invention is to multiply the suppression coefficient and the input signal spectrum for the frequency band below the high frequency threshold frequency when suppressing the noise component contained in the signal corresponding to the amplitude spectrum as the input signal spectrum, while the high frequency threshold. For the frequency band above the frequency, the average value of the suppression coefficient in the frequency axis direction is multiplied by the input signal spectrum, and the method for calculating the suppression coefficient is limited to the procedure / method in the above embodiment. Any procedure or method may be used as long as the suppression coefficient for each frequency f is calculated.

1 ノイズリダクション回路
2 プリエンファシス回路
3 窓処理部
4 時間周波数変換部
5 変換結果出力部
6 音声区間検出・ノイズ更新部
7 ノイズ抑圧回路
71 抑圧係数算出部
72 平均抑圧係数算出部
73 第1の抑圧部
74 第2の抑圧部
8 合成部
9 周波数時間変換部
10 ディエンファシス回路
1 Noise reduction circuit 2 Pre-emphasis circuit 3 Window processing unit 4 Time frequency conversion unit 5 Conversion result output unit 6 Voice section detection / noise update unit 7 Noise suppression circuit 71 Suppression coefficient calculation unit 72 Average suppression coefficient calculation unit 73 First suppression Part 74 Second suppression part 8 Synthesis part 9 Frequency time conversion part 10 De-emphasis circuit

Claims (2)

処理対象の信号の周波数スペクトルのうちの振幅成分を含む振幅スペクトルに該当する信号に含まれる雑音成分を抑圧するための、前記振幅スペクトルの周波数ごとの抑圧係数を算出する抑圧係数算出部と、
前記振幅スペクトルの前記周波数の帯域を高周波帯域とその他の周波帯域とに区分する周波数である高周波閾値周波数から前記振幅スペクトルの前記周波数のうちの最大の周波数までの範囲についての、前記振幅スペクトルの前記周波数ごとの前記抑圧係数の平均値である平均抑圧係数を算出する平均抑圧係数算出部と、
前記高周波閾値周波数未満の周波数帯域について、前記抑圧係数と前記振幅スペクトルに該当する信号とを乗じて、前記振幅スペクトルの前記周波数ごとに減算処理後の振幅スペクトルを算出する第1の抑圧部と、
前記高周波閾値周波数以上の周波数帯域について、前記平均抑圧係数と前記振幅スペクトルに該当する信号とを乗じて、前記振幅スペクトルの前記周波数ごとに減算処理後の振幅スペクトルを算出する第2の抑圧部と、を有する、
ことを特徴とするノイズ抑圧回路。
A suppression coefficient calculation unit for calculating the suppression coefficient for each frequency of the amplitude spectrum for suppressing the noise component contained in the signal corresponding to the amplitude spectrum including the amplitude component of the frequency spectrum of the signal to be processed, and the suppression coefficient calculation unit.
The frequency of the amplitude spectrum is the range from the high frequency threshold frequency, which is a frequency that divides the frequency band of the amplitude spectrum into a high frequency band and other frequency bands, to the maximum frequency of the frequencies of the amplitude spectrum. An average suppression coefficient calculation unit that calculates the average suppression coefficient, which is the average value of the suppression coefficients for each frequency,
A first suppression unit that calculates the amplitude spectrum after subtraction processing for each frequency of the amplitude spectrum by multiplying the suppression coefficient and the signal corresponding to the amplitude spectrum for the frequency band lower than the high frequency threshold frequency.
With respect to the frequency band above the high frequency threshold frequency, a second suppression unit that calculates the amplitude spectrum after subtraction processing for each frequency of the amplitude spectrum by multiplying the average suppression coefficient and the signal corresponding to the amplitude spectrum. , Have,
A noise suppression circuit characterized by this.
前記高周波閾値周波数が、1.2~1.8kHzの範囲のうちのいずれかの値である、
ことを特徴とする請求項1に記載のノイズ抑圧回路。
The high frequency threshold frequency is any value in the range of 1.2 to 1.8 kHz.
The noise suppression circuit according to claim 1.
JP2020113300A 2020-06-30 2020-06-30 Noise suppression circuit Pending JP2022011892A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020113300A JP2022011892A (en) 2020-06-30 2020-06-30 Noise suppression circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020113300A JP2022011892A (en) 2020-06-30 2020-06-30 Noise suppression circuit

Publications (1)

Publication Number Publication Date
JP2022011892A true JP2022011892A (en) 2022-01-17

Family

ID=80149090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020113300A Pending JP2022011892A (en) 2020-06-30 2020-06-30 Noise suppression circuit

Country Status (1)

Country Link
JP (1) JP2022011892A (en)

Similar Documents

Publication Publication Date Title
RU2127454C1 (en) Method for noise suppression
JP3454190B2 (en) Noise suppression apparatus and method
JP3568922B2 (en) Echo processing device
JP3574123B2 (en) Noise suppression device
JP3457293B2 (en) Noise suppression device and noise suppression method
RU2121719C1 (en) Method and device for noise reduction in voice signal
JP3454206B2 (en) Noise suppression device and noise suppression method
KR100860805B1 (en) Voice enhancement system
KR100927897B1 (en) Noise suppression method and apparatus, and computer program
JP4567655B2 (en) Method and apparatus for suppressing background noise in audio signals, and corresponding apparatus with echo cancellation
EP1806739B1 (en) Noise suppressor
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
US8538052B2 (en) Generation of probe noise in a feedback cancellation system
US20010005822A1 (en) Noise suppression apparatus realized by linear prediction analyzing circuit
US9454956B2 (en) Sound processing device
JP2002541753A (en) Signal Noise Reduction by Time Domain Spectral Subtraction Using Fixed Filter
JP2002519719A (en) Noise suppressor including weighted gain smoothing means
JP2004341339A (en) Noise restriction device
CN106941006B (en) Method, apparatus and system for separation and bass enhancement of audio signals
JP2003140700A (en) Method and device for noise removal
JP4395772B2 (en) Noise removal method and apparatus
JPH11265199A (en) Voice transmitter
JP2007310298A (en) Out-of-band signal creation apparatus and frequency band spreading apparatus
JP2022011892A (en) Noise suppression circuit
JP2002140100A (en) Noise suppressing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230627