JP2022011890A - Noise update circuit - Google Patents
Noise update circuit Download PDFInfo
- Publication number
- JP2022011890A JP2022011890A JP2020113298A JP2020113298A JP2022011890A JP 2022011890 A JP2022011890 A JP 2022011890A JP 2020113298 A JP2020113298 A JP 2020113298A JP 2020113298 A JP2020113298 A JP 2020113298A JP 2022011890 A JP2022011890 A JP 2022011890A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- noise
- frame
- update
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
この発明は、ノイズ更新回路に関し、例えば、高周波信号を送受信する無線機に組み込まれるノイズリダクション回路に用いられ得るノイズ更新回路に関する。 The present invention relates to a noise update circuit, for example, a noise update circuit that can be used in a noise reduction circuit incorporated in a radio that transmits and receives high frequency signals.
音声信号に含まれる雑音成分を抑圧する手法としてスペクトル減算法(Spectral Subtraction)が知られている(例えば、特許文献1、非特許文献1参照)。
A spectral subtraction method is known as a method for suppressing a noise component contained in an audio signal (see, for example,
ところで、スペクトル減算法を適切に適用するためには、ノイズ成分を的確に推定して入力される音声信号から減算することが重要である。 By the way, in order to properly apply the spectral subtraction method, it is important to accurately estimate the noise component and subtract it from the input audio signal.
そこでこの発明は、ノイズ成分を的確に推定することが可能な、ノイズ更新回路を提供することを目的とする。 Therefore, an object of the present invention is to provide a noise update circuit capable of accurately estimating a noise component.
上記課題を解決するために、請求項1に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間が、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。
In order to solve the above problem, in the invention according to
請求項2に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。 According to the second aspect of the present invention, when the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f) for each frequency f. The first update unit that calculates the updated noise spectrum Ni (f) by processing including averaging (however, i: the number of orders representing the time series order), and the frame to be processed is a frame containing an audio component. In the case where the frame includes a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging, and the frame includes the voice component, the update is performed. An average of the input signal spectrum Yi (f), the past input signal spectrum Yi-j (f), and the past noise spectrum Ni-k (f) when calculating the later noise spectrum Ni (f). (However, j: an integer of 1 or more representing the degree of deviation from the order number i in the time series, k: an integer of 1 or more representing the degree of deviation from the order number i in the time series), said. The input signal spectrum Yi (f), the past input signal spectrum Yi-j (f), and the past when calculating the updated noise spectrum Ni (f) in the case of a frame containing only noise components. It is a noise update circuit characterized in that it is longer than the average averaging time using the noise spectrum Ni-k (f).
請求項3に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。 According to the third aspect of the present invention, when the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f) for each frequency f. The first update unit that calculates the updated noise spectrum Ni (f) by processing including averaging (however, i: the number of orders representing the time-series order), and the frame to be processed is a frame containing an audio component. In the case where the frame includes a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging, and the frame includes the voice component, the update is performed. The average averaging time using the input signal spectrum Yi (f) and the past noise spectrum Ni-k (f) when calculating the later noise spectrum Ni (f) (however, k: time series). The input signal spectrum Yi (f) when calculating the updated noise spectrum Ni (f) in the case of a frame containing only the noise component (an integer of 1 or more representing the degree of deviation from the order number i in ) And the past noise spectrum Ni-k (f), which is longer than the average averaging time.
請求項4に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間よりも長い、ことを特徴とするノイズ更新回路である。 According to the fourth aspect of the present invention, when the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f) for each frequency f. The first update unit that calculates the updated noise spectrum Ni (f) by processing including averaging (however, i: the number of orders representing the time-series order), and the frame to be processed is a frame containing an audio component. In the case where the frame includes a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging, and the frame includes the voice component, the update is performed. The average averaging time using the input signal spectrum Yi (f) and the past input signal spectrum Yi-j (f) when calculating the later noise spectrum Ni (f) (however, j: hour). An integer of 1 or more representing the degree of deviation from the order number i in the series), the input signal spectrum Yi (in the case of a frame containing only the noise component) when calculating the updated noise spectrum Ni (f). It is a noise update circuit characterized in that it is longer than the average averaging time using f) and the past input signal spectrum Yi-j (f).
請求項5に記載の発明は、請求項1から4のうちのいずれか1項に記載のノイズ更新回路おいて、前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の前記平均化時間が、1~10秒の範囲のうちのいずれかの値である、ことを特徴とする。
The invention according to
請求項6に記載の発明は、処理対象のフレームがノイズ成分のみのフレームである場合に、前記処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIRフィルタである以下の数式1もしくはFIRフィルタである以下の数式2に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する第1の更新部と(但し、Ni-1(f):更新の1フレーム前のノイズスペクトル、Yi-j(f):更新のjフレーム前の入力信号スペクトル、Kn:処理対象のフレームがノイズ成分のみのフレームである場合のYi(f)に対するNi-1(f)の重みづけを決定づける定数、i:時系列の順序を表す順序数、j:時系列における順序数iとの隔たりの程度を表す0以上の整数)、
請求項7に記載の発明は、請求項6に記載のノイズ更新回路において、前記定数Ksが、IIRフィルタの時定数もしくはFIRフィルタの平均区間の1~10秒に相当する範囲のうちのいずれかの値に設定される、ことを特徴とする。
In the invention according to
請求項8に記載の発明は、請求項1から7のうちのいずれか1項に記載のノイズ更新回路において、前記入力信号スペクトルYi(f)について、以下の数式5に従って平均スペクトルレベルMを算出する平均値算出部と(但し、f1:振幅スペクトルにおける最小の周波数、f2:振幅スペクトルにおける最大の周波数、Fn:最小の周波数f1から最大の周波数f2までの範囲における周波数の個数)、
請求項9に記載の発明は、請求項8に記載のノイズ更新回路において、前記係数Teが、1~100の範囲のうちのいずれかの値に設定される、ことを特徴とする。
The invention according to
請求項1ないし請求項4に記載の発明によれば、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、処理対象のフレームがノイズ成分のみのフレームである場合にはノイズスペクトルを更新する一方で音声成分を含むフレームである場合にはノイズスペクトルを更新しないようにしているので、処理対象のフレームとして音声成分を含むフレームが続くとノイズスペクトルが更新されないためにノイズの変動に的確に追従することができず、結果的にノイズ成分を的確に推定することができない、という問題がある。これに対して、請求項1ないし請求項4に記載の発明では、処理対象のフレームが音声成分を含むフレームである場合もノイズスペクトルを更新するようにしているので、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。 According to the first to fourth aspects of the invention, it is possible to follow the fluctuation of noise even when a frame containing an audio component continues as a frame to be processed, and the noise component can be accurately estimated. It becomes possible. Specifically, in the conventional circuit that realizes the spectrum subtraction method, the noise spectrum is updated when the frame to be processed is a frame containing only a noise component, while the noise spectrum is updated when the frame contains a voice component. Since the noise spectrum is not updated when a frame containing an audio component continues as a frame to be processed, it is not possible to accurately follow the noise fluctuation, and as a result, the noise component is accurately updated. There is a problem that it cannot be estimated. On the other hand, in the invention according to claim 1 to 4, the noise spectrum is updated even when the frame to be processed is a frame containing an audio component, so that the audio component is used as the frame to be processed. Even when the frame containing the noise continues, it is possible to follow the fluctuation of the noise, and it is possible to accurately estimate the noise component.
請求項5に記載の発明によれば、処理対象のフレームが音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の平均化時間が適切な値に設定されるので、処理対象のフレームとして音声成分を含むフレームが続いた場合におけるノイズの変動に一層確実に追従することができ、ノイズ成分を一層確実に的確に推定することが可能となる。 According to the fifth aspect of the present invention, when the frame to be processed is a frame containing an audio component, the averaging time for calculating the updated noise spectrum Ni (f) is set to an appropriate value. Therefore, it is possible to more reliably follow the fluctuation of noise when a frame containing an audio component continues as the frame to be processed, and it is possible to estimate the noise component more reliably and accurately.
請求項6に記載の発明によれば、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、処理対象のフレームがノイズ成分のみのフレームである場合にはノイズスペクトルを更新する一方で音声成分を含むフレームである場合にはノイズスペクトルを更新しないようにしているので、処理対象のフレームとして音声成分を含むフレームが続くとノイズスペクトルが更新されないためにノイズの変動に的確に追従することができず、結果的にノイズ成分を的確に推定することができない、という問題がある。これに対して、請求項6に記載の発明では、処理対象のフレームが音声成分を含むフレームである場合もノイズスペクトルを更新するようにしているので、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。
According to the invention of
請求項7に記載の発明によれば、処理対象のフレームが音声成分を含むフレームである場合の入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数Ksが適切な値に設定されるので、処理対象のフレームとして音声成分を含むフレームが続いた場合におけるノイズの変動に一層確実に追従することができ、ノイズ成分を一層確実に的確に推定することが可能となる。
According to the invention of
請求項8に記載の発明によれば、トーン信号を抑圧しないようすることが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、周波数スペクトルにおいて定常的に存在する成分をノイズと判断して抑圧するようにしているので、トーン信号も定常性があるためにノイズと判断されて抑圧の対象になり、ユーザにとって必要なトーン信号(例えば、モールス信号)も抑圧されてしまう、という問題がある。これに対して、請求項8に記載の発明では、平均スペクトルレベルよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から除外するようにしているので、トーン信号を抑圧しないようにすることが可能となる。
According to the invention of
請求項9に記載の発明によれば、係数Teが適切な値に設定されるので、平均スペクトルレベルよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から一層確実に除外することができ、トーン信号を一層確実に抑圧しないようすることが可能となる。
According to the invention of
以下、この発明を図示の実施の形態に基づいて説明する。 Hereinafter, the present invention will be described based on the illustrated embodiment.
(実施の形態1)
図1は、この発明の実施の形態に係るノイズ更新回路11を含むノイズリダクション回路1の概略構成を示す機能ブロック図である。図2は、実施の形態1に係るノイズ更新回路11の概略構成を示す機能ブロック図である。
(Embodiment 1)
FIG. 1 is a functional block diagram showing a schematic configuration of a
ノイズリダクション回路1は、例えば、高周波信号を送受信する無線機に組み込まれて、音声信号に含まれる雑音成分を抑圧する手法であるスペクトル減算法(Spectral Subtraction)を実現する回路であり、主として、プリエンファシス回路2と、窓処理部3と、時間周波数変換部4と、変換結果出力部5と、減算部6と、合成部7と、周波数時間変換部8と、ディエンファシス回路9と、音声区間検出部10と、ノイズ更新回路11と、を有する。
The
プリエンファシス(Pre-Emphasis:PE)回路2は、アンテナから受信した高周波信号を復調した音声信号に対して高周波成分の相対強度を予め増幅する高域強調処理を施して、高域強調処理後の信号を出力する。
The pre-emphasis (PE)
窓処理部3は、プリエンファシス回路2から出力される高域強調処理後の信号の入力を受け、入力された前記信号から所定の時間長さのフレームを抽出する(例えば、12.5msごとに25ms分の時間波形を抽出する)とともに、各フレームに対して例えばハニング窓などの窓関数を乗じて窓処理を施す。窓処理部3は、各フレームに対して窓処理を施すたびに、窓処理後のフレームを出力する。
The
時間周波数変換部4は、窓処理部3から出力される窓処理後のフレームの入力を受け、前記フレームの入力を受けるたびに、前記フレームに対して時間領域の信号から周波数領域の信号への変換処理を施し、複数の周波数それぞれについての振幅成分と位相成分とを含む周波数スペクトルを計算して、実数と虚数との周波数スペクトルの信号を出力する。時間周波数変換部4は、例えば離散フーリエ変換(Discrete Fourier Transform)や高速フーリエ変換(Fast Fourier Transform)により、時間周波数変換を実行して周波数スペクトルを計算する。
The time-
変換結果出力部5は、時間周波数変換部4から出力されるフレームごとの(例えば、12.5ms程度の間隔で)周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルのうちの各周波数の振幅成分を含む振幅スペクトルに該当する信号を減算部6に対して出力するとともに、入力された前記周波数スペクトルのうちの各周波数の位相成分を含む位相スペクトルに該当する信号を合成部7に対して出力する。
The conversion
減算部6は、変換結果出力部5から出力されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、ノイズ更新回路11から出力されるフレームごとの更新後のノイズスペクトルに該当する信号の入力を受け、各フレームについて、入力された前記振幅スペクトルに該当する信号から、周波数ごとに(別言すると、スペクトルごとに)、入力された前記更新後のノイズスペクトルに該当する信号を減算する。これにより、音声信号に含まれる雑音成分が抑圧される。減算部6は、変換結果出力部5から出力されるフレームごとに、減算処理後の振幅スペクトルに該当する信号を出力する。
The
合成部7は、変換結果出力部5から出力されるフレームごとの位相スペクトルに該当する信号の入力を受けるとともに、減算部6から出力されるフレームごとの減算処理後の振幅スペクトルに該当する信号の入力を受け、フレームごとに、入力された前記位相スペクトルに該当する信号と前記振幅スペクトルに該当する信号とを合成して周波数スペクトルを生成して、実数と虚数との周波数スペクトルの信号を出力する。
The synthesizing
周波数時間変換部8は、合成部7から出力されるフレームごとの周波数スペクトルの信号の入力を受け、フレームごとに、入力された前記周波数スペクトルの信号に対して周波数領域の信号から時間領域の信号への変換処理、すなわち時間周波数変換部4における変換処理の逆変換処理を施して、音声信号を出力する。周波数時間変換部8は、例えば逆離散フーリエ変換や逆高速フーリエ変換により、周波数時間変換を実行して音声信号を生成する。
The frequency-
ディエンファシス(De-Emphasis:DE)回路9は、周波数時間変換部8から出力される音声信号の入力を受け、入力された前記音声信号に対して高周波成分の相対強度を減衰させる高域減衰処理、すなわちプリエンファシス回路2の逆フィルタによる減衰処理を施して、高域減衰処理後の音声信号を出力する。
The De-Emphasis (DE)
音声区間検出部10は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受け、フレームごとに、入力された前記振幅スペクトルに該当する信号について、ノイズ成分のみのフレームであるのか、音声成分を含むフレームであるのか、の判定を行う。
The voice
音声区間検出部10における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法は、特定の手順や手法に限定されるものではなく、従来もしくは新規の手順や手法の中から適当な手順や手法が適宜選択され得る。
The method of determining whether the frame to be processed contains only a noise component or a voice component in the voice
音声区間検出部10における、処理対象のフレームがノイズ成分のみであるのか音声成分を含むのかの判定の仕法として、例えば、音声の非恒常性に着目して、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が直近のフレームにおいて複数回(例えば、3~5回程度)連続して所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記以外のときは処理対象のフレームには音声成分があると判定する手法、あるいは、振幅スペクトルの周波数別の振幅の大きさに関する平均や分散の値が所定の閾値未満であるときは処理対象のフレームはノイズ成分のみであると判定し、前記平均や分散の値が前記閾値以上であるときは処理対象のフレームには音声成分があると判定する手法などが用いられ得る。
As a method of determining whether the frame to be processed contains only a noise component or a voice component in the voice
音声区間検出部10は、処理対象のフレームはノイズ成分のみであると判定した場合にはノイズフレーム信号を出力し、また、処理対象のフレームには音声成分があると判定した場合には音声フレーム信号を出力する。音声区間検出部10は、フレームごとに、音声区間検出結果としてノイズフレーム信号または音声フレーム信号を出力する。
The voice
そして、実施の形態に係るノイズ更新回路11は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部と(但し、i:時系列の順序を表す順序数)、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)の平均化時間よりも長い、ようにしている。
Then, in the
ノイズ更新回路11は、過去に計算された周波数ごとの雑音成分を表すノイズスペクトルに、現フレーム(別言すると、処理対象のフレーム、最新のフレーム)の振幅スペクトルを加味することにより、最新のノイズスペクトルに更新するものであり、第1の更新部111と、第2の更新部112と、を有する。
The
ノイズ更新回路11は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、音声区間検出部10から出力されるフレームごとの音声区間検出結果の入力を受け、入力された前記振幅スペクトルに該当する信号を用いて、周波数fごとに、更新の1フレーム前のノイズスペクトルNi-1(f)を更新するものとして、更新後のノイズスペクトルNi(f)を、入力された前記音声区間検出結果の内容に応じて下記の数式7もしくは数式8または数式9もしくは数式10に従って算出する。なお、以降の数式における添字iは、時系列の順序を表す順序数であり、すべての数式に共通して適用される順序を表す。また、以降の数式における添字jは、時系列における順序数iとの隔たりの程度を表す変数であり、0以上の整数である。
The
ノイズ更新回路11へと入力された前記音声区間検出結果がノイズフレーム信号である場合には、第1の更新部111が、入力された前記振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIR(Infinite Impulse Response の略;無限インパルス応答)フィルタである以下の数式7もしくはFIR(Finite Impulse Response の略;有限インパルス応答)フィルタである以下の数式8に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する。なお、以降の数式における、Ni-1(f)は更新の1フレーム前のノイズスペクトルを表し、Yi-j(f)は更新のjフレーム前の入力信号スペクトルを表す。
数式7や数式8におけるKnは、処理対象のフレーム(別言すると、現フレーム、最新のフレーム)がノイズ成分のみのフレームである場合の、前記処理対象のフレームの振幅スペクトルである入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数であり、「ノイズ時更新前重み定数Kn」と呼ぶ。
Kn in
ノイズ時更新前重み定数Knは、0以上の整数であれば特定の値には限定されない。ノイズ時更新前重み定数Knは、具体的には例えば、IIRフィルタの時定数もしくはFIRフィルタの平均区間の0.06~0.20秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてKn=5~16程度の範囲)のうちのいずれかの値に設定されることが考えられ、特にIIRフィルタの時定数もしくはFIRフィルタの平均区間の0.1秒程度に相当する値(例えば、フレーム間隔12.5msにおいてKn=8程度)に設定されることが考えられる。なお、IIRフィルタの時定数もしくはFIRフィルタの平均区間を例えば0.1秒としたとき、数式7における定数Knの具体的な値と数式8における定数Knの具体的な値とは異なる。
The weight constant Kn before update at the time of noise is not limited to a specific value as long as it is an integer of 0 or more. Specifically, the weight constant Kn before updating during noise is Kn in a range corresponding to, for example, the time constant of the IIR filter or the average interval of the FIR filter of about 0.06 to 0.20 seconds (for example, at a frame interval of 12.5 ms). It is conceivable that it is set to any value in the range of about 5 to 16), and in particular, a value corresponding to about 0.1 seconds of the time constant of the IIR filter or the average interval of the FIR filter (for example, frame). It is conceivable that Kn = 8) is set at an interval of 12.5 ms. When the time constant of the IIR filter or the average interval of the FIR filter is, for example, 0.1 seconds, the specific value of the constant Kn in
ノイズ更新回路11へと入力された前記音声区間検出結果が音声フレーム信号である場合には、第2の更新部112が、入力された前記振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、IIRフィルタである以下の数式9もしくはFIRフィルタである以下の数式10に従って周波数fごとに更新後のノイズスペクトルNi(f)を算出する。
数式9や数式10におけるKsは、処理対象のフレーム(別言すると、現フレーム、最新のフレーム)が音声成分を含むフレームである場合の、前記処理対象のフレームの振幅スペクトルである入力信号スペクトルYi(f)に対する更新の1フレーム前のノイズスペクトルNi-1(f)の重みづけを決定づける定数であり、「音声時更新前重み定数Ks」と呼ぶ。
Ks in
音声時更新前重み定数Ksは、ノイズ時更新前重み定数Knよりも大きく、好ましくは十分に大きい整数であれば、特定の値には限定されない。音声時更新前重み定数Ksは、具体的には例えば、IIRフィルタの時定数もしくはFIRフィルタの平均区間の1~10秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてKs=80~800程度の範囲)のうちのいずれかの値、さらに特定するとIIRフィルタの時定数もしくはFIRフィルタの平均区間の1~6秒程度に相当する範囲(例えば、フレーム間隔12.5msにおいてKs=80~500程度の範囲)のうちのいずれかの値に設定されることが考えられ、特にIIRフィルタの時定数もしくはFIRフィルタの平均区間の3.7秒程度に相当する値(例えば、フレーム間隔12.5msにおいてKs=295程度)に設定されることが考えられる。なお、IIRフィルタの時定数もしくはFIRフィルタの平均区間を例えば3.7秒としたとき、数式9における定数Ksの具体的な値と数式10における定数Ksの具体的な値とは異なる。
The weight constant Ks before update during voice is not limited to a specific value as long as it is an integer larger than the weight constant Kn before update during noise, preferably sufficiently large. Specifically, the weight constant Ks before update during voice is, for example, a range corresponding to about 1 to 10 seconds of the time constant of the IIR filter or the average interval of the FIR filter (for example, Ks = 80 to 800 at a frame interval of 12.5 ms). Any value in the range of degrees), more specifically, the time constant of the IIR filter or the range corresponding to about 1 to 6 seconds of the average interval of the FIR filter (for example, Ks = 80 to 500 at a frame interval of 12.5 ms). It is conceivable that it is set to any value within the range of degree), and in particular, a value corresponding to about 3.7 seconds of the time constant of the IIR filter or the average interval of the FIR filter (for example, the frame interval of 12.5 ms). It is conceivable that Ks = about 295). When the time constant of the IIR filter or the average interval of the FIR filter is, for example, 3.7 seconds, the specific value of the constant Ks in
音声時更新前重み定数Ksが十分に大きい値に設定されることにより、音声には非恒常性があるため、ノイズスペクトルの更新において音声成分が大きく反映されることが回避され、したがって、音声成分が雑音成分として抑圧されることがない。 By setting the pre-update weighting constant Ks to a sufficiently large value during audio, the audio has non-homeostasis, which prevents the audio component from being significantly reflected in the noise spectrum update, and therefore the audio component. Is not suppressed as a noise component.
なお、更新後のノイズスペクトルNi(f)を算出するための平均化処理として、IIRフィルタ(一般形は Ni(f)=ΣAjYi-j(f)+ΣBkNi-k(f);但し、A,Bは係数、iは時系列の順序を表す順序数、jは時系列における順序数iとの隔たりの程度を表す0以上の整数、kは時系列における順序数iとの隔たりの程度を表す1以上の整数)を用いる場合は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部112と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、場合に該当する。
As an averaging process for calculating the updated noise spectrum Ni (f), an IIR filter (general form is Ni (f) = ΣAjYi-j (f) + ΣBkNi-k (f); however, A and B Is a coefficient, i is an order number representing the order of the time series, j is an integer of 0 or more representing the degree of deviation from the order number i in the time series, and k is 1 indicating the degree of deviation from the order number i in the time series. When the above integer) is used, when the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is used as the input signal spectrum Yi (f) and updated for each frequency f. The
また、上記のIIRフィルタの一般形についてj≧1においてAj=0としたIIRフィルタを用いる場合は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部112と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、場合に該当する。
Further, when using the IIR filter in which Aj = 0 in j ≧ 1 for the general form of the above IIR filter, it corresponds to the amplitude spectrum of the frame to be processed when the frame to be processed is a frame containing only noise components. The signal to be processed is the input signal spectrum Yi (f), and the
なお、上記のIIRフィルタの一般形についてj≧1においてAj=0としたうえで、A0=1/(1+Kn),B1=Kn/(1+Kn),且つBk=0(k≧2)である場合が上記の数式7に該当し、A0=1/(1+Ks),B1=Ks/(1+Ks),且つBk=0(k≧2)である場合が上記の数式9に該当する。
Regarding the general form of the above IIR filter, when Aj = 0 in j ≧ 1, A0 = 1 / (1 + Kn), B1 = Kn / (1 + Kn), and Bk = 0 (k ≧ 2). Corresponds to the
さらに、更新後のノイズスペクトルNi(f)を算出するための平均化処理として、FIRフィルタ(一般形は Ni(f)=ΣAjYi-j(f);但し、Aは係数、iは時系列の順序を表す順序数、jは時系列における順序数iとの隔たりの程度を表す0以上の整数;即ち、上記のIIRフィルタの一般形についてBk=0としたもの)を用いる場合は、処理対象のフレームがノイズ成分のみのフレームである場合に、処理対象のフレームの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第1の更新部111と、処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部112と、を有し、音声成分を含むフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間が、ノイズ成分のみのフレームである場合に更新後のノイズスペクトルNi(f)を算出する際の、入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間よりも長い、場合に該当する。
Further, as an averaging process for calculating the updated noise spectrum Ni (f), an FIR filter (general form is Ni (f) = ΣAjYi-j (f); where A is a coefficient and i is a time series. When using an order number indicating the order, j is an integer of 0 or more indicating the degree of deviation from the order number i in the time series; that is, Bk = 0 for the general form of the above IIR filter), the processing target is used. When the frame of is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f), and the updated noise spectrum Ni (f) is averaged for each frequency f. When the frame to be processed is a frame containing an audio component, the
なお、上記のFIRフィルタの一般形について、Aj=1/Knである場合が上記の数式8に該当し、Aj=1/Ksである場合が上記の数式10に該当する。
Regarding the general form of the above FIR filter, the case where Aj = 1 / Kn corresponds to the
ノイズ更新回路11は、フレームごとの振幅スペクトルに該当する信号および音声区間検出結果の入力を受けるたびに、更新後の、周波数fごとのノイズスペクトルNi(f)に該当する信号を減算部6に対して出力する。減算部6は、フレームごとに、ノイズ更新回路11から出力される前記更新後のノイズスペクトルNi(f)に該当する信号を用いて、変換結果出力部5から出力される振幅スペクトルに該当する信号から前記更新後のノイズスペクトルNi(f)に該当する信号を減算する処理を行う。
Each time the
上記のようなノイズ更新回路11によれば、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、処理対象のフレームがノイズ成分のみのフレームである場合にはノイズスペクトルを更新する一方で音声成分を含むフレームである場合にはノイズスペクトルを更新しないようにしているので、処理対象のフレームとして音声成分を含むフレームが続くとノイズスペクトルが更新されないためにノイズの変動に的確に追従することができず、結果的にノイズ成分を的確に推定することができない、という問題がある。これに対して、上記のようなノイズ更新回路11では、処理対象のフレームが音声成分を含むフレームである場合もノイズスペクトルを更新するようにしているので、処理対象のフレームとして音声成分を含むフレームが続いた場合であってもノイズの変動に追従することができ、ノイズ成分を的確に推定することが可能となる。
According to the
(実施の形態2)
図3は、この発明の実施の形態2に係るノイズ更新回路11の概略構成を示す機能ブロック図である。
(Embodiment 2)
FIG. 3 is a functional block diagram showing a schematic configuration of the
この実施の形態ではノイズ更新回路11が上記の実施の形態1の構成と比べて追加の構成を有する点で実施の形態1と異なる一方で、共通する構成や処理の内容もあり、実施の形態1と同等の構成や処理の内容については同一符号を付することでその説明を省略する。
This embodiment is different from the first embodiment in that the
この実施の形態に係るノイズ更新回路11は、入力信号スペクトルYi(f)について平均スペクトルレベルMを算出する平均値算出部113と、入力信号スペクトルYi(f)と平均スペクトルレベルMとに関して Yi(f)≧Te×M である周波数fについて更新後のノイズスペクトルNi(f)を決定する第3の更新部114と、をさらに有する、ようにしている。
The
ノイズ更新回路11は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号の入力を受けるとともに、音声区間検出部10から出力されるフレームごとの音声区間検出結果の入力を受け、入力された前記振幅スペクトルに該当する信号を用いて、周波数fごとに、更新の1フレーム前のノイズスペクトルNi-1(f)を更新するものとして、更新後のノイズスペクトルNi(f)を、入力された前記音声区間検出結果の内容などに応じて上記の数式7もしくは数式8、数式9もしくは数式10、ならびに数式12のうちのいずれかに従って算出する。
The
平均値算出部113は、変換結果出力部5から出力されて分岐されるフレームごとの振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、以下の数式11に従って平均スペクトルレベルMを算出する。平均スペクトルレベルMは、すなわち、振幅スペクトルの周波数軸方向における平均値である。
数式11における、fは振幅スペクトルにおける周波数を表し、f1は振幅スペクトルにおける最小の周波数であり、f2は振幅スペクトルにおける最大の周波数であり、さらに、Fnは最小の周波数f1から最大の周波数f2までの範囲における周波数の個数を表す。周波数の個数Fnは、すなわち、時間周波数変換部4での時間周波数変換において1フレームに含まれるサンプル点数をnとすると、n/2+1である。
In
平均値算出部113は、フレームごとの振幅スペクトルに該当する信号の入力を受けるたびに、平均スペクトルレベルMを算出する。
The mean
そのうえで、ノイズ更新回路11へと入力された音声区間検出結果がノイズフレーム信号である場合には、入力された振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに、前記入力信号スペクトルYi(f)と平均スペクトルレベルMとの間の関係に応じて下記の〈ア〉または〈イ〉の処理が行われる。
Then, when the voice section detection result input to the
〈ア〉Yi(f)<Te×M である周波数fについて
第1の更新部111が、上記の数式7もしくは数式8に従って更新後のノイズスペクトルNi(f)を算出する。
<A> For the frequency f where Yi (f) <Te × M, the
入力信号スペクトルYi(f)と平均スペクトルレベルMとの間の関係におけるTeは、平均スペクトルレベルMよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から除外するための係数である。係数Teは、特定の値に限定されるものではなく、例えばトーン信号に相当する周波数成分がノイズスペクトルの更新から除外されるようにしてトーン信号が減算部6で減算されず雑音成分として抑圧されないようにすることが考慮されるなどしたうえで、適当な値に適宜設定される。係数Teは、具体的には、1~100程度の範囲のうちのいずれかの値に設定されることが考えられ、特に10程度に設定されることが考えられる。
Te in the relationship between the input signal spectrum Yi (f) and the average spectrum level M is a coefficient for excluding frequency components whose amplitude spectrum is significantly larger than the average spectrum level M from updating the noise spectrum. The coefficient Te is not limited to a specific value. For example, the tone signal is not subtracted by the
〈イ〉Yi(f)≧Te×M である周波数fについて
第3の更新部114が、以下の数式12に従って更新後のノイズスペクトルNi(f)を決定する。
数式12におけるNi-1(f)は、更新の1フレーム前のノイズスペクトルを表す。 Ni-1 (f) in Equation 12 represents the noise spectrum one frame before the update.
また、ノイズ更新回路11へと入力された音声区間検出結果が音声フレーム信号である場合には、入力された振幅スペクトルに該当する信号を入力信号スペクトルYi(f)として、周波数fごとに、前記入力信号スペクトルYi(f)と平均スペクトルレベルMとの間の関係に応じて下記の〈ウ〉または〈エ〉の処理が行われる。
When the voice section detection result input to the
〈ウ〉Yi(f)<Te×M である周波数fについて
第2の更新部112が、上記の数式9もしくは数式10に従って更新後のノイズスペクトルNi(f)を算出する。
<C> For the frequency f where Yi (f) <Te × M, the
〈エ〉Yi(f)≧Te×M である周波数fについて
第3の更新部114が、上記の数式12に従って更新後のノイズスペクトルNi(f)を決定する。
<D> With respect to the frequency f in which Yi (f) ≧ Te × M, the
上記の処理では、すなわち、Yi(f)≧Te×M であって平均スペクトルレベルMよりも振幅スペクトルが著しく大きい周波数成分については、当該の更新の後のノイズスペクトルNi(f)を更新の1フレーム前のノイズスペクトルNi-1(f)のままとして更新から除外する。 In the above processing, that is, for a frequency component in which Yi (f) ≧ Te × M and the amplitude spectrum is significantly larger than the average spectrum level M, the noise spectrum Ni (f) after the update is updated to 1. The noise spectrum before the frame is Ni-1 (f) and is excluded from the update.
ノイズ更新回路11は、フレームごとの振幅スペクトルに該当する信号および音声区間検出結果の入力を受けるたびに、更新後の、周波数fごとのノイズスペクトルNi(f)に該当する信号を減算部6に対して出力する。減算部6は、フレームごとに、ノイズ更新回路11から出力される前記更新後のノイズスペクトルNi(f)に該当する信号を用いて、変換結果出力部5から出力される振幅スペクトルに該当する信号から前記更新後のノイズスペクトルNi(f)に該当する信号を減算する処理を行う。
Each time the
上記のようなノイズ更新回路11によれば、トーン信号を抑圧しないようすることが可能となる。具体的には、スペクトル減算法を実現する従来の回路では、周波数スペクトルにおいて定常的に存在する成分をノイズと判断して抑圧するようにしているので、トーン信号も定常性があるためにノイズと判断されて抑圧の対象になり、ユーザにとって必要なトーン信号(例えば、モールス信号)も抑圧されてしまう、という問題がある。これに対して、上記のようなノイズ更新回路11では、平均スペクトルレベルよりも振幅スペクトルが著しく大きい周波数成分をノイズスペクトルの更新から除外するようにしているので、トーン信号を抑圧しないようにすることが可能となる。
According to the
なお、実施の形態2に係るノイズ更新回路11については、その時々の運用に応じてユーザが平均値算出部113および第3の更新部114を機能させるか否かを選択するというモードの選択に合わせてノイズスペクトルの更新の仕方が調整されて雑音成分の抑圧の仕方が調整されるようにしてもよい。例えば、ユーザが、雑音成分を抑圧しながら主に音声信号を送受信する場合には平均値算出部113および第3の更新部114を機能させないモードを選択してトーン信号を抑圧し、一方、モールス信号を送受信する場合には平均値算出部113および第3の更新部114を機能させるモードを選択してトーン信号を抑圧しないようすることが考えられる。
Regarding the
以上、この発明の実施の形態について説明したが、具体的な構成は、上記の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があっても、この発明に含まれる。例えば、上記の実施の形態では図1に概略構成を示すノイズリダクション回路1に対してこの発明に係るノイズ更新回路11が適用される場合を例に挙げて説明しているが、この発明が適用され得るノイズリダクション回路の構成は図1に示す例には限定されない。さらに言えば、この発明が適用され得る回路は、ノイズリダクション回路には限定されない。すなわち、この発明は、ノイズスペクトルを時系列で更新することが必要とされる種々の回路に対して適用され得る。
Although the embodiment of the present invention has been described above, the specific configuration is not limited to the above-described embodiment, and even if there is a design change or the like within a range that does not deviate from the gist of the present invention. Included in the invention. For example, in the above embodiment, the case where the
また、更新後のノイズスペクトルNi(f)を算出するための平均化を含む処理は、上記の実施の形態におけるノイズ時更新前重み定数Knおよび音声時更新前重み定数Ksに相当する係数を用いる方法であればどのような方法であってもよい。すなわち、更新後のノイズスペクトルNi(f)の算出式は、上記の実施の形態における数式7ないし数式10には限定されない。
Further, in the process including averaging for calculating the noise spectrum Ni (f) after the update, the coefficients corresponding to the noise constant before update Kn and the voice constant before update Ks in the above embodiment are used. Any method may be used as long as it is a method. That is, the updated noise spectrum Ni (f) calculation formula is not limited to the
1 ノイズリダクション回路
2 プリエンファシス回路
3 窓処理部
4 時間周波数変換部
5 変換結果出力部
6 減算部
7 合成部
8 周波数時間変換部
9 ディエンファシス回路
10 音声区間検出部
11 ノイズ更新回路
111 第1の更新部
112 第2の更新部
113 平均値算出部(実施の形態2)
114 第3の更新部(実施の形態2)
1
114 Third update section (Embodiment 2)
Claims (9)
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間が、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。 When the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f), and the noise spectrum Ni (f) updated for each frequency f. With the first update part calculated by processing including averaging (however, i: the number of orders representing the order of the time series),
When the frame to be processed is a frame containing an audio component, it has a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging.
When the average time for calculating the updated noise spectrum Ni (f) is a frame containing only the noise component, the updated noise spectrum Ni (f) is used. Longer than the averaging time when calculating,
A noise update circuit characterized by that.
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。 When the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f), and the noise spectrum Ni (f) updated for each frequency f. With the first update part calculated by processing including averaging (however, i: the number of orders representing the order of the time series),
When the frame to be processed is a frame containing an audio component, it has a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging.
The input signal spectrum Yi (f), the past input signal spectrum Yi-j (f), and the past noise when calculating the updated noise spectrum Ni (f) in the case of a frame containing the voice component. The average averaging time using the spectrum Ni-k (f) (where j: an integer of 1 or more representing the degree of deviation from the order number i in the time series, k: the order number i in the time series). The input signal spectrum Yi (f) and the past input when calculating the updated noise spectrum Ni (f) in the case of a frame containing only the noise component (an integer of 1 or more representing the degree of separation). It is longer than the average averaging time using the signal spectrum Yi-j (f) and the past noise spectrum Ni-k (f).
A noise update circuit characterized by that.
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間が(但し、k:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去のノイズスペクトルNi-k(f)とを用いた平均の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。 When the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f), and the noise spectrum Ni (f) updated for each frequency f. With the first update part calculated by processing including averaging (however, i: the number of orders representing the order of the time series),
When the frame to be processed is a frame containing an audio component, it has a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging.
An average using the input signal spectrum Yi (f) and the past noise spectrum Ni-k (f) when calculating the updated noise spectrum Ni (f) in the case of a frame containing the voice component. (However, k: an integer of 1 or more representing the degree of deviation from the order number i in the time series), and in the case of a frame containing only the noise component, the updated noise spectrum Ni (f) is obtained. It is longer than the average averaging time using the input signal spectrum Yi (f) and the past noise spectrum Ni-k (f) in the calculation.
A noise update circuit characterized by that.
前記処理対象のフレームが音声成分を含むフレームである場合に、周波数fごとに更新後のノイズスペクトルNi(f)を平均化を含む処理によって算出する第2の更新部と、を有し、
前記音声成分を含むフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間が(但し、j:時系列における順序数iとの隔たりの程度を表す1以上の整数)、前記ノイズ成分のみのフレームである場合に前記更新後のノイズスペクトルNi(f)を算出する際の、前記入力信号スペクトルYi(f)と前記過去の入力信号スペクトルYi-j(f)とを用いた平均の平均化時間よりも長い、
ことを特徴とするノイズ更新回路。 When the frame to be processed is a frame containing only noise components, the signal corresponding to the amplitude spectrum of the frame to be processed is set as the input signal spectrum Yi (f), and the noise spectrum Ni (f) updated for each frequency f. With the first update part calculated by processing including averaging (however, i: the number of orders representing the order of the time series),
When the frame to be processed is a frame containing an audio component, it has a second update unit for calculating the updated noise spectrum Ni (f) for each frequency f by a process including averaging.
The input signal spectrum Yi (f) and the past input signal spectrum Yi-j (f) used in calculating the updated noise spectrum Ni (f) in the case of a frame containing the voice component are used. The updated noise spectrum Ni (f) when the average averaging time (where j: an integer of 1 or more representing the degree of deviation from the order number i in the time series) and the frame containing only the noise component is used. Is longer than the average averaging time using the input signal spectrum Yi (f) and the past input signal spectrum Yi-j (f) in calculating.
A noise update circuit characterized by that.
ことを特徴とする請求項1から4のうちのいずれか1項に記載のノイズ更新回路。 In the case of a frame containing the voice component, the averaging time when calculating the updated noise spectrum Ni (f) is any value in the range of 1 to 10 seconds.
The noise update circuit according to any one of claims 1 to 4, wherein the noise update circuit is characterized in that.
ことを特徴とする請求項6に記載のノイズ更新回路。 The constant Ks is set to a value in either the time constant of the IIR filter or the range corresponding to 1 to 10 seconds of the average interval of the FIR filter.
The noise update circuit according to claim 6.
ことを特徴とする請求項8に記載のノイズ更新回路。 The coefficient Te is set to any value in the range of 1 to 100.
The noise update circuit according to claim 8.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020113298A JP2022011890A (en) | 2020-06-30 | 2020-06-30 | Noise update circuit |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020113298A JP2022011890A (en) | 2020-06-30 | 2020-06-30 | Noise update circuit |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022011890A true JP2022011890A (en) | 2022-01-17 |
Family
ID=80147610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020113298A Pending JP2022011890A (en) | 2020-06-30 | 2020-06-30 | Noise update circuit |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022011890A (en) |
-
2020
- 2020-06-30 JP JP2020113298A patent/JP2022011890A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4423300B2 (en) | Noise suppressor | |
JP3568922B2 (en) | Echo processing device | |
EP2675073B1 (en) | Adaptive equalizer, acoustic echo canceller device, and active noise control device | |
KR100927897B1 (en) | Noise suppression method and apparatus, and computer program | |
JP5347794B2 (en) | Echo suppression method and apparatus | |
US8792649B2 (en) | Echo canceller used for voice communication | |
KR101052445B1 (en) | Method and apparatus for suppressing noise, and computer program | |
EP1349148A1 (en) | Noise removing method and device | |
JP2001134287A (en) | Noise suppressing device | |
JP4607015B2 (en) | Echo suppression device | |
JP4757775B2 (en) | Noise suppressor | |
JP2003140700A (en) | Method and device for noise removal | |
JP4395772B2 (en) | Noise removal method and apparatus | |
JP4690243B2 (en) | Digital filter, periodic noise reduction device, and noise reduction device | |
JP5466581B2 (en) | Echo canceling method, echo canceling apparatus, and echo canceling program | |
JP2022011890A (en) | Noise update circuit | |
JP2002140100A (en) | Noise suppressing device | |
JP2022011891A (en) | Noise update circuit | |
JP2003131689A (en) | Noise removing method and device | |
JP2002175099A (en) | Method and device for noise suppression | |
JP6143702B2 (en) | Echo canceling apparatus, method and program | |
JP2022011892A (en) | Noise suppression circuit | |
US9659575B2 (en) | Signal processor and method therefor | |
JP2022011889A (en) | Voice section detection circuit | |
JP2022011893A (en) | Noise suppression circuit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230627 |