JP2010160521A - Noise canceller, and communication device equipped with the same - Google Patents
Noise canceller, and communication device equipped with the same Download PDFInfo
- Publication number
- JP2010160521A JP2010160521A JP2010089555A JP2010089555A JP2010160521A JP 2010160521 A JP2010160521 A JP 2010160521A JP 2010089555 A JP2010089555 A JP 2010089555A JP 2010089555 A JP2010089555 A JP 2010089555A JP 2010160521 A JP2010160521 A JP 2010160521A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- band
- power
- value
- minimum value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Noise Elimination (AREA)
Abstract
Description
この発明は、ディジタル自動車・携帯電話装置やディジタルコードレス電話機、ディジタル有線電話装置等のように音声信号を符号化して伝送する通信装置に設けられるノイズキャンセラおよびこのノイズキャンセラを備えた通信装置に関する。 The present invention relates to a noise canceller provided in a communication device that encodes and transmits an audio signal, such as a digital automobile / mobile phone device, a digital cordless phone, a digital wired phone device, and the like, and a communication device including the noise canceller.
ディジタル携帯電話装置では、一般にCELP(Code Excited Linear Prediction)方式等の低ビットレートの音声符号化方式が使用されている。この種の符号化方式を使用すると、背景雑音が比較的大きい環境下でも良好な音声通話を行なうことが可能である。なお、CELP方式の詳細については、M.R.Schroeder 氏とB.S.Atal氏の“Code-Excited Linear Prediction(CELP):High-Quality Speech At Very Low Bit Rates”in Proc.ICASSP,1985.pp.937-939に述べられている。 In a digital cellular phone device, a low bit rate speech encoding method such as a CELP (Code Excited Linear Prediction) method is generally used. By using this type of coding system, it is possible to perform a good voice call even in an environment where the background noise is relatively large. For details of the CELP method, see MR Schroeder and BSAtal in “Code-Excited Linear Prediction (CELP): High-Quality Speech At Very Low Bit Rates” in Proc.ICASSP, 1985.pp.937-939. It is stated.
しかし、鉄道のホームや幹線道路等のような高雑音環境下では、背景雑音は音声の明瞭感を著しく低下させる。このため、雑音を除去して音声のみを符号化に供するノイズキャンセラの研究が種々なされている。その一例として、米国で規格化された可変レート音声符号化方式においてオプションとして規定されたノイズキャンセラがある(例えば、非特許文献1を参照。)。
However, in a noisy environment such as a railway platform or a main road, background noise significantly reduces voice clarity. For this reason, various studies have been made on noise cancellers that remove noise and use only speech for encoding. As an example, there is a noise canceller defined as an option in the variable rate speech coding system standardized in the United States (see Non-Patent
図9は、この非特許文献1に記載された規格において規定されたノイズキャンセラの機能ブロック図である。同図において、51は高速フーリエ変換部(FFT:fast Fourier transform )であり、このFFT51にはフレーム化された送話信号が入力される。なお、フレーム化送話信号は、A/D変換された送話信号を例えば80サンプルのフレームに分割したのち、オーバラップ分を含め128サンプルに整えることにより生成される。FFT51は、上記フレーム化送話信号に対し高速フーリエ変換処理を行い、これにより例えば16帯域に周波数分割された変換係数が得られる。
FIG. 9 is a functional block diagram of a noise canceller defined in the standard described in
FFT51により得られた16帯域の変換係数は、帯域エネルギ推定部52に入力される。帯域エネルギ推定部52は、上記16帯域の変換係数のエネルギを計算して、この帯域別エネルギの算出値を帯域SNR推定部53及び雑音推定部54に入力する。雑音推定部54は、上記帯域別エネルギの推定値をもとに雑音部分の帯域別エネルギを推定し、この推定した帯域別雑音エネルギを帯域SNR推定部53に与える。帯域SNR推定部53は、上記帯域別エネルギの算出値と上記帯域別雑音エネルギの推定値とをもとに、帯域別の信号エネルギと雑音エネルギとの対数値(SNR)を計算する。そして、この帯域別SNRをボイスメトリック計算部55に与える。ボイスメトリック計算部55は、上記帯域別SNRにその大きさに応じた重み係数を掛けたのちその総和を求めるもので、その算出結果がボイスメトリック(Voice metric)である。
The 16-band conversion coefficient obtained by the
帯域SNR修正部56は、上記ボイスメトリックがしきい値より小さい場合には音声が含まれないと判断して帯域SNRを小さい値に修正し、帯域ゲイン計算部57に与える。帯域ゲイン計算部57は、上記修正されたSNRをもとに各帯域の雑音抑圧量を決定し、乗算部61に与える。この結果乗算部61では、前記FFT51から出力された16帯域の変換係数と上記帯域別の雑音抑圧量とが帯域別に乗算され、これにより帯域別に雑音抑圧された信号が出力される。そして、この帯域別に雑音抑圧された変換係数は、逆高速フーリエ変換部(IFFT)58において逆高速フーリエ変換され、これにより時間領域の信号に戻されて出力される。
The band
なお、上記雑音エネルギの更新は、スペクトル偏差推定部59及び雑音更新判定部60において更新の可否が判定された上で行われる。
すなわち、上記ノイズキセャンセラでは、帯域別ノイズ抑圧量を送話信号のSNR、つまり信号のエネルギと雑音エネルギとの比をもとに決定している。また、音声が含まれるかどうかを判断するために、各帯域別SNRを重み付け加算して求めた値であるボイスメトリックを用いている。
The noise energy is updated after the spectrum
That is, in the noise canceller, the noise suppression amount for each band is determined based on the SNR of the transmission signal, that is, the ratio between the signal energy and the noise energy. Further, in order to determine whether or not speech is included, a voice metric which is a value obtained by weighted addition of each band SNR is used.
ところで、雑音(Background Noise)は一般に定常と仮定されるが、屋外では変動する場合がある。特に、自動車が通り過ぎるときに発生する雑音のエネルギは自動車の接近とともに大きくなる。この状態で送話音声が入力されると、音声と雑音とのエネルギ差が小さいため、抑圧後の音声を歪ませることがある。また、雑音のスペクトル形状と音声のスペクトル形状が似ている場合も、雑音エネルギをもとに抑圧を行うと音声のスペクトルに干渉しやすくなるため、抑圧後の音声に歪みが発生する。 By the way, although noise (Background Noise) is generally assumed to be steady, it may fluctuate outdoors. In particular, the energy of noise generated when a vehicle passes by increases as the vehicle approaches. When the transmitted voice is input in this state, the energy difference between the voice and noise is small, and thus the suppressed voice may be distorted. Further, even when the noise spectrum shape is similar to the speech spectrum shape, if suppression is performed based on noise energy, interference with the speech spectrum is likely to occur, and thus the suppressed speech is distorted.
音声の検出に用いるボイスメトリックは、SNRに重み係数を掛けてその総和をとったものであるため、突発的な雑音が混入した場合には音声と見なされやすい。 Since the voice metric used for voice detection is obtained by multiplying the SNR by a weighting coefficient and taking the sum, it is likely to be regarded as voice when sudden noise is mixed.
この発明は上記事情に着目してなされたもので、その目的は、雑音エネルギが変動した場合でもその影響を排除して安定な雑音抑圧処理を行えるようにし、これにより雑音抑圧における音声歪みの発生を低減したノイズキャンセラとこのノイズキャンセラを備えた通信装置を提供することである。 The present invention has been made paying attention to the above circumstances, and its purpose is to eliminate the influence of noise energy fluctuations and to perform stable noise suppression processing, thereby generating voice distortion in noise suppression. The present invention is to provide a noise canceller with reduced noise and a communication apparatus including the noise canceller.
上記目的を達成するためにこの発明の一つの観点は、入力信号を一定時間長のフレームに分割するとともに、これらのフレームの信号をそれぞれ複数の周波数帯域に分け、これらの周波数帯域ごとに雑音の抑圧処理を行うノイズキャンセラにおいて、上記周波数帯域ごとに信号のパワーを求め、この帯域パワーをもとに帯域別の雑音パワーを推定する雑音パワー推定手段と、上記帯域パワーおよび帯域別雑音パワーのうちの少なくとも一方について、複数のフレーム期間にわたりパワーの最小値を検出する最小値検出手段と、上記周波数帯域ごとにその帯域パワーと上記最小値検出手段により検出された帯域別最小値との差を求め、この差をもとに周波数帯域別の雑音抑圧量を決定する抑圧量決定手段とを具備したものである。 In order to achieve the above object, one aspect of the present invention is to divide an input signal into frames having a fixed time length, and divide the signals of these frames into a plurality of frequency bands, respectively. In a noise canceller that performs suppression processing, the power of a signal is obtained for each frequency band, noise power estimation means for estimating noise power for each band based on the band power, and the band power and the noise power for each band For at least one, a minimum value detecting means for detecting a minimum value of power over a plurality of frame periods, and obtaining a difference between the band power for each frequency band and the minimum value for each band detected by the minimum value detecting means, And a suppression amount determining means for determining a noise suppression amount for each frequency band based on this difference.
具体的には、上記抑圧量決定手段は、音声区間と雑音区間のうちの少なくとも音声区間において、上記帯域パワーと上記帯域別最小値との差に基づく帯域別の雑音抑圧量決定処理を行う。 Specifically, the suppression amount determination means performs a noise suppression amount determination process for each band based on a difference between the band power and the minimum value for each band in at least the speech section of the speech section and the noise section.
したがってこの発明の一観点によれば、周波数帯域ごとにその帯域パワー又は帯域別雑音パワーの最小値が検出され、帯域パワーとこの最小値との差をもとに周波数帯域別の雑音抑圧量が決定される。このため、通話中に例えば自動車が通過して雑音エネルギが一時的に増加しても、雑音抑圧量はあくまでも帯域パワーと上記最小値との差をもとに決定されるため、抑圧量は安定に保持され、この結果常に安定な雑音抑圧処理が可能となる。 Therefore, according to one aspect of the present invention, the minimum value of the band power or the noise power for each band is detected for each frequency band, and the noise suppression amount for each frequency band is determined based on the difference between the band power and the minimum value. It is determined. For this reason, even if, for example, a vehicle passes during a call and the noise energy temporarily increases, the noise suppression amount is determined based on the difference between the band power and the minimum value, so the suppression amount is stable. As a result, stable noise suppression processing is always possible.
また、雑音のスペクトル形状と音声のスペクトル形状が似ている場合でも、帯域パワーと上記最小値との差をもとに抑圧処理が行われるため、雑音エネルギの影響を受け難くなり、この結果音声のスペクトルに対する干渉は減少されて音声歪みの発生は防止される。 In addition, even if the noise spectrum shape is similar to the speech spectrum shape, suppression processing is performed based on the difference between the band power and the above minimum value, making it less susceptible to noise energy. Interference with the spectrum of is reduced and the occurrence of speech distortion is prevented.
またこの発明は、上記抑圧量決定手段において、フレームごとに異なる帯域共通の調整値を生成し、上記周波数帯域ごとに、その帯域パワーと、最小値検出手段により検出された帯域別最小値に上記帯域共通の調整値を加えた値との差を求め、この差をもとに周波数帯域別の雑音抑圧量を決定することも特徴とする。 Further, according to the present invention, the suppression amount determining means generates a common adjustment value for each band different for each frame, and for each frequency band, the band power and the minimum value for each band detected by the minimum value detecting means are It is also characterized in that a difference from a value obtained by adding an adjustment value common to the bands is obtained, and a noise suppression amount for each frequency band is determined based on the difference.
具体的には、雑音区間においては前記帯域別最小値間の平均値と前記帯域別雑音パワー間の平均値との差に基づいて帯域共通の調整値を決定し、一方音声区間においては1フレームにおける複数の帯域パワーの中の最小値と複数の帯域別最小値の中の最大値との差に基づいて帯域共通の調整値を決定する。
このようにすることで、音声区間及び雑音区間の各々についてより一層適切な雑音抑圧量を決定することが可能となる。
Specifically, in the noise period, a common adjustment value is determined based on the difference between the average value between the minimum values for each band and the average value between the noise powers for each band. An adjustment value common to the bands is determined based on the difference between the minimum value among the plurality of band powers and the maximum value among the minimum values according to the bands.
By doing so, it becomes possible to determine a more appropriate noise suppression amount for each of the speech section and the noise section.
すなわちこの発明によれば、雑音エネルギが変動した場合でもその影響を排除して安定な雑音抑圧処理を行うことができ、これにより雑音抑圧における音声歪みの発生を低減したノイズキャンセラとこのノイズキャンセラを備えた通信装置を提供することができる。 That is, according to the present invention, even when the noise energy fluctuates, it is possible to eliminate the influence and perform stable noise suppression processing, thereby including a noise canceller that reduces the occurrence of voice distortion in noise suppression and the noise canceller. A communication device can be provided.
以下、図面を参照してこの発明に係わる実施形態を説明する。
図1は、この発明に係わるノイズキャンセラを備えたディジタル携帯電話装置の一実施形態を示す回路ブロック図である。
同図において、図示しない基地局から無線チャネルを介して送られた無線搬送波信号は、アンテナ1で受信されたのちアンテナ共用器(DUP)2を介して受信回路(RX)3に入力され、ここで周波数シンセサイザ(SYN)4から出力された受信局部発振信号とミキシングされて中間周波信号に周波数変換される。そしてこの受信中間周波信号は、図示しないA/D変換器においてサンプリングされたのちディジタル復調器(DEM)6に入力される。
Embodiments according to the present invention will be described below with reference to the drawings.
FIG. 1 is a circuit block diagram showing an embodiment of a digital cellular phone device provided with a noise canceller according to the present invention.
In the figure, a radio carrier signal transmitted from a base station (not shown) via a radio channel is received by an
ディジタル復調器6は、上記ディジタル受信中間周波信号に対するフレーム同期およびビット同期を確立したうえで、ディジタル復調処理を行なう。この復調処理により得られたベースバンドのディジタル復調信号は、時分割多元接続回路(TDMA)8に入力され、ここで各伝送フレームごとに自己宛てのタイムスロットが分離抽出される。なお、上記ディジタル復調器6において得られたフレーム同期及びビット同期に関する情報は制御回路18に入力される。
The
上記TDMA回路8から出力されたディジタル復調信号は、続いて誤り訂正符号復号回路(CH−COD)9に入力され、ここで誤り訂正復号処理される。そして、この誤り訂正復号されたディジタル復調信号は、音声復号回路(DEC)10に入力されて音声復号処理され、これによりディジタル受話信号が再生される。このディジタル受話信号は、D/A変換器11でアナログ受話信号に戻されたのち図示しない音声増幅器を介してスピーカ12に供給され、このスピーカ12から拡声出力される。
The digital demodulated signal output from the
一方、話者の送話音声は、マイクロホン13で集音されて電気信号に変換されたのちA/D変換器14に入力され、このA/D変換器14で所定のサンプリング周期でサンプリングされてディジタル送話信号に変換される。このディジタル送話信号は、後述するノイズキャンセラ17に通されたのち音声符号化回路(COD)16に入力されて音声符号化される。
On the other hand, the transmitted voice of the speaker is collected by the
この音声符号化回路16から出力された符号化音声データは、制御回路18から出力された制御信号とともに誤り訂正符号復号回路(CH−COD)9に入力され、ここで誤り訂正符号化される。そして、この誤り訂正符号化されたディジタル送信信号はTDMA回路8に入力される。このTDMA回路8では、時分割多元接続(TDMA)方式に対応した伝送フレームが生成され、この伝送フレーム中の自装置に割り当てられたタイムスロットに上記ディジタル送信信号を挿入するための処理が行なわれる。このTDMA回路8から出力されたディジタル送信信号は、続いてディジタル変調器(MOD)7に入力される。
The encoded speech data output from the
ディジタル変調器7では、上記ディジタル送信信号によりディジタル変調された送信中間周波信号が発生され、この送信中間周波信号は図示しないD/A変換器によりアナログ信号に変換されたのち送信回路(TX)5に入力される。なお、ディジタル変調方式としては、例えばπ/4シフトQPSK(π/4 shifted quadrature phase shift keying)方式が使用される。
The
送信回路5では、上記変調された送信中間周波信号がまず周波数シンセサイザ4から出力された送信局部発振信号とミキシングされ、これにより通話チャネルに対応する無線搬送波周波数に変換される。そして、この無線変調波信号は、送信電力増幅器において制御回路18から制御信号TCSにより指示された所定の送信電力レベルに制御されたのち、アンテナ共用器2を介してアンテナ1から図示しない基地局へ向けて送信される。
In the
なお、19は操作パネル部であり、この操作パネル部19には発信キー、終了キー、ダイヤルキー、および各種機能キーを有するキー入力部と、液晶表示器 (LCD)や発光ダイオード(LED)を有する表示部とが配設されている。
ところで、ノイズキャンセラ17は例えばDSP(Digital Signal Processor)により実現されるもので、その処理プログラムはノイズキャンセラ内のメモリ又は制御回路18に付属するメモリに格納されている。図2はこの処理プログラムにより実現される機能の構成を示すブロック図である。
Incidentally, the
A/D変換器14から出力されたディジタル送話信号は、先ずフレーム分割部21に入力される。フレーム分割部21は、上記ディジタル送話信号を例えば80サンプルのフレームに分割したのち、ウィンドウがけを行うことによりフレーム端をオーバラップさせ、これによりオーバラップ分を含め128サンプルに整えられたフレームを出力する。そして、このディジタル送話信号フレームを高速フーリエ変換部(FFT)22に入力する。
The digital transmission signal output from the A /
FFT22は、入力されたディジタル送話信号フレームに対し高速フーリエ変換処理を行い、これにより例えば低域から高域まで順に16帯域に周波数分割された変換係数を得る。なお、各帯域ごとの変換係数の数は同一でなくてもよい。そして、この帯域分割された変換係数を、雑音抑圧処理用の乗算器23に入力すると共に帯域パワー計算部26に入力する。
The
帯域パワー計算部26は、各帯域ごとにエネルギ(変換変数の二乗平均値)を求めて対数をとり、帯域パワーchannel_power(m,k)を出力する。ただし、mはフレーム番号、kは帯域番号(k=0,…,15)である。そして、この帯域パワーを、後述する雑音リーク積分値更新部32及び帯域別ゲイン決定部33にそれぞれ入力すると共に、有意値計算部27に入力する。
The band
有意値計算部27は、各帯域ごとに、後述する雑音リーク積分値更新部32から出力される雑音リーク積分値noise_power(m,k)と、上記帯域パワーchannel_power(m,k)との差tmp を求め、これらの帯域別の差tmp を所定のしきい値と比較する。そして、周波数順に配列された上記各帯域別の差tmp のうち隣接する複数の帯域の帯域別差tmp がしきい値を超えると判定された場合に、これらの帯域別差tmp に所定の重み付けを行った上で相互に加算する。そして、この重み付け後の値suby(m,k)と、このsubyの条件付総和を有意値yとして出力する。
For each band, the significant value calculator 27 calculates a difference tmp between a noise leak integrated value noise_power (m, k) output from a noise leak integrated
図3は、この有意値計算部27の処理手順とその内容を示すフローチャートである。
同図において、有意値計算部27は、先ずステップ3aでフレーム番号mを0にリセットしたのち、ステップ3bでグループ番号mをインクリメントすると共に、有意値y 、帯域番号k 、及びしきい値を越える帯域別差tmp の連続数flagをそれぞれ0に初期設定する。
FIG. 3 is a flowchart showing the processing procedure and contents of the significant value calculation unit 27.
In the figure, the significant value calculator 27 first resets the frame number m to 0 in
次に有意値計算部27は、ステップ3cで帯域k=0 について、その帯域パワーと雑音リーク積分値との差tmp と、この帯域別差tmp に対し重み付けを行った値suby(m,k)とをそれぞれ以下のように計算する。
tmp =channel_power(m,k)−noise_power(m,k)
suby(m,k)={200-(k-1)2 }/100*(tmp-1)
ただし、{200-(k-1)2 }は重み係数である。
Next, the significant value calculation unit 27 weights the difference tmp between the band power and the noise leak integrated value for the band k = 0 in
tmp = channel_power (m, k) −noise_power (m, k)
suby (m, k) = {200- (k-1) 2} / 100 * (tmp-1)
However, {200- (k-1) 2} is a weighting coefficient.
そして、帯域k=0 における上記帯域別差tmp が算出されると、有意値計算部27はステップ3dでこの帯域別差tmp をしきい値「1」と比較し、帯域別差tmp がしきい値「1」を越えていると、音声である可能性があると判断してステップ3e及びステップ3gを経てステップ3iに移行し、ここで連続数flag=1に設定する。そして、ステップ3kで帯域番号k をインクリメントしてk=1 としたのち、ステップ3cに戻って今度は帯域k=1 について同様の処理を実行する。
When the band-specific difference tmp in the band k = 0 is calculated, the significant value calculating unit 27 compares the band-specific difference tmp with the threshold “1” in step 3d, and the band-specific difference tmp is the threshold. If the value exceeds “1”, it is determined that there is a possibility of voice, and the process proceeds to step 3i through
さて、この帯域k=1 においても、前記帯域k=0 に続き帯域別差tmp がしきい値「1」を越えたとする。そうすると有意値計算部27は、既にflag=1であるためステップ3eからステップ3fに移行して、ここで
y =y +suby(m,k-1)
なる演算を行う。すなわち、前記帯域k=0 におけるsuby(m,k-1)を有意値y とする。そして、連続数flag=2としたのち、ステップ3gを経てステップ3hに移行し、ここで
y =y +suby(m,k)
なる演算を行い、これにより前記帯域k=0 におけるsuby(m,k-1)に、今回の帯域k=1 で求めたsuby(m,k)を加算する。そして、ステップ3kで帯域番号k をさらにインクリメントしてk=2 としたのち、ステップ3cに戻って帯域k=2 についての処理を実行する。
Now, also in this band k = 1, it is assumed that the band-specific difference tmp exceeds the threshold value “1” following the band k = 0. Then, since significant value calculation unit 27 has already flag = 1, the process proceeds from
y = y + suby (m, k-1)
Perform the following operation. That is, let suby (m, k-1) in the band k = 0 be a significant value y. Then, after setting the continuous number flag = 2, the process proceeds to step 3h through
y = y + suby (m, k)
Thus, the suby (m, k) obtained in the current band k = 1 is added to the suby (m, k-1) in the band k = 0. In step 3k, the band number k is further incremented to become k = 2, and then the process returns to step 3c to execute processing for the band k = 2.
以後同様に、隣接する帯域k=2 ,k=3,k=4 ,…の帯域別差tmp がしきい値「1」を越えるごとに、その帯域のsuby(m,k)が一つ前の帯域までに得られた有意値y に順次加算され、これにより帯域別差tmp の重み付け加算値y が求められる。 Thereafter, similarly, every time the band-specific difference tmp of the adjacent bands k = 2, k = 3, k = 4,... Exceeds the threshold value “1”, the suby (m, k) of that band is decreased by one. Are sequentially added to the significant value y obtained up to the band of, thereby obtaining the weighted addition value y of the band-specific difference tmp.
なお、いずれかの帯域k=i において、帯域別差tmp がしきい値「1」以下になると、有意値計算部27はステップ3dからステップ3jに移行してここでflagを0にリセットする。
そうして、1フレームを構成する16個すべての帯域k=0〜k=15についての処理が終了すると、有意値計算部27はステップ3mからステップ3nに移行して、ここで上記有意値y と、各帯域ごとに算出した重み付け後の帯域別差suby(m,k)(k=0,1,…,15)をそれぞれ出力する。
Note that, in any band k = i, when the band-specific difference tmp is equal to or less than the threshold value “1”, the significant value calculation unit 27 proceeds from step 3d to step 3j and resets flag to 0 here.
Then, when the processing for all 16 bands k = 0 to k = 15 constituting one frame is completed, the significant value calculation unit 27 proceeds from
かくして、各フレームごとに、しきい値が「1」を越える連続する複数の帯域の帯域別差tmp の重み付け加算値y が求められ、この重み付け加算値y が後述する音声重み計算部28における音声重みの計算、つまりそのフレームが音声フレームであるか雑音フレームであるか、さらにはその中間の過渡域フレームであるかの判定に供される。すなわち、ただ1つの帯域のみで帯域別差tmp がしきい値「1」を越えた場合には、これは雑音と見なされて排除され、上記音声重み計算部28における音声/雑音/過渡域の判定には供されない。
Thus, for each frame, the weighted addition value y of the band-specific differences tmp of a plurality of continuous bands whose threshold value exceeds “1” is obtained, and this weighted addition value y is used for the voice
上記有意値計算部27から重み付け加算値y が供給されると、音声重み計算部28では雑音抑圧ゲインの決定に用いる音声重みspの計算が行われる。音声重みspは、1フレーム中に音声が含まれる度合いを0≦sp≦6の範囲で表す数値であり、前記重み付け加算値y から計算される。なお、sp=0は雑音区間、sp=6は音声区間を表す。
When the weighted addition value y is supplied from the significant value calculation unit 27, the audio
図4は、この音声重み計算部28における音声重みspの計算手順とその処理内容を示すフローチャートである。
音声重み計算部28は、先ずステップ4aでフレーム番号mを0にリセットしたのち、ステップ4bでグループ番号mをインクリメントする。次に、ステップ4cで上記重み付け加算値y を任意のしきい値「13」と比較し、y <13であれば雑音フレームと判断してステップ4dに移行し、ここで音声重みspを
sp(m)=sp(m-1)−0.5
に設定する。一方、y ≧13だった場合には、ステップ4eに移行してここで
z =(y−13)*1.5+1
を計算する。すなわち、y をもとに音声重みz を1〜6の範囲で仮に設定する。
FIG. 4 is a flowchart showing the procedure for calculating the voice weight sp in the
The
sp (m) = sp (m-1) −0.5
Set to. On the other hand, if y ≧ 13, the process proceeds to step 4e where
z = (y−13) * 1.5 + 1
Calculate That is, the voice weight z is temporarily set in the range of 1 to 6 based on y.
続いて音声重み計算部28は、ステップ4fにおいてsp(m-1)≦0.5を判定する。すなわち、1フレーム前の音声重みsp(m-1)が雑音フレームだったかどうかを判定する。そして、雑音フレームだった場合にはステップ4gに移行し、ここで現フレームの音声重みsp(m) を上記z に設定する。これに対し、1フレーム前の音声重みsp(m-1)が雑音フレームではなかった場合には、ステップ4hに移行してここでz >sp(m-1)+0.5を判定し、z >sp(m-1)+0.5であればステップ4iで現フレームの音声重みsp(m) をsp(m-1)+0.5に設定する。一方、z >sp(m-1)+0.5でなければ、ステップ4jに移行してここでz >sp(m-1)−0.5を判定し、z >sp(m-1)−0.5であればステップ4kで現フレームの音声重みsp(m) をsp(m-1)−0.5に設定する。また、z >sp(m-1)−0.5でもない場合には、ステップ4mに移行してここで現フレームの音声重みをsp(m) =MIN(sp(m),6)又はsp(m) =MAX(sp(m),0)に設定する。
Subsequently, the voice
すなわち、上記ステップ4fからステップ4mにおいて、現フレームで算出した仮の音声重みz が、1つ前のフレームで設定した音声重みsp(m-1) を考慮して補正される。したがって、このように求めた音声重みsp(m) を使用することで、フレーム間の連続性を考慮した音声/雑音/過渡域の判定が可能となる。
That is, in
上記音声重み計算部28により求められた音声重みsp(m) は、ステップ4nにおいて出力され、雑音最小値推定部29及び帯域別ゲイン決定部33に入力される。
雑音最小値推定部29は、上記音声重みがsp=0となる100フレームの期間ごとに、各帯域における雑音のリーク積分値noise_power(m,k)の最小値を調べる。そして、この最小値を次の100フレームの期間において、雑音最小値noise_min(m,k)として使用する。またそれと共に、各帯域の雑音最小値の帯域間平均値min_allを求める。
The speech weight sp (m) obtained by the speech
The noise minimum
図5及び図6は、この雑音最小値推定部29において実行される最小値推定処理の手順と内容を示すフローチャートである。
同図において、雑音最小値推定部29は先ずステップ5aで、フレーム番号mをm=0にリセットすると共に、フレームカウンタの値をfc =96に、雑音最小値をnoise_min(k)=36に、帯域をk =0,…,15にそれぞれ初期設定し、さらにnoise_min(k)_h(k)=MAX(noise_power(m,2k),noise_power(m,2k+1)),k=0,…,7に、雑音最小値の帯域間平均min_allを
7
min_all=Σ noise_min(k)_h(n)/8
n=0
にそれぞれ初期設定する。
5 and 6 are flowcharts showing the procedure and contents of the minimum value estimation process executed in the noise minimum
In the figure, the noise minimum
7
min_all = Σ noise_min (k) _h (n) / 8
n = 0
Initialize each.
次に雑音最小値推定部29は、ステップ5bでフレーム番号mをインクリメントしたのち、ステップ5cで上記音声重みがsp=0であるか否か、つまり雑音フレームであるか否かを判定する。そして、雑音フレームであれば、ステップ5bに戻ってフレーム番号mをインクリメントし、上記ステップ5cによる雑音フレームの判定を行う。すなわち、上記ステップ5b及びステップ5cにより音声フレーム又は過渡域フレームの検出が行われる。
Next, the noise minimum
さて、音声フレーム又は過渡域フレームが検出されると、雑音最小値推定部29はステップ5dに移行してここでフレームカウンタfc をインクリメントすると共に、帯域k=0を選択する。そして、ステップ5eで
x =MAX(noise_power(m,2k),noise_power(m,2k+1))
に設定したのち、ステップ5fに移行してnoise_min(k)_h(k)>x であるか否か判定し、noise_min(k)_h(k)>x であればステップ5gに移行してここで雑音最小値をnoise_min(k)_h(k)=x に設定する。そして、ステップ5hに移行する。
When a voice frame or a transient frame is detected, the minimum
x = MAX (noise_power (m, 2k), noise_power (m, 2k + 1))
After moving to step 5f, it is determined whether or not noise_min (k) _h (k)> x. If noise_min (k) _h (k)> x, the process proceeds to step 5g where Set the noise minimum value to noise_min (k) _h (k) = x. Then, the process proceeds to step 5h.
これに対しnoise_min(k)_h(k)>x でなければ、そのままステップ5hに移行して次の帯域k=1を選択し、帯域k=8に達するまでは上記ステップ5e〜ステップ5gによる雑音最小値noise_min(k)_h(k)の設定処理を繰り返す。
On the other hand, if noise_min (k) _h (k)> x is not satisfied, the process proceeds directly to step 5h to select the next band k = 1, and until the band k = 8 is reached, the noise generated in
そして、帯域k=8に達すると、雑音最小値推定部29はステップ5jでフレームカウンタfc が100に達したか否かを判定する。そして、100フレームに達するまではステップ5bに戻って次のフレームを選択し、この選択したフレームについて上記ステップ5c〜ステップ5iによる処理を繰り返す。
When the band k reaches 8, the noise minimum
一方、上記100フレームに対する処理を終了すると、雑音最小値推定部29は図6に示すステップ6aに移行し、ここで雑音最小値の帯域間平均min_allを
7
min_all=Σ noise_min(k)_h(n)/8
n=0
により求める。
On the other hand, when the processing for the 100 frames is completed, the noise minimum
7
min_all = Σ noise_min (k) _h (n) / 8
n = 0
Ask for.
またそれと共に、noise_min(0)及びnoise_min(1)をそれぞれ
noise_min(0)=noise_min_h(0)
noise_min(1)=0.75 noise_min_h(0)+0.25 noise_min_h(1)
とすると共に、帯域をk=1とする。
Along with that, noise_min (0) and noise_min (1)
noise_min (0) = noise_min_h (0)
noise_min (1) = 0.75 noise_min_h (0) +0.25 noise_min_h (1)
And the bandwidth is k = 1.
さらに雑音最小値推定部29は、ステップ6bに移行してここで、先に帯域k=0〜k=7について求めた8個の雑音最小値をもとに、残りの帯域k=8〜k=15について雑音最小値を
noise_min(2k)=0.75 noise_min_h(k)+0.25 noise_min_h(k-1)
noise_min(2k+1)=0.75 noise_min_h(k)+0.25 noise_min_h(k+1)
のように算出する。
Further, the noise minimum
noise_min (2k) = 0.75 noise_min_h (k) +0.25 noise_min_h (k-1)
noise_min (2k + 1) = 0.75 noise_min_h (k) +0.25 noise_min_h (k + 1)
Calculate as follows.
そして、以上の演算が終了すると、雑音最小値推定部29はステップ6dからステップ6eに移行し、ここで
noise_min(14)=0.75 noise_min_h(7)+0.25 noise_min_h(6)
noise_min(15)=noise_min_h(7)
を算出する。
When the above calculation is completed, the noise minimum
noise_min (14) = 0.75 noise_min_h (7) +0.25 noise_min_h (6)
noise_min (15) = noise_min_h (7)
Is calculated.
すなわち、雑音最小値推定部29は、上記ステップ6a〜ステップ6eにおいて8個のmin_allをもとに16個のmin_allを補間している。
そうして16個のmin_allを算出すると、雑音最小値推定部29はステップ6fにおいて、フレームカウンタfc を0にリセットすると共に、雑音最小値をnoise_min_h(k)=36に、また帯域をk=0,…,7に設定し直す。そして、ステップ6gにおいて、先に算出した雑音最小値の帯域間平均値min_all、及び雑音最小値noise_min(m,k),k=0,…,15を出力したのち、ステップ5bに戻って次のフレームm=m+1について同様の雑音最小値及びその帯域間平均値の算出処理を繰り返す。
That is, the noise minimum
After calculating 16 min_all, the noise minimum
また、更新判定部31および雑音リーク積分値更新部32では、雑音のリーク積分値noise_power(m,k)の更新処理が行われる。すなわち、更新判定部31は、y <15のときに更新可、それ以外のときには更新不可とする。更新可のとき雑音リーク積分値更新部32は、雑音パワーnoise_powerを例えば、
noise_power(m+1,k)=noise_power(m,k)*0.9+channel_power(m,k)*0.1, k=0,…,15
のように更新する。
In addition, the
noise_power (m + 1, k) = noise_power (m, k) * 0.9 + channel_power (m, k) * 0.1, k = 0, ..., 15
Update like this.
帯域別ゲイン決定部33は、前記帯域パワー計算部26から出力された帯域パワーchannel_power(m,k)、雑音リーク積分値更新部32から出力された雑音パワーnoise_power(m,k)、音声重み計算部28から出力された音声重みsp(m,k)、及び雑音最小値推定部29から出力された雑音最小値noise_min(m,k)をもとに、帯域別ゲインgain(m,k)を決定する。
The band-specific gain determination unit 33 includes the band power channel_power (m, k) output from the band
先ず雑音リーク積分値noise_power(m,k)の帯域平均値noise_allを、
15
noise_all= Σ noise_power(m,k)/16
k=0
により求める。
First, the band average value noise_all of the noise leak integrated value noise_power (m, k)
15
noise_all = Σ noise_power (m, k) / 16
k = 0
Ask for.
続いて、帯域パワーchannel_power(m,k)の帯域最低値min_band、及び雑音最小値noise_min(m,k)の帯域最大値max_bandをそれぞれ、
min_band=MIN (channel_power(m,k),k=2,…,11
max_band=MAX(noise_power(m,k),k=0,…,15)
により求める。
Subsequently, the band minimum value min_band of the band power channel_power (m, k) and the band maximum value max_band of the noise minimum value noise_min (m, k), respectively,
min_band = MIN (channel_power (m, k), k = 2,…, 11
max_band = MAX (noise_power (m, k), k = 0,…, 15)
Ask for.
次に、帯域共通の調整値mdを
md=(noise_all−min_all)*(1−sp/6)+(min_band−max_band)*sp/6
により決定する。この式によると、
sp=0すなわち雑音区間のとき、md=noise_all−min_all
sp=6すなわち音声区間のとき、md=min_band−max_band
となり、過渡域はこれらの中間の値をとることがわかる。
Next, the adjustment value md common to all bands
md = (noise_all−min_all) * (1−sp / 6) + (min_band−max_band) * sp / 6
Determined by According to this formula:
When sp = 0, that is, in the noise interval, md = noise_all−min_all
sp = 6, that is, md = min_band−max_band when the voice interval
Thus, it can be seen that the transition region takes an intermediate value between these.
雑音フレームの場合、及び音声フレームの場合の周波数対パワー特性の一例を、それぞれ図7及び図8に示す。
雑音フレームでは、図7に示すように、帯域パワーは雑音最小値に近くなる。雑音最小値に調整値を加えた値は、雑音最小値のスペクトル特性はそのままで平均値が雑音パワーの平均値noise_allに変更されたものとなる。
Examples of frequency versus power characteristics in the case of a noise frame and in the case of a speech frame are shown in FIGS. 7 and 8, respectively.
In the noise frame, as shown in FIG. 7, the band power is close to the noise minimum value. The value obtained by adding the adjustment value to the minimum noise value is obtained by changing the average value to the noise power average value noise_all without changing the spectral characteristics of the minimum noise value.
これに対し音声フレームの場合には、図8に示すように、雑音最小値に調整値を加えた値は、最小値のスペクトル特性はそのままで帯域の最大値が帯域パワーの最低値と一致するよう調整されることになる。
帯域別ゲインgain(m,k)は、帯域パワーchannel_power(m,k)と、雑音最小値noise_min(m,k)と、調整値とから次のように決定される。すなわち、帯域k において、
tmp=channel_power(m,k)−noise_min(m,k)−md−1.625
gain(m,k)={sqrt(1.4+0.49*tmp2)+0.7*tmp−9.5}*2
をk=0,…,15についてそれぞれ独立に求める。
なお、Sp=0のときは雑音であるので、上記の計算式に依らずすべての帯域でゲインを定数に、例えばgain(m,k)=−20に設定してもよい。
On the other hand, in the case of an audio frame, as shown in FIG. 8, the value obtained by adding the adjustment value to the minimum noise value is the same as the minimum value of the band power while the minimum spectral characteristics remain unchanged. Will be adjusted as follows.
The gain by band gain (m, k) is determined from the band power channel_power (m, k), the minimum noise value noise_min (m, k), and the adjustment value as follows. That is, in the band k,
tmp = channel_power (m, k) −noise_min (m, k) −md−1.625
gain (m, k) = {sqrt (1.4 + 0.49 * tmp2) + 0.7 * tmp−9.5} * 2
Are independently obtained for k = 0, ..., 15.
In addition, since it is noise when Sp = 0, the gain may be set to a constant in all bands regardless of the above formula, for example, gain (m, k) = − 20.
そして、以上のように求められた帯域別ゲインgain(m,k)は、乗算器23において帯域ごとに変換係数に乗算され、これによりノイズキャンセルがなされる。そして、このノイズキャンセルされた各帯域ごとの変換係数は、IFFT24において逆高速フーリエ変換されて時間軸上の信号フレームに戻されたのち、フレーム合成部25においてフレーム合成されて音声符号化回路16に供給される。
Then, the gain by band gain (m, k) obtained as described above is multiplied by the conversion coefficient for each band in the
以上述べたようにこの実施形態によれば、雑音最小値推定回路29において各帯域の雑音パワーの最小値を求め、この雑音最小値のスペクトル形状を帯域別ゲイン決定部33による帯域別ゲインの決定に用いるようにしているため、例えば自動車の通過時のような雑音スペクトルの短期的な変化に影響されず、音声スペクトルを歪ませにくいノイズキャンセル処理を実現することができる。
As described above, according to this embodiment, the noise minimum
またこの実施形態によれば、有意値計算部27において、しきい値が「1」を越える連続する複数の帯域の帯域別差の重み付け加算値を求め、この重み付け加算値を音声重み計算部28における音声重みの計算、つまりそのフレームが音声フレームであるか雑音フレームであるか、さらにはその中間の過渡域フレームであるかの判定に供している。このため、ただ1つの帯域のみで帯域別差がしきい値「1」を越えた場合には、これは雑音と見なして排除することができ、これにより音声/雑音/過渡域の判定を正確に行って、ノイズキャンセル性能を高めることができる。
In addition, according to this embodiment, the significant value calculation unit 27 obtains a weighted addition value of a difference for each band of a plurality of continuous bands whose threshold value exceeds “1”, and uses the weighted addition value as a voice
なお、この発明は上記実施形態に限定されるものではない。例えば、前記実施形態ではTDMA方式を採用したディジタル携帯電話装置を例にとって説明したが、CDMA方式を採用したディジタル携帯電話装置にもこの発明は適用可能である。
その他、ノイズキャンセラ内の各機能部の処理手順と処理内容、及びこの処理を実現するための回路構成又は処理プログラム等についても、この発明の要旨を逸脱しない範囲で種々変形して実施できる。
The present invention is not limited to the above embodiment. For example, in the above-described embodiment, the digital mobile phone device adopting the TDMA system has been described as an example. However, the present invention can also be applied to a digital mobile phone device adopting the CDMA system.
In addition, the processing procedure and processing contents of each functional unit in the noise canceller and the circuit configuration or processing program for realizing the processing can be variously modified without departing from the gist of the present invention.
1…アンテナ、2…アンテナ共用器(DUP)、3…受信回路(RX)、4…周波数シンセサイザ(SYN)、5…送信回路(TX)、6…ディジタル復調器(DEM)、7…ディジタル変調器(MOD)、8…時分割多元接続回路(TDMA)、9…誤り訂正符号復号回路(CH−COD)、10…音声復号回路(DEC)、11…D/A変換器、12…スピーカ、13…マイクロホン、14…A/D変換器、16…音声符号化回路(COD)、17…ノイズキャンセラ、18…制御回路、19…操作パネル部、21…フレーム分割部、22…高速フーリエ変換部(FFT)、23…乗算部、24…逆高速フーリエ変換部(IFFT)、25…フレーム合成部、26…帯域パワー計算部、27…有意値計算部、28…音声重み計算部、29…雑音最小値推定部、31…更新判定部、32…雑音リーク積分値更新部、33…帯域別ゲイン決定部。
DESCRIPTION OF
Claims (5)
前記周波数帯域ごとに信号のパワーを求め、この帯域パワーをもとに帯域別の雑音パワーを推定する雑音パワー推定手段と、
前記帯域パワー及び帯域別雑音パワーのうちの少なくとも一方について、複数のフレーム期間に渡りパワーの最小値を検出する最小値検出手段と、
前記周波数帯域ごとにその帯域パワーと前記最小値検出手段により検出された帯域別最小値との差を求め、この差をもとに周波数帯域別の雑音抑圧量を決定する抑圧量決定手段とを具備したことを特徴とするノイズキャンセラ。 In the noise canceller that divides the input signal into frames of a certain time length, divides the signals of these frames into a plurality of frequency bands, and performs noise suppression processing for each of these frequency bands,
Noise power estimating means for obtaining signal power for each frequency band and estimating noise power for each band based on the band power;
Minimum value detecting means for detecting a minimum value of power over a plurality of frame periods for at least one of the band power and the noise power for each band;
For each frequency band, a difference between the band power and the minimum value for each band detected by the minimum value detecting means is obtained, and a suppression amount determining means for determining a noise suppression amount for each frequency band based on the difference. A noise canceller characterized by comprising.
前記抑圧量決定手段は、音声区間及び雑音区間のうちの少なくとも音声区間において、前記帯域パワーと前記帯域別最小値との差に基づく帯域別の雑音抑圧量決定処理を行うことを特徴とする請求項1記載のノイズキャンセラ。 Further comprising means for determining a speech interval and a noise interval for the input signal;
The suppression amount determination means performs a noise suppression amount determination process for each band based on a difference between the band power and the minimum value for each band in at least a speech section of a speech section and a noise section. Item 2. The noise canceller according to Item 1.
前記送話入力信号を一定時間長のフレームに分割すると共に、これらのフレームの信号をそれぞれ複数の周波数帯域に分け、これらの周波数帯域ごとに雑音の抑圧処理を行うノイズキャンセラを具備し、
前記ノイズキャンセラは、
前記周波数帯域ごとに信号のパワーを求め、この帯域パワーをもとに帯域別の雑音パワーを推定する雑音パワー推定手段と、
前記帯域パワー及び帯域別雑音パワーのうちの少なくとも一方について、複数のフレーム期間に渡りパワーの最小値を検出する最小値検出手段と、
前記周波数帯域ごとにその帯域パワーと前記最小値検出手段により検出された帯域別最小値との差を求め、この差をもとに周波数帯域別の雑音抑圧量を決定する抑圧量決定手段とを備えたことを特徴とする通信装置。 In a communication apparatus that encodes and transmits a transmission input signal by a voice encoding unit,
The transmission input signal is divided into frames of a certain time length, and the signals of these frames are divided into a plurality of frequency bands, respectively, and a noise canceller that performs noise suppression processing for each of these frequency bands is provided,
The noise canceller is
Noise power estimating means for obtaining signal power for each frequency band and estimating noise power for each band based on the band power;
Minimum value detecting means for detecting a minimum value of power over a plurality of frame periods for at least one of the band power and the noise power for each band;
For each frequency band, a difference between the band power and the minimum value for each band detected by the minimum value detecting means is obtained, and a suppression amount determining means for determining a noise suppression amount for each frequency band based on the difference. A communication device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010089555A JP2010160521A (en) | 2010-04-08 | 2010-04-08 | Noise canceller, and communication device equipped with the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010089555A JP2010160521A (en) | 2010-04-08 | 2010-04-08 | Noise canceller, and communication device equipped with the same |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000162086A Division JP4580508B2 (en) | 2000-05-31 | 2000-05-31 | Signal processing apparatus and communication apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010160521A true JP2010160521A (en) | 2010-07-22 |
Family
ID=42577667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010089555A Withdrawn JP2010160521A (en) | 2010-04-08 | 2010-04-08 | Noise canceller, and communication device equipped with the same |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010160521A (en) |
-
2010
- 2010-04-08 JP JP2010089555A patent/JP2010160521A/en not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1938309B1 (en) | Method for suppressing receiver audio regeneration | |
US8280727B2 (en) | Voice band expansion device, voice band expansion method, and communication apparatus | |
JP4836720B2 (en) | Noise suppressor | |
US8102941B2 (en) | Peak suppression control apparatus | |
JP4580508B2 (en) | Signal processing apparatus and communication apparatus | |
US20160330064A1 (en) | Communication apparatus, demodulation apparatus, carrier reproduction apparatus, phase error compensation apparatus, phase error compensation method, and storage medium on which phase error compensation program has been stored | |
US5953381A (en) | Noise canceler utilizing orthogonal transform | |
US9008232B2 (en) | Method and apparatus for supporting frequency-quadrature amplitude modulation in wireless communication system | |
US9679577B2 (en) | Voice switching device, voice switching method, and non-transitory computer-readable recording medium having stored therein a program for switching between voices | |
US9070372B2 (en) | Apparatus and method for voice processing and telephone apparatus | |
JP2006174364A (en) | Multi-carrier signal transmission apparatus, multi-carrier signal reception apparatus, multi-carrier signal transmission method, multi-carrier signal reception method, and communication system | |
US9960866B1 (en) | Method and apparatus for signal-to-noise ratio (SNR) estimation | |
JP2002169599A (en) | Noise suppressing method and electronic equipment | |
JP2008309955A (en) | Noise suppresser | |
US8767974B1 (en) | System and method for generating comfort noise | |
JP4533517B2 (en) | Signal processing method and signal processing apparatus | |
JP2005202222A (en) | Noise suppressor and voice communication device provided therewith | |
US6496686B1 (en) | Mitigation of interference associated to the frequency of the burst in a burst transmitter | |
US8224265B1 (en) | Method for optimizing AM/AM and AM/PM predistortion in a mobile terminal | |
JP2010160521A (en) | Noise canceller, and communication device equipped with the same | |
US11223399B2 (en) | Base station and modulation method supporting lattice-partition-based non-orthogonal multiple access | |
JP3522986B2 (en) | Noise canceller and communication device using this noise canceller | |
JP2001320289A (en) | Noise canceler, communication equipment provided with the same and storage medium with noise cancel processing program stored therein | |
JPH11122143A (en) | Noise canceller and communication equipment provided with the noise canceller | |
US8582700B2 (en) | Reducing switching noise |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20101220 |