JP2002300687A - Electronic apparatus - Google Patents

Electronic apparatus

Info

Publication number
JP2002300687A
JP2002300687A JP2001095039A JP2001095039A JP2002300687A JP 2002300687 A JP2002300687 A JP 2002300687A JP 2001095039 A JP2001095039 A JP 2001095039A JP 2001095039 A JP2001095039 A JP 2001095039A JP 2002300687 A JP2002300687 A JP 2002300687A
Authority
JP
Japan
Prior art keywords
noise
value
band
voice
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001095039A
Other languages
Japanese (ja)
Other versions
JP4509413B2 (en
JP2002300687A5 (en
Inventor
Yuriko Tsukahara
由利子 塚原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001095039A priority Critical patent/JP4509413B2/en
Publication of JP2002300687A publication Critical patent/JP2002300687A/en
Publication of JP2002300687A5 publication Critical patent/JP2002300687A5/ja
Application granted granted Critical
Publication of JP4509413B2 publication Critical patent/JP4509413B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an electronic apparatus which realizes a satisfactory noise suppressing function and voice switch function. SOLUTION: The electronic apparatus comprises a voice switch for inserting a loss corresponding to a signal attenuation A in a transmitted or received signal and a noise canceler which detects voice components from the transmitted or received signal, computes a signal attenuation B and compares the attenuation A with the attenuation B to obtain an adjusted final signal attenuation C for suppressing noise.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声信号の送受を
取り扱う携帯電話などの電子機器に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an electronic device such as a portable telephone for handling transmission and reception of audio signals.

【0002】[0002]

【従来の技術】携帯電話などの音声の送受を行う通信シ
ステムにおいては、ハウリングなどの防止のため、ボイ
ススイッチが通信システムを構成する電子機器(携帯電
話など)に搭載されている。
2. Description of the Related Art In a communication system for transmitting and receiving voice such as a mobile phone, a voice switch is mounted on an electronic device (a mobile phone or the like) constituting the communication system in order to prevent howling or the like.

【0003】ボイススイッチは送受信の信号ループのな
かに恒常的にLOSSを挿入するものであり、受信信号
もしくは送信信号のどちらか一方に所定の信号低減量を
課すものである。
[0003] A voice switch constantly inserts a LOSS into a transmission / reception signal loop, and imposes a predetermined signal reduction amount on either a reception signal or a transmission signal.

【0004】一般的には、受話のみのときには送信信号
に、送話のみのときには受信信号にLOSSを挿入する
ように設定されている。いわゆるダブルトークの際もし
くは無話状態のときには、例えば、送話側にLOSSが
挿入されるように設定されている。
[0004] In general, a setting is made so that LOSS is inserted into a transmission signal when only reception is performed and into a reception signal when transmission is only performed. At the time of a so-called double talk or a non-talking state, for example, a setting is made so that a LOSS is inserted on the transmitting side.

【0005】また携帯電話など音声通信を行う電子機器
では、CELP(Code Excited Linear Prediction)方式
などの音声符号化方式が用いられている。
[0005] In an electronic device such as a portable telephone for performing voice communication, a voice coding system such as a CELP (Code Excited Linear Prediction) system is used.

【0006】このような機器を背景雑音の大きい環境下
で使用すると、この背景雑音が取り込まれて符号化され
音声の明瞭感が低下してしまう。そのため、背景雑音を
除去もしくは抑制して音声のみの信号に近づけて音声符
号化を行う技術(ノイズキャンセラ)が研究され、電子
機器に搭載されてきている。
When such a device is used in an environment with a large amount of background noise, the background noise is taken in and coded, and the intelligibility of speech is reduced. For this reason, a technology (noise canceller) for removing or suppressing background noise so as to approach a signal containing only speech and performing speech coding has been studied, and has been mounted on electronic devices.

【0007】[0007]

【発明が解決しようとする課題】前述のごとく、ボイス
スイッチ及びノイズキャンセラはそれぞれ異なる目的を
有するため、両者を備えた電子機器においては、それぞ
れ独自にその機能を発揮するように個別に動作してい
る。
As described above, since the voice switch and the noise canceller have different purposes, respectively, electronic devices equipped with both operate independently to exhibit their functions. .

【0008】従って両者が同一の信号系(たとえば送話
系)に信号低減をいれた場合はどちらの機能にとっても
必要以上の信号低減が行われてしまうという問題点があ
る。
[0008] Therefore, there is a problem that when both of the functions reduce the signal in the same signal system (for example, the transmission system), the signal is reduced more than necessary for both functions.

【0009】また、音声検出機能及び信号低減機能は共
通の機能である。従って信号処理的には冗長な領域が存
在していることになる。
The voice detection function and the signal reduction function are common functions. Accordingly, a redundant area exists in signal processing.

【0010】本発明は以上の点を考慮してなされたもの
であり、ノイズキャンセラとボイススイッチとを有する
際の音声信号処理が改善された電子機器の提供を目的と
する。
The present invention has been made in consideration of the above points, and has as its object to provide an electronic apparatus in which a sound signal processing when a noise canceller and a voice switch are provided is improved.

【0011】[0011]

【課題を解決するための手段】本発明は、送信信号また
は受信信号に信号低減量(A)のLOSS挿入を行うボ
イススイッチと;送信信号または受信信号から音声検出
を行いノイズ抑制のための信号低減量(B)を算定し、
前記信号低減量(A)と前記信号低減量(B)とを比較
して調整された最終信号低減量(C)でノイズ抑制を行
うノイズキャンセラとを備えたことを特徴とする電子機
器である。
SUMMARY OF THE INVENTION The present invention provides a voice switch for inserting a LOSS of a signal reduction amount (A) into a transmission signal or a reception signal; a signal for detecting noise from the transmission signal or the reception signal and suppressing noise. Calculate the reduction (B),
An electronic apparatus comprising: a noise canceller that performs noise suppression with a final signal reduction amount (C) adjusted by comparing the signal reduction amount (A) and the signal reduction amount (B).

【0012】すなわちボイススイッチによる信号低減量
(A)とノイズキャンセラによる信号低減量(B)とを
単純に加算することなく、両者を比較して適正な信号減
衰量を決定するというものである。
That is, without simply adding the signal reduction amount (A) by the voice switch and the signal reduction amount (B) by the noise canceller, the two are compared to determine an appropriate signal attenuation amount.

【0013】一般的にノイズキャンセラの方がきめ細か
いノイズ低減を行うように動作するので(信号減衰量の
時間変化が細やか)、ノイズキャンセラの信号低減量
(B)を基準に送信/受信系に挿入する信号低減量を決
定することが好ましい。
In general, since the noise canceller operates to perform finer noise reduction (the time variation of the signal attenuation is small), the signal inserted into the transmission / reception system based on the signal reduction (B) of the noise canceller is used as a reference. It is preferred to determine the amount of reduction.

【0014】しかしながらハウリング防止などの観点か
ら一定量の信号低減は送信/受信系のいずれかには入れ
る必要がある。
However, from the viewpoint of howling prevention, a certain amount of signal reduction needs to be included in any of the transmission / reception systems.

【0015】従って、信号低減量の基準としてはノイズ
キャンセラの信号低減量(B)を採用し、信号低減量の
上限(絶対値としては下限)をボイススイッチの信号低
減量(A)とすることが好ましい。
Therefore, the signal reduction amount (B) of the noise canceller is adopted as a reference of the signal reduction amount, and the upper limit (absolute value lower limit) of the signal reduction amount is set as the signal reduction amount (A) of the voice switch. preferable.

【0016】すなわち、ノイズキャンセラの信号低減量
(B)がボイススイッチの信号低減量(A)以下となる
ように調整することで達成できる。
That is, it can be achieved by adjusting the signal reduction amount (B) of the noise canceller to be equal to or less than the signal reduction amount (A) of the voice switch.

【0017】またボイススイッチのLOSSは送信系,
受信系のいずれかに挿入されるが、その判断は送信系/
受信系のどちらに音声信号が存在するかの判断による。
この判断手法は種々の方法があり特段限定するものでは
ない。
The voice switch LOSS is a transmission system,
It is inserted into any of the receiving systems, but the judgment is
It depends on which of the receiving systems has the audio signal.
There are various methods for this determination, and there is no particular limitation.

【0018】しかしながら、ノイズキャンセラでも音声
信号の有無の判断を行っているので、この結果を利用す
ることでボイススイッチにおける独自の音声信号有無検
出の処理を省略することができる。
However, since the noise canceller also determines the presence / absence of an audio signal, the use of this result makes it possible to omit the unique voice signal presence / absence detection processing in the voice switch.

【0019】本発明は、送信信号または受信信号から音
声検出を行いノイズ抑制を行うノイズキャンセラと;前
記ノイズキャンセラにおける音声検出の結果を受け、送
信信号または受信信号にLOSS挿入を行うボイススイ
ッチとを備えたことを特徴とする電子機器も提供する。
The present invention comprises: a noise canceller for detecting a voice from a transmission signal or a reception signal to suppress noise; and a voice switch for receiving a result of the voice detection in the noise canceller and inserting LOSS into the transmission signal or the reception signal. An electronic device characterized by the above is also provided.

【0020】本発明で用いるノイズキャンセラとしては
時間領域におけるノイズ抑制方式,周波数領域における
ノイズ抑制方式など各種方式を採用することができる。
As the noise canceller used in the present invention, various methods such as a noise suppression method in a time domain and a noise suppression method in a frequency domain can be adopted.

【0021】例えば特許2995737号公報には、入
力信号を所定期間のフレームに分割し、フレーム毎に雑
音/音声を判断し、雑音フレームと判断された場合には
帯域別のゲイン値を最小に設定し、音声フレームと判断
された場合にはそれを超えるゲイン値を設定し、ノイズ
抑圧を行う方式が開示されており、これを用いることも
できる。
For example, in Japanese Patent No. 2995737, an input signal is divided into frames of a predetermined period, noise / speech is determined for each frame, and when a noise frame is determined, a gain value for each band is set to a minimum. However, there is disclosed a method of setting a gain value exceeding that when an audio frame is determined and performing noise suppression, and this method can also be used.

【0022】また、入力信号を定められた時間単位のフ
レームに分割し、この分割されたフレームを所定の周波
数帯域に分割し、この分割された帯域ごとに雑音の抑圧
処理を行うノイズ抑制方法において:前記フレームが雑
音フレームであるか音声フレームであるかの判定を行う
音声フレーム判定ステップと;前記音声フレーム判定ス
テップの結果に基づき各フレームの帯域別ゲイン値を設
定する帯域別ゲイン決定ステップと;前記帯域ゲイン決
定ステップにより決定された帯域別ゲイン値を用いて帯
域毎に雑音抑圧を行った後にフレームを再構成して雑音
抑制された出力信号を生成する信号生成ステップとを具
備し、前記帯域別ゲイン決定ステップでは、決定対象の
フレームが音声フレームであると判定された場合の帯域
別ゲイン値が、決定対象のフレームが雑音フレームであ
ると判定された場合の帯域別ゲイン値より小さい値を取
り得るように帯域別ゲイン値の設定が行われることを特
徴とするノイズキャンセラを採用することもできる。
A noise suppression method for dividing an input signal into frames in a predetermined time unit, dividing the divided frames into predetermined frequency bands, and performing noise suppression processing for each of the divided bands. : An audio frame determining step of determining whether the frame is a noise frame or an audio frame; a band-specific gain determining step of setting a band-specific gain value of each frame based on the result of the audio frame determining step; A signal generation step of generating a noise-suppressed output signal by reconstructing a frame after performing noise suppression for each band using the gain value for each band determined in the band gain determination step, In the separate gain determination step, the gain value for each band when the determination target frame is determined to be an audio frame is determined. It is also possible to employ a noise canceller, characterized in that the target frame is set in the band-specific gain value to be taken per-band gain value smaller than the value when it is determined that the noise frame.

【0023】この方式では音声フレーム内での音声成分
を含まない帯域のノイズ抑制が十分に行われ、良好なノ
イズ低減を行うことができる。すなわち、雑音抑圧を行
う際の帯域別のゲイン値を音声フレームと雑音フレーム
とで区別して決定するだけではなく、雑音フレームの帯
域別最小ゲイン値よりも音声フレームの帯域別最小ゲイ
ン値の方が小さくなるように設定することで、ノイズ抑
圧後の音声信号の聴感が改善されるている。
In this method, noise in a band that does not include a sound component in a sound frame is sufficiently suppressed, and good noise reduction can be performed. That is, not only is the band-specific gain value for noise suppression determined separately for a voice frame and a noise frame, but the minimum gain value for each band of a voice frame is greater than the minimum gain value for each band of a noise frame. By setting to be smaller, the audibility of the audio signal after noise suppression is improved.

【0024】音声フレームと判断されたフレームでも全
ての帯域に音声成分が含まれているとは限らない。音声
フレームと判断されたフレーム内の音声成分が含まれな
い(若しくは音声成分が少ない)と推定される帯域に関
しては、雑音フレームの帯域別ゲイン値より小さいゲイ
ンを設定し、音声フレーム内での音声成分の含まれる帯
域を際立たせることで良好な聴感が得られるのである。
Even if a frame is determined to be an audio frame, not all bands contain audio components. For a band in which it is estimated that the audio component in the frame determined to be an audio frame is not included (or the audio component is small), a gain smaller than the band-specific gain value of the noise frame is set and the audio in the audio frame By making the band containing the component stand out, a good audibility can be obtained.

【0025】すなわち、決定対象フレームが音声フレー
ムであると判定されたフレーム内の音声成分が含まれな
いと推定された帯域の帯域別ゲイン値を、決定対象のフ
レームが雑音フレームであると判定された場合の帯域別
ゲイン値より小さい値を取るように帯域別ゲイン値の設
定を行うことにより、音声フレーム内の音声成分を含む
帯域をより際立たせることができ、結果として聴感の良
好なノイズ抑圧された出力信号を得ることができる。
That is, the gain value for each band of the band in which it is estimated that the speech component is not included in the frame determined to be the speech frame to be determined is determined to be the noise frame. By setting the gain value for each band so as to take a value smaller than the gain value for each band, the band including the audio component in the audio frame can be made more prominent, and as a result, noise suppression with good audibility can be achieved. The obtained output signal can be obtained.

【0026】なお、雑音フレームにおいては、各帯域に
関し一定値のゲイン値を設定する様にしても良いし、帯
域別パワーと雑音パワーとの差に基づいて変化するよう
に設定してもよい。
In the noise frame, a constant gain value may be set for each band, or it may be set to change based on the difference between the power for each band and the noise power.

【0027】また、音声フレームに関しては帯域別パワ
ーと雑音パワーの差に基づく指標が大きくなるにつれ帯
域別ゲイン値が大きくなるように設定し、この指標が所
定値以下の場合は一定値とする設定も可能である。連続
的に減少する関数を採用することも構わない。
Also, with respect to the voice frame, the gain value for each band is set so as to increase as the index based on the difference between the power for each band and the noise power increases. Is also possible. A function that decreases continuously may be employed.

【0028】このようなノイズ抑制方法においては、前
述の帯域別ゲインを決定する前段階として、雑音パワー
の推定値の更新を行う段階がある。この雑音推定値は、
所定の条件で更新され、例えば特表平10−51303
0号に開示されたノイズ抑圧方法に開示された更新方法
を採用することができる。
In such a noise suppression method, there is a step of updating the estimated value of the noise power as a step before determining the above-described gain for each band. This noise estimate is
It is updated under a predetermined condition.
The update method disclosed in the noise suppression method disclosed in No. 0 can be adopted.

【0029】この更新方法は、各フレームの個々の帯域
ごとのSNR(信号エネルギ/雑音エネルギの対数値)
に重み付けを行ったものの合計であるボイスメトリック
を用いるものであり、個々の帯域ごとの偏差(信号エネ
ルギの対数値−過去の信号エネルギの平均値の対数値)
の絶対値をとったものの合計であるスペクトル偏差を用
いて雑音推定値を更新する技術であり、このスペクトル
偏差がしきい値を一定時間(例えば1秒間)下回った場
合は推定雑音値が更新される。
This updating method uses the SNR (log value of signal energy / noise energy) for each band of each frame.
The voice metric, which is the sum of the weighted values, is used, and the deviation for each band (log value of signal energy−log value of average value of past signal energy)
Is a technique for updating a noise estimation value using a spectrum deviation that is a sum of absolute values of the noises. If the spectrum deviation falls below a threshold for a predetermined time (for example, one second), the estimated noise value is updated. You.

【0030】また、スペクトル偏差の値をそのまま判定
に用いるのではなく、過去フレームとの間で、帯域パワ
ーと雑音パワーとの差の偏差合計をその平均値で正規化
し、この正規化値をもとに雑音区間の判定を行うこと
で、上記方法に比べフレーム間の変動の大きい雑音を雑
音として認識することができる方法を採用することもで
きる。
Also, instead of using the value of the spectral deviation as it is for determination, the total deviation of the difference between the band power and the noise power between the previous frame and the previous frame is normalized by the average value. By determining the noise section at this time, a method can be adopted in which noise having a large inter-frame variation compared to the above method can be recognized as noise.

【0031】すなわち、帯域別パワーと帯域別雑音パワ
ー推定値との差に所定の重み付けを行った帯域別有意値
(suby)の現フレームと前フレームとの差を合計した値(s
um)を、その平均値(sum_average)で正規化した比率(r)
をもとに現フレームが雑音フレームであるか否かの判定
を行う方法である。
That is, a significant value for each band in which a difference between the power for each band and the estimated noise power value for each band is weighted in a predetermined manner.
(suby) The sum of the difference between the current frame and the previous frame (s
um) is the ratio (r) normalized by the average value (sum_average)
Is a method for determining whether or not the current frame is a noise frame based on

【0032】このように過去フレームとの帯域別有意値
(suby)の偏差を利用し、この偏差合計値の平均値で偏差
を正規化した値を判定根拠に用いることでフレーム毎の
ばらつきを緩和することができるので、安定した雑音フ
レーム判定を行うことができる。従ってフレーム間のば
らつきが大きい雑音に対しても雑音としての認識を良好
に行うことができる。
As described above, the significant value for each band with respect to the past frame
Using the deviation of (suby) and normalizing the deviation with the average value of the total deviation value as the basis for the determination, it is possible to mitigate the variation for each frame. Can be. Therefore, it is possible to satisfactorily recognize noise having large inter-frame variations as noise.

【0033】より詳細に説明すると、送信入力信号を定
められた時間単位のフレームに分割するフレーム分割ス
テップと;各々のフレームについて複数の周波数帯域に
分割する周波数帯域分割ステップと;各々の周波数帯域
について帯域別パワー(channel_power)を算定する帯域
別パワー算定ステップと;各々の周波数帯域について帯
域別雑音パワー推定値(noise_power)と前記帯域別パワ
ー(chennel_power)との差(tmp)を算定し、この差(tmp)
に所定の重み付けを行って得た帯域別有意値(suby)を所
定の条件にて加算した有意値(y)を算定する有意値算定
ステップと;現フレームと前のフレームとの間で、各々
の周波数帯域について帯域別有意値(suby)の差の絶対値
和(sum)をとる帯域別有意値和算定ステップと;前記絶
対値和(sum)の平均値(sum_average)を算定し、前記絶
対値和(sum)をこの絶対値和の平均値(sum_average)で
正規化した比率(r)を算定する有意値正規化ステップ
と;を有する。
More specifically, a frame dividing step of dividing a transmission input signal into frames in a predetermined time unit; a frequency band dividing step of dividing each frame into a plurality of frequency bands; Calculating a power for each band (channel_power); calculating a difference (tmp) between a noise power estimation value for each band (noise_power) and the power for each band (chennel_power) for each frequency band; (tmp)
A significant value calculating step of calculating a significant value (y) obtained by adding a significant value (suby) for each band obtained by performing a predetermined weighting on a predetermined condition; and between a current frame and a previous frame, Calculating the sum of the absolute values (sum) of the differences of the significant values (suby) of the respective bands for the frequency band of; and calculating the average value (sum_average) of the sum of the absolute values (sum); A significant value normalizing step of calculating a ratio (r) obtained by normalizing the sum of values (sum) by the average value (sum_average) of the sum of absolute values.

【0034】雑音パワー推定値の更新は以下の2種類の
ステップを有する。
Updating the noise power estimate has the following two steps.

【0035】すなわち、前記有意値(y)が所定のしきい
値を下回った場合に現フレームを雑音フレームと判断
し、前記帯域別雑音パワー推定値(noise_power)を更新
する第1の雑音パワー推定値更新ステップと;前記比率
(r)が所定のしきい値を所定の期間連続して下回った際
に現フレームを雑音フレームと判断し、前記帯域別雑音
パワー推定値(noise_power)の更新を行う第2の雑音パ
ワー推定値更新ステップとである。
That is, when the significant value (y) falls below a predetermined threshold value, the current frame is determined to be a noise frame, and the first noise power estimation value for updating the noise power estimation value (noise_power) for each band is determined. Updating the value; the ratio
When (r) continuously falls below a predetermined threshold for a predetermined period, the current frame is determined to be a noise frame, and the second noise power estimation value for updating the noise power estimation value for each band (noise_power) Update step.

【0036】上記第1の雑音パワー推定値更新ステップ
は、良好に雑音推定が行われて有意値判定により雑音フ
レームであると判定される場合であり、第2の雑音パワ
ー推定値更新ステップは、有意値がフレーム間でばらつ
いたりして有意値では良好な雑音フレーム判定ができな
い場合でも強制更新を可能とするものである。
The first noise power estimation value updating step is a case where noise estimation is performed satisfactorily and the frame is determined to be a noise frame by a significant value determination. The second noise power estimation value updating step includes: Even if a significant value varies between frames and a good noise value cannot be determined with a significant value, forced updating can be performed.

【0037】なお正規化に用いる平均値は、前記絶対値
和(sum)のリーク積分を用いての推定値を使用すること
ができる。また、前記絶対値和(sum)の標準偏差のリー
ク積分を用いて得られた前記平均値(sum_average)の推
定値を用いることも可能である。
As the average value used for normalization, an estimated value obtained by using leak integration of the sum of absolute values (sum) can be used. Further, it is also possible to use an estimated value of the average value (sum_average) obtained by using leak integration of a standard deviation of the sum of absolute values (sum).

【0038】なお、前述の帯域別のゲイン設定に際して
は、音声フレームの場合と雑音フレームの場合とで異な
る関数を用いてその帯域別ゲイン値を決定すすことにな
るが、ゲイン値決定の変数は基本的には帯域別パワーと
帯域別ノイズパワーとの差(対数では差:SNR)をも
とに算出される。すなわち音声フレームでSNRが大き
い帯域は音声成分を含んでいる帯域と推定されるので、
その帯域のゲイン値は大きく設定され、SNRが小さい
帯域は音声成分を含んでいないと推定され、そのゲイン
値は小さく設定される。
In the above-described gain setting for each band, the gain value for each band is determined by using a different function between the case of a voice frame and the case of a noise frame. Basically, it is calculated based on the difference between the power for each band and the noise power for each band (difference in logarithm: SNR). That is, a band having a large SNR in a voice frame is presumed to be a band containing a voice component.
The gain value of the band is set to a large value, the band having a small SNR is estimated to contain no voice component, and the gain value is set to a small value.

【0039】ところで、雑音(Background Noise)は一
般に定常と仮定されるが、屋外では変動する場合があ
る。特に、自動車が通り過ぎるときに発生する雑音のエ
ネルギは自動車の接近とともに大きくなる。この状態で
送話音声が入力されると、音声と雑音とのエネルギ差が
小さいため、抑圧後の音声を歪ませることがある。ま
た、雑音のスペクトル形状と音声のスペクトル形状が似
ている場合も、雑音エネルギをもとに抑圧を行うと音声
のスペクトルに干渉しやすくなるため、抑圧後の音声に
歪みが発生する。雑音エネルギが変動した場合でもその
影響を排除して安定な雑音抑圧処理を行えるように、S
NRを基本としながら、ゲイン値決定の変数を調整する
ことでそのような影響を抑えることも可能である。
Incidentally, noise (Background Noise) is generally assumed to be stationary, but may fluctuate outdoors. In particular, the energy of noise generated when a vehicle passes by increases as the vehicle approaches. If the transmitted voice is input in this state, the suppressed voice may be distorted because the energy difference between the voice and the noise is small. Also, when the spectral shape of the noise is similar to the spectral shape of the voice, the suppression of the noise based on the noise energy makes it easier to interfere with the voice spectrum, so that the suppressed voice is distorted. Even if the noise energy fluctuates, S
It is also possible to suppress such an effect by adjusting the variable for determining the gain value while using the NR as a basis.

【0040】このような調整は、前記帯域別ゲイン値の
決定に際し、前記周波数帯域ごとに信号のパワーを求
め、この帯域パワーをもとに帯域別の雑音パワーを推定
する雑音パワー推定ステップと;前記帯域パワー及び帯
域別雑音パワーのうちの少なくとも一方について、複数
のフレーム期間に亘りパワーの最小値を検出する最小値
検出ステップと;前記周波数帯域ごとにその帯域パワー
と前記最小値検出ステップにより検出された帯域別最小
値との差を求める帯域別最小値決定ステップから求めら
れた差をもとに周波数帯域別の雑音抑圧量を決定するこ
とにより行うことができる。
In the above-mentioned adjustment, a noise power estimating step of obtaining a signal power for each frequency band and estimating a noise power for each band based on the band power when determining the gain value for each band; A minimum value detecting step of detecting a minimum value of power over at least one of the band power and the band-specific noise power over a plurality of frame periods; and detecting the band power and the minimum value detecting step for each of the frequency bands. This can be performed by determining the noise suppression amount for each frequency band based on the difference obtained from the band-specific minimum value determining step for obtaining the difference from the obtained band-specific minimum value.

【0041】さらに、フレームごとに異なる帯域共通の
調整値を生成する調整値を用い、前記周波数帯域ごと
に、前記帯域別最小値と前記調整値を加えた値とその帯
域パワーとの差を求め、この差をもとに周波数帯域別の
雑音抑圧量を決定することにより行うこともできる。
Further, using an adjustment value for generating an adjustment value common to different bands for each frame, a difference between a value obtained by adding the minimum value for each band and the adjustment value and the band power is obtained for each frequency band. It is also possible to determine the amount of noise suppression for each frequency band based on this difference.

【0042】この調整値は、雑音区間においては、前記
帯域別最小値間の平均値と前記帯域別雑音パワー間の平
均値との差に基づいて帯域共通の調整値を決定し;音声
区間においては、1フレームにおける複数の帯域パワー
の中の最小値と複数の帯域別最小値の中の最大値との差
に基づいて帯域共通の調整値を決定することで得ること
ができる。
In the noise section, an adjustment value common to the bands is determined based on the difference between the average value between the minimum values for the respective bands and the average value between the noise powers for the respective bands; Can be obtained by determining an adjustment value common to bands based on a difference between a minimum value among a plurality of band powers in one frame and a maximum value among a plurality of band-specific minimum values.

【0043】なお、音声フレームと雑音フレームとの判
定には:周波数帯域ごとに信号のパワーを求め、この帯
域パワーをもとに帯域別の雑音パワーを推定する雑音パ
ワー推定ステップと;前記周波数帯域ごとに帯域別雑音
パワーと帯域パワーとの差を求め、これらの帯域別差を
所定のしきい値と比較する比較ステップと;周波数順に
配列された前記各帯域別差のうち隣接する複数の帯域の
帯域別差がしきい値を超えると判定された場合に、これ
らの帯域別差を所定の重み付けを行った上で相互に加算
する加算ステップと;この加算ステップにより得られた
帯域別差の加算値に基づいて、前記入力信号について音
声区間か雑音区間であるかを判定する判定ステップとか
らなる判定方法を採用することができる。
In the determination of a speech frame and a noise frame, a noise power estimating step of obtaining signal power for each frequency band and estimating noise power for each band based on the band power; Comparing the difference between the noise power and the band power for each band and comparing the difference for each band with a predetermined threshold value; a plurality of adjacent bands among the differences for each band arranged in frequency order The difference between the bands is determined to exceed the threshold value, the band-by-band difference is weighted by a predetermined weight, and then added to each other; And a determining step of determining whether the input signal is a voice section or a noise section based on the added value.

【0044】この加算ステップでは、各帯域別差に対
し、周波数が高くなるに従い重みが小さくなるような重
み付けを行うことができ、前記判定ステップでは、前記
加算値に基づいて、前記入力信号について音声区間か、
雑音区間か或いは両区間の中間領域である過渡区間かを
判定することが可能である。
In the adding step, the difference for each band can be weighted so that the weight decreases as the frequency increases. In the determining step, the voice of the input signal is determined based on the added value. Section or
It is possible to determine whether it is a noise section or a transition section which is an intermediate area between both sections.

【0045】この様な本発明は、ACELP,EVR
C,EFR,AMRなどの各種音声符号化方式を用いた
ディジタル音声符号化方法を採用する携帯電話など電子
機器に適応できる。すなわち、音声信号入力部(マイク
などの直接入力手段,電子ファイルなどからの信号送出
でも構わない)と、音声符号化部とを有する電子機器に
おいて、音声信号入力部の音声信号を受け、上述のノイ
ズ抑制方法によりノイズ抑制された信号を音声符号化部
へ供給するノイズキャンセラと、前述のボイススイッチ
とを具備した電子機器である。
The present invention as described above uses ACELP, EVR
The present invention can be applied to an electronic device such as a mobile phone adopting a digital voice coding method using various voice coding methods such as C, EFR, and AMR. That is, in an electronic device having an audio signal input unit (a direct input unit such as a microphone or a signal transmitted from an electronic file or the like) and an audio encoding unit, the audio signal of the audio signal input unit is received, and An electronic apparatus includes a noise canceller that supplies a signal whose noise has been suppressed by the noise suppression method to a speech encoding unit, and the above-described voice switch.

【0046】なおボイススイッチ,ノイズキャンセラ
は、例えば音声符号化などと同様にDSP内の信号処理
により実行することが可能である。
The voice switch and the noise canceller can be executed by signal processing in the DSP in the same manner as, for example, speech coding.

【0047】[0047]

【発明の実施の形態】本発明の実施態様を説明する。DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described.

【0048】図1は本発明の実施態様を示す電子機器の
概略ブロック図である。
FIG. 1 is a schematic block diagram of an electronic apparatus showing an embodiment of the present invention.

【0049】受話信号(1)は受話信号増幅器(2)を
介してスピーカなどの音声出力器(3)に供給される。
またマイクなどの音声入力器(4)からの入力信号はノ
イズキャンセラNC(5)を介して送話信号(9)とし
て送り出される。
The reception signal (1) is supplied to an audio output device (3) such as a speaker via a reception signal amplifier (2).
An input signal from a voice input device (4) such as a microphone is transmitted as a transmission signal (9) via a noise canceller NC (5).

【0050】ボイススイッチVS(6)は、受話信号か
ら受話信号中の音声信号の有無を検出し、またノイズキ
ャンセラNC(5)から送話信号中の音声信号の有無を
示す信号sp[音声検出フラグ]を受け取る。その結果
からダブルトーク判定部DTD(7)で送受話信号のど
ちらに音声信号が含まれているかを判断する。
The voice switch VS (6) detects the presence or absence of an audio signal in the received signal from the received signal, and outputs a signal sp [voice detection flag] indicating the presence or absence of the audio signal in the transmitted signal from the noise canceller NC (5). ] Is received. Based on the result, the double talk determination unit DTD (7) determines which of the transmission and reception signals contains the audio signal.

【0051】この判断結果を受けてLOSS決定部
(8)では、設定に基づき送信系/受信系に挿入するL
OSSを決定し、増幅器(2)にはR_lossを、ノ
イズキャンセラNC(5)にはS_lossを通知す
る。
In response to the result of this judgment, the LOSS determining section (8) sets L to be inserted into the transmission system / reception system based on the setting.
The OSS is determined, and R_loss is notified to the amplifier (2) and S_loss is notified to the noise canceller NC (5).

【0052】この設定としては、例えば、一定量のVS
_loss(例えば−12dB)を送話/受話のどちら
か一方に挿入するものとする。
As this setting, for example, a certain amount of VS
_Loss (for example, −12 dB) is inserted into one of the transmission and reception.

【0053】音声の有無により4個のケースがあり下記
のように設定される。 (1)受話(音声なし)/送話(音声なし):S_lo
ss=VS_loss (2)受話(音声有り)/送話(音声なし):S_lo
ss=VS_loss (3)受話(音声なし)/送話(音声有り):R_lo
ss=VS_loss (4)受話(音声有り)/送話(音声有り):S_lo
ss=VS_loss VS_lossの挿入されなかった方の減衰量は“0”
とする。
There are four cases depending on the presence or absence of voice, and are set as follows. (1) Receive (no voice) / Transmit (no voice): S_lo
ss = VS_loss (2) Reception (with voice) / Transmission (without voice): S_lo
ss = VS_loss (3) Receive (no voice) / Transmit (with voice): R_lo
ss = VS_loss (4) Received (with voice) / Transmitted (with voice): S_lo
ss = VS_loss The attenuation of the non-inserted VS_loss is “0”
And

【0054】この設定は適宜変更することが可能であ
る。例えば、ボイススイッチの切り替え時(VS_lo
ssから“0”への切り替え)には急激に減衰量が変化
するのでいわゆるスイッチ感がユーザーに感じられる。
これを低減するため、切り替え時に減衰量に傾きをつけ
ることも可能である。
This setting can be changed as appropriate. For example, when switching the voice switch (VS_lo
Since the amount of attenuation changes rapidly when switching from ss to "0", the user feels a so-called switch feeling.
In order to reduce this, it is possible to make the amount of attenuation slope at the time of switching.

【0055】このボイススイッチの決定する信号減衰量
(A)とノイズキャンセラの決定する信号減衰量(B)
とから送話/受話信号の信号減衰量を決定する。
The signal attenuation determined by the voice switch (A) and the signal attenuation determined by the noise canceller (B)
Thus, the signal attenuation of the transmission / reception signal is determined.

【0056】本実施例では、受話信号の信号減衰量はボ
イススイッチの信号減衰量(A)となり、送話信号の信
号低減量はボイススイッチの信号低減量(A)で制御さ
れたノイズキャンセラの最終信号減衰量(C)となる。
In this embodiment, the signal attenuation of the received signal is the signal attenuation of the voice switch (A), and the signal reduction of the transmission signal is the final value of the noise canceller controlled by the signal reduction (A) of the voice switch. This is the signal attenuation (C).

【0057】すなわち、ノイズキャンセラがノイズ低減
のために算定した信号減衰量が、ボイススイッチが提供
する信号減衰量より大きい場合はノイズキャンセラの信
号減衰量を採用し、ボイススイッチが提供する信号減衰
量よりノイズキャンセラの信号減衰量が小さい場合はボ
イススイッチが提供する信号減衰量を採用する。
That is, if the signal attenuation calculated by the noise canceller for noise reduction is larger than the signal attenuation provided by the voice switch, the signal attenuation of the noise canceller is adopted, and the noise cancellation is made smaller than the signal attenuation provided by the voice switch. If the signal attenuation is small, the signal attenuation provided by the voice switch is adopted.

【0058】従って、送話信号の最終信号低減量は、ボ
イススイッチの提供する信号減衰量を上限とした形で推
移することになる。
Therefore, the final signal reduction amount of the transmission signal changes with the signal attenuation amount provided by the voice switch as an upper limit.

【0059】送話側の音声信号の有無もボイススイッチ
で送話信号を取り込んで同様の処理を施すことで判定し
てもよいが、本実施形態では送話信号中の音声の有無は
ノイズキャンセラの判断を用いる設定にしている。
The presence / absence of a voice signal on the transmitting side may be determined by taking in the voice signal with a voice switch and performing similar processing, but in the present embodiment, the presence / absence of voice in the voice signal is determined by the noise canceller. The setting uses judgment.

【0060】次にノイズキャンセラの動作について説明
する。
Next, the operation of the noise canceller will be described.

【0061】ノイズキャンセラは例えばDSP(Digita
l Signal Processor)により実現されるものであり、そ
の処理プログラムはノイズキャンセラ内のメモリまたは
制御回路に付属するメモリに格納されている。図2はこ
の処理プログラムにより実現される機能構成を示すノイ
ズキャンセラのブロック図である。
The noise canceller is, for example, a DSP (Digita
l Signal Processor), and the processing program is stored in a memory in the noise canceller or a memory attached to the control circuit. FIG. 2 is a block diagram of a noise canceller showing a functional configuration realized by the processing program.

【0062】マイクなどの音声入力部からの音声信号が
A/D変換されたデジタル音声信号は、まずフレーム分
割部21に入力される。フレーム分割部は、例えば12
8サンプルに整えられたフレームを出力する(フレーム
分割ステップ)。このときディジタル送話信号を例えば
80サンプルのフレームに分割した後、ウインドウがけ
を行うことによりフレーム端をオーバーラップさせても
構わない。このディジタル送話信号フレームを高速フー
リエ変換部(FFT)22に入力する。
A digital audio signal obtained by A / D converting an audio signal from an audio input unit such as a microphone is first input to a frame division unit 21. The frame division unit is, for example, 12
The frames arranged into eight samples are output (frame division step). At this time, the digital transmission signal may be divided into, for example, frames of 80 samples, and then the frame ends may be overlapped by windowing. The digital transmission signal frame is input to a fast Fourier transform unit (FFT) 22.

【0063】FFT22の出力はノイズキャンセラの最
終信号低減量(C)を決定する最終低減量決定部34か
らの出力に基づき乗算器23にてノイズ抑制がなされ、
IFFT部24にて逆FFTをかけフレーム合成部25
にてフレームに戻し、送信信号として出力される。
The output of the FFT 22 is subjected to noise suppression in the multiplier 23 based on the output from the final reduction amount determining section 34 for determining the final signal reduction amount (C) of the noise canceller.
IFFT unit 24 performs inverse FFT and frame synthesis unit 25
To return to the frame and output as a transmission signal.

【0064】また、FFT22の出力は帯域パワー計算
部26に入力され、その出力は有意値計算部27及び帯
域別ゲイン決定部33に供給される。また更新判定部3
1の判定結果により雑音リーク積分値更新部32にもそ
の出力が供給される。
The output of the FFT 22 is input to a band power calculator 26, and the output is supplied to a significant value calculator 27 and a band-specific gain determiner 33. Update determination unit 3
According to the determination result of 1, the output is also supplied to the noise leak integration value updating unit 32.

【0065】有意値計算部27の出力は更新判定部31
及び音声重み計算部28に供給される。
The output of the significant value calculator 27 is sent to the update determiner 31
And a voice weight calculator 28.

【0066】雑音リーク積分値更新部32の出力は、有
意値計算部27,音声重み計算部28及び帯域別ゲイン
決定部33に供給される。
The output of the noise leak integrated value updating unit 32 is supplied to a significant value calculating unit 27, a voice weight calculating unit 28, and a band-specific gain determining unit 33.

【0067】音声重み計算部28の出力は雑音最小値推
定部29及び帯域別ゲイン決定部33に供給されるとと
もに、ボイススイッチVSにSP値(音声検出フラグ)
として出力される。
The output of the voice weight calculator 28 is supplied to the noise minimum value estimator 29 and the band-specific gain determiner 33, and the SP value (voice detection flag) is supplied to the voice switch VS.
Is output as

【0068】帯域別ゲイン決定部33は、雑音リーク積
分値更新部32,雑音最小値推定部29及び音声重み計
算部28からの出力を入力とし、最終低減量決定部34
へ信号を出力する。
The band-specific gain determining section 33 receives the outputs from the noise leak integrated value updating section 32, the noise minimum value estimating section 29, and the speech weight calculating section 28 as input, and determines the final reduction amount determining section 34.
Output a signal to

【0069】最終低減量決定部34は、ボイススイッチ
VSからのS_lossと帯域別ゲイン決定部33から
の出力を入力とし、乗算器23へゲインを出力する。
The final reduction amount determination unit 34 receives S_loss from the voice switch VS and the output from the band-specific gain determination unit 33 as inputs, and outputs a gain to the multiplier 23.

【0070】以下各ブロックにおける動作を説明する。The operation of each block will be described below.

【0071】高速フーリエ変換部FFT22は、入力さ
れたディジタル送話信号フレームに対し高速フーリエ変
換処理を行い、低域から高域まで順に16帯域(k=
0,1,2,・・・15)に周波数分割された変換係数
を得る。この変換係数は各帯域において同じである必要
はない。この帯域分割された変換係数を、帯域パワー計
算部26に出力する(周波数帯域分割ステップ)。 <帯域パワー計算>帯域パワー計算部26は、各帯域ご
とにエネルギ(変換係数の二乗平均値)を求めて対数を
とり、帯域パワーchannel_power(m,k)、[mはフレーム
番号,kは帯域番号(0〜15)]を出力する(帯域別
パワー算定ステップ)。この帯域パワーは有意値計算部
27に出力される。 <有意値計算>有意値計算部27では、後述する雑音リ
ーク積分値更新部32から出力される雑音リーク積分値
noise_power(m,k)と、上記帯域パワーchannel_power
(m,k)との差tmpをもとめ、帯域別の差tmpを所定のしき
い値と比較する。周波数順に配列された上記帯域別の差
tmpの内、隣接する複数の帯域の帯域別差tmpがしきい値
を超えると判定された場合に、これらの帯域別差tmpに
所定の重み付けを行った上で相互に加算する。この重み
付け後の値suby(m,k)の条件付き総和(隣接する複数の
帯域の帯域別差tmpがしきい値を超えると判定された場
合)を有意値yとして出力する(有意値算定ステッ
プ)。
The fast Fourier transform unit FFT22 performs a fast Fourier transform process on the input digital transmission signal frame, and sequentially performs 16 bands (k =
0, 1, 2,... 15) are obtained. This transform coefficient need not be the same in each band. The band-divided transform coefficients are output to the band power calculator 26 (frequency band dividing step). <Band Power Calculation> The band power calculation unit 26 obtains the energy (mean square value of the conversion coefficient) for each band, takes the logarithm, and calculates the band power channel_power (m, k), [m is the frame number, and k is the band. No. (0 to 15)] (power calculation step for each band). This band power is output to the significant value calculation unit 27. <Significant value calculation> In the significant value calculating unit 27, the noise leak integrated value output from the noise leak integrated value updating unit 32 described later
noise_power (m, k) and the above band power channel_power
The difference tmp from (m, k) is obtained, and the difference tmp for each band is compared with a predetermined threshold value. Differences by band above arranged in frequency order
When it is determined that the difference tmp by band of a plurality of adjacent bands among the tmps exceeds the threshold value, the difference tmp by band is given a predetermined weight and added to each other. The conditional sum of the weighted values suby (m, k) (when it is determined that the difference tmp by band of a plurality of adjacent bands exceeds the threshold) is output as a significant value y (significant value calculating step). ).

【0072】また有意値yの平均値(y_average:リー
ク積分による推定値で代用でき、例えば下記の式にて計
算)も出力する。
The average value of the significant value y (y_average: an estimated value obtained by leak integration, for example, calculated by the following equation) is also output.

【0073】y(m):有意値、suby(m,k)の条件付き総和 y_average(m)=y_average(m-1)×0.9+y(m)×0.1 図3は有意値計算部27の処理手順を示すフローチャー
トである。有意値yを出力するフローを図3に基づいて
説明する。
Y (m): Significant value, conditional sum of suby (m, k) y_average (m) = y_average (m-1) × 0.9 + y (m) × 0.1 FIG. It is a flowchart which shows a procedure. A flow for outputting the significant value y will be described with reference to FIG.

【0074】ステップ3aでフレーム番号m=0にリセ
ット/初期値設定した後、ステップ3bでグループ番号
mをインクリメントするとともに有意値y,帯域番号k
及び連続数flag(しきい値を超える帯域別差tmpの連続
数フラグ)を“0”に初期設定する。
After resetting / initializing the frame number m to 0 in step 3a, the group number m is incremented and the significant value y and the band number k are incremented in step 3b.
And the continuous number flag (continuous number flag of the difference tmp for each band exceeding the threshold value) is initialized to “0”.

【0075】次にステップ3cで帯域k=0について、
帯域パワーと雑音リーク積分値との差tmpと、この帯域
別差tmpに対して重み付けを行った値suby(m,k)とを下記
のように計算する。
Next, in step 3c, for band k = 0,
The difference tmp between the band power and the noise leak integral value and the value suby (m, k) obtained by weighting the difference tmp for each band are calculated as follows.

【0076】 tmp=chanel_power(m,k)−noise_power(m,k) sub_y(m,k)={200−(k−1)2}/100×(tmp−1) ただし、{200−(k−1)2}は重み付け係数である。この
場合、帯域の周波数が高くなるにつれ小さくなるように
設定されているが、適宜変更可能である。
Tmp = chanel_power (m, k) −noise_power (m, k) sub_y (m, k) = {200− (k−1) 2 } / 100 × (tmp−1) where {200− (k−1) -1) 2 } is a weighting coefficient. In this case, the band is set to decrease as the frequency of the band increases, but can be changed as appropriate.

【0077】帯域k=0における帯域別差tmpが算出さ
れると、有意値計算部27はステップ3dで帯域別差tm
pをしきい値(例えば1)と比較する。しきい値を超え
ていると音声である可能性があると判断してステップ3
e,ステップ3gを経てステップ3iに移行し、連続数
flagを1に設定する。ついでステップ3kで帯域番号k
をインクリメントしてk=1とした後、ステップcに戻
って帯域k=1についても同様の処理を実行する。
When the difference tmp for each band at the band k = 0 is calculated, the significant value calculation unit 27 determines in step 3d the difference tm for each band.
Compare p to a threshold value (eg, 1). If the threshold is exceeded, it is determined that there is a possibility that the sound is voice, and step 3 is performed.
e, the process proceeds to step 3i via step 3g,
Set flag to 1. Then, in step 3k, the band number k
Is incremented to set k = 1, and the process returns to step c to execute the same processing for the band k = 1.

【0078】ここで帯域k=1においても帯域k=0に
引き続いて帯域別差tmpがしきい値を超えたとする。連
続数flagは既に1なのでステップ3eからステップ3f
に移行して、ここで y=y+suby(m,k−1) なる演算を実行する。そして連続数flagを2に設定し、
ステップ3gを経てステップ3hに移行して、下記演算
を実行する。
Here, it is assumed that the band-by-band difference tmp exceeds the threshold value after the band k = 0 even in the band k = 1. Since the continuation number flag is already 1, step 3e to step 3f
Then, the operation of y = y + suby (m, k−1) is executed. Then, set the continuous number flag to 2,
After step 3g, the process proceeds to step 3h to execute the following calculation.

【0079】y=y+suby(m,k) ついでステップ3kで帯域番号kを更にインクリメント
しk=2として、ステップ3cに戻り、帯域k=2につ
いての処理を実行する。
Y = y + suby (m, k) Then, in step 3k, the band number k is further incremented to set k = 2, and the process returns to step 3c to execute the processing for band k = 2.

【0080】以降同様に、隣接する帯域の帯域別差tmp
が連続してしきい値を超える毎に、その帯域のsuby(m,
k)が一つ前の帯域までに得られた有意値yに順次加算さ
れ、帯域別差tmpの重み付け加算値yが求められる。
Thereafter, similarly, the difference tmp by band between adjacent bands
Each time exceeds the threshold, the suby (m,
k) is sequentially added to the significant value y obtained up to the immediately preceding band, and a weighted added value y of the band-based difference tmp is obtained.

【0081】なお、いずれかの帯域k=iにおいて、帯
域別差tmpがしきい値以下になると、有意値計算部27
はステップ3dからステップ3jに移行し、連続数flag
を0にリセットする。
When the difference tmp for each band becomes equal to or less than the threshold value in any band k = i, the significant value calculation unit 27
Moves from step 3d to step 3j,
Is reset to 0.

【0082】こうして1フレームを構成する16個の全
ての帯域(k=0〜15)について処理が完了すると、
有意値計算部27は、ステップ3mからステップ3nに
移行し、有意値yと、帯域ごとに算出した重み付け後の
帯域別差suby(m,k)(k=0〜15)を夫々出力する。
When the processing is completed for all 16 bands (k = 0 to 15) constituting one frame,
The significant value calculation unit 27 proceeds from step 3m to step 3n, and outputs the significant value y and the weighted difference suby (m, k) (k = 0 to 15) calculated for each band after weighting.

【0083】このようにして各フレーム毎に有意値yが
求められ、音声フレームであるか雑音フレームであるか
の判定に供される。
In this way, a significant value y is obtained for each frame, and is used to determine whether the frame is a speech frame or a noise frame.

【0084】また有意値計算部27では雑音パワー強制
更新を判定する有意区間のカウントをも行う。この処理
を図4のフローチャートに基づいて説明する。
The significant value calculation section 27 also counts a significant section for determining the noise power forced update. This processing will be described with reference to the flowchart of FIG.

【0085】まず有意値y(m)の平均値y_average(m)を
求める。
First, an average value y_average (m) of the significant values y (m) is obtained.

【0086】ステップ4aでフレーム番号m=0,sum
_average(0)=0.1,y_average(0)=10,counter(0)=0
に初期値設定した後、ステップ4bでグループ番号mを
インクリメントするとともに有意値y,sub(m,k)を入力
する。
In step 4a, frame number m = 0, sum
_Average (0) = 0.1, y_average (0) = 10, counter (0) = 0
, The group number m is incremented and a significant value y, sub (m, k) is input in step 4b.

【0087】ついでステップ4cで有意値yの平均値を
算出する。平均値はメモリ容量,計算量などの関係から
適宜期間を設定することができるが(例えば0.1〜
0.3秒くらいの平均をとれば十分であるので、過去2
0フレーム分を加算して平均を求めるなど)、一般的に
はリーク積分を用い下記のように推定算出する。平均値
の求め方はリーク積分以外の手法を用いても良いことは
言うまでもない。
Then, in step 4c, the average value of the significant value y is calculated. The average value can be set to an appropriate period based on the relationship between the memory capacity and the calculation amount (for example, 0.1 to
It is enough to take an average of about 0.3 seconds.
For example, an average is obtained by adding 0 frames), and in general, estimation is calculated as follows using leak integration. Needless to say, a method other than leak integration may be used for obtaining the average value.

【0088】 y_average(m)=y_average(m-1)×0.9+y(m)×0.1 次にステップ4dでsub(m,k)とsub(m-1,k)との差の絶対
値和sumを求め(帯域別有意値和算定ステップ)、更に
ステップ4eにて、絶対和sumの平均値sum_averageで
割り、比率rを算出する(有意値正規化ステップ)。
Y_average (m) = y_average (m−1) × 0.9 + y (m) × 0.1 Next, in step 4d, the sum of absolute values sum of the difference between sub (m, k) and sub (m-1, k) Is calculated (step of calculating the sum of significant values for each band), and in step 4e, the ratio r is calculated by dividing the sum by the average value sum_average of the absolute sum sum (significant value normalization step).

【0089】sum(m)/sum_average(m−1) この値を直接rとしても良いが、特異的な値を除去する
ため、r(m−1)に決められた減衰率(例えば0.99)
を乗じた値との大きさを比べ、大きい方をr(m)とし
て採用する。
Sum (m) / sum_average (m−1) This value may be directly used as r, but in order to remove a specific value, the attenuation rate determined by r (m−1) (for example, 0.99 )
Is compared with the value obtained by multiplying the value, the larger value is adopted as r (m).

【0090】この比率rは有意値区間算定のカウンタ加
算の判定基準となるものであり、例えば上限は8に設定
される。従って、ステップ4fでr(m)が8を超えて
いると判定されるとステップ4gでr(m)=8に設定
し直される。
The ratio r serves as a criterion for the counter addition for calculating the significant value section. For example, the upper limit is set to 8. Therefore, if it is determined in step 4f that r (m) exceeds 8, r (m) = 8 is reset in step 4g.

【0091】ついでステップ4hでsum_averageが更新
される。この平均値もメモリ容量,計算量などの関係か
ら適宜期間を設定することができるが(例えば0.1〜
0.3秒くらいの平均をとれば十分であるので、過去2
0フレーム分を加算して平均を求めるなど)、一般的に
はリーク積分を用い下記のように推定算出することがで
きる。平均値の求め方はリーク積分以外の手法を用いて
も良いことは言うまでもない。
Next, sum_average is updated in step 4h. The average value can also be set to an appropriate period based on the relationship between the memory capacity and the calculation amount (for example, 0.1 to
It is enough to take an average of about 0.3 seconds.
In general, it can be estimated and calculated as described below using leak integration. Needless to say, a method other than leak integration may be used for obtaining the average value.

【0092】sum_average(m)=sum_average(m−1)×
0.9+sum(y)×0.1 なおsum_averageは標準偏差の推定値を用いても良い。
その場合も下記式のリーク積分を用いて推定値を得るこ
とができ、この値で代用する。
Sum_average (m) = sum_average (m−1) ×
0.9 + sum (y) × 0.1 Note that sum_average may use an estimated value of the standard deviation.
Also in this case, an estimated value can be obtained by using the leak integral of the following equation, and this value is used instead.

【0093】sum_average(m)=sqrt(sum_average(m−
1)2×0.9+sum(m)2×0.1) 続いて有意区間のカウンタcounter(m)を算出する。
Sum_average (m) = sqrt (sum_average (m−
1) 2 × 0.9 + sum (m) 2 × 0.1) Subsequently, the counter (m) of the significant section is calculated.

【0094】y>10かつcounter(m)<100かつr(m)
≦THRのとき、counter(m)に1が加算される。この条
件を満たさない場合はcounter(m)=0にリセットされる。
Y> 10 and counter (m) <100 and r (m)
When ≤ THR, 1 is added to counter (m). If this condition is not satisfied, counter (m) is reset to 0.

【0095】THRは固定値でも構わないし、y_avera
geによって変化させることも可能である。本実施形態で
は、下記の式で変化するTHRを採用している。
THR may be a fixed value, and y_avera
It can be changed by ge. In the present embodiment, the THR that changes according to the following equation is adopted.

【0096】THR=1.7+(y_average−40)/200
ただし 1.7≦THR≦2.0 y_average>100 THR=2.0 y_average≦ 40 THR=1.7 40≦y_average≦100 THR=1.7+(y_average−4
0)/200 従ってステップ4iでy_average(m)が100を超える
と判定された場合はステップ4jにてTHR=2.0に
設定され、ステップ4kでy_average(m)が40を超え
ると判定された場合はステップ4lでTHRが上記式の
可変値に設定される。その他の場合はステップ4mにて
THR=1.7に設定される。
THR = 1.7 + (y_average−40) / 200
However, 1.7 ≦ THR ≦ 2.0 y_average> 100 THR = 2.0 y_average ≦ 40 THR = 1.7 40 ≦ y_average ≦ 100 THR = 1.7 + (y_average−4
0) / 200 Therefore, when it is determined in step 4i that y_average (m) exceeds 100, THR is set to 2.0 in step 4j, and it is determined in step 4k that y_average (m) exceeds 40. In this case, in step 41, THR is set to a variable value in the above equation. In other cases, THR is set to 1.7 in step 4m.

【0097】ステップ4nで有意値yが10を超えてい
ると判定され、ステップ4oでカウンタcounterが10
0未満と判定され、ステップ4pで比率rがTHR以下
と判定された場合は、ステップ4qでカウンタcounter
が加算され、それ以外の場合はステップ4rにてカウン
タcounterは0にリセットされる。
At step 4n, it is determined that the significant value y exceeds 10, and at step 4o, the counter counter is set to 10
If it is determined that the ratio r is less than 0 and the ratio r is determined to be equal to or less than THR in Step 4p, the counter counter is
Is added, otherwise the counter counter is reset to 0 in step 4r.

【0098】同様にステップ4nで有意値yが10以下
と判定された場合はステップ4sでカウンタcounter(m)
は0にリセットされ、ステップ4oでcounterが100
以上(すなわち100)の場合はステップ4tでcounte
r(m)=counter(m−1)に据え置かれる。
Similarly, if it is determined in step 4n that the significant value y is 10 or less, in step 4s the counter counter (m) is determined.
Is reset to 0, and counter is 100 in step 4o.
In the case of above (ie, 100), count 4
r (m) = counter (m−1).

【0099】以上の処理で各フレームmに対して、coun
ter(m)とy_average(m)が出力されることになる(ステ
ップ4u)。 <更新判定>これらの出力(counter(m),suby(m,k),y
(m),y_average(m))を受け更新判定部31で帯域別雑
音パワー値noise_power(m,k)の更新の有無を判定し、
雑音リーク積分値更新部32で帯域別雑音パワー値を更
新する。
With the above processing, coun
ter (m) and y_average (m) are output (step 4u). <Update judgment> These outputs (counter (m), suby (m, k), y
(m), y_average (m)), the update determination unit 31 determines whether or not the noise power value noise_power (m, k) for each band has been updated.
The noise leakage integrated value updating unit 32 updates the noise power value for each band.

【0100】有意値yは通常の音声の場合は20〜30
程度であり雑音推定が良好に実施されている場合はy<
15程度となる。従ってy<15のときには例えば下記
の式により実施する(第1の雑音パワー推定値更新ステ
ップ)。 noise_power(m+1,k)=noise_power(m,k)×0.9+chan
nel_power(m,k)×0.1 k=0,1,・・・,15 またIS127[米国規格の可変レート音声符号化方
式:"Enhanced VariableRate Codec, Speech Service O
ption 3 for Wideband Spread Spectrum Digital Syste
ms" (TIA IS127)]に規定されているような通常の雑音
パワー更新を行ってもよい。
Significant value y is 20 to 30 for normal speech
And if noise estimation is well performed, y <
It will be about 15. Therefore, when y <15, for example, the following equation is used (first noise power estimation value updating step). noise_power (m + 1, k) = noise_power (m, k) × 0.9 + chan
nel_power (m, k) × 0.1 k = 0,1,..., 15 IS127 [Variable-rate speech coding system of US standard: “Enhanced VariableRate Codec, Speech Service O
ption 3 for Wideband Spread Spectrum Digital Syste
ms "(TIA IS127)], a normal noise power update may be performed.

【0101】何らかの理由でyが正確に計算されない場
合は、上記カウンタ値(counter)をもとに強制更新が実
施される(第2の雑音パワー推定値更新ステップ)。た
とえば、counter(m)≧100かつy<y_average(m)+5
のときに、上記式に従って更新する。
If y is not accurately calculated for some reason, forced updating is performed based on the counter value (counter) (second noise power estimation value updating step). For example, counter (m) ≧ 100 and y <y_average (m) +5
At the time of updating, it is updated according to the above equation.

【0102】続いて帯域別ゲイン決定部33において帯
域別のゲインを決定する。このとき有意値計算部におい
て算出された有意値(y),帯域別有意値(suby)などを参
照して、各帯域毎に設定される。 <音声重み計算>上記有意値計算部にからの出力である
有意値yを受け、音声重み計算部では雑音抑圧ゲインの
決定に用いる音声重みspの計算が行われる。音声重み
spは、1フレーム中に音声が含まれる度合いを0≦s
p≦6の範囲で表す数値であり、sp=0は雑音区間、
sp=6は音声区間を表す。なおこの数値,段階区切り
などは適宜設定可能である。
Subsequently, the band-specific gain determining section 33 determines the gain for each band. At this time, the value is set for each band with reference to the significant value (y), the significant value (suby) for each band, and the like calculated by the significant value calculation unit. <Speech Weight Calculation> Upon receiving the significant value y output from the significant value calculation unit, the speech weight calculation unit calculates the speech weight sp used for determining the noise suppression gain. The voice weight sp is defined as a degree of voice included in one frame, 0 ≦ s.
is a numerical value expressed in the range of p ≦ 6, where sp = 0 is a noise section,
sp = 6 represents a voice section. It should be noted that the numerical value, the step division, and the like can be set as appropriate.

【0103】このsp値が前述のボイススイッチに供給
され、ボイススイッチにおける送話信号中の音声の有無
の判定に供される。例えば、sp=0のときは音声なし
と判断し、それ以外のときは音声有りと判断することが
できる。
This sp value is supplied to the above-mentioned voice switch, and is used for the voice switch to determine the presence or absence of voice in the transmission signal. For example, when sp = 0, it is determined that there is no voice, and otherwise, it is determined that there is voice.

【0104】図5は、この音声重み計算部28における
音声重みspの計算手順とその処理内容を示すフローチ
ャートである。
FIG. 5 is a flowchart showing the procedure for calculating the speech weight sp in the speech weight calculator 28 and the processing contents thereof.

【0105】先ずステップ5aでフレーム番号mを0に
リセットしたのち、ステップ5bでグループ番号mをイ
ンクリメントする。次に、ステップ5cで上記重み付け
加算値yを任意のしきい値「13」と比較し、y<13
であれば雑音フレームと判断してステップ5dに移行
し、ここで音声重みsp(m)を sp(m)=sp(m−1)−0.5 に設定する。後述の如くsp(m)は最終ステップで sp(m)=MAX(sp(m),0)) と最小値が0となるように設定されるので、雑音フレー
ムが連続すればsp(m)は0に収束する。
First, after resetting the frame number m to 0 in step 5a, the group number m is incremented in step 5b. Next, in step 5c, the weighted addition value y is compared with an arbitrary threshold value “13”, and y <13
If so, it is determined that the frame is a noise frame, and the process proceeds to step 5d, where the speech weight sp (m) is set to sp (m) = sp (m-1) -0.5. As will be described later, sp (m) is set in the final step so that sp (m) = MAX (sp (m), 0)) and the minimum value becomes 0. Therefore, if noise frames are continuous, sp (m) Converges to zero.

【0106】一方、y≧13だった場合には、音声若し
くは過渡期のフレームであり、ステップ5eに移行して
仮の音声重みz z=(y−13)×1.5+1 を計算する。
On the other hand, if y.gtoreq.13, the frame is in a voice or transitional period, and the process proceeds to step 5e to calculate a temporary voice weight zz = (y-13) .times.1.5 + 1.

【0107】まず、ステップ5fにおいて sp(m−1)≦0.5 を判定する。すなわち、1フレーム前の音声重みsp
(m−1)が0.5以下と十分小さいかどうかを判断
し、雑音フレームだったかどうかを判定する。
First, it is determined in step 5f that sp (m-1) ≦ 0.5. That is, the speech weight sp one frame before.
It is determined whether (m-1) is sufficiently smaller than 0.5 or less, and it is determined whether the frame is a noise frame.

【0108】1フレーム前のフレームが雑音フレームと
判断されていた場合、すなわちsp(m−1)が0.5
以下の場合はステップ5gに移行し、ここで現フレーム
の音声重みsp(m)を上記仮の音声重みzに設定す
る。
When the previous frame is determined to be a noise frame, that is, when sp (m-1) is 0.5
In the following cases, the process proceeds to step 5g, where the voice weight sp (m) of the current frame is set to the temporary voice weight z.

【0109】このケースは、雑音から音声への切り替わ
りの時点であり、語頭が切れないように、雑音を抑制し
て音声をはっきりたち上げる必要がある。従って音声重
みとして大きい値を取るように設定されることになる。
This case is at the time of switching from the noise to the voice, and it is necessary to suppress the noise and raise the voice clearly so that the beginning of the word is not cut off. Therefore, the audio weight is set to take a large value.

【0110】これに対し、1フレーム前の音声重みsp
(m−1)が雑音フレームではなかった場合(sp(m
−1)>0.5)には、ステップ5hに移行して、 z>sp(m−1)+0.5 を判定する。zが(sp(m−1)+0.5)より大で
あればステップ5iで現フレームの音声重みsp(m)
を(sp(m−1)+0.5)に設定する。
On the other hand, the speech weight sp of the previous frame is
When (m-1) is not a noise frame (sp (m
In -1)> 0.5), the process proceeds to step 5h, where z> sp (m-1) +0.5 is determined. If z is greater than (sp (m-1) +0.5), in step 5i the speech weight sp (m) of the current frame
Is set to (sp (m-1) +0.5).

【0111】このケースは、音声フレームの過渡期と判
断されている時点であり、連続性を重視し、前フレーム
からzの上昇を0.5に抑えていることになる。
This case is a point in time when it is determined that the audio frame is in a transitional period. The importance is placed on continuity, and the rise of z from the previous frame is suppressed to 0.5.

【0112】一方、zが(sp(m−1)+0.5)以
下であればステップ5jに移行し、 z<sp(m−1)−0.5 を判定し、zが(sp(m−1)−0.5)より小であ
ればステップ5kで現フレームの音声重みsp(m)を
(sp(m−1)−0.5)に設定する。
On the other hand, if z is equal to or smaller than (sp (m-1) +0.5), the flow shifts to step 5j to judge that z <sp (m-1) -0.5, and z is equal to (sp (m) If it is smaller than -1) -0.5), the voice weight sp (m) of the current frame is set to (sp (m-1) -0.5) in step 5k.

【0113】このケースは、やはり音声フレームの過渡
期と判断されている時点であり、連続性を重視し、前フ
レームからzの下降を0.5に抑えていることになる。
This case is also a point in time when it is determined that the audio frame is in a transition period, and the continuity is emphasized, and the drop of z from the previous frame is suppressed to 0.5.

【0114】また、zが(sp(m−1)−0.5)以
下であればステップ5mに移行して現フレームの音声重
みsp(m)=zに設定する。
If z is equal to or smaller than (sp (m-1) -0.5), the flow shifts to step 5m to set the speech weight sp (m) = z of the current frame.

【0115】以上のステップを経て、sp(m)=z,
sp(m−1)±0.5の3種類の値のいずれかに設定
され、最終的に sp(m)=MIN(sp(m),6) sp(m)=MAX(sp(m),0) により、sp(m)=0〜6の値が決定される。
Through the above steps, sp (m) = z,
sp (m-1) ± 0.5 is set to one of three values, and finally sp (m) = MIN (sp (m), 6) sp (m) = MAX (sp (m) , 0) determines the value of sp (m) = 0 to 6.

【0116】すなわち上記ステップ5fからステップ5
mにおいて、現フレームで算出した仮の音声重みzが、
1つ前のフレームで設定した音声重みsp(m−1)を
考慮して補正され、ステップ5nでsp(m)として出
力され、ステップ5bに戻り全てのmに対してsp
(m)が求められる。
That is, steps 5f to 5
m, the temporary voice weight z calculated in the current frame is
It is corrected in consideration of the voice weight sp (m-1) set in the immediately preceding frame, output as sp (m) in step 5n, returns to step 5b, and returns sp to all m.
(M) is required.

【0117】このように求めた音声重みsp(m)を使
用することで、フレーム間の連続性を考慮した音声/雑
音/過渡域の調整を行うことができる。
By using the voice weights sp (m) obtained in this way, it is possible to adjust the voice / noise / transient range in consideration of the continuity between frames.

【0118】上記音声重み計算部28により求められた
音声重みsp(m)は、雑音最小値推定部29及び帯域
別ゲイン決定部33に入力される。
The speech weight sp (m) obtained by the speech weight calculator 28 is input to the noise minimum value estimator 29 and the band-specific gain determiner 33.

【0119】なおこのsp値は音声検出フラグとしてボ
イススイッチVSにも供給される。これをもとにVS側
で、例えばsp=0[音声なし]/sp>0[音声あ
り]のような判断することになる。 <雑音最小値推定>雑音最小値推定部29は、上記音声
重みspがsp=0となる100フレームの期間ごと
に、各帯域における雑音のリーク積分値noise_power
(m,k)の最小値を調べる。そして、この最小値を次の1
00フレームの期間において、雑音最小値noise_min
(m,k)として使用する。またそれと共に、各帯域の雑音
最小値の帯域間平均値min_allを求める。
The sp value is also supplied to the voice switch VS as a voice detection flag. Based on this, the VS determines, for example, that sp = 0 [no sound] / sp> 0 [voice]. <Estimation of Noise Minimum Value> The noise minimum value estimation unit 29 calculates the leak integrated value noise_power of noise in each band every 100 frames in which the speech weight sp becomes sp = 0.
Check the minimum value of (m, k). Then, this minimum value is calculated by the following 1
In the period of 00 frames, the noise minimum value noise_min
Used as (m, k). At the same time, an inter-band average value min_all of the noise minimum value of each band is obtained.

【0120】図6及び図7は、この雑音最小値推定部2
9において実行される最小値推定処理の手順と内容を示
すフローチャートである。
FIGS. 6 and 7 show the noise minimum value estimating unit 2.
9 is a flowchart showing the procedure and contents of a minimum value estimation process executed in FIG.

【0121】同図において、雑音最小値推定部29は先
ずステップ6aで、フレーム番号mをm=0にリセット
すると共に、フレームカウンタの値をfc=96に、雑
音最小値をnoise_min(k)=36に、帯域をk =0,・
・・,15にそれぞれ初期設定する。
In the figure, the noise minimum value estimating unit 29 first resets the frame number m to m = 0 at step 6a, sets the frame counter value to fc = 96, and sets the noise minimum value to noise_min (k) = 36, the band is set to k = 0,.
.. Initially set to 15, respectively.

【0122】さらに noise_min_h(k)=MAX(noise_power(m,2k),noise_p
ower(m,2k+1)), k=0,・・・,7 雑音最小値の帯域間平均min_allをnoise_min_h(n):
n=0,1,・・・,7の値の合計値の平均値である min_all=Σ noise_min_h(n)/8 n=0〜7 にそれぞれ初期設定する。
Further, noise_min_h (k) = MAX (noise_power (m, 2k), noise_p
ower (m, 2k + 1)), k = 0,..., 7 The noise-to-band average min_all of the noise minimum is noise_min_h (n):
Initially, min_all = Σnoise_min_h (n) / 8 n = 0 to 7, which is the average of the sum of the values of n = 0, 1,..., 7.

【0123】すなわち、隣接する帯域で大きいノイズパ
ワーを有する値をとり、その平均値をmin_allと設定す
る。
That is, a value having a large noise power in an adjacent band is taken, and the average value is set as min_all.

【0124】次に雑音最小値推定部29は、ステップ6
bでフレーム番号mをインクリメントしたのち、ステッ
プ6cで上記音声重みがsp=0であるか否か、つまり
雑音フレームであるか否かを判定する。
Next, the noise minimum value estimating section 29 determines in step 6
After incrementing the frame number m in b, it is determined in step 6c whether the speech weight is sp = 0, that is, whether the frame is a noise frame.

【0125】そして、雑音フレームであれば、ステップ
6bに戻ってフレーム番号mをインクリメントし、上記
ステップ6cによる雑音フレームの判定を行う。sp=
0ではないと判定された場合、すなわち、音声フレーム
又は過渡域フレームが検出されると、雑音最小値推定部
29はステップ6dに移行してここでフレームカウンタ
fcをインクリメントすると共に、帯域k=0を選択す
る。
If the frame is a noise frame, the flow returns to step 6b to increment the frame number m, and the noise frame is determined in step 6c. sp =
If it is determined that the value is not 0, that is, if a voice frame or a transition frame is detected, the minimum noise value estimating unit 29 proceeds to step 6d, where the frame counter fc is incremented and the band k = 0. Select

【0126】そして、ステップ6eで x=MAX(noise_power(m,2k),noise_power(m,2k+1)) に設定したのち、ステップ6fに移行して noise_min_h(k)>x であるか否か判定する。After setting x = MAX (noise_power (m, 2k), noise_power (m, 2k + 1)) in step 6e, the process proceeds to step 6f to determine whether noise_min_h (k)> x. judge.

【0127】noise_min_h(k)>xであればステップ6
gに移行してここで雑音最小値をnoise_min_h(k)=x
に設定する。そして、ステップ6hに移行する。
If noise_min_h (k)> x, step 6
g, where the minimum noise value is noise_min_h (k) = x
Set to. Then, control goes to a step 6h.

【0128】これに対しnoise_min_h(k)≦xであれ
ば、そのままステップ6hに移行して次の帯域k=1を
選択し、帯域k=8に達するまでは上記ステップ6e〜
ステップ6gによる雑音最小値noise_min_h(k)の設定
処理を繰り返す。
On the other hand, if noise_min_h (k) ≦ x, the process directly proceeds to step 6h to select the next band k = 1, and the above-mentioned steps 6e to 6e until the band k = 8 is reached.
The process of setting the noise minimum value noise_min_h (k) in step 6g is repeated.

【0129】そして、帯域k=8に達すると、雑音最小
値推定部29はステップ6jでフレームカウンタfcが
100に達したか否かを判定する。そして、100フレ
ームに達するまではステップ6bに戻って次のフレーム
を選択し、この選択したフレームについて上記ステップ
6c〜ステップ6iによる処理を繰り返す。
When the band k reaches 8, the noise minimum value estimating unit 29 determines whether or not the frame counter fc has reached 100 in step 6j. Until the number of frames reaches 100, the process returns to step 6b to select the next frame, and the processes in steps 6c to 6i are repeated for the selected frame.

【0130】一方、上記100フレームに対する処理を
終了すると、雑音最小値推定部29はステップ7aに移
行し、ここで雑音最小値の帯域間平均(min_all)をnois
e_min_h(n):n=0,1,・・・,7の値の合計値の
平均値として下記のように算出する。
On the other hand, when the processing for the above 100 frames is completed, the minimum noise value estimating section 29 proceeds to step 7a, where the inter-band average (min_all) of the minimum noise value is calculated as noise.
e_min_h (n): Calculated as the average of the sum of the values of n = 0, 1,..., 7 as follows.

【0131】 min_all=Σ noise_min_h(n)/8 n=0〜7 またそれと共に、noise_min(0)及びnoise_min(1)をそ
れぞれ noise_min(0)=noise_min_h(0) noise_min(1)=0.75×noise_min_h(0)+0.25×noise
_min_h(1) とすると共に、帯域をk=1とする。
Min_all = Σ noise_min_h (n) / 8 n = 0-7 Further, noise_min (0) and noise_min (1) are respectively changed to noise_min (0) = noise_min_h (0) noise_min (1) = 0.75 × noise_min_h ( 0) + 0.25 × noise
_Min_h (1) and the band is k = 1.

【0132】さらに雑音最小値推定部29は、ステップ
7bに移行してここで、先に帯域k=0〜7について求
めた8個の雑音最小値をもとに、残りの帯域k=8〜1
5について雑音最小値を noise_min(2k)=0.75×noise_min_h(k)+0.25×nois
e_min_h(k-1) noise_min(2k+1)=0.75×noise_min_h(k)+0.25×no
ise_min_h(k+1) のように算出する。
Further, the minimum noise value estimating section 29 proceeds to step 7b, where the remaining bands k = 8 to 8 based on the eight noise minimum values previously determined for the bands k = 0 to 7. 1
Noise minimum value for 5 is noise_min (2k) = 0.75 × noise_min_h (k) + 0.25 × nois
e_min_h (k-1) noise_min (2k + 1) = 0.75 × noise_min_h (k) + 0.25 × no
It is calculated as ise_min_h (k + 1).

【0133】そして、以上の演算が終了すると、雑音最
小値推定部29はステップ7dからステップ7eに移行
し、ここで noise_min(14)=0.75×noise_min_h(7)+0.25×nois
e_min_h(6) noise_min(15)=noise_min_h(7) を算出する。
When the above operation is completed, the noise minimum value estimating unit 29 proceeds from step 7d to step 7e, where noise_min (14) = 0.75 × noise_min_h (7) + 0.25 × nois
e_min_h (6) noise_min (15) = noise_min_h (7) is calculated.

【0134】すなわち、雑音最小値推定部29は、上記
ステップ7a〜ステップ7eにおいて8個のmin_allを
もとに16個のmin_allを補間している。
That is, the minimum noise value estimating unit 29 interpolates 16 min_all based on 8 min_all in the steps 7a to 7e.

【0135】そうして16個のmin_allを算出すると、
雑音最小値推定部29はステップ7fにおいて、フレー
ムカウンタfcを0にリセットすると共に、雑音最小値
をnoise_min_h(k)=36に、また帯域をk=0,・・
・,7に設定し直す。
When 16 min_all are calculated in this way,
In step 7f, the noise minimum value estimating unit 29 resets the frame counter fc to 0, sets the noise minimum value to noise_min_h (k) = 36, and sets the band to k = 0,.
・ Set to 7 again.

【0136】そして、ステップ7gにおいて、先に算出
した雑音最小値の帯域間平均値min_all、及び雑音最小
値noise_min(m,k),k=0,・・・,15を出力し、
ステップ6bに戻って次のフレーム(m=m+1)につ
いて同様の雑音最小値及びその帯域間平均値の算出処理
を繰り返す。 <帯域別ゲイン決定>帯域別ゲイン決定部33は、前記
帯域パワー計算部26から出力された帯域パワーchanne
l_power(m,k)、雑音リーク積分値更新部32から出力
された雑音パワーnoise_power(m,k)、音声重み計算部
28から出力された音声重みsp(m,k)、及び雑音最小値
推定部29から出力された雑音最小値noise_min(m,k)
をもとに、帯域別ゲインgain(m,k)を決定する。
Then, in step 7g, the inter-band average value min_all of the noise minimum value calculated previously and the noise minimum value noise_min (m, k), k = 0,...
Returning to step 6b, similar calculation processing of the minimum noise value and the average value between bands is repeated for the next frame (m = m + 1). <Band-Specific Gain Determination> The band-specific gain determination unit 33 determines the band power channe output from the band power
l_power (m, k), noise power noise_power (m, k) output from the noise leak integration value update unit 32, voice weight sp (m, k) output from the voice weight calculation unit 28, and noise minimum value estimation Noise minimum value noise_min (m, k) output from the unit 29
, The gain for each band gain (m, k) is determined.

【0137】先ず雑音リーク積分値noise_power(m,k)
の帯域平均値noise_allを、noise_power(m,k):k=
0,1,・・・,15 の値の合計値の平均値として noise_all= Σ noise_power(m,k)/16 k=0〜15 により求める。
First, the noise leak integrated value noise_power (m, k)
Noise_power (m, k): k =
Noise_all = Σnoise_power (m, k) / 16 k = 0 to 15 as an average of the sum of the values of 0, 1,..., 15.

【0138】続いて、帯域パワーchannel_power(m,k)
の帯域最低値min_band、及び雑音最小値noise_min(m,
k)の帯域最大値max_bandをそれぞれ、 min_band=MIN(channel_power(m,k),k=2,・
・・,11) max_band=MAX(noise_power(m,k),k=0,・・
・,15) により求める。
Subsequently, the band power channel_power (m, k)
Band minimum value min_band and noise minimum value noise_min (m,
The band maximum value max_band of k) is defined as min_band = MIN (channel_power (m, k), k = 2,.
.., 11) max_band = MAX (noise_power (m, k), k = 0,...)
・, 15)

【0139】次に、帯域共通の調整値mdを md=(noise_all−min_all)×(1−sp/6)+(min
_band−max_band)×sp/6 により決定する。この式によると、 sp=0すなわち雑音区間のとき、md=noise_all−min_al
l sp=6すなわち音声区間のとき、md=min_band−max_ban
d となり、過渡域はこれらの中間の値をとることがわか
る。
Next, the adjustment value md common to the bands is given by md = (noise_all−min_all) × (1−sp / 6) + (min
_Band−max_band) × sp / 6. According to this equation, when sp = 0, that is, in a noise section, md = noise_all−min_al
l sp = 6, ie, in the voice section, md = min_band−max_ban
d, indicating that the transition region takes an intermediate value between these values.

【0140】雑音フレームの場合、及び音声フレームの
場合の周波数対パワー特性の一例を、それぞれ図8及び
図9に示す。
FIGS. 8 and 9 show examples of frequency versus power characteristics for a noise frame and a speech frame, respectively.

【0141】雑音フレームでは、図8に示すように、帯
域パワーは雑音最小値に近くなる。雑音最小値に調整値
を加えた値は、雑音最小値のスペクトル特性はそのまま
で平均値が雑音パワーの平均値noise_allに変更された
ものとなる。
In a noise frame, as shown in FIG. 8, the band power is close to the noise minimum. The value obtained by adding the adjustment value to the noise minimum value is obtained by changing the average value to the noise noise average value noise_all while keeping the spectral characteristics of the noise minimum value.

【0142】これに対し音声フレームの場合には、図9
に示すように、雑音最小値に調整値を加えた値は、最小
値のスペクトル特性はそのままで帯域の最大値が帯域パ
ワーの最低値と一致するよう調整されることになる。
On the other hand, in the case of a voice frame, FIG.
As shown in (2), the value obtained by adding the adjustment value to the noise minimum value is adjusted so that the maximum value of the band coincides with the minimum value of the band power while maintaining the spectral characteristics of the minimum value.

【0143】帯域別ゲインgain(m,k)は、帯域パワーcha
nnel_power(m,k)と、雑音最小値noise_min(m,k)と、
調整値とから次のように決定される。
The gain for each band gain (m, k) is the band power cha
nnel_power (m, k), noise minimum value noise_min (m, k),
It is determined as follows from the adjustment value.

【0144】まず、 tmp=channel_power(m,k)−noise_min(m,k)−md−1.62
5 と設定する。
First, tmp = channel_power (m, k) −noise_min (m, k) −md−1.62
Set to 5.

【0145】次いで、音声重みspによりgain(m,k)(g
ain(m,K)≦0)決定の方式を変更する。 (1)sp>0、すなわち、音声若しくは過渡フレーム
のとき、 gain(m,k)={sqrt(1.4+(0.7×tmp)2)+0.7×tmp
−10}×2 (2)sp=0、すなわち、雑音フレームのとき、 gain(m,k)=[sqrt(1.4+(0.03125×tmp)2)+0.03125
×tmp−10]×2 これをk=,・・・,15についてそれぞれ独立に求め
る。
Next, gain (m, k) (g
ain (m, K) ≦ 0) Change the method of decision. (1) When sp> 0, that is, when voice or a transient frame, gain (m, k) = {sqrt (1.4+ (0.7 × tmp) 2 ) + 0.7 × tmp
−10} × 2 (2) When sp = 0, that is, for a noise frame, gain (m, k) = [sqrt (1.4+ (0.03125 × tmp) 2 ) +0.03125
× tmp−10] × 2 This is obtained independently for k =,.

【0146】このgainを決定する関数形は適宜設定
可能である。tmpの値の小さい領域で音声フレームの
方が雑音フレームより下回っていればよい。
The function form for determining the gain can be set as appropriate. It is sufficient that the voice frame is lower than the noise frame in an area where the value of tmp is small.

【0147】そして、以上のように求められた帯域別ゲ
インgain(m,k)は、乗算器23において帯域ごとに変換
係数に乗算され、これによりノイズキャンセルがなされ
る。
The gain for each band gain (m, k) obtained as described above is multiplied by a transform coefficient for each band in the multiplier 23, thereby performing noise cancellation.

【0148】図10にtmp−gainの関係をグラフ
として示す。実線で示したのが音声フレーム(sp>
0)の場合であり、点線が雑音フレーム(sp=0)の
場合である。
FIG. 10 is a graph showing the relationship between tmp and gain. The audio frame (sp>) is indicated by a solid line.
0), and the dotted line is the case of a noise frame (sp = 0).

【0149】tmpが0を下回った場合には音声フレー
ムのゲインの方が雑音フレームのゲインを下回ってい
る。これはtmpが帯域のSNRからmdと定数(上記
例では1.625)を差引いたものと考えることができ
るため、調整値mdの変動分はあるものの、帯域のSN
Rが小さい場合には、音声区間の方が雑音区間より小さ
いゲイン値を採ることになる。
When tmp is less than 0, the gain of the voice frame is lower than the gain of the noise frame. It can be considered that tmp is obtained by subtracting md and a constant (1.625 in the above example) from the SNR of the band, so that although there is a variation in the adjustment value md, the SN of the band is
When R is small, the voice section takes a smaller gain value than the noise section.

【0150】これは音声区間における小さいSNRを示
す帯域(これは音声成分を含まないと推定できる帯域で
ある)を積極的に抑圧(小ゲイン値)することで、音声
フレーム中の音声成分を含む帯域を際立たせる結果とな
る。この効果は雑音フレームの帯域ゲイン値より小さく
設定することで達成される。
This is because a band showing a small SNR in a voice section (this is a band which can be estimated to contain no voice component) is positively suppressed (small gain value) to include a voice component in a voice frame. The result is to make the band stand out. This effect can be achieved by setting the gain smaller than the band gain value of the noise frame.

【0151】このようなゲイン値設定は上記双曲線的な
関数に限らず種々の設定で行うことが可能である。
Such a gain value setting is not limited to the above-described hyperbolic function, and can be performed by various settings.

【0152】たとえば図11に示すように、音声フレー
ム及び過渡フレームのときには、 gain(m,k)=−20 tmp<0 tmp×2−20 0≦tmp≦10 0 tmp>10 雑音フレームのときには、 gain(m,k)=−18 のように設定することも可能である。
For example, as shown in FIG. 11, in the case of a voice frame and a transient frame, gain (m, k) = − 20 tmp <0 tmp × 2−200 0 ≦ tmp ≦ 100 tmp> 10 In the case of a noise frame, gain (m, k) =-18 can also be set.

【0153】このノイズキャンセルされた各帯域ごとの
変換係数は、IFFT24において逆高速フーリエ変換
されて時間軸上の信号フレームに戻されたのち、フレー
ム合成部25においてフレーム合成されて送話信号とし
て、例えば音声符号化回路に供給される。
The noise-cancelled transform coefficient for each band is subjected to inverse fast Fourier transform in IFFT 24 and returned to a signal frame on the time axis, and is then frame-synthesized in frame synthesizing unit 25 as a transmission signal. For example, it is supplied to a speech encoding circuit.

【0154】以上述べたようにこの実施形態によれば、
音声フレームと判断されたフレームでも、音声成分が含
まれないと判断された帯域については、雑音フレームと
判断されたフレームの帯域別ゲインより小さいゲインが
設定されているので、音声フレームにおける音声成分
(帯域)が強調されることになり、結果として聴覚的に
良好なノイズ抑制出力信号を得ることができる。
As described above, according to this embodiment,
Even in a frame determined to be a voice frame, a gain smaller than a band-specific gain of a frame determined to be a noise frame is set for a band determined not to include a voice component. Band) is emphasized, and as a result, an acoustically good noise suppression output signal can be obtained.

【0155】また、雑音最小値推定回路29において各
帯域の雑音パワーの最小値を求め、この雑音最小値のス
ペクトル形状を帯域別ゲイン決定部33による帯域別ゲ
インの決定に用いるようにしているため、例えば自動車
の通過時のような雑音スペクトルの短期的な変化に影響
されず、音声スペクトルを歪ませにくいノイズキャンセ
ル処理を実現することができる。
Further, the minimum value of the noise power in each band is obtained in the noise minimum value estimating circuit 29, and the spectrum shape of the noise minimum value is used for the determination of the gain for each band by the gain determining unit 33 for each band. For example, it is possible to realize a noise canceling process that is not affected by a short-term change in a noise spectrum such as when a car passes, and does not easily distort the voice spectrum.

【0156】また、各フレームの有意値yが大きく(通
常は音声と判断される)が前フレームとの帯域別差の差
分の変化が小さい(ただし平均値で正規化したもので判
断)フレームが連続した場合(例えば100フレーム)
は雑音フレームと判断し、雑音パワー推定値を強制更新
する。この強制更新の判定の際には、スペクトル偏差の
平均値で正規化した値をもって連続区間をカウントして
いるため、スペクトル偏差がフレーム間でばらつくよう
な雑音の場合でも実質的に連続区間としてカウントする
ことができる。従って、良好な雑音フレーム判定がなさ
れないような有意値の変動があっても強制更新がかかる
ことにより良好な雑音パワー推定値の更新が可能とな
り、もって良好なノイズ抑制が行われることになる。
[0156] Also, a frame in which the significant value y of each frame is large (usually judged to be speech) but the change in the difference of the band-wise difference from the previous frame is small (however, judgment is made by normalizing with the average value). When continuous (for example, 100 frames)
Judge as a noise frame, and forcibly update the noise power estimation value. At the time of this forced update determination, the continuous section is counted using the value normalized by the average value of the spectrum deviation, so even if the noise is such that the spectrum deviation varies between frames, it is counted as a substantially continuous section. can do. Therefore, even if there is a change in a significant value such that a good noise frame determination is not made, a good update of the noise power estimation value becomes possible by performing the forced update, and thus good noise suppression is performed.

【0157】以上のようにしてノイズキャンセラの信号
低減量(B)が決定された後、最終信号減衰量(C)を
調整する最終低減量決定部34において、ボイススイッ
チから供給されるS_lossとgainをもとに送信
信号の最終的な信号減衰量(lg)を決定する。
After the signal reduction amount (B) of the noise canceller is determined as described above, the final reduction amount determining unit 34 for adjusting the final signal attenuation amount (C) determines the S_loss and gain supplied from the voice switch. Based on this, the final signal attenuation (lg) of the transmission signal is determined.

【0158】この信号減衰量は例えば下記の様に決定さ
れる。
This signal attenuation is determined, for example, as follows.

【0159】lg(m,k)=MIN(S_loss
(m),gain(m,k)) S_lossとgain(m,k)の小さい方,すなわ
ち信号減衰量の大きい方を採用することになる。
Lg (m, k) = MIN (S_loss
(M), gain (m, k)) The smaller of S_loss and gain (m, k), that is, the larger of the signal attenuation is adopted.

【0160】図12に送話信号及び受話信号のサンプル
を、図13にS_loss及びlgのパワー推移をサン
プルを提示する。
FIG. 12 shows samples of the transmission signal and the reception signal, and FIG. 13 shows samples of the power transitions of S_loss and lg.

【0161】lgは必ずS_loss以下であるので、
通信系(送信−受信)には必ずVS_loss以下のL
OSSが挿入される。また送話のみのときにはS_lo
ss=0であるから、ノイズキャンセラ本来のノイズ抑
圧が実現される。送話音声が終った時点において、上記
例では、gain<S_lossとなるので、ボイスス
イッチによるスイッチ感(送受話系のLOSSの急激な
切替えによる不自然に音が小さくなる現象)は低減され
る。
Since lg is always equal to or less than S_loss,
The communication system (send-receive) must be VS_loss or less.
OSS is inserted. S_lo for only transmission
Since ss = 0, the original noise suppression of the noise canceller is realized. At the time when the transmission voice ends, in the above example, since gain <S_loss, the feeling of switching by the voice switch (phenomenon in which the sound is unnaturally reduced due to abrupt switching of the LOSS of the transmission / reception system) is reduced.

【0162】次いでボイススイッチの動作に関して説明
する。
Next, the operation of the voice switch will be described.

【0163】上述のノイズキャンセラを受話側にも設け
て音声の有無の判断を行ってもよいが、本実施形態では
受話信号中の音声の有無はダブルトーク判定部DTDで
行う設定にしている。判定方法は各種方法が採用できる
がその一例を図14を用いて説明する。
The above-described noise canceller may also be provided on the receiving side to determine the presence or absence of voice. In this embodiment, the presence or absence of voice in the received signal is set to be performed by the double talk determination unit DTD. Various methods can be adopted as the determination method, and an example will be described with reference to FIG.

【0164】この例では、受話信号のフレーム毎のフレ
ームパワーP(例えばP=10log(サンプルの二乗
平均値))を所定基準と比較し音声の有無を判定する。
この判定の際に雑音レベル更新期間INTVL(例えば
1秒間:50フレーム相当)のフレームパワーPの最低
値min,Pの長期平均avg(例えばリーク積分値:
avg=γavg+(1−γ),γは適宜設定(例えば
0.99))を用いる。
In this example, the presence / absence of voice is determined by comparing the frame power P (for example, P = 10 log (mean square value of the sample)) of each frame of the received signal with a predetermined reference.
At the time of this determination, the long-term average avg of the minimum values min and P of the frame power P during the noise level update period INTVL (for example, 1 second: equivalent to 50 frames) (for example, the leak integration value:
avg = γavg + (1−γ), and γ is appropriately set (for example, 0.99).

【0165】ステップ(2a)でcounter=0と
し計算を開始する。初期値は適宜設定可能であるが、例
えば、min=MAX_NOISE,noise=5,
avg=5と設定する。MAX_NOISEは雑音の最
高値であり、例えば36とする。
At step (2a), counter = 0 is set and the calculation is started. The initial value can be set as appropriate, for example, min = MAX_NOISE, noise = 5,
avg = 5 is set. MAX_NOISE is the maximum value of noise, and is set to, for example, 36.

【0166】ステップ(2b)で対象フレームのフレー
ムパワーPを計算/入力する。
In step (2b), the frame power P of the target frame is calculated / input.

【0167】ステップ(2c)でcounterを
“1”増分し、ステップ(2d)でフレームパワーPと
minとの比較を行う。P<minであればmin=P
と書き換え(ステップ2e)、それ以外はminの現状
値を維持して次ステップ(2f)に進む。
In step (2c), the counter is incremented by "1", and in step (2d), the frame power P and min are compared. If P <min, min = P
(Step 2e), otherwise the current value of min is maintained and the process proceeds to the next step (2f).

【0168】ステップ(2f)ではフレームパワーPの
長期平均avgを求める。例えば下式のようにリーク積
分値を長期平均値として採用することができる。
In step (2f), a long-term average avg of the frame power P is obtained. For example, a leak integral value can be adopted as a long-term average value as in the following equation.

【0169】avg=γavg+(1−γ),γは適宜
設定(例えば0.99) ステップ(2g)でcounter値をINTVL値と
比較する。両者が一致しなければステップ(2m)に進
み、測定対象フレームに対するnoise値を出力す
る。counter=INTVLの場合はnoise値
の更新のため次ステップ(2h)に進む。
Avg = γavg + (1−γ), γ is appropriately set (for example, 0.99) In step (2g), the counter value is compared with the INTVL value. If they do not match, the process proceeds to step (2m) to output a noise value for the frame to be measured. If counter = INTVL, the process proceeds to the next step (2h) to update the noise value.

【0170】ステップ(2h)ではmin−noise
>−2を判定する。Yesであればステップ(2i)に
進み、noise=minと設定する。Noであれば次
ステップ(2j)に進み、avg<noise−1を判
定する。Yesであればステップ(2k)に進み、no
ise=avgと設定する。
In step (2h), min-noise
> -2. If Yes, proceed to step (2i) and set noise = min. If No, the process proceeds to the next step (2j) to determine avg <noise-1. If Yes, go to step (2k), no
Set is = avg.

【0171】次いでステップ(2l)に進み、coun
ter=0とリセットし、min=MAX_NOISE
に設定して次ステップ(2m)に進み、更新されたno
ise値を出力する。
Then, the process proceeds to a step (2l), wherein
reset to ter = 0 and min = MAX_NOISE
To the next step (2m), and the updated no
Output an issue value.

【0172】各フレーム毎のフレームパワーPとnoi
se値を入力として受話信号中の音声の有無を判定す
る。
The frame power P and noi for each frame
Using the se value as input, the presence or absence of a voice in the received signal is determined.

【0173】ステップ(2o)でフレームパワーPとn
oiseを入力し、次ステップ(2p)でP<nois
e+THの判定を行う。THは閾値であり、例えば18
に設定される。P<noise+THであれば受話=無
[音声信号なし](ステップ(2q)),そうでなけれ
ば受話=有[音声信号あり](ステップ(2r))と判
断する。
In the step (2o), the frame powers P and n
Input oise, and in the next step (2p), P <nois
e + TH is determined. TH is a threshold, for example, 18
Is set to If P <noise + TH, it is determined that the reception is absent [no voice signal] (step (2q)), otherwise it is received = available [voice signal is present] (step (2r)).

【0174】この結果を対象フレームの音声の有無とし
て出力する(ステップ(2s))。
The result is output as the presence / absence of voice of the target frame (step (2s)).

【0175】これを各フレーム毎に繰返すことで、受話
信号中の音声の有無の検出を行うことができる。
By repeating this for each frame, it is possible to detect the presence or absence of voice in the received signal.

【0176】この結果を受け、音声有りの場合は受話側
にLOSSを挿入するため、R_lossの信号低減率
を増幅器で実行することになる。一方、送信側にはノイ
ズキャンセラにおいてノイズキャンセラの信号減衰量
(B)と比較調整のためS_loss(信号減衰量
(A))が送られることになる。
[0176] In response to this result, if there is a voice, a LOSS is inserted into the receiving side, so that the signal reduction rate of R_loss is executed by the amplifier. On the other hand, S_loss (signal attenuation (A)) is sent to the transmission side for comparison and adjustment with the signal attenuation (B) of the noise canceller.

【0177】上述のボイススイッチのlossは“0”
/VS_lossの2値であったが、この設定は適宜変
更することが可能であり、例えば下記のように設定する
こともできる。 (1)受話(音声なし)/送話(音声なし): R_loss=VS_loss−h;S_loss=h (2)受話(音声有り)/送話(音声なし): R_loss=0;S_loss=VS_loss (3)受話(音声なし)/送話(音声有り): R_loss=VS_loss;S_loss=0 (4)受話(音声有り)/送話(音声有り): R_loss=0;S_loss=VS_loss ただし、h=(sp=0が続いたフレーム数)×(−
0.1) VS_loss≦h≦0 sp:ノイズキャンセラから受け取る音声/雑音の判断
変数 上記実施形態に加えエコーキャンセラEC(10)を加
えてもよい(図15)。エコーキャンセラは音声出力部
からの出力が音声入力部から入力された場合にその信号
を除去/低減するものでありエコー検出の方式は各種の
方式を採用することができる。
The loss of the above voice switch is “0”
Although / VS_loss is a binary value, this setting can be changed as appropriate. For example, it can be set as follows. (1) Receive (no voice) / Transmit (no voice): R_loss = VS_loss-h; S_loss = h (2) Receive (voice) / Transmit (no voice): R_loss = 0; S_loss = VS_loss (3) ) Receiving (no voice) / transmitting (with voice): R_loss = VS_loss; S_loss = 0 (4) Receiving (voice) / transmitting (with voice): R_loss = 0; S_loss = VS_loss, where h = (sp) = Number of frames in which 0 continues) x (-
0.1) VS_loss ≦ h ≦ 0 sp: voice / noise determination variable received from the noise canceller An echo canceller EC (10) may be added to the above embodiment (FIG. 15). The echo canceller removes / reduces the signal when the output from the audio output unit is input from the audio input unit, and various types of echo detection methods can be adopted.

【0178】エコーキャンセラEC(10)以外は図2
の構成と同一であり説明を省略する。ECにおいて、音
声入力部からの入力信号と、音声出力部に入力される受
信信号と、音声入力部の信号から受信信号を引いた信号
とを比較し、入力信号に受信信号が重畳していないかを
判断し、重畳していればその信号分を差引いてノイズキ
ャンセラNCへの入力信号とするものでる。
FIG. 2 except for the echo canceller EC (10)
And the explanation is omitted. In EC, the input signal from the audio input unit, the received signal input to the audio output unit, and the signal obtained by subtracting the received signal from the signal of the audio input unit are compared, and the received signal is not superimposed on the input signal It is determined whether the signal is superimposed, and if the signal is superimposed, the signal is subtracted and used as an input signal to the noise canceller NC.

【0179】なお出力音声環境に応じエコーパスは変化
するので音声出力部にて出力された音声が音声入力部に
て受ける際の時間差を考慮する必要がある。
Since the echo path changes according to the output voice environment, it is necessary to consider the time difference when the voice output from the voice output unit is received by the voice input unit.

【0180】上述の実施態様では、送話側にノイズキャ
ンセラを挿入しているが、受話側にノイズキャンセラを
いれてもよい。送受話双方にノイズキャンセラをいれた
場合は、送受話ともノイズキャンセルを行うことも可能
であり、この場合は、ボイススイッチ機能をノイズキャ
ンセラに取り込んで、ノイズキャンセラの音声信号減衰
量の制御でボイススイッチのLOSS挿入機能を兼ねる
ことも可能である。
In the above embodiment, a noise canceller is inserted on the transmitting side, but a noise canceller may be inserted on the receiving side. If a noise canceller is used for both transmission and reception, noise cancellation can be performed for both transmission and reception. In this case, the voice switch function is incorporated into the noise canceller, and the LOSS of the voice switch is controlled by controlling the noise signal attenuation of the noise canceller. It is also possible to double as an insertion function.

【0181】すなわち送受話どちらかに必ずボイススイ
ッチ機能に必要なLOSS量を入れるように両者の信号
減衰量を制御すれば良い。
That is, it is sufficient to control the signal attenuation of both the transmission and reception so that the LOSS required for the voice switch function is always included.

【0182】本発明は携帯電話などの通信機器に限ら
ず、音声処理を用いる電子機器(録音機器,携帯電子端
末など)でればどのような機器にも使用することができ
る。
The present invention is not limited to a communication device such as a mobile phone, but can be used for any device that uses voice processing (such as a recording device or a portable electronic terminal).

【0183】なお、図2に示す各ブロックは機能説明を
行うために便宜上区分して記載したものであり、各ブロ
ックが個別の素子である必要はなく、1個またはそれ以
上の機能、たとえばCPU,DSP,モデム,音声符号
化回路など、をまとめて1チップのLSIとしても良い
ことは言うまでもない。
Note that each block shown in FIG. 2 is separately described for convenience of explanation, and each block does not have to be an individual element, and one or more functions, for example, a CPU , A DSP, a modem, a voice encoding circuit, and the like may be combined into a one-chip LSI.

【0184】[0184]

【発明の効果】以上説明したように本発明によれば、ノ
イズキャンセラとボイススイッチを組合せて用いること
により高音質の音声信号を供給することができる電子機
器を提供することができ、産業上寄与するところ大なる
ものである。
As described above, according to the present invention, it is possible to provide an electronic device capable of supplying a high-quality sound signal by using a combination of a noise canceller and a voice switch, thereby contributing to the industry. But it is a big thing.

【図面の簡単な説明】[Brief description of the drawings]

【図1】 図1は本発明の実施形態を示す回路ブロック
図。
FIG. 1 is a circuit block diagram showing an embodiment of the present invention.

【図2】 図2は本発明の実施形態のノイズキャンセラ
示すブロック図。
FIG. 2 is a block diagram showing a noise canceller according to the embodiment of the present invention.

【図3】 図3は本発明の実施形態の有意値計算部の処
理手順を示すフローチャート。
FIG. 3 is a flowchart showing a processing procedure of a significant value calculating unit according to the embodiment of the present invention.

【図4】 図4は本発明の実施形態の雑音パワー強制更
新を判定する有意区間のカウントの処理手順を示すフロ
ーチャート。
FIG. 4 is a flowchart showing a procedure of counting a significant section for determining a noise power forced update according to the embodiment of the present invention.

【図5】 図5は本発明の実施携帯の音声重みspの処
理手順を示すフローチャート。
FIG. 5 is a flowchart showing a processing procedure of a voice weight sp of the mobile phone according to the embodiment of the present invention.

【図6】 図6は本発明の実施形態のの雑音最小値推定
部の処理手順を示すフローチャート。
FIG. 6 is a flowchart showing a processing procedure of a noise minimum value estimating unit according to the embodiment of the present invention.

【図7】 図7は本発明の実施形態のの雑音最小値推定
部の処理手順を示すフローチャート。
FIG. 7 is a flowchart illustrating a processing procedure of a noise minimum value estimating unit according to the embodiment of the present invention.

【図8】 図8は雑音フレームの場合の周波数対パワー
特性の一例を示す図。
FIG. 8 is a diagram illustrating an example of frequency versus power characteristics in the case of a noise frame.

【図9】 図9は音声フレームの場合の周波数対パワー
特性の一例を示す図。
FIG. 9 is a diagram illustrating an example of frequency versus power characteristics in the case of a voice frame.

【図10】 図10は本発明の実施形態のtmp−ga
inの関係図。
FIG. 10 shows tmp-ga according to the embodiment of the present invention.
FIG.

【図11】 図11は本発明の実施形態のtmp−ga
inの関係図。
FIG. 11 shows tmp-ga according to the embodiment of the present invention.
FIG.

【図12】 図12は送話信号及び受話信号のサンプル
示す図。
FIG. 12 is a diagram showing samples of a transmission signal and a reception signal.

【図13】 図13はS_loss及びlgのパワー推
移をサンプルを示す図。
FIG. 13 is a diagram showing samples of power transitions of S_loss and lg.

【図14】 図14は本発明の実施形態のボイススイッ
チの処理手順を示すフローチャート。
FIG. 14 is a flowchart showing a processing procedure of the voice switch according to the embodiment of the present invention.

【図15】 図15は本発明の実施形態のブロック図。FIG. 15 is a block diagram of an embodiment of the present invention.

【符号の説明】[Explanation of symbols]

NC・・・ノイズキャンセラ;VS・・・ボイススイッ
NC: Noise canceller; VS: Voice switch

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】送信信号または受信信号に信号低減量
(A)のLOSS挿入を行うボイススイッチと;送信信
号または受信信号から音声検出を行いノイズ抑制のため
の信号低減量(B)を算定し、前記信号低減量(A)と
前記信号低減量(B)とを比較して調整された最終信号
低減量(C)でLOSS挿入とノイズ抑制を行うノイズ
キャンセラとを備えたことを特徴とする電子機器。
1. A voice switch for inserting a signal reduction (A) LOSS into a transmission signal or a reception signal; and detecting a voice from the transmission signal or the reception signal to calculate a signal reduction (B) for noise suppression. And a noise canceller that performs LOSS insertion and noise suppression with a final signal reduction amount (C) adjusted by comparing the signal reduction amount (A) and the signal reduction amount (B). machine.
【請求項2】ノイズキャンセラの最終信号低減量(C)
がボイススイッチの信号低減量(A)以下となるように
調整することを特徴とする請求項1記載の電子機器。
2. A final signal reduction amount (C) of a noise canceller.
2. The electronic device according to claim 1, wherein the electronic device is adjusted so as to be equal to or less than a signal reduction amount (A) of the voice switch.
【請求項3】前記ボイススイッチは、前記ノイズキャン
セラにおける音声検出の結果を受け、送信信号または受
信信号にLOSS挿入を行ことを特徴とする請求項1乃
至2記載の電子機器。
3. The electronic apparatus according to claim 1, wherein said voice switch receives a result of voice detection by said noise canceller and inserts a LOSS into a transmission signal or a reception signal.
【請求項4】送信信号または受信信号から音声検出を行
いノイズ抑制を行うノイズキャンセラと;前記ノイズキ
ャンセラにおける音声検出の結果を受け、送信信号また
は受信信号にLOSS挿入を行うボイススイッチとを備
えたことを特徴とする電子機器。
4. A noise canceller that performs voice detection from a transmission signal or a reception signal to suppress noise and a voice switch that receives a result of voice detection by the noise canceller and inserts a LOSS into the transmission signal or the reception signal. Electronic equipment characterized.
JP2001095039A 2001-03-29 2001-03-29 Electronics Expired - Fee Related JP4509413B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001095039A JP4509413B2 (en) 2001-03-29 2001-03-29 Electronics

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001095039A JP4509413B2 (en) 2001-03-29 2001-03-29 Electronics

Publications (3)

Publication Number Publication Date
JP2002300687A true JP2002300687A (en) 2002-10-11
JP2002300687A5 JP2002300687A5 (en) 2008-04-24
JP4509413B2 JP4509413B2 (en) 2010-07-21

Family

ID=18949148

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001095039A Expired - Fee Related JP4509413B2 (en) 2001-03-29 2001-03-29 Electronics

Country Status (1)

Country Link
JP (1) JP4509413B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007159109A (en) * 2005-11-14 2007-06-21 Nippon Steel Corp Telephone conversation apparatus
JP2009036831A (en) * 2007-07-31 2009-02-19 Canon Inc Information processor, and information processing method
JP2012189906A (en) * 2011-03-11 2012-10-04 Toshiba Corp Voice discrimination device, voice discrimination method and voice discrimination program
JP2012189907A (en) * 2011-03-11 2012-10-04 Toshiba Corp Voice discrimination device, voice discrimination method and voice discrimination program
JP2014060525A (en) * 2012-09-14 2014-04-03 Rohm Co Ltd Wind noise reduction circuit, wind noise reduction method and audio-signal processing circuit using the same, and electronic apparatus

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10861473B2 (en) * 2017-09-27 2020-12-08 Gopro, Inc. Multi-band noise gate

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6343451A (en) * 1986-08-11 1988-02-24 Mitsubishi Electric Corp Amplified speaking circuit
JPH0256155A (en) * 1988-08-22 1990-02-26 Fujitsu Ten Ltd Howling preventing device
JPH02222348A (en) * 1988-12-28 1990-09-05 Sgs Thomson Microelectron Sa Hand-free mutually operating telephone controller
JPH037451A (en) * 1989-06-05 1991-01-14 Sharp Corp Loudspeaker telephone set
JPH0337699A (en) * 1989-07-04 1991-02-19 Fujitsu Ltd Noise suppressing circuit
JPH11284550A (en) * 1998-03-27 1999-10-15 Kobe Steel Ltd Voice input-output device
JP2002519719A (en) * 1998-06-22 2002-07-02 ディーエスピーシー・テクノロジーズ・リミテッド Noise suppressor including weighted gain smoothing means

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6343451A (en) * 1986-08-11 1988-02-24 Mitsubishi Electric Corp Amplified speaking circuit
JPH0256155A (en) * 1988-08-22 1990-02-26 Fujitsu Ten Ltd Howling preventing device
JPH02222348A (en) * 1988-12-28 1990-09-05 Sgs Thomson Microelectron Sa Hand-free mutually operating telephone controller
JPH037451A (en) * 1989-06-05 1991-01-14 Sharp Corp Loudspeaker telephone set
JPH0337699A (en) * 1989-07-04 1991-02-19 Fujitsu Ltd Noise suppressing circuit
JPH11284550A (en) * 1998-03-27 1999-10-15 Kobe Steel Ltd Voice input-output device
JP2002519719A (en) * 1998-06-22 2002-07-02 ディーエスピーシー・テクノロジーズ・リミテッド Noise suppressor including weighted gain smoothing means

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007159109A (en) * 2005-11-14 2007-06-21 Nippon Steel Corp Telephone conversation apparatus
JP2009036831A (en) * 2007-07-31 2009-02-19 Canon Inc Information processor, and information processing method
JP4590437B2 (en) * 2007-07-31 2010-12-01 キヤノン株式会社 Information processing device
JP2012189906A (en) * 2011-03-11 2012-10-04 Toshiba Corp Voice discrimination device, voice discrimination method and voice discrimination program
JP2012189907A (en) * 2011-03-11 2012-10-04 Toshiba Corp Voice discrimination device, voice discrimination method and voice discrimination program
US9330682B2 (en) 2011-03-11 2016-05-03 Kabushiki Kaisha Toshiba Apparatus and method for discriminating speech, and computer readable medium
JP2014060525A (en) * 2012-09-14 2014-04-03 Rohm Co Ltd Wind noise reduction circuit, wind noise reduction method and audio-signal processing circuit using the same, and electronic apparatus

Also Published As

Publication number Publication date
JP4509413B2 (en) 2010-07-21

Similar Documents

Publication Publication Date Title
US6810273B1 (en) Noise suppression
KR100851716B1 (en) Noise suppression based on bark band weiner filtering and modified doblinger noise estimate
FI124716B (en) System and method for adaptive intelligent noise reduction
KR100909679B1 (en) Enhanced Artificial Bandwidth Expansion System and Method
JP3568922B2 (en) Echo processing device
US7912729B2 (en) High-frequency bandwidth extension in the time domain
JP4836720B2 (en) Noise suppressor
US20060126865A1 (en) Method and apparatus for adaptive sound processing parameters
WO1997022116A2 (en) A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
US9124708B2 (en) Far-end sound quality indication for telephone devices
WO1995015550A1 (en) Transmitted noise reduction in communications systems
US7889874B1 (en) Noise suppressor
JP2002169599A (en) Noise suppressing method and electronic equipment
JP4509413B2 (en) Electronics
US20050058277A1 (en) Controlling attenuation during echo suppression
US20100158137A1 (en) Apparatus and method for suppressing noise in receiver
JP2006113515A (en) Noise suppressor, noise suppressing method, and mobile communication terminal device
JP2002076960A (en) Noise suppressing method and mobile telephone
US20060104460A1 (en) Adaptive time-based noise suppression
JP2004234023A (en) Noise suppressing device
WO2001041334A1 (en) Method and apparatus for suppressing acoustic background noise in a communication system

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050414

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050606

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080307

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100402

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100428

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130514

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees