JPH07336290A - Vox制御通信装置 - Google Patents

Vox制御通信装置

Info

Publication number
JPH07336290A
JPH07336290A JP6126665A JP12666594A JPH07336290A JP H07336290 A JPH07336290 A JP H07336290A JP 6126665 A JP6126665 A JP 6126665A JP 12666594 A JP12666594 A JP 12666594A JP H07336290 A JPH07336290 A JP H07336290A
Authority
JP
Japan
Prior art keywords
threshold value
current frame
silent
average
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6126665A
Other languages
English (en)
Inventor
Hideaki Yoshida
秀明 吉田
Toshiyuki Okamura
俊幸 岡村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Radio Co Ltd
Original Assignee
Japan Radio Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Radio Co Ltd filed Critical Japan Radio Co Ltd
Priority to JP6126665A priority Critical patent/JPH07336290A/ja
Publication of JPH07336290A publication Critical patent/JPH07336290A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 VOX制御を用いた通信装置において、話頭
切れを無くし高品質を得る。 【構成】 PCM符号化器1にてデジタル信号に変換さ
れた音声信号は音声符号化器2で現在フレームの平均パ
ワー及び反射係数が算出され音声検出器3に入力され
る。音声検出器3では、無音区間の平均パワーと現在フ
レームの平均パワーとの変化量を算出する。また、無音
区間の平均パワーに基づき算出された第1しきい値と予
測利得に基づき算出された第2しきい値との重み付け平
均で決定される第4しきい値、及び、第1しきい値と予
測利得及び無音区間の平均予測利得に基づき算出された
第3しきい値との重み付け平均で決定される第5しきい
値と変化量との大小比較により現在フレームが有音か無
音かを判定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はVOX制御通信装置、特
にデジタル移動通信機などに用いられるVOX制御に関
する。
【0002】
【従来の技術】従来より、無線機器の送信時における省
電力技術の一方法としてVOX(Voice Operated Trans
mitter)が知られている。このVOXとは、入力される
音声信号を検出し音声信号が存在する時のみ送信機の電
源をONとし、音声信号が存在しない時にはOFFとす
る技術である。
【0003】特に、携帯電話等の移動通信機において
は、その電力はバッテリにより供給されるため、省電力
技術としてこのVOXが広く用いられている。
【0004】VOXにおいては、音声信号の検出から送
信機の電力がONされるまでの立ち上がり時間が長すぎ
るといわゆる話頭切断が生じてしまい、受信側において
聞き取りにくい音声となってしまう。そのため、音声信
号の有無の検出は極めて重要である。
【0005】そこで、従来のVOXにおける有音か無音
かの判定は、入力音声レベルに対して固定のしきい値レ
ベルを設け、これらの値を大小比較することにより行わ
れていた。
【0006】
【発明が解決しようとする課題】しかしながら、このよ
うに固定しきい値を用いて有音か無音かを判定する構成
では、例えば子音等のように低いレベルの音声信号が入
力された場合には、固定しきい値よりも小さいと誤判定
されてしまう場合があり、その結果話頭が欠如し音質が
劣化してしまう問題があった。
【0007】そこで、本願出願人は先に特願平6−41
1号にて無音区間の平均パワーに基づきしきい値を決定
し、この可変しきい値との大小比較により有音か無音か
を判定する構成を提案した。このように有音か無音かを
判定するためのしきい値を無音区間の平均パワーに応じ
て決定することにより、高雑音下においても低いレベル
の音声信号を確実に検出することができる。
【0008】一方、このようにしきい値を無音区間の平
均パワーに応じて決定した場合でも、特定の子音(例え
ばサ行など)が話頭にくる場合には誤判定が生じてしま
う可能性があり、全ての音声信号に対して話頭切断を防
止するには充分でない問題があった。
【0009】本発明は上記従来技術の有する課題に鑑み
なされたものであり、その目的は、高雑音下での話頭切
れを確実に防止し、誤動作の少ない高効率なVOX制御
を行うことができるVOX制御通信装置を提供すること
にある。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載のVOX制御通信装置は、アナログ入
力音声を符号化する際に現在フレームが有音か無音かを
判定し、有音時のみ送信を行うVOX制御通信装置にお
いて、無音区間の平均パワーに対する現在フレームの平
均パワーの変化量を算出する変化量算出手段と、少なく
とも1次と2次の反射係数に基づき予測利得を算出する
予測利得算出手段と、無音区間の平均予測利得を算出す
る平均算出手段と、前記無音区間の平均パワーに基づき
第1しきい値を算出する第1しきい値算出手段と、前記
現在フレームの予測利得に基づき第2しきい値を算出す
る第2しきい値算出手段と、前記平均予測利得及び現在
フレームの予測利得に基づき第3しきい値を算出する第
3しきい値算出手段と、前記第1しきい値及び第2しき
い値の重み付け平均により第4しきい値を算出する第4
しきい値算出手段と、前記第1しきい値及び第3しきい
値の重み付け平均により第5しきい値を算出する第5算
出手段と、前記変化量と前記第4しきい値の大小比較に
より現在フレームが有音か無音かを仮判定する第1判定
手段と、前記変化量と前記第5しきい値の大小比較によ
り現在フレームが有音か無音かを仮判定する第2判定手
段と、前記第1判定手段と第2判定手段のいずれか一方
で有音と仮判定された場合には現在フレームは有音と判
定し、前記第1判定手段及び第2判定手段でいずれも無
音と仮判定された場合には現在フレームは無音と判定す
る第3判定手段と、前記第3判定手段により現在フレー
ムが無音と判定された場合に、前記無音区間の平均パワ
ーと無音と判定された現在フレームの平均パワーの重み
付け平均で無音区間の平均パワーを更新するとともに、
前記無音区間の平均予測利得と無音と判定された現在フ
レームの予測利得の重み付け平均で無音区間の平均予測
利得を更新する更新手段とを有することを特徴とする。
【0011】また、上記目的を達成するために、請求項
2記載のVOX制御通信装置は、請求項1記載のVOX
制御通信装置において、前記予測利得算出手段は、1次
から4次までの反射係数に基づき予測利得を算出するこ
とを特徴とする。
【0012】また、上記目的を達成するために、請求項
3記載のVOX制御通信装置は、請求項1または請求項
2記載のVOX制御通信装置において、前記第1しきい
値算出手段は、前記無音区間の平均パワーに反比例する
ように前記第1しきい値を算出することを特徴とする。
【0013】また、上記目的を達成するために、請求項
4記載のVOX制御通信装置は、請求項1または請求項
2または請求項3記載のVOX制御通信装置において、
前記第2しきい値算出手段は、前記予測利得をR、正の
定数をAとした場合に、
【数1】TH2=AR3 により第2しきい値を算出することを特徴とする。
【0014】また、上記目的を達成するために、請求項
5記載のVOX制御通信装置は、請求項1または請求項
2または請求項3または請求項4記載のVOX制御通信
装置において、前記第3しきい値算出手段は、前記平均
予測利得をRav、予測利得をR、正の定数をB,Cとし
た場合に、
【数2】TH3=(C/Rav3 )・R3 −B により第3しきい値を算出することを特徴とする。
【0015】
【作用】本発明のVOX制御通信装置では、無音区間の
平均パワーに基づき算出されたしきい値(第1しきい
値)のみで有音か無音かを判定する場合の子音の欠如を
防止すべく、この第1しきい値反射係数に基づき計算さ
れる予測利得に基づくしきい値(第2しきい値)との重
み付け平均により決定されるしきい値(第4しきい
値)、及び第1しきい値と予測利得と無音区間の平均予
測利得に基づくしきい値(第3しきい値)との重み付け
平均により決定されるしきい値(第5しきい値)の2種
類のしきい値を用いて現在フレームが有音か無音かを判
定する。
【0016】子音が入力された場合には、反射係数に基
づき計算される予測利得は低下する事実に着目し、予測
利得に基づきしきい値を決定することにより子音の検出
精度が向上することになるが、単に予測利得に対し正の
相関を有するようにしきい値(第2しきい値)を決定す
るのみでは予測利得の増大に応じてしきい値が不要に増
大する場合がある。そこで、予測利得に応じてしきい値
を決定する際の関数の係数として無音区間における平均
予測利得に対し負の相関を有するような係数を用いて適
当な範囲のしきい値(第3しきい値)を決定し、両しき
い値を用いて有音か無音かを判定することにより、単一
のしきい値を用いた場合に比べてより精度良く子音を検
出することができる。
【0017】なお、第1しきい値は無音区間の平均パワ
ーに反比例するように、すなわち雑音が高く無音区間の
平均パワーが大きい場合にはしきい値を下げるように設
定され、雑音下でも微小なパワー変動を検出できるよう
に設定する。また、第2しきい値あるいは第3しきい値
を算出する際の予測利得は少なくとも1次と2次の反射
係数、好適には1次から4次までの反射係数が用いられ
る。これは、反射係数の変動に過剰の応答することな
く、かつ、短時間で最適なしきい値を設定するためであ
る。
【0018】
【実施例】以下、図面に基づき本発明のVOX制御通信
装置の実施例について説明する。
【0019】図1には本実施例の構成ブロック図が示さ
れている。マイクロフォン(不図示)から入力された音
声信号はPCM符号化器1に入力され、デジタル信号に
変換される。PCM符号化器1からのデジタル信号は音
声符号化器2に入力される。音声符号化器2では、現在
のフレームの平均パワー及び反射係数を算出する。算出
された平均パワー及び反射係数は、音声検出器3に入力
される。音声検出器3では後述する所定の演算及び大小
比較を行って現在フレームが有音か無音かを判定し、制
御信号を無線部4に出力する。無線部4では、音声検出
器3からの制御信号に基づき現在フレームが有音の場合
にはアンテナ5にデジタル信号を供給し、送信を行う。
【0020】図2及び図3には音声検出器3にて行われ
る処理のフローチャートが示されている。上述したよう
に、音声検出器3には音声符号化器2から現在フレーム
の平均パワーが入力されるが、音声検出器3は、入力さ
れた現在フレームの平均パワーと既に算出された無音区
間の平均パワーとの変化量を算出する(S101)。な
お、音声符号化器2における平均パワーの算出は、PC
M符号化器1から入力されたデジタル信号のそれぞれの
2乗和を算出することにより行われる。また、無音区間
の平均パワーは、既に無音と判定された区間における平
均パワーに基づき算出され順次更新されるが、その詳細
については後述する。無音区間の平均パワーに対する現
在フレームの平均パワーの変化量が算出された後、音声
検出器3は次に音声符号化器2から入力された1次から
4次の反射係数に基づき予測利得を算出する(S10
2)。予測利得Rは反射係数をri (i=1,2,3,
4)とした場合、
【数3】 により算出される。なお、1次の反射係数のみを用いて
予測利得を算出した場合、反射係数の変動に対し予測利
得が過剰に変動してしまい、しきい値を最適に決定する
ことが困難となる。また、5次以上の高次の反射係数を
も考慮して予測利得を算出した場合、高次の反射係数は
ほとんど寄与しないこと及び予測利得の算出に長時間を
要すること等から効率が低下してしまう問題がある。従
って、予測利得を算出する際には少なくとも2次以上、
好適には1次から4次までの反射係数を用いて算出する
のがよい。
【0021】1次から4次の反射係数に基づき予測利得
が算出された後、音声検出器3は無音区間の平均パワー
に基づきしきい値1(第1しきい値)を決定する(S1
03)。このしきい値1は無音区間の平均パワーに反比
例するように決定され、本実施例においては、特に
【数4】TH1=−0.0833(P0 +6) により決定している。ここで、TH1はしきい値1、P0
は無音区間の平均パワーである。なお、図4には無音区
間の平均パワーP0 としきい値1との関係が示されてい
る。
【0022】無音区間の平均パワーに基づきしきい値1
が決定された後、音声検出器3はS102にて算出され
た現在フレームの予測利得Rに基づきしきい値2(第2
しきい値)を決定する(S104)。しきい値2は予測
利得が小さければ小さくなり、予測利得が大きければ大
きくなるような正の相関を有する関数により決定され、
本実施例においては、特に3次関数を用いて
【数5】TH2=0.0065R3 により決定している。なお、図5には予測利得としきい
値TH2との関係が示されている。
【0023】次に、音声検出器3はS102で算出され
た過去の無音区間の予測利得の平均値(平均予測利得)
に基づいてしきい値3を決定するための関数を決定する
(S105)。すなわち、しきい値3は上述したしきい
値2と同様に予測利得が大きくなれば大きくなるような
正の相関を有する3次関数により決定されるが、その関
数の3次の係数は定数ではなく無音区間の平均予測利得
で決定される。具体的には、3次の係数Coeは無音区間
の平均予測利得をRavとした場合、
【数6】Coe=6.5/Rav3 により決定している。しきい値3の算出関数が決定され
た後、音声検出器3は現在フレームの予測利得Rと無音
区間の平均予測により決定された3次の係数Coeを用い
【数7】TH3=Coe・R3 −1.5 により決定する。なお、図6には予測利得としきい値T
H3との関係が示されている。
【0024】このようにしてしきい値1、しきい値2、
及びしきい値3が算出された後、音声検出器3はこれら
しきい値の重み付け平均により最終的なしきい値を決定
する。すなわち、図3に示されるように、まずしきい値
1としきい値2との重み付け平均によりしきい値4(第
4しきい値)を決定し(S107)、さらに、しきい値
1としきい値3との重み付け平均によりしきい値5を決
定する(S108)。重み付け平均は、しきい値1とし
きい値2の重み、及びしきい値1としきい値3の重みを
それぞれ2:1として、
【数8】TH4=(2TH1+TH2)/3
【数9】TH5=(2TH1+TH3)/3 により行われる。
【0025】そして、音声検出器3はS101にて算出
された変化量と算出されたしきい値4及びしきい値5と
の大小比較を行う。すなわち、まず変化量としきい値T
H4との大小比較を行い(S109)、変化量がしきい値
TH4以上である場合には現在フレームは有音であると判
定され(S110)、無線部4に有音信号を出力する。
一方、変化量がしきい値より小さい場合には、次に変化
量としきい値TH5との大小比較を行い(S111)、変
化量がしきい値TH5以上である場合には現在フレームは
有音であると判定され(S112)、無線部4に有音信
号を出力する。従って、変化量がしきい値TH4あるいは
しきい値TH5のいずれか一方以上であれば現在フレーム
は有音と判定されることになり、変化量が両しきい値よ
り小さい場合には無音と判定されることになる。なお、
変化量が両しきい値より小さい場合には、既に算出され
た無音区間の平均パワーと現在フレームの平均パワーと
の重み付け平均を算出して無音区間の平均パワーを順次
更新し(S113)、無音区間の平均予測利得と現在フ
レームの予測利得との重み付け平均により無音区間の平
均予測利得を更新する(S114)。そして、現在フレ
ームが無音と判定して無線部4に無音信号を出力する
(S115)。
【0026】このように、本実施例においては音声検出
器3で無音区間の平均パワーと現在フレームの平均パワ
ーの変化量により有音か無音かの判定を行い、かつ、無
音区間の平均パワーを順次更新するため、雑音下におけ
る微妙なパワーの変動にも対応でき、誤動作を防止する
ことができる。また、有音か無音かの判定を行う際に用
いるしきい値として、無音区間の平均パワーに基づき決
定されるしきい値と現在フレームの予測利得に基づき決
定されるしきい値との重み付け平均で算出されるしきい
値(第4しきい値TH4)、及び無音区間の平均パワーに
基づき決定されるしきい値と現在フレームの予測利得と
無音区間の平均予測利得に基づき決定されるしきい値と
の重み付け平均で算出されるしきい値(第5しきい値T
H5)の2種類のしきい値を用い、変化量がいずれか一の
しきい値以上である場合には有音と判定する構成である
ので、有色雑音下での子音の検出にも優れ、話頭欠如を
有効に防止して高品質の通信を行うことができる。すな
わち、しきい値TH4は平均パワーと現在フレームの予測
利得に応じて適宜調整され、一方、しきい値TH5はさら
に無音区間の平均予測利得にも対応して適宜調整される
ので、種々の雑音が混入する携帯電話等の実際の環境下
においても、入力された子音を確実に捉えることが可能
となる。
【0027】
【発明の効果】以上説明したように、請求項1乃至請求
項5記載のVOX制御通信装置によれば、有音か無音か
の判定を行う際のしきい値を種々の雑音が混入する環境
下でも最適に設定し、高品質で誤動作の少ない高効率な
VOX制御を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施例の構成ブロック図である。
【図2】本発明の実施例における処理フローチャートで
ある。
【図3】本発明の実施例における処理フローチャートで
ある。
【図4】本発明の実施例における無音区間の平均パワー
と第1しきい値との関係を示すグラフ図である。
【図5】本発明の実施例における予測利得と第2しきい
値との関係を示すグラフ図である。
【図6】本発明の実施例における予測利得と第3しきい
値との関係を示すグラフ図である。
【符号の説明】
1 PCM符号化器 2 音声符号化器 3 音声検出器 4 無線部 5 アンテナ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 アナログ入力音声を符号化する際に現在
    フレームが有音か無音かを判定し、有音時のみ送信を行
    うVOX制御通信装置において、 無音区間の平均パワーに対する現在フレームの平均パワ
    ーの変化量を算出する変化量算出手段と、 少なくとも1次と2次の反射係数に基づき予測利得を算
    出する予測利得算出手段と、 無音区間の平均予測利得を算出する平均算出手段と、 前記無音区間の平均パワーに基づき第1しきい値を算出
    する第1しきい値算出手段と、 前記現在フレームの予測利得に基づき第2しきい値を算
    出する第2しきい値算出手段と、 前記平均予測利得及び現在フレームの予測利得に基づき
    第3しきい値を算出する第3しきい値算出手段と、 前記第1しきい値及び第2しきい値の重み付け平均によ
    り第4しきい値を算出する第4しきい値算出手段と、 前記第1しきい値及び第3しきい値の重み付け平均によ
    り第5しきい値を算出する第5算出手段と、 前記変化量と前記第4しきい値の大小比較により現在フ
    レームが有音か無音かを仮判定する第1判定手段と、 前記変化量と前記第5しきい値の大小比較により現在フ
    レームが有音か無音かを仮判定する第2判定手段と、 前記第1判定手段と第2判定手段のいずれか一方で有音
    と仮判定された場合には現在フレームは有音と判定し、
    前記第1判定手段及び第2判定手段でいずれも無音と仮
    判定された場合には現在フレームは無音と判定する第3
    判定手段と、 前記第3判定手段により現在フレームが無音と判定され
    た場合に、前記無音区間の平均パワーと無音と判定され
    た現在フレームの平均パワーの重み付け平均で無音区間
    の平均パワーを更新するとともに、前記無音区間の平均
    予測利得と無音と判定された現在フレームの予測利得の
    重み付け平均で無音区間の平均予測利得を更新する更新
    手段と、 を有することを特徴とするVOX制御通信装置。
  2. 【請求項2】 請求項1記載のVOX制御通信装置にお
    いて、 前記予測利得算出手段は、1次から4次までの反射係数
    に基づき予測利得を算出することを特徴とするVOX制
    御通信装置。
  3. 【請求項3】 請求項1または請求項2記載のVOX制
    御通信装置において、 前記第1しきい値算出手段は、前記無音区間の平均パワ
    ーに反比例するように前記第1しきい値を算出すること
    を特徴とするVOX制御通信装置。
  4. 【請求項4】 請求項1または請求項2または請求項3
    記載のVOX制御通信装置において、 前記第2しきい値算出手段は、前記予測利得をR、正の
    定数をAとした場合に、 TH2=AR3 により第2しきい値を算出することを特徴とするVOX
    制御通信装置。
  5. 【請求項5】 請求項1または請求項2または請求項3
    または請求項4記載のVOX制御通信装置において、 前記第3しきい値算出手段は、前記平均予測利得をRa
    v、予測利得をR、正の定数をB,Cとした場合に、 TH3=(C/Rav3 )・R3 −B により第3しきい値を算出することを特徴とするVOX
    制御通信装置。
JP6126665A 1994-06-09 1994-06-09 Vox制御通信装置 Pending JPH07336290A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6126665A JPH07336290A (ja) 1994-06-09 1994-06-09 Vox制御通信装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6126665A JPH07336290A (ja) 1994-06-09 1994-06-09 Vox制御通信装置

Publications (1)

Publication Number Publication Date
JPH07336290A true JPH07336290A (ja) 1995-12-22

Family

ID=14940847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6126665A Pending JPH07336290A (ja) 1994-06-09 1994-06-09 Vox制御通信装置

Country Status (1)

Country Link
JP (1) JPH07336290A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6629070B1 (en) 1998-12-01 2003-09-30 Nec Corporation Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
JP2018074487A (ja) * 2016-11-02 2018-05-10 株式会社Jvcケンウッド 無線機

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6629070B1 (en) 1998-12-01 2003-09-30 Nec Corporation Voice activity detection using the degree of energy variation among multiple adjacent pairs of subframes
JP2018074487A (ja) * 2016-11-02 2018-05-10 株式会社Jvcケンウッド 無線機

Similar Documents

Publication Publication Date Title
US6223154B1 (en) Using vocoded parameters in a staggered average to provide speakerphone operation based on enhanced speech activity thresholds
JP3963850B2 (ja) 音声区間検出装置
KR100944252B1 (ko) 오디오 신호 내에서 음성활동 탐지
EP1086453B1 (en) Noise suppression using external voice activity detection
US7171357B2 (en) Voice-activity detection using energy ratios and periodicity
EP0599664B1 (en) Voice encoder and method of voice encoding
KR100343776B1 (ko) 디지털 전화 단말기에서 주변소음에 따른 신호음 및/또는수신음 크기 조절장치 및 방법
EP0736858B1 (en) Mobile communication equipment
JP2002366174A (ja) G.729の付属書bに準拠した音声アクティビティ検出回路を収束させるための方法
US8363820B1 (en) Headset with whisper mode feature
CN102804260A (zh) 声音信号处理装置以及声音信号处理方法
EP3815082B1 (en) Adaptive comfort noise parameter determination
CN103270740A (zh) 声音控制装置、声音控制方法、声音控制程序以及移动终端装置
CN100504840C (zh) 用于背景噪声快速动态估计的方法
US20110071821A1 (en) Receiver intelligibility enhancement system
JP2005253097A (ja) 音声信号送受信装置
KR100378648B1 (ko) 주변 잡음 레벨 추정 장치, 통신 장치, 데이타 터미날장치 및 주변 잡음 레벨 추정 방법
US20030163304A1 (en) Error concealment for voice transmission system
JPH07336290A (ja) Vox制御通信装置
US7778828B2 (en) Method and system for automatic gain control of a speech signal
JPH07336289A (ja) Vox制御通信装置
JPH07212296A (ja) Vox制御通信装置
JP2006050476A (ja) デジタル無線通信装置
JPH07327013A (ja) Vox制御通信装置
US9099095B2 (en) Apparatus and method of processing a received voice signal in a mobile terminal