JPH05323996A

JPH05323996A - 有音無音判定法

Info

Publication number: JPH05323996A
Application number: JP4134543A
Authority: JP
Inventors: Masato Saegusa; 正人三枝; Tomoyuki Oya; 智之大矢; Shinji Kamibayashi; 真司上林; Toshio Miki; 俊雄三木
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1992-05-27
Filing date: 1992-05-27
Publication date: 1993-12-07

Abstract

(57)【要約】【目的】ディジタル移動通信のＶＯＸ技術に適用する
ための音声信号の有音無音判定法において、高雑音下で
も、少ない所要演算量で安定した無音の検出を可能にす
る。【構成】音声信号のフレーム単位に求めた音声電力平
均値だけでなく、過去数フレームにわたる各フレームの
音声電力平均値の最大値と最小値の差、各フレームの音
声信号を高能率符号化するのに伴って得られる音声符号
化パラメータ、を有音無音の判定に用いる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号を送受信する
際、送信側で、その送信すべき音声信号において、音声
の存在する有音区間と音声の存在しない無音区間とを判
定する有音無音判定法に関するものである。

【０００２】更に詳しくは、ディジタル通信において音
声信号伝送を符号化データ形式（音声信号をフレーム単
位で符号化）で行う際、伝送すべき音声信号の中で、フ
レーム単位に見て音声の存在する有音区間では、送信す
るが、音声の存在しない無音区間では送信を止め（送信
パワをオフ）にして、その分、送信に要する電力の低減
をはかるＶＯＸ（Voice Operated Transmitter）制御、
特にディジタル移動通信における移動機の低消費電力化
を図るＶＯＸ制御に適用するための有音無音判定法に本
発明は係る。

【０００３】

【従来の技術】従来の有音無音判定法では、入力音声の
音声電力を監視し、該電力の大小のみを用いて有音無音
の判定を行っているものが多い。しかし、周囲雑音が大
きい移動通信においては、従来法では、周囲雑音と音声
を電力の大小だけでは区別できないため、実際には無音
声でも周囲雑音を音声と誤って判定してしまうので、無
音区間を検出できない。

【０００４】あるいは、周囲雑音下でも、無音区間を検
出しようとすると、今度は有音区間を正確に検出できな
いことになり、有音区間であるにもかかわらず、その区
間を無音とする音声欠落の発生を招くという問題もあっ
た。

【０００５】そのほか、入力音声信号の零交叉数、極性
系列等、音声固有の特徴量を有音無音判定のパラメータ
とする方法、判定しきい値を可変とし、無音と判定され
た区間の入力信号に基づき、しきい値を更新する方法等
が提案されているが、判定アルゴリズムが複雑になり、
かつ、信号処理の負担が大きいため、移動通信の携帯機
には適さない。

【０００６】しきい値を可変とする方法は更に、一度有
音区間を誤って無音区間と判定すると、判定しきい値が
更新されるため、以後の通信で、有音区間が軒並み無音
区間と判定されることから、極端な音声欠落の発生する
危険がある。

【０００７】

【発明が解決しようとする課題】本発明は、音声信号を
高能率符号化し音声符号化データとして伝送するディジ
タル移動通信方式のＶＯＸ技術への適用を狙って、少な
い所要演算量で、高雑音下でも安定した有音無音判定を
実現することのできる有音無音判定法を提供することを
目的とする。

【０００８】

【課題を解決するための手段】上記目的達成のため、本
発明では、送信すべき音声信号をフレーム単位に高能率
符号化し音声符号化データとして送信するときの有音無
音判定法において、

【０００９】送信すべき音声信号のフレーム単位に求め
た音声電力の平均値と、予め定めた一定フレーム数だけ
前のフレームから現在の当該フレームまでの各フレーム
についてフレーム単位に求めた平均電力の最大値と最小
値の差の値と、各フレームの音声信号を高能率符号化す
るのに伴って求められる音声符号化パラメータの一つで
ある反射係数を使って表される当該音声フレームの音声
特徴量と、を用いて当該音声フレームが有音区間である
か無音区間であるかの判定することにした。

【００１０】また送信すべき音声信号をフレーム単位に
ベクトル量子化し符号化する際に得られるベクトルコー
ドのコードブックインデックスを使って表される当該音
声フレームの音声特徴量をも併せ用いて当該音声フレー
ムが有音区間であるか無音区間であるかの判定を行うこ
ととした。

【００１１】

【作用】本発明では、入力音声の現フレームの音声電力
の大きさ以外に、フレーム単位の音声電力の、過去数フ
レームにわたる間の最大値と最小値との差、各フレーム
の音声信号を高能率符号化するのに伴って求められる音
声符号化パラメータの一つである反射係数を使って導出
した値、音声信号をフレーム単位にベクトル量子化し符
号化する際に得られるベクトルコードのコードブックイ
ンデックスをパラメータとして用いて、有音無音判定を
行うことにより、周囲雑音が大きい環境下でも正確な有
音無音判定を実現できる。また、高能率音声符号化の際
に算出される値をパラメータとして流用することによ
り、極めて少ない演算量でＶＯＸ制御が可能になる。

【００１２】

【実施例】次に、図を参照して本発明の実施例を説明す
る。図２は、本発明による有音無音判定法を適用する対
象としてのディジタル移動通信における送信側（ディジ
タル移動通信日本標準方式の音声符号化方式であるＶＳ
ＥＬＰを採用している）を示すブロック図である。な
お、ＶＳＥＬＰのＶはＶｅｃｔｏｒ、ＳはＳｕｍ、Ｅは
Ｅｘｃｉｔｅｄ、ＬはＬｉｎｅａｒ、ＰはＰｒｅｄｉｃ
ｔｉｏｎ、を表わしている。

【００１３】図２において、高能率音声符号化器１に
は、マイクＭからフレーム単位の音声が６４ｋｂ／ｓの
ＰＣＭ信号形式に変換されて入力され、高能率音声符号
化器１において符号化された符号化データが送信制御部
３へ、また、高能率音声符号化器１において符号化の際
に求められた符号化パラメータが有音区間検出器２へ出
力される。

【００１４】有音区間検出器２には、１フレーム単位の
音声がマイクＭより６４ｋｂ／ｓのＰＣＭ信号形式に変
換されて入力され、また、同時に高能率音声符号化器１
からその時点で有音区間検出器２に入力されるフレーム
より１つ前のフレームの符号化パラメータ（音声電力、
反射係数、コードブックインデックス）が入力され、有
音区間検出器２では、当該入力フレームについて前記符
号化パラメータを用いて有音無音の判定処理を行ない、
有音無音の判定結果が送信制御部３へ出力される。

【００１５】送信制御部３には、高能率音声符号化器１
から符号化データが、有音区間検出器２から有音無音判
定結果が入力される。送信制御部３は、有音無音判定結
果により、符号化データ送信、送信開始予告信号、送信
停止予告信号のいずれかを選択して、送信機Ｔｘ．４に
渡す。送信機Ｔｘ．４は、それに応じて送信、或いは送
信停止を行い、送信に要する電力の低減をはかるＶＯＸ
（Voice Operated Transmitter）制御を行う。

【００１６】図１は、本発明による有音無音判定アルゴ
リズムの一例を示す説明図である。有音区間において、
それまでの有音との判定が無音との判定に変わり、有音
区間から無音区間へ判定が遷移するときの条件は、三つ
あり、それが遷移１の（１），（２），（３）で示され
ている。

【００１７】同様に、無音区間において、それまでの無
音との判定が有音との判定に変わり、無音区間から有音
区間へ判定が遷移するときの条件は、二つあり、それが
遷移２の（１），（２）で示されている。

【００１８】遷移１の条件（１）は、日本標準音声符号
化方式（ＶＳＥＬＰ）による音声信号１フレーム当たり
の音声電力平均値の符号化値ｒ０（０≦ｒ０≦３１）を
用い、そのｒ０が或るしきい値ＴＨ１より小さいとき、
無音と判定するものである。これは、周囲雑音レベルが
十分低い時に効果的に無音区間を検出する。なおｊは当
該音声フレームのフレーム番号を表している。

【００１９】遷移１の条件（２）は、各フレームの音声
信号を高能率符号化するのに伴って求められる音声符号
化パラメータの一つである反射係数ｒｉから次の式（数
１）で表される演算量を算出しておく。

【００２０】

【数１】

【００２１】そして、音声信号１フレーム当たりの音声
電力平均値の符号化値ｒ０がしきい値ＴＨ２より小さく
（但し、しきい値ＴＨ２は、先のしきい値ＴＨ１より大
きく設定しておく）かつ、前記演算量がしきい値（ＴＨ
＿ＲＩ）より大きいとき、無音と判定するものである。

【００２２】上記演算量は、音声信号では、比較的小さ
い値をとり、ホワイトノイズなど周囲雑音では、音声信
号より大きい値をとるので、周囲雑音の電力とは無関係
に音声と周囲雑音の分離が可能である。

【００２３】ここで、前記式（数１）の物理的意味を説
明しておく。ｒ_i（ｊ）は、第ｊフレームのｉ次反射係
数を表す。ここで与えられたフレームにおける近似残差
エネルギーＲＳは、次の式（数２）で与えられる。

【００２４】

【数２】

【００２５】この式（数２）から次の式（数３）が求ま
る。

【数３】

【００２６】この式（数３）から分かるように、次の式
（数４）は近似残差エネルギーに比例する値である。近
似残差エネルギーが大きいということは、そのフレーム
は音声ではなく、また近似残差エネルギーが小さいとき
に、そのフレームは音声に非常に近いということが分か
っており、近似残差エネルギーは、そのような判断の目
安となる物理量になっているわけである。

【数４】

【００２７】但し、Ｎはフレーム長、Ｒ’_q（０）はフ
レームエネルギーの符号化値である。また上記各式のΠ
は、ｉ＝１からｉ＝１０までの各項の掛け算を表すもの
であることは述べるまでもない。ｉ＝１からｉ＝１０ま
でというのは、１フレームにおいて、ｉ＝１からｉ＝１
０までの、１０次の反射係数ｒ_iがあるということであ
る。

【００２８】次に遷移１の条件（３）は、ＶＳＥＬＰ符
号化の際に求められるＧＳＰ０インデックスであるｇｓ
ｐ０を併せ用いるもので、音声信号１フレーム当たりの
音声電力平均値の符号化値ｒ０がしきい値ＴＨ２より小
さく、かつ、上記インデックスｇｓｐ０がしきい値（Ｔ
Ｈ＿ＧＳＰ０）より小さいときに無音と判定するもので
ある。

【００２９】本条件は、周囲雑音レベルが比較的大きい
とき、周囲雑音の電力とは無関係に音声と周囲雑音を分
離するのに有効である。ここで、ＧＳＰ０インデックス
について簡単に説明しておく。

【００３０】ＶＳＥＬＰという符号化方式では、各フレ
ーム毎に分析される複数個のパラメータをセットして１
組のベクトル（パターン）とし、コードブック（符号
帳）に蓄えられている複数個のベクトルコードのなかか
らひずみが最小となるコードを選択し、そのコード番号
を符号として送り、受信側では、その符号を、同じコー
ドブック（符号帳）を参照して復号するというやり方で
ある。ＧＳＰ０インデックスというのは、そのコード番
号に相当するものである。

【００３１】なお、無音との判定は、１フレームのみで
所定条件を満たしても直ぐには行なわず、１０フレーム
程度連続して所定条件を満たした場合にのみ行い、それ
により送信を停止する方法が、音声品質の観点から有効
である。

【００３２】次に、図１において、遷移２（つまり無音
区間において、それまでの無音との判定が有音との判定
に変わり、無音区間から有音区間へ判定が遷移すると
き）の条件の（１）は、やはり音声信号１フレーム当た
りの音声電力平均値の符号化値ｒ０を用い、該ｒ０がし
きい値ＴＨ３より大きいとき有音区間と判定する。

【００３３】また遷移２の条件の（２）は、判定の対象
とする現フレームから（例えば）５フレーム前のフレー
ムからの各フレームの音声電力の中の最大値と最小値を
それぞれ求め、その最大値と最小値の差を算出し、この
値がしきい値ＴＨ４より大きいとき有音と判定する。遷
移２の条件（２）の式におけるＪＯは、この場合定数４
を意味している。

【００３４】この場合、周囲雑音レベルが高くても、周
囲雑音の振幅変動が小さければ、効果的に有音区間の検
出ができる。

【００３５】本実施例では、有音区間から無音区間への
遷移のみにＶＳＥＬＰ符号化の符号化パラメータを用い
ており、無音区間から有音区間への遷移には、簡単に算
出できる音声電力のみを用いている。このようにするこ
とで、無音期間中、高能率音声符号化器の動作を停止さ
せることが可能になるので、送信停止による送信電力の
低減だけでなく、送信停止時における高能率音声符号化
器の消費電力も低減できる。

【００３６】図３は、本発明による有音無音判定法を用
いて、ＶＯＸ制御を行った場合の、入力音声のＳＮ比と
送信比率の関係を、従来技術によるそれと比較して示し
た特性図である。同図において、横軸はＳＮ比であり、
縦軸は伝送される音声信号の中で、どれだけの％部分が
有音と判定されて実際に符号化され送信されたかを表す
量である。

【００３７】各サンプル（１〜４）の原音の有音区間の
時間比率はそれぞれ、７０％，６１％，６３％，６４％
である。本発明の方法を用いることにより、ＳＮ＝２０
ｄＢの高雑音下においても（換言すればＳＮ比が少なく
とも２０ｄＢ程度、得られさえすれば）、ほぼ正確なＶ
ＯＸ制御が可能なことがわかる。

【００３８】図３で、＊印を付した特性は従来の方法で
得られた結果（図１で、遷移１及び２の条件（１）のみ
を用いた場合の特性）を示しており、ＳＮ比が少なくと
も３０ｄＢ程度、得られなければ、正確なＶＯＸ制御は
不可能であることを示している。この＊印を付した特性
と比較することにより、本発明の有効性が認められるで
あろう。

【００３９】

【発明の効果】以上説明したように、本発明によれば、
背景雑音レベルが高い場合にも無音区間の検出が可能に
なり、背景雑音レベルが大きい環境下でも正確な有音無
音判定が可能になるという利点がある。また、高能率音
声符号化の際に必然的に算出される値を有音無音判定パ
ラメータとして流用することにより、極めて少ない演算
量でＶＯＸ制御が可能になるという利点もある。

【図面の簡単な説明】

【図１】本発明による有音無音判定アルゴリズムの一例
を示す説明図である。

【図２】本発明による有音無音判定法を適用する対象と
してのディジタル移動通信における送信側を示すブロッ
ク図である。

【図３】本発明による有音無音判定法を用いてＶＯＸ制
御を行った場合の入力音声のＳＮ比と送信比率の関係を
従来技術によるそれと比較して示した特性図である。

【符号の説明】

１…高能率音声符号化器、２…有音区間検出器、３…送
信制御部、４…送信機、Ａ…アンテナ、Ｍ…マイク

───────────────────────────────────────────────────── フロントページの続き (72)発明者三木俊雄東京都千代田区内幸町１丁目１番６号日本電信電話株式会社内

Claims

【特許請求の範囲】

【請求項１】送信すべき音声信号をフレーム単位に高
能率符号化し音声符号化データとして送信するものと
し、その際、送信すべき音声信号の中で、音声の存在す
る有音区間と音声の存在しない無音区間とを判定して、
有音区間では音声符号化データを送信し、無音区間では
音声符号化データを送信しないようにするときの該有音
区間と無音区間の判定方法である有音無音判定法におい
て、送信すべき音声信号のフレーム単位に求めた音声電力の
平均値と、予め定めた一定フレーム数だけ前のフレーム
から現在の当該フレームまでの各フレームについてフレ
ーム単位に求めた平均電力の最大値と最小値の差の値
と、各フレームの音声信号を高能率符号化するのに伴っ
て求められる音声符号化パラメータの一つである反射係
数を使って表される当該音声フレームの音声特徴量と、
を用いて当該音声フレームが有音区間であるか無音区間
であるかの判定を行うことを特徴とする有音無音判定
法。
【請求項２】送信すべき音声信号をフレーム単位にベ
クトル量子化し符号化することにより高能率符号化し音
声符号化データとして送信するものとし、その際、送信
すべき音声信号の中で、音声の存在する有音区間と音声
の存在しない無音区間とを判定して、有音区間では音声
符号化データを送信し、無音区間では音声符号化データ
を送信しないようにするときの該有音区間と無音区間の
判定方法である有音無音判定法において、送信すべき音声信号のフレーム単位に求めた音声電力の
平均値と、予め定めた一定フレーム数だけ前のフレーム
から現在の当該フレームまでの各フレームについてフレ
ーム単位に求めた平均電力の最大値と最小値の差の値
と、各フレームの音声信号を高能率符号化するのに伴っ
て求められる音声符号化パラメータの一つである反射係
数を使って表される当該音声フレームの音声特徴量と、送信すべき音声信号をフレーム単位にベクトル量子化し
符号化する際に得られるベクトルコードのコードブック
インデックスを使って表される当該音声フレームの音声
特徴量と、を用いて当該音声フレームが有音区間である
か無音区間であるかの判定を行うことを特徴とする有音
無音判定法。