JPH05323996A - 有音無音判定法 - Google Patents

有音無音判定法

Info

Publication number
JPH05323996A
JPH05323996A JP4134543A JP13454392A JPH05323996A JP H05323996 A JPH05323996 A JP H05323996A JP 4134543 A JP4134543 A JP 4134543A JP 13454392 A JP13454392 A JP 13454392A JP H05323996 A JPH05323996 A JP H05323996A
Authority
JP
Japan
Prior art keywords
frame
voice
voiced
section
transmitted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4134543A
Other languages
English (en)
Inventor
Masato Saegusa
正人 三枝
Tomoyuki Oya
智之 大矢
Shinji Kamibayashi
真司 上林
Toshio Miki
俊雄 三木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4134543A priority Critical patent/JPH05323996A/ja
Publication of JPH05323996A publication Critical patent/JPH05323996A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 ディジタル移動通信のVOX技術に適用する
ための音声信号の有音無音判定法において、高雑音下で
も、少ない所要演算量で安定した無音の検出を可能にす
る。 【構成】 音声信号のフレーム単位に求めた音声電力平
均値だけでなく、過去数フレームにわたる各フレームの
音声電力平均値の最大値と最小値の差、各フレームの音
声信号を高能率符号化するのに伴って得られる音声符号
化パラメータ、を有音無音の判定に用いる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を送受信する
際、送信側で、その送信すべき音声信号において、音声
の存在する有音区間と音声の存在しない無音区間とを判
定する有音無音判定法に関するものである。
【0002】更に詳しくは、ディジタル通信において音
声信号伝送を符号化データ形式(音声信号をフレーム単
位で符号化)で行う際、伝送すべき音声信号の中で、フ
レーム単位に見て音声の存在する有音区間では、送信す
るが、音声の存在しない無音区間では送信を止め(送信
パワをオフ)にして、その分、送信に要する電力の低減
をはかるVOX(Voice Operated Transmitter)制御、
特にディジタル移動通信における移動機の低消費電力化
を図るVOX制御に適用するための有音無音判定法に本
発明は係る。
【0003】
【従来の技術】従来の有音無音判定法では、入力音声の
音声電力を監視し、該電力の大小のみを用いて有音無音
の判定を行っているものが多い。しかし、周囲雑音が大
きい移動通信においては、従来法では、周囲雑音と音声
を電力の大小だけでは区別できないため、実際には無音
声でも周囲雑音を音声と誤って判定してしまうので、無
音区間を検出できない。
【0004】あるいは、周囲雑音下でも、無音区間を検
出しようとすると、今度は有音区間を正確に検出できな
いことになり、有音区間であるにもかかわらず、その区
間を無音とする音声欠落の発生を招くという問題もあっ
た。
【0005】そのほか、入力音声信号の零交叉数、極性
系列等、音声固有の特徴量を有音無音判定のパラメータ
とする方法、判定しきい値を可変とし、無音と判定され
た区間の入力信号に基づき、しきい値を更新する方法等
が提案されているが、判定アルゴリズムが複雑になり、
かつ、信号処理の負担が大きいため、移動通信の携帯機
には適さない。
【0006】しきい値を可変とする方法は更に、一度有
音区間を誤って無音区間と判定すると、判定しきい値が
更新されるため、以後の通信で、有音区間が軒並み無音
区間と判定されることから、極端な音声欠落の発生する
危険がある。
【0007】
【発明が解決しようとする課題】本発明は、音声信号を
高能率符号化し音声符号化データとして伝送するディジ
タル移動通信方式のVOX技術への適用を狙って、少な
い所要演算量で、高雑音下でも安定した有音無音判定を
実現することのできる有音無音判定法を提供することを
目的とする。
【0008】
【課題を解決するための手段】上記目的達成のため、本
発明では、送信すべき音声信号をフレーム単位に高能率
符号化し音声符号化データとして送信するときの有音無
音判定法において、
【0009】送信すべき音声信号のフレーム単位に求め
た音声電力の平均値と、予め定めた一定フレーム数だけ
前のフレームから現在の当該フレームまでの各フレーム
についてフレーム単位に求めた平均電力の最大値と最小
値の差の値と、各フレームの音声信号を高能率符号化す
るのに伴って求められる音声符号化パラメータの一つで
ある反射係数を使って表される当該音声フレームの音声
特徴量と、を用いて当該音声フレームが有音区間である
か無音区間であるかの判定することにした。
【0010】また送信すべき音声信号をフレーム単位に
ベクトル量子化し符号化する際に得られるベクトルコー
ドのコードブックインデックスを使って表される当該音
声フレームの音声特徴量をも併せ用いて当該音声フレー
ムが有音区間であるか無音区間であるかの判定を行うこ
ととした。
【0011】
【作用】本発明では、入力音声の現フレームの音声電力
の大きさ以外に、フレーム単位の音声電力の、過去数フ
レームにわたる間の最大値と最小値との差、各フレーム
の音声信号を高能率符号化するのに伴って求められる音
声符号化パラメータの一つである反射係数を使って導出
した値、音声信号をフレーム単位にベクトル量子化し符
号化する際に得られるベクトルコードのコードブックイ
ンデックスをパラメータとして用いて、有音無音判定を
行うことにより、周囲雑音が大きい環境下でも正確な有
音無音判定を実現できる。また、高能率音声符号化の際
に算出される値をパラメータとして流用することによ
り、極めて少ない演算量でVOX制御が可能になる。
【0012】
【実施例】次に、図を参照して本発明の実施例を説明す
る。図2は、本発明による有音無音判定法を適用する対
象としてのディジタル移動通信における送信側(ディジ
タル移動通信日本標準方式の音声符号化方式であるVS
ELPを採用している)を示すブロック図である。な
お、VSELPのVはVector、SはSum、Eは
Excited、LはLinear、PはPredic
tion、を表わしている。
【0013】図2において、高能率音声符号化器1に
は、マイクMからフレーム単位の音声が64kb/sの
PCM信号形式に変換されて入力され、高能率音声符号
化器1において符号化された符号化データが送信制御部
3へ、また、高能率音声符号化器1において符号化の際
に求められた符号化パラメータが有音区間検出器2へ出
力される。
【0014】有音区間検出器2には、1フレーム単位の
音声がマイクMより64kb/sのPCM信号形式に変
換されて入力され、また、同時に高能率音声符号化器1
からその時点で有音区間検出器2に入力されるフレーム
より1つ前のフレームの符号化パラメータ(音声電力、
反射係数、コードブックインデックス)が入力され、有
音区間検出器2では、当該入力フレームについて前記符
号化パラメータを用いて有音無音の判定処理を行ない、
有音無音の判定結果が送信制御部3へ出力される。
【0015】送信制御部3には、高能率音声符号化器1
から符号化データが、有音区間検出器2から有音無音判
定結果が入力される。送信制御部3は、有音無音判定結
果により、符号化データ送信、送信開始予告信号、送信
停止予告信号のいずれかを選択して、送信機Tx.4に
渡す。送信機Tx.4は、それに応じて送信、或いは送
信停止を行い、送信に要する電力の低減をはかるVOX
(Voice Operated Transmitter)制御を行う。
【0016】図1は、本発明による有音無音判定アルゴ
リズムの一例を示す説明図である。有音区間において、
それまでの有音との判定が無音との判定に変わり、有音
区間から無音区間へ判定が遷移するときの条件は、三つ
あり、それが遷移1の(1),(2),(3)で示され
ている。
【0017】同様に、無音区間において、それまでの無
音との判定が有音との判定に変わり、無音区間から有音
区間へ判定が遷移するときの条件は、二つあり、それが
遷移2の(1),(2)で示されている。
【0018】遷移1の条件(1)は、日本標準音声符号
化方式(VSELP)による音声信号1フレーム当たり
の音声電力平均値の符号化値r0(0≦r0≦31)を
用い、そのr0が或るしきい値TH1より小さいとき、
無音と判定するものである。これは、周囲雑音レベルが
十分低い時に効果的に無音区間を検出する。なおjは当
該音声フレームのフレーム番号を表している。
【0019】遷移1の条件(2)は、各フレームの音声
信号を高能率符号化するのに伴って求められる音声符号
化パラメータの一つである反射係数riから次の式(数
1)で表される演算量を算出しておく。
【0020】
【数1】
【0021】そして、音声信号1フレーム当たりの音声
電力平均値の符号化値r0がしきい値TH2より小さく
(但し、しきい値TH2は、先のしきい値TH1より大
きく設定しておく)かつ、前記演算量がしきい値(TH
_RI)より大きいとき、無音と判定するものである。
【0022】上記演算量は、音声信号では、比較的小さ
い値をとり、ホワイトノイズなど周囲雑音では、音声信
号より大きい値をとるので、周囲雑音の電力とは無関係
に音声と周囲雑音の分離が可能である。
【0023】ここで、前記式(数1)の物理的意味を説
明しておく。ri (j)は、第jフレームのi次反射係
数を表す。ここで与えられたフレームにおける近似残差
エネルギーRSは、次の式(数2)で与えられる。
【0024】
【数2】
【0025】この式(数2)から次の式(数3)が求ま
る。
【数3】
【0026】この式(数3)から分かるように、次の式
(数4)は近似残差エネルギーに比例する値である。近
似残差エネルギーが大きいということは、そのフレーム
は音声ではなく、また近似残差エネルギーが小さいとき
に、そのフレームは音声に非常に近いということが分か
っており、近似残差エネルギーは、そのような判断の目
安となる物理量になっているわけである。
【数4】
【0027】但し、Nはフレーム長、R’q (0)はフ
レームエネルギーの符号化値である。また上記各式のΠ
は、i=1からi=10までの各項の掛け算を表すもの
であることは述べるまでもない。i=1からi=10ま
でというのは、1フレームにおいて、i=1からi=1
0までの、10次の反射係数ri があるということであ
る。
【0028】次に遷移1の条件(3)は、VSELP符
号化の際に求められるGSP0インデックスであるgs
p0を併せ用いるもので、音声信号1フレーム当たりの
音声電力平均値の符号化値r0がしきい値TH2より小
さく、かつ、上記インデックスgsp0がしきい値(T
H_GSP0)より小さいときに無音と判定するもので
ある。
【0029】本条件は、周囲雑音レベルが比較的大きい
とき、周囲雑音の電力とは無関係に音声と周囲雑音を分
離するのに有効である。ここで、GSP0インデックス
について簡単に説明しておく。
【0030】VSELPという符号化方式では、各フレ
ーム毎に分析される複数個のパラメータをセットして1
組のベクトル(パターン)とし、コードブック(符号
帳)に蓄えられている複数個のベクトルコードのなかか
らひずみが最小となるコードを選択し、そのコード番号
を符号として送り、受信側では、その符号を、同じコー
ドブック(符号帳)を参照して復号するというやり方で
ある。GSP0インデックスというのは、そのコード番
号に相当するものである。
【0031】なお、無音との判定は、1フレームのみで
所定条件を満たしても直ぐには行なわず、10フレーム
程度連続して所定条件を満たした場合にのみ行い、それ
により送信を停止する方法が、音声品質の観点から有効
である。
【0032】次に、図1において、遷移2(つまり無音
区間において、それまでの無音との判定が有音との判定
に変わり、無音区間から有音区間へ判定が遷移すると
き)の条件の(1)は、やはり音声信号1フレーム当た
りの音声電力平均値の符号化値r0を用い、該r0がし
きい値TH3より大きいとき有音区間と判定する。
【0033】また遷移2の条件の(2)は、判定の対象
とする現フレームから(例えば)5フレーム前のフレー
ムからの各フレームの音声電力の中の最大値と最小値を
それぞれ求め、その最大値と最小値の差を算出し、この
値がしきい値TH4より大きいとき有音と判定する。遷
移2の条件(2)の式におけるJOは、この場合定数4
を意味している。
【0034】この場合、周囲雑音レベルが高くても、周
囲雑音の振幅変動が小さければ、効果的に有音区間の検
出ができる。
【0035】本実施例では、有音区間から無音区間への
遷移のみにVSELP符号化の符号化パラメータを用い
ており、無音区間から有音区間への遷移には、簡単に算
出できる音声電力のみを用いている。このようにするこ
とで、無音期間中、高能率音声符号化器の動作を停止さ
せることが可能になるので、送信停止による送信電力の
低減だけでなく、送信停止時における高能率音声符号化
器の消費電力も低減できる。
【0036】図3は、本発明による有音無音判定法を用
いて、VOX制御を行った場合の、入力音声のSN比と
送信比率の関係を、従来技術によるそれと比較して示し
た特性図である。同図において、横軸はSN比であり、
縦軸は伝送される音声信号の中で、どれだけの%部分が
有音と判定されて実際に符号化され送信されたかを表す
量である。
【0037】各サンプル(1〜4)の原音の有音区間の
時間比率はそれぞれ、70%,61%,63%,64%
である。本発明の方法を用いることにより、SN=20
dBの高雑音下においても(換言すればSN比が少なく
とも20dB程度、得られさえすれば)、ほぼ正確なV
OX制御が可能なことがわかる。
【0038】図3で、*印を付した特性は従来の方法で
得られた結果(図1で、遷移1及び2の条件(1)のみ
を用いた場合の特性)を示しており、SN比が少なくと
も30dB程度、得られなければ、正確なVOX制御は
不可能であることを示している。この*印を付した特性
と比較することにより、本発明の有効性が認められるで
あろう。
【0039】
【発明の効果】以上説明したように、本発明によれば、
背景雑音レベルが高い場合にも無音区間の検出が可能に
なり、背景雑音レベルが大きい環境下でも正確な有音無
音判定が可能になるという利点がある。また、高能率音
声符号化の際に必然的に算出される値を有音無音判定パ
ラメータとして流用することにより、極めて少ない演算
量でVOX制御が可能になるという利点もある。
【図面の簡単な説明】
【図1】本発明による有音無音判定アルゴリズムの一例
を示す説明図である。
【図2】本発明による有音無音判定法を適用する対象と
してのディジタル移動通信における送信側を示すブロッ
ク図である。
【図3】本発明による有音無音判定法を用いてVOX制
御を行った場合の入力音声のSN比と送信比率の関係を
従来技術によるそれと比較して示した特性図である。
【符号の説明】
1…高能率音声符号化器、2…有音区間検出器、3…送
信制御部、4…送信機、A…アンテナ、M…マイク
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三木 俊雄 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 送信すべき音声信号をフレーム単位に高
    能率符号化し音声符号化データとして送信するものと
    し、その際、送信すべき音声信号の中で、音声の存在す
    る有音区間と音声の存在しない無音区間とを判定して、
    有音区間では音声符号化データを送信し、無音区間では
    音声符号化データを送信しないようにするときの該有音
    区間と無音区間の判定方法である有音無音判定法におい
    て、 送信すべき音声信号のフレーム単位に求めた音声電力の
    平均値と、予め定めた一定フレーム数だけ前のフレーム
    から現在の当該フレームまでの各フレームについてフレ
    ーム単位に求めた平均電力の最大値と最小値の差の値
    と、各フレームの音声信号を高能率符号化するのに伴っ
    て求められる音声符号化パラメータの一つである反射係
    数を使って表される当該音声フレームの音声特徴量と、
    を用いて当該音声フレームが有音区間であるか無音区間
    であるかの判定を行うことを特徴とする有音無音判定
    法。
  2. 【請求項2】 送信すべき音声信号をフレーム単位にベ
    クトル量子化し符号化することにより高能率符号化し音
    声符号化データとして送信するものとし、その際、送信
    すべき音声信号の中で、音声の存在する有音区間と音声
    の存在しない無音区間とを判定して、有音区間では音声
    符号化データを送信し、無音区間では音声符号化データ
    を送信しないようにするときの該有音区間と無音区間の
    判定方法である有音無音判定法において、 送信すべき音声信号のフレーム単位に求めた音声電力の
    平均値と、予め定めた一定フレーム数だけ前のフレーム
    から現在の当該フレームまでの各フレームについてフレ
    ーム単位に求めた平均電力の最大値と最小値の差の値
    と、各フレームの音声信号を高能率符号化するのに伴っ
    て求められる音声符号化パラメータの一つである反射係
    数を使って表される当該音声フレームの音声特徴量と、 送信すべき音声信号をフレーム単位にベクトル量子化し
    符号化する際に得られるベクトルコードのコードブック
    インデックスを使って表される当該音声フレームの音声
    特徴量と、を用いて当該音声フレームが有音区間である
    か無音区間であるかの判定を行うことを特徴とする有音
    無音判定法。
JP4134543A 1992-05-27 1992-05-27 有音無音判定法 Pending JPH05323996A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4134543A JPH05323996A (ja) 1992-05-27 1992-05-27 有音無音判定法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4134543A JPH05323996A (ja) 1992-05-27 1992-05-27 有音無音判定法

Publications (1)

Publication Number Publication Date
JPH05323996A true JPH05323996A (ja) 1993-12-07

Family

ID=15130779

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4134543A Pending JPH05323996A (ja) 1992-05-27 1992-05-27 有音無音判定法

Country Status (1)

Country Link
JP (1) JPH05323996A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5937375A (en) * 1995-11-30 1999-08-10 Denso Corporation Voice-presence/absence discriminator having highly reliable lead portion detection
KR100760905B1 (ko) * 2006-01-06 2007-09-21 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
US8145479B2 (en) 2006-01-06 2012-03-27 Realnetworks, Inc. Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5937375A (en) * 1995-11-30 1999-08-10 Denso Corporation Voice-presence/absence discriminator having highly reliable lead portion detection
KR100760905B1 (ko) * 2006-01-06 2007-09-21 와이더댄 주식회사 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치
US8145479B2 (en) 2006-01-06 2012-03-27 Realnetworks, Inc. Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing
US8359198B2 (en) 2006-01-06 2013-01-22 Intel Corporation Pre-processing and speech codec encoding of ring-back audio signals transmitted over a communication network to a subscriber terminal
US8719013B2 (en) 2006-01-06 2014-05-06 Intel Corporation Pre-processing and encoding of audio signals transmitted over a communication network to a subscriber terminal

Similar Documents

Publication Publication Date Title
US6424938B1 (en) Complex signal activity detection for improved speech/noise classification of an audio signal
EP0785541B1 (en) Usage of voice activity detection for efficient coding of speech
US7499853B2 (en) Speech decoder and code error compensation method
US6275794B1 (en) System for detecting voice activity and background noise/silence in a speech signal using pitch and signal to noise ratio information
US6594626B2 (en) Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook
US7426465B2 (en) Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality
JPH09152894A (ja) 有音無音判別器
KR100421648B1 (ko) 음성코딩을 위한 적응성 표준
KR20010093324A (ko) 스피치 코더용의 1/8 난수 발생용 방법 및 장치
JP2000172283A (ja) 有音検出方式及び方法
JPH05323996A (ja) 有音無音判定法
EP1083548B1 (en) Speech signal decoding
EP0694907A2 (en) Speech coder
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP3055608B2 (ja) 音声符号化方法および装置
JPH08195722A (ja) スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
JP3001584B2 (ja) 音声信号送信方法
JPH0786952A (ja) 音声の予測符号化方法
JPH11259099A (ja) 音声符号化・復号装置
JPH07281689A (ja) 音声信号伝送装置
JPH1069298A (ja) 音声復号化方法
JPH0736493A (ja) 可変レート音声符号化装置
JPH07135490A (ja) 音声検出器及び音声検出器を有する音声符号化器
JPH08139688A (ja) 音声符号化装置
MX9603416A (es) Metodo de codificacion de habla.