JPH05323996A - 有音無音判定法 - Google Patents
有音無音判定法Info
- Publication number
- JPH05323996A JPH05323996A JP4134543A JP13454392A JPH05323996A JP H05323996 A JPH05323996 A JP H05323996A JP 4134543 A JP4134543 A JP 4134543A JP 13454392 A JP13454392 A JP 13454392A JP H05323996 A JPH05323996 A JP H05323996A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- voice
- voiced
- section
- transmitted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】
【目的】 ディジタル移動通信のVOX技術に適用する
ための音声信号の有音無音判定法において、高雑音下で
も、少ない所要演算量で安定した無音の検出を可能にす
る。 【構成】 音声信号のフレーム単位に求めた音声電力平
均値だけでなく、過去数フレームにわたる各フレームの
音声電力平均値の最大値と最小値の差、各フレームの音
声信号を高能率符号化するのに伴って得られる音声符号
化パラメータ、を有音無音の判定に用いる。
ための音声信号の有音無音判定法において、高雑音下で
も、少ない所要演算量で安定した無音の検出を可能にす
る。 【構成】 音声信号のフレーム単位に求めた音声電力平
均値だけでなく、過去数フレームにわたる各フレームの
音声電力平均値の最大値と最小値の差、各フレームの音
声信号を高能率符号化するのに伴って得られる音声符号
化パラメータ、を有音無音の判定に用いる。
Description
【0001】
【産業上の利用分野】本発明は、音声信号を送受信する
際、送信側で、その送信すべき音声信号において、音声
の存在する有音区間と音声の存在しない無音区間とを判
定する有音無音判定法に関するものである。
際、送信側で、その送信すべき音声信号において、音声
の存在する有音区間と音声の存在しない無音区間とを判
定する有音無音判定法に関するものである。
【0002】更に詳しくは、ディジタル通信において音
声信号伝送を符号化データ形式(音声信号をフレーム単
位で符号化)で行う際、伝送すべき音声信号の中で、フ
レーム単位に見て音声の存在する有音区間では、送信す
るが、音声の存在しない無音区間では送信を止め(送信
パワをオフ)にして、その分、送信に要する電力の低減
をはかるVOX(Voice Operated Transmitter)制御、
特にディジタル移動通信における移動機の低消費電力化
を図るVOX制御に適用するための有音無音判定法に本
発明は係る。
声信号伝送を符号化データ形式(音声信号をフレーム単
位で符号化)で行う際、伝送すべき音声信号の中で、フ
レーム単位に見て音声の存在する有音区間では、送信す
るが、音声の存在しない無音区間では送信を止め(送信
パワをオフ)にして、その分、送信に要する電力の低減
をはかるVOX(Voice Operated Transmitter)制御、
特にディジタル移動通信における移動機の低消費電力化
を図るVOX制御に適用するための有音無音判定法に本
発明は係る。
【0003】
【従来の技術】従来の有音無音判定法では、入力音声の
音声電力を監視し、該電力の大小のみを用いて有音無音
の判定を行っているものが多い。しかし、周囲雑音が大
きい移動通信においては、従来法では、周囲雑音と音声
を電力の大小だけでは区別できないため、実際には無音
声でも周囲雑音を音声と誤って判定してしまうので、無
音区間を検出できない。
音声電力を監視し、該電力の大小のみを用いて有音無音
の判定を行っているものが多い。しかし、周囲雑音が大
きい移動通信においては、従来法では、周囲雑音と音声
を電力の大小だけでは区別できないため、実際には無音
声でも周囲雑音を音声と誤って判定してしまうので、無
音区間を検出できない。
【0004】あるいは、周囲雑音下でも、無音区間を検
出しようとすると、今度は有音区間を正確に検出できな
いことになり、有音区間であるにもかかわらず、その区
間を無音とする音声欠落の発生を招くという問題もあっ
た。
出しようとすると、今度は有音区間を正確に検出できな
いことになり、有音区間であるにもかかわらず、その区
間を無音とする音声欠落の発生を招くという問題もあっ
た。
【0005】そのほか、入力音声信号の零交叉数、極性
系列等、音声固有の特徴量を有音無音判定のパラメータ
とする方法、判定しきい値を可変とし、無音と判定され
た区間の入力信号に基づき、しきい値を更新する方法等
が提案されているが、判定アルゴリズムが複雑になり、
かつ、信号処理の負担が大きいため、移動通信の携帯機
には適さない。
系列等、音声固有の特徴量を有音無音判定のパラメータ
とする方法、判定しきい値を可変とし、無音と判定され
た区間の入力信号に基づき、しきい値を更新する方法等
が提案されているが、判定アルゴリズムが複雑になり、
かつ、信号処理の負担が大きいため、移動通信の携帯機
には適さない。
【0006】しきい値を可変とする方法は更に、一度有
音区間を誤って無音区間と判定すると、判定しきい値が
更新されるため、以後の通信で、有音区間が軒並み無音
区間と判定されることから、極端な音声欠落の発生する
危険がある。
音区間を誤って無音区間と判定すると、判定しきい値が
更新されるため、以後の通信で、有音区間が軒並み無音
区間と判定されることから、極端な音声欠落の発生する
危険がある。
【0007】
【発明が解決しようとする課題】本発明は、音声信号を
高能率符号化し音声符号化データとして伝送するディジ
タル移動通信方式のVOX技術への適用を狙って、少な
い所要演算量で、高雑音下でも安定した有音無音判定を
実現することのできる有音無音判定法を提供することを
目的とする。
高能率符号化し音声符号化データとして伝送するディジ
タル移動通信方式のVOX技術への適用を狙って、少な
い所要演算量で、高雑音下でも安定した有音無音判定を
実現することのできる有音無音判定法を提供することを
目的とする。
【0008】
【課題を解決するための手段】上記目的達成のため、本
発明では、送信すべき音声信号をフレーム単位に高能率
符号化し音声符号化データとして送信するときの有音無
音判定法において、
発明では、送信すべき音声信号をフレーム単位に高能率
符号化し音声符号化データとして送信するときの有音無
音判定法において、
【0009】送信すべき音声信号のフレーム単位に求め
た音声電力の平均値と、予め定めた一定フレーム数だけ
前のフレームから現在の当該フレームまでの各フレーム
についてフレーム単位に求めた平均電力の最大値と最小
値の差の値と、各フレームの音声信号を高能率符号化す
るのに伴って求められる音声符号化パラメータの一つで
ある反射係数を使って表される当該音声フレームの音声
特徴量と、を用いて当該音声フレームが有音区間である
か無音区間であるかの判定することにした。
た音声電力の平均値と、予め定めた一定フレーム数だけ
前のフレームから現在の当該フレームまでの各フレーム
についてフレーム単位に求めた平均電力の最大値と最小
値の差の値と、各フレームの音声信号を高能率符号化す
るのに伴って求められる音声符号化パラメータの一つで
ある反射係数を使って表される当該音声フレームの音声
特徴量と、を用いて当該音声フレームが有音区間である
か無音区間であるかの判定することにした。
【0010】また送信すべき音声信号をフレーム単位に
ベクトル量子化し符号化する際に得られるベクトルコー
ドのコードブックインデックスを使って表される当該音
声フレームの音声特徴量をも併せ用いて当該音声フレー
ムが有音区間であるか無音区間であるかの判定を行うこ
ととした。
ベクトル量子化し符号化する際に得られるベクトルコー
ドのコードブックインデックスを使って表される当該音
声フレームの音声特徴量をも併せ用いて当該音声フレー
ムが有音区間であるか無音区間であるかの判定を行うこ
ととした。
【0011】
【作用】本発明では、入力音声の現フレームの音声電力
の大きさ以外に、フレーム単位の音声電力の、過去数フ
レームにわたる間の最大値と最小値との差、各フレーム
の音声信号を高能率符号化するのに伴って求められる音
声符号化パラメータの一つである反射係数を使って導出
した値、音声信号をフレーム単位にベクトル量子化し符
号化する際に得られるベクトルコードのコードブックイ
ンデックスをパラメータとして用いて、有音無音判定を
行うことにより、周囲雑音が大きい環境下でも正確な有
音無音判定を実現できる。また、高能率音声符号化の際
に算出される値をパラメータとして流用することによ
り、極めて少ない演算量でVOX制御が可能になる。
の大きさ以外に、フレーム単位の音声電力の、過去数フ
レームにわたる間の最大値と最小値との差、各フレーム
の音声信号を高能率符号化するのに伴って求められる音
声符号化パラメータの一つである反射係数を使って導出
した値、音声信号をフレーム単位にベクトル量子化し符
号化する際に得られるベクトルコードのコードブックイ
ンデックスをパラメータとして用いて、有音無音判定を
行うことにより、周囲雑音が大きい環境下でも正確な有
音無音判定を実現できる。また、高能率音声符号化の際
に算出される値をパラメータとして流用することによ
り、極めて少ない演算量でVOX制御が可能になる。
【0012】
【実施例】次に、図を参照して本発明の実施例を説明す
る。図2は、本発明による有音無音判定法を適用する対
象としてのディジタル移動通信における送信側(ディジ
タル移動通信日本標準方式の音声符号化方式であるVS
ELPを採用している)を示すブロック図である。な
お、VSELPのVはVector、SはSum、Eは
Excited、LはLinear、PはPredic
tion、を表わしている。
る。図2は、本発明による有音無音判定法を適用する対
象としてのディジタル移動通信における送信側(ディジ
タル移動通信日本標準方式の音声符号化方式であるVS
ELPを採用している)を示すブロック図である。な
お、VSELPのVはVector、SはSum、Eは
Excited、LはLinear、PはPredic
tion、を表わしている。
【0013】図2において、高能率音声符号化器1に
は、マイクMからフレーム単位の音声が64kb/sの
PCM信号形式に変換されて入力され、高能率音声符号
化器1において符号化された符号化データが送信制御部
3へ、また、高能率音声符号化器1において符号化の際
に求められた符号化パラメータが有音区間検出器2へ出
力される。
は、マイクMからフレーム単位の音声が64kb/sの
PCM信号形式に変換されて入力され、高能率音声符号
化器1において符号化された符号化データが送信制御部
3へ、また、高能率音声符号化器1において符号化の際
に求められた符号化パラメータが有音区間検出器2へ出
力される。
【0014】有音区間検出器2には、1フレーム単位の
音声がマイクMより64kb/sのPCM信号形式に変
換されて入力され、また、同時に高能率音声符号化器1
からその時点で有音区間検出器2に入力されるフレーム
より1つ前のフレームの符号化パラメータ(音声電力、
反射係数、コードブックインデックス)が入力され、有
音区間検出器2では、当該入力フレームについて前記符
号化パラメータを用いて有音無音の判定処理を行ない、
有音無音の判定結果が送信制御部3へ出力される。
音声がマイクMより64kb/sのPCM信号形式に変
換されて入力され、また、同時に高能率音声符号化器1
からその時点で有音区間検出器2に入力されるフレーム
より1つ前のフレームの符号化パラメータ(音声電力、
反射係数、コードブックインデックス)が入力され、有
音区間検出器2では、当該入力フレームについて前記符
号化パラメータを用いて有音無音の判定処理を行ない、
有音無音の判定結果が送信制御部3へ出力される。
【0015】送信制御部3には、高能率音声符号化器1
から符号化データが、有音区間検出器2から有音無音判
定結果が入力される。送信制御部3は、有音無音判定結
果により、符号化データ送信、送信開始予告信号、送信
停止予告信号のいずれかを選択して、送信機Tx.4に
渡す。送信機Tx.4は、それに応じて送信、或いは送
信停止を行い、送信に要する電力の低減をはかるVOX
(Voice Operated Transmitter)制御を行う。
から符号化データが、有音区間検出器2から有音無音判
定結果が入力される。送信制御部3は、有音無音判定結
果により、符号化データ送信、送信開始予告信号、送信
停止予告信号のいずれかを選択して、送信機Tx.4に
渡す。送信機Tx.4は、それに応じて送信、或いは送
信停止を行い、送信に要する電力の低減をはかるVOX
(Voice Operated Transmitter)制御を行う。
【0016】図1は、本発明による有音無音判定アルゴ
リズムの一例を示す説明図である。有音区間において、
それまでの有音との判定が無音との判定に変わり、有音
区間から無音区間へ判定が遷移するときの条件は、三つ
あり、それが遷移1の(1),(2),(3)で示され
ている。
リズムの一例を示す説明図である。有音区間において、
それまでの有音との判定が無音との判定に変わり、有音
区間から無音区間へ判定が遷移するときの条件は、三つ
あり、それが遷移1の(1),(2),(3)で示され
ている。
【0017】同様に、無音区間において、それまでの無
音との判定が有音との判定に変わり、無音区間から有音
区間へ判定が遷移するときの条件は、二つあり、それが
遷移2の(1),(2)で示されている。
音との判定が有音との判定に変わり、無音区間から有音
区間へ判定が遷移するときの条件は、二つあり、それが
遷移2の(1),(2)で示されている。
【0018】遷移1の条件(1)は、日本標準音声符号
化方式(VSELP)による音声信号1フレーム当たり
の音声電力平均値の符号化値r0(0≦r0≦31)を
用い、そのr0が或るしきい値TH1より小さいとき、
無音と判定するものである。これは、周囲雑音レベルが
十分低い時に効果的に無音区間を検出する。なおjは当
該音声フレームのフレーム番号を表している。
化方式(VSELP)による音声信号1フレーム当たり
の音声電力平均値の符号化値r0(0≦r0≦31)を
用い、そのr0が或るしきい値TH1より小さいとき、
無音と判定するものである。これは、周囲雑音レベルが
十分低い時に効果的に無音区間を検出する。なおjは当
該音声フレームのフレーム番号を表している。
【0019】遷移1の条件(2)は、各フレームの音声
信号を高能率符号化するのに伴って求められる音声符号
化パラメータの一つである反射係数riから次の式(数
1)で表される演算量を算出しておく。
信号を高能率符号化するのに伴って求められる音声符号
化パラメータの一つである反射係数riから次の式(数
1)で表される演算量を算出しておく。
【0020】
【数1】
【0021】そして、音声信号1フレーム当たりの音声
電力平均値の符号化値r0がしきい値TH2より小さく
(但し、しきい値TH2は、先のしきい値TH1より大
きく設定しておく)かつ、前記演算量がしきい値(TH
_RI)より大きいとき、無音と判定するものである。
電力平均値の符号化値r0がしきい値TH2より小さく
(但し、しきい値TH2は、先のしきい値TH1より大
きく設定しておく)かつ、前記演算量がしきい値(TH
_RI)より大きいとき、無音と判定するものである。
【0022】上記演算量は、音声信号では、比較的小さ
い値をとり、ホワイトノイズなど周囲雑音では、音声信
号より大きい値をとるので、周囲雑音の電力とは無関係
に音声と周囲雑音の分離が可能である。
い値をとり、ホワイトノイズなど周囲雑音では、音声信
号より大きい値をとるので、周囲雑音の電力とは無関係
に音声と周囲雑音の分離が可能である。
【0023】ここで、前記式(数1)の物理的意味を説
明しておく。ri (j)は、第jフレームのi次反射係
数を表す。ここで与えられたフレームにおける近似残差
エネルギーRSは、次の式(数2)で与えられる。
明しておく。ri (j)は、第jフレームのi次反射係
数を表す。ここで与えられたフレームにおける近似残差
エネルギーRSは、次の式(数2)で与えられる。
【0024】
【数2】
【0025】この式(数2)から次の式(数3)が求ま
る。
る。
【数3】
【0026】この式(数3)から分かるように、次の式
(数4)は近似残差エネルギーに比例する値である。近
似残差エネルギーが大きいということは、そのフレーム
は音声ではなく、また近似残差エネルギーが小さいとき
に、そのフレームは音声に非常に近いということが分か
っており、近似残差エネルギーは、そのような判断の目
安となる物理量になっているわけである。
(数4)は近似残差エネルギーに比例する値である。近
似残差エネルギーが大きいということは、そのフレーム
は音声ではなく、また近似残差エネルギーが小さいとき
に、そのフレームは音声に非常に近いということが分か
っており、近似残差エネルギーは、そのような判断の目
安となる物理量になっているわけである。
【数4】
【0027】但し、Nはフレーム長、R’q (0)はフ
レームエネルギーの符号化値である。また上記各式のΠ
は、i=1からi=10までの各項の掛け算を表すもの
であることは述べるまでもない。i=1からi=10ま
でというのは、1フレームにおいて、i=1からi=1
0までの、10次の反射係数ri があるということであ
る。
レームエネルギーの符号化値である。また上記各式のΠ
は、i=1からi=10までの各項の掛け算を表すもの
であることは述べるまでもない。i=1からi=10ま
でというのは、1フレームにおいて、i=1からi=1
0までの、10次の反射係数ri があるということであ
る。
【0028】次に遷移1の条件(3)は、VSELP符
号化の際に求められるGSP0インデックスであるgs
p0を併せ用いるもので、音声信号1フレーム当たりの
音声電力平均値の符号化値r0がしきい値TH2より小
さく、かつ、上記インデックスgsp0がしきい値(T
H_GSP0)より小さいときに無音と判定するもので
ある。
号化の際に求められるGSP0インデックスであるgs
p0を併せ用いるもので、音声信号1フレーム当たりの
音声電力平均値の符号化値r0がしきい値TH2より小
さく、かつ、上記インデックスgsp0がしきい値(T
H_GSP0)より小さいときに無音と判定するもので
ある。
【0029】本条件は、周囲雑音レベルが比較的大きい
とき、周囲雑音の電力とは無関係に音声と周囲雑音を分
離するのに有効である。ここで、GSP0インデックス
について簡単に説明しておく。
とき、周囲雑音の電力とは無関係に音声と周囲雑音を分
離するのに有効である。ここで、GSP0インデックス
について簡単に説明しておく。
【0030】VSELPという符号化方式では、各フレ
ーム毎に分析される複数個のパラメータをセットして1
組のベクトル(パターン)とし、コードブック(符号
帳)に蓄えられている複数個のベクトルコードのなかか
らひずみが最小となるコードを選択し、そのコード番号
を符号として送り、受信側では、その符号を、同じコー
ドブック(符号帳)を参照して復号するというやり方で
ある。GSP0インデックスというのは、そのコード番
号に相当するものである。
ーム毎に分析される複数個のパラメータをセットして1
組のベクトル(パターン)とし、コードブック(符号
帳)に蓄えられている複数個のベクトルコードのなかか
らひずみが最小となるコードを選択し、そのコード番号
を符号として送り、受信側では、その符号を、同じコー
ドブック(符号帳)を参照して復号するというやり方で
ある。GSP0インデックスというのは、そのコード番
号に相当するものである。
【0031】なお、無音との判定は、1フレームのみで
所定条件を満たしても直ぐには行なわず、10フレーム
程度連続して所定条件を満たした場合にのみ行い、それ
により送信を停止する方法が、音声品質の観点から有効
である。
所定条件を満たしても直ぐには行なわず、10フレーム
程度連続して所定条件を満たした場合にのみ行い、それ
により送信を停止する方法が、音声品質の観点から有効
である。
【0032】次に、図1において、遷移2(つまり無音
区間において、それまでの無音との判定が有音との判定
に変わり、無音区間から有音区間へ判定が遷移すると
き)の条件の(1)は、やはり音声信号1フレーム当た
りの音声電力平均値の符号化値r0を用い、該r0がし
きい値TH3より大きいとき有音区間と判定する。
区間において、それまでの無音との判定が有音との判定
に変わり、無音区間から有音区間へ判定が遷移すると
き)の条件の(1)は、やはり音声信号1フレーム当た
りの音声電力平均値の符号化値r0を用い、該r0がし
きい値TH3より大きいとき有音区間と判定する。
【0033】また遷移2の条件の(2)は、判定の対象
とする現フレームから(例えば)5フレーム前のフレー
ムからの各フレームの音声電力の中の最大値と最小値を
それぞれ求め、その最大値と最小値の差を算出し、この
値がしきい値TH4より大きいとき有音と判定する。遷
移2の条件(2)の式におけるJOは、この場合定数4
を意味している。
とする現フレームから(例えば)5フレーム前のフレー
ムからの各フレームの音声電力の中の最大値と最小値を
それぞれ求め、その最大値と最小値の差を算出し、この
値がしきい値TH4より大きいとき有音と判定する。遷
移2の条件(2)の式におけるJOは、この場合定数4
を意味している。
【0034】この場合、周囲雑音レベルが高くても、周
囲雑音の振幅変動が小さければ、効果的に有音区間の検
出ができる。
囲雑音の振幅変動が小さければ、効果的に有音区間の検
出ができる。
【0035】本実施例では、有音区間から無音区間への
遷移のみにVSELP符号化の符号化パラメータを用い
ており、無音区間から有音区間への遷移には、簡単に算
出できる音声電力のみを用いている。このようにするこ
とで、無音期間中、高能率音声符号化器の動作を停止さ
せることが可能になるので、送信停止による送信電力の
低減だけでなく、送信停止時における高能率音声符号化
器の消費電力も低減できる。
遷移のみにVSELP符号化の符号化パラメータを用い
ており、無音区間から有音区間への遷移には、簡単に算
出できる音声電力のみを用いている。このようにするこ
とで、無音期間中、高能率音声符号化器の動作を停止さ
せることが可能になるので、送信停止による送信電力の
低減だけでなく、送信停止時における高能率音声符号化
器の消費電力も低減できる。
【0036】図3は、本発明による有音無音判定法を用
いて、VOX制御を行った場合の、入力音声のSN比と
送信比率の関係を、従来技術によるそれと比較して示し
た特性図である。同図において、横軸はSN比であり、
縦軸は伝送される音声信号の中で、どれだけの%部分が
有音と判定されて実際に符号化され送信されたかを表す
量である。
いて、VOX制御を行った場合の、入力音声のSN比と
送信比率の関係を、従来技術によるそれと比較して示し
た特性図である。同図において、横軸はSN比であり、
縦軸は伝送される音声信号の中で、どれだけの%部分が
有音と判定されて実際に符号化され送信されたかを表す
量である。
【0037】各サンプル(1〜4)の原音の有音区間の
時間比率はそれぞれ、70%,61%,63%,64%
である。本発明の方法を用いることにより、SN=20
dBの高雑音下においても(換言すればSN比が少なく
とも20dB程度、得られさえすれば)、ほぼ正確なV
OX制御が可能なことがわかる。
時間比率はそれぞれ、70%,61%,63%,64%
である。本発明の方法を用いることにより、SN=20
dBの高雑音下においても(換言すればSN比が少なく
とも20dB程度、得られさえすれば)、ほぼ正確なV
OX制御が可能なことがわかる。
【0038】図3で、*印を付した特性は従来の方法で
得られた結果(図1で、遷移1及び2の条件(1)のみ
を用いた場合の特性)を示しており、SN比が少なくと
も30dB程度、得られなければ、正確なVOX制御は
不可能であることを示している。この*印を付した特性
と比較することにより、本発明の有効性が認められるで
あろう。
得られた結果(図1で、遷移1及び2の条件(1)のみ
を用いた場合の特性)を示しており、SN比が少なくと
も30dB程度、得られなければ、正確なVOX制御は
不可能であることを示している。この*印を付した特性
と比較することにより、本発明の有効性が認められるで
あろう。
【0039】
【発明の効果】以上説明したように、本発明によれば、
背景雑音レベルが高い場合にも無音区間の検出が可能に
なり、背景雑音レベルが大きい環境下でも正確な有音無
音判定が可能になるという利点がある。また、高能率音
声符号化の際に必然的に算出される値を有音無音判定パ
ラメータとして流用することにより、極めて少ない演算
量でVOX制御が可能になるという利点もある。
背景雑音レベルが高い場合にも無音区間の検出が可能に
なり、背景雑音レベルが大きい環境下でも正確な有音無
音判定が可能になるという利点がある。また、高能率音
声符号化の際に必然的に算出される値を有音無音判定パ
ラメータとして流用することにより、極めて少ない演算
量でVOX制御が可能になるという利点もある。
【図面の簡単な説明】
【図1】本発明による有音無音判定アルゴリズムの一例
を示す説明図である。
を示す説明図である。
【図2】本発明による有音無音判定法を適用する対象と
してのディジタル移動通信における送信側を示すブロッ
ク図である。
してのディジタル移動通信における送信側を示すブロッ
ク図である。
【図3】本発明による有音無音判定法を用いてVOX制
御を行った場合の入力音声のSN比と送信比率の関係を
従来技術によるそれと比較して示した特性図である。
御を行った場合の入力音声のSN比と送信比率の関係を
従来技術によるそれと比較して示した特性図である。
1…高能率音声符号化器、2…有音区間検出器、3…送
信制御部、4…送信機、A…アンテナ、M…マイク
信制御部、4…送信機、A…アンテナ、M…マイク
───────────────────────────────────────────────────── フロントページの続き (72)発明者 三木 俊雄 東京都千代田区内幸町1丁目1番6号 日 本電信電話株式会社内
Claims (2)
- 【請求項1】 送信すべき音声信号をフレーム単位に高
能率符号化し音声符号化データとして送信するものと
し、その際、送信すべき音声信号の中で、音声の存在す
る有音区間と音声の存在しない無音区間とを判定して、
有音区間では音声符号化データを送信し、無音区間では
音声符号化データを送信しないようにするときの該有音
区間と無音区間の判定方法である有音無音判定法におい
て、 送信すべき音声信号のフレーム単位に求めた音声電力の
平均値と、予め定めた一定フレーム数だけ前のフレーム
から現在の当該フレームまでの各フレームについてフレ
ーム単位に求めた平均電力の最大値と最小値の差の値
と、各フレームの音声信号を高能率符号化するのに伴っ
て求められる音声符号化パラメータの一つである反射係
数を使って表される当該音声フレームの音声特徴量と、
を用いて当該音声フレームが有音区間であるか無音区間
であるかの判定を行うことを特徴とする有音無音判定
法。 - 【請求項2】 送信すべき音声信号をフレーム単位にベ
クトル量子化し符号化することにより高能率符号化し音
声符号化データとして送信するものとし、その際、送信
すべき音声信号の中で、音声の存在する有音区間と音声
の存在しない無音区間とを判定して、有音区間では音声
符号化データを送信し、無音区間では音声符号化データ
を送信しないようにするときの該有音区間と無音区間の
判定方法である有音無音判定法において、 送信すべき音声信号のフレーム単位に求めた音声電力の
平均値と、予め定めた一定フレーム数だけ前のフレーム
から現在の当該フレームまでの各フレームについてフレ
ーム単位に求めた平均電力の最大値と最小値の差の値
と、各フレームの音声信号を高能率符号化するのに伴っ
て求められる音声符号化パラメータの一つである反射係
数を使って表される当該音声フレームの音声特徴量と、 送信すべき音声信号をフレーム単位にベクトル量子化し
符号化する際に得られるベクトルコードのコードブック
インデックスを使って表される当該音声フレームの音声
特徴量と、を用いて当該音声フレームが有音区間である
か無音区間であるかの判定を行うことを特徴とする有音
無音判定法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4134543A JPH05323996A (ja) | 1992-05-27 | 1992-05-27 | 有音無音判定法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4134543A JPH05323996A (ja) | 1992-05-27 | 1992-05-27 | 有音無音判定法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH05323996A true JPH05323996A (ja) | 1993-12-07 |
Family
ID=15130779
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4134543A Pending JPH05323996A (ja) | 1992-05-27 | 1992-05-27 | 有音無音判定法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH05323996A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5937375A (en) * | 1995-11-30 | 1999-08-10 | Denso Corporation | Voice-presence/absence discriminator having highly reliable lead portion detection |
KR100760905B1 (ko) * | 2006-01-06 | 2007-09-21 | 와이더댄 주식회사 | 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 |
US8145479B2 (en) | 2006-01-06 | 2012-03-27 | Realnetworks, Inc. | Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing |
-
1992
- 1992-05-27 JP JP4134543A patent/JPH05323996A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5937375A (en) * | 1995-11-30 | 1999-08-10 | Denso Corporation | Voice-presence/absence discriminator having highly reliable lead portion detection |
KR100760905B1 (ko) * | 2006-01-06 | 2007-09-21 | 와이더댄 주식회사 | 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 |
US8145479B2 (en) | 2006-01-06 | 2012-03-27 | Realnetworks, Inc. | Improving the quality of output audio signal,transferred as coded speech to subscriber's terminal over a network, by speech coder and decoder tandem pre-processing |
US8359198B2 (en) | 2006-01-06 | 2013-01-22 | Intel Corporation | Pre-processing and speech codec encoding of ring-back audio signals transmitted over a communication network to a subscriber terminal |
US8719013B2 (en) | 2006-01-06 | 2014-05-06 | Intel Corporation | Pre-processing and encoding of audio signals transmitted over a communication network to a subscriber terminal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6424938B1 (en) | Complex signal activity detection for improved speech/noise classification of an audio signal | |
EP0785541B1 (en) | Usage of voice activity detection for efficient coding of speech | |
US7499853B2 (en) | Speech decoder and code error compensation method | |
US6275794B1 (en) | System for detecting voice activity and background noise/silence in a speech signal using pitch and signal to noise ratio information | |
US6594626B2 (en) | Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook | |
US7426465B2 (en) | Speech signal decoding method and apparatus using decoded information smoothed to produce reconstructed speech signal to enhanced quality | |
JPH09152894A (ja) | 有音無音判別器 | |
KR100421648B1 (ko) | 음성코딩을 위한 적응성 표준 | |
KR20010093324A (ko) | 스피치 코더용의 1/8 난수 발생용 방법 및 장치 | |
JP2000172283A (ja) | 有音検出方式及び方法 | |
JPH05323996A (ja) | 有音無音判定法 | |
EP1083548B1 (en) | Speech signal decoding | |
EP0694907A2 (en) | Speech coder | |
JP3496618B2 (ja) | 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法 | |
JP3055608B2 (ja) | 音声符号化方法および装置 | |
JPH08195722A (ja) | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 | |
JP3001584B2 (ja) | 音声信号送信方法 | |
JPH0786952A (ja) | 音声の予測符号化方法 | |
JPH11259099A (ja) | 音声符号化・復号装置 | |
JPH07281689A (ja) | 音声信号伝送装置 | |
JPH1069298A (ja) | 音声復号化方法 | |
JPH0736493A (ja) | 可変レート音声符号化装置 | |
JPH07135490A (ja) | 音声検出器及び音声検出器を有する音声符号化器 | |
JPH08139688A (ja) | 音声符号化装置 | |
MX9603416A (es) | Metodo de codificacion de habla. |