JP2001005474A

JP2001005474A - 音声符号化装置及び方法、入力信号判定方法、音声復号装置及び方法、並びにプログラム提供媒体

Info

Publication number: JP2001005474A
Application number: JP11173354A
Authority: JP
Inventors: Yuji Maeda; 祐児前田; Masayuki Nishiguchi; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1999-06-18
Filing date: 1999-06-18
Publication date: 2001-01-12
Anticipated expiration: 2019-06-18
Also published as: TW521261B; JP4438127B2; EP1598811B1; KR100767456B1; EP1061506B1; EP1061506A3; KR20010007416A; EP1061506A2; EP1598811A2; DE60038914D1; US6654718B1; DE60027956D1; EP1598811A3; DE60027956T2; CN1282952A; CN1135527C

Abstract

(57)【要約】【課題】音声コーデックにおいて、音声区間中で重要
な意味合いを持つ有声音に比較的多い伝送ビット量を与
え、以下無声音、背景雑音の順にビット数を減らすこと
により総伝送ビット数を抑制し、平均伝送ビット量を少
なくする。【解決手段】入力端子１から入力された、フィルタ処
理が施された上記入力音声信号の実効（root mean squa
re、r.m.s）値を演算するr.m.s演算部２と、上記実効値
rmsから実効値の定常レベルを演算する定常レベル演算
部３と、r.m.s演算部２の出力r.m.sを定常レベル演算部
３の出力min_rmsで除算して後述する除算値rms_gを演算
する除算演算子４と、対数振幅差分演算部８からの対数
振幅差分wdifより判定フラグdecflagを出力するファジ
イ推論部９とを備えてなる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力音声信号の無
声音区間と有声音区間とでビットレートを可変して符号
化する符号化装置及び方法に関する。また、上記符号化
装置及び方法により符号化されて伝送されてきた符号化
データを復号する復号装置及び方法に関する。また、上
記符号化方法、復号方法をソフトウェア的に実行させる
ためのプログラム提供媒体に関する。

【０００２】

【従来の技術】近年、伝送路を必要とする通信分野にお
いては、伝送帯域の有効利用を実現するために、伝送し
ようとする入力信号の種類、例えば有声音と無声音区間
に分けられる音声信号区間と、背景雑音区間のような種
類によって、符号化レートを可変してから伝送すること
が考えられるようになった。

【０００３】例えば、背景雑音区間と判断されると、符
号化パラメータを全く送らずに、復号化装置側では、特
に背景雑音を生成することをせずに、単にミュートする
ことが考えられた。

【０００４】しかし、これでは通信相手が音声を発して
いればその音声には背景雑音が乗っているが、音声を発
しないときには突然無音になってしまうことになるので
不自然な通話となってしまう。

【０００５】そのため、可変レートコーデックにおいて
は、背景雑音区間として判断されると符号化のパラメー
タのいくつかを送らずに、復号化装置側では過去のパラ
メータを繰り返し用いて背景雑音を生成するということ
を行っていた。

【０００６】

【発明が解決しようとする課題】ところで、上述したよ
うに、過去のパラメータをそのまま繰り返し用いると、
雑音自体がピッチを持つような印象を受け、不自然な雑
音になることが多い。これは、レベルなどを変えても、
線スペクトル対（ＬＳＰ）パラメータが同じである限り
起こってしまう。

【０００７】他のパラメータを乱数等で変えるようにし
ても、ＬＳＰパラメータが同一であると、不自然な感じ
を与えてしまう。

【０００８】本発明は、上記実情に鑑みてなされたもの
であり、音声コーデックにおいて、音声区間中で重要な
意味合いを持つ有声音に比較的多い伝送ビット量を与
え、以下無声音、背景雑音の順にビット数を減らすこと
により総伝送ビット数を抑制でき、平均伝送ビット量を
少なくできる音声符号化装置及び方法、入力信号判定方
法、復号装置及び方法、並びにプログラム提供媒体の提
供を目的とする。

【０００９】

【課題を解決するための手段】本発明に係る音声符号化
装置は、上記課題を解決するために、入力音声信号の無
声音区間と有声音区間で可変レートによる符号化を行う
音声符号化装置において、時間軸上での入力音声信号を
所定の単位で区分し、この単位で求めた信号レベルとス
ペクトル包絡の時間的な変化に基づいて無声音区間を背
景雑音区間と音声区間に分けて判定する入力信号判定手
段を備え、上記入力信号判定手段で判定された背景雑音
区間のパラメータと、上記音声区間のパラメータと、有
声音区間のパラメータに対する符号化ビットの割り当て
を異ならせることを特徴とする。

【００１０】また、本発明に係る音声符号化方法は、上
記課題を解決するために、入力音声信号の無声音区間と
有声音区間で可変レートによる符号化を行う音声符号化
方法において、時間軸上での入力音声信号を所定の単位
で区分し、この単位で求めた信号レベルとスペクトル包
絡の時間的な変化に基づいて無声音区間を背景雑音区間
と音声区間に分けて判定する入力信号判定工程を備え、
上記入力信号判定工程で判定された背景雑音区間のパラ
メータと、上記音声区間のパラメータと、有声音区間の
パラメータに対する符号化ビットの割り当てを異ならせ
ることを特徴とする。

【００１１】本発明に係る入力信号判定方法は、上記課
題を解決するために、時間軸上での入力音声信号を所定
の単位で区分し、この単位で入力信号の信号レベルの時
間的な変化を求める工程と、上記単位でのスペクトル包
絡の時間的な変化を求める工程と、上記信号レベル及び
スペクトル包絡の時間的な変化から背景雑音か否かを判
定する工程とを備えることを特徴とする。

【００１２】本発明に係る音声復号装置は、上記課題を
解決するために、音声区間のパラメータと、有声音区間
のパラメータに対する符号化ビットの割り当てが異なっ
て伝送されてきた符号化ビットを復号する復号装置にお
いて、上記符号化ビットから音声区間であるか、又は背
景雑音区間であるかを判定する判定手段と、上記判定手
段で背景雑音区間を示す情報を取り出したときには現在
又は現在及び過去に受信したＬＰＣ係数、現在又は現在
及び過去に受信したＣＥＬＰのゲインインデクス、及び
内部でランダムに生成したＣＥＬＰのシェイプインデク
スを用いて上記符号化ビットを復号する復号手段とを備
えることを特徴とする。

【００１３】本発明に係る音声復号方法は、上記課題を
解決するために、無声音区間のパラメータと、有声音区
間のパラメータに対する符号化ビットの割り当てが異な
って伝送されてきた符号化ビットを復号する復号方法に
おいて、上記符号化ビットから音声区間であるか、又は
背景雑音区間であるかを判定する判定工程と、上記判定
工程で背景雑音区間を示す情報を取り出したときには現
在又は現在及び過去に受信したＬＰＣ係数、現在又は現
在及び過去に受信したＣＥＬＰのゲインインデクス、及
び内部でランダムに生成したＣＥＬＰのシェイプインデ
クスを用いて上記符号化ビットを復号する復号工程とを
備えることを特徴とする。

【００１４】本発明に係るプログラム提供媒体は、上記
課題を解決するために、入力音声信号の無声音区間と有
声音区間で可変レートによる符号化を行う音声符号化プ
ログラムを提供するプログラム提供媒体において、時間
軸上での入力音声信号を所定の単位で区分し、この単位
で求めた信号レベルとスペクトル包絡の時間的な変化に
基づいて無声音区間を背景雑音区間と音声区間に分けて
判定する入力信号判定工程を備え、上記入力信号判定工
程で判定された背景雑音区間のパラメータと、上記音声
区間のパラメータと、有声音区間のパラメータに対する
符号化ビットの割り当てを異ならせるプログラムを提供
することを特徴とする。

【００１５】また、本発明に係るプログラム提供媒体
は、上記課題を解決するために、無声音区間のパラメー
タと、有声音区間のパラメータに対する符号化ビットの
割り当てが異なって伝送されてきた符号化ビットを復号
するための復号プログラムを提供するためのプログラム
提供媒体において、上記符号化ビットから音声区間であ
るか、又は背景雑音区間であるかを判定する判定工程
と、上記判定工程で背景雑音区間を示す情報を取り出し
たときには現在又は現在及び過去に受信したＬＰＣ係
数、現在又は現在及び過去に受信したＣＥＬＰのゲイン
インデクス、及び内部でランダムに生成したＣＥＬＰの
シェイプインデクスを用いて上記符号化ビットを復号す
る復号工程とを備えるプログラムを提供することを特徴
とする。

【００１６】

【発明の実施の形態】以下、本発明に係る符号化装置及
び方法、並びに音声復号装置及び方法の実施の形態につ
いて図面を参照しながら説明する。

【００１７】基本的には、主に送信側で音声を分析する
ことにより符号化パラメータを求め、それらを伝送した
後、受信側で音声を合成するシステムが挙げられる。特
に、送信側では入力音声の性質に応じて符号化のモード
分けを行い、ビットレートを可変とすることで伝送ビッ
トレートの平均値を小さくする。

【００１８】具体例としては、図１に構成を示す、携帯
電話装置が挙げられる。この携帯電話装置は、本発明に
係る符号化装置及び方法、並びに復号装置及び方法を図
１に示すような、音声符号化装置２０、並びに音声復号
化装置３１として用いる。

【００１９】音声符号化装置２０は、入力音声信号の無
声音（UnVoiced：ＵＶ）区間のビットレートを有声音
（Voiced：Ｖ）区間のビットレートより少なくする符号
化を行う。更に、無声音区間において背景雑音区間（非
音声区間）と音声区間を判定し、非音声区間においては
更に低いビットレートにより符号化を行う。また、非音
声区間と音声区間とを判定しフラグにより復号化装置３
１側に伝える。

【００２０】この音声符号化装置２０内部で、入力音声
信号の中の無声音区間又は有声音区間の判定、又は無声
音区間の非音声区間と音声区間の判定は入力信号判定部
２１ａが行う。この入力信号判定部２１ａの詳細につい
ては後述する。

【００２１】先ず、送信側の構成を説明する。マイクロ
ホン１から入力された音声信号は、Ａ／Ｄ変換器１０に
よりディジタル信号に変換され、音声符号化装置２０に
より可変レートの符号化が施され、伝送路符号化器２２
により伝送路の品質が音声品質に影響を受けにくいよう
に符号化された後、変調器２３で変調され、送信機２４
で送信処理が施され、アンテナ共用器２５を通して、ア
ンテナ２６から送信される。

【００２２】一方、受信側の音声復号化装置３１は、音
声区間であるか、非音声区間であるかを示すフラグを受
信するとともに、非音声区間においては、現在又は現在
及び過去に受信したＬＰＣ係数、現在又は現在及び過去
に受信したＣＥＬＰ（符号励起線形予測）のゲインイン
デクス、及び復号器内部でランダムに生成したＣＥＬＰ
のシェイプインデクスを用いて復号する。

【００２３】受信側の構成について説明する。アンテナ
２６で捉えられた電波は、アンテナ共用器２５を通じて
受信機２７で受信され、復調器２９で復調され、伝送路
復号化器３０で伝送路誤りが訂正され、音声復号化装置
３１で復号され、Ｄ／Ａ変換器３２でアナログ音声信号
に戻されて、スピーカ３３から出力される。

【００２４】また、制御部３４は上記各部をコントロー
ルし、シンセサイザ２８は送受信周波数を送信機２４、
及び受信機２７に与えている。また、キーパッド３５及
びＬＣＤ表示器３６はマンマシンインターフェースに利
用される。

【００２５】次に、音声符号化装置２０の詳細について
図２及び図３を用いて説明する。図２は音声符号化装置
２０内部にあって、入力信号判定部２１ａとパラメータ
制御部２１ｂを除いた符号化部の詳細な構成図である。
また、図３は入力信号判定部２１ａとパラメータ制御部
２１ｂの詳細な構成図である。

【００２６】先ず、入力端子１０１には８KHzサンプリ
ングされた音声信号が供給される。この入力音声信号
は、ハイパスフィルタ（ＨＰＦ）１０９にて不要な帯域
の信号を除去するフィルタ処理が施された後、入力信号
判定部２１ａと、ＬＰＣ（線形予測符号化）分析・量子
化部１１３のＬＰＣ分析回路１３２と、ＬＰＣ逆フィル
タ回路１１１に送られる。

【００２７】入力信号判定部２１ａは、図３に示すよう
に、入力端子１から入力された、フィルタ処理が施され
た上記入力音声信号の実効（root mean square、r.m.
s）値を演算するr.m.s演算部２と、上記実効値rmsから
実効値の定常レベルを演算する定常レベル演算部３と、
r.m.s演算部２の出力r.m.sを定常レベル演算部３の出力
min_rmsで除算して後述する除算値rms_gを演算する除算
演算子４と、入力端子１からの入力音声信号をLPC分析
し、LPC係数α(m)を求めるLPC分析部５と、LPC分析部５
からのLPC係数α(m)をLPCケプストラム係数C_L(m)に変換
するLPCケプストラム係数演算部６と、LPCケプストラム
係数演算部６のLPCケプストラム係数C_L(m)から平均対数
振幅logAmp(i)を求める対数振幅演算部７と、対数振幅
演算部７の平均対数振幅logAmp(i)から対数振幅差分wdi
fを求める対数振幅差分演算部８と、除算演算子４から
のrms_gと、対数振幅差分演算部８からの対数振幅差分wd
ifより判定フラグdecflagを出力するファジイ推論部９
とを備えてなる。なお、図３には説明の都合上、上記入
力音声信号から後述するidVUV判定結果を出力するV/UV
判定部１１５を含むと共に、各種パラメータを符号化し
て出力する図２に示す符号化部を音声符号化器１３とし
て示している。

【００２８】また、パラメータ制御部２１ｂは、上記V/
UV判定部１１５からのidVUV判定結果と上記ファジイ推
論部９からの判定結果decflagを基に背景雑音カウンタb
gnCnt、背景雑音周期カウンタbgnIntvlをセットするカ
ウンタ制御部１１と、カウンタ制御部１１からのbgnInt
vlと上記idVUV判定結果よりidVUVパラメータと、更新フ
ラグFlagを決定し、出力端子１０６から出力するパラメ
ータ生成部１２とを備えてなる。

【００２９】次に、入力信号判定部２１ａ及びパラメー
タ制御部２１ｂの上記各部の詳細な動作について説明す
る。先ず、入力信号判定部２１ａの各部は以下の通りに
動作する。

【００３０】r.m.s演算部２は、８KHzサンプリングされ
た上記入力音声信号を20msec毎のフレーム（160サンプ
ル）に分割する。そして、音声分析については互いにオ
ーバーラップする32msec（256サンプル）で実行する。
ここで入力信号s(n)を８分割して区間電力ene(i)を次の
（１）式から求める。

【００３１】

【数１】

【００３２】こうして求めたene(i)から信号区間の前後
の比ratioを最大にする境界ｍを次の（２）式又は
（３）式により求める。ここで（２）式は前半が後半よ
り大きいときの比ratioであり、（３）式は後半が前半
より大きいときの比ratioである。

【００３３】

【数２】

【００３４】

【数３】

【００３５】但し、ｍ＝２，・・・６の間に限定する。

【００３６】こうして求めた境界ｍより、前半あるいは
後半の大きいほうの平均電力より信号の実効値rmsを次
の（４）式あるいは（５）式から求める。（４）式は前
半が後半より大きいときの実効値rmsであり、（５）式
は後半が前半より大きいときの実効値rmsである。

【００３７】

【数４】

【００３８】

【数５】

【００３９】定常レベル演算部３は、上記実効値rmsか
ら図４に示すフローチャートにしたがって実効値の定常
レベルを演算する。ステップＳ１で過去のフレームの実
効値rmsの安定状態に基づくカウンタst_cntが４以上で
あるか否かを判断し、４以上であればステップＳ２に進
み、過去の連続する４フレームのrmsの中２番目に大き
いものをnear_rmsとする。次に、ステップＳ３でそれ以
前のrmsであるfar_rms(i)（i=0,1）とnear_rmsより最小
の値minvalを求める。

【００４０】こうして求めた最小の値minvalがステップ
Ｓ４で定常的なrmsである値min_rmsより大きいとき、ス
テップＳ５に進み、min_rmsを次の（６）式に示す通り
に更新する。

【００４１】

【数６】

【００４２】その後、ステップＳ６でfar_rmsを次の
（７）式、（８）式に示すように更新する。

【００４３】

【数７】

【００４４】

【数８】

【００４５】次に、ステップＳ７で、rmsと標準レベルS
TD_LEVELの内、小さい方をｍａｘ＿ｖａｌとする。ここ
で、ＳＴＤ＿ＬＥＶＥＬは-30dB位の信号レベルに相当
する値とする。これは、現在のrmsがかなりレベルの高
いものであるとき誤動作しないように、上限を決定する
ためのものである。そして、ステップＳ８でmaxvalをmi
n_rmsと比較してmin_rmsを以下の通り更新する。すなわ
ち、maxvalがmin_rmsより小さいときにはステップＳ９
で（９）式に示すように、また、maxvalがmin_rms以上
であるときにはステップＳ１０で（１０）式に示すよう
にmin_rmsを少しだけ更新する。

【００４６】

【数９】

【００４７】

【数１０】

【００４８】次に、ステップＳ１１でmin_rmsが無音レ
ベルMIN_LEVELより小さいときmin_rms＝MIN_LEVELとす
る。MIN_LEVELは−66dB位の信号レベルに相当する値と
する。

【００４９】ところでステップＳ１２で信号の前後半の
信号レベルの比ratioが４より小さく、rmsがSTD_LEVEL
より小さいときにはフレームの信号は安定しているので
ステップＳ１３に進んで安定性を示すカウンタst_cntを
１歩進し、そうでないときには安定性が乏しいのでステ
ップＳ１４に進んでst_cnt＝０とする。このようにして
目的とする定常のrmsを得ることができる。

【００５０】除算演算子４はr.m.s演算部２の出力r.m.s
を定常レベル演算部３の出力min_rmsで除算してrms_gを
演算する。すなわち、このrms_gは定常的なrmsに対して
今のrmsがどの程度のレベルであるのかを示すものであ
る。

【００５１】次に、LPC分析部５は上記入力音声信号s
(n)より短期予測（LPC）係数α(m)（m=1,・・・，10）
を求める。なお、音声符号化器１３内部でのLPC分析に
より求めたLPC係数α(m)を用いることもできる。LPCケ
プストラム係数演算部６は上記LPC係数α(m)をLPCケプ
ストラム係数C_L(m)に変換する。

【００５２】対数振幅演算部７はLPCケプストラム係数C
_L(m)より対数二乗振幅特性ln|H_L(e^jΩ)|²を次の（１
１）式より求めることができる。

【００５３】

【数１１】

【００５４】しかしここでは近似的に右辺の総和計算の
上限を無限大でなく１６までとし、さらに積分を求める
ことにより区間平均logAmp(i)を次の（１２）及び（１
３）式より求める。ところで、C_L(0)=0なので省略す
る。

【００５５】

【数１２】

【００５６】

【数１３】

【００５７】ここで、ωは平均区間(ω＝Ω_i+1-Ω_i)で5
00Hz(＝π/8)としている。ここでは、logAmp(i)につい
ては0〜2kHzまでを500Hzずつ４等分したi＝0, ,3まで
計算する。

【００５８】次に、対数振幅差分演算部８とファジイ推
論部９の説明に移る。本発明では、無音、背景雑音の検
出にはファジイ理論を用いる。このファジイ推論部９
は、上記除算演算子４がrmsをmin_rmsで割って得た値rm
s_gと、後述する対数振幅差分演算部８からのwdifを用い
て判定フラグdecflagを出力する。

【００５９】図５に、ファジイ推論部９でのファジイル
ールを示すが上段（ａ）については無音、背景雑音(bac
kground noise)についてのルール、中段（ｂ）は主に雑
音パラメータ更新(parameter renovation)のためのルー
ル、下段（ｃ）は音声(speech)のためのルールである。
また、この中で、左列はrmsのためのメンバシップ関
数、中列はスペクトル包絡のためのメンバシップ関数、
右列は推論結果である。

【００６０】ファジイ推論部９は、先ず、除算演算子４
により上記rmsを上記min_rmsで割って得られた値rms_gを
図５の左列に示すメンバシップ関数で分類する。ここ
で、上段からメンバシップ関数μ_Ai1(x₁)(i=1,2,3)を図
６に示すように定義する。なお、x₁=rms_gとする。すな
わち、図５の左列に示すメンバシップ関数は、上段
（ａ）、中段（ｂ）、下段（ｃ）の順に、図６に示すμ
_A11(x₁）、μ_A21(x₁）、μ_A31(x₁）と定義される。

【００６１】一方、対数振幅差分演算部８は、過去ｎ
（例えば４）フレーム分のスペクトルの対数振幅logAmp
(i)を保持し、その平均であるaveAmp(i)を求め、それと
現在ののlogAmp(i)の差分の２乗和wdifを次の（１４）
式から求める。

【００６２】

【数１４】

【００６３】ファジイ推論部９は、対数振幅差分演算部
８が上記のように求めたwdifを図５の中列に示すメンバ
シップ関数で分類する。ここで、上段からメンバシップ
関数μ_Ai2(x₂)(i=1,2,3)を図７に示すように定義する。
なお、x₂=wdifとする。すなわち、図５の中列に示すメ
ンバシップ関数は、上段（ａ）、中段（ｂ）、下段
（ｃ）の順に、図７に示すμ_A12(x₂）、μ_A22(x₂）、μ
_A32(x₂）と定義される。ところで、ここでもしrmsが既
出の定数MIN_LEVEL（無音レベル）より小さい時には図
７には従わず、μ_A12(x₂）＝１、μ_A22(x₂）＝μ
_A32(x₂）＝０とする。なぜなら、信号が微妙になると
き、スペクトルの変動が通常以上に大きく、差別の妨げ
となるからである。

【００６４】ファジイ推論部９は、こうして求めたμ
_Aij(x_j)より推論結果であるメンバシップ関数μ_Bi(y)を
以下に説明するように求める。先ず、図５の上中下段そ
れぞれのμ_Ai1(x₁)とμ_Ai2(x₂)より小さい方を次の（１
５）式に示すようにその段のμ_Bi(y)とする。しかし、
ここで音声を示すメンバシップ関数μ_A31(x₁)とμ_A32(x
₂)のどちらかが１となるとき、μ_B1(y)=μ_B2(y)=0,μ_B3
(y)=1と出力する構成を追加してもよい。

【００６５】

【数１５】

【００６６】この（１５）式より得られた各段のμ
_Bi(y)は図５の右列の関数の値に当たるものである。こ
こでメンバシップ関数μ_Bi(y)を図８に示すように定義
する。すなわち、図５の右列に示すメンバシップ関数
は、上段（ａ）、中段（ｂ）、下段（ｃ）の順に、図８
に示すμ_B1(y）、μ_B2(y）、μ_B3(y）と定義される。

【００６７】これらの値を基にファジイ推論部９は推論
するが、次の（１６）式に示すような面積法による判定
を行う。

【００６８】

【数１６】

【００６９】ここで、y^*は推論結果であり、y_i ^*は各段
のメンバシップ関数の重心であり、図５においては上
段、中段、下段の順に、0.1389、0.5、0.8611となって
いる。また、Siは面積にあたる。S₁〜S₂はメンバシップ
関数μ_Bi(y)を用いて次の（１７）、（１８）、（１
９）式より求められる。

【００７０】

【数１７】

【００７１】

【数１８】

【００７２】

【数１９】

【００７３】これらの値から求められた推論結果y^*の値
により判定フラグdecFlagの出力値を次のように定義す
る。

【００７４】 0≦y^*≦0.34 → decFlag=0 0.34＜y^*＜0.66 → decFlag=2 0.66≦y^*≦1 → decFlag=1 ここで、decFlag=0は判定結果が背景雑音を示す結果で
ある。decFlag=2はパラメータを更新すべき背景雑音を
示す結果である。また、decFlag=1は音声を判別した結
果である。

【００７５】図９に具体例を示す。今仮にx₁=1.6,x₂=0.
35であったとする。これよりμ_Aij(x_j)，μ_Ai2(x₂)，μ
_Bi(y)は以下のように求まる。

【００７６】 μ_A11(x₁)=0.4, μ_A12(x₂)=0, μ_B1(y)=0 μ_A21(x₁)=0.4, μ_A22(x₂)=0.5, μ_B2(y)=0.4 μ_A31(x₁)=0.6, μ_A32(x₂)=0.5, μ_B3(y)=0.5 これより面積を計算するとS1=0,S2=0.2133,S3=0.2083に
なり結局y^*=0.6785となりdecFlag=1となる。すなわち、
音声とする。

【００７７】ここまでが入力信号判定部２１ａの動作で
ある。引き続き、パラメータ制御部２１ｂの各部の詳細
な動作について説明する。

【００７８】カウンタ制御部１１は、上記V/UV判定部１
１５からのidVUV判定結果と上記ファジイ推論部９から
のdecflagを基に背景雑音カウンタbgnCnt、背景雑音周
期カウンタbgnIntvlをセットする。

【００７９】パラメータ生成部１２は、カウンタ制御部
１１からのbgnIntvlと上記idVUV判定結果よりidVUVパラ
メータと、更新フラグFlagを決定し、出力端子１０６か
ら伝送する。

【００８０】この伝送パラメータを決めるフローチャー
トを図１０及び図１１に分けて示す。背景雑音カウンタ
bgnCnt、背景雑音周期カウンタbgnIntvl（いずれも初期
値０）を定義する。先ず、図１０のステップＳ２１で入
力信号の分析結果が無声音(idVUV=0)の場合、ステップ
Ｓ２２及びステップＳ２４を通してdecFlag=0ならステ
ップＳ２５に進んで背景雑音カウンタbgnCntを１歩進
し、decFlag=2ならbgnCntを保持する。ステップＳ２６
でbgnCntが定数BGN_CNT（例えば6)より大きいときステ
ップＳ２７に進み、idVUVが背景雑音を示す値１にセッ
トされる。また、ステップＳ２８でdecFlag=0のときに
はbgnIntvlをステップＳ２９で１歩進させ、ここでステ
ップＳ３１でbgnIntvlが定数BGN_INTVL（例えば１６）
に等しいときステップＳ３２に進んでbgnIntvl=0にセッ
トされる。また、ステップＳ２８でdecFlag=2のとき、
ステップＳ３０に進み、bgnIntvl=0にセットされる。

【００８１】ところで、ステップＳ２１で有声音(idVUV
=2,3)の場合、或いはステップＳ２２でdecFlag=1の場
合、ステップＳ２３に進み、bgnCnt=0，bgnIntvl=0にセ
ットされる。

【００８２】図１１に移り、ステップＳ３３で無声音或
いは背景雑音(idVUV=0,1)の場合、もしステップＳ３５
で無声音(idVUV=0)なら、ステップＳ３６で無声音パラ
メータが出力される。

【００８３】ステップＳ３５で背景雑音(idVUV=1)で、
かつステップＳ３７でbgnIntvl=0なら、ステップＳ３８
から背景雑音パラメータ(BGN=Back Ground Noise)が出
力される。一方、ステップＳ３７でbgnIntvl＞0ならば
ステップＳ３９に進みヘッダビッドのみが送信される。

【００８４】ヘッダビットの構成を図１６に示す。ここ
で、上位２ビットはidVUVビットそのものがセットされ
るが、背景雑音期間(idVUV=1)の場合もし更新フレーム
でないなら次の１ビットに0、更新フレームであるなら
次の１ビットに1をセットする。

【００８５】MPEG4にて採用されている音声コーデックH
VXC(Harmonic Vector Excitation Coding)を例にとり、
各条件での符号化ビットの内訳を図１２に示す。

【００８６】idVUVは有声音、無声音、背景雑音更新
時、背景雑音非更新時にそれぞれ２ビット符号化され
る。更新フラグには背景雑音更新時、背景雑音非更新時
にそれぞれ１ビットが割り当てられる。

【００８７】ＬＳＰパラメータは、LSP０,LSP２,LSP３,
LSP４，LSP５に分けられる。LSP０は１０次のＬＳＰパ
ラメータのコードブックインデクスであり、エンベロー
プの基本的なパラメータとして使われ、２０msecのフレ
ームでは５ビットが割り当てられる。LSP２は５次の低
周波数域誤差補正のＬＳＰパラメータのコードブックイ
ンデクスであり、７ビットが割り当てられる。LSP３は
５次の高周波数域誤差補正のＬＳＰパラメータのコード
ブックインデクスであり、５ビットが割り当てられる。
LSP５は１０次の全帯域誤差補正のＬＳＰパラメータの
コードブックインデクスであり、８ビットが割り当てら
れる。このうち、LSP２，LSP３及びLSP５は前の段階で
の誤差を埋めてやるために使われるインデクスであり、
特に、LSP２とLSP３はLSP０でエンベロープを表現しき
れなかったときに補助的に用いられる。LSP４は符号化
時の符号化モードが直接モード（straight mode）であ
るか、差分モード（differential mode）であるかの１
ビットの選択フラグである。元々の波形から分析して求
めたオリジナルのＬＳＰパラメータに対する、量子化に
より求めた直接モードのＬＳＰと、量子化された差分に
より求めたＬＳＰの差の少ない方のモードの選択を示
す。LSP４が０であるときには直接モードであり、LSP４
が１であるときには差分モードである。

【００８８】有声音時には全てのＬＳＰパラメータを符
号化ビットとする。無声音及び背景雑音更新時はＬＳＰ
５を除いた符号化ビットとする。背景雑音非更新時はＬ
ＳＰ符号化ビットを送らない。特に、背景雑音更新時の
ＬＳＰ符号化ビットは直近３フレームのＬＳＰパラメー
タの平均をとったものを量子化して得られた符号化ビッ
トとする。

【００８９】ピッチPCHパラメータは有声音時ときのみ
７ビットの符号化ビットとされる。スペクトルエンベロ
ープのコードブックパラメータidSは、idS０で記される
第０LPC残差スペクトルコードブックインデクスとidS１
で記される第１LPC残差スペクトルコードブックインデ
スクに分けられる。有声音時に共に４ビットの符号化ビ
ットとされる。また、雑音コードブックインデクスidSL
００やidSL０１は、無声音時に６ビット符号化される。

【００９０】また、LPC残差スペクトルゲインコードブ
ックインデスクidGは有声音時に、５ビットの符号化ビ
ットとされる。また、雑音コードブックゲインインデク
スidGL００やidGL１１には無声音時にそれぞれ４ビット
の符号化ビットが割り当てられる。背景雑音更新時には
idGL００に４ビットのみの符号化ビットが割り当てられ
る。この背景雑音更新時のidGL００４ビットについても
直近４フレーム（８サブフレーム）のCelpゲインの平均
をとったものを量子化して得られた符号化ビットとす
る。

【００９１】また、idS０_4kで記される第０拡張LPC残
差スペクトルコードブックインデクスと、idS１_4kで記
される第１拡張LPC残差スペクトルコードブックインデ
クスと、idS２_4kで記される第２拡張LPC残差スペクト
ルコードブックインデクスと、idS３_4kで記される第３
拡張LPC残差スペクトルコードブックインデクスには、
有声音時に、７ビット、１０ビット、９ビット、６ビッ
トが符号化ビットとして割り当てられる。

【００９２】これにより、有声音時は８０ビット、無声
音時は４０ビット、背景雑音更新時は２５ビット、背景
雑音非更新時は３ビットがトータルビットとして割り当
てられる。

【００９３】ここで、上記図１２に示した符号化ビット
を生成する音声符号化器について上記図２を用いて詳細
に説明する。

【００９４】入力端子１０１に供給された音声信号は、
ハイパスフィルタ（ＨＰＦ）１０９にて不要な帯域の信
号を除去するフィルタ処理が施された後、上述したよう
に入力信号判定部２１ａに送られると共に、ＬＰＣ（線
形予測符号化）分析・量子化部１１３のＬＰＣ分析回路
１３２と、ＬＰＣ逆フィルタ回路１１１とに送られる。

【００９５】ＬＰＣ分析・量子化部１１３のＬＰＣ分析
回路１３２は、上述したように入力音声信号波形の２５
６サンプル程度の長さを１ブロックとしてハミング窓を
かけて、自己相関法により線形予測係数、いわゆるαパ
ラメータを求める。データ出力の単位となるフレーミン
グの間隔は、１６０サンプル程度とする。サンプリング
周波数ｆｓが例えば８ｋHzのとき、１フレーム間隔は１
６０サンプルで２０ｍsec となる。

【００９６】ＬＰＣ分析回路１３２からのαパラメータ
は、α→ＬＳＰ変換回路１３３に送られて、線スペクト
ル対（ＬＳＰ）パラメータに変換される。これは、直接
型のフィルタ係数として求まったαパラメータを、例え
ば１０個、すなわち５対のＬＳＰパラメータに変換す
る。変換は例えばニュートン−ラプソン法等を用いて行
う。このＬＳＰパラメータに変換するのは、αパラメー
タよりも補間特性に優れているからである。

【００９７】α→ＬＳＰ変換回路１３３からのＬＳＰパ
ラメータは、ＬＳＰ量子化器１３４によりマトリクスあ
るいはベクトル量子化される。このとき、フレーム間差
分をとってからベクトル量子化してもよく、複数フレー
ム分をまとめてマトリクス量子化してもよい。ここで
は、２０ｍsec を１フレームとし、２０ｍsec 毎に算出
されるＬＳＰパラメータを２フレーム分まとめて、マト
リクス量子化及びベクトル量子化している。

【００９８】このＬＳＰ量子化器１３４からの量子化出
力、すなわちＬＳＰ量子化のインデクスは、端子１０２
を介して取り出され、また量子化済みのＬＳＰベクトル
は、ＬＳＰ補間回路１３６に送られる。

【００９９】ＬＳＰ補間回路１３６は、上記２０ｍsec
あるいは４０ｍsec 毎に量子化されたＬＳＰのベクトル
を補間し、８倍のレートにする。すなわち、２．５ｍse
c 毎にＬＳＰベクトルが更新されるようにする。これ
は、残差波形をハーモニック符号化復号化方法により分
析合成すると、その合成波形のエンベロープは非常にな
だらかでスムーズな波形になるため、ＬＰＣ係数が２０
ｍsec 毎に急激に変化すると異音を発生することがある
からである。すなわち、２．５ｍsec 毎にＬＰＣ係数が
徐々に変化してゆくようにすれば、このような異音の発
生を防ぐことができる。

【０１００】このような補間が行われた２．５ｍsec 毎
のＬＳＰベクトルを用いて入力音声の逆フィルタリング
を実行するために、ＬＳＰ→α変換回路１３７により、
ＬＳＰパラメータを例えば１０次程度の直接型フィルタ
の係数であるαパラメータに変換する。このＬＳＰ→α
変換回路１３７からの出力は、上記ＬＰＣ逆フィルタ回
路１１１に送られ、このＬＰＣ逆フィルタ１１１では、
２．５ｍsec 毎に更新されるαパラメータにより逆フィ
ルタリング処理を行って、滑らかな出力を得るようにし
ている。このＬＰＣ逆フィルタ１１１からの出力は、サ
イン波分析符号化部１１４、具体的には例えばハーモニ
ック符号化回路、の直交変換回路１４５、例えばＤＦＴ
（離散フーリエ変換）回路に送られる。

【０１０１】ＬＰＣ分析・量子化部１１３のＬＰＣ分析
回路１３２からのαパラメータは、聴覚重み付けフィル
タ算出回路１３９に送られて聴覚重み付けのためのデー
タが求められ、この重み付けデータが後述する聴覚重み
付きのベクトル量子化器１１６と、第２の符号化部１２
０の聴覚重み付けフィルタ１２５及び聴覚重み付きの合
成フィルタ１２２とに送られる。

【０１０２】ハーモニック符号化回路等のサイン波分析
符号化部１１４では、ＬＰＣ逆フィルタ１１１からの出
力を、ハーモニック符号化の方法で分析する。すなわ
ち、ピッチ検出、各ハーモニクスの振幅Ａｍの算出、有
声音（Ｖ）／無声音（ＵＶ）の判別を行い、ピッチによ
って変化するハーモニクスのエンベロープあるいは振幅
Ａｍの個数を次元変換して一定数にしている。

【０１０３】図２に示すサイン波分析符号化部１１４の
具体例においては、一般のハーモニック符号化を想定し
ているが、特に、ＭＢＥ（Multiband Excitation: マル
チバンド励起）符号化の場合には、同時刻（同じブロッ
クあるいはフレーム内）の周波数軸領域いわゆるバンド
毎に有声音（Voiced）部分と無声音（Unvoiced）部分と
が存在するという仮定でモデル化することになる。それ
以外のハーモニック符号化では、１ブロックあるいはフ
レーム内の音声が有声音か無声音かの択一的な判定がな
されることになる。なお、以下の説明中のフレーム毎の
Ｖ／ＵＶとは、ＭＢＥ符号化に適用した場合には全バン
ドがＵＶのときを当該フレームのＵＶとしている。ここ
で上記ＭＢＥの分析合成手法については、本件出願人が
先に提案した特願平４−９１４２２号明細書及び図面に
詳細な具体例を開示している。

【０１０４】図２のサイン波分析符号化部１１４のオー
プンループピッチサーチ部１４１には、上記入力端子１
０１からの入力音声信号が、またゼロクロスカウンタ１
４２には、上記ＨＰＦ（ハイパスフィルタ）１０９から
の信号がそれぞれ供給されている。サイン波分析符号化
部１１４の直交変換回路１４５には、ＬＰＣ逆フィルタ
１１１からのＬＰＣ残差あるいは線形予測残差が供給さ
れている。オープンループピッチサーチ部１４１では、
入力信号のＬＰＣ残差をとってオープンループによる比
較的ラフなピッチのサーチが行われ、抽出された粗ピッ
チデータは高精度ピッチサーチ１４６に送られて、後述
するようなクローズドループによる高精度のピッチサー
チ（ピッチのファインサーチ）が行われる。また、オー
プンループピッチサーチ部１４１からは、上記粗ピッチ
データと共にＬＰＣ残差の自己相関の最大値をパワーで
正規化した正規化自己相関最大値ｒ(p) が取り出され、
Ｖ／ＵＶ（有声音／無声音）判定部１１５に送られてい
る。

【０１０５】直交変換回路１４５では例えばＤＦＴ（離
散フーリエ変換）等の直交変換処理が施されて、時間軸
上のＬＰＣ残差が周波数軸上のスペクトル振幅データに
変換される。この直交変換回路１４５からの出力は、高
精度ピッチサーチ部１４６及びスペクトル振幅あるいは
エンベロープを評価するためのスペクトル評価部１４８
に送られる。

【０１０６】高精度（ファイン）ピッチサーチ部１４６
には、オープンループピッチサーチ部１４１で抽出され
た比較的ラフな粗ピッチデータと、直交変換部１４５に
より例えばＤＦＴされた周波数軸上のデータとが供給さ
れている。この高精度ピッチサーチ部１４６では、上記
粗ピッチデータ値を中心に、0.２〜0.５きざみで±数サ
ンプルずつ振って、最適な小数点付き（フローティン
グ）のファインピッチデータの値へ追い込む。このとき
のファインサーチの手法として、いわゆる合成による分
析 (Analysis by Synthesis)法を用い、合成されたパワ
ースペクトルが原音のパワースペクトルに最も近くなる
ようにピッチを選んでいる。このようなクローズドルー
プによる高精度のピッチサーチ部１４６からのピッチデ
ータについては、スイッチ１１８を介して出力端子１０
４に送っている。

【０１０７】スペクトル評価部１４８では、ＬＰＣ残差
の直交変換出力としてのスペクトル振幅及びピッチに基
づいて各ハーモニクスの大きさ及びその集合であるスペ
クトルエンベロープが評価され、高精度ピッチサーチ部
１４６、Ｖ／ＵＶ（有声音／無声音）判定部１１５及び
聴覚重み付きのベクトル量子化器１１６に送られる。

【０１０８】Ｖ／ＵＶ（有声音／無声音）判定部１１５
は、直交変換回路１４５からの出力と、高精度ピッチサ
ーチ部１４６からの最適ピッチと、スペクトル評価部１
４８からのスペクトル振幅データと、オープンループピ
ッチサーチ部１４１からの正規化自己相関最大値ｒ(p)
と、ゼロクロスカウンタ１４２からのゼロクロスカウン
ト値とに基づいて、当該フレームのＶ／ＵＶ判定が行わ
れる。さらに、ＭＢＥの場合の各バンド毎のＶ／ＵＶ判
定結果の境界位置も当該フレームのＶ／ＵＶ判定の一条
件としてもよい。このＶ／ＵＶ判定部１１５からの判定
出力は、出力端子１０５を介して取り出される。

【０１０９】ところで、スペクトル評価部１４８の出力
部あるいはベクトル量子化器１１６の入力部には、デー
タ数変換（一種のサンプリングレート変換）部が設けら
れている。このデータ数変換部は、上記ピッチに応じて
周波数軸上での分割帯域数が異なり、データ数が異なる
ことを考慮して、エンベロープの振幅データ｜Ａ_m｜を
一定の個数にするためのものである。すなわち、例えば
有効帯域を３４００ｋHzまでとすると、この有効帯域が
上記ピッチに応じて、８バンド〜６３バンドに分割され
ることになり、これらの各バンド毎に得られる上記振幅
データ｜Ａ_m｜の個数ｍ_MX＋１も８〜６３と変化するこ
とになる。このためデータ数変換部１１９では、この可
変個数ｍ_MX＋１の振幅データを一定個数Ｍ個、例えば４
４個、のデータに変換している。

【０１１０】このスペクトル評価部１４８の出力部ある
いはベクトル量子化器１１６の入力部に設けられたデー
タ数変換部からの上記一定個数Ｍ個（例えば４４個）の
振幅データあるいはエンベロープデータが、ベクトル量
子化器１１６により、所定個数、例えば４４個のデータ
毎にまとめられてベクトルとされ、重み付きベクトル量
子化が施される。この重みは、聴覚重み付けフィルタ算
出回路１３９からの出力により与えられる。ベクトル量
子化器１１６からの上記エンベロープのインデクスidS
は、スイッチ１１７を介して出力端子１０３より取り出
される。なお、上記重み付きベクトル量子化に先だっ
て、所定個数のデータから成るベクトルについて適当な
リーク係数を用いたフレーム間差分をとっておくように
してもよい。

【０１１１】次に、いわゆるＣＥＬＰ（符号励起線形予
測）符号化構成を有している符号化部について説明す
る。この符号化部は入力音声信号の無声音部分の符号化
のために用いられている。この無声音部分用のＣＥＬＰ
符号化構成において、雑音コードブック、いわゆるスト
キャスティック・コードブック（stochastic code boo
k）１２１からの代表値出力である無声音のＬＰＣ残差
に相当するノイズ出力を、ゲイン回路１２６を介して、
聴覚重み付きの合成フィルタ１２２に送っている。重み
付きの合成フィルタ１２２では、入力されたノイズをＬ
ＰＣ合成処理し、得られた重み付き無声音の信号を減算
器１２３に送っている。減算器１２３には、上記入力端
子１０１からＨＰＦ（ハイパスフィルタ）１０９を介し
て供給された音声信号を聴覚重み付けフィルタ１２５で
聴覚重み付けした信号が入力されており、合成フィルタ
１２２からの信号との差分あるいは誤差を取り出してい
る。なお、聴覚重み付けフィルタ１２５の出力から聴覚
重み付き合成フィルタの零入力応答を事前に差し引いて
おくものとする。この誤差を距離計算回路１２４に送っ
て距離計算を行い、誤差が最小となるような代表値ベク
トルを雑音コードブック１２１でサーチする。このよう
な合成による分析（Analysis by Synthesis ）法を用い
たクローズドループサーチを用いた時間軸波形のベクト
ル量子化を行っている。

【０１１２】このＣＥＬＰ符号化構成を用いた符号化部
からのＵＶ（無声音）部分用のデータとしては、雑音コ
ードブック１２１からのコードブックのシェイプインデ
クスidSlと、ゲイン回路１２６からのコードブックのゲ
インインデクスidGlとが取り出される。雑音コードブッ
ク１２１からのＵＶデータであるシェイプインデクスid
Slは、スイッチ１２７ｓを介して出力端子１０７ｓに送
られ、ゲイン回路１２６のＵＶデータであるゲインイン
デクスidGlは、スイッチ１２７ｇを介して出力端子１０
７ｇに送られている。

【０１１３】ここで、これらのスイッチ１２７ｓ、１２
７ｇ及び上記スイッチ１１７、１１８は、上記Ｖ／ＵＶ
判定部１１５からのＶ／ＵＶ判定結果によりオン／オフ
制御され、スイッチ１１７、１１８は、現在伝送しよう
とするフレームの音声信号のＶ／ＵＶ判定結果が有声音
（Ｖ）のときオンとなり、スイッチ１２７ｓ、１２７ｇ
は、現在伝送しようとするフレームの音声信号が無声音
（ＵＶ）のときオンとなる。

【０１１４】以上のように構成される音声符号化器によ
り、可変レートで符号化された各パラメータ、すなわ
ち、ＬＳＰパラメータLSP、有声音／無声音判定パラメ
ータidVUV、ピッチパラメータPCH、スペクトルエンベロ
ープのコードブックパラメータidS及びゲインインデク
スidG、雑音コードブックパラメータidSl及びゲインイ
ンデクスidGlは、上記図１に示す伝送路符号化器２２に
より伝送路の品質が音声品質に影響を受けにくいように
符号化された後、変調器２３で変調され、送信機２４で
送信処理が施され、アンテナ共用器２５を通して、アン
テナ２６から送信される。また、上記パラメータは、上
述したようにパラメータ制御部２１ｂのパラメータ生成
部１２にも供給される。そして、パラメータ生成部１２
は、V/UV判定部１１５からの判定結果idVUVと、上記パ
ラメータと、カウンタ制御部１１からのbgnIntvlを用い
てidVUV、更新フラグを生成する。また、パラメータ制
御部２１ｂは、もしV/UV判定部１１５から背景雑音であ
るというidVUV=１が送られてきたときには、ＬＳＰ量子
化部１３４にLSP量子化の方法である差分モード（ＬＳ
Ｐ４＝１）を禁止し、直接モード（ＬＳＰ４＝０）で量
子化を行うように制御する。

【０１１５】次に、上記図１に示した携帯電話装置の受
信側の音声復号化装置３１について詳細に説明する。音
声復号化装置３１には、アンテナ２６で捉えられ、アン
テナ共用器２５を通じて受信機２７で受信され、復調器
２９で復調され、伝送路復号化器３０で伝送路誤りが訂
正された受信ビットが入力される。

【０１１６】この音声復号化装置３１の詳細な構成を図
１３に示す。この音声復号化装置は、入力端子２００か
ら入力された受信ビットからヘッダビットを取り出し、
図１６に従ってidVUVと更新フラグを分離すると共に、
符号ビット（code bits）を出力するヘッダビット解釈
部２０１と、上記idVUVと更新フラグより後述するスイ
ッチ２４３及びスイッチ２４８の切り換えを制御する切
り換え制御部２４１と、後述するシーケンスでＬＰＣパ
ラメータ、もしくはＬＳＰパラメータを決定するＬＰＣ
パラメータ再生制御部２４０と、上記符号ビット中のＬ
ＳＰインデクスよりＬＰＣパラメータを再生するＬＰＣ
パラメータ再生部２１３と、上記符号ビットを個々のパ
ラメータインデクスに分解する符号ビット解釈部２０９
と、切り換え制御部２４１により切り換えが制御され、
背景雑音更新フレームを受信したとき閉じられ、それ以
外は開くスイッチ２４８と、切り換え制御部２４１によ
り切り換えが制御され、会計雑音更新フレームを受信し
た場合、ＲＡＭ２４４方向に閉じられ、それ以外はヘッ
ダビット解釈部２０１方向に閉じられるスイッチ２４３
と、ＵＶシェイプインデクスを乱数により発生する乱数
発生器２０８と、無声音を合成する無声音合成部２２０
と、エンベロープインデクスよりエンベロープを逆ベク
トル量子化する逆ベクトル量子化部２１２と、idVUV、
ピッチ、エンベロープより有声音を合成する有声音合成
部２１１と、ＬＰＣ合成フィルタ２１４と、背景雑音更
新フレーム受信時に符号ビットを保持し、背景雑音非更
新フレーム受信時に符号ビットを供給するＲＡＭ２４４
とを備える。

【０１１７】先ず、ヘッダビット解釈部２０１は、入力
端子２００を介して供給された受信ビットからヘッドビ
ットを取り出し、idVUVと更新フラグFlagを分離して当
フレームのビット数を認識する。また、後続のビットの
存在する場合、符号ビットとして出力する。もし図１６
に示したヘッダビット構成の上位２ビットが00なら無声
音(Unvoiced speech)と分かるので次の３８ビットを読
み取る。また、上位２ビットが01なら背景雑音(BGN)と
分かるので次の１ビットが0なら背景雑音の非更新フレ
ームであるのでそこで終わり、もち次の１ビットが１な
ら背景雑音の更新フレームを読み取るため次の２２ビッ
トを読み取る。もし、上位２ビットが10/11なら有声音
と分かるので次の７８ビットを読み取る。

【０１１８】切り換え制御部２４１では、idVUVと更新
フラグを見て、もしidVUV=1のとき、更新フラグFlag=1
ならば更新なのでスイッチ２４８を閉じ、符号ビットを
ＲＡＭ２４４に供給し、同時にスイッチ２４３をヘッダ
ビット解釈部２０１側に閉じ符号ビットを符号ビット解
釈部２０９に供給し、逆に更新フラグFlag=0ならば非更
新なのでスイッチ２４８を開き、さらにスイッチ２４３
をＲＡＭ２４４側に閉じて更新時の符号ビットを供給す
る。idVUV≠0の場合、スイッチ２４８は開き、スイッチ
２４３が上方に閉じる。

【０１１９】符号ビット解釈部２０９は、ヘッダビット
解釈部２０１からスイッチ２４３を介して入力された符
号ビットを個々のパラメータインデクス、すなわちＬＳ
Ｐインデクス、ピッチ、エンベロープインデクス、ＵＶ
ゲインインデクス、ＵＶシェイプインデクスに分解す
る。

【０１２０】乱数発生器２０８は、ＵＶシェイプインデ
クスを乱数により発生するが、スイッチ２４９がidVUV=
1である背景雑音フレームを受信したとき、切り換え制
御部２４１より閉じられ、無声音合成部２２０に供給す
る。idVUV≠1なら符号ビット解釈部２０９よりスイッチ
２４９を通じて無声音合成部２２０にＵＶシェイプイン
デクスを供給する。

【０１２１】ＬＰＣパラメータ再生制御部２４０は、内
部に図示しない切り換え制御部と、インデクス判定部と
を備え、切り換え制御部にてidVUVを検出し、その検出
結果に基づいてＬＰＣパラメータ再生部２１３の動作を
制御する。詳細については後述する。

【０１２２】ＬＰＣパラメータ再生部２１３、無声音合
成部２２０、逆ベクトル量子化部２１２、有声音合成部
２１１及びＬＰＣ合成フィルタ２１４は、音声復号化器
３１の基本的な部分である。図１４に、この基本的な部
分とその周辺の構成を示す。

【０１２３】入力端子２０２には、上記ＬＳＰのベクト
ル量子化出力、いわゆるコードブックのインデクスが供
給されている。

【０１２４】このＬＳＰのインデクスは、ＬＰＣパラメ
ータ再生部２１３に送られる。ＬＰＣパラメータ再生部
２１３は、上述したように符号ビットの内のＬＳＰイン
デクスよりＬＰＣパラメータを再生するが、ＬＰＣパラ
メータ再生制御部２４０の内部の図示しない上記切り換
え制御部によって制御される。

【０１２５】先ず、ＬＰＣパラメータ再生部２１３につ
いて説明する。ＬＰＣパラメータ再生部２１３は、ＬＳ
Ｐの逆量子化器２３１と、切り換えスイッチ２５１と、
ＬＳＰ補間回路２３２（Ｖ用）及び２３３（ＵＶ用）
と、ＬＳＰ→α変換回路２３４（Ｖ用）及び２３５（Ｕ
Ｖ用）と、スイッチ２５２と、ＲＡＭ２５３と、フレー
ム補間回路２４５と、ＬＳＰ補間回路２４６（ＢＧＮ
用）と、ＬＳＰ→α変換回路２４７（ＢＧＮ用）とを備
えてなる。

【０１２６】ＬＳＰの逆量子化器２３１ではＬＳＰイン
デクスよりＬＳＰパラメータを逆量子化する。このＬＳ
Ｐの逆量子化器２３１における、ＬＳＰパラメータの生
成について説明する。ここでは、背景雑音カウンタbgnI
ntvl（初期値0）を導入する。有声音(idVUV=2,3)あるい
は無声音(idVUV=０)の場合、通常の復号処理でＬＳＰパ
ラメータを生成する。

【０１２７】背景雑音(idVUV=1)の場合もしそれが更新
フレームの場合bgnIntvl=0とし、そうでないならbgnInt
vlを１歩進させる。ただし、bgnIntvlを１歩進させるこ
とで後述する定数BGN_INTVL_RXと等しくなる場合は、bg
nIntvlを１歩進させない。

【０１２８】そして、次の（２０）式のようにＬＳＰパ
ラメータを生成する。ここで更新フレームの直前に受信
されたＬＳＰパラメータをqLSP(prev)(1, ,10)、更新
フレームで受信されたLSPパラメータをqLSP(curr)(1,
,10)、補間により生成するＬＳＰパラメータをqLSP(1,
,10)とし、次の（２０）式により求める。

【０１２９】

【数２０】

【０１３０】ここで、BGN_INTVL_RXは定数、bgnIntvl'
はbgnIntvlと乱数rnd(=-3, 3)を用いて次の（２１）
式により生成するが、もしbgnIntvl’＜0のときbgnIntv
l’=bgnIntvl、bgnIntvl'≧BGN_INTVL_RXのとき、bgnIn
tvl’=bgnIntvlとする。

【０１３１】

【数２１】

【０１３２】また、ＬＰＣパラメータ再生制御部２４０
中の図示しない切り換え制御部はＶ／ＵＶパラメータdV
UV、更新フラグFlagを元にＬＰＣパラメータ再生部２１
３内部のスイッチ２５１及び２５２を制御する。

【０１３３】スイッチ２５１は、idVUV=0,2,3のとき上
方端子に、idVUV=1のとき下方端子に切り換わる。スイ
ッチ２５２は更新フラグFlag=1、つまり背景雑音更新フ
レームの時、閉じられてＬＳＰパラメータがＲＡＭ２５
３に供給され、qLSP(prev)がqLSP(curr)により更新され
た後、qLSP(curr)を更新する。ＲＡＭ２５３は、qLSP(p
rev)、qLSP(curr)を保持する。

【０１３４】フレーム補間回路２４５は、qLSP(curr)、
qLSP(prev)より内部カウンタbgnIntvlを用いてqLSPを生
成する。ＬＳＰ補間回路２４６は、ＬＳＰを補間する。
ＬＳＰ→α変換回路２４７はBGN用ＬＳＰをαに変換す
る。

【０１３５】次に、ＬＰＣパラメータ再生制御部２４０
によるＬＰＣパラメータ再生部２１３の制御の詳細につ
いて図１５のフローチャートを用いて説明する。

【０１３６】先ず、ＬＰＣパラメータ再生制御部２４０
の切り換え制御部においてステップＳ４１でＶ／ＵＶ判
定パラメータidVUVを検出し、0ならステップＳ４２に進
み、ＬＳＰ補間回路２３３でＬＳＰ補間し、さらにステ
ップＳ４３に進んでＬＳＰ→α変換回路２３５でＬＳＰ
をαに変換する。

【０１３７】ステップＳ４１でidVUV=1であり、かつス
テップＳ４４で更新フラグFlag=1ならば、更新フレーム
であるので、ステップＳ４５においてフレーム補間回路
２４５でbgnIntvl=0とする。

【０１３８】ステップＳ４４で更新フラグFlag=0であ
り、かつステップＳ４６でbgnIntvl＜BGN_INTVL_RX_１
であるなら、ステップＳ４７に進み、bgnIntvlを１歩進
させる。

【０１３９】次に、ステップＳ４８でフレーム補間回路
２４５によりbgnIntvl’を乱数rndを発生させて求め
る。ただし、ステップＳ４９でbgnIntvl’＜0かbgnIntv
l'≧BGN_INTVL_RXのとき、ステップＳ５０でbgnIntvl’
=bgnIntvlとする。

【０１４０】次に、ステップＳ５１でフレーム補間回路
２４５によりＬＳＰをフレーム補間し、ステップＳ５２
でＬＳＰ補間回路２４６によりＬＳＰ補間し、ステップ
Ｓ５３でＬＳＰ→α変換回路２４７によりＬＳＰをαに
変換する。

【０１４１】なお、ステップＳ４１でidVUV=2,3である
なら、ステップＳ５４に進み、ＬＳＰ補間回路２３２で
ＬＳＰ補間し、ステップＳ５５でＬＳＰ→α変換回路２
３４によりＬＳＰをαに変換する。

【０１４２】またＬＰＣ合成フィルタ２１４は、有声音
部分のＬＰＣ合成フィルタ２３６と、無声音部分のＬＰ
Ｃ合成フィルタ２３７とを分離している。すなわち、有
声音部分と無声音部分とでＬＰＣの係数補間を独立に行
うようにして、有声音から無声音への遷移部や、無声音
から有声音への遷移部で、全く性質の異なるＬＳＰ同士
を補間することによる悪影響を防止している。

【０１４３】また、入力端子２０３には、上記スペクト
ルエンベロープ（Ａｍ）の重み付けベクトル量子化され
たコードインデクスデータが供給され、入力端子２０４
には、上記ピッチパラメータPCHのデータが供給され、
入力端子２０５には、上記Ｖ／ＵＶ判定データidUVUが
供給されている。

【０１４４】入力端子２０３からのスペクトルエンベロ
ープＡｍのベクトル量子化されたインデクスデータは、
逆ベクトル量子化器２１２に送られて逆ベクトル量子化
が施され、上記データ数変換に対応する逆変換が施され
て、スペクトルエンベロープのデータとなって、有声音
合成部２１１のサイン波合成回路２１５に送られてい
る。

【０１４５】なお、エンコード時にスペクトルのベクト
ル量子化に先だってフレーム間差分をとっている場合に
は、ここでの逆ベクトル量子化後にフレーム間差分の復
号を行ってからデータ数変換を行い、スペクトルエンベ
ロープのデータを得る。

【０１４６】サイン波合成回路２１５には、入力端子２
０４からのピッチ及び入力端子２０５からの上記Ｖ／Ｕ
Ｖ判定データidVUVが供給されている。サイン波合成回
路２１５からは、上記図２に示したＬＰＣ逆フィルタ１
１１からの出力に相当するＬＰＣ残差データが取り出さ
れ、これが加算器２１８に送られている。このサイン波
合成の具体的な手法については、例えば本件出願人が先
に提案した、特願平４−９１４２２号の明細書及び図
面、あるいは特願平６−１９８４５１号の明細書及び図
面に開示されている。

【０１４７】また、逆ベクトル量子化器２１２からのエ
ンベロープのデータと、入力端子２０４、２０５からの
ピッチ、Ｖ／ＵＶ判定データidVUVとは、有声音（Ｖ）
部分のノイズ加算のためのノイズ合成回路２１６に送ら
れている。このノイズ合成回路２１６からの出力は、重
み付き重畳加算回路２１７を介して加算器２１８に送っ
ている。これは、サイン波合成によって有声音のＬＰＣ
合成フィルタへの入力となるエクサイテイション（Exci
tation：励起、励振）を作ると、男声等の低いピッチの
音で鼻づまり感がある点、及びＶ（有声音）とＵＶ（無
声音）とで音質が急激に変化し不自然に感じる場合があ
る点を考慮し、有声音部分のＬＰＣ合成フィルタ入力す
なわちエクサイテイションについて、音声符号化データ
に基づくパラメータ、例えばピッチ、スペクトルエンベ
ロープ振幅、フレーム内の最大振幅、残差信号のレベル
等を考慮したノイズをＬＰＣ残差信号の有声音部分に加
えているものである。

【０１４８】加算器２１８からの加算出力は、ＬＰＣ合
成フィルタ２１４の有声音用の合成フィルタ２３６に送
られてＬＰＣの合成処理が施されることにより時間波形
データとなり、さらに有声音用ポストフィルタ２３８ｖ
でフィルタ処理された後、加算器２３９に送られる。

【０１４９】次に、図１４の入力端子２０７ｓ及び２０
７ｇには、符号ビット解釈部２０９で符号ビットから分
解された、ＵＶデータとしてのシェイプインデクス及び
ゲインインデクスがそれぞれ供給される。ゲインインデ
クスは、無声音合成部２２０に送られている。端子２０
７ｓからのシェイプインデクスは、切り換えスイッチ２
４９の被選択端子に送られている。この切り換えスイッ
チ２４９のもう一つの被選択端子には乱数発生器２０８
からの出力が供給される。そして、背景雑音フレームを
受信したときには上記図１３に示した切り換え制御部２
４１の制御により、スイッチ２４９が乱数発生器２０８
側に閉じられ、無声音合成部２２０には乱数発生器２０
８からのシェイプインデクスが供給される。また、idVU
V≠1なら符号ビット解釈部２０９よりスイッチ２４９を
通してシェイプインデクスが供給される。

【０１５０】すなわち、励起信号の生成については、有
声音(idVUV=2,3)或いは無声音(idVUV=0)の場合には通常
の復号処理により励起信号を生成するが、背景雑音(idV
UV=1)の場合にはCelpのシェイプインデクスidSL00，idS
L01を乱数rnd(=0, ，N_SHAPE_L0_１)を発生させて生
成する。ここで、N_SHAPE_L0_１は、Celp シェイプコー
ドベクタの数である。さらに、Celpゲインインデクスid
GL00，idGL01は更新フレーム中のidGL00を両サブフレー
ムに適用する。

【０１５１】以上、本発明の符号化装置及び方法の具体
例となる符号化装置と、復号装置及び方法の具体例とな
る復号装置を備えた携帯電話装置について説明してきた
が、本発明は携帯電話装置の符号化装置、復号装置にの
み適用が限定されるものではない。例えば、伝送システ
ムにも適用できる。

【０１５２】図１７は、本発明を適用した伝送システム
（システムとは、複数の装置が論理的に集合したものを
いい、各構成の装置が同一筐体中にあるか否かは問わな
い）の一実施の形態の構成例を示している。

【０１５３】この伝送システムでは、上記復号装置をク
ライアント端末６３が備え、上記符号化装置をサーバ６
１が備えている。クライアント端末６３とサーバ６１
は、例えば、インターネットや、ＩＳＤＮ（Integrated
Service Digital Network）、ＬＡＮ（Local Area Net
work）、ＰＳＴＮ（Public Switched Telephone Networ
k）などのネットワーク６２で接続されている。

【０１５４】クライアント端末６３からサーバ１に対し
て、ネットワーク６２を介して、例えば、曲などのオー
ディオ信号の要求があると、サーバ６１において、その
要求のあった曲に対応するオーディオ信号の符号化パラ
メータを、入力音声の性質に応じて符号化のモード分け
を行い、ネットワーク６２を介して、クライアント端末
６３に伝送する。クライアント端末６３では、上記復号
方法に応じてサーバー６１から伝送路誤りに対して保護
されてきた符号化パラメータを復号して例えばスピーカ
のような出力装置から音声として出力する。

【０１５５】図１８は、図１７のサーバ６１のハードウ
ェア構成例を示している。

【０１５６】ＲＯＭ（Read Only Memory）７１には、例
えば、ＩＰＬ（Initial Program Loading）プログラム
などが記憶されている。ＣＰＵ（Central Processing U
nit）７２は、例えば、ＲＯＭ７１に記憶されているＩ
ＰＬプログラムにしたがって、外部記憶装置７６に記憶
（記録）されたＯＳ（Operating System）のプログラム
を実行し、さらに、そのＯＳの制御の下、外部記憶装置
７６に記憶された所定のアプリケーションプログラムを
実行することで、入力信号の性質に応じた符号化モード
で符号化を行いビットレートを可変とし、クライアント
端末６３への送信処理などを行う。ＲＡＭ（Random Acc
ess Memory）７３は、ＣＰＵ７２の動作上必要なプログ
ラムやデータなどを記憶する。入力装置７４は、例え
ば、キーボードやマウス、マイク、外部インターフェー
スなどで構成され、必要なデータやコマンドを入力する
ときに操作される。さらに、入力装置７４は、外部か
ら、クライアント端末６３に対して提供するディジタル
オーディオ信号の入力を受け付けるインターフェースと
しても機能するようになされている。出力装置７５は、
例えば、ディスプレイや、スピーカ、プリンタなどで構
成され、必要な情報を表示、出力する。外部記憶装置７
６は、例えば、ハードディスクなどでなり、上述したＯ
Ｓや所定のアプリケーションプログラムなどを記憶して
いる。また、外部記憶装置７６は、その他、ＣＰＵ７２
の動作上必要なデータなども記憶する。通信装置７７
は、ネットワーク６２を介しての通信に必要な制御を行
う。

【０１５７】外部記憶装置７６に記憶されている所定の
アプリケーションプログラムとは、上記図１に示した、
音声符号化器３と、伝送路符号化器４と、変調器７の機
能をＣＰＵ７２に実行させるためのプログラムである。

【０１５８】また、図１９は、図１７のクライアント端
末６３のハードウェア構成例を示している。

【０１５９】クライアント端末６３は、ＲＯＭ８１乃至
通信装置８７で構成され、上述したＲＯＭ７１乃至通信
装置７７で構成されるサーバ６１と基本的に同様に構成
されている。

【０１６０】但し、外部記憶装置８６には、アプリケー
ションプログラムとして、サーバ６１からの符号化デー
タを復号するための、本発明に係る復号方法を実行する
ためのプログラムや、その他の後述するような処理を行
うためのプログラムなどが記憶されており、ＣＰＵ８２
では、これらのアプリケーションプログラムが実行され
ることで、伝送ビットレートが可変とされた符号化デー
タの復号、再生処理などが行われるようになされてい
る。

【０１６１】すなわち、外部記憶装置８６には、上記図
１に示した、復調器１３と、伝送路復号化器１４と、音
声復号化器１７の機能をＣＰＵ８２に実行させるための
アプリケーションプログラムが記憶されている。

【０１６２】このため、クライアント端末６３では、外
部記憶装置８６に記憶されている復号方法を、上記図１
に示したハードウェア構成を必要とせず、ソフトウェア
として実現することができる。

【０１６３】なお、クライアント端末６３では、外部記
憶装置８６にサーバ６１から伝送されてきた上記符号化
データを記憶しておいて所望の時間にその符号化データ
を読み出して上記復号方法を実行し所望の時間に音声を
出力装置８５から出力するようにしてもよい。また、上
記符号化データを外部記憶装置８６とは別の外部記憶装
置、例えば光磁気ディスクや他の記録媒体に記録してお
いてもよい。

【０１６４】また、上述の実施の形態においては、サー
バ６１の外部記憶装置７６としても、光記録媒体、光磁
気記録媒体、磁気記録媒体等の記録可能な媒体を使用し
て、この記録媒体に符号化された符号化データを記録し
ておいてもよい。

【０１６５】

【発明の効果】本発明によれば、音声コーデックにおい
て、音声区間中で重要な意味合いを持つ有声音に比較的
多い伝送ビット量を与え、以下無声音、背景雑音の順に
ビット数を減らすことにより総伝送ビット数を抑制で
き、平均伝送ビット量を少なくできる。

【図面の簡単な説明】

【図１】本発明の実施の形態となる携帯電話装置の構成
を示すブロック図である。

【図２】上記携帯電話装置を構成する音声符号化装置の
内部にあって、入力信号判定部とパラメータ制御部を除
いた詳細な構成図である。

【図３】入力信号判定部とパラメータ制御部の詳細な構
成図である。

【図４】rmsの定常レベルを演算する処理を示すフロー
チャートである。

【図５】ファジイ推論部でのファジイルールを説明する
ための図である。

【図６】上記ファジイルールでの信号レベルに関するメ
ンバシップ関数の特性図である。

【図７】上記ファジイルールでのスペクトルに関するメ
ンバシップ関数の特性図である。

【図８】上記ファジイルールでの推論結果のメンバシッ
プ関数の特性図である。

【図９】上記ファイジイ推論部での推論の具体例を示す
図である。

【図１０】パラメータ生成部における伝送パラメータを
決める処理の一部を示すフローチャートである。

【図１１】パラメータ生成部における伝送パラメータを
決める処理の残りの一部を示すフローチャートである。

【図１２】MPEG4にて採用されている音声コーデックHVX
C(Harmonic Vector Excitation Coding)を例にとり、各
条件での符号化ビットの内訳を示す図である。

【図１３】音声復号化装置の詳細な構成を示すブロック
図である。

【図１４】音声符号化装置の基本的な部分とその周辺の
構成を示すブロック図である。

【図１５】ＬＰＣパラメータ再生制御部によるＬＰＣパ
ラメータ再生部の制御の詳細を示すフローチャートであ
る。

【図１６】ヘッダビットの構成図である。

【図１７】本発明を適用できる伝送システムのブロック
図である。

【図１８】上記伝送システムを構成するサーバのブロッ
ク図である。

【図１９】上記伝送システムを構成するクライアント端
末のブロック図である。

【符号の説明】

２ｒｍｓ演算部、３定常レベル演算部、９ファジ
イ推論部、１１カウンタ制御部、１２パラメータ生
成部、２１ａ入力信号判定部、２１ｂパラメータ制
御部

Claims

【特許請求の範囲】

【請求項１】入力音声信号の無声音区間と有声音区間
で可変レートによる符号化を行う音声符号化装置におい
て、時間軸上での入力音声信号を所定の単位で区分し、この
単位で求めた信号レベルとスペクトル包絡の時間的な変
化に基づいて無声音区間を背景雑音区間と音声区間に分
けて判定する入力信号判定手段を備え、上記入力信号判定手段で判定された背景雑音区間のパラ
メータと、上記音声区間のパラメータと、有声音区間の
パラメータに対する符号化ビットの割り当てを異ならせ
ることを特徴とする音声符号化装置。
【請求項２】上記無声音区間のパラメータに対するビ
ットレートを上記有声音区間のパラメータに対するビッ
トレートより少なくすることを特徴とする請求項１記載
の音声符号化装置。
【請求項３】上記背景雑音区間のパラメータに対する
ビットレートを上記音声区間のパラメータに対するビッ
トレートより少なくすることを特徴とする請求項１記載
の音声符号化装置。
【請求項４】上記背景雑音区間において背景雑音パラ
メータの更新の有無を示す情報を、背景雑音区間の信号
レベル及びスペクトル包絡の時間的な変化に基づいて制
御して生成することを特徴とする請求項１記載の音声符
号化装置。
【請求項５】上記背景雑音区間の信号レベル及びスペ
クトル包絡の時間的な変化量が小さいときには、背景雑
音区間を示す情報及び背景雑音パラメータの非更新を示
す情報を送出し、その変化量が大きいときには背景雑音
区間を示す情報及と更新した背景雑音パラメータと背景
雑音パラメータが更新されたことを示す情報とを送出す
ることを特徴とする請求項１記載の音声符号化装置。
【請求項６】背景雑音区間における背景雑音を表現す
るパラメータの一定時間以上の連続を制限するため、少
なくともある一定時間の長さで背景雑音パラメータを更
新することを特徴とする請求項５記載の音声符号化装
置。
【請求項７】上記背景雑音パラメータはスペクトル包
絡を示すＬＰＣ係数、及びＣＥＬＰの励起信号のゲイン
パラメータのインデクスからなることを特徴とする請求
項６記載の音声符号化装置。
【請求項８】入力音声信号の無声音区間と有声音区間
で可変レートによる符号化を行う音声符号化方法におい
て、時間軸上での入力音声信号を所定の単位で区分し、この
単位で求めた信号レベルとスペクトル包絡の時間的な変
化に基づいて無声音区間を背景雑音区間と音声区間に分
けて判定する入力信号判定工程を備え、上記入力信号判定工程で判定された背景雑音区間のパラ
メータと、上記音声区間のパラメータと、有声音区間の
パラメータに対する符号化ビットの割り当てを異ならせ
ることを特徴とする音声符号化方法。
【請求項９】時間軸上での入力音声信号を所定の単位
で区分し、この単位で入力信号の信号レベルの時間的な
変化を求める工程と、上記単位でのスペクトル包絡の時間的な変化を求める工
程と、上記信号レベル及びスペクトル包絡の時間的な変化から
背景雑音か否かを判定する工程とを備えることを特徴と
する入力信号判定方法。
【請求項１０】ファジイ推論を用いて背景雑音か否か
を判定することを特徴とする請求項９記載の入力信号判
定方法。
【請求項１１】音声区間のパラメータと、有声音区間
のパラメータに対する符号化ビットの割り当てが異なっ
て伝送されてきた符号化ビットを復号する復号装置にお
いて、上記符号化ビットから音声区間であるか、又は背景雑音
区間であるかを判定する判定手段と、上記判定手段で背景雑音区間を示す情報を取り出したと
きには現在又は現在及び過去に受信したＬＰＣ係数、現
在又は現在及び過去に受信したＣＥＬＰのゲインインデ
クス、及び内部でランダムに生成したＣＥＬＰのシェイ
プインデクスを用いて上記符号化ビットを復号する復号
手段とを備えることを特徴とする復号装置。
【請求項１２】上記復号手段は、上記判定手段で背景
雑音区間と判定された区間においては、過去に受信した
ＬＰＣ係数と現在受信したＬＰＣ係数、または過去に受
信したＬＰＣ係数同士を補間して生成したＬＰＣ係数を
用いて背景雑音区間の信号を合成するときに、ＬＰＣ係
数を補間する補間係数の生成に乱数を用いることを特徴
とする請求項１１記載の復号装置。
【請求項１３】無声音区間のパラメータと、有声音区
間のパラメータに対する符号化ビットの割り当てが異な
って伝送されてきた符号化ビットを復号する復号方法に
おいて、上記符号化ビットから音声区間であるか、又は背景雑音
区間であるかを判定する判定工程と、上記判定工程で背景雑音区間を示す情報を取り出したと
きには現在又は現在及び過去に受信したＬＰＣ係数、現
在又は現在及び過去に受信したＣＥＬＰのゲインインデ
クス、及び内部でランダムに生成したＣＥＬＰのシェイ
プインデクスを用いて上記符号化ビットを復号する復号
工程とを備えることを特徴とする復号方法。
【請求項１４】入力音声信号の無声音区間と有声音区
間で可変レートによる符号化を行う音声符号化プログラ
ムを提供するプログラム提供媒体において、時間軸上での入力音声信号を所定の単位で区分し、この
単位で求めた信号レベルとスペクトル包絡の時間的な変
化に基づいて無声音区間を背景雑音区間と音声区間に分
けて判定する入力信号判定工程を備え、上記入力信号判定工程で判定された背景雑音区間のパラ
メータと、上記音声区間のパラメータと、有声音区間の
パラメータに対する符号化ビットの割り当てを異ならせ
るプログラムを提供することを特徴とするプログラム提
供媒体。
【請求項１５】無声音区間のパラメータと、有声音区
間のパラメータに対する符号化ビットの割り当てが異な
って伝送されてきた符号化ビットを復号するための復号
プログラムを提供するためのプログラム提供媒体におい
て、上記符号化ビットから音声区間であるか、又は背景雑音
区間であるかを判定する判定工程と、上記判定工程で背景雑音区間を示す情報を取り出したと
きには現在又は現在及び過去に受信したＬＰＣ係数、現
在又は現在及び過去に受信したＣＥＬＰのゲインインデ
クス、及び内部でランダムに生成したＣＥＬＰのシェイ
プインデクスを用いて上記符号化ビットを復号する復号
工程とを備えるプログラムを提供することを特徴とする
プログラム提供媒体。