JPH11177434A

JPH11177434A - 音声符号化復号方式

Info

Publication number: JPH11177434A
Application number: JP9280836A
Authority: JP
Inventors: Kazunobu Kondou; 多伸近藤
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 1997-10-07
Filing date: 1997-10-14
Publication date: 1999-07-02
Anticipated expiration: 2017-10-14
Also published as: JP3765171B2; US6141637A

Abstract

(57)【要約】【課題】従来のベクトル量子化と同等レベルのビット
レートで、しかも音声品質の劣化が少ない音声符号化復
号方式を提供する。【解決手段】音声信号は、ＭＤＣＴ部１で所定区間毎
に時間領域から周波数領域に直交変換されて直交変換係
数が求められる。ＬＰＣ分析部２、ピッチ成分分析部４
及びパワースペクトラム分析部６は、音声信号を分析し
て補助情報を求める。演算手段３，５，７は補助情報に
よって直交変換係数を平滑化し、この平滑化された直交
変換係数をベクトル量子化部８でベクトル量子化する。
平滑化された直交変換係数のベクトル量子化前後の低域
成分をそれぞれ低域成分抽出部１０，１２で抽出してベ
クトル量子化誤差を求め、これをスカラー量子化部１４
でスカラー量子化して低域補正情報を得る。この低域補
正情報は、量子化インデックス及び補助情報と共に符号
化出力として出力される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、音声や楽音等の
信号（以下、総称して「音声信号」と呼ぶ）を時間領域
から周波数領域へ直交変換してベクトル量子化すること
により音声信号を圧縮符号化する音声符号化復号方式に
関する。

【０００２】

【従来の技術】従来より、低ビットレートで高品質の圧
縮符号化が可能である音声信号の圧縮符号化方式として
ベクトル量子化が広く知られている。ベクトル量子化
は、符号帳（コードブック）を用いて音声信号波形を一
定区間毎に量子化することにより、その情報量を格段に
削減することができるため、音声情報の通信分野等に広
く使用されている。符号帳は多くの学習サンプルデータ
を用いて一般化Lloydアルゴリズム等によって学習され
る。しかし、これによって得られた符号帳は、学習サン
プルデータの持つ特性に大きく影響を受ける。従って、
符号帳が特定の特性に偏らないようにするためには、相
当数のサンプルデータを用いて学習を行う必要がある
が、それでも全てのパターンを網羅することは不可能で
ある。このため、符号帳はなるべくランダムなデータを
用いて作成される。

【０００３】一方、音声信号を圧縮符号化する場合、音
声信号のパワースペクトルの偏りに着目して音声信号を
直交変換（ＦＦＴ，ＤＣＴ，ＭＤＣＴ等）することで圧
縮効率を高めることがなされている。これをベクトル量
子化に適用する場合、直交変換係数の振幅は予め特定の
レベルに固定化しておくことが望ましい。振幅値がバラ
バラであると、多くの符号ビットが必要になる上、それ
に対応する符号ベクトルの数も膨大になるからである。
このため、直交変換係数をベクトル量子化する場合に
は、音声信号を線形予測分析（ＬＰＣ）してそのスペ
クトル包絡を予測する、移動平均予測等を用いてフレ
ーム間の相関を取り除く、ピッチ予測を行う、聴覚
心理特性を用いて帯域に依存する冗長性を取り除く等の
手法を用いて、音声信号の周波数スペクトル（直交変換
係数）を平滑化し、ベクトル量子化に適したデータとし
てから符号帳の学習を行うようにしている（例えば「周
波数領域重み付けインタリーブベクトル量子化（TwinV
Q）によるオーディオ符号化」岩上他：日本音響学会講
演論文集，平成６年１０月，pp339）。なお、これら直
交変換係数を平滑化するための情報は、補助情報として
量子化インデックスと共に伝送される。

【０００４】

【発明が解決しようとする課題】ところで、音声信号は
多くの場合、定常的な調波構造を有するため、周波数領
域に変換された変換係数列の包絡には細かいスパイク状
の凹凸が現れる。この凹凸は線形予測やピッチ予測を組
み合わせても十分に表現することは難しい。このため、
上述した平滑化技術を用いても音声信号の周波数スペク
トルの平滑化はまだ十分とはいえないのが現状である。

【０００５】振幅値がある程度固定されていることを前
提とするベクトル量子化では、平滑化しきれなかった部
分にベクトル量子化誤差が顕著に現れる。特にピッチ性
の高い音声信号の場合、低域で現れるベクトル量子化誤
差が目立った聴感上の劣化を引き起こす。しかし、低域
成分の再現性を高めるために符号ビット数を多くする
と、前述したように符号ベクトル数が膨大になり、ビッ
トレートも増大するという問題がある。

【０００６】この発明は、このような問題点に鑑みなさ
れたもので、従来のベクトル量子化と同等レベルのビッ
トレートで、しかも音声品質の劣化が少ない音声符号化
復号方式を提供することを目的とする。

【０００７】

【課題を解決するための手段】この発明に係る音声符号
化復号方式は、音声信号を所定区間毎に時間領域から周
波数領域に直交変換して直交変換係数を求めると共に、
前記音声信号を分析して求められた補助情報によって前
記直交変換係数を平滑化し、この平滑化された直交変換
係数をベクトル量子化して量子化インデックスを得、更
に前記平滑化された直交変換係数の低域成分のベクトル
量子化誤差を抽出してこれをスカラー量子化して低域補
正情報を得、前記量子化インデックスを前記低域補正情
報及び前記補助情報と共に符号化出力として出力する音
声符号化装置と、この音声符号化装置から出力される符
号化出力に含まれる前記量子化インデックスをベクトル
逆量子化して前記直交変換係数を復号すると共に、前記
低域補正情報を復号して前記復号された直交変換係数の
低域成分を補正し、この補正された直交変換係数を前記
補助情報に基づいて平滑化前の状態に復元した後、周波
数領域から時間領域に逆直交変換して前記音声信号を復
号する音声復号装置とを備えたことを特徴とする。

【０００８】この発明に係る音声符号化装置は、音声信
号を所定区間毎に時間領域から周波数領域に直交変換し
て直交変換係数を出力する直交変換手段と、前記音声信
号を分析して前記直交変換係数を平滑化するための補助
情報を求める音声信号分析手段と、この音声信号分析手
段で求められた補助情報によって前記直交変換係数を平
滑化する演算手段と、この演算手段から得られる平滑化
された直交変換係数をベクトル量子化して量子化インデ
ックスを出力するベクトル量子化手段と、このベクトル
量子化手段で得られた量子化インデックスを逆量子化し
て復号直交変換係数を出力するベクトル逆量子化手段
と、前記演算手段から出力される直交変換係数と前記ベ
クトル逆量子化手段から出力される復号直交変換係数の
低域成分の誤差を抽出する低域誤差抽出手段と、この低
域誤差抽出手段から抽出される低域成分の誤差をスカラ
ー量子化して低域補正情報を出力するスカラー量子化手
段と、前記音声信号分析手段からの補助情報、前記ベク
トル量子化手段からの量子化インデックス及び前記スカ
ラー量子化手段からの低域補正情報を符号化出力として
出力する合成手段とを備えたことを特徴とする。

【０００９】この発明に係る音声復号装置は、音声信号
の直交変換係数を平滑化するための補助情報、平滑され
た直交変換係数をベクトル量子化して得られた量子化イ
ンデックス及び前記平滑化された直交変換係数の低域成
分のベクトル量子化誤差をスカラー量子化して得られた
低域補正情報を含む符号化情報を入力し、前記量子化イ
ンデックス、低域補正情報及び補助情報をそれぞれ分離
する情報分離手段と、この情報分離手段で分離された量
子化インデックスをベクトル逆量子化して直交変換係数
を出力するベクトル逆量子化手段と、前記情報分離手段
で分離された低域補正情報を復号するスカラー逆量子化
手段と、前記情報分離手段で分離された補助情報を復号
する補助情報復号手段と、前記ベクトル逆量子化手段で
得られた直交変換係数の低域成分を前記復号された低域
補正情報によって補正すると共に、この補正された直交
変換係数を前記復号された補助情報に基づいて平滑化前
の状態に復元する演算手段と、この演算手段の出力を周
波数領域から時間領域に逆直交変換して前記音声信号を
復号する逆直交変換手段とを備えたことを特徴とする。

【００１０】また、この発明に係る媒体に記憶された音
声符号化復号プログラムは、音声信号を所定区間毎に時
間領域から周波数領域に直交変換して直交変換係数を求
めると共に、前記音声信号を分析して求められた補助情
報によって前記直交変換係数を平滑化し、この平滑化さ
れた直交変換係数をベクトル量子化して量子化インデッ
クスを得、更に前記平滑化された直交変換係数の低域成
分のベクトル量子化誤差を抽出してこれをスカラー量子
化して低域補正情報を得、前記量子化インデックスを前
記低域補正情報及び前記補助情報と共に符号化出力とし
て出力する音声符号化処理と、この音声符号化処理によ
って出力される符号化出力に含まれる前記量子化インデ
ックスをベクトル逆量子化して前記直交変換係数を復号
すると共に、前記低域補正情報を復号して前記復号され
た直交変換係数の低域成分を補正し、この補正された直
交変換係数を前記補助情報に基づいて平滑化前の状態に
復元した後、周波数領域から時間領域に逆直交変換して
前記音声信号を復号する音声復号処理とを含むことを特
徴とする。

【００１１】この発明では、音声信号を分析して求めら
れた補助情報によって直交変換係数を平滑化すると共
に、平滑化された直交変換係数の低域成分のベクトル量
子化誤差を抽出してこれをスカラー量子化して低域補正
情報を得、量子化インデックスを低域補正情報及び補助
情報と共に符号化出力として出力する。このため、直交
変換係数の低域成分は、低域補正情報によって補正する
ことで正確に再現可能になり、聴感上目立った音質の劣
化を防止することができる。低域補正情報は、直交変換
係数のベクトル量子化誤差、即ち直交変換係数の量子化
前後の振幅差に基づく誤差成分であり、しかも低域成分
（例えば０〜２ｋＨｚ程度）に限定されているので、ス
カラー量子化による符号ビット数の増加は僅かで済むこ
とになる。

【００１２】

【発明の実施の形態】以下、図面を参照して、この発明
の好ましい実施の形態について説明する。図１は、この
発明の一実施例に係る音声符号化復号システムにおける
音声符号化装置（送信側）の構成を示すブロック図であ
る。ディジタルの時系列信号からなる音声信号は、直交
変換手段としてのＭＤＣＴ（Modified Discrete Cosine
Transform）部１及び音声分析手段であるＬＰＣ（Line
ar Predictive Coding）分析部２にそれぞれ供給され
る。ＭＤＣＴ部１では、音声信号を、所定サンプル数を
１フレームとしてフレーム毎に切り出し、時間領域から
周波数領域へＭＤＣＴ変換してＭＤＣＴ係数を出力す
る。ＬＰＣ分析部２は、１フレームの時系列信号を共分
散法、自己相関法等のアルゴリズムを用いてＬＰＣ分析
し、音声信号のスペクトラム包絡を予測係数（ＬＰＣ係
数）として求めると共に、得られたＬＰＣ係数を量子化
して量子化ＬＰＣ係数を出力する。

【００１３】ＭＤＣＴ部１から出力されるＭＤＣＴ係数
は、割算器３に入力され、ＬＰＣ分析部２から出力され
るＬＰＣ係数で除算されることにより、その振幅値が正
規化（平坦化）される。割算器３の出力は、ピッチ成分
分析部４に供給され、ピッチ成分を抽出される。抽出さ
れたピッチ成分は減算器５で正規化されたＭＤＣＴ係数
から分離される。ピッチ成分を分離された正規化ＭＤＣ
Ｔ係数は、パワースペクトラム分析部６に入力され、こ
こでサブバンド毎のパワースペクトラムが求められる。
即ち、ＭＤＣＴ係数の振幅包絡は、実際にはＬＰＣ分析
によるパワースペクトラム包絡と相違するため、ピッチ
成分を分離された正規化ＭＤＣＴ係数から再度スペクト
ラム包絡を求めて、これを割算器７によって正規化す
る。ここでは、ＬＰＣ分析部２、ピッチ成分分析部４及
びパワースペクトラム分析部６が音声信号分析手段を構
成し、量子化されたＬＰＣ係数、ピッチ情報及びサブバ
ンド情報が補助情報となる。また、割算器３，７及び減
算器５がＭＤＣＴ係数の平滑化のための演算手段であ
る。

【００１４】補助情報により平坦化されたＭＤＣＴ係数
は、重み付きベクトル量子化部８でベクトル量子化され
る。ここでは、ＭＤＣＴ係数と符号帳との照合によって
最もマッチングする符号ベクトルの量子化インデックス
が符号化出力として求められる。ベクトル量子化に際し
ては、聴覚心理モデル分析部９が補助情報に基づいて聴
覚心理モデルを分析し、マスキング効果等を考慮して聴
感的に量子化歪みを最小にするような重み付けを行う。

【００１５】また、この装置では、ベクトル量子化誤差
による低域成分の歪みを補正するため、ベクトル量子化
誤差をスカラー量子化して得られた低域補正情報を符号
化出力に付加する。即ち、平坦化されたＭＤＣＴ係数の
低域成分が低域成分抽出部１０で抽出される。また、量
子化インデックスをベクトル逆量子化部１１で逆量子化
して復号された平坦化ＭＤＣＴ係数の低域成分が低域成
分抽出部１２で抽出される。低域成分抽出部１０，１２
の出力の差分が減算器１３で求められる。これらベクト
ル逆量子化部１１、低域成分抽出部１０，１２及び減算
器１３が低域誤差抽出手段を構成している。これら低域
成分抽出部１０，１２の動作設定値は、発明者実験で
は、９０Ｈｚから１ｋＨｚの範囲の成分を抽出するよう
に設定して、聴感上良好な結果が得られているが、さら
に抽出範囲を拡大する場合その上下限値としては、０Ｈ
ｚから２ｋＨｚ程度までが妥当と考えられる。この低域
量子化誤差はスカラー量子化部１４でスカラー量子され
る。これによって低域補正情報が得られる。

【００１６】以上の処理で求められた量子化インデック
ス、補助情報及び低域補正情報は、合成手段としてのマ
ルチプレクサ１５に供給され、ここで合成されて符号化
出力として出力される。

【００１７】一方、図２に示す音声復号装置（受信側）
では、上記と逆の処理によって音声信号が復号される。
即ち、上述した符号化出力は、情報分離手段であるデマ
ルチプレクサ２１によって量子化インデックス、補助情
報及び低域補正情報に分離される。ベクトル逆量子化部
２２では、送信側のベクトル量子化部８と同じ符号帳を
用いてＭＤＣＴ係数を復号する。低域補正情報はスカラ
ー逆量子化部２３で復号され、得られた低域誤差分が加
算器２４においてＭＤＣＴ係数に加算されることで復号
されたＭＤＣＴ係数の低域成分が補正される。また、デ
マルチプレクサ２１で分離された補助情報のうちサブバ
ンド情報は、パワースペクトラム復号部２５で復号され
て乗算器２６に供給され、低域補正されたＭＤＣＴ係数
に乗算される。補助情報のうちピッチ情報は、ピッチ成
分復号部２７で復号されて加算器２８に供給され、スペ
クトラム補正されたＭＤＣＴ係数に加算される。補助情
報のうちＬＰＣ係数は、ＬＰＣ復号部２９で復号されて
乗算器３０に供給され、ピッチ補正されたＭＤＣＴ係数
に乗算される。これら補助情報によって補正されたＭＤ
ＣＴ係数は、ＩＭＤＣＴ部３１で逆ＭＤＣＴ処理されて
周波数領域から時間領域に変換されて元の音声信号が復
号される。

【００１８】このシステムによれば、ベクトル量子化前
の平滑化ＭＤＣＴ係数と、ベクトル量子化後の平滑化Ｍ
ＤＣＴ係数との差分（ベクトル量子化誤差）の低域成分
をスカラー量子化して低域補正情報として伝送し、復号
側でベクトル逆量子化されたＭＤＣＴ係数に低域補正情
報から復号される差分を加算することでベクトル量子化
誤差を低減することができる。スカラー量子化されるの
はベクトル量子化誤差の低域部分のみであるから、僅か
な情報量の付加で足りることになる。

【００１９】図３は、ベクトル量子化前の原平滑化ＭＤ
ＣＴ係数、ベクトル量子化後の復号平滑化ＭＤＣＴ係数
及びその差分として現れるベクトル量子化誤差成分を示
す図である。この図に示すように、音声信号のピッチ成
分に相当する部分に大きな量子化誤差が見られる。この
点に着目して、ベクトル量子化誤差をスカラー量子化す
る場合、具体的には次のような方法を用いることができ
る。

【００２０】例えば、図４は、ベクトル量子化誤差を各
周波数毎に評価して、量子化誤差が大きい順に予め定め
られた特定の数だけ周波数位置（帯域Ｎｏ．）と量子化
誤差のペアを符号化する例である。この場合、帯域Ｎ
ｏ．を表すビット数をｎ、量子化誤差を表すビット数を
ｍ、符号化すべきペアの数をＮとしたとき、Ｎ（ｎ＋
ｍ）が低域補正情報のビット数となる。また、図５は、
予め定めた周波数帯域について全ての周波数位置の量子
化誤差を符号化する例である。この場合には、帯域Ｎ
ｏ．を特定する必要がないため、量子化誤差を表すビッ
ト数をｋ、符号化する周波数帯域のバンド数をＭとした
とき、低域補正情報のビット数はＭｋとなる。

【００２１】音声信号の場合、ピッチ性の高い信号と破
裂音、摩擦音のようにランダムな信号とが存在するた
め、上記２つの量子化方式をベクトル量子化誤差の性質
に応じて切り換えるようにしても良い。即ち、ピッチ性
の高い信号の場合、図３のように、量子化誤差は特定の
間隔で大きく現れるが、その他の部分の誤差は極めて少
ないので、量子化誤差のビット数ｍを大きな値とすると
共に、符号化すべきペアの数Ｎを小さな値とする。ま
た、破裂音や摩擦音の場合には、比較的小さな量子化誤
差が広い範囲にわたって現れるので、量子化ビット数ｋ
を小さな値に設定する。そして、スカラー量子化部１４
で、ベクトル量子化誤差のパターンを評価して、いずれ
か一方の量子化方式を選択すると共に、量子化方式を示
す１ビットのモード情報を符号化データの先頭に追加す
る。これにより、低域補正情報として僅かの情報量の追
加で従前の符号帳をそのまま使用した場合でも、原音に
近い高品質の復号音が得られる音声符号化復号方式を実
現することができる。

【００２２】図６は、従来システムにおける原音声信号
と復号音声信号との間の誤差信号を、横軸に時間軸とし
て示した図であり、図７は同じく上述した実施例のシス
テムにおける原音声信号と復号音声信号との間の誤差信
号を示す図である。これらの図からも明らかなように、
この発明のシステムによれば、量子化誤差が全体的に減
少している。特に図６のＡの部分に特徴的に現れている
ように、ピッチの明確な音の部分では、従来方式の場
合、大きな量子化誤差が現れているのに対して、本方式
の場合、逆に誤差が小さくなっており、この発明がピッ
チの大きな信号に対して特に効果的であることが明らか
になった。

【００２３】また、図８は低域補正情報による補正をし
た場合としなかった場合のベクトル量子化誤差のスペク
トラムをそれぞれ示したものである。この図において、
縦軸は誤差振幅を示すＰＣＭサンプルデ−タ振幅スケ−
ルでありその上下限値は±（２の１５乗）となる。また
横軸はサブバンドＮｏ（ｆｓ＝２２．０５ｋＨｚ、フレ
−ム長５１２サンプルとして、時間軸周波数軸変換の一
つであるＭＤＣＴを施した際に、ｆｓ／２の周波数がサ
ブバンドＮｏ＝５１２となるよう換算された周波数スケ
−ル）であり、例えば図中のサブバンドＮｏ＝３０は６
４６Ｈｚに相当している。この図から明らかなように、
補正を行わない場合には低域で大きな量子化誤差が現れ
ているのに対し、本方式のように補正を行った場合に
は、低域での量子化誤差が大幅に小さくなっていること
が分かる。

【００２４】なお、以上の実施例では、音声符号化装置
及び音声復号装置をそれぞれハードウェアにて構成した
例について説明したが、図１及び図２の各ブロックを機
能ブロックとして捉えれば、ソフトウェアによっても実
現可能である。この場合、音声符号化復号処理プログラ
ムは、ＦＤ、ＣＤ−ＲＯＭ等の適当な媒体に記録され、
又は通信媒体を介して提供されることになる。

【００２５】

【発明の効果】以上述べたように、この発明によれば、
音声信号を分析して求められた補助情報によって直交変
換係数を平滑化すると共に、平滑化された直交変換係数
の低域成分のベクトル量子化誤差を抽出してこれをスカ
ラー量子化して低域補正情報を得、量子化インデックス
を低域補正情報及び補助情報と共に符号化出力として出
力して、直交変換係数の低域成分を、低域補正情報によ
って補正するようにしているので、僅かな情報量の付加
だけで高品質の復号音を得ることができるという効果を
奏する。

【図面の簡単な説明】

【図１】この発明の一実施例に係る音声符号化復号シ
ステムにおける符号化装置のブロック図である。

【図２】同システムにおける復号装置のブロック図で
ある。

【図３】同システムにおけるベクトル量子化誤差を示
す図である。

【図４】同システムにおける低域補正情報の一例を示
す図である。

【図５】同システムにおける低域補正情報の他の例を
示す図である。

【図６】従来システムによる符号化誤差信号を示す波
形図である。

【図７】本システムによる符号化誤差信号を示す波形
図である。

【図８】従来システムと本システムによる量子化誤差
スペクトラムをそれぞれ示す図である。

【符号の説明】

１…ＭＤＣＴ部、２…ＬＰＣ分析部、４…ピッチ成分分
析部、６…パワースペクトラム分析部、８…重み付きベ
クトル量子化部、９…聴覚心理モデル分析部、１０，１
２…低域成分抽出部、１１，２２…ベクトル逆量子化
部、１４…スカラー量子化部、１５…マルチプレクサ、
２１…デマルチプレクサ、２３…スカラー逆量子化部、
２５…パワースペクトラム復号部、２７…ピッチ成分復
号部、２９…ＬＰＣ復号部、３１…ＩＭＤＣＴ部。

Claims

【特許請求の範囲】

【請求項１】音声信号を所定区間毎に時間領域から周
波数領域に直交変換して直交変換係数を求めると共に、
前記音声信号を分析して求められた補助情報によって前
記直交変換係数を平滑化し、この平滑化された直交変換
係数をベクトル量子化して量子化インデックスを得、更
に前記平滑化された直交変換係数の低域成分のベクトル
量子化誤差を抽出してこれをスカラー量子化して低域補
正情報を得、前記量子化インデックスを前記低域補正情
報及び前記補助情報と共に符号化出力として出力する音
声符号化装置と、この音声符号化装置から出力される符号化出力に含まれ
る前記量子化インデックスをベクトル逆量子化して前記
直交変換係数を復号すると共に、前記低域補正情報を復
号して前記復号された直交変換係数の低域成分を補正
し、この補正された直交変換係数を前記補助情報に基づ
いて平滑化前の状態に復元した後、周波数領域から時間
領域に逆直交変換して前記音声信号を復号する音声復号
装置とを備えたことを特徴とする音声符号化復号方式。
【請求項２】音声信号を所定区間毎に時間領域から周
波数領域に直交変換して直交変換係数を出力する直交変
換手段と、前記音声信号を分析して前記直交変換係数を平滑化する
ための補助情報を求める音声信号分析手段と、この音声信号分析手段で求められた補助情報によって前
記直交変換係数を平滑化する演算手段と、この演算手段から得られる平滑化された直交変換係数を
ベクトル量子化して量子化インデックスを出力するベク
トル量子化手段と、このベクトル量子化手段で得られた量子化インデックス
を逆量子化して復号直交変換係数を出力するベクトル逆
量子化手段と、前記演算手段から出力される直交変換係数と前記ベクト
ル逆量子化手段から出力される復号直交変換係数の低域
成分の誤差を抽出する低域誤差抽出手段と、この低域誤差抽出手段から抽出される低域成分の誤差を
スカラー量子化して低域補正情報を出力するスカラー量
子化手段と、前記音声信号分析手段からの補助情報、前記ベクトル量
子化手段からの量子化インデックス及び前記スカラー量
子化手段からの低域補正情報を符号化出力として出力す
る合成手段とを備えたことを特徴とする音声符号化装
置。
【請求項３】音声信号の直交変換係数を平滑化するた
めの補助情報、平滑された直交変換係数をベクトル量子
化して得られた量子化インデックス及び前記平滑化され
た直交変換係数の低域成分のベクトル量子化誤差をスカ
ラー量子化して得られた低域補正情報を含む符号化情報
を入力し、前記量子化インデックス、低域補正情報及び
補助情報をそれぞれ分離する情報分離手段と、この情報分離手段で分離された量子化インデックスをベ
クトル逆量子化して直交変換係数を出力するベクトル逆
量子化手段と、前記情報分離手段で分離された低域補正情報を復号する
スカラー逆量子化手段と、前記情報分離手段で分離された補助情報を復号する補助
情報復号手段と、前記ベクトル逆量子化手段で得られた直交変換係数の低
域成分を前記復号された低域補正情報によって補正する
と共に、この補正された直交変換係数を前記復号された
補助情報に基づいて平滑化前の状態に復元する演算手段
と、この演算手段の出力を周波数領域から時間領域に逆直交
変換して前記音声信号を復号する逆直交変換手段とを備
えたことを特徴とする音声復号装置。
【請求項４】音声信号を所定区間毎に時間領域から周
波数領域に直交変換して直交変換係数を求めると共に、
前記音声信号を分析して求められた補助情報によって前
記直交変換係数を平滑化し、この平滑化された直交変換
係数をベクトル量子化して量子化インデックスを得、更
に前記平滑化された直交変換係数の低域成分のベクトル
量子化誤差を抽出してこれをスカラー量子化して低域補
正情報を得、前記量子化インデックスを前記低域補正情
報及び前記補助情報と共に符号化出力として出力する音
声符号化処理と、この音声符号化処理によって出力される符号化出力に含
まれる前記量子化インデックスをベクトル逆量子化して
前記直交変換係数を復号すると共に、前記低域補正情報
を復号して前記復号された直交変換係数の低域成分を補
正し、この補正された直交変換係数を前記補助情報に基
づいて平滑化前の状態に復元した後、周波数領域から時
間領域に逆直交変換して前記音声信号を復号する音声復
号処理とを含む音声符号化復号プログラムを記憶してな
る媒体。