JPH1097298A

JPH1097298A - ベクトル量子化方法、音声符号化方法及び装置

Info

Publication number: JPH1097298A
Application number: JP8251614A
Authority: JP
Inventors: Masayuki Nishiguchi; 正之西口; Kazuyuki Iijima; 和幸飯島; Atsushi Matsumoto; 淳松本
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1996-09-24
Filing date: 1996-09-24
Publication date: 1998-04-14
Anticipated expiration: 2016-09-24
Also published as: US6611800B1; KR100543982B1; MY120520A; DE69726525T2; ID18313A; JP3707153B2; CN1145142C; EP0831457B1; EP0831457A3; CN1188957A; TW360859B; EP0831457A2; DE69726525D1; KR19980024885A

Abstract

(57)【要約】【課題】ベクトル量子化のコードブックサーチに要す
る演算量を低減する。【解決手段】サイン波分析符号化部１１４のスペクト
ル評価部１４８からのハーモニクススペクトルのエンベ
ロープを表すデータをベクトル量子化部１１６に送って
ベクトル量子化する際に、入力ベクトルと符号帳に蓄え
られた全てのコードベクトルとの類似度を近似計算によ
り求めて類似度の高い複数のコードベクトルを予備選択
し、この予備選択により選択された複数のコードベクト
ルについて上記入力ベクトルとの誤差を最小化する最適
のコードベクトルを本選択することにより、簡略化され
た演算の予備選択である程度候補を絞り込んだ後に、こ
れらの候補についてのみ高精度の本選択を行わせる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力ベクトルを符
号帳に蓄えられたコードベクトルと比較して最適のコー
ドベクトルのインデクスを出力するベクトル量子化方
法、入力音声信号をブロックやフレーム等の所定の符号
化単位で区分して、区分された符号化単位毎にベクトル
量子化を含んだ符号化処理を行うような音声符号化方法
及び装置に関する。

【０００２】

【従来の技術】オーディオ信号やビデオ信号等をディジ
タル化し、圧縮符号化を施す場合に、入力データの複数
個をまとめてベクトルとし１つの符号（インデクス）で
表現するようなベクトル量子化が知られている。

【０００３】このベクトル量子化においては、入力され
る種々のベクトルの代表的なパターンを予め学習等によ
って決定して、それぞれに符号（インデクス）を与えて
符号帳（コードブック）に蓄えておき、入力ベクトルと
符号帳の各パターン（コードベクトル）との比較、すな
わちパターンマッチングを行い、最も類似度や相関性の
高いパターンの符号を出力する。この類似度や相関性
は、入力ベクトルと各コードベクトルとの間の歪尺度や
誤差エネルギ等を計算することにより求められ、歪や誤
差が小さいほど類似度や相関性が高いことになる。

【０００４】ところで、オーディオ信号（音声信号や音
響信号を含む）の時間領域や周波数領域における統計的
性質と人間の聴感上の特性を利用して信号圧縮を行うよ
うな符号化方法が種々知られている。この符号化方法と
しては、大別して時間領域での符号化、周波数領域での
符号化、分析合成符号化等が挙げられる。

【０００５】音声信号等の高能率符号化の例として、ハ
ーモニック（Harmonic）符号化、ＭＢＥ（Multiband Ex
citation: マルチバンド励起）符号化等のサイン波分析
符号化や、ＳＢＣ（Sub-band Coding:帯域分割符号
化）、ＬＰＣ（Linear Predictive Coding: 線形予測符
号化）、あるいはＤＣＴ（離散コサイン変換）、ＭＤＣ
Ｔ（モデファイドＤＣＴ）、ＦＦＴ（高速フーリエ変
換）等が知られている。

【０００６】このような音声信号等の高能率符号化にお
いて、例えば得られたハーモニクススペクトル等のパラ
メータに対して、上述したようなベクトル量子化が採用
されている。

【０００７】

【発明が解決しようとする課題】ところで、符号帳に蓄
えられているパターン、すなわちコードベクトルの個数
が多い場合や、複数の符号帳を組み合わせて構成される
多段のベクトル量子化器の場合には、上記パターンマッ
チングの際のコードベクトルの検索（サーチ）の回数が
多くなり、演算量が増大するという欠点がある。特に、
複数の符号帳を組み合わせる場合には、各符号帳のコー
ドベクトルの個数の積の回数の類似度演算が必要となる
ため、コードブックサーチの演算量がかなり大きくなっ
てしまう。

【０００８】本発明は、このような実情に鑑みてなされ
たものであり、コードブックサーチの演算量を抑えるこ
とが可能なベクトル量子化方法、音声符号化方法及び装
置の提供を目的とする。

【０００９】

【課題を解決するための手段】本発明に係るベクトル量
子化方法は、上述した課題を解決するために、ベクトル
量子化しようとする入力ベクトルと符号帳（コードブッ
ク）に蓄えられた全てのコードベクトルとの類似度を近
似計算により求めて類似度の高い複数のコードベクトル
を予備選択し、この予備選択により選択された複数のコ
ードベクトルについて上記入力ベクトルとの誤差を最小
化する最適のコードベクトルを本選択することを特徴と
する。

【００１０】この予備選択を行った後に本選択を行うこ
とにより、簡略化された演算の予備選択である程度候補
を絞り込んだ後に、これらの候補についてのみ高精度の
本選択を行わせることができ、符号帳検索（コードブッ
クサーチ）に要する演算量を低減できる。

【００１１】ここで上記符号帳は、複数の符号帳を組み
合わせて構成され、最適の組み合わせを構成するコード
ベクトルが各符号帳毎にそれぞれ選択されることが挙げ
られる。また、上記類似度としては、上記入力ベクトル
と上記コードベクトルとの内積、重み付き内積、又はこ
れらを各コードベクトルのノルム又は重み付きノルムで
割ったもののいずれかを用いることが挙げられる。

【００１２】また、本発明に係る音声符号化方法は、入
力音声信号又は入力音声信号の短期予測残差をサイン波
分析してハーモニクススペクトルを求め、符号化単位毎
の上記ハーモニクススペクトルに基づくパラメータを入
力ベクトルとしてベクトル量子化することにより符号化
する音声符号化方法であって、上記ベクトル量子化は、
上記入力ベクトルと符号帳に蓄えられた全てのコードベ
クトルとの類似度を近似計算により求めて類似度の高い
複数のコードベクトルを予備選択し、この予備選択によ
り選択された複数のコードベクトルについて上記入力ベ
クトルとの誤差を最小化する最適のコードベクトルを本
選択することを特徴とする。

【００１３】上記類似度としては、上記入力ベクトルと
上記コードベクトルとの内積、重み付き内積、又はこれ
らを各コードベクトルのノルム又は重み付きノルムで割
ったもののいずれかを用い、また上記ノルムの重み付け
には、低域側にエネルギが集中し高域側にエネルギが低
下してゆく重みを用い、そのような重みを付けたコード
ベクトルのノルムで上記コードベクトルの重み付き内積
を割ったものを用いて、上記類似度を求めることが挙げ
られる。

【００１４】このような音声符号化方法が適用された音
声符号化装置を構成できる。

【００１５】

【発明の実施の形態】以下、本発明に係る好ましい実施
の形態について説明する。先ず、図１は、本発明に係る
ベクトル量子化方法の実施の形態が適用された音声符号
化装置の基本構成を示している。

【００１６】ここで、図１の音声信号符号化装置の基本
的な考え方は、入力音声信号の短期予測残差例えばＬＰ
Ｃ（線形予測符号化）残差を求めてサイン波分析（sinu
soidal analysis ）符号化、例えばハーモニックコーデ
ィング（harmonic coding ）を行う第１の符号化部１１
０と、入力音声信号に対して位相再現性のある波形符号
化により符号化する第２の符号化部１２０とを有し、入
力信号の有声音（Ｖ：Voiced）の部分の符号化に第１の
符号化部１１０を用い、入力信号の無声音（ＵＶ：Unvo
iced）の部分の符号化には第２の符号化部１２０を用い
るようにすることである。

【００１７】上記第１の符号化部１１０には、例えばＬ
ＰＣ残差をハーモニック符号化やマルチバンド励起（Ｍ
ＢＥ）符号化のようなサイン波分析符号化を行う構成が
用いられる。上記第２の符号化部１２０には、例えば合
成による分析法を用いて最適ベクトルのクローズドルー
プサーチによるベクトル量子化を用いた符号励起線形予
測（ＣＥＬＰ）符号化の構成が用いられる。

【００１８】図１の例では、入力端子１０１に供給され
た音声信号が、第１の符号化部１１０のＬＰＣ逆フィル
タ１１１及びＬＰＣ分析・量子化部１１３に送られてい
る。ＬＰＣ分析・量子化部１１３から得られたＬＰＣ係
数あるいはいわゆるαパラメータは、ＬＰＣ逆フィルタ
１１１に送られて、このＬＰＣ逆フィルタ１１１により
入力音声信号の線形予測残差（ＬＰＣ残差）が取り出さ
れる。また、ＬＰＣ分析・量子化部１１３からは、後述
するようにＬＳＰ（線スペクトル対）の量子化出力が取
り出され、これが出力端子１０２に送られる。ＬＰＣ逆
フィルタ１１１からのＬＰＣ残差は、サイン波分析符号
化部１１４に送られる。サイン波分析符号化部１１４で
は、ピッチ検出やスペクトルエンベロープ振幅計算が行
われると共に、Ｖ（有声音）／ＵＶ（無声音）判定部１
１５によりＶ／ＵＶの判定が行われる。サイン波分析符
号化部１１４からのスペクトルエンベロープ振幅データ
がベクトル量子化部１１６に送られる。スペクトルエン
ベロープのベクトル量子化出力としてのベクトル量子化
部１１６からのコードブックインデクスは、スイッチ１
１７を介して出力端子１０３に送られ、サイン波分析符
号化部１１４からの出力は、スイッチ１１８を介して出
力端子１０４に送られる。また、Ｖ／ＵＶ判定部１１５
からのＶ／ＵＶ判定出力は、出力端子１０５に送られる
と共に、スイッチ１１７、１１８の制御信号として送ら
れており、上述した有声音（Ｖ）のとき上記インデクス
及びピッチが選択されて各出力端子１０３及び１０４か
らそれぞれ取り出される。

【００１９】図１の第２の符号化部１２０は、この例で
はＣＥＬＰ（符号励起線形予測）符号化構成を有してお
り、雑音符号帳１２１からの出力を、重み付きの合成フ
ィルタ１２２により合成処理し、得られた重み付き音声
を減算器１２３に送り、入力端子１０１に供給された音
声信号を聴覚重み付けフィルタ１２５を介して得られた
音声との誤差を取り出し、この誤差を距離計算回路１２
４に送って距離計算を行い、誤差が最小となるようなベ
クトルを雑音符号帳１２１でサーチするような、合成に
よる分析（Analysis by Synthesis ）法を用いたクロー
ズドループサーチを用いた時間軸波形のベクトル量子化
を行っている。このＣＥＬＰ符号化は、上述したように
無声音部分の符号化に用いられており、雑音符号帳１２
１からのＵＶデータとしてのコードブックインデクス
は、上記Ｖ／ＵＶ判定部１１５からのＶ／ＵＶ判定結果
が無声音（ＵＶ）のときオンとなるスイッチ１２７を介
して、出力端子１０７より取り出される。

【００２０】次に、図２は、本発明に係る音声復号化方
法の一実施の形態が適用された音声信号復号化装置とし
て、上記図１の音声信号符号化装置に対応する音声信号
復号化装置の基本構成を示すブロック図である。

【００２１】この図２において、入力端子２０２には上
記図１の出力端子１０２からの上記ＬＳＰ（線スペクト
ル対）の量子化出力としてのコードブックインデクスが
入力される。入力端子２０３、２０４、及び２０５に
は、上記図１の各出力端子１０３、１０４、及び１０５
からの各出力、すなわちエンベロープ量子化出力として
のインデクス、ピッチ、及びＶ／ＵＶ判定出力がそれぞ
れ入力される。また、入力端子２０７には、上記図１の
出力端子１０７からのＵＶ（無声音）用のデータとして
のインデクスが入力される。

【００２２】入力端子２０３からのエンベロープ量子化
出力としてのインデクスは、逆ベクトル量子化器２１２
に送られて逆ベクトル量子化され、ＬＰＣ残差のスペク
トルエンベロープが求められて有声音合成部２１１に送
られる。有声音合成部２１１は、サイン波合成により有
声音部分のＬＰＣ（線形予測符号化）残差を合成するも
のであり、この有声音合成部２１１には入力端子２０４
及び２０５からのピッチ及びＶ／ＵＶ判定出力も供給さ
れている。有声音合成部２１１からの有声音のＬＰＣ残
差は、ＬＰＣ合成フィルタ２１４に送られる。また、入
力端子２０７からのＵＶデータのインデクスは、無声音
合成部２２０に送られて、雑音符号帳を参照することに
より無声音部分のＬＰＣ残差が取り出される。このＬＰ
Ｃ残差もＬＰＣ合成フィルタ２１４に送られる。ＬＰＣ
合成フィルタ２１４では、上記有声音部分のＬＰＣ残差
と無声音部分のＬＰＣ残差とがそれぞれ独立に、ＬＰＣ
合成処理が施される。あるいは、有声音部分のＬＰＣ残
差と無声音部分のＬＰＣ残差とが加算されたものに対し
てＬＰＣ合成処理を施すようにしてもよい。ここで入力
端子２０２からのＬＳＰのインデクスは、ＬＰＣパラメ
ータ再生部２１３に送られて、ＬＰＣのαパラメータが
取り出され、これがＬＰＣ合成フィルタ２１４に送られ
る。ＬＰＣ合成フィルタ２１４によりＬＰＣ合成されて
得られた音声信号は、出力端子２０１より取り出され
る。

【００２３】次に、上記図１に示した音声信号符号化装
置のより具体的な構成について、図３を参照しながら説
明する。なお、図３において、上記図１の各部と対応す
る部分には同じ指示符号を付している。

【００２４】この図３に示された音声信号符号化装置に
おいて、入力端子１０１に供給された音声信号は、ハイ
パスフィルタ（ＨＰＦ）１０９にて不要な帯域の信号を
除去するフィルタ処理が施された後、ＬＰＣ（線形予測
符号化）分析・量子化部１１３のＬＰＣ分析回路１３２
と、ＬＰＣ逆フィルタ回路１１１とに送られる。

【００２５】ＬＰＣ分析・量子化部１１３のＬＰＣ分析
回路１３２は、入力信号波形の２５６サンプル程度の長
さを符号化単位の１ブロックとしてハミング窓をかけ
て、自己相関法により線形予測係数、いわゆるαパラメ
ータを求める。データ出力の単位となるフレーミングの
間隔は、１６０サンプル程度とする。サンプリング周波
数ｆｓが例えば８ｋHzのとき、１フレーム間隔は１６０
サンプルで２０ｍsec となる。

【００２６】ＬＰＣ分析回路１３２からのαパラメータ
は、α→ＬＳＰ変換回路１３３に送られて、線スペクト
ル対（ＬＳＰ）パラメータに変換される。これは、直接
型のフィルタ係数として求まったαパラメータを、例え
ば１０個、すなわち５対のＬＳＰパラメータに変換す
る。変換は例えばニュートン−ラプソン法等を用いて行
う。このＬＳＰパラメータに変換するのは、αパラメー
タよりも補間特性に優れているからである。

【００２７】α→ＬＳＰ変換回路１３３からのＬＳＰパ
ラメータは、ＬＳＰ量子化器１３４によりマトリクスあ
るいはベクトル量子化される。このとき、フレーム間差
分をとってからベクトル量子化してもよく、複数フレー
ム分をまとめてマトリクス量子化してもよい。ここで
は、２０ｍsec を１フレームとし、２０ｍsec 毎に算出
されるＬＳＰパラメータを２フレーム分まとめて、マト
リクス量子化及びベクトル量子化している。

【００２８】このＬＳＰ量子化器１３４からの量子化出
力、すなわちＬＳＰ量子化のインデクスは、端子１０２
を介して取り出され、また量子化済みのＬＳＰベクトル
は、ＬＳＰ補間回路１３６に送られる。

【００２９】ＬＳＰ補間回路１３６は、上記２０ｍsec
あるいは４０ｍsec 毎に量子化されたＬＳＰのベクトル
を補間し、８倍のレートにする。すなわち、２．５ｍse
c 毎にＬＳＰベクトルが更新されるようにする。これ
は、残差波形をハーモニック符号化復号化方法により分
析合成すると、その合成波形のエンベロープは非常にな
だらかでスムーズな波形になるため、ＬＰＣ係数が２０
ｍsec 毎に急激に変化すると異音を発生することがある
からである。すなわち、２．５ｍsec 毎にＬＰＣ係数が
徐々に変化してゆくようにすれば、このような異音の発
生を防ぐことができる。

【００３０】このような補間が行われた２．５ｍsec 毎
のＬＳＰベクトルを用いて入力音声の逆フィルタリング
を実行するために、ＬＳＰ→α変換回路１３７により、
ＬＳＰパラメータを例えば１０次程度の直接型フィルタ
の係数であるαパラメータに変換する。このＬＳＰ→α
変換回路１３７からの出力は、上記ＬＰＣ逆フィルタ回
路１１１に送られ、このＬＰＣ逆フィルタ１１１では、
２．５ｍsec 毎に更新されるαパラメータにより逆フィ
ルタリング処理を行って、滑らかな出力を得るようにし
ている。このＬＰＣ逆フィルタ１１１からの出力は、サ
イン波分析符号化部１１４、具体的には例えばハーモニ
ック符号化回路、の直交変換回路１４５、例えばＤＦＴ
（離散フーリエ変換）回路に送られる。

【００３１】ＬＰＣ分析・量子化部１１３のＬＰＣ分析
回路１３２からのαパラメータは、聴覚重み付けフィル
タ算出回路１３９に送られて聴覚重み付けのためのデー
タが求められ、この重み付けデータが後述する聴覚重み
付きのベクトル量子化器１１６と、第２の符号化部１２
０の聴覚重み付けフィルタ１２５及び聴覚重み付きの合
成フィルタ１２２とに送られる。

【００３２】ハーモニック符号化回路等のサイン波分析
符号化部１１４では、ＬＰＣ逆フィルタ１１１からの出
力を、ハーモニック符号化の方法で分析する。すなわ
ち、ピッチ検出、各ハーモニクスの振幅Ａｍの算出、有
声音（Ｖ）／無声音（ＵＶ）の判別を行い、ピッチによ
って変化するハーモニクスのエンベロープあるいは振幅
Ａｍの個数を次元変換して一定数にしている。

【００３３】図３に示すサイン波分析符号化部１１４の
具体例においては、一般のハーモニック符号化を想定し
ているが、特に、ＭＢＥ（Multiband Excitation: マル
チバンド励起）符号化の場合には、同時刻（同じブロッ
クあるいはフレーム内）の周波数軸領域いわゆるバンド
毎に有声音（Voiced）部分と無声音（Unvoiced）部分と
が存在するという仮定でモデル化することになる。それ
以外のハーモニック符号化では、１ブロックあるいはフ
レーム内の音声が有声音か無声音かの択一的な判定がな
されることになる。なお、以下の説明中のフレーム毎の
Ｖ／ＵＶとは、ＭＢＥ符号化に適用した場合には全バン
ドがＵＶのときを当該フレームのＵＶとしている。ここ
で上記ＭＢＥの分析合成手法については、本件出願人が
先に提案した特願平４−９１４２２号明細書及び図面に
詳細な具体例を開示している。

【００３４】図３のサイン波分析符号化部１１４のオー
プンループピッチサーチ部１４１には、上記入力端子１
０１からの入力音声信号が、またゼロクロスカウンタ１
４２には、上記ＨＰＦ（ハイパスフィルタ）１０９から
の信号がそれぞれ供給されている。サイン波分析符号化
部１１４の直交変換回路１４５には、ＬＰＣ逆フィルタ
１１１からのＬＰＣ残差あるいは線形予測残差が供給さ
れている。オープンループピッチサーチ部１４１では、
入力信号のＬＰＣ残差をとってオープンループによる比
較的ラフなピッチのサーチが行われ、抽出された粗ピッ
チデータは高精度ピッチサーチ１４６に送られて、後述
するようなクローズドループによる高精度のピッチサー
チ（ピッチのファインサーチ）が行われる。また、オー
プンループピッチサーチ部１４１からは、上記粗ピッチ
データと共にＬＰＣ残差の自己相関の最大値をパワーで
正規化した正規化自己相関最大値ｒ(p) が取り出され、
Ｖ／ＵＶ（有声音／無声音）判定部１１５に送られてい
る。

【００３５】直交変換回路１４５では例えばＤＦＴ（離
散フーリエ変換）等の直交変換処理が施されて、時間軸
上のＬＰＣ残差が周波数軸上のスペクトル振幅データに
変換される。この直交変換回路１４５からの出力は、高
精度ピッチサーチ部１４６及びスペクトル振幅あるいは
エンベロープを評価するためのスペクトル評価部１４８
に送られる。

【００３６】高精度（ファイン）ピッチサーチ部１４６
には、オープンループピッチサーチ部１４１で抽出され
た比較的ラフな粗ピッチデータと、直交変換部１４５に
より例えばＤＦＴされた周波数軸上のデータとが供給さ
れている。この高精度ピッチサーチ部１４６では、上記
粗ピッチデータ値を中心に、0.２〜0.５きざみで±数サ
ンプルずつ振って、最適な小数点付き（フローティン
グ）のファインピッチデータの値へ追い込む。このとき
のファインサーチの手法として、いわゆる合成による分
析 (Analysis by Synthesis)法を用い、合成されたパワ
ースペクトルが原音のパワースペクトルに最も近くなる
ようにピッチを選んでいる。このようなクローズドルー
プによる高精度のピッチサーチ部１４６からのピッチデ
ータについては、スイッチ１１８を介して出力端子１０
４に送っている。

【００３７】スペクトル評価部１４８では、ＬＰＣ残差
の直交変換出力としてのスペクトル振幅及びピッチに基
づいて各ハーモニクスの大きさ及びその集合であるスペ
クトルエンベロープが評価され、高精度ピッチサーチ部
１４６、Ｖ／ＵＶ（有声音／無声音）判定部１１５及び
聴覚重み付きのベクトル量子化器１１６に送られる。

【００３８】Ｖ／ＵＶ（有声音／無声音）判定部１１５
は、直交変換回路１４５からの出力と、高精度ピッチサ
ーチ部１４６からの最適ピッチと、スペクトル評価部１
４８からのスペクトル振幅データと、オープンループピ
ッチサーチ部１４１からの正規化自己相関最大値ｒ(p)
と、ゼロクロスカウンタ１４２からのゼロクロスカウン
ト値とに基づいて、当該フレームのＶ／ＵＶ判定が行わ
れる。さらに、ＭＢＥの場合の各バンド毎のＶ／ＵＶ判
定結果の境界位置も当該フレームのＶ／ＵＶ判定の一条
件としてもよい。このＶ／ＵＶ判定部１１５からの判定
出力は、出力端子１０５を介して取り出される。

【００３９】ところで、スペクトル評価部１４８の出力
部あるいはベクトル量子化器１１６の入力部には、デー
タ数変換（一種のサンプリングレート変換）部が設けら
れている。このデータ数変換部は、上記ピッチに応じて
周波数軸上での分割帯域数が異なり、データ数が異なる
ことを考慮して、エンベロープの振幅データ｜Ａ_m｜を
一定の個数にするためのものである。すなわち、例えば
有効帯域を３４００ｋHzまでとすると、この有効帯域が
上記ピッチに応じて、８バンド〜６３バンドに分割され
ることになり、これらの各バンド毎に得られる上記振幅
データ｜Ａ_m｜の個数ｍ_MX＋１も８〜６３と変化するこ
とになる。このためデータ数変換部１１９では、この可
変個数ｍ_MX＋１の振幅データを一定個数Ｍ個、例えば４
４個、のデータに変換している。

【００４０】このスペクトル評価部１４８の出力部ある
いはベクトル量子化器１１６の入力部に設けられたデー
タ数変換部からの上記一定個数Ｍ個（例えば４４個）の
振幅データあるいはエンベロープデータが、ベクトル量
子化器１１６により、所定個数、例えば４４個のデータ
毎にまとめられてベクトルとされ、重み付きベクトル量
子化が施される。この重みは、聴覚重み付けフィルタ算
出回路１３９からの出力により与えられる。ベクトル量
子化器１１６からの上記エンベロープのインデクスは、
スイッチ１１７を介して出力端子１０３より取り出され
る。なお、上記重み付きベクトル量子化に先だって、所
定個数のデータから成るベクトルについて適当なリーク
係数を用いたフレーム間差分をとっておくようにしても
よい。

【００４１】次に、第２の符号化部１２０について説明
する。第２の符号化部１２０は、いわゆるＣＥＬＰ（符
号励起線形予測）符号化構成を有しており、特に、入力
音声信号の無声音部分の符号化のために用いられてい
る。この無声音部分用のＣＥＬＰ符号化構成において、
雑音符号帳、いわゆるストキャスティック・コードブッ
ク（stochastic code book）１２１からの代表値出力で
ある無声音のＬＰＣ残差に相当するノイズ出力を、ゲイ
ン回路１２６を介して、聴覚重み付きの合成フィルタ１
２２に送っている。重み付きの合成フィルタ１２２で
は、入力されたノイズをＬＰＣ合成処理し、得られた重
み付き無声音の信号を減算器１２３に送っている。減算
器１２３には、上記入力端子１０１からＨＰＦ（ハイパ
スフィルタ）１０９を介して供給された音声信号を聴覚
重み付けフィルタ１２５で聴覚重み付けした信号が入力
されており、合成フィルタ１２２からの信号との差分あ
るいは誤差を取り出している。なお、聴覚重み付けフィ
ルタ１２５の出力から聴覚重み付き合成フィルタの零入
力応答を事前に差し引いておくものとする。この誤差を
距離計算回路１２４に送って距離計算を行い、誤差が最
小となるような代表値ベクトルを雑音符号帳１２１でサ
ーチする。このような合成による分析（Analysisby Syn
thesis ）法を用いたクローズドループサーチを用いた
時間軸波形のベクトル量子化を行っている。

【００４２】このＣＥＬＰ符号化構成を用いた第２の符
号化部１２０からのＵＶ（無声音）部分用のデータとし
ては、雑音符号帳１２１からのコードブックのシェイプ
インデクスと、ゲイン回路１２６からのコードブックの
ゲインインデクスとが取り出される。雑音符号帳１２１
からのＵＶデータであるシェイプインデクスは、スイッ
チ１２７ｓを介して出力端子１０７ｓに送られ、ゲイン
回路１２６のＵＶデータであるゲインインデクスは、ス
イッチ１２７ｇを介して出力端子１０７ｇに送られてい
る。

【００４３】ここで、これらのスイッチ１２７ｓ、１２
７ｇ及び上記スイッチ１１７、１１８は、上記Ｖ／ＵＶ
判定部１１５からのＶ／ＵＶ判定結果によりオン／オフ
制御され、スイッチ１１７、１１８は、現在伝送しよう
とするフレームの音声信号のＶ／ＵＶ判定結果が有声音
（Ｖ）のときオンとなり、スイッチ１２７ｓ、１２７ｇ
は、現在伝送しようとするフレームの音声信号が無声音
（ＵＶ）のときオンとなる。

【００４４】次に、図４は、上記図２に示した本発明に
係る実施の形態としての音声信号復号化装置のより具体
的な構成を示している。この図４において、上記図２の
各部と対応する部分には、同じ指示符号を付している。

【００４５】この図４において、入力端子２０２には、
上記図１、３の出力端子１０２からの出力に相当するＬ
ＳＰのベクトル量子化出力、いわゆるコードブックのイ
ンデクスが供給されている。

【００４６】このＬＳＰのインデクスは、ＬＰＣパラメ
ータ再生部２１３のＬＳＰの逆ベクトル量子化器２３１
に送られてＬＳＰ（線スペクトル対）データに逆ベクト
ル量子化され、ＬＳＰ補間回路２３２、２３３に送られ
てＬＳＰの補間処理が施された後、ＬＳＰ→α変換回路
２３４、２３５でＬＰＣ（線形予測符号）のαパラメー
タに変換され、このαパラメータがＬＰＣ合成フィルタ
２１４に送られる。ここで、ＬＳＰ補間回路２３２及び
ＬＳＰ→α変換回路２３４は有声音（Ｖ）用であり、Ｌ
ＳＰ補間回路２３３及びＬＳＰ→α変換回路２３５は無
声音（ＵＶ）用である。またＬＰＣ合成フィルタ２１４
は、有声音部分のＬＰＣ合成フィルタ２３６と、無声音
部分のＬＰＣ合成フィルタ２３７とを分離している。す
なわち、有声音部分と無声音部分とでＬＰＣの係数補間
を独立に行うようにして、有声音から無声音への遷移部
や、無声音から有声音への遷移部で、全く性質の異なる
ＬＳＰ同士を補間することによる悪影響を防止してい
る。

【００４７】また、図４の入力端子２０３には、上記図
１、図３のエンコーダ側の端子１０３からの出力に対応
するスペクトルエンベロープ（Ａｍ）の重み付けベクト
ル量子化されたコードインデクスデータが供給され、入
力端子２０４には、上記図１、図３の端子１０４からの
ピッチのデータが供給され、入力端子２０５には、上記
図１、図３の端子１０５からのＶ／ＵＶ判定データが供
給されている。

【００４８】入力端子２０３からのスペクトルエンベロ
ープＡｍのベクトル量子化されたインデクスデータは、
逆ベクトル量子化器２１２に送られて逆ベクトル量子化
が施され、上記データ数変換に対応する逆変換が施され
て、スペクトルエンベロープのデータとなって、有声音
合成部２１１のサイン波合成回路２１５に送られてい
る。

【００４９】なお、エンコード時にスペクトルのベクト
ル量子化に先だってフレーム間差分をとっている場合に
は、ここでの逆ベクトル量子化後にフレーム間差分の復
号を行ってからデータ数変換を行い、スペクトルエンベ
ロープのデータを得る。

【００５０】サイン波合成回路２１５には、入力端子２
０４からのピッチ及び入力端子２０５からの上記Ｖ／Ｕ
Ｖ判定データが供給されている。サイン波合成回路２１
５からは、上述した図１、図３のＬＰＣ逆フィルタ１１
１からの出力に相当するＬＰＣ残差データが取り出さ
れ、これが加算器２１８に送られている。このサイン波
合成の具体的な手法については、例えば本件出願人が先
に提案した、特願平４−９１４２２号の明細書及び図
面、あるいは特願平６−１９８４５１号の明細書及び図
面に開示されている。

【００５１】また、逆ベクトル量子化器２１２からのエ
ンベロープのデータと、入力端子２０４、２０５からの
ピッチ、Ｖ／ＵＶ判定データとは、有声音（Ｖ）部分の
ノイズ加算のためのノイズ合成回路２１６に送られてい
る。このノイズ合成回路２１６からの出力は、重み付き
重畳加算回路２１７を介して加算器２１８に送ってい
る。これは、サイン波合成によって有声音のＬＰＣ合成
フィルタへの入力となるエクサイテイション（Excitati
on：励起、励振）を作ると、男声等の低いピッチの音で
鼻づまり感がある点、及びＶ（有声音）とＵＶ（無声
音）とで音質が急激に変化し不自然に感じる場合がある
点を考慮し、有声音部分のＬＰＣ合成フィルタ入力すな
わちエクサイテイションについて、音声符号化データに
基づくパラメータ、例えばピッチ、スペクトルエンベロ
ープ振幅、フレーム内の最大振幅、残差信号のレベル等
を考慮したノイズをＬＰＣ残差信号の有声音部分に加え
ているものである。

【００５２】加算器２１８からの加算出力は、ＬＰＣ合
成フィルタ２１４の有声音用の合成フィルタ２３６に送
られてＬＰＣの合成処理が施されることにより時間波形
データとなり、さらに有声音用ポストフィルタ２３８ｖ
でフィルタ処理された後、加算器２３９に送られる。

【００５３】次に、図４の入力端子２０７ｓ及び２０７
ｇには、上記図３の出力端子１０７ｓ及び１０７ｇから
のＵＶデータとしてのシェイプインデクス及びゲインイ
ンデクスがそれぞれ供給され、無声音合成部２２０に送
られている。端子２０７ｓからのシェイプインデクス
は、無声音合成部２２０の雑音符号帳２２１に、端子２
０７ｇからのゲインインデクスはゲイン回路２２２にそ
れぞれ送られている。雑音符号帳２２１から読み出され
た代表値出力は、無声音のＬＰＣ残差に相当するノイズ
信号成分であり、これがゲイン回路２２２で所定のゲイ
ンの振幅となり、窓かけ回路２２３に送られて、上記有
声音部分とのつなぎを円滑化するための窓かけ処理が施
される。

【００５４】窓かけ回路２２３からの出力は、無声音合
成部２２０からの出力として、ＬＰＣ合成フィルタ２１
４のＵＶ（無声音）用の合成フィルタ２３７に送られ
る。合成フィルタ２３７では、ＬＰＣ合成処理が施され
ることにより無声音部分の時間波形データとなり、この
無声音部分の時間波形データは無声音用ポストフィルタ
２３８ｕでフィルタ処理された後、加算器２３９に送ら
れる。

【００５５】加算器２３９では、有声音用ポストフィル
タ２３８ｖからの有声音部分の時間波形信号と、無声音
用ポストフィルタ２３８ｕからの無声音部分の時間波形
データとが加算され、出力端子２０１より取り出され
る。

【００５６】ところで、上記音声信号符号化装置では、
要求される品質に合わせ異なるビットレートの出力デー
タを出力することができ、出力データのビットレートが
可変されて出力される。

【００５７】具体的には、出力データのビットレート
を、低ビットレートと高ビットレートとに切り換えるこ
とができる。例えば、低ビットレートを２ｋbpsとし、
高ビットレートを６ｋbpsとする場合には、以下の表１
に示す各ビットレートのデータが出力される。

【００５８】

【表１】

【００５９】出力端子１０４からのピッチデータについ
ては、有声音時に、常に８bits／２０ｍsecで出力さ
れ、出力端子１０５から出力されるＶ／ＵＶ判定出力
は、常に１bit／２０ｍsecである。出力端子１０２から
出力されるＬＳＰ量子化のインデクスは、３２bits／４
０ｍsecと４８bits／４０ｍsecとの間で切り換えが行わ
れる。また、出力端子１０３から出力される有声音時
（Ｖ）のインデクスは、１５bits／２０ｍsecと８７bit
s／２０ｍsecとの間で切り換えが行われ、出力端子１０
７ｓ、１０７ｇから出力される無声音時（ＵＶ）のイン
デクスは、１１bits／１０ｍsecと２３bits／５ｍsecと
の間で切り換えが行われる。これにより、有声音時
（Ｖ）の出力データは、２ｋbpsでは４０bits／２０ｍs
ecとなり、６ｋbpsでは１２０bits／２０ｍsecとなる。
また、無声音時（ＵＶ）の出力データは、２ｋbpsでは
３９bits／２０ｍsecとなり、６ｋbpsでは１１７bits／
２０ｍsecとなる。

【００６０】尚、上記ＬＳＰ量子化のインデクス、有声
音時（Ｖ）のインデクス、及び無声音時（ＵＶ）のイン
デクスについては、後述する各部の構成と共に説明す
る。

【００６１】次に、図５及び図６を用いて、ＬＳＰ量子
化器１３４におけるマトリクス量子化及びベクトル量子
化について詳細に説明する。

【００６２】上述のように、ＬＰＣ分析回路１３２から
のαパラメータは、α→ＬＳＰ変換回路１３３に送られ
て、ＬＳＰパラメータに変換される。例えば、ＬＰＣ分
析回路１３２でＰ次のＬＰＣ分析を行う場合には、αパ
ラメータはＰ個算出される。このＰ個のαパラメータ
は、ＬＳＰパラメータに変換され、バッファ６１０に保
持される。

【００６３】このバッファ６１０からは、２フレーム分
のＬＳＰパラメータが出力される。２フレーム分のＬＳ
Ｐパラメータはマトリクス量子化部６２０でマトリクス
量子化される。マトリクス量子化部６２０は、第１のマ
トリクス量子化部６２０₁ と第２のマトリクス量子化部
６２０₂ とから成る。２フレーム分のＬＳＰパラメータ
は、第１のマトリクス量子化部６２０₁ でマトリクス量
子化され、これにより得られる量子化誤差が、第２のマ
トリクス量子化部６２０₂ でさらにマトリクス量子化さ
れる。これらのマトリクス量子化により、時間軸方向及
び周波数軸方向の相関を取り除く。

【００６４】マトリクス量子化部６２０₂ からの２フレ
ーム分の量子化誤差は、ベクトル量子化部６４０に入力
される。ベクトル量子化部６４０は、第１のベクトル量
子化部６４０₁ と第２のベクトル量子化部６４０₂ とか
ら成る。さらに、第１のベクトル量子化部６４０₁ は、
２つのベクトル量子化部６５０、６６０から成り、第２
のベクトル量子化部６４０₂ は、２つのベクトル量子化
部６７０、６８０から成る。第１のベクトル量子化部６
４０₁ のベクトル量子化部６５０、６６０で、マトリク
ス量子化部６２０からの量子化誤差が、それぞれ１フレ
ーム毎にベクトル量子化される。これにより得られる量
子化誤差ベクトルは、第２のベクトル量子化部６４０₂
のベクトル量子化部６７０、６８０で、さらにベクトル
量子化される。これらのベクトル量子化により、周波数
軸方向の相関を処理する。

【００６５】このように、マトリクス量子化を施す工程
を行うマトリクス量子化部６２０は、第１のマトリクス
量子化工程を行う第１のマトリクス量子化部６２０₁
と、この第１のマトリクス量子化による量子化誤差をマ
トリクス量子化する第２のマトリクス量子化工程を行う
第２のマトリクス量子化部６２０₂ とを少なくとも有
し、上記ベクトル量子化を施す工程を行うベクトル量子
化部６４０は、第１のベクトル量子化工程を行う第１の
ベクトル量子化部６４０₁ と、この第１のベクトル量子
化の際の量子化誤差ベクトルをベクトル量子化する第２
のベクトル量子化工程を行う第２のベクトル量子化部６
４０₂ とを少なくとも有する。

【００６６】次に、マトリクス量子化及びベクトル量子
化について具体的に説明する。

【００６７】バッファ６１０に保持された、２フレーム
分のＬＳＰパラメータ、すなわち１０×２の行列は、マ
トリクス量子化器６２０₁ に送られる。上記第１のマト
リクス量子化部６２０₁ では、２フレーム分のＬＳＰパ
ラメータが加算器６２１を介して重み付き距離計算器６
２３に送られ、最小となる重み付き距離が算出される。

【００６８】この第１のマトリクス量子化部６２０₁ に
よるコードブックサーチ時の歪尺度ｄ_MQ1は、ＬＳＰパ
ラメータＸ₁ 、量子化値Ｘ₁'を用い、（１）式で示す。

【００６９】

【数１】

【００７０】ここで、ｔはフレーム番号、ｉはＰ次元の
番号を示す。

【００７１】また、このときの、周波数軸方向及び時間
軸方向に重みの制限を考慮しない場合の重みｗを（２）
式で示す。

【００７２】

【数２】

【００７３】この（２）式の重みｗは、後段のマトリク
ス量子化及びベクトル量子化でも用いられる。

【００７４】算出された重み付き距離はマトリクス量子
化器（ＭＱ₁）６２２に送られて、マトリクス量子化が
行われる。このマトリクス量子化により出力される８ビ
ットのインデクスは信号切換器６９０に送られる。ま
た、マトリクス量子化による量子化値は、加算器６２１
で、バッファ６１０からの２フレーム分のＬＳＰパラメ
ータから減算される。重み付き距離計算器６２３では、
加算器６２１からの出力を用いて、重み付き距離が算出
される。このように、２フレーム毎に、順次、重み付き
距離計算器６２３では重み付き距離が算出されて、マト
リクス量子化器６２２でマトリクス量子化が行われる。
重み付き距離が最小となる量子化値が選ばれる。また、
加算器６２１からの出力は、第２のマトリクス量子化部
６２０₂ の加算器６３１に送られる。

【００７５】第２のマトリクス量子化部６２０₂ でも第
１のマトリクス量子化部６２０₁ と同様にして、マトリ
クス量子化を行う。上記加算器６２１からの出力は、加
算器６３１を介して重み付き距離計算器６３３に送ら
れ、最小となる重み付き距離が算出される。

【００７６】この第２のマトリクス量子化部６２０₂ に
よるコードブックサーチ時の歪尺度ｄ_MQ2 を、第１のマ
トリクス量子化部６２０₁ からの量子化誤差Ｘ₂ 、量子
化値Ｘ₂'により、（３）式で示す。

【００７７】

【数３】

【００７８】この重み付き距離はマトリクス量子化器
（ＭＱ₂）６３２に送られて、マトリクス量子化が行わ
れる。このマトリクス量子化により出力される８ビット
のインデクスは信号切換器６９０に送られる。また、マ
トリクス量子化による量子化値は、加算器６３１で、２
フレーム分の量子化誤差から減算される。重み付き距離
計算器６３３では、加算器６３１からの出力を用いて、
重み付き距離が順次算出されて、重み付き距離が最小と
なる量子化値が選ばれる。また、加算器６３１からの出
力は、第１のベクトル量子化部６４０₁ の加算器６５
１、６６１に１フレームずつ送られる。

【００７９】この第１のベクトル量子化部６４０₁ で
は、１フレーム毎にベクトル量子化が行われる。加算器
６３１からの出力は、１フレーム毎に、加算器６５１、
６６１を介して重み付き距離計算器６５３、６６３にそ
れぞれ送られ、最小となる重み付き距離が算出される。

【００８０】量子化誤差Ｘ₂と量子化値Ｘ₂'との差分
は、１０×２の行列であり、Ｘ₂−Ｘ₂’＝［ｘ _3-1，ｘ _3-2］と表すときの、この第１のベクトル量子化部６４０₁ の
ベクトル量子化器６５２、６６２によるコードブックサ
ーチ時の歪尺度ｄ_VQ1、ｄ_VQ2を、（４）、（５）式で示
す。

【００８１】

【数４】

【００８２】この重み付き距離はベクトル量子化器（Ｖ
Ｑ₁）６５２、ベクトル量子化器（ＶＱ₂）６６２にそ
れぞれ送られて、ベクトル量子化が行われる。このベク
トル量子化により出力される各８ビットのインデクスは
信号切換器６９０に送られる。また、ベクトル量子化に
よる量子化値は、加算器６５１、６６１で、入力された
２フレーム分の量子化誤差ベクトルから減算される。重
み付き距離計算器６５３、６６３では、加算器６５１、
６６１からの出力を用いて、重み付き距離が順次算出さ
れて、重み付き距離が最小となる量子化値が選ばれる。
また、加算器６５１、６６１からの出力は、第２のベク
トル量子化部６４０₂ の加算器６７１、６８１にそれぞ
れ送られる。

【００８３】ここで、ｘ _4-1 ＝ｘ _3-1−ｘ’_3-1 ｘ _4-2 ＝ｘ _3-2−ｘ’_３−２と表すときの、この第２のベクトル量子化部６４０_２
のベクトル量子化器６７２、６８２によるコードブック
サーチ時の歪尺度ｄ_VQ3、ｄ_VQ4を、（６）、（７）式で
示す。

【００８４】

【数５】

【００８５】この重み付き距離はベクトル量子化器（Ｖ
Ｑ₃）６７２、ベクトル量子化器（ＶＱ₄）６８２にそ
れぞれ送られて、ベクトル量子化が行われる。このベク
トル量子化により出力される各８ビットのインデクスは
信号切換器６９０に送られる。また、ベクトル量子化に
よる量子化値は、加算器６７１、６８１で、入力された
２フレーム分の量子化誤差ベクトルから減算される。重
み付き距離計算器６７３、６８３では、加算器６７１、
６８１からの出力を用いて、重み付き距離が順次算出さ
れて、重み付き距離が最小となる量子化値が選ばれる。

【００８６】また、コードブックの学習時には、上記各
歪尺度をもとにして、一般化ロイドアルゴリズム（ＧＬ
Ａ）により学習を行う。

【００８７】尚、コードブックサーチ時と学習時の歪尺
度は、異なる値であっても良い。

【００８８】上記マトリクス量子化器６２２、６３２、
ベクトル量子化器６５２、６６２、６７２、６８２から
の各８ビットのインデクスは、信号切換器６９０で切り
換えられて、出力端子６９１から出力される。

【００８９】具体的には、低ビットレート時には、上記
第１のマトリクス量子化工程を行う第１のマトリクス量
子化部６２０₁ 、上記第２のマトリクス量子化工程を行
う第２のマトリクス量子化部６２０₂ 、及び上記第１の
ベクトル量子化工程を行う第１のベクトル量子化部６４
０₁ での出力を取り出し、高ビットレート時には、上記
低ビットレート時の出力に上記第２のベクトル量子化工
程を行う第２のベクトル量子化部６４０₂ での出力を合
わせて取り出す。

【００９０】これにより、２ｋbps 時には、３２bits／
４０ｍsec のインデクスが出力され、６ｋbps 時には、
４８bits／４０ｍsec のインデクスが出力される。

【００９１】また、上記マトリクス量子化部６２０及び
上記ベクトル量子化部６４０では、上記ＬＰＣ係数を表
現するパラメータの持つ特性に合わせた、周波数軸方向
又は時間軸方向、あるいは周波数軸及び時間軸方向に制
限を持つ重み付けを行う。

【００９２】先ず、ＬＳＰパラメータの持つ特性に合わ
せた、周波数軸方向に制限を持つ重み付けについて説明
する。例えば、次数Ｐ＝１０とするとき、ＬＳＰパラメ
ータｘ（ｉ）を、低域、中域、高域の３つの領域とし
て、Ｌ₁＝｛ｘ（ｉ）｜１≦ｉ≦２｝Ｌ₂＝｛ｘ（ｉ）｜３≦ｉ≦６｝Ｌ₃＝｛ｘ（ｉ）｜７≦ｉ≦１０｝とグループ化する。そして、各グループＬ₁、Ｌ₂、Ｌ₃
の重み付けを１／４、１／２、１／４とすると、各グル
ープＬ₁、Ｌ₂、Ｌ₃ の周波数軸方向のみに制限を持つ重
みは、（８）、（９）、（１０）式となる。

【００９３】

【数６】

【００９４】これにより、各ＬＳＰパラメータの重み付
けは、各グループ内でのみ行われ、その重みは各グルー
プに対する重み付けで制限される。

【００９５】ここで、時間軸方向からみると、各フレー
ムの重み付けの総和は、必ず１となるので、時間軸方向
の制限は１フレーム単位である。この時間軸方向のみに
制限を持つ重みは、（１１）式となる。

【００９６】

【数７】

【００９７】この（１１）式により、周波数軸方向での
制限のない、フレーム番号ｔ＝０，１の２つのフレーム
間で、重み付けが行われる。この時間軸方向にのみ制限
を持つ重み付けは、マトリクス量子化を行う２フレーム
間で行う。

【００９８】また、学習時には、学習データとして用い
る全ての音声フレーム、即ち全データのフレーム数Ｔに
ついて、（１２）式により、重み付けを行う。

【００９９】

【数８】

【０１００】また、周波数軸方向及び時間軸方向に制限
を持つ重み付けについて説明する。例えば、次数Ｐ＝１
０とするとき、ＬＳＰパラメータｘ（ｉ，ｔ）を、低
域、中域、高域の３つの領域として、Ｌ₁＝｛ｘ（ｉ，ｔ）｜１≦ｉ≦２，０≦ｔ≦１｝Ｌ₂＝｛ｘ（ｉ，ｔ）｜３≦ｉ≦６，０≦ｔ≦１｝Ｌ₃＝｛ｘ（ｉ，ｔ）｜７≦ｉ≦１０，０≦ｔ≦１｝とグループ化する。各グループＬ₁、Ｌ₂、Ｌ₃ の重み付
けを１／４、１／２、１／４とすると、各グループ
Ｌ₁、Ｌ₂、Ｌ₃ の周波数軸方向及び時間軸方向に制限を
持つ重み付けは、（１３）、（１４）、（１５）式とな
る。

【０１０１】

【数９】

【０１０２】この（１３）、（１４）、（１５）式によ
り、周波数軸方向では３つの帯域毎に、時間軸方向では
マトリクス量子化を行う２フレーム間に重み付けの制限
を加えた重み付けを行う。これは、コードブックサーチ
時及び学習時共に有効となる。

【０１０３】また、学習時においては、全データのフレ
ーム数について重み付けを行う。ＬＳＰパラメータｘ
（ｉ，ｔ）を、低域、中域、高域の３つの領域として、Ｌ₁ ＝｛ｘ（ｉ，ｔ）｜１≦ｉ≦２，０≦ｔ≦Ｔ｝Ｌ₂ ＝｛ｘ（ｉ，ｔ）｜３≦ｉ≦６，０≦ｔ≦Ｔ｝Ｌ₃ ＝｛ｘ（ｉ，ｔ）｜７≦ｉ≦１０，０≦ｔ≦Ｔ｝とグループ化し、各グループＬ₁、Ｌ₂、Ｌ₃ の重み付け
を１／４、１／２、１／４とすると、各グループＬ₁、
Ｌ₂、Ｌ₃ の周波数軸方向及び時間軸方向に制限を持つ
重み付けは、（１６）、（１７）、（１８）式となる。

【０１０４】

【数１０】

【０１０５】この（１６）、（１７）、（１８）式によ
り、周波数軸方向では３つの帯域毎に重み付けを行い、
時間軸方向では全フレーム間で重み付けを行うことがで
きる。

【０１０６】さらに、上記マトリクス量子化部６２０及
び上記ベクトル量子化部６４０では、上記ＬＳＰパラメ
ータの変化の大きさに応じて重み付けを行う。音声フレ
ーム全体においては少数フレームとなる、Ｖ→ＵＶ、Ｕ
Ｖ→Ｖの遷移（トランジェント）部において、子音と母
音との周波数特性の違いから、ＬＳＰパラメータは大き
く変化する。そこで、（１９）式に示す重みを、上述の
重みｗ’（ｉ，ｔ）に乗算することにより、上記遷移部
を重視する重み付けを行うことができる。

【０１０７】

【数１１】

【０１０８】尚、（１９）式の代わりに、（２０）式を
用いることも考えられる。

【０１０９】

【数１２】

【０１１０】このように、ＬＳＰ量子化器１３４では、
２段のマトリクス量子化及び２段のベクトル量子化を行
うことにより、出力するインデクスのビット数を可変に
することができる。

【０１１１】次に、上記図１、図３のベクトル量子化部
１１６の基本構成を図７に、図７のベクトル量子化部の
より具体的な構成を図８にそれぞれ示し、ベクトル量子
化部１１６におけるスペクトルエンベロープ（Ａｍ）の
重み付きベクトル量子化の具体例について説明する。

【０１１２】先ず、図３の音声信号符号化装置におい
て、スペクトル評価部１４８の出力側あるいはベクトル
量子化器１１６の入力側に設けられたスペクトルエンベ
ロープの振幅のデータ数を一定個数にするデータ数変換
の具体例について説明する。

【０１１３】このデータ数変換には種々の方法が考えら
れるが、本実施の形態においては、例えば、周波数軸上
の有効帯域１ブロック分の振幅データに対して、ブロッ
ク内の最後のデータからブロック内の最初のデータまで
の値を補間するようなダミーデータ、あるいはブロック
の最後のデータ、最初のデータを繰り返すような所定の
データを付加してデータ個数をＮ_F個に拡大した後、帯
域制限型のＯ_S倍（例えば８倍）のオーバーサンプリン
グを施すことによりＯ_S倍の個数の振幅データを求め、
このＯ_S倍の個数（（ｍ_MX＋１）×Ｏ_S個）の振幅デー
タを直線補間してさらに多くのＮ_M個（例えば２０４８
個）に拡張し、このＮ_M個のデータを間引いて上記一定
個数Ｍ（例えば４４個）のデータに変換している。実際
には、最終的に必要なＭ個のデータを作成するのに必要
なデータのみをオーバーサンプリング及び直線補間で算
出しており、Ｎ_M個のデータを全て求めてはいない。

【０１１４】図３の重み付きベクトル量子化を行うベク
トル量子化器１１６は、図７に示すように、第１のベク
トル量子化工程を行う第１のベクトル量子化部５００
と、この第１のベクトル量子化部５００における第１の
ベクトル量子化の際の量子化誤差ベクトルを量子化する
第２のベクトル量子化工程を行う第２のベクトル量子化
部５１０とを少なくとも有する。この第１のベクトル量
子化部５００は、いわゆる１段目のベクトル量子化部で
あり、第２のベクトル量子化部５１０は、いわゆる２段
目のベクトル量子化部である。

【０１１５】第１のベクトル量子化部５００の入力端子
５０１には、スペクトル評価部１４８の出力ベクトル
ｘ、即ち一定個数Ｍのエンベロープデータが入力され
る。この出力ベクトルｘは、ベクトル量子化器５０２で
重み付きベクトル量子化される。これにより、ベクトル
量子化器５０２から出力されるシェイプインデクスは出
力端子５０３から出力され、また、量子化値ｘ ₀'は出力
端子５０４から出力されると共に、加算器５０５、５１
３に送られる。加算器５０５では、ソースベクトルｘか
ら量子化値ｘ ₀'が減算されて、量子化誤差ベクトルｙが
得られる。

【０１１６】この量子化誤差ベクトルｙは、第２のベク
トル量子化部５１０内のベクトル量子化部５１１に送ら
れる。このベクトル量子化部５１１は、複数個のベクト
ル量子化器で構成され、図７では、２個のベクトル量子
化器５１１₁、５１１₂から成る。量子化誤差ベクトルｙ
は次元分割されて、２個のベクトル量子化器５１１₁、
５１１₂で、それぞれ重み付きベクトル量子化される。
これらのベクトル量子化器５１１₁、５１１₂から出力さ
れるシェイプインデクスは、出力端子５１２₁、５１２₂
からそれぞれ出力され、また、量子化値ｙ ₁’、ｙ ₂’は
次元方向に接続されて、加算器５１３に送られる。この
加算器５１３では、量子化値ｙ ₁’、ｙ ₂’と量子化値ｘ
₀’とが加算されて、量子化値ｘ ₁’が生成される。この
量子化値ｘ ₁’は出力端子５１４から出力される。

【０１１７】これにより、低ビットレート時には、上記
第１のベクトル量子化部５００による第１のベクトル量
子化工程での出力を取り出し、高ビットレート時には、
上記第１のベクトル量子化工程での出力及び上記第２の
量子化部５１０による第２のベクトル量子化工程での出
力を取り出す。

【０１１８】具体的には、図８に示すように、ベクトル
量子化器１１６内の第１のベクトル量子化部５００のベ
クトル量子化器５０２は、Ｌ次元、例えば４４次元の２
ステージ構成としている。

【０１１９】すなわち、４４次元でコードブックサイズ
が３２のベクトル量子化コードブックからの出力ベクト
ルの和に、ゲインｇ_iを乗じたものを、４４次元のスペ
クトルエンベロープベクトルｘの量子化値ｘ ₀’として
使用する。これは、図８に示すように、２つのシェイプ
コードブックをＣＢ０、ＣＢ１とし、その出力ベクトル
をｓ _0i、ｓ _1j、ただし０≦ｉ，ｊ≦３１、とする。ま
た、ゲインコードブックＣＢｇの出力をｇ_l、ただし０
≦ｌ≦３１、とする。ｇ_lはスカラ値である。この最終
出力ｘ ₀'は、ｇ_i（ｓ _0i＋ｓ _1j）となる。

【０１２０】ＬＰＣ残差について上記ＭＢＥ分析によっ
て得られたスペクトルエンベロープＡｍを一定次元に変
換したものをｘとする。このとき、ｘをいかに効率的に
量子化するかが重要である。

【０１２１】ここで、量子化誤差エネルギＥを、Ｅ＝‖Ｗ｛Ｈｘ−Ｈｇ_l（ｓ _0i＋ｓ _1j）｝‖² ・・・（２１）＝‖ＷＨ｛ｘ−ｇ_l（ｓ _0i＋ｓ _1j）｝‖² と定義する。この（２１）式において、ＨはＬＰＣの
合成フィルタの周波数軸上での特性であり、Ｗは聴覚
重み付けの周波数軸上での特性を表す重み付けのための
行列である。

【０１２２】行列Ｈは、現フレームのＬＰＣ分析結果
によるαパラメータを、α_i（１≦ｉ≦Ｐ）として、

【０１２３】

【数１３】

【０１２４】の周波数特性からＬ次元、例えば４４次元
の各対応する点の値をサンプルしたものである。

【０１２５】算出手順としては、一例として、１、
α₁、α₂、・・・、α_pに０詰めして、すなわち、１、
α₁、α₂、・・・、α_p、０、０、・・・、０として、
例えば２５６点のデータにする。その後、２５６点ＦＦ
Ｔを行い、（re²＋im²）^1/2を０〜πに対応する点に対
して算出して、その逆数をとる。それをＬ点、すなわち
例えば４４点に間引いたものを対角要素とする行列を、

【０１２６】

【数１４】

【０１２７】とする。

【０１２８】聴覚重み付け行列Ｗは、以下のように求
められる。

【０１２９】

【数１５】

【０１３０】この（２３）式で、α_iは入力のＬＰＣ分
析結果である。また、λa、λbは定数であり、一例とし
て、λa＝０．４、λb＝０．９が挙げられる。

【０１３１】行列あるいはマトリクスＷは、上記（２
３）式の周波数特性から算出できる。一例として、１、
α₁λb、α₂λb²、・・・、α_pλb^p、０、０、・・・、
０として２５６点のデータとしてＦＦＴを行い、０以上
π以下の区間に対して（re²[ｉ]＋im²[ｉ]）^1/2、０≦
ｉ≦１２８、を求める。次に、１、α₁λa、α₂λa²、
・・・、α_pλa^p 、０、０、・・・、０として分母の周
波数特性を２５６点ＦＦＴで０〜πの区間を１２８点で
算出する。これを（re'²[ｉ]＋im'²[ｉ]）^1/2、０≦ｉ
≦１２８、とする。

【０１３２】

【数１６】

【０１３３】として、上記（２３）式の周波数特性が求
められる。

【０１３４】これをＬ次元、例えば４４次元ベクトルの
対応する点について、以下の方法で求める。より正確に
は、直線補間を用いるべきであるが、以下の例では最も
近い点の値で代用している。

【０１３５】すなわち、 ω[ｉ]＝ω₀［nint(128ｉ/L)］１≦ｉ≦Ｌただし、nint（Ｘ）は、Ｘに最も近い整数を返す関数である。

【０１３６】また、上記Ｈに関しても同様の方法で、
h(1)、h(2)、・・・、h(L)を求めている。すなわち、

【０１３７】

【数１７】

【０１３８】となる。

【０１３９】ここで、他の例として、ＦＦＴの回数を減
らすのに、Ｈ(ｚ)Ｗ(ｚ)を先に求めてから、周波数特性
を求めてもよい。すなわち、

【０１４０】

【数１８】

【０１４１】この（２５）式の分母を展開した結果を、

【０１４２】

【数１９】

【０１４３】とする。ここで、１、β₁、β₂、・・・、
β_2p、０、０、・・・、０として、例えば２５６点のデ
ータにする。その後、２５６点ＦＦＴを行い、振幅の周
波数特性を、

【０１４４】

【数２０】

【０１４５】とする。これより、

【０１４６】

【数２１】

【０１４７】これをＬ次元ベクトルの対応する点につい
て求める。上記ＦＦＴのポイント数が少ない場合は、直
線補間で求めるべきであるが、ここでは最寄りの値を使
用している。すなわち、

【０１４８】

【数２２】

【０１４９】である。これを対角要素とする行列を
Ｗ’とすると、

【０１５０】

【数２３】

【０１５１】となる。（２６）式は上記（２４）式と同
一のマトリクスとなる。

【０１５２】あるいは、（２５）式より直接｜Ｈ（exp
(jω)）Ｗ（exp(jω)）｜をω＝ｉπ／Ｌ（ただし、１
≦ｉ≦Ｌ）に関して算出したものをwh[i] に使用しても
よい。又は、（２５）式のインパルス応答を適当な長さ
（例えば４０点）求めて、それを用いてＦＦＴして振幅
周波数特性を求めて使用してもよい。

【０１５３】このマトリクス、すなわち重み付き合成フ
ィルタの周波数特性を用いて、上記（２１）式を書き直
すと、

【０１５４】

【数２４】

【０１５５】となる。

【０１５６】ここで、シェイプコードブックとゲインコ
ードブックの学習法について説明する。

【０１５７】先ず、ＣＢ０に関しコードベクトルｓ _0cを
選択する全てのフレームｋに関して歪の期待値を最小化
する。そのようなフレームがＭ個あるとして、

【０１５８】

【数２５】

【０１５９】を最小化すればよい。この（２８）式中
で、Ｗ_k'はｋ番目のフレームに対する重み、ｘ _kはｋ
番目のフレームの入力、ｇ_kはｋ番目のフレームのゲイ
ン、ｓ _1kはｋ番目のフレームについてのコードブックＣ
Ｂ１からの出力、をそれぞれ示す。

【０１６０】この（２８）式を最小化するには、

【０１６１】

【数２６】

【０１６２】

【数２７】

【０１６３】次に、ゲインに関しての最適化を考える。

【０１６４】ゲインのコードワードｇ_cを選択するｋ番
目のフレームに関しての歪の期待値Ｊ_gは、

【０１６５】

【数２８】

【０１６６】上記（３１）式及び（３２）式は、シェイ
プｓ _0i、ｓ _1j及びゲインｇ_l、０≦ｉ≦３１、０≦ｊ≦
３１、０≦ｌ≦３１の最適なセントロイドコンディショ
ン(Centroid Condition)、すなわち最適なデコーダ出力
を与えるものである。なお、ｓ _1jに関してもｓ _0iと同様
に求めることができる。

【０１６７】次に、最適エンコード条件（Nearest Neig
hbour Condition ）を考える。

【０１６８】歪尺度を求める上記（２７）式、すなわ
ち、Ｅ＝‖Ｗ'（ｘ−ｇ_l（ｓ _0i＋ｓ _1j））‖² を最小化するｓ _0i、ｓ _1jを、入力ｘ、重みマトリクス
Ｗ' が与えられる毎に、すなわち毎フレームごとに決
定する。

【０１６９】このようなコードブックサーチは、本来
は、総当り的に全てのｇ_l （０≦ｌ≦３１）、ｓ _0i（０
≦ｉ≦３１）、ｓ _1j（０≦ｊ≦３１）の組み合せの、３
２×３２×３２＝３２７６８通りについてＥを求めて、
最小のＥを与えるｇ_l 、ｓ _0i、ｓ _1jの組を求めるべきで
あるが、膨大な演算量となるので、本実施の形態では、
シェイプとゲインのシーケンシャルサーチを行ってい
る。なお、ｓ _0iとｓ _1jとの組み合せについては、総当り
サーチを行うものとする。これは、３２×３２＝１０２
４通りである。以下の説明では、簡単化のため、ｓ _0i＋
ｓ _1jをｓ _mと記す。

【０１７０】上記（２７）式は、Ｅ＝‖Ｗ'（ｘ−ｇ_l
ｓ _m）‖² となる。さらに簡単のため、ｘ _w＝Ｗ'ｘ、
ｓ _w＝Ｗ'ｓ _mとすると、

【０１７１】

【数２９】

【０１７２】となる。従って、ｇ_l の精度が充分にとれ
ると仮定すると、

【０１７３】

【数３０】

【０１７４】という２つのステップに分けてサーチする
ことができる。元の表記を用いて書き直すと、

【０１７５】

【数３１】

【０１７６】となる。この（３５）式が最適エンコード
条件(Nearest Neighbour Condition)である。

【０１７７】次に、このようなベクトル量子化のコード
ブックサーチ（符号帳検索）を行う場合の演算量につい
てさらに考察する。

【０１７８】先ず、上記（３５）式の（１）’の演算量
は、ｓ _0i及びｓ _1jの次元をＫ、コードブックＣＢ０、Ｃ
Ｂ１のサイズをそれぞれＬ₀、Ｌ₁、すなわち０≦ｉ＜Ｌ₀、０≦ｊ＜Ｌ₁ とし、分子の加算、積和、２乗の各演算量をそれぞれ
１、分母の積、積和の各演算量をそれぞれ１として、概
略、分子：Ｌ₀・Ｌ₁・｛Ｋ・（１＋１）＋１｝分母：Ｌ₀・Ｌ₁・Ｋ・（１＋１）大小比較：Ｌ₀・Ｌ₁ となり、計Ｌ₀・Ｌ₁（４Ｋ＋２）となる。ここで、Ｌ₀
＝Ｌ₁＝３２、Ｋ＝４４とすると、演算量は、１８２２
７２程度のオーダーとなる。

【０１７９】そこで、上記（３５）式の（１）’の演算
を全て実行せずに、ｓ _0i及びｓ _1jに関してＰ個ずつ予備
選択（プリセレクション）を行う。なお、ここでは、負
のゲインエントリを考えていない（許していない）た
め、上記（３５）式の（２）’の分子の値は常に正の数
となるように、上記（３５）式の（１）’のサーチを行
う。すなわち、ｘ ^tＷ'^tＷ'（ｓ _0i＋ｓ _1j）の極性
込みで、上記（３５）式の（１）’の最大化を行う。

【０１８０】このような予備選択方法の具体例について
説明すると、先ず、（手順１）ｘ ^tＷ'^tＷ'ｓ _0iを最大にするｓ _0iを上位
からＰ₀ 個選択（手順２）ｘ ^tＷ'^tＷ'ｓ _1jを最大にするｓ _1iを上位
からＰ₁ 個選択（手順３）これらＰ₀個のｓ _0iとＰ₁個のｓ _1jの全ての組
み合わせについて、上記（３５）式の（１）’の式を評
価という方法が挙げられる。

【０１８１】これは、上記（３５）式の（１）’の式の
平方根である、

【０１８２】

【数３２】

【０１８３】の評価において、分母、すなわちｓ _0i＋ｓ
_1jの重み付きノルムが、ｉ、ｊによらずほぼ一定という
仮定が成立するときに有効である。実際には上記（ａ
１）式の分母の大きさは一定ではないが、これを考慮し
た予備選択方法については、後述する。

【０１８４】ここでは、上記（ａ１）式の分母が一定と
仮定した場合の演算量の削減効果を説明する。上記（手
順１）のサーチにＬ₀・Ｋの演算量を要し、大小比較
に、（Ｌ₀−１）＋（Ｌ₀−２）＋・・・＋（Ｌ₀−Ｐ₀）＝Ｐ₀・Ｌ₀ − Ｐ₀（１＋Ｐ₀）／２を要するから、演算量の計は、Ｌ₀（Ｋ＋Ｐ₀）−Ｐ
₀（１＋Ｐ₀）／２となる。また、上記（手順２）にも同
様の処理量が必要であり、これらを合計して、予備選択
のための演算処理量は、 L₀(K+P₀)＋L₁(K+P₁)−P₀(1+P₀)/2−P₁(1+P₁)/2 となる。

【０１８５】また、上記（手順３）の本選択の処理につ
いては、上記（３５）式の（１）’の演算に関して、分子：Ｐ₀・Ｐ₁・（１＋Ｋ＋１）分母：Ｐ₀・Ｐ₁・Ｋ・（１＋１）大小比較：Ｐ₀・Ｐ₁ となり、計Ｐ₀・Ｐ₁（３Ｋ＋３）となる。

【０１８６】例えば、Ｐ₀＝Ｐ₁＝６、Ｌ₀＝Ｌ₁＝３２、
Ｋ＝４４とすると、演算量は、本選択で４８６０、予備
選択で３１５８となり、計８０１８程度のオーダーとな
る。また、予備選択の個数をそれぞれ１０個にまで増や
してＰ₀＝Ｐ₁＝１０としても、本選択で１３５００、予
備選択で３３４６となり、１６８４６程度のオーダーと
なる。

【０１８７】このように、予備選択するベクトルの個数
を各コードブックそれぞれ１０個ずつとした場合でも、
前述した全てを演算する場合の１８２２７２と比較し
て、１６８４６／１８２２７２となり、元の約１／１０以下の演算量に抑えることがで
きる。

【０１８８】ところで、上記（３５）式の（１）’の式
の分母の大きさは一定ではなく、選択されたコードベク
トルに依存して大小変化する。そこで、ある程度このノ
ルムの概略の大きさを考慮した予備選択（プリセレクシ
ョン）方法について、以下に説明する。

【０１８９】上記（３５）式の（１）’の式の平方根で
ある上記（ａ１）式の最大値を求める場合に、

【０１９０】

【数３３】

【０１９１】であることを考慮して、この（ａ２）式の
左辺を最大化すればよい。そこで、この左辺を

【０１９２】

【数３４】

【０１９３】のように展開して、この（ａ３）式の第１
項、第２項をそれぞれ最大化する。

【０１９４】上記（ａ３）式の第１項の分子はｓ _0iのみ
の関数なので、ｓ _0iに関しての最大化を考える。また上
記（ａ３）式の第２項の分子はｓ _1jのみの関数なので、
ｓ _1jに関しての最大化を考える。すなわち、

【０１９５】

【数３５】

【０１９６】において、（手順１）上記（ａ４）式を最大化するものの上位から
Ｑ₀ 個のｓ _0iを選択（手順２）上記（ａ５）式を最大化するものの上位から
Ｑ₁ 個のｓ _1jを選択（手順３）選択されたＱ₀個のｓ _0iとＱ₁個のｓ _1jの全て
の組み合わせについて、上記（３５）式の（１）’の式
を評価という方法が挙げられる。

【０１９７】なお、Ｗ’＝ＷＨ／‖ｘ‖であり、
ＷもＨも入力ベクトルｘの関数であり、当然Ｗ’
も入力ベクトルｘの関数となる。

【０１９８】従って、本来は入力ベクトルｘ毎にＷ’
を算出し、上記（ａ４）、（ａ５）式の分母を計算すべ
きであるが、ここでは予備選択なのであまり演算処理量
を費やしたくない。そこで、これらの分母については、
典型的な、すなわち代表的なＷ’の値を用いて事前に
各ｓ _0i、ｓ _1jについて計算した値を、ｓ _0i、ｓ _1jと共に
テーブルに格納しておく。なお、実際のサーチ演算で割
り算をすることは処理が重いので、

【０１９９】

【数３６】

【０２００】の（ａ６）、（ａ７）式の値を格納してお
く。ここで、Ｗ^* は、次の（ａ８）式に示すものであ
る。

【０２０１】

【数３７】

【０２０２】図９は、上記Ｗ^* を下記の（ａ10）式で
記述したときの各Ｗ[0]〜Ｗ[43] の具体例を示すもので
ある。

【０２０３】

【数３８】

【０２０４】上記（ａ４）、（ａ５）式の分子について
は、Ｗ’を入力ベクトルｘ毎に算出して使用する。こ
れは、いずれにせよｓ _0i、ｓ _1jとｘとの内積を算出せね
ばならないので、ｘ ^tＷ'^tＷ'を一度計算しておけば
演算量増加はごく僅かであることを考慮したものであ
る。

【０２０５】このような予備選択方法に要する演算量の
概略を見積もると、上記（手順１）のサーチでは、Ｌ₀
（Ｋ＋１）の演算量を要し、大小比較に、Ｑ₀・Ｌ₀ − Ｑ₀（１＋Ｑ₀）／２を要する。また、上記（手順２）にも同様の処理量が必
要であり、これらを合計して、予備選択のための演算処
理量は、 L₀(K+Q₀+1)＋L₁(K+Q₁+1)−Q₀(1+Q₀)/2−Q₁(1+Q₁)/2 となる。

【０２０６】また、上記（手順３）の本選択の処理につ
いては、上記（３５）式の（１）’の演算に関して、分子：Ｑ₀・Ｑ₁・（１＋Ｋ＋１）分母：Ｑ₀・Ｑ₁・Ｋ・（１＋１）大小比較：Ｑ₀・Ｑ₁ となり、計Ｑ₀・Ｑ₁（３Ｋ＋３）となる。

【０２０７】例えば、Ｑ₀＝Ｑ₁＝６、Ｌ₀＝Ｌ₁＝３２、
Ｋ＝４４とすると、演算量は、本選択で４８６０、予備
選択で３２２２となり、計８０８２程度のオーダーとな
る。また、予備選択の個数をそれぞれ１０個にまで増や
してＱ₀＝Ｑ₁＝１０としても、本選択で１３５００、予
備選択で３４１０となり、１６９１０程度のオーダーと
なる。

【０２０８】これらの計算結果は、上述した重み付きノ
ルムで割り込まない（ノーマライズ無し）場合のＰ₀＝
Ｐ₁＝６としたときの演算量の、計８０１８程度のオー
ダーや、Ｐ₀＝Ｐ₁＝１０としたときの１６８４６程度の
オーダーとほぼ同程度の値であり、予備選択するベクト
ルの個数を各コードブックそれぞれ１０個ずつとした場
合でも、前述した全てを演算する場合の１８２２７２と
比較して、１６９１０／１８２２７２となり、元の約１／１０以下の演算量に抑えることがで
きる。

【０２０９】以上説明したような予備選択を行わないで
分析・合成した音声を基準として、予備選択を行った場
合のＳＮＲ（ＳＮ比）と、２０msecセグメントのときの
セグメンタルＳＮＲとについて具体例を示すと、ノーマ
ライズ無しＰ₀＝Ｐ₁＝６のときのＳＮＲ：１４．８（ｄ
Ｂ）、セグメンタルＳＮＲ：１７．５（ｄＢ）に比べ
て、同じ予備選択個数でノーマライズ有り、重み無しの
とき、ＳＮＲ：１６．８（ｄＢ）、セグメンタルＳＮ
Ｒ：１８．７（ｄＢ）となり、重み付きノーマライズ有
りのとき、ＳＮＲ：１７．８（ｄＢ）、セグメンタルＳ
ＮＲ：１９．６（ｄＢ）となる。このように、ノーマラ
イズ無しから、重み付きノーマライズ有りとすること
で、２〜３ｄＢだけＳＮＲ、セグメンタルＳＮＲが向上
している。

【０２１０】ここで上記（３１）、（３２）式の条件
（Centroid Condition）と、（３５）式の条件を用い
て、ＬＢＧ（Linde-Buzo-Gray）アルゴリズム、いわゆ
る一般化ロイドアルゴリズム（Generalized Lloyd Algo
rithm:ＧＬＡ）によりコードブック（ＣＢ０、ＣＢ１、
ＣＢｇ）を同時にトレーニングできる。

【０２１１】なお、本実施の形態では、Ｗ’として、
入力ｘのノルムで割り込んだＷ’を使用している。す
なわち、上記（３１）、（３２）、（３５）式におい
て、事前にＷ’にＷ’／‖ｘ‖を代入して使用して
いる。

【０２１２】あるいは別法として、ベクトル量子化器１
１６でのベクトル量子化の際の聴覚重み付けに用いられ
る重みＷ’については、上記（２６）式で定義されて
いるが、過去のＷ’も加味して現在のＷ’を求める
ことにより、テンポラルマスキングも考慮したＷ’を
求めてもよい。

【０２１３】上記（２６）式中のwh(1),wh(2),・・・,w
h(L)に関して、時刻ｎ、すなわち第ｎフレームで算出さ
れたものをそれぞれwh_n(1),wh_n(2),・・・,wh_n(L) とす
る。

【０２１４】時刻ｎで過去の値を考慮した重みをＡ
_n(i)、１≦ｉ≦Ｌと定義すると、

【０２１５】

【数３９】

【０２１６】とする。ここで、λは例えばλ＝０．２と
すればよい。このようにして求められたＡ_n(i)、１≦ｉ
≦Ｌについて、これを対角要素とするマトリクスを上
記重みとして用いればよい。

【０２１７】このように重み付きベクトル量子化により
得られたシェイプインデクスｓ _0i、ｓ _1jは、出力端子５
２０、５２２からそれぞれ出力され、ゲインインデクス
ｇ_lは、出力端子５２１から出力される。また、量子化
値ｘ ₀'は、出力端子５０４から出力されると共に、加算
器５０５に送られる。

【０２１８】この加算器５０５では、スペクトルエンベ
ロープベクトルｘから量子化値ｘ ₀'が減算されて、量子
化誤差ベクトルｙが生成される。この量子化誤差ベクト
ルｙは、具体的には、８個のベクトル量子化器５１１₁
〜５１１₈から成るベクトル量子化部５１１に送られ
て、次元分割され、各ベクトル量子化器５１１₁〜５１
１₈で重み付きのベクトル量子化が施される。

【０２１９】第２のベクトル量子化部５１０では、第１
のベクトル量子化部５００と比較して、かなり多くのビ
ット数を用いるため、コードブックのメモリ容量及びコ
ードブックサーチのための演算量（Complexity）が非常
に大きくなり、第１のベクトル量子化部５００と同じ４
４次元のままでベクトル量子化を行うことは、不可能で
ある。そこで、第２のベクトル量子化部５１０内のベク
トル量子化部５１１を複数個のベクトル量子化器で構成
し、入力される量子化値を次元分割して、複数個の低次
元ベクトルとして、重み付きのベクトル量子化を行う。

【０２２０】ベクトル量子化器５１１₁〜５１１₈で用い
る各量子化値ｙ ₀〜ｙ ₇と、次元数と、ビット数との関係
を、表２に示す。

【０２２１】

【表２】

【０２２２】ベクトル量子化器５１１₁〜５１１₈から出
力されるインデクスＩdvq₀〜Ｉdvq₇は、各出力端子５２
３₁〜５２３₈からそれぞれ出力される。これらのインデ
クスの合計は７２ビットである。

【０２２３】また、ベクトル量子化器５１１₁〜５１１₈
から出力される量子化値ｙ ₀’〜ｙ ₇’を次元方向に接続
した値をｙ’とすると、加算器５１３では、量子化値
ｙ’と量子化値ｘ ₀’とが加算されて、量子化値ｘ ₁’が
得られる。よって、この量子化値ｘ ₁’は、ｘ ₁ ’＝ｘ ₀’＋ｙ’ ＝ｘ−ｙ＋ｙ’ で表される。すなわち、最終的な量子化誤差ベクトル
は、ｙ’−ｙとなる。

【０２２４】尚、音声信号復号化装置側では、この第２
のベクトル量子化部５１０からの量子化値ｘ ₁’ を復号
化するときには、第１のベクトル量子化部５００からの
量子化値ｘ ₀’ は不要であるが、第１のベクトル量子化
部５００及び第２のベクトル量子化部５１０からのイン
デクスは必要とする。

【０２２５】次に、上記ベクトル量子化部５１１におけ
る学習法及びコードブックサーチについて説明する。

【０２２６】先ず、学習法においては、量子化誤差ベク
トルｙ及び重みｗ’を用い、表２に示すように、８つの
低次元ベクトルｙ ₀〜ｙ ₇及びマトリクスに分割する。こ
のとき、重みＷ’は、例えば４４点に間引いたものを
対角要素とする行列、

【０２２７】

【数４０】

【０２２８】とすると、以下の８つの行列に分割され
る。

【０２２９】

【数４１】

【０２３０】このように、ｙ及びＷ’の低次元に分割
されたものを、それぞれｙ _i 、Ｗ_i’ （１≦ｉ≦８）とする。

【０２３１】ここで、歪尺度Ｅを、Ｅ＝‖Ｗ_i'（ｙ _i−ｓ）‖² ・・・（３７）と定義する。このコードベクトルｓはｙ _iの量子化結果
であり、歪尺度Ｅを最小化する、コードブックのコード
ベクトルｓがサーチされる。

【０２３２】尚、Ｗ_i’は、学習時には重み付けがあ
り、サーチ時には重み付け無し、すなわち単位行列と
し、学習時とコードブックサーチ時とでは異なる値を用
いるようにしてもよい。

【０２３３】また、コードブックの学習では、一般化ロ
イドアルゴリズム（ＧＬＡ）を用い、さらに重み付けを
行っている。先ず、学習のための最適なセントロイドコ
ンディションについて説明する。コードベクトルｓを最
適な量子化結果として選択した入力ベクトルｙがＭ個あ
る場合に、トレーニングデータをｙ _k とすると、歪の期
待値Ｊは、全てのフレームｋに関して重み付け時の歪の
中心を最小化するような（３８）式となる。

【０２３４】

【数４２】

【０２３５】上記（３９）式で示すｓは最適な代表ベク
トルであり、最適なセントロイドコンディションであ
る。

【０２３６】また、最適エンコード条件は、‖Ｗ_i'
（ｙ _i−ｓ）‖² の値を最小化するｓをサーチすればよ
い。ここでサーチ時のＷ_i'は、必ずしも学習時と同じ
Ｗ_i'である必要はなく、重み無しで

【０２３７】

【数４３】

【０２３８】のマトリクスとしてもよい。

【０２３９】このように、音声信号符号化装置内のベク
トル量子化部１１６を２段のベクトル量子化部から構成
することにより、出力するインデクスのビット数を可変
にすることができる。

【０２４０】ところで、前述したように、スペクトルエ
ンベロープ評価部１４８において得られるハーモニクス
スペクトルのデータ数は上記ピッチに応じて変化し、有
効帯域が例えば３４００ｋHzのときには８個から６３個
程度までのいずれかの個数のデータとなる。これらのデ
ータをまとめてブロック化したベクトルｖは可変次元ベ
クトルであり、上述の具体例では、ベクトル量子化の前
に一定のデータ数、例えば４４次元の固定次元の入力ベ
クトルｘに次元変換している。この可変／固定次元変換
は、上述したデータ数変換のことであり、具体的には例
えば前述のように、オーバーサンプリング及び直線補間
等を用いて実現することができる。

【０２４１】このような固定次元に変換したベクトルｘ
に対して誤差計算を行って誤差を最小化するようなコー
ドブックサーチを行うと、必ずしも元の可変次元ベクト
ルｖに対する誤差を最小化するようなコードベクトルが
選択されるとは限らない。

【０２４２】そこで、本実施の形態では、上記固定次元
でのコードベクトルの選択を仮選択として複数のコード
ベクトルを選択するようにし、これらの仮選択された複
数のコードベクトルについて、可変次元で最終的な最適
コードベクトルの本選択を行わせるようにしている。な
お、固定次元での仮選択を行わずに、可変次元での選択
処理のみを行うようにしてもよい。

【０２４３】図１０は、このような元の可変次元での最
適ベクトル選択を行うための構成の一例を示しており、
端子５４１には、上記スペクトルエンベロープ評価部１
４８において得られるスペクトルエンベロープの可変個
数のデータ、すなわち可変次元ベクトルｖが入力されて
いる。この可変次元の入力ベクトルｖは、前述したデー
タ数変換回路である可変／固定次元変換回路５４２によ
り、一定の個数、例えば４４個のデータから成る固定次
元（４４次元）のベクトルｘに変換され、端子５０１に
送られている。この固定次元の入力ベクトルｘと、固定
次元の符号帳（コードブック）５３０から読み出される
固定次元のコードベクトルとが固定次元の選択回路５３
５に送られて、これらの間の重み付きの誤差あるいは歪
が最小となるようなコードベクトルを符号帳５３０から
選択するような選択処理あるいはコードブックサーチが
行われる。

【０２４４】さらにこの図１０の例においては、固定次
元の符号帳５３０から得られた固定次元のコードベクト
ルを固定／可変次元変換回路５４４により元の可変次元
の入力ベクトルｖと同じ可変次元に変換し、この可変次
元に変換されたコードベクトルを可変次元の選択回路５
４５に送って、上記入力ベクトルｖとの間の重み付き歪
の計算を行い、その歪を最小とするコードベクトルを符
号帳５３０から選択するような選択処理あるいはコード
ブックサーチを行っている。

【０２４５】すなわち、固定次元の選択回路５３５で
は、仮選択として、重み付き歪を最小化する候補となる
いくつかのコードベクトルを選択しておき、これらの候
補について、可変次元の選択回路５４５で重み付き歪計
算を行って、歪を最小とするコードベクトルを本選択す
るようにしている。

【０２４６】この場合の仮選択及び本選択を用いるベク
トル量子化についての適用範囲を簡単に説明する。この
ベクトル量子化は、ハーモニックコーディング、ＬＰＣ
残差のハーモニックコーディング、本件出願人が先に提
案した特願平４−９１４２２号明細書及び図面に開示し
たようなＭＢＥ（マルチバンド励起）符号化、ＬＰＣ残
差のＭＢＥ符号化等におけるハーモニクススペクトルに
対して帯域制限型の次元変換を用いて可変次元のハーモ
ニクスを重み付きベクトル量子化する場合に適用できる
のみならず、その他、入力ベクトルの次元が可変であっ
て、固定次元の符号帳を用いてベクトル量子化するよう
なあらゆる場合に適用できる。

【０２４７】上記仮選択としては、多段の量子化器構成
の場合の一部を選択したり、シェイプコードブックとゲ
インコードブックとから成る符号帳の場合にシェイプコ
ードブックのみを仮選択でサーチするようにしゲインに
ついては可変次元での歪計算により決定するようにした
りすることが挙げられる。また、この仮選択について、
前述した予備選択、すなわち、固定次元のベクトルｘと
符号帳に蓄えられた全てのコードベクトルとの類似度を
近似計算（重み付き歪の近似計算）により求めて類似度
の高い複数のコードベクトルを選択すること、を適用し
てもよい。この場合、固定次元での仮選択を上記予備選
択とし、予備選択された候補のコードベクトルについて
可変次元での重み付き歪を最小化するような本選択を行
わせてもよく、また、仮選択の工程で上記予備選択のみ
ならず高精度の歪演算による絞り込みをさらに行った後
に本選択に回すようにしてもよい。

【０２４８】以下、このような仮選択及び本選択を用い
たベクトル量子化の具体例について、図面を参照しなが
ら説明する。

【０２４９】図１０においては、符号帳５３０は、シェ
イプコードブック５３１とゲインコードブック５３２と
から成り、シェイプコードブック５３１は、さらに２つ
のコードブックＣＢ０，ＣＢ１を有している。これらの
シェイプコードブックＣＢ０，ＣＢ１からの出力コード
ベクトルをそれぞれｓ ₀，ｓ ₁とし、ゲインコードブック
５３２により決定されるゲイン回路５３３のゲインをｇ
とする。入力端子５４１からの可変次元の入力ベクトル
ｖは、可変／固定次元変換回路５４２により次元変換
（これをＤ₁ とする）されて、端子５０１を介して固定
次元のベクトルｘとして選択回路５３５の減算器５３６
に送られ、符号帳５３０から読み出された固定次元のコ
ードベクトルとの差がとられ、重み付け回路５３７によ
り重み付けがなされて、誤差最小化回路５３８に送られ
る。この重み付け回路５３７での重みをＷ’とする。
また、符号帳５３０から読み出された固定次元のコード
ベクトルは、固定／可変次元変換回路５４４により次元
変換（これをＤ₂ とする）されて、可変次元の選択回路
５４５の減算器５４６に送られ、可変次元の入力ベクト
ルｖとの差がとられ、重み付け回路５４７により重み付
けがなされて、誤差最小化回路５４８に送られる。この
重み付け回路５４７での重みをＷ_v とする。

【０２５０】ここで、誤差最小化回路５３８，５４８の
誤差とは、上記歪あるいは歪尺度のことであり、誤差す
なわち歪が小さくなることは、類似度あるいは相関性が
高まることに相当する。

【０２５１】固定次元での上記仮選択を行う選択回路５
３５では、前記（２７）式の説明と同様に、Ｅ₁ ＝ ‖Ｗ'（ｘ−ｇ(ｓ ₀＋ｓ ₁)）‖² ・・・（ｂ１）で表される歪尺度Ｅ₁ を最小化するｓ ₀，ｓ ₁，ｇをサー
チする。ここで、重み付け回路５３７での重みＷ’
は、Ｗ' ＝ＷＨ／‖ｘ‖ ・・・（ｂ２）であり、ＨはＬＰＣ合成フィルタの周波数応答特性を
対角要素に持つマトリクスを、またＷは聴覚重み付け
フィルタの周波数応答特性を対角要素に持つマトリクス
をそれぞれ示している。

【０２５２】先ず、上記（ｂ１）式の歪尺度Ｅ₁ を最小
化するｓ ₀，ｓ ₁，ｇをサーチする。ここで、ｓ ₀，ｓ ₁，
ｇを、上記歪尺度Ｅ₁ を小さくする順に、上位からＬ組
とっておき（固定次元での仮選択）、そのＬ組のｓ ₀，
ｓ ₁，ｇに関して、Ｅ₂ ＝ ‖Ｗ_v（ｖ−Ｄ₂ｇ(ｓ ₀＋ｓ ₁)）‖² ・・・（ｂ３）を最小化するｓ ₀，ｓ ₁，ｇの組を最適コードベクトルと
して、最終的な本選択を可変次元で行う。

【０２５３】上記（ｂ１）式についてのサーチ、学習に
ついては、前述した（２７）式以下の説明の通りであ
る。

【０２５４】以下、上記（ｂ３）式に基づくコードブッ
ク学習のためのセントロイドコンディションについて説
明する。

【０２５５】符号帳（コードブック）５３０の内のシェ
イプコードブック５３１の１つであるコードブックＣＢ
０について、コードベクトルｓ ₀ を選択する全てのフレ
ームｋに関して、歪の期待値を最小化する。そのような
フレームがＭ個あるとして、

【０２５６】

【数４４】

【０２５７】を最小化すればよい。この（ｂ４）式を最
小化するために、

【０２５８】

【数４５】

【０２５９】を解いて、

【０２６０】

【数４６】

【０２６１】となる。この（ｂ６）式で、｛｝^-1は逆
行列を、Ｗ_vk ^T はＷ_vkの転置行列をそれぞれ示して
いる。この（ｂ６）式が、シェイプベクトルｓ ₀ の最適
セントロイド条件である。

【０２６２】次に、符号帳（コードブック）５３０の内
のシェイプコードブック５３１のもう１つのコードブッ
クＣＢ１についてのコードベクトルｓ ₁ を選択する場合
も同様であるため、説明を省略する。

【０２６３】次に、符号帳（コードブック）５３０の内
のゲインコードブック５３２からのゲインｇについての
セントロイド条件を考察する。

【０２６４】ゲインのコードワードｇ_cを選択するｋ番
目のフレームに関して、歪の期待値Ｊ_gは、

【０２６５】

【数４７】

【０２６６】この（ｂ７）式を最小化するために、

【０２６７】

【数４８】

【０２６８】を解いて、

【０２６９】

【数４９】

【０２７０】これがゲインのセントロイド条件である。

【０２７１】次に、上記（ｂ３）式に基づく最適エンコ
ード条件を考察する。上記（ｂ３）式でサーチせねばな
らないｓ ₀，ｓ ₁，ｇの組は、上記固定次元での仮選択に
よりＬ組と限定されているので、上記（ｂ３）式をＬ組
のｓ ₀，ｓ ₁，ｇに関して直接計算し、歪Ｅ₂ を最小とす
るｓ ₀，ｓ ₁，ｇの組を最適コードベクトルとして選択す
ればよい。

【０２７２】ここで、仮選択のＬが非常に大きい場合
や、上記仮選択を行わず直接的に可変次元でｓ ₀，ｓ ₁，
ｇの選択を行う場合に、有効とされるシェイプとゲイン
のシーケンシャルなサーチの方法について説明する。

【０２７３】上記（ｂ３）式の各ｓ ₀，ｓ ₁，ｇに、それ
ぞれｉ，ｊ，ｌのインデクスを付加して書き直すと、Ｅ₂ ＝ ‖Ｗ_v（ｖ−Ｄ₂ｇ_l(ｓ _0i＋ｓ _1j)）‖² ・・・（ｂ10）となる。これを最小化するｇ_l，ｓ _0i，ｓ _1j を総当たり
でサーチすることも可能であるが、例えば０≦ｌ＜３
２，０≦ｉ＜３２，０≦ｊ＜３２とすると、３２³＝３
２７６８通りものパターンについて上記（ｂ10）式を計
算することになり、膨大な演算量となる。そこで、シェ
イプとゲインをシーケンシャルにサーチする方法を説明
する。

【０２７４】先ず、シェイプコードベクトルｓ _0i，ｓ _1j
を決定してから、ゲインｇ_l を決定する。ｓ _0i＋ｓ _1j＝
ｓ _m とおくと、上記（ｂ10）式は、Ｅ₂ ＝ ‖Ｗ_v（ｖ−Ｄ₂ｇ_l ｓ _m）‖² ・・・（ｂ11）と表せ、さらに、ｖ _w＝Ｗ_v ｖ，ｓ _w＝Ｗ_vＤ₂ ｓ _mとお
くと、（ｂ11）式は、

【０２７５】

【数５０】

【０２７６】となる。よって、ｇ_l の精度が充分にとれ
るとすると、

【０２７７】

【数５１】

【０２７８】元の変数を代入して書き直すと、次の（ｂ
15），（ｂ16）式のようになる。

【０２７９】

【数５２】

【０２８０】上記（ｂ６），（ｂ９）式のシェイプ、ゲ
インのセントロイド条件と、上記（ｂ15），（ｂ16）式
の最適エンコード条件（Nearest Neighbour Condition
）を用いて、一般化ロイドアルゴリズム（Generalized
Lloyd Algorithm:ＧＬＡ）によって、コードブック
（ＣＢ０、ＣＢ１、ＣＢｇ）を同時に学習させることが
できる。

【０２８１】これらの（ｂ６），（ｂ９），（ｂ15），
（ｂ16）式を用いた学習法は、先に述べた（２７）式以
下の説明、特に前記（３１），（３２），（３５）式を
用いる方法に比べて、元の入力ベクトルｖの可変次元へ
の変換を行った後の歪を最小化している点で優れてい
る。

【０２８２】しかし、上記（ｂ６），（ｂ９）式、特に
（ｂ６）式の演算は、煩雑であるので、例えば上記（ｂ
15），（ｂ16）式の最適エンコード条件のみを用いて、
セントロイド条件は前記（２７）式（すなわち（ｂ
１）式）の最適化から導かれるものを用いてもよい。

【０２８３】あるいは、コードブックの学習時は、全て
前記（２７）式以下の説明に述べた方法で行い、サーチ
時のみ上記（ｂ15），（ｂ16）式を用いる方法も挙げら
れる。また、上記固定次元での仮選択を前記（２７）式
以下の説明に述べた方法で行い、選ばれた複数個（Ｌ
個）の組についてのみ上記（ｂ３）式を直接評価してサ
ーチを行うようにしてもよい。

【０２８４】いずれにしても、上記（ｂ３）式の歪評価
によるサーチを、上記仮選択後、あるいは総当たり的に
使用することにより、最終的にはより歪の少ないコード
ベクトルサーチあるいは学習を行うことが可能となる。

【０２８５】ここで、元の入力ベクトルｖと同じ可変次
元で歪計算を行うことが好ましい理由について簡単に述
べる。

【０２８６】これは、固定次元での歪の最小化と可変次
元での歪の最小化とが一致すれば、可変次元での歪の最
小化は不要であるが、固定／可変次元変換回路５４４で
の次元変換Ｄ₂ が直交行列ではないため、これらの歪の
最小化は一致しない。このため、固定次元で歪を最小化
しても、必ずしもこれは可変次元で最適に歪を最小化す
ることにはならず、最終的に得られる可変次元のベクト
ルを最適化しようとするには、可変次元での最適化が必
要とされるからである。

【０２８７】次に図１１は、符号帳（コードブック）を
シェイプコードブックとゲインコードブックとに分ける
ときのゲインを可変次元でのゲインとし、可変次元で最
適化するようにした例を示している。

【０２８８】すなわち、シェイプコードブック５３１か
ら読み出された固定次元のコードベクトルを固定／可変
次元変換回路５４４に送って可変次元のベクトルに変換
した後、ゲイン回路５３３に送っている。可変次元での
選択回路５４５は、ゲイン回路５３３からの可変次元の
コードベクトルと上記入力ベクトルｖとに基づいて、固
定／可変次元変換されたコードベクトルに対するゲイン
回路５３３での最適ゲインを選択すればよい。あるい
は、ゲイン回路５３３への入力ベクトルと上記入力ベク
トルｖとの内積に基づいて最適ゲインを選択するように
してもよい。他の構成及び動作は、上記図１０の例と同
様である。

【０２８９】なお、シェイプコードブック５３１につい
ては、選択回路５３５における固定次元での選択時に唯
一のコードベクトルを選択するようにし、可変次元での
選択はゲインのみとしてもよい。

【０２９０】このように、固定／可変次元変換回路５４
４で変換したコードベクトルに対してゲインを掛けるよ
うな構成とすることにより、上記図１０に示すようなゲ
イン倍したコードベクトルを固定／可変次元変換するも
のに比べて、固定／可変次元変換による影響を考慮した
上で最適なゲインを選択することができる。

【０２９１】次に、このような固定次元での仮選択と可
変次元での本選択とを組み合わせるベクトル量子化の他
の具体例について説明する。

【０２９２】以下の具体例では、第１の符号帳から読み
出された固定次元の第１のコードベクトルを入力ベクト
ルの可変次元に次元変換し、第２の符号帳から読み出さ
れた固定次元の第２のコードベクトルを上記固定／可変
次元変換された可変次元の第１のコードベクトルに加算
し、この加算されて得られた加算コードベクトルについ
て上記入力ベクトルとの誤差を最小化する最適のコード
ベクトルを上記少なくとも第２の符号帳より選択するよ
うにしている。

【０２９３】例えば、図１２の例では、第１の符号帳
（コードブック）ＣＢ０から読み出された固定次元の第
１のコードベクトルｓ ₀ を、固定／可変次元変換回路５
４４に送って、端子５４１の入力ベクトルｖに等しい可
変次元に次元変換し、第２の符号帳ＣＢ１から読み出さ
れた固定次元の第２のコードベクトルｓ ₁ を加算機５４
９に送って、固定／可変次元変換回路５４４からの可変
次元のコードベクトルに加算し、この加算器５４９で加
算されて得られた加算コードベクトルを選択回路５４５
に送り、この選択回路５４５で、加算器５４９からの加
算ベクトルと上記入力ベクトルｖとの誤差を最小化する
最適のコードベクトルを選択するようにしている。ここ
で、第２の符号帳（コードブック）ＣＢ１からのコード
ベクトルは、入力スペクトルのハーモニクスの低域側か
らコードブックＣＢ１の次元にまで適用される。また、
ゲインｇのゲイン回路５３３は、第１の符号帳ＣＢ０と
固定／可変次元変換回路５４４との間にのみ設けられて
いる。他の構成は上記図１０と同様であるため、対応す
る部分に同じ指示符号を付して説明を省略する。

【０２９４】このように、コードブックＣＢ１からの固
定次元のままのコードベクトルを、コードブックＣＢ０
から読み出されて可変次元に変換されたコードベクトル
と加算することにより、固定／可変次元変換を行うこと
によって発生した歪をコードブックＣＢ１からの固定次
元のコードベクトルによって減じることができる。

【０２９５】この図１２の可変次元の選択回路５４５で
計算される歪Ｅ₃ は、Ｅ₃ ＝‖Ｗ_v（ｖ−（Ｄ₂ｇｓ ₀＋ｓ ₁））‖² ・・・（ｂ17）となる。

【０２９６】次に、図１３の例では、ゲイン回路５３３
を加算器５４９の出力側に配置している。従って、第１
の符号帳ＣＢ０から読み出され固定／可変次元変換回路
５４４で可変次元に変換されたコードベクトルと、第２
の符号帳ＣＢ１から読み出されたコードベクトルとの加
算結果に対してゲインｇが掛けられる。これは、ＣＢ０
からのコードベクトルに乗ずるべきゲインと、その補正
分（量子化誤差の量子化）のためのコードブックＣＢ１
からのコードベクトルに乗ずるべきゲインの相関が強い
ため、共通のゲインを用いている。この図１３の選択回
路５４５で計算される歪Ｅ₄ は、Ｅ₄ ＝‖Ｗ_v（ｖ−ｇ（Ｄ₂ ｓ ₀＋ｓ ₁））‖² ・・・（ｂ18）となる。この図１３の例の他の構成は、上記図１２の例
と同様であるため説明を省略する。

【０２９７】次に、図１４の例では、上記図１２の例に
おける第１の符号帳ＣＢ０の出力側にゲインｇのゲイン
回路５３３₀ を設けるのみならず、第２の符号帳ＣＢ１
の出力側にもゲインｇのゲイン回路５３３₁ を設けてい
る。この図１４の選択回路５４５で計算される歪は、上
記図１３の例と同様に、（ｂ18）式に示す歪Ｅ₄ とな
る。この図１４の例の他の構成は、上記図１２の例と同
様であるため説明を省略する。

【０２９８】次に、図１５は、上記図１２の第１の符号
帳を２つのシェイプコードブックＣＢ０、ＣＢ１で構成
した例を示し、これらのシェイプコードブックＣＢ０、
ＣＢ１からの各コードベクトルｓ ₀、ｓ ₁が加算され、ゲ
イン回路５３３でゲインｇを掛けられて、固定／可変次
元変換回路５４４に送られている。この固定／可変次元
変換回路５４４からの可変次元のコードベクトルと、第
２の符号帳ＣＢ２からのコードベクトルｓ ₂ とを加算器
５４９で加算して、選択回路５４５に送っている。この
図１５の選択回路５４５で計算される歪Ｅ₅ は、Ｅ₅ ＝‖Ｗ_v（ｖ−（ｇＤ₂（ｓ ₀＋ｓ ₁）＋ｓ₂））‖² ・・・（ｂ19）となる。この図１５の例の他の構成は、上記図１２の例
と同様であるため説明を省略する。

【０２９９】ここで、上記（ｂ18）式におけるサーチ方
法について説明する。先ず、第１のサーチ方法として
は、Ｅ₄' ＝‖Ｗ'（ｘ−ｇ_l ｓ _0i））‖² ・・・（ｂ20）を最小化するｓ _0i，ｇ_l をサーチし、次にＥ₄ ＝‖Ｗ_v（ｖ−ｇ_l（Ｄ₂ ｓ _0i＋ｓ _1j））‖² ・・・（ｂ21）を最小化するｓ _1jをサーチすることが挙げられる。

【０３００】第２のサーチ方法としては、

【０３０１】

【数５３】

【０３０２】が挙げられる。

【０３０３】第３のサーチ方法としては、

【０３０４】

【数５４】

【０３０５】が挙げられる。

【０３０６】次に、上記第１のサーチ方法の上記（ｂ2
0）式のセントロイド条件について説明する。上記コー
ドベクトルｓ _0iのセントロイドをｓ _0cとするとき、

【０３０７】

【数５５】

【０３０８】を最小化する。これを最小化するために、

【０３０９】

【数５６】

【０３１０】を解いて、

【０３１１】

【数５７】

【０３１２】が得られる。同様に、ゲインｇのセントロ
イドｇ_c については、上記（ｂ20）式より、

【０３１３】

【数５８】

【０３１４】

【数５９】

【０３１５】を解いて、

【０３１６】

【数６０】

【０３１７】また、上記第１のサーチ方法の上記（ｂ2
1）式のセントロイド条件として、ベクトルｓ _1jのセン
トロイドｓ _1cについては、

【０３１８】

【数６１】

【０３１９】

【数６２】

【０３２０】を解いて、

【０３２１】

【数６３】

【０３２２】が得られる。上記（ｂ21）式から上記コー
ドベクトルｓ _0iのセントロイドｓ _0cを求めると、

【０３２３】

【数６４】

【０３２４】

【数６５】

【０３２５】

【数６６】

【０３２６】が得られる。同様に、上記（ｂ21）式から
上記ゲインｇのセントロイドｇ_c を求めると、

【０３２７】

【数６７】

【０３２８】が得られる。

【０３２９】以上、上記（ｂ20）式によるコードベクト
ルｓ _0iのセントロイドｓ _0cの算出方法を（ｂ30）式に、
ゲインｇのセントロイドｇ_c の算出方法を（ｂ33）式に
それぞれ示した。また、上記（ｂ21）式によるセントロ
イドの算出方法として、コードベクトルｓ _1jのセントロ
イドｓ _1cを（ｂ36）式に、コードベクトルｓ _0iのセント
ロイドｓ _0cを（ｂ39）式に、ゲインｇのセントロイドｇ
_c を（ｂ40）式にそれぞれ示した。

【０３３０】実際の一般化ロイドアルゴリズム（ＧＬ
Ａ）によるコードブックの学習においては、セントロイ
ド条件として、上記（ｂ30）式、（ｂ36）式、（ｂ40）
式を使用してｓ ₀，ｓ ₁，ｇを同時に学習する方法が挙げ
られる。サーチ方法（NearestNeighbour Condition）
は、例えば上記（ｂ22）式、（ｂ23）式、（ｂ24）式を
用いればよい。この他、上記（ｂ30）式、（ｂ33）式、
（ｂ36）式、あるいは、上記（ｂ39）式、（ｂ36）式、
（ｂ40）式といったセントロイド条件の組み合わせも可
能であることは勿論である。

【０３３１】次に、上記図１２に対応する上記（ｂ17）
式の歪尺度の場合のサーチ方法について説明する。この
場合には、Ｅ₃' ＝‖Ｗ'（ｘ−ｇ_l ｓ _0i））‖² ・・・（ｂ41）を最小化するｓ _0i，ｇ_l をサーチし、次にＥ₃ ＝‖Ｗ_v（ｖ−ｇ_l（Ｄ₂ ｓ _0i＋ｓ _1j））‖² ・・・（ｂ42）を最小化するｓ _1jをサーチすることが挙げられる。

【０３３２】上記（ｂ41）式において、全てのｇ_l，ｓ
_0iの組を総当たりするのは現実的でないので、次のよう
にしている。

【０３３３】

【数６８】

【０３３４】次に、上記（ｂ41）式、（ｂ42）式よりセ
ントロイド条件を導く。この場合も、上述したのと同様
に、どの式を用いるかで変わってくる。

【０３３５】先ず、上記（ｂ41）式を用いる場合には、
上記コードベクトルｓ _0iのセントロイドをｓ _0cとすると
き、

【０３３６】

【数６９】

【０３３７】を最小化することにより、

【０３３８】

【数７０】

【０３３９】が得られる。同様に、ゲインｇのセントロ
イドｇ_c については、上記（ｂ41）式より、上記（ｂ3
3）式の場合と同様に、次の式が得られる。

【０３４０】

【数７１】

【０３４１】また、上記（ｂ42）式を用いてベクトルｓ
_1jのセントロイドｓ _1cを求める場合には、次の通りであ
る。

【０３４２】

【数７２】

【０３４３】

【数７３】

【０３４４】を解いて、

【０３４５】

【数７４】

【０３４６】が得られる。同様に、上記（ｂ42）式から
上記コードベクトルｓ _0iのセントロイドｓ _0c、及び上記
ゲインｇのセントロイドｇ_c を求めることができる。

【０３４７】

【数７５】

【０３４８】

【数７６】

【０３４９】

【数７７】

【０３５０】

【数７８】

【０３５１】なお、一般化ロイドアルゴリズム（ＧＬ
Ａ）によるコードブックの学習は、上記（ｂ47）式、
（ｂ48）式、（ｂ51）式を用いて、あるいは、上記（ｂ
51）式、（ｂ52）式、（ｂ55）式を用いて行うようにす
ればよい。

【０３５２】次に、本発明の前記ＣＥＬＰ符号化構成を
用いた第２の符号化部１２０は、より具体的には図１６
に示すような、多段のベクトル量子化処理部（図１６の
例では２段の符号化部１２０₁と１２０₂）の構成を有す
るものとなされている。なお、当該図１６の構成は、伝
送ビットレートを例えば前記２ｋｂｐｓと６ｋｂｐｓと
で切り換え可能な場合において、６ｋｂｐｓの伝送ビッ
トレートに対応した構成を示しており、さらにシェイプ
及びゲインインデクス出力を２３ビット／５ｍｓｅｃと
１５ビット／５ｍｓｅｃとで切り換えられるようにして
いるものである。また、この図１６の構成における処理
の流れは図１７に示すようになっている。

【０３５３】この図１６において、例えば、図１６の第
１の符号化部３００は前記図３の第１の符号化部１１３
と略々対応し、図１６のＬＰＣ分析回路３０２は前記図
３に示したＬＰＣ分析回路１３２と対応し、図１６のＬ
ＳＰパラメータ量子化回路３０３は図３の前記α→ＬＳ
Ｐ変換回路１３３からＬＳＰ→α変換回路１３７までの
構成と対応し、図１６の聴覚重み付けフィルタ３０４は
図３の前記聴覚重み付けフィルタ算出回路１３９及び聴
覚重み付けフィルタ１２５と対応している。したがっ
て、この図１６において、端子３０５には前記図３の第
１の符号化部１１３のＬＳＰ→α変換回路１３７からの
出力と同じものが供給され、また、端子３０７には前記
図３の聴覚重み付けフィルタ算出回路１３９からの出力
と同じものが、端子３０６には前記図３の聴覚重み付け
フィルタ１２５からの出力と同じものが供給される。た
だし、この図１６の聴覚重み付けフィルタ３０４では、
前記図３の聴覚重み付けフィルタ１２５とは異なり、前
記ＬＳＰ→α変換回路１３７の出力を用いずに、入力音
声データと量子化前のαパラメータとから、前記聴覚重
み付けした信号（すなわち前記図３の聴覚重み付けフィ
ルタ１２５からの出力と同じ信号）を生成している。

【０３５４】また、この図１６に示す２段構成の第２の
符号化部１２０₁及び１２０₂において、減算器３１３及
び３２３は図３の減算器１２３と対応し、距離計算回路
３１４及び３２４は図３の距離計算回路１２４と、ゲイ
ン回路３１１及び３２１は図３のゲイン回路１２６と、
ストキャスティックコードブック３１０，３２０及びゲ
インコードブック３１５，３２５は図３の雑音符号帳１
２１とそれぞれ対応している。

【０３５５】このような図１６の構成において、先ず、
図１７のステップＳ１に示すように、ＬＰＣ分析回路３
０２では、端子３０１から供給された入力音声データｘ
を前述同様に適当なフレームに分割してＬＰＣ分析を行
い、αパラメータを求める。ＬＳＰパラメータ量子化回
路３０３では、上記ＬＰＣ分析回路３０２からのαパラ
メータをＬＳＰパラメータに変換して量子化し、さらに
この量子化したＬＳＰパラメータを補間した後、αパラ
メータに変換する。次に、当該ＬＳＰパラメータ量子化
回路３０３では、当該量子化したＬＳＰパラメータを変
換したαパラメータ、すなわち量子化されたαパラメー
タから、ＬＰＣ合成フィルタ関数１／Ｈ（ｚ）を生成
し、これを端子３０５を介して１段目の第２の符号化部
１２０₁の聴覚重み付き合成フィルタ３１２に送る。

【０３５６】一方、聴覚重み付けフィルタ３０４では、
ＬＰＣ分析回路３０２からのαパラメータ（すなわち量
子化前のαパラメータ）から、前記図３の聴覚重み付け
フィルタ算出回路１３９によるものと同じ聴覚重み付け
のためのデータを求め、この重み付けのためのデータが
端子３０７を介して、１段目の第２の符号化部１２０₁
の聴覚重み付き合成フィルタ３１２に送られる。また、
当該聴覚重み付けフィルタ３０４では、図１７のステッ
プＳ２に示すように、入力音声データと量子化前のαパ
ラメータとから、前記聴覚重み付けした信号（前記図３
の聴覚重み付けフィルタ１２５からの出力と同じ信号）
を生成する。すなわち、先ず、量子化前のαパラメータ
から聴覚重み付けフィルタ関数Ｗ（ｚ）を生成し、さら
に入力音声データｘに当該フィルタ関数Ｗ（ｚ）を適用
してｘ _W を生成し、これを上記聴覚重み付けした信号と
して、端子３０６を介して１段目の第２の符号化部１２
０₁ の減算器３１３に送る。

【０３５７】１段目の第２の符号化部１２０₁ では、９
ビットシェイプインデクス出力のストキャスティックコ
ードブック（stochastic code book）３１０からの代表
値出力（無声音のＬＰＣ残差に相当するノイズ出力）が
ゲイン回路３１１に送られ、このゲイン回路３１１に
て、ストキャスティックコードブック３１０からの代表
値出力に６ビットゲインインデクス出力のゲインコード
ブック３１５からのゲイン（スカラ値）を乗じ、このゲ
イン回路３１１にてゲインが乗じられた代表値出力が、
１／Ａ（ｚ）＝（１／Ｈ（ｚ））・Ｗ（ｚ）の聴覚重み
付きの合成フィルタ３１２に送られる。この重み付きの
合成フィルタ３１２からは、図１７のステップＳ３のよ
うに、１／Ａ（ｚ）のゼロ入力応答出力が減算器３１３
に送られる。当該減算器３１３では、上記聴覚重み付き
合成フィルタ３１２からのゼロ入力応答出力と、上記聴
覚重み付けフィルタ３０４からの上記聴覚重み付けした
信号ｘ _W とを用いた減算が行われ、この差分或いは誤差
が参照ベクトルｒとして取り出される。図１７のステッ
プＳ４に示すように、１段目の第２の符号化部１２０₁
でのサーチ時には、この参照ベクトルｒが、距離計算回
路３１４に送られ、ここで距離計算が行われ、量子化誤
差エネルギＥを最小にするシェイプベクトルｓとゲイン
ｇがサーチされる。ただし、ここでの１／Ａ（ｚ）はゼ
ロ状態である。すなわち、コードブック中のシェイプベ
クトルｓをゼロ状態の１／Ａ（ｚ）で合成したものをｓ
_synとするとき、式（４０）を最小にするシェイプベク
トルｓとゲインｇをサーチする。

【０３５８】

【数７９】

【０３５９】ここで、量子化誤差エネルギＥを最小とす
るｓとｇをフルサーチしてもよいが、計算量を減らすた
めに、以下のような方法をとることができる。なお、ｒ
(ｎ)等は、ベクトルｒ等の要素を表している。

【０３６０】第１の方法として、以下の式（４１）に定
義するＥ_sを最小とするシェイプベクトルｓをサーチす
る。

【０３６１】

【数８０】

【０３６２】第２の方法として、第１の方法により得ら
れたｓより、理想的なゲインは、式（４２）のようにな
るから、式（４３）を最小とするｇをサーチする。

【０３６３】

【数８１】

【０３６４】Ｅ_g＝（ｇ_ref−ｇ）² （４３）ここで、Ｅはｇの二次関数であるから、Ｅ_gを最小にす
るｇはＥを最小化する。

【０３６５】上記第１，第２の方法によって得られたｓ
とｇより、量子化誤差ベクトルｅは次の式（４４）のよ
うに計算できる。

【０３６６】ｅ＝ｒ−ｇｓ _syn （４４）これを、２段目の第２の符号化部１２０₂ のリファレン
ス入力として１段目と同様にして量子化する。

【０３６７】すなわち、上記１段目の第２の符号化部１
２０₁ の聴覚重み付き合成フィルタ３１２からは、端子
３０５及び端子３０７に供給された信号がそのまま２段
目の第２の符号化部１２０₂の聴覚重み付き合成フィル
タ３２２に送られる。また、当該２段目の第２の符号化
部１２０₂減算器３２３には、１段目の第２の符号化部
１２０₁にて求めた上記量子化誤差ベクトルｅが供給さ
れる。

【０３６８】次に、図１７のステップＳ５において、当
該２段目の第２の符号化部１２０₂でも１段目と同様に
処理が行われる。すなわち、５ビットシェイプインデク
ス出力のストキャスティックコードブック３２０からの
代表値出力がゲイン回路３２１に送られ、このゲイン回
路３２１にて、当該コードブック３２０からの代表値出
力に３ビットゲインインデクス出力のゲインコードブッ
ク３２５からのゲインを乗じ、このゲイン回路３２１の
出力が、聴覚重み付きの合成フィルタ３２２に送られ
る。当該重み付きの合成フィルタ３２２からの出力は減
算器３２３に送られ、当該減算器３２３にて上記聴覚重
み付き合成フィルタ３２２からの出力と１段目の量子化
誤差ベクトルｅとの差分が求められ、この差分が距離計
算回路３２４に送られてここで距離計算が行われ、量子
化誤差エネルギＥを最小にするシェイプベクトルｓとゲ
インｇがサーチされる。

【０３６９】上述したような１段目の第２の符号化部１
２０₁ のストキャストコードブック３１０からのシェイ
プインデクス出力及びゲインコードブック３１５からの
ゲインインデクス出力と、２段目の第２の符号化部１２
０₂ のストキャストコードブック３２０からのインデク
ス出力及びゲインコードブック３２５からのインデクス
出力は、インデクス出力切り換え回路３３０に送られる
ようになっている。ここで、当該第２の符号化部１２０
から２３ビット出力を行うときには、上記１段目と２段
目の第２の符号化部１２０₁及び１２０₂のストキャスト
コードブック３１０，３２０及びゲインコードブック３
１５，３２５からの各インデクスを合わせて出力し、一
方、１５ビット出力を行うときには、上記１段目の第２
の符号化部１２０₁ のストキャストコードブック３１０
とゲインコードブック３１５からの各インデクスを出力
する。

【０３７０】その後は、ステップＳ６のようにフィルタ
状態がアップデートされる。

【０３７１】ところで、本実施の形態では、２段目の第
２の符号化部１２０₂ のインデクスビット数が、シェイ
プベクトルについては５ビットで、ゲインについては３
ビットと非常に少ない。このような場合、適切なシェイ
プ、ゲインがコードブックに存在しないと、量子化誤差
を減らすどころか逆に増やしてしまう可能性がある。

【０３７２】この問題を防ぐためには、ゲインに０を用
意しておけばよいが、ゲインは３ビットしかなく、その
うちの一つを０にしてしまうのは量子化器の性能を大き
く低下させてしまう。そこで、比較的多いビット数を割
り当てたシェイプベクトルに、要素が全て０のベクトル
を用意する。そして、このゼロベクトルを除いて、前述
のサーチを行い、量子化誤差が最終的に増えてしまった
場合に、ゼロベクトルを選択するようにする。なお、こ
のときのゲインは任意である。これにより、２段目の第
２の符号化部１２０₂が量子化誤差を増すことを防ぐこ
とができる。

【０３７３】なお、図１６の例では、２段構成の場合を
例に挙げているが、２段に限らず複数段構成とすること
ができる。この場合、１段目のクローズドループサーチ
によるベクトル量子化が終了したら、Ｎ段目（２≦Ｎ）
ではＮ−１段目の量子化誤差をリファレンス入力として
量子化を行い、さらにその量子化誤差をＮ＋１段目のリ
ファレンス入力とする。

【０３７４】上述したように、図１６及び図１７から、
第２の符号化部に多段のベクトル量子化器を用いること
により、従来のような同じビット数のストレートベクト
ル量子化や共役コードブックなどを用いたものと比較し
て、計算量が少なくなる。特に、ＣＥＬＰ符号化では、
合成による分析（Analysis by Synthesis ）法を用いた
クローズドループサーチを用いた時間軸波形のベクトル
量子化を行っているため、サーチの回数が少ないことが
重要である。また、２段の第２の符号化部１２０₁と１
２０₂の両インデクス出力を用いる場合と、１段目の第
２の符号化部１２０₁のインデクス出力のみを用いる
（２段目の第２の符号化部１２０₂の出力インデクスを
用いない）場合とを切り換えることにより、簡単にビッ
ト数を切り換えることが可能となっている。さらに上述
したように、１段目と２段目の第２の符号化部１２０₁
と１２０₂の両インデクス出力を合わせて出力するよう
なことを行えば、後のデコーダ側において例えば何れか
を選ぶようにすることで、デコーダ側でも容易に対応で
きることになる。すなわち例えば６ｋｂｐｓでエンコー
ドしたパラメータを、２ｋｂｐｓのデコーダでデコード
するときに、デコーダ側で容易に対応できることにな
る。またさらに、例えば２段目の第２の符号化部１２０
₂のシェイプコードブックにゼロベクトルを含ませるこ
とにより、割り当てられたビット数が少ない場合でも、
ゲインに０を加えるよりは少ない性能劣化で量子化誤差
が増加することを防ぐことが可能となっている。

【０３７５】次に、上記ストキャスティックコードブッ
クのコードベクトル（シェイプベクトル）は例えば以下
のようにして生成することができる。

【０３７６】例えば、ストキャスティックコードブック
のコードベクトルは、いわゆるガウシアンノイズのクリ
ッピングにより生成することができる。具体的には、ガ
ウシアンノイズを発生させ、これを適当なスレシホール
ド値でクリッピングし、それを正規化することで、コー
ドブックを構成することができる。

【０３７７】ところが、音声には様々な形態があり、例
えば「さ，し，す，せ，そ」のようなノイズに近い子音
の音声には、ガウシアンノイズが適しているが、例えば
「ぱ，ぴ，ぷ，ぺ，ぽ」のような立ち上がりの激しい子
音（急峻な子音）の音声については、対応しきれない。

【０３７８】そこで、本発明では、全コードベクトルの
うち、適当な数はガウシアンノイズとし、残りを学習に
より求めて上記立ち上がりの激しい子音とノイズに近い
子音の何れにも対応できるようにする。例えば、スレシ
ホールド値を大きくとると、大きなピークを幾つか持つ
ようなベクトルが得られ、一方、スレシホールド値を小
さくとると、ガウシアンノイズそのものに近くなる。し
たがって、このようにクリッピングスレシホールド値の
バリエーションを増やすことにより、例えば「ぱ，ぴ，
ぷ，ぺ，ぽ」のような立ち上がりの激しい子音や、例え
ば「さ，し，す，せ，そ」のようなノイズに近い子音な
どに対応でき、明瞭度を向上させることができるように
なる。なお、図１８には、図中実線で示すガウシアンノ
イズと図中点線で示すクリッピング後のノイズの様子を
示している。また、図１８の（Ａ）はクリッピングスレ
シホールド値が１．０の場合（すなわちスレシホールド
値が大きい場合）を、図１８の（Ｂ）にはクリッピング
スレシホールド値が０．４の場合（すなわちスレシホー
ルド値が小さい場合）を示している。この図１８の
（Ａ）及び（Ｂ）から、スレシホールド値を大きくとる
と、大きなピークを幾つか持つようなベクトルが得ら
れ、一方、スレシホールド値を小さくとると、ガウシア
ンノイズそのものに近くなることが判る。

【０３７９】このようなことを実現するため、先ず、ガ
ウシアンノイズのクリッピングにより初期コードブック
を構成し、さらに予め適当な数だけ学習を行わないコー
ドベクトルを決めておく。この学習しないコードベクト
ルは、その分散値が小さいものから順に選ぶようにす
る。これは、例えば「さ，し，す，せ，そ」のようなノ
イズに近い子音に対応させるためである。一方、学習を
行って求めるコードベクトルは、当該学習のアルゴリズ
ムとしてＬＢＧアルゴリズムを用いるようにする。ここ
で最適エンコード条件（Nearest Neighbour Conditio
n）でのエンコードは固定したコードベクトルと、学習
対象のコードベクトル両方を使用して行う。セントロイ
ドコンディション（Centroid Condition）においては、
学習対象のコードベクトルのみをアップデートする。こ
れにより、学習対象となったコードベクトルは「ぱ，
ぴ，ぷ，ぺ，ぽ」などの立ち上がりの激しい子音に対応
するようになる。

【０３８０】なお、ゲインは通常通りの学習を行うこと
で、これらのコードベクトルに対して最適なものが学習
できる。

【０３８１】上述したガウシアンノイズのクリッピング
によるコードブックの構成のための処理の流れを図１９
に示す。

【０３８２】この図１９において、ステップＳ１０で
は、初期化として、学習回数ｎ＝０とし、誤差Ｄ₀＝∞
とし、最大学習回数ｎ_maxを決定し、学習終了条件を決
めるスレシホールド値εを決定する。

【０３８３】次のステップＳ１１では、ガウシアンノイ
ズのクリッピングによる初期コードブックを生成し、ス
テップＳ１２では学習を行わないコードベクトルとして
一部のコードベクトルを固定する。

【０３８４】次にステップＳ１３では上記コードブック
を用いてエンコードを行い、ステップＳ１４では誤差を
算出し、ステップＳ１５では（Ｄ_n-1−Ｄ_n）／Ｄ_n＜
ε、若しくはｎ＝ｎ_maxか否かを判断し、Ｙｅｓと判断
した場合には処理を終了し、Ｎｏと判断した場合にはス
テップＳ１６に進む。

【０３８５】ステップＳ１６ではエンコードに使用され
なかったコードベクトルの処理を行い、次のステップＳ
１７ではコードブックのアップデートを行う。次にステ
ップＳ１８では学習回数ｎを１インクリメントし、その
後ステップＳ１３に戻る。

【０３８６】次に、図３の音声信号符号化装置におい
て、Ｖ／ＵＶ（有声音／無声音）判定部１１５の具体例
について説明する。

【０３８７】このＶ／ＵＶ判定部１１５においては、直
交変換回路１４５からの出力と、高精度ピッチサーチ部
１４６からの最適ピッチと、スペクトル評価部１４８か
らのスペクトル振幅データと、オープンループピッチサ
ーチ部１４１からの正規化自己相関最大値ｒ(p) と、ゼ
ロクロスカウンタ４１２からのゼロクロスカウント値と
に基づいて、当該フレームのＶ／ＵＶ判定が行われる。
さらに、ＭＢＥの場合と同様な各バンド毎のＶ／ＵＶ判
定結果の境界位置も当該フレームのＶ／ＵＶ判定の一条
件としている。

【０３８８】このＭＢＥの場合の各バンド毎のＶ／ＵＶ
判定結果を用いたＶ／ＵＶ判定条件について以下に説明
する。

【０３８９】ＭＢＥの場合の第ｍ番目のハーモニクスの
大きさを表すパラメータあるいは振幅｜Ａ_m｜は、

【０３９０】

【数８２】

【０３９１】により表せる。この式において、｜Ｓ(j)
｜は、ＬＰＣ残差をＤＦＴしたスペクトルであり、｜
Ｅ(j)｜は、基底信号のスペクトル、具体的には２５６
ポイントのハミング窓をＤＦＴしたものである。また、
ａ_m及びｂ_mは、第ｍ番目のハーモニクスに対応する第ｍ
バンドに対応する周波数をインデクスｊで表現したとき
の下限値及び上限値である。また、各バンド毎のＶ／Ｕ
Ｖ判定のために、ＮＳＲ（ノイズtoシグナル比）を利用
する。この第ｍバンドのＮＳＲは、

【０３９２】

【数８３】

【０３９３】と表せ、このＮＳＲ値が所定の閾値（例え
ば0.3 ）より大のとき（エラーが大きい）ときには、そ
のバンドでの｜Ａ_m ｜｜Ｅ(j) ｜による｜Ｓ(j) ｜の近
似が良くない（上記励起信号｜Ｅ(j) ｜が基底として不
適当である）と判断でき、当該バンドをＵＶ（Unvoice
d、無声音）と判別する。これ以外のときは、近似があ
る程度良好に行われていると判断でき、そのバンドをＶ
（Voiced、有声音）と判別する。

【０３９４】ここで、上記各バンド（ハーモニクス）の
ＮＳＲは、各ハーモニクス毎のスペクトル類似度をあら
わしている。ＮＳＲのハーモニクスのゲインによる重み
付け和をとったものをＮＳＲ_all として次のように定義
する。

【０３９５】ＮＳＲ_all ＝（Σ_m ｜Ａ_m ｜ＮＳＲ_m ）／
（Σ_m ｜Ａ_m ｜）このスペクトル類似度ＮＳＲ_all がある閾値より大きい
か小さいかにより、Ｖ／ＵＶ判定に用いるルールベース
を決定する。ここでは、この閾値をＴｈ_NSR ＝0.3 とし
ておく。このルールベースは、フレームパワー、ゼロク
ロス、ＬＰＣ残差の自己相関の最大値に関するものであ
り、ＮＳＲ_all ＜Ｔｈ_NSR のときに用いられるルールベ
ースでは、ルールが適用されるとＶとなり適用されるル
ールがなかった場合はＵＶとなる。

【０３９６】また、ＮＳＲ_all ≧Ｔｈ_NSR のときに用い
られるルールベースでは、ルールが適用されるとＵＶ、
適用されないとＶとなる。

【０３９７】ここで、具体的なルールは、次のようなも
のである。ＮＳＲ_all ＜Ｔｈ_NSR のとき、 if numZeroＸＰ＜２４、& frmPow＞３４０、& r0＞0.32
then ＶＮＳＲ_all ≧Ｔｈ_NSR のとき、 if numZeroＸＰ＞３０、& frmPow＜９００、& r0＜0.23
then ＵＶただし、各変数は次のように定義される。 numZeroＸＰ：１フレーム当たりのゼロクロス回数 frmPow ：フレームパワー r0 ：自己相関最大値上記のようなルールの集合であるルールに照合すること
で、Ｖ／ＵＶを判定する。

【０３９８】次に、図４の音声復号化装置（デコーダ）
の要部のより具体的な構成及び動作について説明する。

【０３９９】スペクトルエンベロープの逆ベクトル量子
化器２１２においては、上述したような音声符号化装置
（エンコーダ）側でのベクトル量子化器の構成に対応し
た逆ベクトル量子化構成が用いられる。

【０４００】例えば、エンコーダ側で上記図１０に示し
た構成によりベクトル量子化が施されている場合に、デ
コーダ側では、与えられたインデクスに応じて符号帳５
３０のシェイプコードブックＣＢ０，ＣＢ１及びゲイン
コードブックＤＢ_g から、コードベクトルｓ ₀，ｓ ₁及び
ゲインｇがそれぞれ読み出され、ｇ（ｓ ₀＋ｓ ₁）の固定
次元（例えば４４次元）のベクトルとして取り出され、
元のハーモニクススペクトルのベクトルの次元数に対応
する可変次元のベクトルに変換（固定／可変次元変換）
される。

【０４０１】また、エンコーダ側で、図１２〜図１５の
ように、可変次元ベクトルに固定次元コードベクトルを
加算するようなベクトル量子化器の構成を有する場合に
は、デコーダ側では、可変次元用のコードブック（例え
ば図１２のコードブックＣＢ０）から読み出されたコー
ドベクトルについては固定／可変次元変換し、これに固
定次元用のコードブック（図１２ではコードブックＣＢ
１）から読み出された固定次元のコードベクトルをハー
モニクスの低域側から次元数分だけ加算して、取り出す
ようにしている。

【０４０２】次に、図４のＬＰＣ合成フィルタ２１４
は、上述したように、Ｖ（有声音）用の合成フィルタ２
３６と、ＵＶ（無声音）用の合成フィルタ２３７とに分
離されている。すなわち、合成フィルタを分離せずにＶ
／ＵＶの区別なしに連続的にＬＳＰの補間を２０サンプ
ルすなわち２．５ｍsec 毎に行う場合には、Ｖ→ＵＶ、
ＵＶ→Ｖの遷移（トランジェント）部において、全く性
質の異なるＬＳＰ同士を補間することになり、Ｖの残差
にＵＶのＬＰＣが、ＵＶの残差にＶのＬＰＣが用いられ
ることにより異音が発生するが、このような悪影響を防
止するために、ＬＰＣ合成フィルタをＶ用とＵＶ用とで
分離し、ＬＰＣの係数補間をＶとＵＶとで独立に行わせ
たものである。

【０４０３】この場合の、ＬＰＣ合成フィルタ２３６、
２３７の係数補間方法について説明する。これは、次の
表３に示すように、Ｖ／ＵＶの状態に応じてＬＳＰの補
間を切り換えている。

【０４０４】

【表３】

【０４０５】この表３において、均等間隔ＬＳＰとは、
例えば１０次のＬＰＣ分析の例で述べると、フィルタの
特性がフラットでゲインが１のときのαパラメータ、す
なわち α₀＝１，α₁＝α₂＝・・・＝α₁₀＝０に対応す
るＬＳＰであり、ＬＳＰ_i ＝（π／１１）×ｉ０≦ｉ≦１０である。

【０４０６】このような１０次のＬＰＣ分析、すなわち
１０次のＬＳＰの場合は、図２０に示す通り、０〜πの
間を１１等分した位置に均等間隔で配置されたＬＳＰ
で、完全にフラットなスペクトルに対応している。合成
フィルタの全帯域ゲインはこのときが最小のスルー特性
となる。

【０４０７】図２１は、ゲイン変化の様子を概略的に示
す図であり、ＵＶ（無声音）部分からＶ（有声音）部分
への遷移時における１／Ｈ_UV(z) のゲイン及び１／Ｈ
_V(z)のゲインの変化の様子を示している。

【０４０８】ここで、補間を行う単位は、フレーム間隔
が１６０サンプル（２０ｍsec ）のとき、１／Ｈ_V(z)の
係数は２．５ｍsec （２０サンプル）毎、また１／Ｈ_UV
(z)の係数は、ビットレートが２ｋbps で１０ｍsec
（８０サンプル）、６ｋbps で５ｍsec （４０サンプ
ル）毎である。なお、ＵＶ時はエンコード側の第２の符
号化部１２０で合成による分析法を用いた波形マッチン
グを行っているので、必ずしも均等間隔ＬＳＰと補間せ
ずとも、隣接するＶ部分のＬＳＰとの補間を行ってもよ
い。ここで、第２の符号化部１２０におけるＵＶ部の符
号化処理においては、Ｖ→ＵＶへの遷移部で１／Ａ(z)
の重み付き合成フィルタ１２２の内部状態をクリアする
ことによりゼロインプットレスポンスを０にする。

【０４０９】これらのＬＰＣ合成フィルタ２３６、２３
７からの出力は、それぞれ独立に設けられたポストフィ
ルタ２３８ｖ、２３８ｕに送られており、ポストフィル
タもＶとＵＶとで独立にかけることにより、ポストフィ
ルタの強度、周波数特性をＶとＵＶとで異なる値に設定
している。

【０４１０】次に、ＬＰＣ残差信号、すなわちＬＰＣ合
成フィルタ入力であるエクサイテイションの、Ｖ部とＵ
Ｖ部のつなぎ部分の窓かけについて説明する。これは、
図４の有声音合成部２１１のサイン波合成回路２１５
と、無声音合成部２２０の窓かけ回路２２３とによりそ
れぞれ行われるものである。なお、エクサイテイション
のＶ部の合成方法については、本件出願人が先に提案し
た特願平４−９１４２２号の明細書及び図面に具体的な
説明が、また、Ｖ部の高速合成方法については、本件出
願人が先に提案した特願平６−１９８４５１号の明細書
及び図面に具体的な説明が、それぞれ開示されている。
今回の具体例では、この高速合成方法を用いてＶ部のエ
クサイテイションを生成している。

【０４１１】Ｖ（有声音）部分では、隣接するフレーム
のスペクトルを用いてスペクトルを補間してサイン波合
成するため、図２２に示すように、第ｎフレームと第ｎ
＋１フレームとの間にかかる全ての波形を作ることがで
きる。しかし、図２２の第ｎ＋１フレームと第ｎ＋２フ
レームとのように、ＶとＵＶ（無声音）に跨る部分、あ
るいはその逆の部分では、ＵＶ部分は、フレーム中に±
８０サンプル（全１６０サンプル＝１フレーム間隔）の
データのみをエンコード及びデコードしている。このた
め、図２３に示すように、Ｖ側ではフレームとフレーム
との間の中心点ＣＮを越えて窓かけを行い、ＵＶ側では
中心点ＣＮ移行の窓かけを行って、接続部分をオーバー
ラップさせている。ＵＶ→Ｖの遷移（トランジェント）
部分では、その逆を行っている。なお、Ｖ側の窓かけは
破線のようにしてもよい。

【０４１２】次に、Ｖ（有声音）部分でのノイズ合成及
びノイズ加算について説明する。これは、図４のノイズ
合成回路２１６、重み付き重畳回路２１７、及び加算器
２１８を用いて、有声音部分のＬＰＣ合成フィルタ入力
となるエクサイテイションについて、次のパラメータを
考慮したノイズをＬＰＣ残差信号の有声音部分に加える
ことにより行われる。

【０４１３】すなわち、上記パラメータとしては、ピッ
チラグＰch、有声音のスペクトル振幅Ａm[i]、フレーム
内の最大スペクトル振幅Ａmax 、及び残差信号のレベル
Ｌevを挙げることができる。ここで、ピッチラグＰch
は、所定のサンプリング周波数ｆs （例えばｆs＝８kH
z）でのピッチ周期内のサンプル数であり、スペクトル
振幅Ａm[i]のｉは、ｆs／２の帯域内でのハーモニック
スの本数をＩ＝Ｐch／２とするとき、０＜ｉ＜Ｉの範囲
内の整数である。

【０４１４】このノイズ合成回路２１６による処理は、
例えばＭＢＥ（マルチバンド励起）符号化の無声音の合
成と同様な方法で行われる。図２４は、ノイズ合成回路
２１６の具体例を示している。

【０４１５】すなわち図２４において、ホワイトノイズ
発生部４０１からは、時間軸上のホワイトノイズ信号波
形に所定の長さ（例えば２５６サンプル）で適当な窓関
数（例えばハミング窓）により窓かけされたガウシャン
ノイズが出力され、これがＳＴＦＴ処理部４０２により
ＳＴＦＴ（ショートタームフーリエ変換）処理を施すこ
とにより、ノイズの周波数軸上のパワースペクトルを得
る。このＳＴＦＴ処理部４０２からのパワースペクトル
を振幅処理のための乗算器４０３に送り、ノイズ振幅制
御回路４１０からの出力を乗算している。乗算器４０３
からの出力は、ＩＳＴＦＴ処理部４０４に送られ、位相
は元のホワイトノイズの位相を用いて逆ＳＴＦＴ処理を
施すことにより時間軸上の信号に変換する。ＩＳＴＦＴ
処理部４０４からの出力は、重み付き重畳加算回路２１
７に送られる。

【０４１６】なお、上記図２４の例においては、ホワイ
トノイズ発生部４０１から時間領域のノイズを発生して
それをＳＴＦＴ等の直交変換を行うことで周波数領域の
ノイズを得ていたが、ノイズ発生部から直接的に周波数
領域のノイズを発生するようにしてもよい。すなわち、
周波数領域のパラメータを直接発生することにより、Ｓ
ＴＦＴやＦＦＴ等の直交変換処理が節約できる。

【０４１７】具体的には、±ｘの範囲の乱数を発生しそ
れをＦＦＴスペクトルの実部と虚部として扱うようにす
る方法や、０から最大値（ｍａｘ）までの範囲の正の乱
数を発生しそれをＦＦＴスペクトルの振幅として扱い、
−πからπまでの乱数を発生しそれをＦＦＴスペクトル
の位相として扱う方法などが挙げられる。

【０４１８】こうすることにより、図２４のＳＴＦＴ処
理部４０２が不要となり、構成の簡略化あるいは演算量
の低減が図れる。

【０４１９】ノイズ振幅制御回路４１０は、例えば図２
５のような基本構成を有し、上記図４のスペクトルエン
ベロープの逆量子化器２１２から端子４１１を介して与
えられるＶ（有声音）についての上記スペクトル振幅Ａ
m[i]と、上記図４の入力端子２０４から端子４１２を介
して与えられる上記ピッチラグＰchに基づいて、乗算器
４０３での乗算係数を制御することにより、合成される
ノイズ振幅Ａm_noise[i]を求めている。すなわち図２５
において、スペクトル振幅Ａm[i]とピッチラグＰchとが
入力される最適なnoise_mix 値の算出回路４１６からの
出力をノイズの重み付け回路４１７で重み付けし、得ら
れた出力を乗算器４１８に送ってスペクトル振幅Ａm[i]
と乗算することにより、ノイズ振幅Ａm_noise[i]を得て
いる。

【０４２０】ここで、ノイズ合成加算の第１の具体例と
して、ノイズ振幅Ａm_noise[i]が、上記４つのパラメー
タの内の２つ、すなわちピッチラグＰch及びスペクトル
振幅Ａm[i]の関数ｆ₁(Pch,Am[i])となる場合について説
明する。

【０４２１】このような関数ｆ₁(Pch,Am[i])の具体例と
して、ｆ₁(Pch,Am[i])＝０（０＜ｉ＜Noise_b×Ｉ）ｆ₁(Pch,Am[i])＝Am[i]×noise_mix （Noise_b×Ｉ≦ｉ＜Ｉ） noise_mix ＝Ｋ×Ｐch／２.0 とすることが挙げられる。

【０４２２】ただし、noise_mix の最大値は、noise_mi
x_max とし、その値でクリップする。一例として、Ｋ＝
０.0２、noise_mix_max＝０.３、Noise_b＝０.７とする
ことが挙げられる。ここで、Noise_b は、全帯域の何割
からこのノイズの付加を行うかを決める定数である。本
例では、７割より高域側、すなわちｆs＝８kHzのとき、
４０００×０．７＝２８００Hzから４０００Hzの間でノ
イズを付加するようにしている。

【０４２３】次に、ノイズ合成加算の第２の具体例とし
て、上記ノイズ振幅Ａm_noise[i]を、上記４つのパラメ
ータの内の３つ、すなわちピッチラグＰch、スペクトル
振幅Ａm[i]及び最大スペクトル振幅Ａmax の関数ｆ₂(Pc
h,Am[i],Amax) とする場合について説明する。

【０４２４】このような関数ｆ₂(Pch,Am[i],Amax) の具
体例として、ｆ₂(Pch,Am[i],Amax)＝０（０＜ｉ＜Noise_b×Ｉ）ｆ₂(Pch,Am[i],Amax)＝Am[i]×noise_mix （Noise_b×Ｉ≦ｉ＜Ｉ） noise_mix ＝Ｋ×Ｐch／２.0 を挙げることができる。ただし、noise_mix の最大値
は、noise_mix_max とし、一例として、Ｋ＝０.0２、no
ise_mix_max＝０.３、Noise_b＝０.７とすることが挙げ
られる。

【０４２５】さらに、もしＡm[i]×noise_mix＞Ａmax×
Ｃ×noise_mix ならば、ｆ₂(Pch,Am[i],Amax)＝Ａmax×Ｃ×noise_mix とする。ここで、定数Ｃは、Ｃ＝０.３としている。こ
の条件式によりノイズレベルが大きくなり過ぎることを
防止できるため、上記Ｋ、noise_mix_max をさらに大き
くしてもよく、高域のレベルも比較的大きいときにノイ
ズレベルを高めることができる。

【０４２６】次に、ノイズ合成加算の第３の具体例とし
て、上記ノイズ振幅Ａm_noise[i]を、上記４つのパラメ
ータの内の４つ全ての関数ｆ₃(Pch,Am[i],Amax,Lev) と
することもできる。

【０４２７】このような関数ｆ₃(Pch,Am[i],Amax,Lev)
の具体例は、基本的には上記第２の具体例の関数ｆ₂(Pc
h,Am[i],Amax) と同様である。ただし、残差信号レベル
Ｌｅｖは、スペクトル振幅Ａｍ［ｉ］のｒｍｓ（root m
ean square）、あるいは時間軸上で測定した信号レベル
である。上記第２の具体例との違いは、Ｋの値とnoise_
mix_max の値とをLev の関数とする点である。すなわ
ち、Lev が小さくなったときには、Ｋ、noise_mix_max
の各値を大きめに設定し、Lev が大きいときは小さめに
設定する。あるいは、連続的にLev の値を逆比例させて
もよい。

【０４２８】次に、ポストフィルタ２３８ｖ、２３８ｕ
について説明する。

【０４２９】図２６は、図４の例のポストフィルタ２３
８ｖ、２３８ｕとして用いられるポストフィルタを示し
ており、ポストフィルタの要部となるスペクトル整形フ
ィルタ４４０は、ホルマント強調フィルタ４４１と高域
強調フィルタ４４２とから成っている。このスペクトル
整形フィルタ４４０からの出力は、スペクトル整形によ
るゲイン変化を補正するためのゲイン調整回路４４３に
送られており、このゲイン調整回路４４３のゲインＧ
は、ゲイン制御回路４４５により、スペクトル整形フィ
ルタ４４０の入力ｘと出力ｙと比較してゲイン変化を計
算し、補正値を算出することで決定される。

【０４３０】スペクトル整形フィルタの４４０特性ＰＦ
(z) は、ＬＰＣ合成フィルタの分母Ｈv(z)、Ｈuv(z) の
係数、いわゆるαパラメータをα_iとすると、

【０４３１】

【数８４】

【０４３２】と表せる。この式の分数部分がホルマント
強調フィルタ特性を、（１−ｋｚ^-1）の部分が高域強調
フィルタ特性をそれぞれ表す。また、β、γ、ｋは定数
であり、一例としてβ＝０．６、γ＝０．８、ｋ＝０．
３を挙げることができる。

【０４３３】また、ゲイン調整回路４４３のゲインＧ
は、

【０４３４】

【数８５】

【０４３５】としている。この式中のｘ(i) はスペクト
ル整形フィルタ４４０の入力、ｙ(i)はスペクトル整形
フィルタ４４０の出力である。

【０４３６】ここで、上記スペクトル整形フィルタ４４
０の係数の更新周期は、図２７に示すように、ＬＰＣ合
成フィルタの係数であるαパラメータの更新周期と同じ
く２０サンプル、２．５ｍsec であるのに対して、ゲイ
ン調整回路４４３のゲインＧの更新周期は、１６０サン
プル、２０ｍsec である。

【０４３７】このように、ポストフィルタのスペクトル
整形フィルタ４４０の係数の更新周期に比較して、ゲイ
ン調整回路４４３のゲインＧの更新周期を長くとること
により、ゲイン調整の変動による悪影響を防止してい
る。

【０４３８】すなわち、一般のポストフィルタにおいて
は、スペクトル整形フィルタの係数の更新周期とゲイン
の更新周期とを同じにしており、このとき、ゲインの更
新周期を２０サンプル、２．５ｍsec とすると、図２７
からも明らかなように、１ピッチ周期の中で変動するこ
とになり、クリックノイズを生じる原因となる。そこで
本例においては、ゲインの切換周期をより長く、例えば
１フレーム分の１６０サンプル、２０ｍsec とすること
により、急激なゲインの変動を防止することができる。
また逆に、スペクトル整形フィルタの係数の更新周期を
１６０サンプル、２０ｍsec とするときには、円滑なフ
ィルタ特性の変化が得られず、合成波形に悪影響が生じ
るが、このフィルタ係数の更新周期を２０サンプル、
２．５ｍsec と短くすることにより、効果的なポストフ
ィルタ処理が可能となる。

【０４３９】なお、隣接するフレーム間でのゲインのつ
なぎ処理は、図２８に示すように、前フレームのフィル
タ係数及びゲインと、現フレームのフィルタ係数及びゲ
インとを用いて算出した結果に、次のような三角窓Ｗ(i) ＝ｉ／２０（０≦ｉ≦２０）と１−Ｗ(i) （０≦ｉ≦２０）をかけてフェードイン、フェードアウトを行って加算す
る。図２８では、前フレームのゲインＧ₁が現フレーム
のゲインＧ₂に変化する様子を示している。すなわち、
オーバーラップ部分では、前フレームのゲイン、フィル
タ係数を使用する割合が徐々に減衰し、現フレームのゲ
イン、フィルタ係数の使用が徐々に増大する。なお、図
２８の時刻Ｔにおけるフィルタの内部状態は、現フレー
ムのフィルタ、前フレームのフィルタ共に同じもの、す
なわち前フレームの最終状態からスタートする。

【０４４０】以上説明したような信号符号化装置及び信
号復号化装置は、例えば図２９及び図３０に示すような
携帯通信端末あるいは携帯電話機等に使用される音声コ
ーデックとして用いることができる。

【０４４１】すなわち、図２９は、上記図１、図３に示
したような構成を有する音声符号化部１６０を用いて成
る携帯端末の送信側構成を示している。この図２９のマ
イクロホン１６１で集音された音声信号は、アンプ１６
２で増幅され、Ａ／Ｄ（アナログ／ディジタル）変換器
１６３でディジタル信号に変換されて、音声符号化部１
６０に送られる。この音声符号化部１６０は、上述した
図１、図３に示すような構成を有しており、この入力端
子１０１に上記Ａ／Ｄ変換器１６３からのディジタル信
号が入力される。音声符号化部１６０では、上記図１、
図３と共に説明したような符号化処理が行われ、図１、
図２の各出力端子からの出力信号は、音声符号化部１６
０の出力信号として、伝送路符号化部１６４に送られ
る。伝送路符号化部１６４では、いわゆるチャネルコー
ディング処理が施され、その出力信号が変調回路１６５
に送られて変調され、Ｄ／Ａ（ディジタル／アナログ）
変換器１６６、ＲＦアンプ１６７を介して、アンテナ１
６８に送られる。

【０４４２】また、図３０は、上記図２、図４に示した
ような構成を有する音声復号化部２６０を用いて成る携
帯端末の受信側構成を示している。この図３０のアンテ
ナ２６１で受信された音声信号は、ＲＦアンプ２６２で
増幅され、Ａ／Ｄ（アナログ／ディジタル）変換器２６
３を介して、復調回路２６４に送られ、復調信号が伝送
路復号化部２６５に送られる。２６４からの出力信号
は、上記図２、図４に示すような構成を有する音声復号
化部２６０に送られる。音声復号化部２６０では、上記
図２、図４と共に説明したような復号化処理が施され、
図２、図４の出力端子２０１からの出力信号が、音声復
号化部２６０からの信号としてＤ／Ａ（ディジタル／ア
ナログ）変換器２６６に送られる。このＤ／Ａ変換器２
６６からのアナログ音声信号がスピーカ２６８に送られ
る。

【０４４３】なお、本発明は上記実施の形態のみに限定
されるものではなく、例えば上記図１、図３の音声分析
側（エンコード側）の構成や、図２、図４の音声合成側
（デコード側）の構成については、各部をハードウェア
的に記載しているが、いわゆるＤＳＰ（ディジタル信号
プロセッサ）等を用いてソフトウェアプログラムにより
実現することも可能である。また、ベクトル量子化は、
音声符号化のみならず、他の種々の信号のベクトル量子
化に適用できる。さらに、本発明の音声符号化方法や装
置の適用範囲は、伝送や記録再生に限定されず、ピッチ
変換やスピード変換、規則音声合成、あるいは雑音抑圧
のような種々の用途に応用できることは勿論である。

【０４４４】

【発明の効果】以上の説明から明らかなように、本発明
によれば、ベクトル量子化しようとする入力ベクトルと
符号帳（コードブック）に蓄えられた全てのコードベク
トルとの類似度を近似計算により求めて類似度の高い複
数のコードベクトルを予備選択し、この予備選択により
選択された複数のコードベクトルについて上記入力ベク
トルとの誤差を最小化する最適のコードベクトルを本選
択することにより、簡略化された演算の予備選択である
程度候補を絞り込んだ後に、これらの候補についてのみ
高精度の本選択を行わせることができ、符号帳検索（コ
ードブックサーチ）に要する演算量を低減できる。

【０４４５】ここで上記符号帳は、複数の符号帳を組み
合わせて構成され、最適の組み合わせを構成するコード
ベクトルが各符号帳毎にそれぞれ選択されることが挙げ
られる。また、上記類似度としては、上記入力ベクトル
と上記コードベクトルとの内積、重み付き内積、又はこ
れらを各コードベクトルのノルム又は重み付きノルムで
割ったもののいずれかを用いることができる。

【０４４６】このようなベクトル量子化を音声符号化に
適用することができ、例えば、短期予測残差をサイン波
分析してハーモニクススペクトルを求め、符号化単位毎
の上記ハーモニクススペクトルに基づくパラメータを入
力ベクトルとしてベクトル量子化する際に適用すること
ができる。これによって、代表的な（平均の）重みによ
る重み付きノルムを各コードベクトル毎にオフラインで
計算しておき、予備選択時に用いることで、より精度の
高い予備選択が可能となり、予備選択を導入することに
よる音質劣化が防止できる。

【図面の簡単な説明】

【図１】本発明に係るベクトル量子化方法が適用された
音声符号化方法の実施の形態となる音声符号化装置の基
本構成を示すブロック図である。

【図２】図１の音声符号化装置により符号化された信号
を復号化するための音声復号化装置の基本構成を示すブ
ロック図である。

【図３】本発明の実施の形態となる音声符号化装置のよ
り具体的な構成を示すブロック図である。

【図４】図２の音声復号化装置のより具体的な構成を示
すブロック図である。

【図５】ＬＳＰ量子化部の基本構成を示すブロック図で
ある。

【図６】ＬＳＰ量子化部のより具体的な構成を示すブロ
ック図である。

【図７】ベクトル量子化部の基本構成を示すブロック図
である。

【図８】ベクトル量子化部のより具体的な構成を示すブ
ロック図である。

【図９】重み付けの重みの具体例を示すグラフである。

【図１０】符号帳検索を可変次元で行うベクトル量子化
器の構成例を示すブロック回路図である。

【図１１】符号帳検索を可変次元で行うベクトル量子化
器の他の構成例を示すブロック回路図である。

【図１２】可変次元用の符号帳と固定次元用の符号帳と
を用いるベクトル量子化器の第１の構成例を示すブロッ
ク回路図である。

【図１３】可変次元用の符号帳と固定次元用の符号帳と
を用いるベクトル量子化器の第２の構成例を示すブロッ
ク回路図である。

【図１４】可変次元用の符号帳と固定次元用の符号帳と
を用いるベクトル量子化器の第３の構成例を示すブロッ
ク回路図である。

【図１５】可変次元用の符号帳と固定次元用の符号帳と
を用いるベクトル量子化器の第５の構成例を示すブロッ
ク回路図である。

【図１６】本発明の音声信号符号化装置のＣＥＬＰ符号
化部分（第２の符号化部）の具体的構成を示すブロック
回路図である。

【図１７】図１６の構成における処理の流れを示すフロ
ーチャートである。

【図１８】ガウシアンノイズと、異なるスレシホールド
値でのクリッピング後のノイズの様子を示す図である。

【図１９】学習によってシェイプコードブックを生成す
る際の処理の流れを示すフローチャートである。

【図２０】１０次のＬＰＣ分析により得られたαパラメ
ータに基づく１０次のＬＳＰ（線スペクトル対）を示す
図である。

【図２１】ＵＶ（無声音）フレームからＶ（有声音）フ
レームへのゲイン変化の様子を説明するための図であ
る。

【図２２】フレーム毎に合成されるスペクトルや波形の
補間処理を説明するための図である。

【図２３】Ｖ（有声音）フレームとＵＶ（無声音）フレ
ームとの接続部でのオーバーラップを説明するための図
である。

【図２４】有声音合成の際のノイズ加算処理を説明する
ための図である。

【図２５】有声音合成の際に加算されるノイズの振幅計
算の例を示す図である。

【図２６】ポストフィルタの構成例を示す図である。

【図２７】ポストフィルタのフィルタ係数更新周期とゲ
イン更新周期とを説明するための図である。

【図２８】ポストフィルタのゲイン、フィルタ係数のフ
レーム境界部分でのつなぎ処理を説明するための図であ
る。

【図２９】本発明の実施の形態となる音声信号符号化装
置が用いられる携帯端末の送信側構成を示すブロック図
である。

【図３０】本発明の実施の形態となる音声信号復号化装
置が用いられる携帯端末の受信側構成を示すブロック図
である。

【符号の説明】

１１０第１の符号化部、１１１ＬＰＣ逆フィル
タ、１１３ＬＰＣ分析・量子化部、１１４サイ
ン波分析符号化部、１１５Ｖ／ＵＶ判定部、１１６
ベクトル量子化器、１２０第２の符号化部、１
２１雑音符号帳、１２２重み付き合成フィルタ、
１２３減算器、１２４距離計算回路、１２５
聴覚重み付けフィルタ、５３０符号帳（コードブ
ック）、５３１シェイプコードブック、５３２ゲ
インコードブック、５３３ゲイン回路、５３５仮
選択用の選択回路、５４２可変／固定次元変換回
路、５４４固定／可変次元変換回路、５４５本
選択用の選択回路

Claims

【特許請求の範囲】

【請求項１】入力ベクトルを符号帳に蓄えられたコー
ドベクトルと比較して最適のコードベクトルのインデク
スを出力するベクトル量子化方法において、上記入力ベクトルと上記符号帳に蓄えられた全てのコー
ドベクトルとの類似度を近似計算により求めて類似度の
高い複数のコードベクトルを選択する予備選択工程と、この予備選択工程により選択された複数のコードベクト
ルについて上記入力ベクトルとの誤差を最小化する最適
のコードベクトルを選択する本選択工程とを有すること
を特徴とするベクトル量子化方法。
【請求項２】上記符号帳は、複数の符号帳を組み合わ
せて構成され、最適の組み合わせを構成するコードベク
トルが各符号帳毎にそれぞれ選択されることを特徴とす
る請求項１記載のベクトル量子化方法。
【請求項３】上記類似度としては、上記入力ベクトル
と上記コードベクトルとの内積、重み付き内積、又はこ
れらを各コードベクトルのノルム又は重み付きノルムで
割ったもののいずれかを用いることを特徴とする請求項
１記載のベクトル量子化方法。
【請求項４】上記入力ベクトルは、音声信号に基づく
周波数軸上のパラメータのベクトルであり、上記類似度としては、上記周波数軸上のパラメータの低
域側にエネルギが集中し高域側にエネルギが低下してゆ
く重みを付けたコードベクトルのノルムで上記コードベ
クトルの重み付き内積を割ったものを用いることを特徴
とする請求項１記載のベクトル量子化方法。
【請求項５】上記類似度としては、上記周波数軸上の
パラメータの低域側にエネルギが集中し高域側にエネル
ギが低下してゆく固定の重みを付けたコードベクトルの
ノルムで上記コードベクトルの可変の重みを付けた内積
を割ったものを用いることを特徴とする請求項４記載の
ベクトル量子化方法。
【請求項６】入力音声信号を時間軸上で所定の符号化
単位で区分して各符号化単位で符号化を行う音声符号化
方法において、入力音声信号に基づく信号をサイン波分析してハーモニ
クススペクトルを求める工程と、上記符号化単位毎の上記ハーモニクススペクトルに基づ
くパラメータを入力ベクトルとしてベクトル量子化する
ことにより符号化する工程とを有し、上記ベクトル量子化は、上記入力ベクトルと符号帳に蓄えられた全てのコードベ
クトルとの類似度を近似計算により求めて類似度の高い
複数のコードベクトルを選択する予備選択工程と、この予備選択工程により選択された複数のコードベクト
ルについて上記入力ベクトルとの誤差を最小化する最適
のコードベクトルを選択する本選択工程とを有して成る
ことを特徴とする音声符号化方法。
【請求項７】上記符号帳は、複数の符号帳を組み合わ
せて構成され、最適の組み合わせを構成するコードベク
トルが各符号帳毎にそれぞれ選択されることを特徴とす
る請求項６記載の音声符号化方法。
【請求項８】上記類似度としては、上記入力ベクトル
と上記コードベクトルとの内積、重み付き内積、又はこ
れらを各コードベクトルのノルム又は重み付きノルムで
割ったもののいずれかを用いることを特徴とする請求項
６記載の音声符号化方法。
【請求項９】上記ノルムの重み付けに、低域側にエネ
ルギが集中し高域側にエネルギが低下してゆく重みを付
けたコードベクトルのノルムで上記コードベクトルの重
み付き内積を割ったものを用いることを特徴とする請求
項８記載の音声符号化方法。
【請求項１０】入力音声信号を時間軸上で所定の符号
化単位で区分して各符号化単位で符号化を行う音声符号
化装置において、入力音声信号の短期予測残差を求める予測符号化手段
と、求められた短期予測残差に対してサイン波分析符号化を
施すサイン波分析符号化手段とを有し、上記サイン波分析符号化手段は、サイン波分析により得られたハーモニクススペクトルに
基づくパラメータを入力ベクトルとして、この入力ベク
トルと符号帳に蓄えられた全てのコードベクトルとの類
似度を近似計算により求めて類似度の高い複数のコード
ベクトルを予備選択し、これらの予備選択された複数の
コードベクトルについて上記入力ベクトルとの誤差を最
小化する最適のコードベクトルを選択するベクトル量子
化手段を有することを特徴とする音声符号化装置。
【請求項１１】上記符号帳は、複数の符号帳を組み合
わせて構成され、最適の組み合わせを構成するコードベ
クトルが各符号帳毎にそれぞれ選択されることを特徴と
する請求項１０記載の音声符号化装置。
【請求項１２】上記類似度としては、上記入力ベクト
ルと上記コードベクトルとの内積、重み付き内積、又は
これらを各コードベクトルのノルム又は重み付きノルム
で割ったもののいずれかを用いることを特徴とする請求
項１０記載の音声符号化装置。
【請求項１３】上記ノルムの重み付けに、有声音部分
の低域側にエネルギが集中し高域側にエネルギが低下し
てゆく重みを付けたコードベクトルのノルムで上記コー
ドベクトルの重み付き内積を割ったものを用いることを
特徴とする請求項１２記載の音声符号化装置。