JPWO2011048810A1

JPWO2011048810A1 - ベクトル量子化装置及びベクトル量子化方法

Info

Publication number: JPWO2011048810A1
Application number: JP2011537141A
Authority: JP
Inventors: 利幸森井
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2009-10-20
Filing date: 2010-10-20
Publication date: 2013-03-07
Also published as: WO2011048810A1; US20120203548A1

Abstract

広帯域のディジタル信号を符号化する場合に、音声品質を劣化させることなく、音声コーデックの計算量を削減することができるベクトル量子化装置。ベクトル量子化装置（１１２）は、聴感重み付き合成フィルタのインパルス応答が畳み込まれた、符号帳を構成する複数のコードベクトルと、ターゲットベクトルとを用いて符号帳の探索を行う。フィルタリング部（２０１）は、インパルス応答に、ローパス特性及びハイパス特性の一方または双方を有するフィルタを掛け、短縮部（２０２）は、フィルタがハイパス特性を有する場合、フィルタリング後のインパルス応答の次数を短縮し、畳込部（２０３）は、複数のコードベクトルそれぞれに、フィルタリング後のインパルス応答を畳み込み、探索部（２０４）は、フィルタがローパス特性を有する場合、インパルス応答が畳み込まれた複数のコードベクトルそれぞれの要素、及び、ターゲットベクトルの要素を間引いて探索を行う。

Description

本発明は、ベクトル量子化装置及びベクトル量子化方法に関する。

移動体通信においては伝送帯域の有効利用のために音声または画像のディジタル情報の圧縮符号化が必須である。その中でも携帯電話で広く利用されている音声コーデック（符号化／復号）技術に対する期待は大きく、圧縮率の高い従来の高効率符号化に更によりよい音質の要求が強まっている。また、音声通信は公衆で使用されるため、標準化が必須であり、それに伴う知的財産権の価値の大きさゆえに世界各国の企業において研究開発が盛んに行われている。

近年、多層構造を持つスケーラブルコーデックは、ＩＴＵ−Ｔ（International Telecommunication Union - Telecommunication Standardization Sector）およびＭＰＥＧ（Moving Picture Experts Group）で標準化が検討されており、より効率的で高品質の音声コーデックが求められている。

２０年前に確立された音声の発声機構をモデル化してベクトル量子化を応用した基本方式であるＣＥＬＰ（Code Excited Linear Prediction）によって大きく性能を向上させた音声符号化技術は、ＩＴＵ−Ｔ標準Ｇ．７２９またはＥＴＳＩ標準ＡＭＲ（Adaptive Multi-Rate）等の標準方式として広く使用されている（例えば、非特許文献１参照）。また、３ＧＰＰ２標準ＶＭＲ−ＷＢ（Variable-Rate Multimode Wideband）では、電話帯域（Narrow Band：２００Ｈｚ〜３．４ｋＨｚ）以上の広帯域（Wide Band：０Ｈｚ〜７ｋＨｚ）の音声を、ＣＥＬＰを用いて符号化する方式が標準化されている（例えば、非特許文献２参照）。

ＩＴＵ−Ｔ標準Ｇ．７２９ "Source-Controlled-Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service options 62 and 63 for Spread Spectrum Systems", 3GPP2 C.S0052-A, April 2005.

しかしながら、広帯域のディジタル信号をＣＥＬＰで符号化すると、従来の電話帯域の信号よりもサンプリングレートが高い分だけ計算量が増加してしまう。特に、ＣＥＬＰにおける適応符号帳の探索は、固定符号帳の探索と比較して計算量削減が進んでいない。例えば、ＶＭＲ−ＷＢの規格書（非特許文献２）に記載されている適応符号帳探索（式（5.16.1-1）および式（5.16.1-2））は、ＶＭＲ−ＷＢの規格書よりも以前に標準化されたＩＴＵ−Ｔ標準Ｇ．７２９の規格書（非特許文献１）に記載されている適応符号帳探索（３．７章：式（３７）および式（３８））とほぼ同一である。すなわち、ＶＭＲ−ＷＢは、ＩＴＵ−Ｔ標準Ｇ．７２９と比較して倍近くのサンプル数を扱うアルゴリズムでありながら、適応符号帳探索において技術的進歩がほとんど無かったことがわかる。

そのため、広帯域化により音声品質は向上するものの、適応符号帳探索に必要となる計算量が大きいため、コーデックの計算量が多くなり、実用化のコストが格段に大きくなるという重大な問題を有している。

本発明の目的は、広帯域のディジタル信号を符号化する場合に、音声品質を劣化させることなく、音声コーデックの計算量を削減することができるベクトル量子化装置及びベクトル量子化方法を提供することである。

本発明のベクトル量子化装置は、複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化装置であって、聴感重み付き合成フィルタのインパルス応答を入力し、ローパス特性およびハイパス特性の一方または双方を有するフィルタを前記インパルス応答に掛けて第１信号を生成するフィルタリング手段と、前記複数のコードベクトルそれぞれに前記第１信号を畳み込んで第２信号を生成する畳込手段と、前記第２信号とターゲットベクトルとを用いて前記探索を行う探索手段と、を具備する構成を採る。

本発明のベクトル量子化方法は、複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化方法であって、ローパス特性およびハイパス特性の一方または双方を有するフィルタを、聴感重み付き合成フィルタのインパルス応答に掛けて第１信号を生成するフィルタリングステップと、前記複数のコードベクトルそれぞれに前記第１信号を畳み込んで第２信号を生成する畳込ステップと、前記第２信号とターゲットベクトルとを用いて前記探索を行う探索ステップと、を具備するようにした。

本発明によれば、音声品質をほとんど劣化させることなく、音声コーデックの計算量を削減することができる。

本発明の実施の形態１に係るＣＥＬＰ符号化装置の構成を示すブロック図本発明の実施の形態１に係るベクトル量子化装置の構成を示すブロック図本発明の実施の形態１に係るベクトル量子化装置の探索部の構成を示すブロック図本発明の実施の形態１に係るバンドパスフィルタの周波数特性を示す図本発明の実施の形態１に係る符号化シミュレーション結果の一例を示す図本発明の実施の形態１に係る符号化シミュレーション結果の一例を示す図本発明の実施の形態２に係るベクトル量子化装置の構成を示すブロック図本発明の実施の形態２に係るベクトル量子化装置の探索部の構成を示すブロック図本発明の実施の形態２に係る符号化シミュレーション結果の一例を示す図本発明の実施の形態２に係る試聴実験結果の一例を示す図（被験者毎の結果）本発明の実施の形態２に係る試聴実験結果の一例を示す図（環境条件毎の結果）

以下、本発明の実施の形態について、図面を参照して詳細に説明する。以下の実施の形態においては、本発明のベクトル量子化装置を適応符号帳の量子化装置として用いた音声符号化装置の一例として、ＣＥＬＰ符号化装置を用いる。

（実施の形態１）
図１は、本実施の形態に係るＣＥＬＰ符号化装置１００の構成を示すブロック図である。

図１において、ＣＥＬＰ符号化装置１００は、声道情報と音源情報とからなる音声信号を、声道情報については、ＬＰＣパラメータ（線形予測係数）を求めることにより符号化し、音源情報については、予め記憶されている音声モデルのいずれを用いるかを特定するインデックスを求めることにより符号化する。すなわち、音源情報については、適応符号帳１０３および固定符号帳１０４でどのような音源ベクトル（コードベクトル）を生成するかを特定するインデックス（符号）を求めることにより符号化する。

具体的には、ＣＥＬＰ符号化装置１００の各部は以下の動作を行う。

ＬＰＣ分析部１０１は、音声信号に対して線形予測分析を施し、スペクトル包絡情報であるＬＰＣパラメータを求め、求めたＬＰＣパラメータをＬＰＣ量子化部１０２および聴感重み付け部１１１に出力する。

ＬＰＣ量子化部１０２は、ＬＰＣ分析部１０１から出力されたＬＰＣパラメータを量子化し、得られた量子化ＬＰＣパラメータをＬＰＣ合成フィルタ１０９に出力し、量子化ＬＰＣパラメータのインデックスをＣＥＬＰ符号化装置１００の外部へ出力する。

一方、適応符号帳１０３は、ＬＰＣ合成フィルタ１０９で使用された過去の駆動音源を記憶しており、後述する歪み最小化部１１２から指示されたインデックスに対応する適応符号帳ラグに従って、記憶している駆動音源から１サブフレーム分の音源ベクトルを生成する。この音源ベクトルは、適応符号帳ベクトルとして乗算器１０６に出力される。

固定符号帳１０４は、所定形状の音源ベクトルを複数個予め記憶しており、歪み最小化部１１２から指示されたインデックスに対応する音源ベクトルを、固定符号帳ベクトルとして乗算器１０７に出力する。ここで、固定符号帳１０４は代数的音源であり、代数的符号帳を用いた場合について説明する。代数的音源とは、多くの標準コーデックに採用されている音源である。

なお、上記の適応符号帳１０３は、有声音のように周期性の強い成分を表現するために使われ、一方、固定符号帳１０４は、白色雑音のように周期性の弱い成分を表現するために使われる。

ゲイン符号帳１０５は、歪み最小化部１１２からの指示に従って、適応符号帳１０３から出力される適応符号帳ベクトル用のゲイン（適応符号帳ゲイン）、および固定符号帳１０４から出力される固定符号帳ベクトル用のゲイン（固定符号帳ゲイン）を生成し、それぞれ乗算器１０６、１０７に出力する。

乗算器１０６は、ゲイン符号帳１０５から出力された適応符号帳ゲインを、適応符号帳１０３から出力された適応符号帳ベクトルに乗じ、乗算後の適応符号帳ベクトルを加算器１０８に出力する。

乗算器１０７は、ゲイン符号帳１０５から出力された固定符号帳ゲインを、固定符号帳１０４から出力された固定符号帳ベクトルに乗じ、乗算後の固定符号帳ベクトルを加算器１０８に出力する。

加算器１０８は、乗算器１０６から出力された適応符号帳ベクトルと、乗算器１０７から出力された固定符号帳ベクトルとを加算し、加算後の音源ベクトルを駆動音源としてＬＰＣ合成フィルタ１０９に出力する。

ＬＰＣ合成フィルタ１０９は、ＬＰＣ量子化部１０２から出力された量子化ＬＰＣパラメータをフィルタ係数とし、適応符号帳１０３および固定符号帳１０４で生成される音源ベクトルを駆動音源としたフィルタ関数、すなわち、ＬＰＣ合成フィルタを用いて合成信号を生成する。この合成信号は、加算器１１０に出力される。

加算器１１０は、ＬＰＣ合成フィルタ１０９で生成された合成信号を音声信号から減算することによって誤差信号を算出し、この誤差信号を聴感重み付け部１１１に出力する。なお、この誤差信号が符号化歪みに相当する。

聴感重み付け部１１１は、加算器１１０から出力された符号化歪みに対して聴感的な重み付けを施し、歪み最小化部１１２に出力する。

歪み最小化部１１２は、聴感重み付け部１１１から出力された符号化歪みが最小となるような、適応符号帳１０３、固定符号帳１０４およびゲイン符号帳１０５の各インデックス（符号）をサブフレームごとに求め、これらのインデックスを符号化情報としてＣＥＬＰ符号化装置１００の外部に出力する。より詳細には、上記の適応符号帳１０３および固定符号帳１０４に基づいて合成信号を生成し、この信号の符号化歪みを求める一連の処理は閉ループ制御（帰還制御）となっており、歪み最小化部１１２は、各符号帳に指示するインデックスを１サブフレーム内において様々に変化させることによって各符号帳を探索し、最終的に得られる、符号化歪みを最小とする各符号帳のインデックスを出力する。

なお、符号化歪みが最小となる際の駆動音源は、サブフレームごとに適応符号帳１０３へフィードバックされる。適応符号帳１０３は、このフィードバックにより、記憶されている駆動音源を更新する。

ここで、適応符号帳１０３の探索方法について説明する。一般的に、適応符号帳ベクトルと固定符号帳ベクトルとはオープンループで（別々のループで）探索され、音源ベクトルの探索とインデックス（符号）の導出とは以下の式（１）の符号化歪を最小化する音源ベクトルを探索することにより行われる。

Ｅ：符号化歪、ｘ：符号化ターゲット（聴感重み付き音声信号）、ｐ：適応符号帳ベクトル、Ｈ：聴感重み付き合成フィルタ（インパルス応答の行列）、ｇ：適応符号帳ベクトルの理想ゲイン

ここで、ゲインｇが理想ゲインであるとすると、上式（１）をｇで偏微分した式が０になることからｇを消去でき、上式（１）は、以下の式（２）のコスト関数に変形できる。なお、式（２）において添字ｔはベクトルの転置を示す。

つまり、上式（１）の符号化歪Ｅを最小にする適応符号帳ベクトルｐは、上式（２）のコスト関数を最大にするものである。ただし、符号化ターゲットｘと、インパルス応答Ｈが畳み込まれた適応符号帳ベクトル（合成された適応符号帳ベクトル）Ｈｐとが正の相関を持つ場合に限定するために、式（２）の分子項を２乗せずに、分母項の平方根を取ることとする。すなわち、式（２）の分子項は、符号化ターゲットｘと、合成された適応符号帳ベクトルＨｐとの相関値を表し、式（２）の分母項は、合成された適応符号帳ベクトルＨｐのパワの平方根を表す。

よって、適応符号帳１０３の探索の際、ＣＥＬＰ符号化装置１００は、上式（２）に示すコスト関数を最大にする適応符号帳ベクトルｐを探索し、コスト関数を最大にする適応符号帳ベクトルのインデックス（符号）を、ＣＥＬＰ符号化装置１００の外部へ出力する。

次に、図２は、本実施の形態に係る歪み最小化部１１２の内部構成のうち、適応符号帳探索に係る構成を示すブロック図である。つまり、図２は、本発明に係るベクトル量子化装置（適応符号帳の量子化装置）を内部構成の一部として備えた歪み最小化部１１２の一例を示すブロック図である。

図２に示すベクトル量子化装置には、聴感重み付け部１１１において聴感的な重み付けが施された符号化歪み（適応符号帳探索のターゲットベクトル）、および、聴感重み付け部１１１における合成フィルタ（聴感重み付き合成フィルタ）のインパルス応答が入力される。

図２において、フィルタリング部２０１は、聴感重み付き合成フィルタのインパルス応答に、バンドパスフィルタを掛ける。具体的には、フィルタリング部２０１は、インパルス応答に、ＦＩＲ（Finite Impulse Response）フィルタの係数を畳み込む。そして、フィルタリング部２０１は、フィルタリング後の聴感重み付き合成フィルタのインパルス応答（第１信号）を短縮部２０２に出力する。ここで、本実施の形態で使用するバンドパスフィルタの伝達関数の一例を以下の式（３）に示し、式（３）に示す伝達関数の周波数特性を図４に示す。

図４に示す周波数特性では、２ｋＨｚ付近から０Ｈｚに向かってハイパス特性が有ることが分かる。また、図４に示す周波数特性では、４ｋＨｚ付近から８ｋＨｚに向かってローパス特性が有ることが分かる。つまり、フィルタリング部２０１におけるバンドパスフィルタは、ローパス特性およびハイパス特性の双方を有する。なお、聴感重み付き合成フィルタのインパルス応答にバンドパスフィルタを掛ける際の計算量をできるだけ少なくするべく、低次元（４次）のバンドパスフィルタとしたため、図４に示す周波数特性において６ｋＨｚから８ｋＨｚまでの間に透過特性が有る。しかし、聴感重み付き合成フィルタのインパルス応答には、この周波数帯域（６ｋＨｚ〜８ｋＨｚ）の成分があまり含まれていないため、透過特性による大きな影響は受けない。

ここで、有声性の有る信号では低周波数領域で周期性を安定して分析することができる。従って、フィルタリング部２０１がインパルス応答にバンドパスフィルタ（式（３）、図４）を掛けることで、フィルタのローパス特性により、音声品質をほとんど劣化させずにダウンサンプリングを行うことが可能となる。これにより、ターゲットベクトルと、インパルス応答が畳み込まれた適応符号帳ベクトル（合成された適応符号帳ベクトル）との相関値、および、合成された適応符号帳ベクトルのパワをより少ない積和数で求めることができる。このため、適応符号帳探索における計算量を、音声品質をほとんど劣化させずに削減することができる。

また、聴感重み付き合成フィルタのインパルス応答には低周波の大きな波が存在し、高次数成分に低周波数領域の大きな振幅を有する。そこで、フィルタリング部２０１がインパルス応答にバンドパスフィルタ（式（３）、図４）を掛けることで、フィルタのハイパス特性により、インパルス応答の成分を低次数成分に集めることができる。よって、インパルス応答の成分を低次の部分のみに短縮することにより、インパルス応答と適応符号帳ベクトルとの畳み込みに要する計算量を削減することが可能となる。

短縮部２０２は、フィルタリング部２０１から入力される、フィルタリング後の聴感重み付き合成フィルタのインパルス応答の成分を、低次の部分のみに短縮する。例えば、聴感重み付け部１１１から入力されるインパルス応答の次数を、フレームの次数と同一の６４次（０番目〜６３番目）とする。このとき、短縮部２０２は、フィルタリング部２０１から入力されるインパルス応答を、０番目〜２３番目までの２４次のみに短縮する。以下の説明では、低次の部分のみに短縮されたインパルス応答を「改良インパルス応答（または、短縮信号）」と呼ぶ。そして、短縮部２０２は、改良インパルス応答（短縮信号）を、畳込部２０３および探索部２０４に出力する。

畳込部２０３は、以下の式（４）に従って、適応符号帳１０３から入力される適応符号帳ベクトル（適応符号帳のコードベクトル）全体に対して、短縮部２０２から入力される改良インパルス応答（短縮信号）を畳み込む。

ｙ_０（ｎ）：合成された最初の適応符号帳ベクトル
ｕ（Ｔ_{ｓｔａｒｔ}＋ｉ）：適応符号帳ベクトル（適応符号帳のコードベクトル）
Ｔ_{ｓｔａｒｔ}：コードベクトルとして最初に用いられるラグ（ピッチディレイ）
Ｈ（ｎ−ｉ）：改良インパルス応答

そして、畳込部２０３は、得られる、合成された最初の適応符号帳ベクトルｙ_０（ｎ）（第２信号）を、探索部２０４に出力する。

探索部２０４には、様々な適応符号帳ベクトルが適応符号帳１０３から入力される。図３は、図２における探索部２０４の内部構成の一例を示すブロック図である。探索部２０４は、計算部２０５、比較部２０６および更新部２０７の３つの構成部から成り、各構成部における３つの過程により、適応符号帳ベクトルの量子化（符号化）を行う。

探索部２０４の計算部２０５は、畳込部２０３から入力される、合成された適応符号帳ベクトル（第２信号）、および、聴感重み付け部１１１から入力されるターゲットベクトルを用いて、以下の式（５）に示すコスト関数Ｅ_ｋ（ｋ：適応符号帳ベクトルの番号）を算出する。ただし、ターゲットベクトルと、合成された適応符号帳ベクトルとが正の相関を持つ場合に限定するために、式（５）の分子項を２乗せずに、分母項の平方根を取ることとする。すなわち、式（５）の分子項は、ターゲットベクトルｘと、合成された適応符号帳ベクトルｙ_ｋとの相関値を表し、式（５）の分母項は、合成された適応符号帳ベクトルｙ_ｋのパワの平方根を表す。

ｘ（２ｎ）：ターゲットベクトル
ｙ_ｋ（２ｎ）：合成された適応符号帳ベクトル

ここで、合成された適応符号帳ベクトルｙ_ｋ（２ｎ）は、改良インパルス応答で合成されているので、上式（５）では積和計算を間引くことができる。つまり、計算部２０５は、式（５）に示すように、適応符号帳ベクトル（コードベクトル）ｙ_ｋの要素およびターゲットベクトルｘの要素を間引いて、コスト関数を計算する。本実施の形態では、１サンプル置き（つまり、２ｎ（ｎ＝０，１，…，３１））に積和を取ることとする。すなわち、積和数は、１サンプル毎（ｎ＝０，１，…，６３）に積和を取る場合、つまり、積和計算を間引かない場合の１／２（つまり、間引き率が１／２）となる。ＶＭＲ−ＷＢの規格書（非特許文献２）に記載されている関数Ｔ_ｋの式（5.16.1-1）と比較すると、本発明におけるコスト関数Ｅ_ｋの積和計算の対象（ｎ＝０〜３１のみ）が削減されていることが明らかである。

探索部２０４の比較部２０６は、計算部２０５で順次算出されるコスト関数Ｅ_ｋを比較し、算出されたコスト関数の中で最も大きい値Ｅ_ｋおよびその係数ｋを保持する。そして、比較部２０６は、適応符号帳探索の結果、最も大きいコスト関数Ｅ_ｋの係数ｋを、最適な適応符号帳ベクトルの番号ｋとする。

探索部２０４の更新部２０７は、以下の式（６）に従って、合成された適応符号帳ベクトルｙ_ｋ（ｎ）を更新する。すなわち、更新部２０７は、式（６）に示すようにして、１つ前の番号（ｋ−１）の合成された適応符号帳ベクトルｙ_ｋ−１（ｎ−１）との差分（ｕ（−ｋ）Ｈ（ｎ））だけを計算することにより、合成された適応符号帳ベクトルｙ_ｋ（ｎ）を更新する。本実施の形態では、６４次から２４次に短縮された改良インパルス応答Ｈを用いるため、式（６）に示すように、積和計算はｎ＝０〜２３のみで行われる。ここで、ＶＭＲ−ＷＢの規格書（非特許文献２）に記載されている式（5.16.1-2）と比較すると、本発明の式（６）では積和計算の対象（ｎ＝０〜２３のみ）が削減されていることが明らかである。

以上のようにして、探索部２０４は、インデックス（符号、つまり、最適な適応符号帳ベクトルの番号ｋ）を求め、出力する。

次に、本発明の効果を示す符号化シミュレーションの結果を図５に示す。図５では、様々な環境騒音が付加された１６個の音声データの平均値を示す。また、図５に示すオリジナル（従来方法）のコーデックは、ＩＴＵ−Ｔ標準Ｇ．７１８準拠の浮動小数点シミュレータであり、ビットレートを１２ｋｂｐｓとする。また、図５に示す計算量（ＷＭＯＰＳ：Weighted Mega Operation Per Second）は、適応符号帳探索に係る部分のみのオペレーションを集計したものである。

図５に示すように、本発明に係る符号化装置を用いた場合には、オリジナルの符号化装置を用いた場合と比較して音声品質（Ｓ／Ｎ比）の劣化は見られない（若干向上している）のに対して、計算量は約２／３と大きく削減されている。すなわち、インパルス応答に対してフィルタリングを適用して、インパルス応答の次数を短縮（改良インパルス応答の使用）し、かつ、適応符号帳探索時のコスト関数の積和計算を間引くことで、音声品質を劣化させずに、適応符号帳探索時の計算量を大幅に削減できることが検証された。

また、音声の環境条件によって音声品質の劣化が生じないことを検証するための符号化シミュレーションの結果を図６に示す。図６に示すオリジナル（従来方法）のコーデックは、図５と同様、ＩＴＵ−Ｔ標準Ｇ．７１８準拠の浮動小数点シミュレータであり、ビットレートを１２ｋｂｐｓとする。また、図６では、環境条件として、図５と同様の様々な環境騒音が付加された１６個の音声データの平均値（条件：１６音声平均）、ノイズ無しの音声データ（条件：クリーン）、走行中の車の騒音が付加された音声データ（条件：カーノイズ）およびバブルノイズ（有色ノイズ）が付加された音声データ（条件：バブルノイズ）を用いる。

図６に示すように、（条件：カーノイズ）では、本発明の符号化装置を用いた場合には、オリジナルの符号化装置を用いた場合と比較して音声品質（Ｓ／Ｎ比）が僅かに下回るものの、全体的に音声品質の劣化はほとんど見られない。すなわち、いずれの環境条件においても音声品質の劣化が見られず、本発明の頑健性が検証された。

以上のように本実施の形態によれば、有声性のある信号では低周波数領域で安定して周期性を分析できることから、インパルス応答にローパス特性を有するフィルタを掛けることで、ローパス特性により、音声品質をほとんど落とさずにダウンサンプリングを行うことが可能となる。これにより、符号帳探索時の積和計算に要する計算量を削減することができる。また聴感重み付き合成フィルタのインパルス応答は低周波の大きな波により高次数成分まで大きな振幅を持つ。このことから、インパルス応答にハイパス特性を有するフィルタを掛けることで、ハイパス特性により、インパルス応答の成分を低次数成分に集めることができ、インパルス応答を低次の部分だけに短縮することができる。これにより、インパルス応答と符号帳ベクトルとの畳み込みに要する計算量を削減することができる。つまり、前記２つの計算量の削減により音声コーデックの計算量の大幅な削減が可能となる。

具体的には、本実施の形態によれば、聴感重み付き合成フィルタのインパルス応答に対して、ローパス特性およびハイパス特性を有するフィルタを畳み込む。これにより、ＣＥＬＰ符号化装置では、フィルタのローパス特性によりダウンサンプリングを行うことで、コスト関数（式（５））の積和計算において積和を取る対象を間引くことができるため、適応符号帳探索時の計算量を削減することができる。さらに、ＣＥＬＰ符号化装置では、フィルタのハイパス特性によりインパルス応答の次数を短縮することで、合成された適応符号帳ベクトルを算出する際（式（６））の積和を取る対象を削減できるため、適応符号帳探索時の計算量を削減することができる。よって、本実施の形態によれば、広帯域のディジタル信号をＣＥＬＰで符号化する場合でも、音声品質を劣化させることなく、音声コーデックの計算量を削減することができる。

なお、本実施の形態では、フレームの次数を６４次とし、インパルス応答の短縮数（短縮後の次数）を２４次とし、積和計算の間引き率を１／２とする場合について説明した。しかし、これらの数値は一例であり、他のどのような仕様においても本発明を適用することができる。

また、本実施の形態では、ローパス特性およびハイパス特性を有するバンドパスフィルタを用いる場合について説明したが、バンドパスフィルタの代わりに、ローパスフィルタとハイパスフィルタとを組み合わせて用いてもよい。また、本実施の形態では、ローパス特性およびハイパス特性の双方を有するフィルタを用いる場合について説明したが、ローパス特性およびハイパス特性のいずれか一方を有するフィルタを用いてもよい。つまり、図２に示す短縮部２０２は、フィルタリング部２０１のフィルタがハイパス特性を有する場合、フィルタリング後のインパルス応答の次数を短縮すればよい。同様に、図２に示す探索部２０４（計算部２０５）は、フィルタリング部２０１のフィルタがローパス特性を有する場合、コスト関数（式（５））において、適応符号帳ベクトルの要素およびターゲットベクトルの要素を間引いて適応符号帳探索を行えばよい。また、本実施の形態では、バンドパスフィルタの次数を、式（３）に示すように４次としたが、本発明はこれに限らず、バンドパスフィルタの次数を他の次数としてもよい。

また、探索部２０４の計算部２０５において式（５）に示すコスト関数の分子を相関値とし、分母をパワの平方根とした場合について説明した。しかし、本発明では、コスト関数の分子を相関値の２乗とし、分母をパワとしてもよい。さらに、正の相関を持つ場合にアドバンテージを持たせる場合には、コスト関数において、相関値の２乗に相関値の極性（＋−）を乗ずればよい。また、この場合には、コスト関数において平方根を取らないため、計算量をさらに削減することができる。

また、本実施の形態では、適応符号帳の量子化（符号化）に本発明を適用する場合について説明した。しかし、適応符号帳に限らず、例えば、固定符号帳に対しても本発明を適用することができる。また、ローパス特性を持つフィルタ（本実施の形態では図４に示す特性を有するバンドパスフィルタ）の使用、および、探索部２０４の計算部２０５におけるコスト関数の計算方法（積和計算を間引くアルゴリズム）は、ＣＥＬＰにおける適応符号帳探索のピッチの限定における前処理として行われるオープンループピッチ探索に用いることができる。

（実施の形態２）
まず、本実施の形態に係るＣＥＬＰ符号化装置１００の適応符号帳１０３（図１）の探索方法について説明する。実施の形態１と同様、適応符号帳ベクトルと固定符号帳ベクトルとはオープンループで（別々のループで）探索され、音源ベクトルの探索とインデックス（符号）の導出は式（１）の符号化歪を最小化する音源ベクトルを探索することにより行われる。

また、式（１）において、ゲインｇが理想ゲインであるとすると、式（１）をｇで偏微分した式が０になることからｇを消去でき、式（１）は、式（２）のコスト関数に変形できる。つまり、式（１）の符号化歪Ｅを最小にする適応符号帳ベクトルｐは、式（２）のコスト関数を最大にするものである。

ここで、実施の形態１では、符号化ターゲットｘと、インパルス応答Ｈが畳み込まれた適応符号帳ベクトル（合成された適応符号帳ベクトル）Ｈｐとが正の相関を持つ場合に限定するために、式（２）の分子項を２乗せずに、分母項の平方根を取ることとした。

これに対して、本実施の形態では、次式（７）に示すように、式（２）のような平方根の計算を行わない。具体的には、式（７）に示すコスト関数の分子項では、聴感重み付き合成フィルタのインパルス応答を用いて求められる探索用畳み込みベクトルＭが畳み込まれた適応符号帳ベクトル（合成ベクトル）Ｍｐが計算される。そして、式（７）に示すコスト関数の分子項は、合成ベクトル（Ｍｐ）と符号化ターゲット（ｘ）とを乗じた相関値（ｘ^ｔＭｐ）に、その相関値の絶対値（｜ｘ^ｔＭｐ｜）を乗じることにより得られる。また、式（７）に示すコスト関数の分母項は、合成ベクトル（Ｍｐ）のパワ（ｐ^ｔＭ^ｔＭｐ）を計算することにより得られる。

Ｍ：探索用畳み込みベクトルの畳み込みマトリクス

式（７）に示すコスト関数の計算により、式（２）に示すコスト関数のように「平方根」という特殊関数を計算することなく、かつ、符号化ターゲットｘと合成ベクトルＭｐとが正の相関を持つ場合に限定することができる。

そして、適応符号帳１０３の探索の際、ＣＥＬＰ符号化装置１００は、上式（７）に示すコスト関数を最大にする適応符号帳ベクトルｐを探索し、コスト関数を最大にする適応符号帳ベクトルのインデックス（符号）を、ＣＥＬＰ符号化装置１００の外部へ出力する。

次に、図７は、本実施の形態に係るＣＥＬＰ符号化装置１００（図１）の歪み最小化部１１２の内部構成のうち、適応符号帳探索に係る構成を示すブロック図である。つまり、図７は、本発明に係るベクトル量子化装置（適応符号帳の量子化装置）を内部構成の一部として備えた歪み最小化部１１２の一例を示すブロック図である。なお、図７において、実施の形態１（図２）と同一の構成要素には同一の符号を付しその説明を省略する。

図７に示すベクトル量子化装置には、聴感重み付け部１１１（図１）において聴感的な重み付けが施された符号化歪み（適応符号帳探索のターゲットベクトル）、および、聴感重み付け部１１１における合成フィルタ（聴感重み付き合成フィルタ）のインパルス応答が入力される。

図７において、探索用畳み込みベクトル計算部３０１は、フィルタリング部３０２及び切出部３０３で構成され、聴感重み付き合成フィルタのインパルス応答を用いて、探索用畳み込みベクトルの畳み込みマトリクス（式（７）に示すＭ）を計算する。

具体的には、探索用畳み込みベクトル計算部３０１のフィルタリング部３０２は、聴感重み付き合成フィルタのインパルス応答に、フィルタを掛ける。具体的には、フィルタリング部３０２は、インパルス応答に、ＦＩＲフィルタの係数を畳み込む。そして、フィルタリング部３０１は、フィルタリング後の聴感重み付き合成フィルタのインパルス応答（第１信号）を切出部３０２に出力する。ここで、本実施の形態で使用するフィルタの伝達関数の一例を以下の式（８）に示す。なお、式（８）に示す伝達関数の周波数特性は、実施の形態１の式（３）（図４）に示す周波数特性よりも特性（ローパス特性又はハイパス特性）が弱い。

フィルタリング部３０２において、インパルス応答に式（８）に示す伝達関数を有するフィルタを掛けることで、フィルタのハイパス特性により、出力ベクトルの成分を低次数成分に集めることができる。よって、探索用畳み込みベクトルを低次部分のみに短く限定することにより、インパルス応答と適応符号帳ベクトルとの畳み込みに要する計算量を削減することが可能となる。

切出部３０３は、フィルタリング部３０２から入力される、フィルタリング後の聴感重み付き合成フィルタのインパルス応答（第１信号）の低次部分を切り出して、切り出した部分を探索用畳み込みベクトル（Ｍ）（または、部分信号と呼ぶ。）とする。例えば、聴感重み付け部１１１から入力されるインパルス応答の次数を、フレームの次数と同一の６４次（０番目〜６３番目）とする。このとき、切出部３０３は、例えば、フィルタリング部３０２から入力されるインパルス応答のうち０番目〜２３番目までの２４次を切り出し、０番目〜２３番目までの２４次を探索用畳み込みベクトル（部分信号）とする。そして、切出部３０３は、探索用畳み込みベクトル（部分信号）を、畳込部２０３および探索部２０４に出力する。

畳込部２０３は、以下の式（９）に従って、適応符号帳１０３から入力される適応符号帳ベクトル（適応符号帳のコードベクトル）全体に対して、切出部３０３から入力される探索用畳み込みベクトル（部分信号）を畳み込む。つまり、畳込部２０３は、切出部３０３において切り出された、フィルタリング後の聴感重み付き合成フィルタのインパルス応答の低次部分を用いて畳み込みを行う。

ｙ_０（ｎ）：合成された最初の適応符号帳ベクトル（合成ベクトルの初期ベクトル）
ｕ（Ｔ_{ｓｔａｒｔ}＋ｉ）：適応符号帳ベクトル（適応符号帳のコードベクトル）
Ｔ_{ｓｔａｒｔ}：コードベクトルとして最初に用いられるラグ（ピッチディレイ）
Ｍ（ｎ−ｉ）：探索用畳み込みベクトル

探索部２０４には、様々な適応符号帳ベクトルが適応符号帳１０３から入力される。図８は、図７における探索部２０４の内部構成の一例を示すブロック図である。探索部２０４は、計算部３０４、比較部２０６および更新部３０５の３つの構成部から成り、各構成部における３つの過程により、適応符号帳ベクトルの量子化（符号化）を行う。

探索部２０４の計算部３０４は、畳込部２０３から入力される、合成された適応符号帳ベクトル、および、聴感重み付け部１１１から入力されるターゲットベクトルを用いて、コスト関数Ｅ_ｋ（ｋ：適応符号帳ベクトルの番号）を算出する。ただし、ターゲットベクトルと、合成ベクトルとが正の相関を持つ場合に限定する必要がある。そこで、本実施の形態では、計算部３０４は、式（７）を用いてコスト関数Ｅ_ｋの分子項及び分母項を計算する。

つまり、探索部２０４は、畳込部２０３においてフィルタリング後の聴感重み付き合成フィルタのインパルス応答（低次部分）が畳み込まれた適応符号帳ベクトル（複数のコードベクトル）とターゲットベクトルとの相関値（ｘ^ｔＭｐ）で表される分子項、および、畳込部２０３においてフィルタリング後の聴感重み付き合成フィルタのインパルス応答（低次部分）が畳み込まれた適応符号帳ベクトル（複数のコードベクトル）のパワ（ｐ^ｔＭ^ｔＭｐ）で表される分母項、から成るコスト関数を用いて、適応符号帳の探索を行う。また、上記コスト関数において、分子項は相関値（ｘ^ｔＭｐ）と相関値の絶対値（｜ｘ^ｔＭｐ｜）との乗算により得られ、分母項はパワ（ｐ^ｔＭ^ｔＭｐ）の計算により得られる。

また、本実施の形態では、適応符号帳の探索ループにおいて２回に１回の割合（つまり、１つ置きの適応符号帳ベクトル）でコスト関数の分母項（合成ベクトルのパワ）を計算することで、コスト関数の分母項の積和計算を間引く。つまり、分母項を求めるための積和の数は、積和計算を間引かない場合の１／２（つまり、間引き率が１／２）となる。また、計算部３０４は、式（１０）に従って、コスト関数の計算において積和計算が行われない適応符号帳ベクトルにおけるコスト関数の分母項（パワ）を、その適応符号帳ベクトルの前後の適応符号帳ベクトルにおけるコスト関数の分母項を用いた補間により求める。

Ｕ_ｋ：コスト関数の分子項
Ｌ_ｋ：コスト関数の分母項の逆数
ｘ（ｎ）：ターゲットベクトル
ｙ_ｋ（ｎ）：合成ベクトル

式（１０）に示すように、適応符号帳の探索ループにおけるループカウンタであり、適応符号帳ベクトルの番号とタイムラグとに同期する係数ｋが偶数または探索ループにおける最後の値である場合、計算部３０４は、コスト関数の分子項および分母項を計算する。なお、式（１０）に示すようにコスト関数の分母項としては、分母項の逆数Ｌ_ｋが計算される。そして、計算部３０４は、式（１０）に示すように、分子項Ｕ_ｋおよび分母項の逆数Ｌ_ｋを用いて、コスト関数Ｅ_ｋを計算する。

また、このとき、式（１０）において係数ｋが最初の値でない場合には、ｋの１つ前の（ｋ−１）において分母項（つまり、分母項の逆数）Ｌ_ｋ−１が計算されなかった（間引かれた）ことになる。そこで、計算部３０４は、（ｋ−１）の前後の、（ｋ−２）における分母項の逆数Ｌ_ｋ−２とｋにおける分母項の逆数Ｌ_ｋとを用いた補間により、（ｋ−１）における分母項の逆数Ｌ_ｋ−１を求める。式（１０）では、分母項の逆数Ｌ_ｋ−１は、（ｋ−１）の前後（つまり、（ｋ−２）とｋ）の分母項の逆数の平均値となる。そして、計算部３０４は、式（１０）に従って、積和計算により得られた分子項Ｕ_ｋ−１および補間により得られた分母項（逆数）Ｌ_ｋ−１を用いて、（ｋ−１）におけるコスト関数Ｅ_ｋ−１を計算する。

また、式（１０）において係数ｋが奇数の場合、計算部３０４は、コスト関数の分子項Ｕ_ｋのみを計算して格納しておく。

換言すると、探索部２０４は、適応符号帳ベクトル（複数のコードベクトル）にそれぞれ付された係数（番号）であって、タイムラグに同期する係数ｋが偶数または探索ループの最後に対応する値の場合、係数ｋに対応するコードベクトルにおけるコスト関数の分母項を計算により求め、係数ｋが奇数の場合、係数ｋに対応するコードベクトルにおけるコスト関数の分母項を、係数（ｋ−１）に対応するコードベクトルにおけるコスト関数の分母項および係数（ｋ＋１）に対応するコードベクトルにおけるコスト関数の分母項を用いた補間により求める。すなわち、探索部２０４は、適応符号帳ベクトル（複数のコードベクトル）のうち、一部のコードベクトルではコスト関数の分母項を計算により求め、コスト関数の分母項が計算により求められた一部のコードベクトル以外のコードベクトルでは、コスト関数の分母項を、上記一部のコードベクトルで計算された分母項を用いた補間により求める。

ここで、着目すべき点は、計算部３０４において、コスト関数Ｅ_ｋの分母項の計算が１つおきの適応符号帳ベクトル（式（１０）ではｋが偶数の場合）に対して行われることでコスト関数Ｅ_ｋの分母項（パワ）計算のための積和計算回数が半分となること、および、コスト関数Ｅ_ｋの分母項の逆数を平均して分母項の補間を行うことにより、コスト関数Ｅ_ｋの分母項の逆数を計算する回数も半分になっていることである。一般（つまり、分母項の間引きを行わない場合）には、コスト関数Ｅ_ｋの分母項（パワ）に対して上述したような補間方法が行われることはない。しかし、本発明の発明者は、適応符号帳の探索ループにおいて各ラグが推移していくとコスト関数の分母項が十分に緩慢に変化していくことに着目し、コスト関数の計算において上述した分母項の補間方法を用いることが可能であることを発見した。本発明の発明者は、この分母項の補間方法を用いることによる特別な不都合が無いことを確認してある。

探索部２０４の比較部２０６は、計算部３０４で順次算出されるコスト関数Ｅ_ｋを比較し、算出されたコスト関数の中で最も大きい値Ｅ_ｋおよびその係数ｋを保持する。そして、比較部２０６は、適応符号帳探索の結果、最も大きいコスト関数Ｅ_ｋの係数ｋを、最適な適応符号帳ベクトルの番号ｋとする。

探索部２０４の更新部３０５は、以下の式（１１）に従って、合成ベクトルｙ_ｋ（ｎ）を更新する。すなわち、更新部３０５は、式（１１）に示すようにして、１つ前の番号（ｋ−１）の合成ベクトルｙ_ｋ−１（ｎ−１）との差分（ｕ（−ｋ）Ｍ（ｎ））だけを計算することにより、合成ベクトルｙ_ｋ（ｎ）を更新する。本実施の形態では、６４次から２４次に短縮された探索用畳み込みベクトルＭを用いるため、式（１１）に示すように、積和計算はｎ＝０〜２３のみで行われる。ここで、ＶＭＲ−ＷＢの規格書（非特許文献２）に記載されている式（5.16.1-2）と比較すると、本発明の式（１１）では積和計算の対象（ｎ＝０〜２３のみ）が削減されていることが明らかである。

次に、本発明の効果を示す符号化シミュレーションの結果を図９に示す。図９では、様々な環境騒音が付加された、サンプリングレート１６ｋＨｚの１６個の音声データの平均値を示す。また、図９に示すオリジナル（従来方法）のコーデックは、ＩＴＵ−Ｔ標準Ｇ．７１８準拠の浮動小数点シミュレータであり、ビットレートを８ｋｂｐｓとする。また、図９に示す計算量（ＷＭＯＰＳ：Weighted Mega Operation Per Second）は、適応符号帳探索に係る部分のみのオペレーションを集計したものである。

図９に示すように、本発明に係る符号化装置を用いた場合には、オリジナルの符号化装置を用いた場合と比較して音声品質（Ｓ／Ｎ比及びセグメンタルＳ／Ｎ比）の劣化はほぼ見られないのに対して、計算量は約３／５と大きく削減されている。すなわち、インパルス応答に対するフィルタリングの適用、インパルス応答の次数の短縮（探索用畳み込みベクトルの使用）、適応符号帳探索時のコスト関数における平方根の不使用、及び、適応符号帳探索時のコスト関数の分母項（パワ）計算の間引きにより、音声品質を大幅に劣化させずに、適応符号帳探索時の計算量を大幅に削減できることが検証された。

さらに、本発明の発明者は、音声の環境条件によって聴感的に音声品質の劣化が生じないことを検証するための試聴実験を行った。試聴実験の環境条件として、ノイズ無しの音声データ（条件：クリーン）、オフィスでの騒音が付加された音声データ（条件：オフィスノイズ）、背景に音楽が付加された音声データ（条件：背景音楽）、バブルノイズ（有色ノイズ）が付加された音声データ（条件：バブルノイズ）、及び、対象となる音声データに対して干渉となる音声が付加された音声データ（条件：干渉話者）の５つの環境条件を用いる。また、評価対象は、「条件：クリーン」の８個の音声データ、「条件：オフィスノイズ」の２個の音声データ、「条件：背景音楽」の２個の音声データ、「条件：バブルノイズ」の２個の音声データ、及び、「条件：干渉話者」の２個の音声データの１６データとする。また、評価方法は、一対比較試験（被験者がオリジナル及び本発明を試聴してどちらがどれだけ良いかを比較する方法）を用いた。また、評価段階は５つ（１：オリジナルが良い、２：オリジナルが僅かに良い、３：どちらとも言えない、４：本発明が僅かに良い、５：本発明が良い）である。また、被験者は３人（被験者Ａ，Ｂ，Ｃ）である。

被験者Ａ，Ｂ，Ｃ毎の評価結果を図１０に示す。図１０に示すように、各被験者ともにオリジナルと本発明とで全体的にほとんど優劣がない。また、環境条件毎の各被験者の評価結果を図１１に示す。図１１に示すように、各環境条件においてもオリジナルと本発明とで全体的にほとんど優劣がない。

すなわち、図１０及び図１１に示すように、本発明を用いる場合でも、オリジナルと比較して、音声の環境条件によって聴感的に音声品質の劣化が生じないことが検証された。つまり、いずれの環境条件においても音声品質の劣化が見られず、本発明の頑健性が検証された。

以上のように本実施の形態によれば、実施の形態１と同様、インパルス応答にローパス特性を有するフィルタを掛けることで、ローパス特性により、音声品質をほとんど落とさずにダウンサンプリングを行うことが可能となる。これにより、符号帳探索時の積和計算に要する計算量を削減することができる。

また聴感重み付き合成フィルタのインパルス応答は低周波の大きな波により高次数成分まで大きな振幅を持つ。このことから、実施の形態１と同様、インパルス応答にハイパス特性を有するフィルタを掛けることで、ハイパス特性により、インパルス応答の成分を低次数成分に集めることができる。よって、本実施の形態によれば、インパルス応答の低次の部分だけを切り出すことにより、インパルス応答と符号帳ベクトルとの畳み込みに要する計算量を削減することができる。

また、本実施の形態によれば、符号帳探索時に用いるコスト関数の分母項（パワ）計算を間引き、かつ、間引かれた分母項の値を前後に計算された分母項で補間する。これにより、符号帳探索時のコスト関数の精度を劣化させることなく、分母項の計算量を削減することができる。

また、本実施の形態によれば、符号帳探索時に用いるコスト関数（式（７））において平方根（特殊関数）を使用しない。これにより、特殊関数の計算に必要な計算を省略することができ、符号帳探索時に要する計算量を削減することができる。

つまり、前記４つの計算量の削減により音声コーデックの計算量の大幅な削減が可能となる。よって、本実施の形態によれば、音声品質をほとんど劣化させることなく、音声コーデックの計算量を、実施の形態１よりもさらに削減することができる。

なお、本実施の形態では、フレームの次数を６４次とし、探索用畳み込みベクトル長を２４次とし、積和計算の間引き率を１／２とする場合について説明した。しかし、これらの数値は一例であり、他のどのような仕様においても本発明を適用することができる。

また、本実施の形態では、実施の形態１と比較して特性（ローパス特性およびハイパス特性）が弱いバンドパスフィルタを用いる場合について説明したが、バンドパスフィルタの代わりに、ローパスフィルタとハイパスフィルタとを組み合わせて用いてもよい。また、本実施の形態では、バンドパスフィルタの次数を、式（８）に示すように３次としたが、本発明はこれに限らず、バンドパスフィルタの次数を他の次数としてもよい。

以上、本発明の各実施の形態について説明した。

なお、上記実施の形態ではＣＥＬＰにおける適応符号帳の探索を一例として説明したが、ＣＥＬＰに限らず、ベクトル量子化を用いたスペクトルの量子化方法であれば本発明を適用することができる。例えば、ＭＤＣＴ（Modified Discrete Cosine Transform）またはＱＭＦ（Quadrature Mirror Filter）を用いたスペクトル量子化方法に対して本発明を適用してもよい。また、帯域拡張技術における低周波数領域のスペクトルの中から類似するスペクトル形状を探索するアルゴリズムに対して本発明を適用することで、そのアルゴリズムの計算量削減に応用することもできる。

また、上記実施の形態におけるベクトル量子化装置、あるいは、これを含む音声符号化装置を、基地局装置あるいは端末装置に適用することも可能である。

また、上記実施の形態においては、ハードウェアで構成する場合を例に説明したが、本発明はこれに限らず、ソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係るベクトル量子化装置あるいは音声符号化装置等と同様の機能を実現することができる。

また、上記実施の形態の各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されても良いし、一部または全てを含むように１チップ化されても良い。ここで、ＬＳＩは、集積度の違いによって、ＩＣ、システムＬＳＩ、スーパーＬＳＩまたはウルトラＬＳＩ等と呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現しても良い。ＬＳＩ製造後に、プログラム化することが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。

さらに、半導体技術の進歩または派生する別技術により、ＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。

２００９年１０月２０日出願の特願２００９−２４１６１６および２０１０年５月１４日出願の特願２０１０−１１２３７４の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

本発明にかかるベクトル量子化装置およびベクトル量子化方法は、特にＣＥＬＰを用いた音声コーデックに好適である。

１００ＣＥＬＰ符号化装置
１０１ＬＰＣ分析部
１０２ＬＰＣ量子化部
１０３適応符号帳
１０４固定符号帳
１０５ゲイン符号帳
１０６、１０７乗算器
１０８、１１０加算器
１０９ＬＰＣ合成フィルタ
１１１聴感重み付け部
１１２歪み最小化部
２０１，３０２フィルタリング部
２０２短縮部
２０３畳込部
２０４探索部
２０５，３０４計算部
２０６比較部
２０７，３０５更新部
３０１探索用畳み込みベクトル計算部
３０３切出部

Claims

複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化装置であって、
聴感重み付き合成フィルタのインパルス応答を入力し、ローパス特性およびハイパス特性の一方または双方を有するフィルタを前記インパルス応答に掛けて第１信号を生成するフィルタリング手段と、
前記複数のコードベクトルそれぞれに前記第１信号を畳み込んで第２信号を生成する畳込手段と、
前記第２信号とターゲットベクトルとを用いて前記探索を行う探索手段と、
を具備するベクトル量子化装置。
前記第１信号の次数を短縮して短縮信号を生成する短縮手段を、さらに具備し、
前記畳込手段は、
前記第１信号の代わりに前記短縮信号を入力し、前記短縮信号を畳み込みに用いて前記第２信号を生成する、
請求項１記載のベクトル量子化装置。
前記探索手段は、
前記第２信号の要素、および、前記ターゲットベクトルの要素を間引いて前記探索を行う、
請求項１記載のベクトル量子化装置。
前記フィルタリング手段は、
ＣＥＬＰにおける適応符号帳の前記探索において、前記フィルタを、前記インパルス応答に掛ける、
請求項１記載のベクトル量子化装置。
前記第１信号の低次部分を切り出して部分信号を生成する切出し手段を、さらに具備し、
前記畳込手段は、
前記第１信号の代わりに前記部分信号を入力し、前記部分信号を畳み込みに用いて前記第２信号を生成する、
請求項１記載のベクトル量子化装置。
前記探索手段は、
前記第２信号と前記ターゲットベクトルとの相関値で表される分子項、および、前記第２信号のパワで表される分母項、から成る関数を用いて前記探索を行い、
前記関数において、
前記分子項は前記相関値と前記相関値の絶対値との乗算により得られ、前記分母項は前記パワの計算により得られる、
請求項５記載のベクトル量子化装置。
前記探索手段は、
前記複数のコードベクトルのうち、一部のコードベクトルでは前記分母項を計算により求め、前記一部のコードベクトル以外のコードベクトルでは、前記分母項を、前記一部のコードベクトルで計算された前記分母項を用いた補間により求める、
請求項６記載のベクトル量子化装置。
前記探索手段は、
前記複数のコードベクトルにそれぞれ付された係数であって、タイムラグに同期する係数ｋが偶数または前記探索の最後に対応する値の場合、前記係数ｋに対応するコードベクトルにおける前記分母項を計算により求め、前記係数ｋが奇数の場合、前記係数ｋに対応するコードベクトルにおける前記分母項を、係数（ｋ−１）に対応するコードベクトルにおける前記分母項および係数（ｋ＋１）に対応するコードベクトルにおける前記分母項を用いた補間により求める、
請求項６記載のベクトル量子化装置。
請求項１記載のベクトル量子化装置を有する音声符号化装置。
請求項９記載の音声符号化装置を有する通信端末装置。
請求項９記載の音声符号化装置を有する基地局装置。
複数のコードベクトルにより構成される符号帳の探索を行い、符号化歪みが最小となるコードベクトルを示す符号を得るベクトル量子化方法であって、
ローパス特性およびハイパス特性の一方または双方を有するフィルタを、聴感重み付き合成フィルタのインパルス応答に掛けて第１信号を生成するフィルタリングステップと、
前記複数のコードベクトルそれぞれに前記第１信号を畳み込んで第２信号を生成する畳込ステップと、
前記第２信号とターゲットベクトルとを用いて前記探索を行う探索ステップと、
を具備するベクトル量子化方法。