JPWO2011086900A1

JPWO2011086900A1 - 符号化装置および符号化方法

Info

Publication number: JPWO2011086900A1
Application number: JP2011549931A
Authority: JP
Inventors: 智史山梨; 押切　正浩; 正浩押切
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2010-01-13
Filing date: 2011-01-12
Publication date: 2013-05-16
Anticipated expiration: 2031-01-12
Also published as: US8924208B2; EP2525354A4; JP5606457B2; US20120296640A1; EP2525354A1; WO2011086900A1; EP2525354B1

Abstract

極低ビットレートという条件下において、低演算量で、復号信号の品質を改善することができる符号化装置および符号化方法。スペクトル補正部（３０２）は、各サブバンドのサブスペクトルに対して、サブスペクトル平均値以上のサンプルに対しては何もせず、サブスペクトル平均値未満のサンプルをゼロにするという補正処理を施す。これによって、近傍探索部（３０３）、およびマルチレートインデキシング部（３０４）において、大きな品質劣化なしに、サブスペクトルを量子化するために必要なビット数を大きく減らすことができる。

Description

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置および符号化方法に関する。

インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、処理演算量が少ない符号化技術、またマルチレート符号化技術に対するニーズが高まっている。

このようなニーズに対して、符号化後の情報量を大幅に増加させることなく、低演算量にて音声・楽音信号を符号化する様々な技術が開発されてきている。例えば、一定時間分の入力信号を変換して得られるスペクトルデータに対して、複数のサブベクトルに分割し、各サブベクトルに対してマルチレート符号化する技術が開示されている（非特許文献１）。なお、上記非特許文献１に開示されているＥＡＶＱ（Embedded Algebraic Vector Quantization）に関連する技術は非特許文献２、非特許文献３、および特許文献１にも開示されている。

特表２００５−５２８８３９号

Stephane Ragot, Bruno Bessette, and Roch Lefebvre, "Low-complexity Multi-rate Lattice Vector Quantization with Application to Wideband TCX Speech Coding", ICASSP 2004 Minjie Xie and Jean-Pierre Adoul, "Embedded Algebraic Vector Quantizers (EAVQ) with Application to Wideband Speech Coding", IEEE 1996 ITU-T:G.718; Frame error robust narrowband and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s. ITU-T Recommendation G.718(2008)

しかしながら、上記先行技術文献に開示されたベクトル量子化技術は、演算量が小さいという利点を有する一方、符号化ビットレートが非常に低い場合には復号信号の品質が大幅に低下するという問題点がある。例えば、非特許文献３に開示されているＡＶＱ符号化方式では４ｋｂｉｔ／ｓまたは１２ｋｂｉｔ／ｓのビットレートにて符号化処理を行っている。また、各サブベクトルの量子化に、１／４／８／１６ビット／フレーム（但しボロノイ拡張符号化に用いるビットは除く）を用いる。ここで、符号化ビットレートが４ｋｂｉｔ／ｓの場合を例に挙げて説明する。非特許文献３に開示されている符号化方式においては、サブバンドエネルギの高いサブバンドから順に量子化されるが、仮に１６ビット／フレームで量子化される場合には、４ｋｂｉｔ／ｓではわずか数サブバンドほどしか量子化できない場合がある。この場合、帯域全体に対して、量子化したサブバンドの占める帯域は非常に少なく（例えば３５サブバンド中の３〜４サブバンド程度、等）、その結果、復号信号の品質が不十分になり得る。

本発明の目的は、極低ビットレートという条件下において、低演算量で、復号信号の品質を改善することができる符号化装置および符号化方法を提供することである。

本発明の符号化装置の一態様は、入力信号を直交変換してスペクトルデータを形成する直交変換手段と、前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正手段と、前記補正処理されたスペクトルデータをラティスベクトル（格子ベクトル）に変換する変換手段と、を備える。

本発明の符号化方法の一態様は、入力信号を直交変換してスペクトルデータを形成するステップと、前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正ステップと、前記補正処理されたスペクトルデータをラティスベクトル（格子ベクトル）に変換する変換ステップと、を具備する。

本発明によれば、非常に低いビットレートで、かつ非常に低い処理演算量で、広い帯域のスペクトルデータを符号化し、復号信号の品質を改善することができる。

本発明の一実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図図１に示した符号化装置の内部の主要な構成を示すブロック図図２に示したＡＶＱ符号化部の内部の主要な構成を示すブロック図図１に示した復号装置の内部の主要な構成を示すブロック図図４に示したＡＶＱ復号部の内部の主要な構成を示すブロック図

以下、本発明の一実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。

図１は、本発明の一実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図１において、通信システムは、符号化装置１０１と復号装置１０３とを備える。符号化装置１０１と復号装置１０３とは、伝送路１０２を介して通信可能な状態となっている。なお、符号化装置および復号装置はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。

符号化装置１０１は、入力信号をＮサンプルずつ区切り（Ｎは自然数）、Ｎサンプルを１フレームとしてフレーム毎に符号化を行う。すなわち、Ｎサンプルが符号化処理単位とされる。ここで、各符号化処理単位に対応する入力信号をｘ_ｎ（ｎ＝０、…、Ｎ−１）と表すこととする。ｎは、入力信号がＮサンプルずつ区切られた信号要素群のうち、ｎ＋１番目を示す。符号化装置１０１は、符号化によって得られた情報（以下「符号化情報」という）を、伝送路１０２を介して復号装置１０３に送信する。

復号装置１０３は、伝送路１０２を介して符号化装置１０１から送信された符号化情報を受信し、これを復号し出力信号を得る。

図２は、図１に示した符号化装置１０１の内部の主要な構成を示すブロック図である。符号化装置１０１は、直交変換処理部２０１およびＡＶＱ符号化部２０２から主に構成される。各部は以下の動作を行う。

直交変換処理部２０１は、バッファｂｕｆ１_ｎ（ｎ＝０、…、Ｎ−１）を内部に有する。直交変換処理部２０１は、入力信号ｘ_ｎを修正離散コサイン変換（ＭＤＣＴ：Modified Discrete Cosine Transform）する。

ここで、直交変換処理部２０１における直交変換（時間−周波数変換）処理について、その計算手順と内部バッファへのデータ出力に関して説明する。

まず、直交変換処理部２０１は、下記の式（１）によりバッファｂｕｆ１_ｎを、「０」を初期値として初期化する。

次いで、直交変換処理部２０１は、下記の式（２）に従って、入力信号ｘ_ｎに対し修正離散コサイン変換（ＭＤＣＴ）を行う。これにより、直交変換処理部２０１は、入力信号のＭＤＣＴ係数（以下、入力スペクトルと呼ぶ）Ｘ（ｋ）を求める。

ｋは１フレームにおける各サンプルのインデックスを示す。

直交変換処理部２０１は、入力信号ｘ_ｎとバッファｂｕｆ１_ｎとを結合させたベクトルであるｘ_ｎ’を下記の式（３）により求める。

次に、直交変換処理部２０１は、式（４）によりバッファｂｕｆ１_ｎを更新する。

そして、直交変換処理部２０１は、式（２）によって得られた入力スペクトルＸ（ｋ）をＡＶＱ符号化部２０２に出力する。

ＡＶＱ符号化部２０２は、直交変換処理部２０１から入力される入力スペクトルＸ（ｋ）を用いて符号化情報を生成する。ＡＶＱ符号化部２０２は、生成した符号化情報を伝送路１０２に出力する。

図３は、ＡＶＱ符号化部２０２の内部の主要な構成を示すブロック図である。ＡＶＱ符号化部２０２は、グローバルゲイン算出部３０１、スペクトル補正部３０２、近傍探索部３０３、マルチレートインデキシング部３０４、および多重化部３０５から主に構成される。各部は以下の動作を行う。

グローバルゲイン算出部３０１は、直交変換処理部２０１から入力される入力スペクトルＸ（ｋ）に対するグローバルゲインを算出する。グローバルゲインの算出方法については、非特許文献３に開示されており、本実施の形態における算出方法も同一方法である。具体的には、グローバルゲイン算出部３０１は、以下の式（５）および式（６）に従って、グローバルゲインｇを算出する。グローバルゲイン算出部３０１は、式（６）に従って算出したグローバルゲインを多重化部３０５に出力する。ここで、式（５）におけるＮＢ＿ＢＩＴＳは符号化処理に利用できるビット数を表し、Ｐは入力スペクトルＸ（ｋ）を分割するサブバンド数を表すものとする。

より詳細には、式（５）における１段目には、初期化に関する式が記載されている。そして、初期化の後に、式（５）では、３段目に記載された式による、第１のオフセット計算が行われる。一方で、６，７段目に記載された式による、第２のオフセット計算も行われる。また、４段目に記載された式により、ｎｂｉｔｓが求められる。そして、５段目の条件に基づいて、第１のオフセット計算によって求められたオフセット、又は、第２のオフセット計算によって求められたオフセットが選択される。すなわち、５段目の条件が満たされない場合には、第１のオフセット計算によって求められたオフセットが選択される。一方、５段目の条件が満たされる場合には、第２のオフセット計算によって求められたオフセットが選択される。

そして、式（６）では、式（５）で選択されたオフセットに基づいて、グローバルゲインｇが求められる。このグローバルゲインｇは、多重化部３０５へ出力される。

また、グローバルゲイン算出部３０１は、式（６）により算出したグローバルゲインｇを用いて入力スペクトルＸ（ｋ）を式（７）に従って正規化し、正規化した入力スペクトルＸ２（ｋ）をスペクトル補正部３０２に出力する。

スペクトル補正部３０２は、グローバルゲイン算出部３０１における処理と同様に、グローバルゲイン算出部３０１から入力される正規化された入力スペクトルＸ２（ｋ）をＰ個のサブバンドに分割する。ここで、Ｐ個の各サブバンドを構成するサンプル（ＭＤＣＴ係数）の数、つまりサブバンド幅をそれぞれＱ（ｐ）とする。なお、以下では、説明の簡略化のため、各サブバンド幅が全てＱである場合について説明するが、もちろん本発明はサブバンド毎にサブバンド幅が異なる場合についても同様に適用できる。

スペクトル補正部３０２は、Ｐ個に分割した各サブバンドのスペクトルに対して、補正処理を行う。なお、以下の説明では、各サブバンドのスペクトルをサブスペクトルＳＳ_ｐ（ｋ）（ｐ＝０、・・・、Ｐ−１、ｋ＝ＢＳ_ｐ、・・・、ＢＥ_ｐ）と呼ぶ。また、補正処理を施したサブスペクトルを補正サブスペクトルＭＳＳ_ｐ（ｋ）（ｐ＝０、・・・、Ｐ−１、ｋ＝ＢＳ_ｐ、・・・、ＢＥ_ｐ）と呼ぶ。ここで、ＢＳ_ｐ、およびＢＥ_ｐは各サブバンドの先頭サンプルのインデックス、および最終サンプルのインデックスをそれぞれ表す。

ここで、スペクトル補正部３０２におけるサブスペクトルの補正方法について説明する。

まず、スペクトル補正部３０２は、各サブバンドに対して、以下の式（８）に従って、サブスペクトルＳＳ_ｐ（ｋ）の平均振幅値Ａｖｅ_ｐを算出する。

次に、スペクトル補正部３０２は、式（８）により算出したサブスペクトル平均値Ａｖｅ_ｐを用いて、以下の式（９）に従って、各サブバンドのサブスペクトルを補正し、補正サブスペクトルＭＳＳ_ｐ（ｋ）を算出する。

つまり、スペクトル補正部３０２は、各サブバンドのサブスペクトルに対して、サブスペクトル平均値以上のサンプルに対しては何もせず、サブスペクトル平均値未満のサンプルをゼロにするという補正処理を施す。

スペクトル補正部３０２において、上記のような処理を行うことにより、サブスペクトルは、相対的に振幅の大きいサンプル（つまり、聴感的に重要なサンプル）以外はすべてゼロというサブスペクトルに補正される。すなわち、スペクトル補正部３０２において、上記のような処理を行うことにより、サブスペクトルは、その特徴が強調されると共に、単純化される。これによって、後述する近傍探索部３０３、およびマルチレートインデキシング部３０４において、大きな品質劣化なしに、サブスペクトルを量子化するために必要なビット数を大きく減らすことができる。その結果、符号化するサブバンド数を増やすことができるため、復号信号の帯域感（帯域の広さ）を向上させることができる。具体例は後述する。

次に、スペクトル補正部３０２は、補正サブスペクトルＭＳＳ_ｐ（ｋ）を近傍探索部３０３に出力する。

近傍探索部３０３は、スペクトル補正部３０２から入力される補正サブスペクトルＭＳＳ_ｐ（ｋ）に対して、非特許文献１および非特許文献３で開示されている技術を用いて、補正サブスペクトルＭＳＳ_ｐ（ｋ）の近傍ベクトル（ラティスベクトル（格子ベクトル））を算出する。具体的には、式（１０）に従い、ＲＥ_８に含まれるサブベクトル（ラティスベクトル）を算出する。ここで、ＲＥ_８および式（１０）の処理の詳細については、非特許文献１、非特許文献２を参照されたい。

近傍探索部３０３は、算出した近傍ベクトル（式（１０）におけるｙ_１ｐまたはｙ_２ｐ）をマルチレートインデキシング部３０４に出力する。

マルチレートインデキシング部３０４は、非特許文献１および非特許文献３で開示されている技術を用いて、近傍探索部３０３から入力される近傍ベクトルからインデックス情報を算出する。ここで、マルチレートインデキシング部３０４の処理の詳細については、非特許文献３に開示されているため、ここでは説明を省略する。マルチレートインデキシング部３０４は、算出したインデックス情報を多重化部３０５に出力する。

多重化部３０５は、グローバルゲイン算出部３０１から入力されるグローバルゲインｇと、マルチレートインデキシング部３０４から入力されるインデックス情報とを多重化して符号化情報を生成し、生成した符号化情報を、伝送路１０２を介して復号装置１０３に出力する。

ここで、本発明の効果を示す一例として、例えば、サブスペクトルのサブバンド幅が８である｛ -4.4, 0.4, 1.6, 0.3, 4.4, 0.4, -1.6, -0.4 ｝というサブスペクトル（テストサブスペクトル）を符号化する場合を考える。この時、近傍探索部３０３において、｛ 4, 0, 2, 0, 4, 0, 2, 0 ｝というベクトルに変換され、さらに｛ 4, 4, 2, 2, 0, 0, 0, 0 ｝というリーダが選択される。このリーダはＱ４に属するため、このリーダを符号化するためには１６ビットが必要となる。しかし、スペクトル補正部３０２において、上記テストサブスペクトルに対して上記の補正処理を行うことにより、テストサブスペクトルは補正テストサブスペクトル｛ -4.4, 0.0, 0.0, 0.0, 4.4, 0.0, 0.0, 0.0 ｝に補正される。この補正テストサブスペクトルは、近傍探索部３０３においては、｛ 4, 0, 0, 0, 4, 0, 0, 0 ｝というベクトルに変換され、さらに｛ 4, 4, 0, 0, 0, 0, 0, 0 ｝というリーダが選択される。このリーダはＱ３に属するため、このリーダを符号化するためには、１２ビットが必要となる。従って、上述したような、相対的に振幅が大きい、重要なサンプル以外のサンプルの値をゼロ化するというベクトル補正処理を行うことにより、大きな品質劣化なしに、４ビットの情報量を削減することができる。

以上が、符号化装置１０１の処理説明である。

図４は、図１に示した復号装置１０３の内部の主要な構成を示すブロック図である。復号装置１０３は、ＡＶＱ復号部４０１および直交変換処理部４０２から主に構成される。各部は以下の動作を行う。

ＡＶＱ復号部４０１は、伝送路を介して入力される符号化情報を用いて、復号スペクトルＸ２’（ｋ）を算出する。ＡＶＱ復号部４０１は、生成した復号スペクトルＸ２’（ｋ）を直交変換処理部４０２に出力する。なお、ＡＶＱ復号部４０１の処理の詳細は後述する。

直交変換処理部４０２は、バッファｂｕｆ２（ｋ）を内部に有しており、下記の式（１１）に示すようにバッファｂｕｆ２（ｋ）を初期化する。

また、直交変換処理部４０２は、ＡＶＱ復号部４０１から入力される復号スペクトルＸ２’（ｋ）を用いて下記の式（１２）に従い、復号信号ｙ_ｎを求めて出力する。

式（１２）におけるＺ（ｋ）は、下記の式（１３）に示すように、復号スペクトルＸ２’（ｋ）とバッファｂｕｆ２（ｋ）とを結合させたベクトルである。

次に、直交変換処理部４０２は、下記の式（１４）に従いバッファｂｕｆ２（ｋ）を更新する。

次に、直交変換処理部４０２は、復号信号ｙ_ｎを出力信号として出力する。

図５は、図４に示したＡＶＱ復号部４０１の内部構成を示すブロック図である。ＡＶＱ復号部４０１は、マルチレート復号部５０１から主に構成される。マルチレート復号部５０１は、伝送路を介して符号化装置１０１から送られる符号化情報を入力とし、入力された符号化情報を、ＡＶＱ符号化部２０２内のマルチレートインデキシング部３０４の処理の逆処理によって復号し、復号スペクトルＸ２’（ｋ）を算出する。ここで、マルチレート復号部５０１の処理の詳細については、非特許文献３に開示されているため、ここでは説明を省略する。基本的には、マルチレートインデキシング部３０４の逆処理を行い、復号スペクトルＸ２’（ｋ）を算出する。

以上が、復号装置１０３の処理説明である。

このように、本実施の形態によれば、ＡＶＱ技術を用いて符号化を行う場合において、符号化対象とするスペクトルに対して補正処理を施すことにより、非常に低いビットレートで、かつ低い処理演算量で、復号信号の品質を改善することができる。具体的には、補正処理では、ＡＶＱ技術において低いビットレートで量子化されるようにするために、符号化対象スペクトルは、その構成の特徴が強調されると共に単純化される。本実施の形態では、簡略化処理の一例として、サブスペクトル毎に振幅の平均値を算出し、この平均値未満のサンプルをすべてゼロにするという方法を説明した。このような補正処理により、各サブサブバンドのスペクトル（サブスペクトル）の符号化に必要なビットが少なくなり、同じビットレートで符号化できるサブバンドの数を増やすことができる。その結果、広い帯域のスペクトルデータを量子化することができるため、復号信号の品質（帯域感＝帯域の広さ）を向上させることができる。

なお、本実施の形態では、スペクトル補正部３０２において、サブスペクトル内の振幅の平均値を用いて、平均値未満のサンプルの値をゼロにする方法について説明したが、本発明はこれに限らず、上記以外の方法によって、サブスペクトルを補正する構成についても同様に適用できる。例えば、スペクトル補正部３０２において、各サンプルに対して、振幅が大きい方から予め定められた数のサンプルのみを選択し、それ以外のサンプルに対しては値をゼロにするという補正処理が行われてもよい。このとき、上記の予め定められた数は、サブバンド毎に変更してもよく、また時間的に変動させてもよい。例えば、重要な低域側のサブバンドでは予め定められた数を大きく設定し、エネルギの小さい高域側のサブバンドでは予め定められた数を小さく設定する、などの方法を採ることもできる。
また、振幅の平均値の代わりに、標準偏差等を算出し、これらを利用してサブスペクトルを補正処理してもよい。

なお、本実施の形態では、入力信号のスペクトルデータそのものをＡＶＱによって符号化する構成について説明したが、本発明はこれに限らず、入力信号の低域部を符号化するコア符号化部をさらに備え、ＡＶＱ符号化部２０２では、コア符号化部から得られるコア復号信号（ローカルデコード信号）と入力信号との残差信号のスペクトルデータを符号化するという構成を有する符号化装置１０１に対しても同様に適用できる。

なお、本実施の形態では、近傍探索部３０３における処理は非特許文献１、および非特許文献３に開示されている方式と同じ処理を行う場合について説明したが、本発明はこれに限らず、近傍探索部３０３において、スペクトル補正部３０２の処理により適合するような処理をする場合についても同様に適用できる。例えば、非特許文献１、および非特許文献３では、Ｑｎに属するベクトルのうち、幾つか選択したベクトルをリーダとしてコードブックに定義し符号化に利用している。この時、リーダとしてコードブック定義するベクトルついて、スペクトル補正部３０２によって補正されるようなベクトルを優先的に選択する。これによって、対象とするサブスペクトル（補正サブスペクトル）の符号化時に、コードブックに含まれるリーダが選択される確率が高まる。その結果、非特許文献１、および非特許文献３に開示されているボロノイ拡張技術を利用しなくてもよくなり、結果としてサブスペクトルの符号化に必要なビットが下がるため、本発明の効果をより高めることができる。

なお、本実施の形態では、近傍探索部３０３内で補正サブスペクトルが変換された結果、符号化するために必要なビット数が減るように、スペクトル補正部３０２において補正処理を行う場合について説明した。しかし、本発明はこれに限らず、近傍探索部３０３において、余剰ビット（リザーブビット）を利用することにより、さらに効果を高めることができる。例えば、補正サブスペクトルに対して、余剰ビットを使って振幅の正規化（ノーマライズ）をするという方法が例として挙げられる。具体的には、サブスペクトルのサブバンド幅が８である｛ -16.4, 0.4, 1.6, 0.3, 4.4, 0.4, -1.6, -0.4 ｝というサブスペクトル（テストサブスペクトル）を符号化する場合を考える。この場合、スペクトル補正部３０２において、上記テストサブスペクトルに対して補正処理を行うことにより、テストサブスペクトルは補正テストサブスペクトル｛ -16.4, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 ｝に補正される。この補正テストサブスペクトルは、近傍探索部３０３においては、｛ 16, 0, 0, 0, 0, 0, 0, 0 ｝というベクトルに変換され、さらに｛ 16, 0, 0, 0, 0, 0, 0, 0 ｝というリーダが選択される。このリーダはＱ４に属するため、このリーダを符号化するためには、１６ビットが必要となる。しかし、剰余ビットを使って補正後サブスペクトルをノーマライズし、｛ 16, 0, 0, 0, 0, 0, 0, 0 ｝を｛ 4, 0, 0, 0, 0, 0, 0, 0 ｝とすることにより、Ｑ２に属するリーダを選択することができるため情報量を８ビット削減することができる（但し、剰余ビットを使って、「4で除算した」という情報を復号装置側に伝送する必要がある）。このように、剰余ビットを使って、グローバルゲインとは別のゲイン情報を符号化することにより、本発明の効果をより高めることができる。なおまた、上述したように、余剰ビットを補正サブスペクトルの正規化に用いる場合、全サブバンドではなく、一部のサブバンドに対して適用することにより、より効果が期待できる。例えば、相対的にエネルギの大きいサブバンドに対してのみ、上述した余剰ビットを適用し正規化することで、少ない余剰ビットで大きな品質改善効果を得ることができる。また、ここで、相対的にエネルギの大きいサブバンドの数はフレーム毎に異なっていても構わない。

なお、本実施の形態では、各サブスペクトルの符号化に必要なビット数を削減し、削減したビット数を他のサブバンドのサブスペクトルを符号化するために利用する構成について説明したが、本発明はこれに限らず、削減したビット数を他のサブバンドの符号化に利用しない構成についても同様に適用できる。この場合、復号品質の帯域感（帯域の広がり）は向上しないが、大きな品質劣化なしに、ビットレートを大幅に削減することができる。

また、本実施の形態では、符号化対象として、ベクトルで表されるスペクトルデータを代表的に用いて説明したが、必ずしもこれに限定されない。符号化対象として、ベクトルにより入力信号の特性を表現することが可能な異なるデータを用いても、本実施の形態と同様の作用効果が得られる。

また、本実施の形態に係る復号装置１０３は、上記符号化装置１０１から伝送された符号化情報を用いて処理を行うとした。しかし、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記符号化装置１０１からの符号化情報でなくても、復号装置１０３は処理を行うことが可能である。

また、信号処理プログラムを、メモリ、ディスク、テープ、ＣＤ、ＤＶＤ等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。

また、本実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。

また、本実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるＬＳＩとして実現される。これらは個別に１チップ化されてもよいし、一部または全てを含むように１チップ化されてもよい。ここでは、ＬＳＩとしたが、集積度の違いにより、ＩＣ、システムＬＳＩ、スーパーＬＳＩ、ウルトラＬＳＩと呼称されることもある。

また、集積回路化の手法はＬＳＩに限るものではなく、専用回路または汎用プロセッサで実現してもよい。ＬＳＩ製造後に、プログラムすることが可能なＦＰＧＡ（Field Programmable Gate Array）や、ＬＳＩ内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル／プロセッサを利用してもよい。

さらには、半導体技術の進歩または派生する別技術によりＬＳＩに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。

２０１０年１月１３日出願の特願２０１０−００４９７８の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。

本発明に係る符号化装置および符号化方法は、ＡＶＱ技術を用いて符号化を行う場合において、符号化対象とするベクトルに対して補正処理を施すことにより、非常に低いビットレートで、かつ低い処理演算量で、復号信号の品質を改善することができ、例えば、パケット通信システム、移動通信システムなどに好適である。

１０１符号化装置
１０３復号装置
２０１直交変換処理部
２０２ＡＶＱ符号化部
３０１グローバルゲイン算出部
３０２スペクトル補正部
３０３近傍探索部
３０４マルチレートインデキシング部
３０５多重化部
４０１ＡＶＱ復号部
４０２直交変換処理部
５０１マルチレート復号部

Claims

入力信号を直交変換してスペクトルデータを形成する直交変換手段と、
前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正手段と、
前記補正処理されたスペクトルデータをラティスベクトルに変換する変換手段と、を備える、
符号化装置。
前記スペクトル補正手段は、前記補正処理として、各サブバンドのスペクトルデータに関するサンプル群のうち、聴感的に重要なサンプル以外の値をゼロにする、
請求項１記載の符号化装置。
前記スペクトル補正手段は、サブバンド毎にスペクトルデータの振幅の平均値を算出し、各サブバンドのスペクトルデータに関するサンプル群のうち、振幅が前記平均値以下のサンプルの値をゼロにする、
請求項２記載の符号化装置。
前記スペクトル補正手段は、サブバンド毎にスペクトルデータの振幅の大きさを評価し、各サブバンドのスペクトルデータに関するサンプル群のうち、振幅の大きい方から予め定められた数のサンプルを選択し、当該選択されたサンプル以外のサンプルの値をゼロにする、
請求項２記載の符号化装置。
前記スペクトル補正手段は、さらに、前記補正処理されたスペクトルデータを正規化する正規化手段を備える、
請求項１記載の符号化装置。
前記正規化手段は、一部のサブバンドに対して正規化を行う、
請求項５記載の符号化装置。
前記正規化手段によって正規化処理が行われるサブフレーム数は、フレーム毎に変化する、
請求項６記載の符号化装置。
請求項１に記載の符号化装置を具備する通信端末装置。
請求項１に記載の符号化装置を具備する基地局装置。
入力信号を直交変換してスペクトルデータを形成するステップと、
前記形成されたスペクトルデータに対して、サブバンド毎に補正処理を行うスペクトル補正ステップと、
前記補正処理されたスペクトルデータをラティスベクトルに変換する変換ステップと、
を具備する符号化方法。