本発明は、無線通信装置等に搭載され、音声信号、オーディオ信号等の符号化を行う符号化装置およびこの符号化信号の復号を行う復号化装置に関する。
音声信号、オーディオ信号等を低ビットレートの信号に圧縮する符号化技術は、移動体通信システムにおいては、電波等の伝送路容量(回線容量)および記録媒体を有効利用するという観点から特に重要である。
音声信号を符号化する音声符号化の方式に、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)で規格化されているG726、G729等の方式が存在する。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を符号化の対象とし、8kbit/s〜32kbit/sのビットレートで高品質な符号化を行うことができる。しかし、このような狭帯域信号は周波数帯域が最大3.4kHzまでと狭いため、その品質は聴取者に音がこもっている印象を与え、臨場感に欠けるという問題がある。
また、広帯域信号(50Hz〜7kHz)を符号化の対象とする音声符号化方式も存在する。この代表的な例として、ITU−TのG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WB等がある。これらの方式は、ビットレートが6.6kbit/s〜64kbit/sで広帯域音声信号の符号化を行うことができる。しかし、符号化の対象とする信号が音声の場合、広帯域信号は比較的高品質であるものの、オーディオ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合には十分ではない。
一方、一般的には、信号の最大周波数が10〜15kHz程度までであると、FMラジオ相当の臨場感が得られ、20kHz程度までであればCD(コンパクト・ディスク)並みの品質が得られる。このような信号に対しては、MPEG(Moving Picture Expert Group)で規格化されているレイヤIII方式やAAC方式等に代表されるオーディオ符号化が適している。しかし、これらのオーディオ符号化方式は、符号化の対象となる信号の周波数帯域が広くなるため、符号化された信号のビットレートが大きくなるという問題がある。
従来の符号化技術として、周波数帯域の広い信号を低ビットレートで符号化する技術がある(例えば、特許文献1参照)。これによれば、入力信号を低域部の信号と高域部の信号とに分け、高域部の信号のスペクトルを低域部の信号のスペクトルで置換することにより符号化して、全体のビットレートを低減させる。
図1A〜図1Dは、上記の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す図である。なお本来は、この処理は符号化処理と組み合わせて行われるものであるが、ここでは説明を簡単にするために、原信号に上記の処理を施す場合を例にとって述べる。
図1Aは、周波数帯域が0≦k<FHに帯域制限された原信号のスペクトル、図1Bは、同信号を0≦k<FLに帯域制限したときのスペクトル(ただし、FL<FH)、図1Cは、上記の技術により低域(低周波帯域)のスペクトルを用いて高域(高周波帯域)のスペクトルを置換して得られたスペクトル、図1Dは、置換後のスペクトルをスペクトル包絡情報に従い置換スペクトルの形状を整えることにより得られるスペクトルを表している。これらの図において、横軸は周波数、縦軸はスペクトル強度を表す。
この技術では、周波数帯域が0≦k<FHの原信号のスペクトル(図1A)を周波数帯域が0≦k<FLの低域のスペクトル(図1B)を用いて表現することが行われる。具体的には、高域のスペクトル(FL≦k<FH)が、低域のスペクトル(0≦k<FL)によって置換される。この処理の結果、図1Cに示すようなスペクトルが得られる。なお、ここでは、説明を簡単にするために、FL=FH/2の関係である場合を例にとって説明している。そして、原信号のスペクトル包絡情報に従い、図1Cのスペクトルの高域のスペクトルの振幅値が調整され、図1Dに示すようなスペクトルが得られる。これが原信号のスペクトルを推定したスペクトルである。
特表2001−521648号公報(第15頁、第1図、第2図)
一般に、音声信号、オーディオ信号等のスペクトルは、ある周波数の整数倍に(所定のピッチごとに)スペクトルのピークが現れる調波構造を持つことが知られている。この調波構造は、音声信号、オーディオ信号等の品質を保つ上で重要な情報であり、調波構造に乱れが生じると品質の劣化が聴取者に知覚されることとなる。
図2Aおよび図2Bは、従来技術の問題点を説明するための図である。
図2Aは、オーディオ信号をスペクトル分析することにより得られたスペクトルである。この図からわかるように、原信号には周波数軸上の間隔Tからなる調波構造が見られる。一方、図2Bは、上記の技術に従い、原信号のスペクトルを推定した結果得られたスペクトルである。これら2つのスペクトルを比較すると、図2Bのスペクトルは、置換元の低域スペクトルS1と置換先の高域スペクトルS2では調波構造が保持されているが、低域スペクトルS1と高域スペクトルS2の接続部(スペクトルS3)では調波構造が崩れていることがわかる。
この推定スペクトルを時間信号に変換して試聴すると、このような調波構造の乱れによって、聴取者は品質劣化を知覚することとなり問題である。この調波構造の乱れは、調波構造の形状を考慮せずに置換が行われたことに起因している。
本発明の目的は、スペクトルの調波構造に乱れを生じさせず、低ビットレートで高品質にスペクトルを符号化することができる符号化装置およびこの符号化信号を復号することができる復号化装置を提供することである。
本発明の符号化装置は、低周波帯域および高周波帯域の2つの帯域に分けられたスペクトルを取得する取得手段と、取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて算出する算出手段と、取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を示すパラメータを符号化する符号化手段と、を具備する構成を採る。
本発明の復号化装置は、低周波帯域および高周波帯域の2つの帯域に分けられたスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得手段と、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得手段と、取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する復号化手段と、を具備する構成を採る。
本発明の符号化方法は、低周波帯域および高周波帯域の2つの帯域に分けられたスペクトルを取得する取得ステップと、取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて算出する算出ステップと、取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を示すパラメータを符号化する符号化ステップと、を具備するようにした。
本発明の復号化方法は、低周波帯域および高周波帯域の2つの帯域に分けられたスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得ステップと、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得ステップと、取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する復号化ステップと、を具備するようにした。
本発明によれば、スペクトルの調波構造を崩さずに、低ビットレートで高品質にスペクトルを符号化することができる。また、この符号化信号を復号した際の音質も向上させることができる。
従来の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す図
従来技術の問題点を説明するための図
実施の形態1に係る無線送信装置の主要な構成を示すブロック図
実施の形態1に係る符号化装置の内部構成を示すブロック図
実施の形態1に係るスペクトル符号化部の内部構成を示すブロック図
実施の形態1に係るフィルタリング部のフィルタリング処理の概要を説明するための図
ピッチ係数Tが変化するに伴い第2スペクトルの推定値のスペクトルがどのように変化するかを説明するための図
ピッチ係数Tが変化するに伴い第2スペクトルの推定値のスペクトルがどのように変化するかを説明するための図
実施の形態1に係るフィルタリング部、探索部、ピッチ係数設定部において行われる各処理の一連のアルゴリズムの一例を示したフロー図
実施の形態1に係る無線受信装置の主要な構成を示すブロック図
実施の形態1に係る復号化装置の内部構成を示すブロック図
実施の形態1に係るスペクトル復号化部の内部構成を示すブロック図
実施の形態1に係るフィルタリング部において生成される復号スペクトルを示した図
実施の形態1に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図
実施の形態1に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図
実施の形態2に係るスペクトル符号化部の主要な構成を示すブロック図
実施の形態2に係るフィルタを用いたフィルタリングの概要を説明するための図
実施の形態3に係るスペクトル符号化部の主要な構成を示すブロック図
実施の形態4に係るスペクトル復号化部の主要な構成を示すブロック図
実施の形態5に係るスペクトル復号化部の主要な構成を示すブロック図
本発明者は、音声信号、オーディオ信号等(以下、総称して音響信号という)の特性、すなわち、音響信号が周波数軸方向に調波構造を形成している点に着目し、全周波数帯域のスペクトルのうち、一部の帯域のスペクトルを用いて残りの帯域のスペクトルを符号化できることを見出して本発明をするに至った。
すなわち、本発明の骨子は、例えば、高域部および低域部の2つの周波数帯域に分けられた信号スペクトルを符号化する際に、高域部のスペクトルに対しては、高域部および低域部の双方のスペクトルの類似具合を求め、この類似具合を表すパラメータ自体を符号化することである。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
図3は、本発明の実施の形態1に係る符号化装置が無線通信システムの送信側に搭載された場合の無線送信装置130の主要な構成を示すブロック図である。
この無線送信装置130は、符号化装置120、入力装置131、A/D変換装置132、RF変調装置133、およびアンテナ134を有する。
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換し、A/D変換装置132に出力する。A/D変換装置132は、このアナログ信号をディジタル信号に変換し、符号化装置120に出力する。符号化装置120は、入力されたディジタル信号を符号化して符号化信号を生成し、RF変調装置133に出力する。RF変調装置133は、符号化信号を変調して変調符号化信号を生成し、アンテナ134に出力する。アンテナ134は、変調符号化信号を電波W12として送信する。
図4は、上記の符号化装置120の内部構成を示すブロック図である。ここでは、階層符号化(スケーラブル符号化)を行う場合を例にとって説明する。
符号化装置120は、入力端子121、ダウンサンプリング部122、第1レイヤ符号化部123、第1レイヤ復号化部124、アップサンプリング部125、遅延部126、スペクトル符号化部100、多重化部127および出力端子128を有する。
入力端子121には、A/D変換装置132から有効周波数帯域が0≦k<FHの信号が入力される。ダウンサンプリング部122は、入力端子121を介し入力された信号にダウンサンプリングを施してサンプリングレートの低い信号を生成し、出力する。第1レイヤ符号化部123は、このダウンサンプリング後の信号を符号化し、得られた符号化コードを多重化部(マルチプレクサ)127に出力すると共に、第1レイヤ復号化部124にも出力する。第1レイヤ復号化部124は、この符号化コードを基に第1レイヤの復号信号を生成する。アップサンプリング部125は、第1レイヤ符号化部123の復号信号のサンプリングレートを上げる。
一方、遅延部126は、入力端子121を介し入力される信号に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部122、第1レイヤ符号化部123,第1レイヤ復号化部124、およびアップサンプリング部125を介した際に生じる時間遅れと同値とする。スペクトル符号化部100は、アップサンプリング部125から出力される信号を第1信号として、また遅延部126から出力される信号を第2信号としてスペクトル符号化を行い、生成した符号化コードを多重化部127に出力する。多重化部127は、第1レイヤ符号化部123で求められる符号化コードとスペクトル符号化部100で求められる符号化コードを多重化し、出力コードとして出力端子128を介し出力する。この出力コードは、RF変調装置133に与えられる。
図5は、上記のスペクトル符号化部100の内部構成を示すブロック図である。
スペクトル符号化部100は、入力端子102、103、周波数領域変換部104、105、内部状態設定部106、フィルタリング部107、探索部108、ピッチ係数設定部109、フィルタ係数算出部110、および出力端子111を有する。
入力端子102には、アップサンプリング部125から第1信号が入力される。この第1信号は、第1レイヤ符号化部123で符号化された符号化パラメータを用いて第1レイヤ復号化部124にて復号された信号であり、有効周波数帯域が0≦k<FLになっている。また、入力端子103には、遅延部126から有効周波数帯域が0≦k<FH(ただし、FL<FH)の第2信号が入力される。
周波数領域変換部104は、入力端子102から入力される第1信号に周波数変換を行い、第1スペクトルS1(k)を算出する。また、周波数領域変換部105は、入力端子103から入力される第2信号に周波数変換を行い、第2スペクトルS2(k)を算出する。ここで周波数変換の方法は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)等を適用する。
内部状態設定部106は、有効周波数帯域が0≦k<FLの第1スペクトルS1(k)を使ってフィルタリング部107で用いられるフィルタの内部状態を設定する。この設定については、後ほど再度説明する。
ピッチ係数設定部109は、ピッチ係数Tを予め定められた探索範囲Tmin〜Tmaxの中で少しずつ変化させながら、フィルタリング部107に順次出力する。
フィルタリング部107は、内部状態設定部106で設定されたフィルタの内部状態と、ピッチ係数設定部109から出力されるピッチ係数Tとに基づいて第2スペクトルのフィルタリングを行い、第1スペクトルの推定値S’2(k)を算出する。このフィルタリング処理の詳細については後述する。
探索部108は、周波数領域変換部105から出力される第2スペクトルS2(k)とフィルタリング部107から出力される第2スペクトルの推定値S’2(k)との類似性を示すパラメータである類似度を算出する。この類似度については、後ほど詳述する。この類似度の算出処理は、ピッチ係数設定部109からピッチ係数Tが与えられる度に行われ、算出される類似度が最大となるピッチ係数T’(Tmin〜Tmaxの範囲)が、フィルタ係数算出部110に与えられる。
フィルタ係数算出部110は、探索部108から与えられるピッチ係数T’を用いて、フィルタ係数βiを求め、出力端子111を介し出力する。このとき、ピッチ係数T’も同時に出力端子111を介し出力される。
次いで、スペクトル符号化部100の主要な各部の具体的な動作について、数式を交えながら以下詳細に説明する。
図6は、フィルタリング部107のフィルタリング処理の概要を説明するための図である。
ここでは、全周波数帯域(0≦k<FH)のスペクトルを便宜的にS(k)と呼び、フィルタ関数は次式
で表されるものを使用する。この式において、zはz変換変数を表しており、Tはピッチ係数設定部109より与えられた係数を表しており、またM=1とする。
この図に示すように、S(k)の0≦k<FLの帯域には、第1スペクトルS1(k)がフィルタの内部状態として格納されている。一方、S(k)のFL≦k<FHの帯域には、以下の手順により求められた第2スペクトルの推定値S’2(k)が格納される。
S’2(k)には、フィルタリング処理により、kよりTだけ低い周波数のスペクトルS(k−T)に、このスペクトルを中心としてiだけ離れた近傍のスペクトルS(k−T−i)に所定の重み付け係数β
iを乗じたスペクトルβ
i・S(k−T−i)を全て加算したスペクトル、すなわち、次式
により表されるスペクトルが代入される。このとき、このフィルタに与えられる入力信号はゼロとしている。すなわち(式2)は(式1)のゼロ入力応答を表す。そして上記の演算を、周波数の低い方(k=FL)から順にkをFL≦k<FHの範囲で変化させて行うことにより、FL≦k<FHにおける第2スペクトルの推定値S’2(k)が算出される。
以上のフィルタリング処理は、ピッチ係数設定部109からピッチ係数Tが与えられる度に、FL≦k<FHの範囲において、その都度S(k)をゼロクリアして行われる。すなわち、ピッチ係数Tが変化するたびにS(k)は算出され、探索部108に出力される。
次に、探索部108において行われる類似度の算出処理および最適なピッチ係数Tの導出処理について説明する。
まず、類似度には、様々な定義が存在する。ここでは、フィルタ係数β
−1およびβ
1を0とみなして、最小2乗誤差法に基づいて次式
によって定義される類似度を用いる場合を例にとって説明する。この類似度を使用した場合、最適なピッチ係数Tを算出した後にフィルタ係数β
iを決定することになる。ここで、Eは、S2(k)とS’2(k)との間の2乗誤差を表す。この式において右辺第1項は、ピッチ係数Tに関係ない固定値となるので、右辺第2項を最大とするS’2(k)を生成するピッチ係数Tが探索される。この式の右辺第2項を類似度と呼ぶことにする。
図7A〜図7Eは、ピッチ係数Tが変化するに伴い第2スペクトルの推定値S’2(k)のスペクトルがどのように変化するかを説明するための図である。
図7Aは、内部状態として格納されている、調波構造を有する第1スペクトルを示した図である。また、図7B〜図7Dは、3種類のピッチ係数T0、T1、T2を用いて、それぞれフィルタリングを行うことにより算出される第2スペクトルの推定値S’2(k)のスペクトルを示した図である。なお、図7Eは、推定値S’2(k)のスペクトルと比較するために第2スペクトルS2(k)を示したものである。
この図に示す例では、図7Cに示すスペクトルと図7Eに示すスペクトルとが類似しているため、T1を用いて算出する類似度が最も高い値を示すことがわかる。すなわち、調波構造を保つことのできるピッチ係数TとしてはT1が最適である。
図8A〜図8Eも、図7A〜図7Eと同様の図であるが、ここでは内部状態として格納されている第1スペクトルの位相が図7A〜図7Eとは異なっている。しかし、この図に示す例においても、調波構造が保持されるピッチ係数T1はTのときである。
このように、ピッチ係数Tを変化させ、類似度が最大となるTを見つけることは、スペクトルの調波構造のピッチ(またはその整数倍)をトライ・アンド・エラーで見つけることに相当している。そして、本実施の形態の符号化装置は、この調波構造のピッチに基づいて第2スペクトルの推定値S’2(k)を算出するので、第1スペクトルと推定スペクトルとの間の接続部において調波構造が崩れない。これは、接続部であるk=FLの場合の推定値S’2(k)は調波構造のピッチ(またはその整数倍)Tだけ離れた第1スペクトルに基づいて算出されることを考えても容易に理解される。
また、ピッチ係数Tは、スペクトルデータの周波数間隔の整数倍(整数値)を表している。しかし、実際の調波構造のピッチは非整数値であることが多い。よって、Tを中心に前後M個の近傍データを、適当な重み付け係数βiを選んで重み付き加算することにより、T−MからT+Mまでの範囲の非整数値の調波構造のピッチを表現することが可能となる。
図9は、フィルタリング部107、探索部108、ピッチ係数設定部109において行われる各処理の一連のアルゴリズムの一例を示したフロー図である。これらの処理の概要については既に説明したので、フローの詳細な説明は省略する。
次に、フィルタ係数算出部110におけるフィルタ係数の算出処理について説明する。
フィルタ係数算出部110は、探索部108から与えられるピッチ係数T’を用いて次式
に従い、この式の2乗歪Eを最小にするようなフィルタ係数β
iを求める。なお、フィルタ係数算出部110は、複数個のβ
i(i=−1,0,1)の組合せを予めデータテーブルとして持っており、上記の(式4)の2乗歪Eを最小とするβ
i(i=−1,0,1)の組合せを決定し、そのインデックスを出力する。
このように、本実施の形態の符号化装置によれば、低域部(0≦k<FL)および高域部(FL≦k<FH)の2つに分けられた入力信号のスペクトルに対し、低域スペクトルを内部状態として有するフィルタリング部107を用いて高域スペクトルの形状を推定し、フィルタリング部107のフィルタ特性を表すパラメータ自体を、高域スペクトルの代わりに符号化して出力するため、低ビットレートで高品質にスペクトルを符号化することができる。
また、以上の構成において、フィルタリング部107が低域スペクトルを用いて高域スペクトルの形状を推定する際に、ピッチ係数設定部109は、推定の基準とする低域スペクトルと高域スペクトルとの周波数差、すなわち、ピッチ係数Tを様々に変化させ出力し、探索部108は、低域スペクトルと高域スペクトルの類似度が最大となるTを検出するので、スペクトル全体の調波構造のピッチに基づいて高域スペクトルの形状を推定することができ、スペクトル全体の調波構造を維持したまま符号化を行うことができる。
また、低域スペクトルの帯域幅を調波構造のピッチに基づいて設定する必要もない。すなわち、低域スペクトルの帯域幅を調波構造のピッチ(または、その整数倍)に揃える必要はなく、任意に帯域幅を設定できる。調波構造のピッチに揃える操作を行わなくても、以上の構成によれば、低域スペクトルと高域スペクトルとの接続部において、スペクトルは滑らかに接続されるからである。
なお、本実施の形態では、(式1)においてM=1とする場合を例にとって説明したが、Mはこれに限定されることは無く、0以上の整数(自然数)を用いることが可能である。
また、本実施の形態では、階層符号化(スケーラブル符号化)を行う符号化装置を例にとって説明したが、上記のスペクトル符号化部100は、他の方式の符号化を行う符号化装置に実装することも可能である。
また、本実施の形態では、スペクトル符号化部100が周波数領域変換部104、105を有する場合を例にとって説明したが、これらは時間領域信号を入力信号とする場合に必要な構成要素であり、スペクトル符号化部100に直接スペクトルが入力される態様においては、周波数領域変換部は必要ない。
さらに、本実施の形態では、低域のスペクトルを用いて、すなわち、低域のスペクトルを符号化の基準として、高域のスペクトルを符号化する場合を例にとって説明したが、この基準となるスペクトルの設定の仕方はこれに限定されず、例えば、エネルギーを有効に利用するという観点からは望ましくないが、高域のスペクトルを用いて低域のスペクトルを符号化したり、または中間周波数帯域のスペクトルを符号化の基準とし他の領域のスペクトルを符号化することも可能である。
図10は、無線送信装置130から送信された信号を受信する無線受信装置180の主要な構成を示すブロック図である。
この無線受信装置180は、アンテナ181、RF復調装置182、復号化装置170、D/A変換装置183、および出力装置184を有している。
アンテナ181は、電波W12としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置182に与える。RF復調装置182は、アンテナ181からの受信符号化音響信号を復調して復調符号化音響信号を生成して復号化装置170に与える。
復号化装置170は、RF復調装置182からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
図11は、上記の復号化装置170の内部構成を示すブロック図である。ここでは、階層符号化された信号を復号する場合を例にとって説明する。
この復号化装置170は、入力端子171、分離部172、第1レイヤ復号化部173、アップサンプリング部174、スペクトル復号化部150、および出力端子176、177を有する。
入力端子171には、RF復調装置182からディジタルの復調符号化音響信号が入力される。分離部172は、入力端子171を介し入力された復調符号化音響信号を分離し、第1レイヤ復号化部173用の符号化コードとスペクトル復号化部150用の符号化コードとを生成する。第1レイヤ復号化部173は、分離部172で得られた符号化コードを用いて信号帯域0≦k<FLの復号信号を復号し、この復号信号をアップサンプリング部174に与える。また、他方の出力は、出力端子176に接続されている。これにより、第1レイヤ復号化部173で生成される第1レイヤ復号信号を出力する必要が生じた場合には、この出力端子176を介し出力させることができる。
アップサンプリング部174は、第1レイヤ復号化部173から与えられる第1レイヤ復号信号のサンプリング周波数を上げる。スペクトル復号化部150には、分離部172で分離された符号化コードとアップサンプリング部174で生成されたアップサンプリング後の第1レイヤ復号信号とが与えられる。スペクトル復号化部150は、後述するスペクトル復号化を行い、信号帯域0≦k<FHの復号信号を生成し、出力端子177を介しこれを出力する。スペクトル復号化部150では、アップサンプリング部174から与えられるアップサンプリング後の第1レイヤ復号信号を第1信号とみなして処理を行うことになる。
この構成によれば、第1レイヤ復号化部173で生成される第1レイヤ復号信号を出力する必要がある場合には、出力端子176より出力させることができる。また、より品質の高いスペクトル復号化部150の出力信号を出力する必要がある場合には、出力端子177より出力させることができる。復号化装置170からは、出力端子176もしくは出力端子177のいずれか一方の信号が出力され、D/A変換装置183に与えられる。どちらの信号が出力されるかは、アプリケーションの設定やユーザの判断に基づく。
図12は、上記のスペクトル復号化部150の内部構成を示すブロック図である。
このスペクトル復号化部150は、入力端子152、153、周波数領域変換部154、内部状態設定部155、フィルタリング部156、時間領域変換部158、および出力端子159を有する。
入力端子152には、スペクトル符号化部100にて符号化された符号化コードを表すフィルタ係数が、分離部172を介して入力される。さらに、入力端子153には、有効周波数帯域が0≦k<FLの第1信号が入力される。この第1信号は、第1レイヤ復号化部173で復号された第1レイヤ復号信号をアップサンプリング部174にてアップサンプリングしたものである。
周波数領域変換部154は、入力端子153から入力された時間領域信号に周波数変換を行い、第1スペクトルS1(k)を算出する。周波数変換法は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)等を使用する。
内部状態設定部155は、第1スペクトルS1(k)を使って、フィルタリング部156で用いられるフィルタの内部状態を設定する。
フィルタリング部156は、内部状態設定部155で設定されたフィルタの内部状態と、入力端子152から与えられるピッチ係数T’およびフィルタ係数βに基づき第1スペクトルのフィルタリングを行い、第2スペクトルの推定値S’2(k)を算出する。この場合、フィルタリング部156では、(式1)に記載のフィルタ関数が用いられる。
時間領域変換部158は、フィルタリング部156により得られた復号スペクトルS’(k)を時間領域の信号に変換し、出力端子159を介し出力する。ここでは、必要に応じて、適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。
図13は、フィルタリング部156において生成される復号スペクトルS’(k)を示した図である。
この図にあるように、周波数帯域0≦k<FLの復号スペクトルS’(k)は、第1スペクトルS1(k)によって構成され、周波数帯域FL≦k<FHの復号スペクトルS’(k)は、第2スペクトルの推定値S’2(k)によって構成される。
このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化方法に対応した構成を有しているため、少ないビット数で効率よく符号化された音響信号を復号することができ、良好な音響信号を出力することができる。
なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。
図14Aは、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図3に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。
有線送信装置140は、符号化装置120、入力装置131、およびA/D変換装置132を有し、出力がネットワークN1に接続されている。
A/D変換装置132の入力端子は、入力装置131の出力端子に接続されている。符号化装置120の入力端子は、A/D変換装置132の出力端子に接続されている。符号化装置120の出力端子はネットワークN1に接続されている。
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換してA/D変換装置132に与える。A/D変換装置132は、アナログ信号をディジタル信号に変換して符号化装置120に与える。符号化装置120は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークN1に出力する。
図14Bは、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図10に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。
有線受信装置190は、ネットークN1に接続されている受信装置191、復号化装置170、D/A変換装置183、および出力装置184を有している。
受信装置191の入力端子は、ネットワークN1に接続されている。復号化装置170の入力端子は、受信装置191の出力端子に接続されている。D/A変換装置183の入力端子は、復号化装置170の出力端子に接続されている。出力装置184の入力端子は、D/A変換装置183の出力端子に接続されている。
受信装置191は、ネットワークN1からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置170に与える。復号化装置170は、受信装置191からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。
(実施の形態2)
図15は、本発明の実施の形態2に係る符号化装置内のスペクトル符号化部200の主要な構成を示すブロック図である。なお、このスペクトル符号化部200は、図5に示したスペクトル符号化部100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、フィルタリング部で用いられるフィルタ関数を実施の形態1よりも簡易なものにすることである。
フィルタリング部201で用いられるフィルタ関数は、次式
のように簡略化したものを用いる。この式は、(式1)においてM=0、β
0=1としたフィルタ関数に相当している。
図16は、上記のフィルタを用いたフィルタリングの概要を説明するための図である。
第2スペクトルの推定値S’2(k)は、Tだけ離れた低域のスペクトルを順次コピーすることにより求められる。また、探索部108は、最適なピッチ係数T’を実施の形態1と同様に(式3)のEを最小とするピッチ係数Tを探索することにより決定する。このようにして求められたピッチ係数T’を出力端子111を介し出力する。この構成により、フィルタの特性はピッチ係数Tのみで決定されることになる。
なお、本実施の形態のフィルタは、低レート音声符号化の代表的な技術であるCELP(Code−Excited Linear Prediction)方式の構成要素の一つである適応符号帳(adaptive codebook)と同じように動作するという特徴がある。
次いで、上記のスペクトル符号化部200によって符号化された信号を復号するスペクトル復号化部について説明する(図示せず)。
このスペクトル復号化部は、図12に示したスペクトル復号化部150と同様の構成を有しているので、詳しい説明は省略するが、次のような特徴を有している。すなわち、フィルタリング部156は、第2スペクトルの推定値S’2(k)を算出する場合に、(式1)に記載のフィルタ関数ではなく(式5)に記載のフィルタ関数を用いる。入力端子152から与えられるのは、ピッチ係数T’のみとなる。すなわち、(式1)または(式5)に記載のフィルタ関数のどちらを利用するかは、符号化側で用いられたフィルタ関数の種類に依存し、そのフィルタ関数と同一のフィルタ関数を用いる。
このように、本実施の形態によれば、フィルタリング部で用いられるフィルタ関数をより簡易なものとするため、フィルタ係数算出部を設置する必要がなくなり、少ない演算量によって第2スペクトル(高域スペクトル)の推定を行うことができ、また、回路規模も縮小することができる。
(実施の形態3)
図17は、本発明の実施の形態3に係る符号化装置内のスペクトル符号化部300の主要な構成を示すブロック図である。なお、このスペクトル符号化部300は、図5に示したスペクトル符号化部100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、概形算出部301および多重化部302をさらに有し、第2スペクトルの推定が行われた後に第2スペクトルの包絡情報をさらに符号化することである。
探索部108は、最適なピッチ係数T’を多重化部302に出力すると共に、このピッチ係数T’を用いて生成される第2スペクトルの推定値S’2(k)を概形算出部301に出力する。概形算出部301は、周波数領域変換部105から与えられる第2スペクトルS2(k)に基づいて第2スペクトルS2(k)の包絡情報を算出する。なお、ここでは、この包絡情報をサブバンド毎のスペクトルパワで表し、周波数帯域FL≦k<FHをJ個のサブバンドに分割する場合を例にとって説明する。このとき、第jサブバンドのスペクトルパワは次式
で表される。この式において、BL(j)は、第jサブバンドの最小周波数、BH(j)は、第jサブバンドの最大周波数を表す。このようにして求めた第2スペクトルのサブバンド情報を第2スペクトルのスペクトル包絡情報とみなす。
同様に、第2スペクトルの推定値S’2(k)のサブバンド情報B’(j)を次式
に従い算出し、サブバンド毎の変動量V(j)を次式
に従い算出する。
次に、変動量V(j)を符号化して符号化後の変動量V(j)を求め、そのインデックスを多重化部302に送る。多重化部302は、探索部108から得られる最適なピッチ係数T’と概形算出部301から出力される変動量V(j)のインデックスを多重化して出力端子111を介し出力する。
このように、本実施の形態によれば、高域スペクトルの推定を行った後に、さらに高域スペクトルの包絡情報も符号化するため、高域スペクトルの推定値の精度を向上させることができる。
(実施の形態4)
図18は、本発明の実施の形態4に係る復号化装置内のスペクトル復号化部550の主要な構成を示すブロック図である。なお、このスペクトル復号化部550は、図12に示したスペクトル復号化部150と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、分離部551、スペクトル包絡復号化部552、およびスペクトル調整部553をさらに有することである。これにより、実施の形態3で示したスペクトル符号化部300等によって高域スペクトルの推定スペクトルの符号化に併せて包絡情報も符号化された符号化コードの復号を行うことができる。
分離部551は、入力端子152を介し入力された符号化コードを分離し、フィルタリング係数に関する情報はフィルタリング部156に与えると共に、スペクトル包絡に関する情報はスペクトル包絡復号化部552に与える。
スペクトル包絡復号化部552は、分離部551から与えられたスペクトル包絡情報から、変動量V(j)を符号化して得られる変動量V(j)を復号することにより求める。
スペクトル調整部553は、フィルタリング部156から得られる復号スペクトルS’(k)に、スペクトル包絡復号化部552から得られる復号されたサブバンド毎の変動量V(j)を次式
に従い乗じることにより、復号スペクトルS’(k)の周波数帯域FL≦k<FHにおけるスペクトル形状を調整し、調整後の復号スペクトルS3(k)を生成する。この調整後の復号スペクトルS3(k)は、時間領域変換部158に出力され、時間領域信号に変換される。
このように、本実施の形態によれば、包絡情報も併せて符号化されている符号化コードを復号することができる。
なお、本実施の形態では、分離部551から与えられるスペクトル包絡情報が、(式8)に示されるサブバンド毎の変動量V(j)を符号化して求められた値V(j)である場合を例にとって説明したが、スペクトル包絡情報はこれに限定されない。
(実施の形態5)
図19は、本発明の実施の形態5に係る復号化装置内のスペクトル復号化部650の主要な構成を示すブロック図である。なお、このスペクトル復号化部650は、図18に示したスペクトル復号化部550と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、LPCスペクトル算出部652をさらに有し、LPC係数により算出されるLPCスペクトルをスペクトル包絡情報として利用し、第2スペクトルの推定を行った後に、第2スペクトルにLPCスペクトルを乗じることにより、より精度の高い第2スペクトルの推定値を得ることである。
LPCスペクトル算出部652は、入力端子651を介し入力されたLPC係数α(j)からLPCスペクトルenv(k)を、次式
に従い算出する。ここで、NPはLPC係数の次数を表す。また、変数γ(0<γ<1)を用い、LPCスペクトルの特性を変化させることによりLPCスペクトルenv(k)を求めることもできる。この場合、LPCスペクトルenv(k)は、次式
のように表される。ここでγは固定値として規定することもできるし、フレーム毎に可変な値をとることもできる。このように算出されたLPCスペクトルenv(k)は、スペクトル調整部553に出力される。
スペクトル調整部553は、フィルタリング部156から得られる復号スペクトルS’(k)に、LPCスペクトル算出部652から得られるLPCスペクトルenv(k)を、次式
に従い乗じ、復号スペクトルS’(k)の周波数帯域FL≦k<FHにおけるスペクトルを調整し、調整後の復号スペクトルS3(k)を生成する。この調整後の復号スペクトルS3(k)は、時間領域変換部158に与えられ、時間領域信号に変換される。
このように、本実施の形態によれば、LPCスペクトルをスペクトル包絡情報として利用するため、より精度の高い第2スペクトルの推定値を得ることができる。
本発明に係る符号化装置または復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、ソフトウェアで実現することも可能である。
本明細書は、2003年9月16日出願の特願2003−323658に基づく。この内容は全てここに含めておく。
本発明に係る符号化装置および復号化装置は、低ビットレートで符号化する効果を有し、無線通信システム等の用途にも適用できる。
本発明は、無線通信装置等に搭載され、音声信号、オーディオ信号等の符号化を行う符号化装置およびこの符号化信号の復号を行う復号化装置に関する。
音声信号、オーディオ信号等を低ビットレートの信号に圧縮する符号化技術は、移動体通信システムにおいては、電波等の伝送路容量(回線容量)および記録媒体を有効利用するという観点から特に重要である。
音声信号を符号化する音声符号化の方式に、ITU−T(International Telecommunication Union Telecommunication Standardization Sector)で規格化されているG726、G729等の方式が存在する。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を符号化の対象とし、8kbit/s〜32kbit/sのビットレートで高品質な符号化を行うことができる。しかし、このような狭帯域信号は周波数帯域が最大3.4kHzまでと狭いため、その品質は聴取者に音がこもっている印象を与え、臨場感に欠けるという問題がある。
また、広帯域信号(50Hz〜7kHz)を符号化の対象とする音声符号化方式も存在する。この代表的な例として、ITU−TのG722、G722.1や、3GPP(The 3rd Generation Partnership Project)のAMR−WB等がある。これらの方式は、ビットレートが6.6kbit/s〜64kbit/sで広帯域音声信号の符号化を行うことができる。しかし、符号化の対象とする信号が音声の場合、広帯域信号は比較的高品質であるものの、オーディオ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合には十分ではない。
一方、一般的には、信号の最大周波数が10〜15kHz程度までであると、FMラジオ相当の臨場感が得られ、20kHz程度までであればCD(コンパクト・ディスク)並みの品質が得られる。このような信号に対しては、MPEG(Moving Picture Expert Group)で規格化されているレイヤIII方式やAAC方式等に代表されるオーディオ符号化が適している。しかし、これらのオーディオ符号化方式は、符号化の対象となる信号の周波数帯域が広くなるため、符号化された信号のビットレートが大きくなるという問題がある。
従来の符号化技術として、周波数帯域の広い信号を低ビットレートで符号化する技術がある(例えば、特許文献1参照)。これによれば、入力信号を低域部の信号と高域部の信号とに分け、高域部の信号のスペクトルを低域部の信号のスペクトルで置換することにより符号化して、全体のビットレートを低減させる。
図1A〜図1Dは、上記の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す図である。なお本来は、この処理は符号化処理と組み合わせて行われるものであるが、ここでは説明を簡単にするために、原信号に上記の処理を施す場合を例にとって述べる。
図1Aは、周波数帯域が0≦k<FHに帯域制限された原信号のスペクトル、図1Bは、同信号を0≦k<FLに帯域制限したときのスペクトル(ただし、FL<FH)、図1Cは、上記の技術により低域(低周波帯域)のスペクトルを用いて高域(高周波帯域)のスペクトルを置換して得られたスペクトル、図1Dは、置換後のスペクトルをスペクトル包絡情報に従い置換スペクトルの形状を整えることにより得られるスペクトルを表している。これらの図において、横軸は周波数、縦軸はスペクトル強度を表す。
この技術では、周波数帯域が0≦k<FHの原信号のスペクトル(図1A)を周波数帯域が0≦k<FLの低域のスペクトル(図1B)を用いて表現することが行われる。具体的には、高域のスペクトル(FL≦k<FH)が、低域のスペクトル(0≦k<FL)によって置換される。この処理の結果、図1Cに示すようなスペクトルが得られる。なお、ここでは、説明を簡単にするために、FL=FH/2の関係である場合を例にとって説明している。そして、原信号のスペクトル包絡情報に従い、図1Cのスペクトルの高域のスペクトルの振幅値が調整され、図1Dに示すようなスペクトルが得られる。これが原信号のスペクトルを推定したスペクトルである。
特表2001−521648号公報(第15頁、第1図、第2図)
一般に、音声信号、オーディオ信号等のスペクトルは、ある周波数の整数倍に(所定のピッチごとに)スペクトルのピークが現れる調波構造を持つことが知られている。この調波構造は、音声信号、オーディオ信号等の品質を保つ上で重要な情報であり、調波構造に乱れが生じると品質の劣化が聴取者に知覚されることとなる。
図2Aおよび図2Bは、従来技術の問題点を説明するための図である。
図2Aは、オーディオ信号をスペクトル分析することにより得られたスペクトルである。この図からわかるように、原信号には周波数軸上の間隔Tからなる調波構造が見られる。一方、図2Bは、上記の技術に従い、原信号のスペクトルを推定した結果得られたスペクトルである。これら2つのスペクトルを比較すると、図2Bのスペクトルは、置換元の低域スペクトルS1と置換先の高域スペクトルS2では調波構造が保持されているが、低域スペクトルS1と高域スペクトルS2の接続部(スペクトルS3)では調波構造が崩れていることがわかる。
この推定スペクトルを時間信号に変換して試聴すると、このような調波構造の乱れによって、聴取者は品質劣化を知覚することとなり問題である。この調波構造の乱れは、調波構造の形状を考慮せずに置換が行われたことに起因している。
本発明の目的は、スペクトルの調波構造に乱れを生じさせず、低ビットレートで高品質にスペクトルを符号化することができる符号化装置およびこの符号化信号を復号することができる復号化装置を提供することである。
本発明の符号化装置は、第1帯域および第2帯域を有するスペクトルを符号化するスペクトル符号化装置であって、前記第2帯域のスペクトルに類似するスペクトルの情報を、調波構造に基づいて前記第1帯域のスペクトルから取得する取得手段と、前記第2帯域のスペクトルの代わりに前記情報を符号化する符号化手段と、を具備する構成を採る。
本発明の符号化装置は、低周波帯域および高周波帯域を有するスペクトルを取得する取得手段と、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて生成する生成手段と、高周波帯域の前記スペクトルの代わりに、前記類似具合を示すパラメータを符号化する符号化手段と、を具備する構成を採る。
本発明の復号化装置は、低周波帯域および高周波帯域のうちの低周波帯域のスペクトルを取得するスペクトル取得手段と、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得手段と、低周波帯域の前記スペクトルおよび前記パラメータを用いて、低周波帯域および高周波帯域の前記スペクトルを復号する復号化手段と、を具備する構成を採る。
本発明の符号化方法は、低周波帯域および高周波帯域を有するスペクトルを取得するステップと、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて生成するステップと、高周波帯域の前記スペクトルの代わりに、前記類似具合を示すパラメータを符号化するステップと、を具備するようにした。
本発明の復号化方法は、低周波帯域および高周波帯域を有するスペクトルのうちの低周波帯域のスペクトルを取得するステップと、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するステップと、低周波帯域の前記スペクトルおよび前記パラメータを用いて、低周波帯域および高周波帯域の前記スペクトルを復号するステップと、を具備するようにした。
本発明によれば、スペクトルの調波構造を崩さずに、低ビットレートで高品質にスペクトルを符号化することができる。また、この符号化信号を復号した際の音質も向上させることができる。
本発明者は、音声信号、オーディオ信号等(以下、総称して音響信号という)の特性、すなわち、音響信号が周波数軸方向に調波構造を形成している点に着目し、全周波数帯域のスペクトルのうち、一部の帯域のスペクトルを用いて残りの帯域のスペクトルを符号化できることを見出して本発明をするに至った。
すなわち、本発明の骨子は、例えば、高域部および低域部の2つの周波数帯域に分けられた信号スペクトルを符号化する際に、高域部のスペクトルに対しては、高域部および低域部の双方のスペクトルの類似具合を求め、この類似具合を表すパラメータ自体を符号化することである。
以下、本発明の実施の形態について、図面を参照して詳細に説明する。
(実施の形態1)
図3は、本発明の実施の形態1に係る符号化装置が無線通信システムの送信側に搭載された場合の無線送信装置130の主要な構成を示すブロック図である。
この無線送信装置130は、符号化装置120、入力装置131、A/D変換装置132、RF変調装置133、およびアンテナ134を有する。
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換し、A/D変換装置132に出力する。A/D変換装置132は、このアナログ信号をディジタル信号に変換し、符号化装置120に出力する。符号化装置120は、入力されたディジタル信号を符号化して符号化信号を生成し、RF変調装置133に出力する。RF変調装置133は、符号化信号を変調して変調符号化信号を生成し、アンテナ134に出力する。アンテナ134は、変調符号化信号を電波W12として送信する。
図4は、上記の符号化装置120の内部構成を示すブロック図である。ここでは、階層符号化(スケーラブル符号化)を行う場合を例にとって説明する。
符号化装置120は、入力端子121、ダウンサンプリング部122、第1レイヤ符号化部123、第1レイヤ復号化部124、アップサンプリング部125、遅延部126、スペクトル符号化部100、多重化部127および出力端子128を有する。
入力端子121には、A/D変換装置132から有効周波数帯域が0≦k<FHの信号が入力される。ダウンサンプリング部122は、入力端子121を介し入力された信号にダウンサンプリングを施してサンプリングレートの低い信号を生成し、出力する。第1レイヤ符号化部123は、このダウンサンプリング後の信号を符号化し、得られた符号化コードを多重化部(マルチプレクサ)127に出力すると共に、第1レイヤ復号化部124にも出力する。第1レイヤ復号化部124は、この符号化コードを基に第1レイヤの復号信号を生成する。アップサンプリング部125は、第1レイヤ符号化部123の復号信号のサンプリングレートを上げる。
一方、遅延部126は、入力端子121を介し入力される信号に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部122、第1レイヤ符号化部123,第1レイヤ復号化部124、およびアップサンプリング部125を介した際に生じる時間遅れと同値とする。スペクトル符号化部100は、アップサンプリング部125から出力される信号を第1信号として、また遅延部126から出力される信号を第2信号としてスペクトル符号化を行い、生成した符号化コードを多重化部127に出力する。多重化部127は、第1レイヤ符号化部123で求められる符号化コードとスペクトル符号化部100で求められる符号化コードを多重化し、出力コードとして出力端子128を介し出力する。この出力コードは、RF変調装置133に与えられる。
図5は、上記のスペクトル符号化部100の内部構成を示すブロック図である。
スペクトル符号化部100は、入力端子102、103、周波数領域変換部104、105、内部状態設定部106、フィルタリング部107、探索部108、ピッチ係数設定部109、フィルタ係数算出部110、および出力端子111を有する。
入力端子102には、アップサンプリング部125から第1信号が入力される。この第1信号は、第1レイヤ符号化部123で符号化された符号化パラメータを用いて第1レイヤ復号化部124にて復号された信号であり、有効周波数帯域が0≦k<FLになっている。また、入力端子103には、遅延部126から有効周波数帯域が0≦k<FH(ただし、FL<FH)の第2信号が入力される。
周波数領域変換部104は、入力端子102から入力される第1信号に周波数変換を行い、第1スペクトルS1(k)を算出する。また、周波数領域変換部105は、入力端子103から入力される第2信号に周波数変換を行い、第2スペクトルS2(k)を算出する。ここで周波数変換の方法は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)等を適用する。
内部状態設定部106は、有効周波数帯域が0≦k<FLの第1スペクトルS1(k)を使ってフィルタリング部107で用いられるフィルタの内部状態を設定する。この設定については、後ほど再度説明する。
ピッチ係数設定部109は、ピッチ係数Tを予め定められた探索範囲Tmin〜Tmaxの中で少しずつ変化させながら、フィルタリング部107に順次出力する。
フィルタリング部107は、内部状態設定部106で設定されたフィルタの内部状態と、ピッチ係数設定部109から出力されるピッチ係数Tとに基づいて第2スペクトルのフィルタリングを行い、第1スペクトルの推定値S'2(k)を算出する。このフィルタリング処理の詳細については後述する。
探索部108は、周波数領域変換部105から出力される第2スペクトルS2(k)とフィルタリング部107から出力される第2スペクトルの推定値S'2(k)との類似性を示すパラメータである類似度を算出する。この類似度については、後ほど詳述する。この類似度の算出処理は、ピッチ係数設定部109からピッチ係数Tが与えられる度に行われ、算出される類似度が最大となるピッチ係数T’(Tmin〜Tmaxの範囲)が、フィルタ係数算出部110に与えられる。
フィルタ係数算出部110は、探索部108から与えられるピッチ係数T’を用いて、フィルタ係数βiを求め、出力端子111を介し出力する。このとき、ピッチ係数T’も同時に出力端子111を介し出力される。
次いで、スペクトル符号化部100の主要な各部の具体的な動作について、数式を交えながら以下詳細に説明する。
図6は、フィルタリング部107のフィルタリング処理の概要を説明するための図である。
ここでは、全周波数帯域(0≦k<FH)のスペクトルを便宜的にS(k)と呼び、フィルタ関数は次式
で表されるものを使用する。この式において、zはz変換変数を表しており、Tはピッチ係数設定部109より与えられた係数を表しており、またM=1とする。
この図に示すように、S(k)の0≦k<FLの帯域には、第1スペクトルS1(k)がフィルタの内部状態として格納されている。一方、S(k)のFL≦k<FHの帯域には、以下の手順により求められた第2スペクトルの推定値S'2(k)が格納される。
S'2(k)には、フィルタリング処理により、kよりTだけ低い周波数のスペクトルS(k−T)に、このスペクトルを中心としてiだけ離れた近傍のスペクトルS(k−T−i)に所定の重み付け係数β
iを乗じたスペクトルβ
i・S(k−T−i)を全て加算したスペクトル、すなわち、次式
により表されるスペクトルが代入される。このとき、このフィルタに与えられる入力信号はゼロとしている。すなわち(式2)は(式1)のゼロ入力応答を表す。そして上記の演算を、周波数の低い方(k=FL)から順にkをFL≦k<FHの範囲で変化させて行うことにより、FL≦k<FHにおける第2スペクトルの推定値S'2(k)が算出される。
以上のフィルタリング処理は、ピッチ係数設定部109からピッチ係数Tが与えられる度に、FL≦k<FHの範囲において、その都度S(k)をゼロクリアして行われる。すなわち、ピッチ係数Tが変化するたびにS(k)は算出され、探索部108に出力される。
次に、探索部108において行われる類似度の算出処理および最適なピッチ係数Tの導出処理について説明する。
まず、類似度には、様々な定義が存在する。ここでは、フィルタ係数β
−1およびβ
1を0とみなして、最小2乗誤差法に基づいて次式
によって定義される類似度を用いる場合を例にとって説明する。この類似度を使用した場合、最適なピッチ係数Tを算出した後にフィルタ係数β
iを決定することになる。ここで、Eは、S2(k)とS'2(k)との間の2乗誤差を表す。この式において右辺第1項は、ピッチ係数Tに関係ない固定値となるので、右辺第2項を最大とするS'2(k)を生成するピッチ係数Tが探索される。この式の右辺第2項を類似度と呼ぶことにする。
図7A〜図7Eは、ピッチ係数Tが変化するに伴い第2スペクトルの推定値S'2(k)のスペクトルがどのように変化するかを説明するための図である。
図7Aは、内部状態として格納されている、調波構造を有する第1スペクトルを示した図である。また、図7B〜図7Dは、3種類のピッチ係数T0、T1、T2を用いて、それぞれフィルタリングを行うことにより算出される第2スペクトルの推定値S'2(k)のスペクトルを示した図である。なお、図7Eは、推定値S'2(k)のスペクトルと比較するために第2スペクトルS2(k)を示したものである。
この図に示す例では、図7Cに示すスペクトルと図7Eに示すスペクトルとが類似しているため、T1を用いて算出する類似度が最も高い値を示すことがわかる。すなわち、調波構造を保つことのできるピッチ係数TとしてはT1が最適である。
図8A〜図8Eも、図7A〜図7Eと同様の図であるが、ここでは内部状態として格納されている第1スペクトルの位相が図7A〜図7Eとは異なっている。しかし、この図に示す例においても、調波構造が保持されるピッチ係数TはT1のときである。
このように、ピッチ係数Tを変化させ、類似度が最大となるTを見つけることは、スペクトルの調波構造のピッチ(またはその整数倍)をトライ・アンド・エラーで見つけることに相当している。そして、本実施の形態の符号化装置は、この調波構造のピッチに基づいて第2スペクトルの推定値S'2(k)を算出するので、第1スペクトルと推定スペクトルとの間の接続部において調波構造が崩れない。これは、接続部であるk=FLの場合の推定値S'2(k)は調波構造のピッチ(またはその整数倍)Tだけ離れた第1スペクトルに基づいて算出されることを考えても容易に理解される。
また、ピッチ係数Tは、スペクトルデータの周波数間隔の整数倍(整数値)を表している。しかし、実際の調波構造のピッチは非整数値であることが多い。よって、Tを中心に前後M個の近傍データを、適当な重み付け係数βiを選んで重み付き加算することにより、T−MからT+Mまでの範囲の非整数値の調波構造のピッチを表現することが可能となる。
図9は、フィルタリング部107、探索部108、ピッチ係数設定部109において行われる各処理の一連のアルゴリズムの一例を示したフロー図である。これらの処理の概要については既に説明したので、フローの詳細な説明は省略する。
次に、フィルタ係数算出部110におけるフィルタ係数の算出処理について説明する。
フィルタ係数算出部110は、探索部108から与えられるピッチ係数T’を用いて次式
に従い、この式の2乗歪Eを最小にするようなフィルタ係数β
iを求める。なお、フィルタ係数算出部110は、複数個のβ
i(i=−1,0,1)の組合せを予めデータテーブルとして持っており、上記の(式4)の2乗歪Eを最小とするβ
i(i=−1,0,1)の組合せを決定し、そのインデックスを出力する。
このように、本実施の形態の符号化装置によれば、低域部(0≦k<FL)および高域部(FL≦k<FH)の2つに分けられた入力信号のスペクトルに対し、低域スペクトルを内部状態として有するフィルタリング部107を用いて高域スペクトルの形状を推定し、フィルタリング部107のフィルタ特性を表すパラメータ自体を、高域スペクトルの代わりに符号化して出力するため、低ビットレートで高品質にスペクトルを符号化することができる。
また、以上の構成において、フィルタリング部107が低域スペクトルを用いて高域スペクトルの形状を推定する際に、ピッチ係数設定部109は、推定の基準とする低域スペクトルと高域スペクトルとの周波数差、すなわち、ピッチ係数Tを様々に変化させ出力し、探索部108は、低域スペクトルと高域スペクトルの類似度が最大となるTを検出するので、スペクトル全体の調波構造のピッチに基づいて高域スペクトルの形状を推定することができ、スペクトル全体の調波構造を維持したまま符号化を行うことができる。
また、低域スペクトルの帯域幅を調波構造のピッチに基づいて設定する必要もない。すなわち、低域スペクトルの帯域幅を調波構造のピッチ(または、その整数倍)に揃える必要はなく、任意に帯域幅を設定できる。調波構造のピッチに揃える操作を行わなくても、以上の構成によれば、低域スペクトルと高域スペクトルとの接続部において、スペクトルは滑らかに接続されるからである。
なお、本実施の形態では、(式1)においてM=1とする場合を例にとって説明したが、Mはこれに限定されることは無く、0以上の整数(自然数)を用いることが可能である。
また、本実施の形態では、階層符号化(スケーラブル符号化)を行う符号化装置を例にとって説明したが、上記のスペクトル符号化部100は、他の方式の符号化を行う符号化装置に実装することも可能である。
また、本実施の形態では、スペクトル符号化部100が周波数領域変換部104、105を有する場合を例にとって説明したが、これらは時間領域信号を入力信号とする場合に必要な構成要素であり、スペクトル符号化部100に直接スペクトルが入力される態様においては、周波数領域変換部は必要ない。
さらに、本実施の形態では、低域のスペクトルを用いて、すなわち、低域のスペクトルを符号化の基準として、高域のスペクトルを符号化する場合を例にとって説明したが、この基準となるスペクトルの設定の仕方はこれに限定されず、例えば、エネルギーを有効に利用するという観点からは望ましくないが、高域のスペクトルを用いて低域のスペクトルを符号化したり、または中間周波数帯域のスペクトルを符号化の基準とし他の領域のスペクトルを符号化することも可能である。
図10は、無線送信装置130から送信された信号を受信する無線受信装置180の主要な構成を示すブロック図である。
この無線受信装置180は、アンテナ181、RF復調装置182、復号化装置170、D/A変換装置183、および出力装置184を有している。
アンテナ181は、電波W12としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してRF復調装置182に与える。RF復調装置182は、アンテナ181からの受信符号化音響信号を復調して復調符号化音響信号を生成して復号化装置170に与える。
復号化装置170は、RF復調装置182からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
図11は、上記の復号化装置170の内部構成を示すブロック図である。ここでは、階層符号化された信号を復号する場合を例にとって説明する。
この復号化装置170は、入力端子171、分離部172、第1レイヤ復号化部173、アップサンプリング部174、スペクトル復号化部150、および出力端子176、177を有する。
入力端子171には、RF復調装置182からディジタルの復調符号化音響信号が入力される。分離部172は、入力端子171を介し入力された復調符号化音響信号を分離し、第1レイヤ復号化部173用の符号化コードとスペクトル復号化部150用の符号化コードとを生成する。第1レイヤ復号化部173は、分離部172で得られた符号化コードを用いて信号帯域0≦k<FLの復号信号を復号し、この復号信号をアップサンプリング部174に与える。また、他方の出力は、出力端子176に接続されている。これにより、第1レイヤ復号化部173で生成される第1レイヤ復号信号を出力する必要が生じた場合には、この出力端子176を介し出力させることができる。
アップサンプリング部174は、第1レイヤ復号化部173から与えられる第1レイヤ復号信号のサンプリング周波数を上げる。スペクトル復号化部150には、分離部172で分離された符号化コードとアップサンプリング部174で生成されたアップサンプリング後の第1レイヤ復号信号とが与えられる。スペクトル復号化部150は、後述するスペクトル復号化を行い、信号帯域0≦k<FHの復号信号を生成し、出力端子177を介しこれを出力する。スペクトル復号化部150では、アップサンプリング部174から与えられるアップサンプリング後の第1レイヤ復号信号を第1信号とみなして処理を行うことになる。
この構成によれば、第1レイヤ復号化部173で生成される第1レイヤ復号信号を出力する必要がある場合には、出力端子176より出力させることができる。また、より品質の高いスペクトル復号化部150の出力信号を出力する必要がある場合には、出力端子177より出力させることができる。復号化装置170からは、出力端子176もしくは出力端子177のいずれか一方の信号が出力され、D/A変換装置183に与えられる。どちらの信号が出力されるかは、アプリケーションの設定やユーザの判断に基づく。
図12は、上記のスペクトル復号化部150の内部構成を示すブロック図である。
このスペクトル復号化部150は、入力端子152、153、周波数領域変換部154、内部状態設定部155、フィルタリング部156、時間領域変換部158、および出力端子159を有する。
入力端子152には、スペクトル符号化部100にて符号化された符号化コードを表すフィルタ係数が、分離部172を介して入力される。さらに、入力端子153には、有効周波数帯域が0≦k<FLの第1信号が入力される。この第1信号は、第1レイヤ復号化部173で復号された第1レイヤ復号信号をアップサンプリング部174にてアップサンプリングしたものである。
周波数領域変換部154は、入力端子153から入力された時間領域信号に周波数変換を行い、第1スペクトルS1(k)を算出する。周波数変換法は、離散フーリエ変換(DFT)、離散コサイン変換(DCT)、変形離散コサイン変換(MDCT)等を使用する。
内部状態設定部155は、第1スペクトルS1(k)を使って、フィルタリング部156で用いられるフィルタの内部状態を設定する。
フィルタリング部156は、内部状態設定部155で設定されたフィルタの内部状態と、入力端子152から与えられるピッチ係数T’およびフィルタ係数βに基づき第1スペクトルのフィルタリングを行い、第2スペクトルの推定値S'2(k)を算出する。この場合、フィルタリング部156では、(式1)に記載のフィルタ関数が用いられる。
時間領域変換部158は、フィルタリング部156により得られた復号スペクトルS'(k)を時間領域の信号に変換し、出力端子159を介し出力する。ここでは、必要に応じて、適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。
図13は、フィルタリング部156において生成される復号スペクトルS'(k)を示した図である。
この図にあるように、周波数帯域0≦k<FLの復号スペクトルS'(k)は、第1スペクトルS1(k)によって構成され、周波数帯域FL≦k<FHの復号スペクトルS'(k)は、第2スペクトルの推定値S'2(k)によって構成される。
このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化方法に対応した構成を有しているため、少ないビット数で効率よく符号化された音響信号を復号することができ、良好な音響信号を出力することができる。
なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。
図14Aは、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図3に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。
有線送信装置140は、符号化装置120、入力装置131、およびA/D変換装置132を有し、出力がネットワークN1に接続されている。
A/D変換装置132の入力端子は、入力装置131の出力端子に接続されている。符号化装置120の入力端子は、A/D変換装置132の出力端子に接続されている。符号化装置120の出力端子はネットワークN1に接続されている。
入力装置131は、人間の耳に聞こえる音波W11を電気的信号であるアナログ信号に変換してA/D変換装置132に与える。A/D変換装置132は、アナログ信号をディジタル信号に変換して符号化装置120に与える。符号化装置120は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークN1に出力する。
図14Bは、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図10に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。
有線受信装置190は、ネットークN1に接続されている受信装置191、復号化装置170、D/A変換装置183、および出力装置184を有している。
受信装置191の入力端子は、ネットワークN1に接続されている。復号化装置170の入力端子は、受信装置191の出力端子に接続されている。D/A変換装置183の入力端子は、復号化装置170の出力端子に接続されている。出力装置184の入力端子は、D/A変換装置183の出力端子に接続されている。
受信装置191は、ネットワークN1からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置170に与える。復号化装置170は、受信装置191からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してD/A変換装置183に与える。D/A変換装置183は、復号化装置170からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置184に与える。出力装置184は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波W13として人間の耳に聴こえるように出力する。
このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。
(実施の形態2)
図15は、本発明の実施の形態2に係る符号化装置内のスペクトル符号化部200の主要な構成を示すブロック図である。なお、このスペクトル符号化部200は、図5に示したスペクトル符号化部100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、フィルタリング部で用いられるフィルタ関数を実施の形態1よりも簡易なものにすることである。
フィルタリング部201で用いられるフィルタ関数は、次式
のように簡略化したものを用いる。この式は、(式1)においてM=0、β
0=1としたフィルタ関数に相当している。
図16は、上記のフィルタを用いたフィルタリングの概要を説明するための図である。
第2スペクトルの推定値S'2(k)は、Tだけ離れた低域のスペクトルを順次コピーすることにより求められる。また、探索部108は、最適なピッチ係数T’を実施の形態1と同様に(式3)のEを最小とするピッチ係数Tを探索することにより決定する。このようにして求められたピッチ係数T’を出力端子111を介し出力する。この構成により、フィルタの特性はピッチ係数Tのみで決定されることになる。
なお、本実施の形態のフィルタは、低レート音声符号化の代表的な技術であるCELP(Code-Excited Linear Prediction)方式の構成要素の一つである適応符号帳(adaptive codebook)と同じように動作するという特徴がある。
次いで、上記のスペクトル符号化部200によって符号化された信号を復号するスペクトル復号化部について説明する(図示せず)。
このスペクトル復号化部は、図12に示したスペクトル復号化部150と同様の構成を有しているので、詳しい説明は省略するが、次のような特徴を有している。すなわち、フィルタリング部156は、第2スペクトルの推定値S'2(k)を算出する場合に、(式1)に記載のフィルタ関数ではなく(式5)に記載のフィルタ関数を用いる。入力端子152から与えられるのは、ピッチ係数T’のみとなる。すなわち、(式1)または(式5)に記載のフィルタ関数のどちらを利用するかは、符号化側で用いられたフィルタ関数の種類に依存し、そのフィルタ関数と同一のフィルタ関数を用いる。
このように、本実施の形態によれば、フィルタリング部で用いられるフィルタ関数をより簡易なものとするため、フィルタ係数算出部を設置する必要がなくなり、少ない演算量によって第2スペクトル(高域スペクトル)の推定を行うことができ、また、回路規模も縮小することができる。
(実施の形態3)
図17は、本発明の実施の形態3に係る符号化装置内のスペクトル符号化部300の主要な構成を示すブロック図である。なお、このスペクトル符号化部300は、図5に示したスペクトル符号化部100と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、概形算出部301および多重化部302をさらに有し、第2スペクトルの推定が行われた後に第2スペクトルの包絡情報をさらに符号化することである。
探索部108は、最適なピッチ係数T’を多重化部302に出力すると共に、このピッチ係数T’を用いて生成される第2スペクトルの推定値S'2(k)を概形算出部301に出力する。概形算出部301は、周波数領域変換部105から与えられる第2スペクトルS2(k)に基づいて第2スペクトルS2(k)の包絡情報を算出する。なお、ここでは、この包絡情報をサブバンド毎のスペクトルパワで表し、周波数帯域FL≦k<FHをJ個のサブバンドに分割する場合を例にとって説明する。このとき、第jサブバンドのスペクトルパワは次式
で表される。この式において、BL(j)は、第jサブバンドの最小周波数、BH(j)は、第jサブバンドの最大周波数を表す。このようにして求めた第2スペクトルのサブバンド情報を第2スペクトルのスペクトル包絡情報とみなす。
同様に、第2スペクトルの推定値S'2(k)のサブバンド情報B’(j)を次式
に従い算出し、サブバンド毎の変動量V(j)を次式
に従い算出する。
次に、変動量V(j)を符号化して符号化後の変動量Vq(j)を求め、そのインデックスを多重化部302に送る。多重化部302は、探索部108から得られる最適なピッチ係数T’と概形算出部301から出力される変動量V(j)のインデックスを多重化して出力端子111を介し出力する。
このように、本実施の形態によれば、高域スペクトルの推定を行った後に、さらに高域スペクトルの包絡情報も符号化するため、高域スペクトルの推定値の精度を向上させることができる。
(実施の形態4)
図18は、本発明の実施の形態4に係る復号化装置内のスペクトル復号化部550の主要な構成を示すブロック図である。なお、このスペクトル復号化部550は、図12に示したスペクトル復号化部150と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、分離部551、スペクトル包絡復号化部552、およびスペクトル調整部553をさらに有することである。これにより、実施の形態3で示したスペクトル符号化部300等によって高域スペクトルの推定スペクトルの符号化に併せて包絡情報も符号化された符号化コードの復号を行うことができる。
分離部551は、入力端子152を介し入力された符号化コードを分離し、フィルタリング係数に関する情報はフィルタリング部156に与えると共に、スペクトル包絡に関する情報はスペクトル包絡復号化部552に与える。
スペクトル包絡復号化部552は、分離部551から与えられたスペクトル包絡情報から、変動量V(j)を符号化して得られる変動量Vq(j)を復号することにより求める。
スペクトル調整部553は、フィルタリング部156から得られる復号スペクトルS'(k)に、スペクトル包絡復号化部552から得られる復号されたサブバンド毎の変動量V
q(j)を次式
に従い乗じることにより、復号スペクトルS'(k)の周波数帯域FL≦k<FHにおけるスペクトル形状を調整し、調整後の復号スペクトルS3(k)を生成する。この調整後の復号スペクトルS3(k)は、時間領域変換部158に出力され、時間領域信号に変換される。
このように、本実施の形態によれば、包絡情報も併せて符号化されている符号化コードを復号することができる。
なお、本実施の形態では、分離部551から与えられるスペクトル包絡情報が、(式8)に示されるサブバンド毎の変動量V(j)を符号化して求められた値Vq(j)である場合を例にとって説明したが、スペクトル包絡情報はこれに限定されない。
(実施の形態5)
図19は、本発明の実施の形態5に係る復号化装置内のスペクトル復号化部650の主要な構成を示すブロック図である。なお、このスペクトル復号化部650は、図18に示したスペクトル復号化部550と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。
本実施の形態の特徴は、LPCスペクトル算出部652をさらに有し、LPC係数により算出されるLPCスペクトルをスペクトル包絡情報として利用し、第2スペクトルの推定を行った後に、第2スペクトルにLPCスペクトルを乗じることにより、より精度の高い第2スペクトルの推定値を得ることである。
LPCスペクトル算出部652は、入力端子651を介し入力されたLPC係数α(j)からLPCスペクトルenv(k)を、次式
に従い算出する。ここで、NPはLPC係数の次数を表す。また、変数γ(0<γ<1)を用い、LPCスペクトルの特性を変化させることによりLPCスペクトルenv(k)を求めることもできる。この場合、LPCスペクトルenv(k)は、次式
のように表される。ここでγは固定値として規定することもできるし、フレーム毎に可変な値をとることもできる。このように算出されたLPCスペクトルenv(k)は、スペクトル調整部553に出力される。
スペクトル調整部553は、フィルタリング部156から得られる復号スペクトルS'(k)に、LPCスペクトル算出部652から得られるLPCスペクトルenv(k)を、次式
に従い乗じ、復号スペクトルS'(k)の周波数帯域FL≦k<FHにおけるスペクトルを調整し、調整後の復号スペクトルS3(k)を生成する。この調整後の復号スペクトルS3(k)は、時間領域変換部158に与えられ、時間領域信号に変換される。
このように、本実施の形態によれば、LPCスペクトルをスペクトル包絡情報として利用するため、より精度の高い第2スペクトルの推定値を得ることができる。
本発明に係る符号化装置または復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、ソフトウェアで実現することも可能である。
本明細書は、2003年9月16日出願の特願2003−323658に基づく。この内容は全てここに含めておく。
本発明に係る符号化装置および復号化装置は、低ビットレートで符号化する効果を有し、無線通信システム等の用途にも適用できる。
従来の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す図
従来技術の問題点を説明するための図
実施の形態1に係る無線送信装置の主要な構成を示すブロック図
実施の形態1に係る符号化装置の内部構成を示すブロック図
実施の形態1に係るスペクトル符号化部の内部構成を示すブロック図
実施の形態1に係るフィルタリング部のフィルタリング処理の概要を説明するための図
ピッチ係数Tが変化するに伴い第2スペクトルの推定値のスペクトルがどのように変化するかを説明するための図
ピッチ係数Tが変化するに伴い第2スペクトルの推定値のスペクトルがどのように変化するかを説明するための図
実施の形態1に係るフィルタリング部、探索部、ピッチ係数設定部において行われる各処理の一連のアルゴリズムの一例を示したフロー図
実施の形態1に係る無線受信装置の主要な構成を示すブロック図
実施の形態1に係る復号化装置の内部構成を示すブロック図
実施の形態1に係るスペクトル復号化部の内部構成を示すブロック図
実施の形態1に係るフィルタリング部において生成される復号スペクトルを示した図
実施の形態1に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図
実施の形態1に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図
実施の形態2に係るスペクトル符号化部の主要な構成を示すブロック図
実施の形態2に係るフィルタを用いたフィルタリングの概要を説明するための図
実施の形態3に係るスペクトル符号化部の主要な構成を示すブロック図
実施の形態4に係るスペクトル復号化部の主要な構成を示すブロック図
実施の形態5に係るスペクトル復号化部の主要な構成を示すブロック図