JPWO2005027095A1

JPWO2005027095A1 - 符号化装置および復号化装置

Info

Publication number: JPWO2005027095A1
Application number: JP2005513947A
Authority: JP
Inventors: 押切　正浩; 正浩押切
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2003-09-16
Filing date: 2004-09-15
Publication date: 2007-11-08
Anticipated expiration: 2024-09-15
Also published as: CN101800049B; BRPI0414444A; CN1849648A; JP4789622B2; EP2071565B1; CN100590712C; EP1657710A4; BRPI0414444B1; EP2071565A2; EP1657710A1; CN101800049A; DE602004032587D1; EP2264700A1; JP2011039553A; JP5171922B2; EP1657710B1; DE602004021266D1; CN101783141B; CN101783141A; WO2005027095A1

Abstract

スペクトルの調波構造に乱れを生じさせず、低ビットレートで高品質にスペクトルを符号化することができる符号化装置。この装置において、内部状態設定部（１０６）は、第１スペクトルＳ１（ｋ）を使ってフィルタリング部（１０７）の内部状態を設定する。ピッチ係数設定部（１０９）は、ピッチ係数Ｔを少しずつ変化させながら出力する。フィルタリング部（１０７）は、ピッチ係数Ｔに基づいて第２スペクトルＳ２（ｋ）の推定値Ｓ’２（ｋ）を算出する。探索部（１０８）は、Ｓ２（ｋ）とＳ’２（ｋ）の類似度を算出する。このとき、算出される類似度が最大となるピッチ係数Ｔ’がフィルタ係数算出部（１１０）に与えられる。フィルタ係数算出部（１１０）は、このピッチ係数Ｔ’を用いてフィルタ係数βｉを求める。

Description

本発明は、無線通信装置等に搭載され、音声信号、オーディオ信号等の符号化を行う符号化装置およびこの符号化信号の復号を行う復号化装置に関する。

音声信号、オーディオ信号等を低ビットレートの信号に圧縮する符号化技術は、移動体通信システムにおいては、電波等の伝送路容量（回線容量）および記録媒体を有効利用するという観点から特に重要である。

音声信号を符号化する音声符号化の方式に、ＩＴＵ−Ｔ（ＩｎｔｅｒｎａｔｉｏｎａｌＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＵｎｉｏｎＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎＳｔａｎｄａｒｄｉｚａｔｉｏｎＳｅｃｔｏｒ）で規格化されているＧ７２６、Ｇ７２９等の方式が存在する。これらの方式は、狭帯域信号（３００Ｈｚ〜３．４ｋＨｚ）を符号化の対象とし、８ｋｂｉｔ／ｓ〜３２ｋｂｉｔ／ｓのビットレートで高品質な符号化を行うことができる。しかし、このような狭帯域信号は周波数帯域が最大３．４ｋＨｚまでと狭いため、その品質は聴取者に音がこもっている印象を与え、臨場感に欠けるという問題がある。

また、広帯域信号（５０Ｈｚ〜７ｋＨｚ）を符号化の対象とする音声符号化方式も存在する。この代表的な例として、ＩＴＵ−ＴのＧ７２２、Ｇ７２２．１や、３ＧＰＰ（Ｔｈｅ３ｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ）のＡＭＲ−ＷＢ等がある。これらの方式は、ビットレートが６．６ｋｂｉｔ／ｓ〜６４ｋｂｉｔ／ｓで広帯域音声信号の符号化を行うことができる。しかし、符号化の対象とする信号が音声の場合、広帯域信号は比較的高品質であるものの、オーディオ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合には十分ではない。

一方、一般的には、信号の最大周波数が１０〜１５ｋＨｚ程度までであると、ＦＭラジオ相当の臨場感が得られ、２０ｋＨｚ程度までであればＣＤ（コンパクト・ディスク）並みの品質が得られる。このような信号に対しては、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔＧｒｏｕｐ）で規格化されているレイヤＩＩＩ方式やＡＡＣ方式等に代表されるオーディオ符号化が適している。しかし、これらのオーディオ符号化方式は、符号化の対象となる信号の周波数帯域が広くなるため、符号化された信号のビットレートが大きくなるという問題がある。

従来の符号化技術として、周波数帯域の広い信号を低ビットレートで符号化する技術がある（例えば、特許文献１参照）。これによれば、入力信号を低域部の信号と高域部の信号とに分け、高域部の信号のスペクトルを低域部の信号のスペクトルで置換することにより符号化して、全体のビットレートを低減させる。

図１Ａ〜図１Ｄは、上記の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す図である。なお本来は、この処理は符号化処理と組み合わせて行われるものであるが、ここでは説明を簡単にするために、原信号に上記の処理を施す場合を例にとって述べる。

図１Ａは、周波数帯域が０≦ｋ＜ＦＨに帯域制限された原信号のスペクトル、図１Ｂは、同信号を０≦ｋ＜ＦＬに帯域制限したときのスペクトル（ただし、ＦＬ＜ＦＨ）、図１Ｃは、上記の技術により低域（低周波帯域）のスペクトルを用いて高域（高周波帯域）のスペクトルを置換して得られたスペクトル、図１Ｄは、置換後のスペクトルをスペクトル包絡情報に従い置換スペクトルの形状を整えることにより得られるスペクトルを表している。これらの図において、横軸は周波数、縦軸はスペクトル強度を表す。

この技術では、周波数帯域が０≦ｋ＜ＦＨの原信号のスペクトル（図１Ａ）を周波数帯域が０≦ｋ＜ＦＬの低域のスペクトル（図１Ｂ）を用いて表現することが行われる。具体的には、高域のスペクトル（ＦＬ≦ｋ＜ＦＨ）が、低域のスペクトル（０≦ｋ＜ＦＬ）によって置換される。この処理の結果、図１Ｃに示すようなスペクトルが得られる。なお、ここでは、説明を簡単にするために、ＦＬ＝ＦＨ／２の関係である場合を例にとって説明している。そして、原信号のスペクトル包絡情報に従い、図１Ｃのスペクトルの高域のスペクトルの振幅値が調整され、図１Ｄに示すようなスペクトルが得られる。これが原信号のスペクトルを推定したスペクトルである。
特表２００１−５２１６４８号公報（第１５頁、第１図、第２図）

一般に、音声信号、オーディオ信号等のスペクトルは、ある周波数の整数倍に（所定のピッチごとに）スペクトルのピークが現れる調波構造を持つことが知られている。この調波構造は、音声信号、オーディオ信号等の品質を保つ上で重要な情報であり、調波構造に乱れが生じると品質の劣化が聴取者に知覚されることとなる。

図２Ａおよび図２Ｂは、従来技術の問題点を説明するための図である。

図２Ａは、オーディオ信号をスペクトル分析することにより得られたスペクトルである。この図からわかるように、原信号には周波数軸上の間隔Ｔからなる調波構造が見られる。一方、図２Ｂは、上記の技術に従い、原信号のスペクトルを推定した結果得られたスペクトルである。これら２つのスペクトルを比較すると、図２Ｂのスペクトルは、置換元の低域スペクトルＳ１と置換先の高域スペクトルＳ２では調波構造が保持されているが、低域スペクトルＳ１と高域スペクトルＳ２の接続部（スペクトルＳ３）では調波構造が崩れていることがわかる。

この推定スペクトルを時間信号に変換して試聴すると、このような調波構造の乱れによって、聴取者は品質劣化を知覚することとなり問題である。この調波構造の乱れは、調波構造の形状を考慮せずに置換が行われたことに起因している。

本発明の目的は、スペクトルの調波構造に乱れを生じさせず、低ビットレートで高品質にスペクトルを符号化することができる符号化装置およびこの符号化信号を復号することができる復号化装置を提供することである。

本発明の符号化装置は、低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルを取得する取得手段と、取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて算出する算出手段と、取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を示すパラメータを符号化する符号化手段と、を具備する構成を採る。

本発明の復号化装置は、低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得手段と、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得手段と、取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する復号化手段と、を具備する構成を採る。

本発明の符号化方法は、低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルを取得する取得ステップと、取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて算出する算出ステップと、取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を示すパラメータを符号化する符号化ステップと、を具備するようにした。

本発明の復号化方法は、低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得ステップと、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得ステップと、取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する復号化ステップと、を具備するようにした。

本発明によれば、スペクトルの調波構造を崩さずに、低ビットレートで高品質にスペクトルを符号化することができる。また、この符号化信号を復号した際の音質も向上させることができる。

従来の高域部のスペクトルを低域部のスペクトルで置換する処理の概要を示す図従来技術の問題点を説明するための図実施の形態１に係る無線送信装置の主要な構成を示すブロック図実施の形態１に係る符号化装置の内部構成を示すブロック図実施の形態１に係るスペクトル符号化部の内部構成を示すブロック図実施の形態１に係るフィルタリング部のフィルタリング処理の概要を説明するための図ピッチ係数Ｔが変化するに伴い第２スペクトルの推定値のスペクトルがどのように変化するかを説明するための図ピッチ係数Ｔが変化するに伴い第２スペクトルの推定値のスペクトルがどのように変化するかを説明するための図実施の形態１に係るフィルタリング部、探索部、ピッチ係数設定部において行われる各処理の一連のアルゴリズムの一例を示したフロー図実施の形態１に係る無線受信装置の主要な構成を示すブロック図実施の形態１に係る復号化装置の内部構成を示すブロック図実施の形態１に係るスペクトル復号化部の内部構成を示すブロック図実施の形態１に係るフィルタリング部において生成される復号スペクトルを示した図実施の形態１に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図実施の形態１に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図実施の形態２に係るスペクトル符号化部の主要な構成を示すブロック図実施の形態２に係るフィルタを用いたフィルタリングの概要を説明するための図実施の形態３に係るスペクトル符号化部の主要な構成を示すブロック図実施の形態４に係るスペクトル復号化部の主要な構成を示すブロック図実施の形態５に係るスペクトル復号化部の主要な構成を示すブロック図

本発明者は、音声信号、オーディオ信号等（以下、総称して音響信号という）の特性、すなわち、音響信号が周波数軸方向に調波構造を形成している点に着目し、全周波数帯域のスペクトルのうち、一部の帯域のスペクトルを用いて残りの帯域のスペクトルを符号化できることを見出して本発明をするに至った。

すなわち、本発明の骨子は、例えば、高域部および低域部の２つの周波数帯域に分けられた信号スペクトルを符号化する際に、高域部のスペクトルに対しては、高域部および低域部の双方のスペクトルの類似具合を求め、この類似具合を表すパラメータ自体を符号化することである。

以下、本発明の実施の形態について、図面を参照して詳細に説明する。

（実施の形態１）
図３は、本発明の実施の形態１に係る符号化装置が無線通信システムの送信側に搭載された場合の無線送信装置１３０の主要な構成を示すブロック図である。

この無線送信装置１３０は、符号化装置１２０、入力装置１３１、Ａ／Ｄ変換装置１３２、ＲＦ変調装置１３３、およびアンテナ１３４を有する。

入力装置１３１は、人間の耳に聞こえる音波Ｗ１１を電気的信号であるアナログ信号に変換し、Ａ／Ｄ変換装置１３２に出力する。Ａ／Ｄ変換装置１３２は、このアナログ信号をディジタル信号に変換し、符号化装置１２０に出力する。符号化装置１２０は、入力されたディジタル信号を符号化して符号化信号を生成し、ＲＦ変調装置１３３に出力する。ＲＦ変調装置１３３は、符号化信号を変調して変調符号化信号を生成し、アンテナ１３４に出力する。アンテナ１３４は、変調符号化信号を電波Ｗ１２として送信する。

図４は、上記の符号化装置１２０の内部構成を示すブロック図である。ここでは、階層符号化（スケーラブル符号化）を行う場合を例にとって説明する。

符号化装置１２０は、入力端子１２１、ダウンサンプリング部１２２、第１レイヤ符号化部１２３、第１レイヤ復号化部１２４、アップサンプリング部１２５、遅延部１２６、スペクトル符号化部１００、多重化部１２７および出力端子１２８を有する。

入力端子１２１には、Ａ／Ｄ変換装置１３２から有効周波数帯域が０≦ｋ＜ＦＨの信号が入力される。ダウンサンプリング部１２２は、入力端子１２１を介し入力された信号にダウンサンプリングを施してサンプリングレートの低い信号を生成し、出力する。第１レイヤ符号化部１２３は、このダウンサンプリング後の信号を符号化し、得られた符号化コードを多重化部（マルチプレクサ）１２７に出力すると共に、第１レイヤ復号化部１２４にも出力する。第１レイヤ復号化部１２４は、この符号化コードを基に第１レイヤの復号信号を生成する。アップサンプリング部１２５は、第１レイヤ符号化部１２３の復号信号のサンプリングレートを上げる。

一方、遅延部１２６は、入力端子１２１を介し入力される信号に対し、所定の長さの遅延を与える。この遅延の大きさは、信号がダウンサンプリング部１２２、第１レイヤ符号化部１２３，第１レイヤ復号化部１２４、およびアップサンプリング部１２５を介した際に生じる時間遅れと同値とする。スペクトル符号化部１００は、アップサンプリング部１２５から出力される信号を第１信号として、また遅延部１２６から出力される信号を第２信号としてスペクトル符号化を行い、生成した符号化コードを多重化部１２７に出力する。多重化部１２７は、第１レイヤ符号化部１２３で求められる符号化コードとスペクトル符号化部１００で求められる符号化コードを多重化し、出力コードとして出力端子１２８を介し出力する。この出力コードは、ＲＦ変調装置１３３に与えられる。

図５は、上記のスペクトル符号化部１００の内部構成を示すブロック図である。

スペクトル符号化部１００は、入力端子１０２、１０３、周波数領域変換部１０４、１０５、内部状態設定部１０６、フィルタリング部１０７、探索部１０８、ピッチ係数設定部１０９、フィルタ係数算出部１１０、および出力端子１１１を有する。

入力端子１０２には、アップサンプリング部１２５から第１信号が入力される。この第１信号は、第１レイヤ符号化部１２３で符号化された符号化パラメータを用いて第１レイヤ復号化部１２４にて復号された信号であり、有効周波数帯域が０≦ｋ＜ＦＬになっている。また、入力端子１０３には、遅延部１２６から有効周波数帯域が０≦ｋ＜ＦＨ（ただし、ＦＬ＜ＦＨ）の第２信号が入力される。

周波数領域変換部１０４は、入力端子１０２から入力される第１信号に周波数変換を行い、第１スペクトルＳ１（ｋ）を算出する。また、周波数領域変換部１０５は、入力端子１０３から入力される第２信号に周波数変換を行い、第２スペクトルＳ２（ｋ）を算出する。ここで周波数変換の方法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を適用する。

内部状態設定部１０６は、有効周波数帯域が０≦ｋ＜ＦＬの第１スペクトルＳ１（ｋ）を使ってフィルタリング部１０７で用いられるフィルタの内部状態を設定する。この設定については、後ほど再度説明する。

ピッチ係数設定部１０９は、ピッチ係数Ｔを予め定められた探索範囲Ｔ_ｍｉｎ〜Ｔ_ｍａｘの中で少しずつ変化させながら、フィルタリング部１０７に順次出力する。

フィルタリング部１０７は、内部状態設定部１０６で設定されたフィルタの内部状態と、ピッチ係数設定部１０９から出力されるピッチ係数Ｔとに基づいて第２スペクトルのフィルタリングを行い、第１スペクトルの推定値Ｓ’２（ｋ）を算出する。このフィルタリング処理の詳細については後述する。

探索部１０８は、周波数領域変換部１０５から出力される第２スペクトルＳ２（ｋ）とフィルタリング部１０７から出力される第２スペクトルの推定値Ｓ’２（ｋ）との類似性を示すパラメータである類似度を算出する。この類似度については、後ほど詳述する。この類似度の算出処理は、ピッチ係数設定部１０９からピッチ係数Ｔが与えられる度に行われ、算出される類似度が最大となるピッチ係数Ｔ’（Ｔ_ｍｉｎ〜Ｔ_ｍａｘの範囲）が、フィルタ係数算出部１１０に与えられる。

フィルタ係数算出部１１０は、探索部１０８から与えられるピッチ係数Ｔ’を用いて、フィルタ係数β_ｉを求め、出力端子１１１を介し出力する。このとき、ピッチ係数Ｔ’も同時に出力端子１１１を介し出力される。

次いで、スペクトル符号化部１００の主要な各部の具体的な動作について、数式を交えながら以下詳細に説明する。

図６は、フィルタリング部１０７のフィルタリング処理の概要を説明するための図である。

ここでは、全周波数帯域（０≦ｋ＜ＦＨ）のスペクトルを便宜的にＳ（ｋ）と呼び、フィルタ関数は次式

で表されるものを使用する。この式において、ｚはｚ変換変数を表しており、Ｔはピッチ係数設定部１０９より与えられた係数を表しており、またＭ＝１とする。

この図に示すように、Ｓ（ｋ）の０≦ｋ＜ＦＬの帯域には、第１スペクトルＳ１（ｋ）がフィルタの内部状態として格納されている。一方、Ｓ（ｋ）のＦＬ≦ｋ＜ＦＨの帯域には、以下の手順により求められた第２スペクトルの推定値Ｓ’２（ｋ）が格納される。

Ｓ’２（ｋ）には、フィルタリング処理により、ｋよりＴだけ低い周波数のスペクトルＳ（ｋ−Ｔ）に、このスペクトルを中心としてｉだけ離れた近傍のスペクトルＳ（ｋ−Ｔ−ｉ）に所定の重み付け係数β_ｉを乗じたスペクトルβ_ｉ・Ｓ（ｋ−Ｔ−ｉ）を全て加算したスペクトル、すなわち、次式

により表されるスペクトルが代入される。このとき、このフィルタに与えられる入力信号はゼロとしている。すなわち（式２）は（式１）のゼロ入力応答を表す。そして上記の演算を、周波数の低い方（ｋ＝ＦＬ）から順にｋをＦＬ≦ｋ＜ＦＨの範囲で変化させて行うことにより、ＦＬ≦ｋ＜ＦＨにおける第２スペクトルの推定値Ｓ’２（ｋ）が算出される。

以上のフィルタリング処理は、ピッチ係数設定部１０９からピッチ係数Ｔが与えられる度に、ＦＬ≦ｋ＜ＦＨの範囲において、その都度Ｓ（ｋ）をゼロクリアして行われる。すなわち、ピッチ係数Ｔが変化するたびにＳ（ｋ）は算出され、探索部１０８に出力される。

次に、探索部１０８において行われる類似度の算出処理および最適なピッチ係数Ｔの導出処理について説明する。

まず、類似度には、様々な定義が存在する。ここでは、フィルタ係数β_−１およびβ_１を０とみなして、最小２乗誤差法に基づいて次式

によって定義される類似度を用いる場合を例にとって説明する。この類似度を使用した場合、最適なピッチ係数Ｔを算出した後にフィルタ係数β_ｉを決定することになる。ここで、Ｅは、Ｓ２（ｋ）とＳ’２（ｋ）との間の２乗誤差を表す。この式において右辺第１項は、ピッチ係数Ｔに関係ない固定値となるので、右辺第２項を最大とするＳ’２（ｋ）を生成するピッチ係数Ｔが探索される。この式の右辺第２項を類似度と呼ぶことにする。

図７Ａ〜図７Ｅは、ピッチ係数Ｔが変化するに伴い第２スペクトルの推定値Ｓ’２（ｋ）のスペクトルがどのように変化するかを説明するための図である。

図７Ａは、内部状態として格納されている、調波構造を有する第１スペクトルを示した図である。また、図７Ｂ〜図７Ｄは、３種類のピッチ係数Ｔ_０、Ｔ_１、Ｔ_２を用いて、それぞれフィルタリングを行うことにより算出される第２スペクトルの推定値Ｓ’２（ｋ）のスペクトルを示した図である。なお、図７Ｅは、推定値Ｓ’２（ｋ）のスペクトルと比較するために第２スペクトルＳ２（ｋ）を示したものである。

この図に示す例では、図７Ｃに示すスペクトルと図７Ｅに示すスペクトルとが類似しているため、Ｔ_１を用いて算出する類似度が最も高い値を示すことがわかる。すなわち、調波構造を保つことのできるピッチ係数ＴとしてはＴ_１が最適である。

図８Ａ〜図８Ｅも、図７Ａ〜図７Ｅと同様の図であるが、ここでは内部状態として格納されている第１スペクトルの位相が図７Ａ〜図７Ｅとは異なっている。しかし、この図に示す例においても、調波構造が保持されるピッチ係数Ｔ_１はＴのときである。

このように、ピッチ係数Ｔを変化させ、類似度が最大となるＴを見つけることは、スペクトルの調波構造のピッチ（またはその整数倍）をトライ・アンド・エラーで見つけることに相当している。そして、本実施の形態の符号化装置は、この調波構造のピッチに基づいて第２スペクトルの推定値Ｓ’２（ｋ）を算出するので、第１スペクトルと推定スペクトルとの間の接続部において調波構造が崩れない。これは、接続部であるｋ＝ＦＬの場合の推定値Ｓ’２（ｋ）は調波構造のピッチ（またはその整数倍）Ｔだけ離れた第１スペクトルに基づいて算出されることを考えても容易に理解される。

また、ピッチ係数Ｔは、スペクトルデータの周波数間隔の整数倍（整数値）を表している。しかし、実際の調波構造のピッチは非整数値であることが多い。よって、Ｔを中心に前後Ｍ個の近傍データを、適当な重み付け係数β_ｉを選んで重み付き加算することにより、Ｔ−ＭからＴ＋Ｍまでの範囲の非整数値の調波構造のピッチを表現することが可能となる。

図９は、フィルタリング部１０７、探索部１０８、ピッチ係数設定部１０９において行われる各処理の一連のアルゴリズムの一例を示したフロー図である。これらの処理の概要については既に説明したので、フローの詳細な説明は省略する。

次に、フィルタ係数算出部１１０におけるフィルタ係数の算出処理について説明する。

フィルタ係数算出部１１０は、探索部１０８から与えられるピッチ係数Ｔ’を用いて次式

に従い、この式の２乗歪Ｅを最小にするようなフィルタ係数β_ｉを求める。なお、フィルタ係数算出部１１０は、複数個のβ_ｉ（ｉ＝−１，０，１）の組合せを予めデータテーブルとして持っており、上記の（式４）の２乗歪Ｅを最小とするβ_ｉ（ｉ＝−１，０，１）の組合せを決定し、そのインデックスを出力する。

このように、本実施の形態の符号化装置によれば、低域部（０≦ｋ＜ＦＬ）および高域部（ＦＬ≦ｋ＜ＦＨ）の２つに分けられた入力信号のスペクトルに対し、低域スペクトルを内部状態として有するフィルタリング部１０７を用いて高域スペクトルの形状を推定し、フィルタリング部１０７のフィルタ特性を表すパラメータ自体を、高域スペクトルの代わりに符号化して出力するため、低ビットレートで高品質にスペクトルを符号化することができる。

また、以上の構成において、フィルタリング部１０７が低域スペクトルを用いて高域スペクトルの形状を推定する際に、ピッチ係数設定部１０９は、推定の基準とする低域スペクトルと高域スペクトルとの周波数差、すなわち、ピッチ係数Ｔを様々に変化させ出力し、探索部１０８は、低域スペクトルと高域スペクトルの類似度が最大となるＴを検出するので、スペクトル全体の調波構造のピッチに基づいて高域スペクトルの形状を推定することができ、スペクトル全体の調波構造を維持したまま符号化を行うことができる。

また、低域スペクトルの帯域幅を調波構造のピッチに基づいて設定する必要もない。すなわち、低域スペクトルの帯域幅を調波構造のピッチ（または、その整数倍）に揃える必要はなく、任意に帯域幅を設定できる。調波構造のピッチに揃える操作を行わなくても、以上の構成によれば、低域スペクトルと高域スペクトルとの接続部において、スペクトルは滑らかに接続されるからである。

なお、本実施の形態では、（式１）においてＭ＝１とする場合を例にとって説明したが、Ｍはこれに限定されることは無く、０以上の整数（自然数）を用いることが可能である。

また、本実施の形態では、階層符号化（スケーラブル符号化）を行う符号化装置を例にとって説明したが、上記のスペクトル符号化部１００は、他の方式の符号化を行う符号化装置に実装することも可能である。

また、本実施の形態では、スペクトル符号化部１００が周波数領域変換部１０４、１０５を有する場合を例にとって説明したが、これらは時間領域信号を入力信号とする場合に必要な構成要素であり、スペクトル符号化部１００に直接スペクトルが入力される態様においては、周波数領域変換部は必要ない。

さらに、本実施の形態では、低域のスペクトルを用いて、すなわち、低域のスペクトルを符号化の基準として、高域のスペクトルを符号化する場合を例にとって説明したが、この基準となるスペクトルの設定の仕方はこれに限定されず、例えば、エネルギーを有効に利用するという観点からは望ましくないが、高域のスペクトルを用いて低域のスペクトルを符号化したり、または中間周波数帯域のスペクトルを符号化の基準とし他の領域のスペクトルを符号化することも可能である。

図１０は、無線送信装置１３０から送信された信号を受信する無線受信装置１８０の主要な構成を示すブロック図である。

この無線受信装置１８０は、アンテナ１８１、ＲＦ復調装置１８２、復号化装置１７０、Ｄ／Ａ変換装置１８３、および出力装置１８４を有している。

アンテナ１８１は、電波Ｗ１２としてのディジタルの符号化音響信号を受けて電気信号のディジタルの受信符号化音響信号を生成してＲＦ復調装置１８２に与える。ＲＦ復調装置１８２は、アンテナ１８１からの受信符号化音響信号を復調して復調符号化音響信号を生成して復号化装置１７０に与える。

復号化装置１７０は、ＲＦ復調装置１８２からのディジタルの復調符号化音響信号を受けて復号化処理を行ってディジタルの復号化音響信号を生成してＤ／Ａ変換装置１８３に与える。Ｄ／Ａ変換装置１８３は、復号化装置１７０からのディジタルの復号化音声信号を変換してアナログの復号化音声信号を生成して出力装置１８４に与える。出力装置１８４は、電気的信号であるアナログの復号化音声信号を空気の振動に変換して音波Ｗ１３として人間の耳に聴こえるように出力する。

図１１は、上記の復号化装置１７０の内部構成を示すブロック図である。ここでは、階層符号化された信号を復号する場合を例にとって説明する。

この復号化装置１７０は、入力端子１７１、分離部１７２、第１レイヤ復号化部１７３、アップサンプリング部１７４、スペクトル復号化部１５０、および出力端子１７６、１７７を有する。

入力端子１７１には、ＲＦ復調装置１８２からディジタルの復調符号化音響信号が入力される。分離部１７２は、入力端子１７１を介し入力された復調符号化音響信号を分離し、第１レイヤ復号化部１７３用の符号化コードとスペクトル復号化部１５０用の符号化コードとを生成する。第１レイヤ復号化部１７３は、分離部１７２で得られた符号化コードを用いて信号帯域０≦ｋ＜ＦＬの復号信号を復号し、この復号信号をアップサンプリング部１７４に与える。また、他方の出力は、出力端子１７６に接続されている。これにより、第１レイヤ復号化部１７３で生成される第１レイヤ復号信号を出力する必要が生じた場合には、この出力端子１７６を介し出力させることができる。

アップサンプリング部１７４は、第１レイヤ復号化部１７３から与えられる第１レイヤ復号信号のサンプリング周波数を上げる。スペクトル復号化部１５０には、分離部１７２で分離された符号化コードとアップサンプリング部１７４で生成されたアップサンプリング後の第１レイヤ復号信号とが与えられる。スペクトル復号化部１５０は、後述するスペクトル復号化を行い、信号帯域０≦ｋ＜ＦＨの復号信号を生成し、出力端子１７７を介しこれを出力する。スペクトル復号化部１５０では、アップサンプリング部１７４から与えられるアップサンプリング後の第１レイヤ復号信号を第１信号とみなして処理を行うことになる。

この構成によれば、第１レイヤ復号化部１７３で生成される第１レイヤ復号信号を出力する必要がある場合には、出力端子１７６より出力させることができる。また、より品質の高いスペクトル復号化部１５０の出力信号を出力する必要がある場合には、出力端子１７７より出力させることができる。復号化装置１７０からは、出力端子１７６もしくは出力端子１７７のいずれか一方の信号が出力され、Ｄ／Ａ変換装置１８３に与えられる。どちらの信号が出力されるかは、アプリケーションの設定やユーザの判断に基づく。

図１２は、上記のスペクトル復号化部１５０の内部構成を示すブロック図である。

このスペクトル復号化部１５０は、入力端子１５２、１５３、周波数領域変換部１５４、内部状態設定部１５５、フィルタリング部１５６、時間領域変換部１５８、および出力端子１５９を有する。

入力端子１５２には、スペクトル符号化部１００にて符号化された符号化コードを表すフィルタ係数が、分離部１７２を介して入力される。さらに、入力端子１５３には、有効周波数帯域が０≦ｋ＜ＦＬの第１信号が入力される。この第１信号は、第１レイヤ復号化部１７３で復号された第１レイヤ復号信号をアップサンプリング部１７４にてアップサンプリングしたものである。

周波数領域変換部１５４は、入力端子１５３から入力された時間領域信号に周波数変換を行い、第１スペクトルＳ１（ｋ）を算出する。周波数変換法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を使用する。

内部状態設定部１５５は、第１スペクトルＳ１（ｋ）を使って、フィルタリング部１５６で用いられるフィルタの内部状態を設定する。

フィルタリング部１５６は、内部状態設定部１５５で設定されたフィルタの内部状態と、入力端子１５２から与えられるピッチ係数Ｔ’およびフィルタ係数βに基づき第１スペクトルのフィルタリングを行い、第２スペクトルの推定値Ｓ’２（ｋ）を算出する。この場合、フィルタリング部１５６では、（式１）に記載のフィルタ関数が用いられる。

時間領域変換部１５８は、フィルタリング部１５６により得られた復号スペクトルＳ’（ｋ）を時間領域の信号に変換し、出力端子１５９を介し出力する。ここでは、必要に応じて、適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。

図１３は、フィルタリング部１５６において生成される復号スペクトルＳ’（ｋ）を示した図である。

この図にあるように、周波数帯域０≦ｋ＜ＦＬの復号スペクトルＳ’（ｋ）は、第１スペクトルＳ１（ｋ）によって構成され、周波数帯域ＦＬ≦ｋ＜ＦＨの復号スペクトルＳ’（ｋ）は、第２スペクトルの推定値Ｓ’２（ｋ）によって構成される。

このように、本実施の形態の復号化装置によれば、本実施の形態に係る符号化方法に対応した構成を有しているため、少ないビット数で効率よく符号化された音響信号を復号することができ、良好な音響信号を出力することができる。

なお、ここでは、本実施の形態に係る符号化装置または復号化装置が無線通信システムに適用される場合を例にとって説明したが、本実施の形態に係る符号化装置または復号化装置は、以下に示すように、有線通信システムにも適用することができる。

図１４Ａは、本実施の形態に係る符号化装置が有線通信システムに適用された場合の送信側の主要な構成を示したブロック図である。なお、図３に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。

有線送信装置１４０は、符号化装置１２０、入力装置１３１、およびＡ／Ｄ変換装置１３２を有し、出力がネットワークＮ１に接続されている。

Ａ／Ｄ変換装置１３２の入力端子は、入力装置１３１の出力端子に接続されている。符号化装置１２０の入力端子は、Ａ／Ｄ変換装置１３２の出力端子に接続されている。符号化装置１２０の出力端子はネットワークＮ１に接続されている。

入力装置１３１は、人間の耳に聞こえる音波Ｗ１１を電気的信号であるアナログ信号に変換してＡ／Ｄ変換装置１３２に与える。Ａ／Ｄ変換装置１３２は、アナログ信号をディジタル信号に変換して符号化装置１２０に与える。符号化装置１２０は、入力されてくるディジタル信号を符号化してコードを生成し、ネットワークＮ１に出力する。

図１４Ｂは、本実施の形態に係る復号化装置が有線通信システムに適用された場合の受信側の主要な構成を示したブロック図である。なお、図１０に示した構成要素と同一のものには同一の符号を付し、その説明を省略する。

有線受信装置１９０は、ネットークＮ１に接続されている受信装置１９１、復号化装置１７０、Ｄ／Ａ変換装置１８３、および出力装置１８４を有している。

受信装置１９１の入力端子は、ネットワークＮ１に接続されている。復号化装置１７０の入力端子は、受信装置１９１の出力端子に接続されている。Ｄ／Ａ変換装置１８３の入力端子は、復号化装置１７０の出力端子に接続されている。出力装置１８４の入力端子は、Ｄ／Ａ変換装置１８３の出力端子に接続されている。

受信装置１９１は、ネットワークＮ１からのディジタルの符号化音響信号を受けてディジタルの受信音響信号を生成して復号化装置１７０に与える。復号化装置１７０は、受信装置１９１からの受信音響信号を受けてこの受信音響信号に復号化処理を行ってディジタルの復号化音響信号を生成してＤ／Ａ変換装置１８３に与える。Ｄ／Ａ変換装置１８３は、復号化装置１７０からのディジタルの復号音声信号を変換してアナログの復号音声信号を生成して出力装置１８４に与える。出力装置１８４は、電気的信号であるアナログの復号音響信号を空気の振動に変換して音波Ｗ１３として人間の耳に聴こえるように出力する。

このように、上記の構成によれば、上記の無線送受信装置と同様の作用効果を有する有線送受信装置を提供することができる。

（実施の形態２）
図１５は、本発明の実施の形態２に係る符号化装置内のスペクトル符号化部２００の主要な構成を示すブロック図である。なお、このスペクトル符号化部２００は、図５に示したスペクトル符号化部１００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

本実施の形態の特徴は、フィルタリング部で用いられるフィルタ関数を実施の形態１よりも簡易なものにすることである。

フィルタリング部２０１で用いられるフィルタ関数は、次式

のように簡略化したものを用いる。この式は、（式１）においてＭ＝０、β_０＝１としたフィルタ関数に相当している。

図１６は、上記のフィルタを用いたフィルタリングの概要を説明するための図である。

第２スペクトルの推定値Ｓ’２（ｋ）は、Ｔだけ離れた低域のスペクトルを順次コピーすることにより求められる。また、探索部１０８は、最適なピッチ係数Ｔ’を実施の形態１と同様に（式３）のＥを最小とするピッチ係数Ｔを探索することにより決定する。このようにして求められたピッチ係数Ｔ’を出力端子１１１を介し出力する。この構成により、フィルタの特性はピッチ係数Ｔのみで決定されることになる。

なお、本実施の形態のフィルタは、低レート音声符号化の代表的な技術であるＣＥＬＰ（Ｃｏｄｅ−ＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏｎ）方式の構成要素の一つである適応符号帳（ａｄａｐｔｉｖｅｃｏｄｅｂｏｏｋ）と同じように動作するという特徴がある。

次いで、上記のスペクトル符号化部２００によって符号化された信号を復号するスペクトル復号化部について説明する（図示せず）。

このスペクトル復号化部は、図１２に示したスペクトル復号化部１５０と同様の構成を有しているので、詳しい説明は省略するが、次のような特徴を有している。すなわち、フィルタリング部１５６は、第２スペクトルの推定値Ｓ’２（ｋ）を算出する場合に、（式１）に記載のフィルタ関数ではなく（式５）に記載のフィルタ関数を用いる。入力端子１５２から与えられるのは、ピッチ係数Ｔ’のみとなる。すなわち、（式１）または（式５）に記載のフィルタ関数のどちらを利用するかは、符号化側で用いられたフィルタ関数の種類に依存し、そのフィルタ関数と同一のフィルタ関数を用いる。

このように、本実施の形態によれば、フィルタリング部で用いられるフィルタ関数をより簡易なものとするため、フィルタ係数算出部を設置する必要がなくなり、少ない演算量によって第２スペクトル（高域スペクトル）の推定を行うことができ、また、回路規模も縮小することができる。

（実施の形態３）
図１７は、本発明の実施の形態３に係る符号化装置内のスペクトル符号化部３００の主要な構成を示すブロック図である。なお、このスペクトル符号化部３００は、図５に示したスペクトル符号化部１００と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

本実施の形態の特徴は、概形算出部３０１および多重化部３０２をさらに有し、第２スペクトルの推定が行われた後に第２スペクトルの包絡情報をさらに符号化することである。

探索部１０８は、最適なピッチ係数Ｔ’を多重化部３０２に出力すると共に、このピッチ係数Ｔ’を用いて生成される第２スペクトルの推定値Ｓ’２（ｋ）を概形算出部３０１に出力する。概形算出部３０１は、周波数領域変換部１０５から与えられる第２スペクトルＳ２（ｋ）に基づいて第２スペクトルＳ２（ｋ）の包絡情報を算出する。なお、ここでは、この包絡情報をサブバンド毎のスペクトルパワで表し、周波数帯域ＦＬ≦ｋ＜ＦＨをＪ個のサブバンドに分割する場合を例にとって説明する。このとき、第ｊサブバンドのスペクトルパワは次式

で表される。この式において、ＢＬ（ｊ）は、第ｊサブバンドの最小周波数、ＢＨ（ｊ）は、第ｊサブバンドの最大周波数を表す。このようにして求めた第２スペクトルのサブバンド情報を第２スペクトルのスペクトル包絡情報とみなす。

同様に、第２スペクトルの推定値Ｓ’２（ｋ）のサブバンド情報Ｂ’（ｊ）を次式

に従い算出し、サブバンド毎の変動量Ｖ（ｊ）を次式

に従い算出する。

次に、変動量Ｖ（ｊ）を符号化して符号化後の変動量Ｖ（ｊ）を求め、そのインデックスを多重化部３０２に送る。多重化部３０２は、探索部１０８から得られる最適なピッチ係数Ｔ’と概形算出部３０１から出力される変動量Ｖ（ｊ）のインデックスを多重化して出力端子１１１を介し出力する。

このように、本実施の形態によれば、高域スペクトルの推定を行った後に、さらに高域スペクトルの包絡情報も符号化するため、高域スペクトルの推定値の精度を向上させることができる。

（実施の形態４）
図１８は、本発明の実施の形態４に係る復号化装置内のスペクトル復号化部５５０の主要な構成を示すブロック図である。なお、このスペクトル復号化部５５０は、図１２に示したスペクトル復号化部１５０と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

本実施の形態の特徴は、分離部５５１、スペクトル包絡復号化部５５２、およびスペクトル調整部５５３をさらに有することである。これにより、実施の形態３で示したスペクトル符号化部３００等によって高域スペクトルの推定スペクトルの符号化に併せて包絡情報も符号化された符号化コードの復号を行うことができる。

分離部５５１は、入力端子１５２を介し入力された符号化コードを分離し、フィルタリング係数に関する情報はフィルタリング部１５６に与えると共に、スペクトル包絡に関する情報はスペクトル包絡復号化部５５２に与える。

スペクトル包絡復号化部５５２は、分離部５５１から与えられたスペクトル包絡情報から、変動量Ｖ（ｊ）を符号化して得られる変動量Ｖ（ｊ）を復号することにより求める。

スペクトル調整部５５３は、フィルタリング部１５６から得られる復号スペクトルＳ’（ｋ）に、スペクトル包絡復号化部５５２から得られる復号されたサブバンド毎の変動量Ｖ（ｊ）を次式

に従い乗じることにより、復号スペクトルＳ’（ｋ）の周波数帯域ＦＬ≦ｋ＜ＦＨにおけるスペクトル形状を調整し、調整後の復号スペクトルＳ３（ｋ）を生成する。この調整後の復号スペクトルＳ３（ｋ）は、時間領域変換部１５８に出力され、時間領域信号に変換される。

このように、本実施の形態によれば、包絡情報も併せて符号化されている符号化コードを復号することができる。

なお、本実施の形態では、分離部５５１から与えられるスペクトル包絡情報が、（式８）に示されるサブバンド毎の変動量Ｖ（ｊ）を符号化して求められた値Ｖ（ｊ）である場合を例にとって説明したが、スペクトル包絡情報はこれに限定されない。

（実施の形態５）
図１９は、本発明の実施の形態５に係る復号化装置内のスペクトル復号化部６５０の主要な構成を示すブロック図である。なお、このスペクトル復号化部６５０は、図１８に示したスペクトル復号化部５５０と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。

本実施の形態の特徴は、ＬＰＣスペクトル算出部６５２をさらに有し、ＬＰＣ係数により算出されるＬＰＣスペクトルをスペクトル包絡情報として利用し、第２スペクトルの推定を行った後に、第２スペクトルにＬＰＣスペクトルを乗じることにより、より精度の高い第２スペクトルの推定値を得ることである。

ＬＰＣスペクトル算出部６５２は、入力端子６５１を介し入力されたＬＰＣ係数α（ｊ）からＬＰＣスペクトルｅｎｖ（ｋ）を、次式

に従い算出する。ここで、ＮＰはＬＰＣ係数の次数を表す。また、変数γ（０＜γ＜１）を用い、ＬＰＣスペクトルの特性を変化させることによりＬＰＣスペクトルｅｎｖ（ｋ）を求めることもできる。この場合、ＬＰＣスペクトルｅｎｖ（ｋ）は、次式

のように表される。ここでγは固定値として規定することもできるし、フレーム毎に可変な値をとることもできる。このように算出されたＬＰＣスペクトルｅｎｖ（ｋ）は、スペクトル調整部５５３に出力される。

スペクトル調整部５５３は、フィルタリング部１５６から得られる復号スペクトルＳ’（ｋ）に、ＬＰＣスペクトル算出部６５２から得られるＬＰＣスペクトルｅｎｖ（ｋ）を、次式

に従い乗じ、復号スペクトルＳ’（ｋ）の周波数帯域ＦＬ≦ｋ＜ＦＨにおけるスペクトルを調整し、調整後の復号スペクトルＳ３（ｋ）を生成する。この調整後の復号スペクトルＳ３（ｋ）は、時間領域変換部１５８に与えられ、時間領域信号に変換される。

このように、本実施の形態によれば、ＬＰＣスペクトルをスペクトル包絡情報として利用するため、より精度の高い第２スペクトルの推定値を得ることができる。

本発明に係る符号化装置または復号化装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する通信端末装置および基地局装置を提供することができる。

なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、ソフトウェアで実現することも可能である。

本明細書は、２００３年９月１６日出願の特願２００３−３２３６５８に基づく。この内容は全てここに含めておく。

本発明に係る符号化装置および復号化装置は、低ビットレートで符号化する効果を有し、無線通信システム等の用途にも適用できる。

音声信号を符号化する音声符号化の方式に、ＩＴＵ−Ｔ（International Telecommunication Union Telecommunication Standardization Sector）で規格化されているＧ７２６、Ｇ７２９等の方式が存在する。これらの方式は、狭帯域信号(300Hz〜3.4kHz)を符号化の対象とし、8kbit/s〜32kbit/sのビットレートで高品質な符号化を行うことができる。しかし、このような狭帯域信号は周波数帯域が最大3.4kHzまでと狭いため、その品質は聴取者に音がこもっている印象を与え、臨場感に欠けるという問題がある。

また、広帯域信号(50Hz〜7kHz)を符号化の対象とする音声符号化方式も存在する。この代表的な例として、ＩＴＵ−ＴのＧ７２２、Ｇ７２２．１や、３ＧＰＰ(The 3rd Generation Partnership Project)のＡＭＲ−ＷＢ等がある。これらの方式は、ビットレートが6.6kbit/s〜64kbit/sで広帯域音声信号の符号化を行うことができる。しかし、符号化の対象とする信号が音声の場合、広帯域信号は比較的高品質であるものの、オーディオ信号を対象とした場合や音声信号でもさらに高臨場感な品質が求められる場合には十分ではない。

一方、一般的には、信号の最大周波数が10〜15kHz程度までであると、ＦＭラジオ相当の臨場感が得られ、20kHz程度までであればＣＤ（コンパクト・ディスク）並みの品質が得られる。このような信号に対しては、ＭＰＥＧ（Moving Picture Expert Group）で規格化されているレイヤIII方式やＡＡＣ方式等に代表されるオーディオ符号化が適している。しかし、これらのオーディオ符号化方式は、符号化の対象となる信号の周波数帯域が広くなるため、符号化された信号のビットレートが大きくなるという問題がある。

図１Ａは、周波数帯域が０≦ｋ＜ＦＨに帯域制限された原信号のスペクトル、図１Ｂは、同信号を０≦ｋ＜ＦＬに帯域制限したときのスペクトル(ただし、ＦＬ＜ＦＨ)、図１Ｃは、上記の技術により低域（低周波帯域）のスペクトルを用いて高域（高周波帯域）のスペクトルを置換して得られたスペクトル、図１Ｄは、置換後のスペクトルをスペクトル包絡情報に従い置換スペクトルの形状を整えることにより得られるスペクトルを表している。これらの図において、横軸は周波数、縦軸はスペクトル強度を表す。

この技術では、周波数帯域が０≦ｋ＜ＦＨの原信号のスペクトル（図１Ａ）を周波数帯域が０≦ｋ＜ＦＬの低域のスペクトル（図１Ｂ）を用いて表現することが行われる。具体的には、高域のスペクトル（ＦＬ≦ｋ＜ＦＨ)が、低域のスペクトル(０≦ｋ＜ＦＬ)によって置換される。この処理の結果、図１Ｃに示すようなスペクトルが得られる。なお、ここでは、説明を簡単にするために、ＦＬ＝ＦＨ／２の関係である場合を例にとって説明している。そして、原信号のスペクトル包絡情報に従い、図１Ｃのスペクトルの高域のスペクトルの振幅値が調整され、図１Ｄに示すようなスペクトルが得られる。これが原信号のスペクトルを推定したスペクトルである。
特表２００１−５２１６４８号公報（第１５頁、第１図、第２図）

本発明の符号化装置は、第１帯域および第２帯域を有するスペクトルを符号化するスペクトル符号化装置であって、前記第２帯域のスペクトルに類似するスペクトルの情報を、調波構造に基づいて前記第１帯域のスペクトルから取得する取得手段と、前記第２帯域のスペクトルの代わりに前記情報を符号化する符号化手段と、を具備する構成を採る。

本発明の符号化装置は、低周波帯域および高周波帯域を有するスペクトルを取得する取得手段と、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて生成する生成手段と、高周波帯域の前記スペクトルの代わりに、前記類似具合を示すパラメータを符号化する符号化手段と、を具備する構成を採る。

本発明の復号化装置は、低周波帯域および高周波帯域のうちの低周波帯域のスペクトルを取得するスペクトル取得手段と、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得手段と、低周波帯域の前記スペクトルおよび前記パラメータを用いて、低周波帯域および高周波帯域の前記スペクトルを復号する復号化手段と、を具備する構成を採る。

本発明の符号化方法は、低周波帯域および高周波帯域を有するスペクトルを取得するステップと、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて生成するステップと、高周波帯域の前記スペクトルの代わりに、前記類似具合を示すパラメータを符号化するステップと、を具備するようにした。

本発明の復号化方法は、低周波帯域および高周波帯域を有するスペクトルのうちの低周波帯域のスペクトルを取得するステップと、低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するステップと、低周波帯域の前記スペクトルおよび前記パラメータを用いて、低周波帯域および高周波帯域の前記スペクトルを復号するステップと、を具備するようにした。

周波数領域変換部１０４は、入力端子１０２から入力される第１信号に周波数変換を行い、第１スペクトルＳ１(ｋ)を算出する。また、周波数領域変換部１０５は、入力端子１０３から入力される第２信号に周波数変換を行い、第２スペクトルＳ２(ｋ)を算出する。ここで周波数変換の方法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を適用する。

内部状態設定部１０６は、有効周波数帯域が０≦ｋ＜ＦＬの第１スペクトルＳ１(ｋ)を使ってフィルタリング部１０７で用いられるフィルタの内部状態を設定する。この設定については、後ほど再度説明する。

フィルタリング部１０７は、内部状態設定部１０６で設定されたフィルタの内部状態と、ピッチ係数設定部１０９から出力されるピッチ係数Ｔとに基づいて第２スペクトルのフィルタリングを行い、第１スペクトルの推定値Ｓ'２(ｋ)を算出する。このフィルタリング処理の詳細については後述する。

探索部１０８は、周波数領域変換部１０５から出力される第２スペクトルＳ２(ｋ)とフィルタリング部１０７から出力される第２スペクトルの推定値Ｓ'２(ｋ)との類似性を示すパラメータである類似度を算出する。この類似度については、後ほど詳述する。この類似度の算出処理は、ピッチ係数設定部１０９からピッチ係数Ｔが与えられる度に行われ、算出される類似度が最大となるピッチ係数Ｔ’（Ｔ_ｍｉｎ〜Ｔ_ｍａｘの範囲）が、フィルタ係数算出部１１０に与えられる。

ここでは、全周波数帯域（０≦ｋ＜ＦＨ）のスペクトルを便宜的にＳ(ｋ)と呼び、フィルタ関数は次式

この図に示すように、Ｓ(ｋ)の０≦ｋ＜ＦＬの帯域には、第１スペクトルＳ１(ｋ)がフィルタの内部状態として格納されている。一方、Ｓ(ｋ)のＦＬ≦ｋ＜ＦＨの帯域には、以下の手順により求められた第２スペクトルの推定値Ｓ'２(ｋ)が格納される。

Ｓ'２(ｋ)には、フィルタリング処理により、ｋよりＴだけ低い周波数のスペクトルＳ(ｋ−Ｔ)に、このスペクトルを中心としてｉだけ離れた近傍のスペクトルＳ(ｋ−Ｔ−ｉ)に所定の重み付け係数β_ｉを乗じたスペクトルβ_ｉ・Ｓ(ｋ−Ｔ−ｉ)を全て加算したスペクトル、すなわち、次式

により表されるスペクトルが代入される。このとき、このフィルタに与えられる入力信号はゼロとしている。すなわち（式２）は（式１）のゼロ入力応答を表す。そして上記の演算を、周波数の低い方（ｋ＝ＦＬ）から順にｋをＦＬ≦ｋ＜ＦＨの範囲で変化させて行うことにより、ＦＬ≦ｋ＜ＦＨにおける第２スペクトルの推定値Ｓ'２(ｋ)が算出される。

以上のフィルタリング処理は、ピッチ係数設定部１０９からピッチ係数Ｔが与えられる度に、ＦＬ≦ｋ＜ＦＨの範囲において、その都度Ｓ(ｋ)をゼロクリアして行われる。すなわち、ピッチ係数Ｔが変化するたびにＳ(ｋ)は算出され、探索部１０８に出力される。

によって定義される類似度を用いる場合を例にとって説明する。この類似度を使用した場合、最適なピッチ係数Ｔを算出した後にフィルタ係数β_ｉを決定することになる。ここで、Ｅは、Ｓ２(ｋ)とＳ'２(ｋ)との間の２乗誤差を表す。この式において右辺第１項は、ピッチ係数Ｔに関係ない固定値となるので、右辺第２項を最大とするＳ'２(ｋ)を生成するピッチ係数Ｔが探索される。この式の右辺第２項を類似度と呼ぶことにする。

図７Ａ〜図７Ｅは、ピッチ係数Ｔが変化するに伴い第２スペクトルの推定値Ｓ'２(ｋ)のスペクトルがどのように変化するかを説明するための図である。

図７Ａは、内部状態として格納されている、調波構造を有する第１スペクトルを示した図である。また、図７Ｂ〜図７Ｄは、３種類のピッチ係数Ｔ_０、Ｔ_１、Ｔ_２を用いて、それぞれフィルタリングを行うことにより算出される第２スペクトルの推定値Ｓ'２(ｋ)のスペクトルを示した図である。なお、図７Ｅは、推定値Ｓ'２(ｋ)のスペクトルと比較するために第２スペクトルＳ２(ｋ)を示したものである。

図８Ａ〜図８Ｅも、図７Ａ〜図７Ｅと同様の図であるが、ここでは内部状態として格納されている第１スペクトルの位相が図７Ａ〜図７Ｅとは異なっている。しかし、この図に示す例においても、調波構造が保持されるピッチ係数ＴはＴ_１のときである。

このように、ピッチ係数Ｔを変化させ、類似度が最大となるＴを見つけることは、スペクトルの調波構造のピッチ（またはその整数倍）をトライ・アンド・エラーで見つけることに相当している。そして、本実施の形態の符号化装置は、この調波構造のピッチに基づいて第２スペクトルの推定値Ｓ'２(ｋ)を算出するので、第１スペクトルと推定スペクトルとの間の接続部において調波構造が崩れない。これは、接続部であるｋ＝ＦＬの場合の推定値Ｓ'２(ｋ)は調波構造のピッチ（またはその整数倍）Ｔだけ離れた第１スペクトルに基づいて算出されることを考えても容易に理解される。

周波数領域変換部１５４は、入力端子１５３から入力された時間領域信号に周波数変換を行い、第１スペクトルＳ１(ｋ)を算出する。周波数変換法は、離散フーリエ変換（ＤＦＴ）、離散コサイン変換（ＤＣＴ）、変形離散コサイン変換（ＭＤＣＴ）等を使用する。

内部状態設定部１５５は、第１スペクトルＳ１(ｋ)を使って、フィルタリング部１５６で用いられるフィルタの内部状態を設定する。

フィルタリング部１５６は、内部状態設定部１５５で設定されたフィルタの内部状態と、入力端子１５２から与えられるピッチ係数Ｔ’およびフィルタ係数βに基づき第１スペクトルのフィルタリングを行い、第２スペクトルの推定値Ｓ'２(ｋ)を算出する。この場合、フィルタリング部１５６では、（式１）に記載のフィルタ関数が用いられる。

時間領域変換部１５８は、フィルタリング部１５６により得られた復号スペクトルＳ'(ｋ)を時間領域の信号に変換し、出力端子１５９を介し出力する。ここでは、必要に応じて、適切な窓掛けおよび重ね合わせ加算等の処理を行い、フレーム間に生じる不連続を回避する。

図１３は、フィルタリング部１５６において生成される復号スペクトルＳ'(ｋ)を示した図である。

この図にあるように、周波数帯域０≦ｋ＜ＦＬの復号スペクトルＳ'(ｋ)は、第１スペクトルＳ１(ｋ)によって構成され、周波数帯域ＦＬ≦ｋ＜ＦＨの復号スペクトルＳ'(ｋ)は、第２スペクトルの推定値Ｓ'２(ｋ)によって構成される。

第２スペクトルの推定値Ｓ'２(ｋ)は、Ｔだけ離れた低域のスペクトルを順次コピーすることにより求められる。また、探索部１０８は、最適なピッチ係数Ｔ’を実施の形態１と同様に（式３）のＥを最小とするピッチ係数Ｔを探索することにより決定する。このようにして求められたピッチ係数Ｔ’を出力端子１１１を介し出力する。この構成により、フィルタの特性はピッチ係数Ｔのみで決定されることになる。

なお、本実施の形態のフィルタは、低レート音声符号化の代表的な技術であるＣＥＬＰ（Code-Excited Linear Prediction）方式の構成要素の一つである適応符号帳（adaptive codebook）と同じように動作するという特徴がある。

このスペクトル復号化部は、図１２に示したスペクトル復号化部１５０と同様の構成を有しているので、詳しい説明は省略するが、次のような特徴を有している。すなわち、フィルタリング部１５６は、第２スペクトルの推定値Ｓ'２(ｋ)を算出する場合に、（式１）に記載のフィルタ関数ではなく（式５）に記載のフィルタ関数を用いる。入力端子１５２から与えられるのは、ピッチ係数Ｔ’のみとなる。すなわち、（式１）または（式５）に記載のフィルタ関数のどちらを利用するかは、符号化側で用いられたフィルタ関数の種類に依存し、そのフィルタ関数と同一のフィルタ関数を用いる。

探索部１０８は、最適なピッチ係数Ｔ’を多重化部３０２に出力すると共に、このピッチ係数Ｔ’を用いて生成される第２スペクトルの推定値Ｓ'２(ｋ)を概形算出部３０１に出力する。概形算出部３０１は、周波数領域変換部１０５から与えられる第２スペクトルＳ２(ｋ)に基づいて第２スペクトルＳ２(ｋ)の包絡情報を算出する。なお、ここでは、この包絡情報をサブバンド毎のスペクトルパワで表し、周波数帯域ＦＬ≦ｋ＜ＦＨをＪ個のサブバンドに分割する場合を例にとって説明する。このとき、第ｊサブバンドのスペクトルパワは次式

で表される。この式において、ＢＬ(ｊ)は、第ｊサブバンドの最小周波数、ＢＨ(ｊ)は、第ｊサブバンドの最大周波数を表す。このようにして求めた第２スペクトルのサブバンド情報を第２スペクトルのスペクトル包絡情報とみなす。

同様に、第２スペクトルの推定値Ｓ'２(ｋ)のサブバンド情報Ｂ’(ｊ)を次式

に従い算出し、サブバンド毎の変動量Ｖ(ｊ)を次式

に従い算出する。

次に、変動量Ｖ(ｊ)を符号化して符号化後の変動量Ｖ_ｑ(ｊ)を求め、そのインデックスを多重化部３０２に送る。多重化部３０２は、探索部１０８から得られる最適なピッチ係数Ｔ’と概形算出部３０１から出力される変動量Ｖ(ｊ)のインデックスを多重化して出力端子１１１を介し出力する。

スペクトル包絡復号化部５５２は、分離部５５１から与えられたスペクトル包絡情報から、変動量Ｖ(ｊ)を符号化して得られる変動量Ｖ_ｑ(ｊ)を復号することにより求める。

スペクトル調整部５５３は、フィルタリング部１５６から得られる復号スペクトルＳ'(ｋ)に、スペクトル包絡復号化部５５２から得られる復号されたサブバンド毎の変動量Ｖ_ｑ(ｊ)を次式

に従い乗じることにより、復号スペクトルＳ'(ｋ)の周波数帯域ＦＬ≦ｋ＜ＦＨにおけるスペクトル形状を調整し、調整後の復号スペクトルＳ３(ｋ)を生成する。この調整後の復号スペクトルＳ３(ｋ)は、時間領域変換部１５８に出力され、時間領域信号に変換される。

なお、本実施の形態では、分離部５５１から与えられるスペクトル包絡情報が、（式８）に示されるサブバンド毎の変動量Ｖ(ｊ)を符号化して求められた値Ｖ_ｑ(ｊ)である場合を例にとって説明したが、スペクトル包絡情報はこれに限定されない。

ＬＰＣスペクトル算出部６５２は、入力端子６５１を介し入力されたＬＰＣ係数α(ｊ)からＬＰＣスペクトルｅｎｖ(ｋ)を、次式

に従い算出する。ここで、ＮＰはＬＰＣ係数の次数を表す。また、変数γ（０＜γ＜１）を用い、ＬＰＣスペクトルの特性を変化させることによりＬＰＣスペクトルｅｎｖ(ｋ)を求めることもできる。この場合、ＬＰＣスペクトルｅｎｖ(ｋ)は、次式

のように表される。ここでγは固定値として規定することもできるし、フレーム毎に可変な値をとることもできる。このように算出されたＬＰＣスペクトルｅｎｖ(ｋ)は、スペクトル調整部５５３に出力される。

スペクトル調整部５５３は、フィルタリング部１５６から得られる復号スペクトルＳ'(ｋ)に、ＬＰＣスペクトル算出部６５２から得られるＬＰＣスペクトルｅｎｖ(ｋ)を、次式

に従い乗じ、復号スペクトルＳ'(ｋ)の周波数帯域ＦＬ≦ｋ＜ＦＨにおけるスペクトルを調整し、調整後の復号スペクトルＳ３(ｋ)を生成する。この調整後の復号スペクトルＳ３(ｋ)は、時間領域変換部１５８に与えられ、時間領域信号に変換される。

Claims

低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルを取得する取得手段と、
取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて算出する算出手段と、
取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を示すパラメータを符号化する符号化手段と、
を具備する符号化装置。
前記算出手段は、
高周波帯域の前記スペクトルから周波数軸上で調波構造のピッチの整数倍だけ離れた、低周波帯域の前記スペクトルに基づいて高周波帯域の前記スペクトルの類似スペクトルを生成する生成手段と、
前記類似スペクトルと高周波帯域の前記スペクトルとが最も類似する際の前記類似スペクトルの特性を示すパラメータを検出する検出手段と、
を具備する請求の範囲１記載の符号化装置。
前記符号化手段は、
取得された高周波帯域の前記スペクトルの包絡線に関する情報も併せて符号化する、
請求の範囲１記載の符号化装置。
前記算出手段は、取得された低周波帯域の前記スペクトルを内部状態として有するフィルタを用いて、取得された高周波帯域の前記スペクトルを推定する推定手段と、前記フィルタの特性を示すパラメータを出力する出力手段と、を具備し、
前記フィルタのフィルタ関数は、次の式によって表され、
前記推定手段は、前記フィルタのゼロ入力応答を用いて前記推定を行う、
請求の範囲１記載の符号化装置。

ただし、
Ｐ（ｚ）：フィルタ関数
ｚ：ｚ変換変数
Ｍ：１／２倍されたフィルタ次数
β：重み付け係数
Ｔ：ピッチ係数
前記フィルタ関数において、Ｍ＝０およびβ_０＝１である請求の範囲４記載の符号化装置。
低周波帯域の前記スペクトルは、
階層符号化において下位レイヤで符号化された後に復号された信号から得られる、
請求の範囲１記載の符号化装置。
請求項１記載の符号化装置を具備する送受信装置。
低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得手段と、
低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得手段と、
取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する復号化手段と、
を具備する復号化装置。
高周波帯域の前記スペクトルの包絡線に関する情報を取得する包絡線情報取得手段をさらに具備し、
前記復号化手段は、
取得された前記包絡線に関する情報も用いて前記復号を行う、
請求の範囲８記載の復号化装置。
前記復号化手段は、取得された低周波帯域の前記スペクトルを内部状態として有し、取得された前記パラメータをフィルタ特性とするフィルタを用いて、高周波帯域の前記スペクトルを推定する推定手段を具備し、
前記フィルタのフィルタ関数は、次の式によって表され、
前記推定手段は、前記フィルタのゼロ入力応答を用いて前記推定を行う、
請求の範囲８記載の復号化装置。

ただし、
Ｐ（ｚ）：フィルタ関数
ｚ：ｚ変換変数
Ｍ：１／２倍されたフィルタ次数
β：重み付け係数
Ｔ：ピッチ係数
前記フィルタ関数において、Ｍ＝０およびβ_０＝１である請求の範囲１０記載の復号化装置。
低周波帯域の前記スペクトルは、
階層符号化において下位レイヤで復号された信号から生成される、
請求の範囲８記載の復号化装置。
請求の範囲８復号化装置を具備する送受信装置。
低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルを取得する取得ステップと、
取得された低周波帯域の前記スペクトルと取得された高周波帯域の前記スペクトルとの類似具合を示すパラメータを前記スペクトルの調波構造に基づいて算出する算出ステップと、
取得された高周波帯域の前記スペクトルの代わりに、算出された前記類似具合を示すパラメータを符号化する符号化ステップと、
を具備する符号化方法。
低周波帯域および高周波帯域の２つの帯域に分けられたスペクトルのうちの低周波帯域のスペクトルを取得するスペクトル取得ステップと、
低周波帯域の前記スペクトルと高周波帯域の前記スペクトルとの類似具合を示すパラメータを取得するパラメータ取得ステップと、
取得された低周波帯域の前記スペクトルおよび前記パラメータを用いて低周波帯域および高周波帯域の前記スペクトルを復号する復号化ステップと、
を具備する復号化方法。