本発明は、主成分分析変換を適用する符号化装置、復号装置およびこれらの方法に関する。
従来の音声通信システムでは、限定された伝送帯域制限下でモノラル音声信号を送信する。通信ネットワークのブロードバンド化に伴い、音声通信に対するユーザの期待は、単なる明瞭さからステレオ音像(stereo image)と自然らしさの提供へと移行しており、ステレオ音声を提供するトレンドが出現している。そのため、ステレオ音声を効率的に送信するための符号化方式が望まれている。
前述の目標を達成するため、ステレオ信号(すなわち、2チャネル)または複数のチャネルの符号化方法として、主成分分析(PCA:Principal Component Analysis)を使用した符号化方法が検討されている(非特許文献1および非特許文献2)。PCAを使用した符号化方法では、入力信号をPCAによって変換(PCA変換)して、変換後の各信号をそれぞれ独立して符号化する。PCA変換は、入力信号の共分散行列から得られる固有値の分布に従って、入力信号におけるエネルギーの集中化を達成させる線形変換である。
例えば、PCAによって変換されたステレオ信号は、ステレオ信号の主要成分(例えば、主旋律のオーディオ信号成分または支配的な音声成分)に対応する主信号(principal signal)と、ステレオ信号の主信号以外の残りの成分に対応する副信号(secondary signal)とに変換される。つまり、ステレオ信号のエネルギーが主信号に集中化される。これにより、PCAを使用した符号化方法では、エネルギーを集中化させた信号を符号化することで、入力信号における冗長性を除去することができるため、符号化効率を向上させることができる。また、ステレオ信号における主信号と副信号とは、互いに無相関の関係があるため、さらに入力信号における冗長性を除去することができる。
図1および図2は、PCAを使用したステレオ信号コーデックの一般的な符号化装置および復号装置を示すブロック図である。図1に示す符号化装置において、PCA変換部11は、ステレオ信号における左信号L(n)および右信号R(n)を主信号P(n)および副信号A(n)に変換する(式(1))。
ここで、ν1およびν2は、左信号L(n)および右信号R(n)を主信号P(n)と副信号A(n)とに変換するために用いるPCA変換パラメータである。符号化部12および符号化部13は、主信号P(n)および副信号A(n)をそれぞれ独立して符号化(例えば、スカラ量子化またはベクトル量子化)し、主信号P(n)の符号化データおよび副信号A(n)の符号化データを多重化部15に出力する。また、量子化部14は、PCA変換部11で得られるPCA変換パラメータν1およびν2を量子化して、PCA変換パラメータの量子化符号を生成する。多重化部15は、主信号P(n)の符号化データと、副信号A(n)の符号化データと、PCA変換パラメータの量子化符号とを多重化して、ビットストリームを形成する。
図2に示す復号装置においてステレオ信号を復号する場合、逆多重化部21は、ビットストリームから主信号P(n)の符号化データ、副信号A(n)の符号化データおよびPCA変換パラメータの量子化符号を多重分離する。そして、復号部22は、主信号P(n)の符号化データを復号して復号主信号P
〜(n)を得る。また、復号部23は、副信号A(n)の符号化データを復号して復号副信号A
〜(n)を得る。また、逆量子化部24は、PCA変換パラメータの量子化符号を逆量子化して、PCA変換パラメータν
〜 1およびν
〜 2を得る。逆PCA変換部25は、PCA変換パラメータν
〜 1およびν
〜 2を用いて、主信号P
〜(n)および副信号A
〜(n)を逆PCA変換し、ステレオ信号の左信号L
〜(n)および右信号R
〜(n)を復元する(式(2))。
また、音声通信システムでは、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。スケーラブルな構成を有する音声符号化技術として、複数の符号化技術を階層的に統合するスケーラブル符号化(階層符号化)技術が検討されている。スケーラブル符号化技術においては、送信側は、入力音声信号に対して階層的な符号化処理を施し、複数の符号化レイヤに階層化された符号化データを伝送する。
また、音声通信システムでは、電波資源の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。低ビットレートの制約下では、上述したPCAを使用したステレオ信号符号化を行う場合、主信号および副信号の双方を共に高品質で符号化することは困難である。そのため、限られたビットを主信号および副信号で適切に割り当てる必要がある。例えば、非特許文献1および非特許文献2には、PCAを使用したステレオ信号符号化におけるビット割当方法が開示されている。
非特許文献1では、ステレオ信号の符号化処理において、パラメトリック符号化を副信号に対して適用する方法を開示している。すなわち、主信号および副信号において、主信号の符号化データの特性と副信号の特性との差に基づくパラメータ(パラメトリック符号化パラメータ)として副信号を表す。副信号をパラメトリック符号化することにより、副信号に含まれている冗長性が取り除かれるため、副信号のビットレートが減少する。このようにして、主信号の符号化データ、および、低ビットレートのパラメトリック符号化パラメータ(副信号)が限られたビットに割り当てられる。
非特許文献2では、入力信号がPCA変換されて得られる複数のチャネルそれぞれのエネルギーに応じてビットを適応的に割り当てるビット割当方法を開示している。例えば、ステレオ信号符号化処理において、ステレオ信号(すなわち、2チャネル)をPCA変換して得られる主信号および副信号それぞれのエネルギーに応じてビットを適応的に割り当てる。これにより、PCA変換後の複数のチャネルのうち、エネルギーがより高いチャネルを優先的に送信することができる。また、低ビットレートの制約下では、ステレオ信号を構成する複数のチャネルのうち、エネルギーがより低いチャネルを破棄することができる。このような送信方法は、チャネルスケーラビリティ送信方法(Channel scalability transmission method)と呼ばれる。
Manuel Briand, David Virette and Nadine Martin "Parametric coding of stereo audio based on principal component analysis", Proc of the 9thInternational Conference on Digital Audio Effects, Montreal, Canada, September 18-20, 2006.
Dai Yang, Hongmei Ai, Chris Kyriakakis and C.-C. Jay Kuo "High-fidelity multichannel audio coding with Karhunen Loeve Transform", IEEE transactions on speech and audio processing, Vol.11, No.4, July 2003.
しかしながら、ステレオ信号に対してスケーラブル符号化技術を用いるスケーラブル符号化システムにおいて、上述したビット割当方法を適用する場合、符号化装置が復号装置に通知すべきビット割当情報の情報量(ビット数)が多くなり、符号化効率が悪くなってしまう。
具体的には、非特許文献1に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、スケーラブル符号化された主信号に基づくパラメトリック符号化パラメータをスケーラブル符号化の符号化レイヤ毎に更新しなければならない。また、このパラメトリック符号化パラメータは、各符号化レイヤで所定のビット数を要する。すなわち、符号化装置は、符号化レイヤ毎に異なるパラメトリック符号化パラメータの情報量(ビット数)を示すビット割当情報を復号装置に通知することが必要となるため、符号化効率が悪くなる。
また、非特許文献2に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、ステレオ信号における主信号および副信号との間での割り当てビット数は、符号化レイヤ毎に異なる。そのため、符号化装置は、符号化レイヤ毎に、主信号および副信号それぞれに割り当てられたビット数を示すビット割当情報を復号装置に通知する必要があるため、符号化効率が悪くなる。
このように、スケーラブル符号化システムにおいて、ステレオ信号をPCA変換して得られる主信号と副信号との間でビット割り当てを行う場合、符号化レイヤ毎に所定のビット数のビット割当情報を通知することが必要となるため、復号信号に通知すべきビット割当情報の情報量が増大してしまう。
本発明の目的は、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、ビット割当情報の情報量を最小限に抑えつつ、高品質なステレオ信号を復元することができる符号化装置、復号装置およびこれらの方法を提供することである。
本発明の符号化装置は、入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して第1レイヤの主信号および第1レイヤの副信号を生成する変換手段と、第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、第m(mは1以上M以下の自然数)レイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、前記重要度が高い信号を選択する第mレイヤの選択手段と、第1レイヤから第Mレイヤにおいて、前記第mレイヤの選択手段で選択された信号を符号化して第mレイヤの符号化データを生成する第mレイヤの符号化手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの符号化データを復号して第mレイヤの復号信号を生成する第mレイヤの復号手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの選択手段で選択された信号から前記第mレイヤの復号信号を減じて得られる信号、および、前記第mレイヤの選択手段で選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する第mレイヤの減算手段と、第1レイヤから第Mレイヤまでの符号化データ、および、第1レイヤから第Mレイヤまでの選択手段で選択された信号を示す信号情報を送信する送信手段と、を具備する構成を採る。
本発明によれば、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、符号化装置は、各符号化レイヤにおいて、ステレオ信号をPCA変換して得られる主信号および副信号の2つの信号のうち重要度が高い信号のみを符号化することにより、ビット割当情報の情報量を最小限に抑えつつ、復号装置は高品質なステレオ信号を復元することができる。
PCAを使用した一般的な符号化装置の構成を示すブロック図
PCAを使用した一般的な復号装置の構成を示すブロック図
本発明の実施の形態1に係る符号化装置の構成を示すブロック図
本発明の実施の形態1に係るPCA変換部の内部の構成を示すブロック図
本発明の実施の形態1に係る適応的残差符号化部の内部の構成を示すブロック図
本発明の実施の形態1に係る選択部の内部の構成を示すブロック図
本発明の実施の形態1に係る復号装置の構成を示すブロック図
本発明の実施の形態2に係る符号化装置の構成を示すブロック図
本発明の実施の形態2に係る帯域分割符号化部の内部の構成を示すブロック図
本発明の実施の形態2に係る帯域分割符号化部で形成される信号を示す図
本発明の実施の形態2に係る復号装置の構成を示すブロック図
本発明の実施の形態2に係る帯域分割復号部の内部の構成を示すブロック図
本発明のその他の選択処理を行う場合の選択部の構成を示すブロック図
本発明のLPC残差信号に対するMDCT後の信号を複数のサブ帯域に分割する処理を行う符号化装置の構成を示すブロック図
本発明のその他の符号化装置の構成を示すブロック図
本発明のその他の復号装置の構成を示すブロック図
本発明の複数のサブ帯域に分割された信号を結合する処理を行う復号装置の構成を示すブロック図
以下、本発明の各実施の形態について、図面を用いて説明する。
(実施の形態1)
図3は本実施の形態に係る符号化装置の構成を示すブロック図であり、図7は本実施の形態に係る復号装置の構成を示すブロック図である。本実施の形態に係る符号化装置および復号装置の構成として、Mレイヤのスケーラブル構成を一例として説明する。つまり、以下の説明では、スケーラブル符号化処理における符号化レイヤ数をM(Mは2以上の自然数)とする。図3に示す符号化装置100において、適応的残差符号化部102−1〜102−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。同様に、図7に示す復号装置200において、復号部202−1〜202−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。また、以下の説明では、ステレオ信号における左信号および右信号をNBサンプルずつ区切り(NBは自然数)、NBサンプルを1フレームとする。ここで、左信号および右信号は左信号L(n)および右信号R(n)で表される。nはNBサンプルずつ区切られた信号のうち、信号要素のn+1番目を示し、n=0〜NB−1とする。
図3に示す符号化装置100において、PCA変換部101には、ステレオ信号における左信号L(n)および右信号R(n)が入力される。PCA変換部101は、入力される左信号L(n)および右信号R(n)を、式(1)に従ってPCA変換を行い、第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)を生成する。そして、PCA変換部101は、第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)を適応的残差符号化部102−1に出力する。また、PCA変換部101は、PCA変換処理時に算出されるPCA変換パラメータν1およびν2を量子化部103に出力する。
適応的残差符号化部102−1〜102−Mは、それぞれに対応する符号化レイヤの主信号の重要度および副信号の重要度に基づいて、2つの信号のいずれか一方を適応的に選択し、選択した信号を符号化(適応的残差符号化:adaptive residue encoding)する。具体的には、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−m(mは1以上M以下の自然数)は、第mレイヤの主信号の重要度と、第mレイヤの副信号の重要度とを比較し、重要度が高い信号を選択し、選択された信号を符号化して第mレイヤの符号化データ(ビット列)を生成する。また、第1レイヤから第(M−1)レイヤにおいて、適応的残差符号化部102−mは、選択された信号から符号化データの復号信号を減じて得られる符号化残差(coding residue)信号および選択された信号以外の信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。また、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−mは、符号化された信号(主信号または副信号)を示す信号情報であるインジケータを生成する。例えば、インジケータに示される信号が主信号の場合、符号化された信号は第mレイヤの主信号であり、インジケータに示される信号が副信号の場合、符号化された信号は第mレイヤの副信号である。つまり、各符号化レイヤに設定された符号化データ用のビット列に割り当てられる信号を示すビット割当情報としてインジケータが生成される。
例えば、最下位レイヤ(第1レイヤ)に対応する、適応的残差符号化部102−1は、PCA変換部101から入力される第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)に対して適応的残差符号化処理を施して、第1レイヤの符号化データC1を生成する。また、適応的残差符号化部102−1は、入力信号(第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n))のうち符号化された信号(選択された信号)から符号化データC1の復号信号を減じて得られる符号化残差信号、および、入力信号(第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n))のうち符号化された信号(選択された信号)以外の信号(選択されなかった信号)を、第2レイヤの主信号P^2(n)および第2レイヤの副信号A^2(n)として生成する。また、適応的残差符号化部102−1は、第1レイヤにおいて符号化された信号(第1レイヤの主信号P1(n)または第1レイヤの副信号A1(n))を示すインジケータF1を生成する。そして、適応的残差符号化部102−1は、第2レイヤの主信号P^2(n)および第2レイヤの副信号A^2(n)を、次の符号化レイヤ(第2レイヤ)に対応する適応的残差符号化部102−2に出力し、インジケータF1および符号化データC1を多重化部104に出力する。
同様に、適応的残差符号化部102−2には、適応的残差符号化部102−1から第2レイヤの主信号P^2(n)および第2レイヤの副信号A^2(n)が入力される。そして、適応的残差符号化部102−2は、適応的残差符号化部102−1と同様にして、第2レイヤの符号化データC2、第3レイヤの主信号P^3(n)、第3レイヤの副信号A^3(n)、および、インジケータF2を生成する。そして、適応的残差符号化部102−2は、第3レイヤの主信号P^3(n)および第3レイヤの副信号A^3(n)を次の符号化レイヤ(第3レイヤ)に対応する適応的残差符号化部102−3に出力し、インジケータF2および符号化データC2を多重化部104に出力する。適応的残差符号化部102−3〜102−Mについても同様である。ただし、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、次の符号化レイヤの主信号および副信号として符号化残差信号を出力しない。すなわち、第1レイヤから第(M−1)レイヤにおいてのみ、つまり、適応的残差符号化部102−1〜102−(M−1)のみが、選択された信号から符号化データの復号信号を減じて得られる符号化残差信号および選択されなかった信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。
量子化部103は、PCA変換部101から入力されるPCA変換パラメータν1およびν2を量子化してPCA変換パラメータの量子化符号を生成する。そして、量子化部103は、PCA変換パラメータの量子化符号を多重化部104に出力する。
多重化部104は、適応的残差符号化部102−1〜102−Mそれぞれから入力される符号化データCmおよびインジケータFmと、量子化部103から入力される量子化符号とを多重化してビットストリームを形成する。得られたビットストリームは、通信路を介して復号装置200(図7)に送信される。
図4はPCA変換部101の内部構成を示すブロック図である。共分散行列算出部1011は、ステレオ信号におけるフレーム単位の左信号L(n)および右信号R(n)を用いて、共分散行列を算出し、算出された共分散行列を固有ベクトル算出部1012に出力する。
固有ベクトル算出部1012は、共分散行列算出部1011から入力される共分散行列を用いて、共分散行列の固有ベクトルを算出する。ここで、固有ベクトル算出部1012で算出される固有ベクトルの各要素がPCA変換パラメータν1およびν2となる。そして、固有ベクトル算出部1012は、算出された固有ベクトル(PCA変換パラメータ)をPCA変換行列形成部1013および図3に示す量子化部103に出力する。
PCA変換行列形成部1013は、固有ベクトル算出部1012から入力される固有ベクトルを用いてPCA変換行列を形成し、形成されたPCA変換行列を変換部1014に出力する。
変換部1014は、PCA変換行列形成部1013から入力されるPCA変換行列を用いて、ステレオ信号における左信号L(n)および右信号R(n)を第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)に変換する(式(1)。ただし、P1(n)=P(n)、A1(n)=A(n))。
次に、適応的残差符号化部102−1〜102−Mにおける適応的残差符号化処理の一例として、第mレイヤに対応する適応的残差符号化部102−mの内部構成について図5を用いて説明する。図5は、適応的残差符号化部102−mの内部構成を示すブロック図である。図5に示す適応的残差符号化部102−mには、1つ下位の第(m−1)レイヤに対応する適応的残差符号化部102−(m−1)から、第mレイヤの主信号P^m(n)および第mレイヤの副信号A^m(n)が入力される。具体的には、図5に示す選択部1021−mおよび符号化部1022−mに、第mレイヤの主信号P^m(n)および第mレイヤの副信号A^m(n)が入力される。また、図5に示す減算器1024−mには第mレイヤの主信号P^m(n)が入力され、減算器1025−mには第mレイヤの副信号A^m(n)が入力される。ただし、図5に示す第1レイヤに対応する適応的残差符号化部102−mには、PCA変換部101から第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)が入力される。なお、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、図5に示す選択部1021−mおよび符号化部1022−mのみを備え、復号部1023−m、減算器1024−mおよび減算器1025−mを備えない。すなわち、適応的残差符号化部102−Mは、インジケータFmおよび符号化データCmのみを出力する。
図5に示す適応的残差符号化部102−mにおいて、選択部1021−mは、入力される第mレイヤの主信号P^m(n)のエネルギーと、第mレイヤの副信号A^m(n)のエネルギーとを比較し、エネルギーがより高い信号を選択する。そして、選択部1021−mは、選択された信号(主信号または副信号)を示すインジケータFmを符号化部1022−m、復号部1023−mおよび図3に示す多重化部104に出力する。
符号化部1022−mは、入力される第mレイヤの主信号P^m(n)および第mレイヤの副信号A^m(n)のうち、選択部1021−mから入力されるインジケータFmに示される信号、つまり、選択部1021−mで選択された信号を符号化して第mレイヤの符号化データCmを生成する。具体的には、符号化部1022−mは、インジケータFmに示される信号が主信号の場合、第mレイヤの主信号P^m(n)を符号化し、インジケータFmに示される信号が副信号の場合、第mレイヤの副信号A^m(n)を符号化する。そして、符号化部1022−mは、生成された第mレイヤの符号化データCmを復号部1023−mおよび図3に示す多重化部104に出力する。
復号部1023−mは、選択部1021−mから入力されるインジケータFmに基づいて、符号化部1022−mから入力される符号化データCmを特定し、符号化データCmを復号して第mレイヤの復号信号を生成する。ここで、復号部1023−mは、インジケータFmに示される信号以外の信号の復号信号を0とする。そして、復号部1023−mは、生成される第mレイヤの復号信号のうち、主信号の復号信号を減算器1024−mに出力し、副信号の復号信号を減算器1025−mに出力する。具体的には、復号部1023−mは、インジケータFmに示される信号が主信号である場合、第mレイヤの符号化データCmを用いて第mレイヤの主信号P^m(n)を復号する。そして、復号部1023−mは、主信号の復号信号P〜 m(n)を減算器1024−mに出力する一方、副信号の復号信号A〜 m(n)として「0」を減算器1025−mに出力する。これに対し、復号部1023−mは、インジケータFmに示される信号が副信号である場合、符号化データCmを用いて第mレイヤの副信号A^m(n)を復号する。そして、復号部1023−mは、副信号の復号信号A〜 m(n)を減算器1025−mに出力する一方、主信号の復号信号P〜 m(n)として「0」を減算器1024−mに出力する。
減算器1024−mは、入力信号である第mレイヤの主信号P^m(n)から、復号部1023−mから入力される主信号の復号信号P〜 m(n)を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。そして、減算器1024−mは、第(m+1)レイヤの主信号P^m+1(n)を次の符号化レイヤである第(m+1)レイヤに対応する適応的残差符号化部102−(m+1)に出力する。
減算器1025−mは、入力信号である第mレイヤの副信号A^m(n)から、復号部1023−mから入力される副信号の復号信号A〜 m(n)を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。そして、減算器1025−mは、第(m+1)レイヤの副信号A^m+1(n)を適応的残差符号化部102−(m+1)に出力する。
例えば、選択部1021−mで主信号が選択された場合、減算器1024−mは、第mレイヤの主信号P^m(n)から符号化データCmの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。また、減算器1025−mは、第mレイヤの副信号A^m(n)を第(m+1)レイヤの副信号A^m+1(n)として生成する。一方、選択部1021−mで副信号が選択された場合、減算器1025−mは、第mレイヤの副信号A^m(n)から符号化データCmの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。また、減算器1024−mは、第mレイヤの主信号P^m(n)を第(m+1)レイヤの主信号P^m+1(n)として生成する。
次に、選択部1021−mの内部構成について図6を用いて説明する。図6は、選択部1021−mの内部構成を示すブロック図である。
図6に示す選択部1021−mにおいて、エネルギー計算部1201−mは、第mレイヤの主信号P^
m(n)のエネルギーE
P^mを式(3)に従って計算する。そして、エネルギー計算部1201−mは、計算されたエネルギーE
P^mを比較部1203−mに出力する。
エネルギー計算部1202−mは、第mレイヤの副信号A^
m(n)のエネルギーE
A^mを式(4)に従って計算する。そして、エネルギー計算部1202−mは、計算されたエネルギーE
A^mを比較部1203−mに出力する。
比較部1203−mは、エネルギー計算部1201−mから入力されるエネルギーEP^mと、エネルギー計算部1202−mから入力されるエネルギーEA^mとを比較する。そして、比較部1203−mは、より大きいエネルギーに対応する信号(主信号または副信号)を第mレイヤにおいて符号化する信号として選択する。例えば、比較部1203−mは、エネルギーEP^mがエネルギーEA^m以上の場合、第mレイヤにおいて符号化される信号として主信号(すなわち、第mレイヤの主信号P^m(n))を選択する。一方、比較部1203−mは、エネルギーEP^mがエネルギーEA^m未満の場合、第mレイヤにおいて符号化される信号として副信号(すなわち、第mレイヤの副信号A^m(n))を選択する。そして、比較部1203−mは、選択された信号、つまり、第mレイヤにおいて符号化される信号(主信号または副信号)を示すインジケータFmを生成する。
上述したように、本実施の形態における符号化装置100は、符号化レイヤ毎に、主信号および副信号のいずれか一方の信号のみを符号化する。そのため、各符号化レイヤにおけるビット割当情報であるインジケータの情報量(ビット数)は、主信号と副信号とを区別するための1ビットでよい。
なお、上述した選択部1021−mは、主信号および副信号のエネルギーの算出を対数領域で行ってもよい。また、選択部1021−mは、主信号および副信号のエネルギーの算出に、左信号L(n)および右信号R(n)を利用してもよく、例えば左信号L(n)および右信号R(n)のエネルギーを用いてもよい。また、選択部1021−mは、マスキングを考慮して主信号および副信号のエネルギーを算出してもよい。
次に、図7に示す復号装置200について説明する。復号装置200は、通信路を介して符号化装置100から送信されるビットストリームを受信する。図7に示す復号装置200において、逆多重化部201は、ビットストリームを、第1レイヤ〜第Mレイヤそれぞれの符号化レイヤに対応する符号化データCmおよびインジケータFmと、PCA変換パラメータの量子化符号とに分離する。そして、逆多重化部201は、各符号化レイヤに対応する符号化データCmおよびインジケータFmを、第1レイヤ〜第Mレイヤそれぞれ対応する復号部202−1〜202−Mに出力する。また、逆多重化部201は、PCA変換パラメータの量子化符号を逆量子化部205に出力する。
復号部202−1〜202−Mは、それぞれ逆多重化部201から入力されるインジケータFmに基づいて、逆多重化部201から入力される符号化データを復号する。例えば、復号部202−mは、インジケータFmに示される信号が主信号である場合、符号化データCmを用いて主信号を復号する。そして、復号部202−mは、復号信号P〜 m(n)を加算器203に出力する。一方、復号部202−mは、インジケータFmに示される信号が副信号である場合、符号化データCmを用いて副信号を復号する。そして、復号部202−mは、復号信号A〜 m(n)を加算器204に出力する。また、復号部202−mは、インジケータFmに示される信号以外の信号の復号信号として「0」を加算器203または加算器204に出力する。
加算器203は、復号部202−1〜202−Mからそれぞれ入力される復号信号P〜 m(n)を加算する。そして、加算器203は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号主信号P〜(n)を逆PCA変換部206に出力する。
加算器204は、復号部202−1〜202−Mからそれぞれ入力される復号信号A〜 m(n)を加算する。そして、加算器204は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号副信号A〜(n)を逆PCA変換部206に出力する。
なお、通信路の状況等によって、ビットストリームの一部が廃棄されてしまう場合がある。例えば、ビットストリームに第mレイヤ(m<M)までの符号化データしか含まれていない場合には、第1レイヤ〜第mレイヤまでの復号部が動作するとともに、これら符号化レイヤに対応する加算器203、204が動作して、復号主信号P〜(n)および復号副信号A〜(n)が求められ、復号主信号P〜(n)および復号副信号A〜(n)が逆PCA変換部206に出力される。
逆量子化部205は、逆多重化部201から入力される量子化符号を逆量子化し、得られるPCA変換パラメータν〜 1およびν〜 2を逆PCA変換部206に出力する。
逆PCA変換部206には、加算器203から復号主信号P〜(n)が入力され、加算器204から復号副信号A〜(n)が入力され、逆量子化部205からPCA変換パラメータν〜 1およびν〜 2が入力される。逆PCA変換部206は、復号主信号P〜(n)および復号副信号A〜(n)を、PCA変換パラメータν〜 1およびν〜 2を用いて、式(2)に従って逆PCA変換(inverse PCA transformation)し、ステレオ信号における左信号L〜(n)および右信号R〜(n)を得る。
このように、本実施の形態によれば、符号化装置100(図3)は、各符号化レイヤにおいて、主信号および副信号のうち、エネルギーがより高い信号のみを符号化対象として選択する。この結果、各符号化レイヤで符号化される信号は、主信号または副信号のいずれか1つのみであるため、符号化された信号(ビット列に割り当てられた信号)を示すインジケータの情報量(ビット数)は、1ビットのみでよい。つまり、符号化装置100は、各符号化レイヤにおける符号化データのビット割当情報を最小限に抑えることができる。
また、スケーラブル符号化においては、各符号化レイヤにおける主信号および副信号として、下位の符号化レイヤにおける符号化残差信号が入力される。そのため、各符号化レイヤにおける入力信号のエネルギーは、下位の符号化レイヤにおける符号化結果に依存して変化する。よって、符号化装置100(図3)が、各符号化レイヤにおいてエネルギーがより高い信号(重要度がより高い信号)を、下位の符号化レイヤにおける符号化結果に応じて適応的に選択することができる。これにより、復号装置200(図7)は、高品質なステレオ信号を復元することができる。
(実施の形態2)
実施の形態1では最下位レイヤである第1レイヤの主信号および副信号に対して適応的残差符号化処理を施したのに対し、本実施の形態では、第1レイヤの主信号に対して、第1レイヤをさらに階層化して分割周波数帯域単位の符号化を行う帯域分割符号化処理を施す。
分割周波数帯域単位のスケーラブル符号化方法としては、例えば、入力信号を複数の帯域に分割し、分割した帯域の信号単位で符号化することでスケーラブル符号化を実現する方法(例えば、米国特許出願公開第2008/0004883号明細書参照)、および、ITU−T勧告G.729.1のレイヤ4以降の符号化(TDAC:Time-Domain Aliasing Cancellation)において、MDCT係数上でサブ帯域単位の符号化を行い、エネルギーの大きいサブ帯域から優先的に符号化データを伝送することでスケーラブル符号化を実現する方法(ITU−T勧告G.729.1(2006)参照)等が検討されている。
帯域分割符号化に基づくスケーラブル符号化において、下位レイヤで符号化対象となる帯域の信号の符号化後の誤差信号(符号化残差信号)が大きい場合には、符号化残差信号が聴感的な復号音質に与える影響は、より上位の符号化レイヤで符号化対象となる帯域の信号が聴感的な復号音質に与える影響よりも大きい。
そこで、本実施の形態では、帯域分割符号化対象の符号化レイヤにおいて、各符号化レイヤより下位レイヤの符号化残差信号を符号化するか否かを適応的に判定する。
図8は本実施の形態に係る符号化装置の構成を示すブロック図である。なお、図8において図3に示す符号化装置100と同一の構成部には同一符号を付し、説明を省略する。
図8に示す符号化装置500において、PCA変換部101は、第1レイヤの主信号P1(n)を帯域分割符号化部501に出力し、第1レイヤの副信号A1(n)を第2レイヤの副信号A^2(n)として適応的残差符号化部102−2に出力する。
帯域分割符号化部501は、PCA変換部101から入力される主信号P1(n)を複数の帯域に分割し、分割した分割帯域単位の信号に対して階層的に符号化を行う。ここで、帯域分割符号化部501が第1レイヤから第Lレイヤ(Lは2以上の自然数)までの符号化を行う場合、適応的残差符号化部102−2〜102−Mは第(L+1)レイヤ以降の符号化を順次行う。そして、帯域分割符号化部501は、第Lレイヤまでの各符号化レイヤで生成された符号化データを含む符号化データCS、および、第1レイヤの符号化対象の帯域をさらに分割した各帯域(サブ帯域)で生成された判定結果を含むインジケータFSを多重化部104に出力する。また、帯域分割符号化部501は、符号化後の符号化残差信号を適応的残差符号化部102−2の入力信号P^2(n)として適応的残差符号化部102−2に出力する。
図9は、図8に示す帯域分割符号化部501の内部構成のうち、第1レイヤの符号化処理に関する構成部および第2レイヤ符号化処理に関する構成部への入力信号形成処理に関する構成部を示すブロック図である。
図9に示す帯域分割符号化部501において、帯域分割部551は、PCA変換部101(図8)から入力される第1レイヤの主信号P1(n)を、第1レイヤの符号化対象の第1帯域の信号である第1帯域信号S1と、第1帯域信号S1以外の信号S”1とに分割する。例えば、帯域分割部551は、第1レイヤの主信号P1(n)の周波数帯域のうち低域部から所定の周波数帯域までの信号を第1帯域信号S1とする。そして、帯域分割部551は、第1帯域信号S1をサブ帯域分割部552および符号化部553に出力し、第1帯域信号以外の信号S”1を信号形成部558に出力する。
サブ帯域分割部552は、帯域分割部551から入力される第1帯域信号S1を複数のサブ帯域信号S1,sb(sb=1,2,…,Nsb、Nsbはサブ帯域分割数)に分割する。そして、サブ帯域分割部552は、分割したサブ帯域信号S1,sbを評価部556および残差算出部557に出力する。
符号化部553は、帯域分割部551から入力される第1帯域信号S1を予め設定された符号化ビットレートで符号化して第1レイヤ符号化データを生成する。そして、符号化部553は、生成した第1レイヤ符号化データを復号部554に出力するとともに、多重化部104(図8)に出力する。
復号部554は、符号化部553から入力される第1レイヤ符号化データを復号して第1レイヤ復号信号S〜 1を生成する。そして、復号部554は、生成した第1レイヤ復号信号S〜 1をサブ帯域分割部555に出力する。
サブ帯域分割部555は、サブ帯域分割部552と同様にして、復号部554から入力される第1レイヤ復号信号S〜 1を複数のサブ帯域信号S〜 1,sbに分割する。そして、サブ帯域分割部555は、分割したサブ帯域信号S〜 1,sbを評価部556および残差算出部557に出力する。
評価部556は、サブ帯域分割部552から入力されるサブ帯域信号S
1,sbおよびサブ帯域分割部555から入力されるサブ帯域信号S
〜 1,sbを用いて、サブ帯域毎の符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、まず、評価部556は、サブ帯域信号S
1,sbおよびサブ帯域信号S
〜 1,sbを用いて、サブ帯域毎の第1レイヤにおける符号化性能に関する評価値を算出する。例えば、評価部556は、評価値として各サブ帯域の符号化残差信号に対するSNR(Signal to Noise Ratio)を用いる。具体的には、評価部556は、第sbサブ帯域におけるSNR
sbを式(5)に従って算出する。ただし、第sbサブ帯域におけるサブ帯域信号のサンプル数をP
1,sbとする。
そして、評価部556は、算出した各サブ帯域における符号化性能に関する評価値(SNR)に基づき、符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、評価部556は、各サブ帯域のSNRsbと所定の閾値SNRthrとを比較して、下記の第sbサブ帯域における判定結果F1,sbを生成する。
F1,sb = 1 if SNRsb < SNRthr
F1,sb = 0 else
つまり、評価部556は、各サブ帯域における評価値(SNR)が所定の閾値より小さい場合(すなわち、符号化残差エネルギーが所定の閾値より大きい場合)、判定結果F1,sbを「1」とし、評価値(SNR)が所定の閾値以上の場合(すなわち、符号化残差エネルギーが所定の閾値以下の場合)、判定結果F1,sbを「0」とする。ここで、評価部556は、SNRthrを予め設定してもよく、入力信号の特性に基づいて設定してもよく、サブ帯域毎に設定してもよい。そして、評価部556は、各サブ帯域の判定結果F1,sbを残差算出部557に出力するとともに、多重化部104(図8)に出力する。
残差算出部557は、評価部556から入力される判定結果F1,sbに基づいて、各サブ帯域における符号化残差信号を算出する。具体的には、残差算出部557は、判定結果F1,sbが「1」である第sbサブ帯域では、サブ帯域分割部552から入力されるサブ帯域信号S1,sbから、サブ帯域分割部555から入力されるサブ帯域信号S〜 1,sbを減じて第sbサブ帯域における符号化残差信号を算出する。一方、残差算出部557は、判定結果F1,sbが「0」である第sbサブ帯域では符号化残差信号を算出しない。そして、残差算出部557は、判定結果F1,sbが「1」であるサブ帯域のみに符号化残差信号を有する第1帯域全体の符号化残差信号Sr1を信号形成部558に出力する。
信号形成部558は、残差算出部557から入力される符号化残差信号Sr1と帯域分割部551から入力される信号S”1とを加算して信号S’1を形成する。すなわち、信号S’1は、第1レイヤの主信号P1(n)の周波数帯域において、第1帯域に符号化残差信号Sr1を有し、第1帯域以外の周波数帯域に信号S”1を有する。そして、信号形成部558は、生成した信号S’1を第2レイヤの符号化処理に関する構成部(図示せず)に出力する。
また、帯域分割符号化部501は、信号形成部558から出力された信号S’1を第2レイヤの入力信号として用いる。そして、第2レイヤでは、帯域分割符号化部501は、第1レイヤと同様にして、入力信号を、第2レイヤで符号化対象とする第2帯域の信号と第2帯域の信号以外の信号とに分割し、第2帯域の信号を予め設定された符号化ビットレートで符号化する。また、帯域分割符号化部501は、第2帯域の信号以外の信号を、第3レイヤの入力信号として用いる。ここで、帯域分割符号化部501は、第1帯域の一部を含む周波数帯域を第2帯域とする。そこで、帯域分割符号化部501は、第2帯域の信号のうち、第1帯域の一部に対応する周波数帯域の信号を優先的に符号化する。具体的には、帯域分割符号化部501は、第2帯域に含まれる第1帯域のうち、サブ帯域の判定結果F1,sbが「1」であるサブ帯域の一部またはすべての符号化残差信号を優先的に符号化する。第3レイヤ以降についても同様である。そして、帯域分割符号化部501は、すべての符号化レイヤの符号化データを含む符号化データCSおよび第1帯域の各サブ帯域の判定結果F1,sbを含むインジケータFSを多重化部104に出力する。
次いで、信号形成部558で形成した信号S’1を図10に示す。図10に示すように、第1レイヤの符号化対象である第1帯域では、判定結果F1,sbが「1」であるサブ帯域のみに符号化レイヤ残差信号が存在する。例えば、図10に示すように、判定結果F1,1が「1」である第1サブ帯域(sb=1)では、符号化残差信号(S1,1−S〜 1,1)が存在し、判定結果F1,3が「1」である第3サブ帯域(sb=3)では、符号化残差信号(S1,3−S〜 1,3)が存在する。一方、判定結果F1,2が「0」である第2サブ帯域(sb=2)および判定結果F1,4が「0」である第4サブ帯域(sb=4)では、符号化残差信号が存在しない。また、第1レイヤの符号化対象ではない帯域では、第1レイヤの主信号P1(n)の第1帯域以外の周波数帯域の信号S”1がそのまま存在する。
これにより、帯域分割符号化部501は、第1帯域の各サブ帯域のうち、符号化残差エネルギーが閾値より大きいサブ帯域の符号化残差信号を入力信号として上位レイヤに出力する。よって、帯域分割符号化部501は、下位レイヤで得る符号化残差信号のうち、符号化残差エネルギーがより高い信号(重要度がより高い信号)のみを上位レイヤで符号化する符号化残差信号として適応的に選択することができる。
次に、本実施の形態に係る復号装置について説明する。図11は復号装置600の構成を示すブロック図である。なお、図11において図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図11に示す復号装置600において、帯域分割復号部601には、逆多重化部201から、符号化装置500の帯域分割符号化部501で生成された各符号化レイヤの符号化データを含む符号化データCSおよび第1レイヤの複数のサブ帯域の判定結果F1、sbを含むインジケータFSが入力される。帯域分割復号部601は、判定結果F1、sbに基づいて、符号化データCSを復号する。具体的には、帯域分割復号部601は、逆多重化部201から入力される各符号化レイヤの符号化データを復号し、生成される復号信号と上位レイヤで生成した復号信号とを加算して各符号化レイヤの復号信号を形成する。そして、帯域分割復号部601は、帯域分割符号化処理を適用した符号化レイヤのうち最下位レイヤである第1レイヤの復号信号を復号信号P〜 1(n)として加算器203に出力する。
図12は、図11に示す帯域分割復号部601の内部構成のうち、第2レイヤの復号信号S〜’1を用いて、最下位レイヤである第1レイヤの復号信号P〜 1(n)を生成する復号処理に関する構成部を示すブロック図である。
図12に示す帯域分割復号部601において、復号部651は、逆多重化部201(図11)から入力される符号化データCSに含まれる第1レイヤ符号化データを復号する。そして、復号部651は、第1レイヤの復号信号S〜 1を帯域復号信号形成部653に出力する。
残差信号分離部652は、逆多重化部201から入力される判定結果F1,sbに基づいて、第2レイヤの復号処理に関する構成部(図示せず)から入力される第2レイヤの復号信号S〜’1(すなわち、第2レイヤから第Lレイヤで復号された復号信号)を第1帯域の復号残差信号S〜 r1と第1帯域以外の周波数帯域の復号信号S〜”1とに分離する。そして、残差信号分離部652は、第1帯域の復号残差信号S〜 r1を帯域復号信号形成部653に出力し、第1帯域以外の周波数帯域の復号信号S〜”1を復号信号形成部654に出力する。
帯域復号信号形成部653は、逆多重化部201から入力される判定結果F1,sbに基づいて、復号部651から入力される復号信号S〜 1および残差信号分離部652から入力される復号残差信号S〜 r1を加算することで、第1帯域の復号信号を形成する。具体的には、帯域復号信号形成部653は、復号信号S〜 1と、復号残差信号S〜 r1における判定結果F1,sbが「1」であるサブ帯域の復号残差信号とを加算する。そして、帯域復号信号形成部653は、形成した第1帯域の復号信号を復号信号形成部654に出力する。
復号信号形成部654は、帯域復号信号形成部653から入力される第1帯域の復号信号、および、残差信号分離部652から入力される第1帯域以外の周波数帯域の復号信号S〜”1を用いて復号信号P〜 1(n)を形成する。そして、復号信号形成部654は、形成した復号信号P〜 1(n)を加算器203(図11)に出力する。
このように、本実施の形態によれば、符号化装置500(図8)は、主信号P1(n)に対して帯域分割符号化に基づくスケーラブル符号化を適用し、ステレオ符号化において聴感的に重要である周波数帯域(特に低域)の信号を適応的に選択して符号化するため、符号化歪をより低減することができる。よって、復号装置600(図11)は、復号音質を向上することができる。
また、本実施の形態によれば、第1レイヤの符号化対象である第1帯域の各サブ帯域のうち、評価値(SNR)が所定の閾値より小さいサブ帯域、つまり、符号化残差エネルギーが所定量より大きいサブ帯域のみを上位レイヤの符号化対象の信号とする。すなわち、各符号化レイヤにおいてエネルギーがより高いサブ帯域の信号(聴感的に重要度がより高いサブ帯域の信号)のみが上位レイヤに入力される。よって、符号化装置500では、帯域分割符号化部501内の各符号化レイヤにおいて、下位レイヤにおける符号化結果に応じて符号化残差エネルギーがより高い信号(重要度がより高い信号)を適応的に符号化するため、復号装置600(図11)は、高品質なステレオ信号を復元することができる。
なお、本実施の形態において、各符号化レイヤにおける符号化対象の信号は、時間領域信号でもよく、周波数領域信号(例えば、MDCT変換後の係数)でもよい。
また、本実施の形態では、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する符号化レイヤは、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに限定されない。例えば、符号化装置は、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤに対して帯域分割符号化処理を適用してもよい。
また、本実施の形態では、PCA変換後の主信号に対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する信号はPCA変換後の主信号に限定されない。例えば、符号化装置は、PCA変換後の副信号、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤにおける符号化残差信号、または、PCA変換後の信号以外の任意の入力信号に対して帯域分割符号化処理を適用してもよい。また、符号化装置は、帯域分割符号化処理と適応的残差符号化処理とを組み合わせず、帯域分割符号化処理を単独で適用してもよい。
また、本実施の形態では、帯域分割符号化部において、入力信号の低域部から所定の周波数帯域までの予め設定した周波数帯域を、各符号化レイヤにおける符号化対象の周波数帯域とする場合について説明した。しかし、本発明では、各符号化レイヤにおける符号化対象の周波数帯域として、例えば、入力信号の特性に応じた周波数帯域を適応的に設定してもよい。
また、本実施の形態では、符号化装置が判定結果F1,sbに基づいて第1帯域の各サブ帯域の符号化残差信号を算出するか否かを決定する場合について説明した。しかし、本発明では、符号化装置は判定結果F1,sbによらず第1帯域のすべてのサブ帯域の符号化残差信号を算出してもよい。
以上、本発明の各実施の形態について説明した。
なお、上記実施の形態では、信号の重要度の指標として、信号のエネルギーを用いる場合について説明した。しかし、本発明では、信号の重要度は、信号のエネルギーに限らず、例えば、信号の信号対雑音比(Signal to Noise Ratio:SNR)でもよい。信号の重要度の指標としてSNRを用いる場合の適応的残差符号化部102−mの選択部3021−mの内部構成について図13のブロック図を用いて説明する。図13に示す選択部3021−mにおいて、符号化部3201−mは、第mレイヤの主信号P^
m(n)を符号化して符号化データを生成し、復号部3202−mは、第mレイヤの主信号P^
m(n)の符号化データを復号して第mレイヤの主信号の復号信号P
〜 m(n)を生成する。そして、減算器3203−mは、第mレイヤの主信号P^
m(n)から第mレイヤの主信号の復号信号P
〜 m(n)を減じて、第(m+1)レイヤの主信号P^
m+1(n)を生成する。逆PCA変換部3204−mは、第(m+1)レイヤの主信号P^
m+1(n)および第mレイヤの副信号A^
m(n)を逆PCA変換して、左信号L^
m1(n)および右信号R^
m1(n)を得る。すなわち、符号化部3201−m、復号部3202−m、減算器3203−mおよび逆PCA変換部3204−mは、第mレイヤの主信号P^
m(n)が符号化された場合(すなわち、選択部3021−mが主信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^
m1(n)および右信号R^
m1(n))を生成する。そして、測定値算出部3205−mは、左信号L^
m1(n)および右信号R^
m1(n)を用いて定量的測定値M
1(すなわち、SNR)を算出する(式(6))。
同様にして、符号化部3206−m、復号部3207−m、減算器3208−mおよび逆PCA変換部3209−mは、第mレイヤの副信号A^
m(n)が符号化された場合(すなわち、選択部3021−mが副信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^
m2(n)および右信号R^
m2(n))を生成する。そして、測定値算出部3210−mは、左信号L^
m2(n)および右信号R^
m2(n)を用いて定量的測定値M
2(すなわち、SNR)を算出する(式(7))。
比較部3211−mは、定量的測定値M1および定量的測定値M2を比較し、より大きい値の定量的測定値に対応する信号(主信号または副信号)を符号化される信号として選択し、選択された信号を示すインジケータFmを出力する。つまり、選択部3021−mは、主信号を符号化した際に復号装置200で得られる出力ステレオ信号、および、副信号を符号化した際に復号装置200で得られる出力ステレオ信号を選択部3021−mの内部で生成する。これにより、選択部3021−mは、定量的測定値として、復号装置200におけるSNRを算出することができる。よって、選択部3021−mは、復号装置200におけるSNRがより高い信号を選択するため、上記実施の形態と同様、ビット割当情報を通知するための情報量を最小限に抑えつつ、符号化効率を向上することができる。なお、信号の重要度を示す定量的測定値は式(6)および式(7)より算出されるSNRに限らず、例えば、マスク対雑音比(Mask to Noise Ratio:MNR)でもよい。例えば、ステレオ信号の重要度としてMNRを用いる場合、ステレオ信号における左信号L(n)および右信号R(n)の心理音響的モデル化を含む処理を経て導出することができる。
また、上記実施の形態では、時間領域のステレオ信号に対して本発明を適用する場合について説明した。しかし、本発明は、時間領域のステレオ信号に限らず、別の領域のステレオ信号に対して本発明を適用してもよい。例えば、MDCT(Modified Discrete Cosine Transform)領域のステレオ信号、または、ステレオ信号にLPC分析を施したLPC(Linear Prediction Coefficients)残差信号に対して本発明を適用してもよい。また、本発明は、例えば、MDCT領域のLPC残差信号に対して適用してもよい。
また、本発明に係る符号化装置は、入力信号の帯域を複数のサブ帯域(sub band)に分割し、入力信号の各サブ帯域の信号であるサブ帯域信号に対して本発明を適用してもよい。例えば、入力信号であるステレオ信号の左信号L(n)および右信号R(n)を、K個のサブ帯域に分割して、左信号L(n)のサブ帯域信号Lk(n)(k=1〜K)、および、右信号R(n)のサブ帯域信号Rk(n)(k=1〜K)を得る。
例えば、ステレオ信号において、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割した場合について、図14〜図17を用いて説明する。なお、図14は、符号化装置のうち、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割する処理に関する構成部300を示し、図15は、符号化装置のうち、本発明に係る符号化処理に関する構成部350を示す。同様に、図16は、復号装置のうち、本発明に係る復号処理に関する構成部400を示し、図17は、復号装置のうち、複数のサブ帯域信号に分割されたMDCT領域のLPC残差信号を結合してステレオ信号を復元する処理に関する構成部450を示す。なお、図14〜図17において図3に示す符号化装置100または図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図14において、LPC分析部301は、ステレオ信号における左信号L(n)を用いて線形予測分析を行い、左信号L(n)のスペクトルの概形を示すLPCパラメータ(線形予測パラメータ)AL(z)を得る。量子化部302は、LPCパラメータAL(z)を量子化して量子化符号IqLを得る。逆量子化部303は、LPCパラメータの量子化符号IqLを逆量子化し、復号LPCパラメータAdL(z)を得る。逆フィルタ304は、左信号L(n)に対し、復号LPCパラメータAdL(z)を用いて逆フィルタリング(LPC逆フィルタリング)を施すことにより、スペクトルの概形の特徴が取り除かれたフィルタリング後の左信号Le(n)を得る。T/F部305は、逆フィルタリング後の左信号Le(n)に対してMDCT(すなわち、時間/周波数領域変換)を行い、時間領域の左信号Le(n)をMDCT領域(周波数領域)の左信号Le(f)を得る。つまり、左信号のMDCT領域のLPC残差信号Le(f)が得られる。
帯域分割部306は、左信号のMDCT領域のLPC残差信号Le(f)を複数のサブ帯域(ここでは、K個のサブ帯域)に分割し、左信号Le(f)のサブ帯域信号Le1(f)〜LeK(f)を生成する。
一方、図14に示すLPC分析部307、量子化部308、逆量子化部309、逆フィルタ310、T/F部311および帯域分割部312は、LPC分析部301から帯域分割部306までの一連の処理と同様の処理を右信号R(n)に施すことで、右信号Re(f)のサブ帯域信号Re1(f)〜ReK(f)を生成する。
ここで、例えば、左信号Le(f)のサブ帯域信号Le1(f)〜LeK(f)および右信号Re(f)のサブ帯域信号Re1(f)〜ReK(f)のうち、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)に対してのみ本発明を適用する場合について説明する。図15に示すように、PCA変換部351は、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)をPCA変換し、MDCT領域の主信号P(f)および副信号A(f)を得る。そして、適応的残差符号化部352−1〜352−Mは、上記実施の形態と同様にして、主信号P(f)および副信号A(f)に対して適応的残差符号化処理を施す。多重化部313は、適応的残差符号化部352−1〜352−Mから入力される符号化データCmおよびインジケータFmと、図14に示す量子化部302および量子化部308からそれぞれ入力されるLPCパラメータの量子化符号IqLおよびIqRとを多重化する。
一方、図16に示す復号装置の逆多重化部401は、ビットストリームに多重化された符号化データCmおよびインジケータFmを復号部402−1〜402−Mにそれぞれ出力する。また、逆多重化部401は、LPCパラメータの量子化符号IqLおよびIqRを、図17に示す逆量子化部451および逆量子化部455に出力する。復号部402−1〜402−Mは、上記実施の形態と同様にして、符号化データを復号し、MDCT領域の復号信号P〜 m(f)およびMDCT領域の復号信号A〜 m(f)を得る。逆PCA変換部403は、復号主信号P〜 m(f)および復号副信号A〜 m(f)を用いて、左信号のサブ帯域信号L〜 e1および右信号のサブ帯域信号R〜 e1を得る。左信号のサブ帯域信号L〜 e1は、図17に示す帯域結合部452に出力され、右信号のサブ帯域信号R〜 e1は、図17に示す帯域結合部456に出力される。
図17に示す逆量子化部451は、LPCパラメータの量子化符号IqLを逆量子化してLPCパラメータAdL(z)を得る。帯域結合部452は、左信号Le(f)のサブ帯域信号Le1(f)〜LeK(n)を結合し、MDCT領域の左信号L〜 e(f)を得る。F/T部453は、MDCT領域の左信号L〜 e(f)に対して逆MDCT(すなわち、周波数/時間領域変換)を行い、時間領域の左信号L〜 e(n)を得る。合成フィルタ454は、LPCパラメータAdL(z)を用いて、時間領域の左信号L〜 e(n)に対して合成フィルタを掛け、左信号L〜(n)を得る。
一方、図17に示す逆量子化部455、帯域結合部456、F/T部457および合成フィルタ458は、逆量子化部451、帯域結合部452、F/T部453および合成フィルタ454の一連の処理と同様の処理を量子化符号IqRおよび右信号Re(f)のサブ帯域信号Re1(f)〜ReK(n)に対して施すことにより、右信号R〜(n)を得る。
このように、ステレオ信号のLPC残差信号をMDCT領域に変換して、MDCT領域の信号を複数のサブ帯域に分割して、分割したサブ帯域の信号に対してPCA変換、適応的残差符号化を適用することで、サブ帯域毎に適した効率的な符号化を行うことができる。
また、上記実施の形態では、ステレオ信号をPCA変換する場合、量子化前のPCA変換パラメータ(すなわち、ステレオ信号から算出される共分散行列の固有ベクトルの各要素)を使用する場合について説明した。しかし、本発明では、PCA変換の際に使用するPCA変換パラメータとして、量子化後のPCA変換パラメータを用いてもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、最下位のレイヤである第1レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤでは主信号が副信号よりも重要な情報であるため、符号化装置は、第1レイヤにおいて、適応的残差符号化処理を省略し、常に主信号を選択してもよい。この場合、符号化装置は、第2レイヤ〜第Mレイヤまでのインジケータを送信すればよい。つまり、第1レイヤのインジケータを送信しなくてよいため、ビット割当情報を1ビット削減することができる。また、符号化装置は、第1レイヤにおいて、主信号および副信号の双方を符号化し、第2レイヤ以降の符号化レイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、例えば、最下位のレイヤである第1レイヤから所定の符号化レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤ〜第(i−1)レイヤ(iは2以上の自然数)では、符号化装置は、適応的残差符号化処理を省略し、常に主信号を選択してもよい。つまり、符号化装置は、第iレイヤ〜第Mレイヤで本発明を適用してもよい。また、符号化装置は、第1レイヤ〜第(i−1)レイヤにおいて、主信号および副信号の双方を符号化し、第iレイヤ〜第Mレイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、第1レイヤ〜第Mレイヤのうち1つ以上の任意の符号化レイヤで本発明を適用してもよい。
また、PCA変換は、KL変換(KLT:Karhunen Loeve Transform)と呼ばれることもある。
また、上記実施の形態に係る復号装置は、上記実施の形態に係る符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明した。しかし、本発明はこれに限定されず、上記実施の形態に係る復号装置が受信して処理するビットストリームは、上記実施の形態に係る復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであればよい。
また、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、例えば音声符号化装置および音声復号装置等として、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2008年5月30日出願の特願2008−143863および2008年6月19日出願の特願2008−160954の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および復号装置等は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
本発明は、主成分分析変換を適用する符号化装置、復号装置およびこれらの方法に関する。
従来の音声通信システムでは、限定された伝送帯域制限下でモノラル音声信号を送信する。通信ネットワークのブロードバンド化に伴い、音声通信に対するユーザの期待は、単なる明瞭さからステレオ音像(stereo image)と自然らしさの提供へと移行しており、ステレオ音声を提供するトレンドが出現している。そのため、ステレオ音声を効率的に送信するための符号化方式が望まれている。
前述の目標を達成するため、ステレオ信号(すなわち、2チャネル)または複数のチャネルの符号化方法として、主成分分析(PCA:Principal Component Analysis)を使用した符号化方法が検討されている(非特許文献1および非特許文献2)。PCAを使用した符号化方法では、入力信号をPCAによって変換(PCA変換)して、変換後の各信号をそれぞれ独立して符号化する。PCA変換は、入力信号の共分散行列から得られる固有値の分布に従って、入力信号におけるエネルギーの集中化を達成させる線形変換である。
例えば、PCAによって変換されたステレオ信号は、ステレオ信号の主要成分(例えば、主旋律のオーディオ信号成分または支配的な音声成分)に対応する主信号(principal signal)と、ステレオ信号の主信号以外の残りの成分に対応する副信号(secondary signal)とに変換される。つまり、ステレオ信号のエネルギーが主信号に集中化される。これにより、PCAを使用した符号化方法では、エネルギーを集中化させた信号を符号化することで、入力信号における冗長性を除去することができるため、符号化効率を向上させることができる。また、ステレオ信号における主信号と副信号とは、互いに無相関の関係があるため、さらに入力信号における冗長性を除去することができる。
図1および図2は、PCAを使用したステレオ信号コーデックの一般的な符号化装置および復号装置を示すブロック図である。図1に示す符号化装置において、PCA変換部11は、ステレオ信号における左信号L(n)および右信号R(n)を主信号P(n)および副信号A(n)に変換する(式(1))。
ここで、ν1およびν2は、左信号L(n)および右信号R(n)を主信号P(n)と副信号A(n)とに変換するために用いるPCA変換パラメータである。符号化部12および符号化部13は、主信号P(n)および副信号A(n)をそれぞれ独立して符号化(例えば、スカラ量子化またはベクトル量子化)し、主信号P(n)の符号化データおよび副信号A(n)の符号化データを多重化部15に出力する。また、量子化部14は、PCA変換部11で得られるPCA変換パラメータν1およびν2を量子化して、PCA変換パラメータの量子化符号を生成する。多重化部15は、主信号P(n)の符号化データと、副信号A(n)の符号化データと、PCA変換パラメータの量子化符号とを多重化して、ビットストリームを形成する。
図2に示す復号装置においてステレオ信号を復号する場合、逆多重化部21は、ビット
ストリームから主信号P(n)の符号化データ、副信号A(n)の符号化データおよびPCA変換パラメータの量子化符号を多重分離する。そして、復号部22は、主信号P(n)の符号化データを復号して復号主信号P
〜(n)を得る。また、復号部23は、副信号A(n)の符号化データを復号して復号副信号A
〜(n)を得る。また、逆量子化部24は、PCA変換パラメータの量子化符号を逆量子化して、PCA変換パラメータν
〜 1およびν
〜 2を得る。逆PCA変換部25は、PCA変換パラメータν
〜 1およびν
〜 2を用いて、主信号P
〜(n)および副信号A
〜(n)を逆PCA変換し、ステレオ信号の左信号L
〜(n)および右信号R
〜(n)を復元する(式(2))。
また、音声通信システムでは、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。スケーラブルな構成を有する音声符号化技術として、複数の符号化技術を階層的に統合するスケーラブル符号化(階層符号化)技術が検討されている。スケーラブル符号化技術においては、送信側は、入力音声信号に対して階層的な符号化処理を施し、複数の符号化レイヤに階層化された符号化データを伝送する。
また、音声通信システムでは、電波資源の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。低ビットレートの制約下では、上述したPCAを使用したステレオ信号符号化を行う場合、主信号および副信号の双方を共に高品質で符号化することは困難である。そのため、限られたビットを主信号および副信号で適切に割り当てる必要がある。例えば、非特許文献1および非特許文献2には、PCAを使用したステレオ信号符号化におけるビット割当方法が開示されている。
非特許文献1では、ステレオ信号の符号化処理において、パラメトリック符号化を副信号に対して適用する方法を開示している。すなわち、主信号および副信号において、主信号の符号化データの特性と副信号の特性との差に基づくパラメータ(パラメトリック符号化パラメータ)として副信号を表す。副信号をパラメトリック符号化することにより、副信号に含まれている冗長性が取り除かれるため、副信号のビットレートが減少する。このようにして、主信号の符号化データ、および、低ビットレートのパラメトリック符号化パラメータ(副信号)が限られたビットに割り当てられる。
非特許文献2では、入力信号がPCA変換されて得られる複数のチャネルそれぞれのエネルギーに応じてビットを適応的に割り当てるビット割当方法を開示している。例えば、ステレオ信号符号化処理において、ステレオ信号(すなわち、2チャネル)をPCA変換して得られる主信号および副信号それぞれのエネルギーに応じてビットを適応的に割り当てる。これにより、PCA変換後の複数のチャネルのうち、エネルギーがより高いチャネルを優先的に送信することができる。また、低ビットレートの制約下では、ステレオ信号を構成する複数のチャネルのうち、エネルギーがより低いチャネルを破棄することができる。このような送信方法は、チャネルスケーラビリティ送信方法(Channel scalability transmission method)と呼ばれる。
Manuel Briand, David Virette and Nadine Martin "Parametric coding of stereo audio based on principal component analysis", Proc of the 9thInternational Conference on Digital Audio Effects, Montreal, Canada, September 18-20, 2006.
Dai Yang, Hongmei Ai, Chris Kyriakakis and C.-C. Jay Kuo "High-fidelity multichannel audio coding with Karhunen Loeve Transform", IEEE transactions on speech and audio processing, Vol.11, No.4, July 2003.
しかしながら、ステレオ信号に対してスケーラブル符号化技術を用いるスケーラブル符号化システムにおいて、上述したビット割当方法を適用する場合、符号化装置が復号装置に通知すべきビット割当情報の情報量(ビット数)が多くなり、符号化効率が悪くなってしまう。
具体的には、非特許文献1に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、スケーラブル符号化された主信号に基づくパラメトリック符号化パラメータをスケーラブル符号化の符号化レイヤ毎に更新しなければならない。また、このパラメトリック符号化パラメータは、各符号化レイヤで所定のビット数を要する。すなわち、符号化装置は、符号化レイヤ毎に異なるパラメトリック符号化パラメータの情報量(ビット数)を示すビット割当情報を復号装置に通知することが必要となるため、符号化効率が悪くなる。
また、非特許文献2に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、ステレオ信号における主信号および副信号との間での割り当てビット数は、符号化レイヤ毎に異なる。そのため、符号化装置は、符号化レイヤ毎に、主信号および副信号それぞれに割り当てられたビット数を示すビット割当情報を復号装置に通知する必要があるため、符号化効率が悪くなる。
このように、スケーラブル符号化システムにおいて、ステレオ信号をPCA変換して得られる主信号と副信号との間でビット割り当てを行う場合、符号化レイヤ毎に所定のビット数のビット割当情報を通知することが必要となるため、復号信号に通知すべきビット割当情報の情報量が増大してしまう。
本発明の目的は、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、ビット割当情報の情報量を最小限に抑えつつ、高品質なステレオ信号を復元することができる符号化装置、復号装置およびこれらの方法を提供することである。
本発明の符号化装置は、入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して第1レイヤの主信号および第1レイヤの副信号を生成する変換手段と、第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、第m(mは1以上M以下の自然数)レイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、前記重要度が高い信号を選択する第mレイヤの選択手段と、第1レイヤから第Mレイヤにおいて、前記第mレイヤの選択手段で選択された信号を符号化して第mレイヤの符号化データを生成する第mレイヤの符号化手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの符号化データを復号して第mレイヤの復号信号を生成する第mレイヤの復号手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの選択手段で選択された信号から前記第mレイヤの復号信号を減じて得られる信号、および、前記第mレイヤの選択手段で選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する第mレイヤの減算手段と、第1レイヤから第Mレイヤまでの符号化データ
、および、第1レイヤから第Mレイヤまでの選択手段で選択された信号を示す信号情報を送信する送信手段と、を具備する構成を採る。
本発明によれば、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、符号化装置は、各符号化レイヤにおいて、ステレオ信号をPCA変換して得られる主信号および副信号の2つの信号のうち重要度が高い信号のみを符号化することにより、ビット割当情報の情報量を最小限に抑えつつ、復号装置は高品質なステレオ信号を復元することができる。
PCAを使用した一般的な符号化装置の構成を示すブロック図
PCAを使用した一般的な復号装置の構成を示すブロック図
本発明の実施の形態1に係る符号化装置の構成を示すブロック図
本発明の実施の形態1に係るPCA変換部の内部の構成を示すブロック図
本発明の実施の形態1に係る適応的残差符号化部の内部の構成を示すブロック図
本発明の実施の形態1に係る選択部の内部の構成を示すブロック図
本発明の実施の形態1に係る復号装置の構成を示すブロック図
本発明の実施の形態2に係る符号化装置の構成を示すブロック図
本発明の実施の形態2に係る帯域分割符号化部の内部の構成を示すブロック図
本発明の実施の形態2に係る帯域分割符号化部で形成される信号を示す図
本発明の実施の形態2に係る復号装置の構成を示すブロック図
本発明の実施の形態2に係る帯域分割復号部の内部の構成を示すブロック図
本発明のその他の選択処理を行う場合の選択部の構成を示すブロック図
本発明のLPC残差信号に対するMDCT後の信号を複数のサブ帯域に分割する処理を行う符号化装置の構成を示すブロック図
本発明のその他の符号化装置の構成を示すブロック図
本発明のその他の復号装置の構成を示すブロック図
本発明の複数のサブ帯域に分割された信号を結合する処理を行う復号装置の構成を示すブロック図
以下、本発明の各実施の形態について、図面を用いて説明する。
(実施の形態1)
図3は本実施の形態に係る符号化装置の構成を示すブロック図であり、図7は本実施の形態に係る復号装置の構成を示すブロック図である。本実施の形態に係る符号化装置および復号装置の構成として、Mレイヤのスケーラブル構成を一例として説明する。つまり、以下の説明では、スケーラブル符号化処理における符号化レイヤ数をM(Mは2以上の自然数)とする。図3に示す符号化装置100において、適応的残差符号化部102−1〜102−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。同様に、図7に示す復号装置200において、復号部202−1〜202−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。また、以下の説明では、ステレオ信号における左信号および右信号をNBサンプルずつ区切り(NBは自然数)、NBサンプルを1フレームとする。ここで、左信号および右信号は左信号L(n)および右信号R(n)で表される。nはNBサンプルずつ区切られた信号のうち、信号要素のn+1番目を示し、n=0〜NB−1とする。
図3に示す符号化装置100において、PCA変換部101には、ステレオ信号における左信号L(n)および右信号R(n)が入力される。PCA変換部101は、入力される左信号L(n)および右信号R(n)を、式(1)に従ってPCA変換を行い、第1レ
イヤの主信号P1(n)および第1レイヤの副信号A1(n)を生成する。そして、PCA変換部101は、第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)を適応的残差符号化部102−1に出力する。また、PCA変換部101は、PCA変換処理時に算出されるPCA変換パラメータν1およびν2を量子化部103に出力する。
適応的残差符号化部102−1〜102−Mは、それぞれに対応する符号化レイヤの主信号の重要度および副信号の重要度に基づいて、2つの信号のいずれか一方を適応的に選択し、選択した信号を符号化(適応的残差符号化:adaptive residue encoding)する。具体的には、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−m(mは1以上M以下の自然数)は、第mレイヤの主信号の重要度と、第mレイヤの副信号の重要度とを比較し、重要度が高い信号を選択し、選択された信号を符号化して第mレイヤの符号化データ(ビット列)を生成する。また、第1レイヤから第(M−1)レイヤにおいて、適応的残差符号化部102−mは、選択された信号から符号化データの復号信号を減じて得られる符号化残差(coding residue)信号および選択された信号以外の信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。また、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−mは、符号化された信号(主信号または副信号)を示す信号情報であるインジケータを生成する。例えば、インジケータに示される信号が主信号の場合、符号化された信号は第mレイヤの主信号であり、インジケータに示される信号が副信号の場合、符号化された信号は第mレイヤの副信号である。つまり、各符号化レイヤに設定された符号化データ用のビット列に割り当てられる信号を示すビット割当情報としてインジケータが生成される。
例えば、最下位レイヤ(第1レイヤ)に対応する、適応的残差符号化部102−1は、PCA変換部101から入力される第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)に対して適応的残差符号化処理を施して、第1レイヤの符号化データC1を生成する。また、適応的残差符号化部102−1は、入力信号(第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n))のうち符号化された信号(選択された信号)から符号化データC1の復号信号を減じて得られる符号化残差信号、および、入力信号(第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n))のうち符号化された信号(選択された信号)以外の信号(選択されなかった信号)を、第2レイヤの主信号P^2(n)および第2レイヤの副信号A^2(n)として生成する。また、適応的残差符号化部102−1は、第1レイヤにおいて符号化された信号(第1レイヤの主信号P1(n)または第1レイヤの副信号A1(n))を示すインジケータF1を生成する。そして、適応的残差符号化部102−1は、第2レイヤの主信号P^2(n)および第2レイヤの副信号A^2(n)を、次の符号化レイヤ(第2レイヤ)に対応する適応的残差符号化部102−2に出力し、インジケータF1および符号化データC1を多重化部104に出力する。
同様に、適応的残差符号化部102−2には、適応的残差符号化部102−1から第2レイヤの主信号P^2(n)および第2レイヤの副信号A^2(n)が入力される。そして、適応的残差符号化部102−2は、適応的残差符号化部102−1と同様にして、第2レイヤの符号化データC2、第3レイヤの主信号P^3(n)、第3レイヤの副信号A^3(n)、および、インジケータF2を生成する。そして、適応的残差符号化部102−2は、第3レイヤの主信号P^3(n)および第3レイヤの副信号A^3(n)を次の符号化レイヤ(第3レイヤ)に対応する適応的残差符号化部102−3に出力し、インジケータF2および符号化データC2を多重化部104に出力する。適応的残差符号化部102−3〜102−Mについても同様である。ただし、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、次の符号化レイヤの主信号および副信号として符号化残差信号を出力しない。すなわち、第1レイヤから第(M−1)レイヤにおいてのみ、つまり、適応的残差符号化部102−1〜102−(M−1)のみが、選択された信号から
符号化データの復号信号を減じて得られる符号化残差信号および選択されなかった信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。
量子化部103は、PCA変換部101から入力されるPCA変換パラメータν1およびν2を量子化してPCA変換パラメータの量子化符号を生成する。そして、量子化部103は、PCA変換パラメータの量子化符号を多重化部104に出力する。
多重化部104は、適応的残差符号化部102−1〜102−Mそれぞれから入力される符号化データCmおよびインジケータFmと、量子化部103から入力される量子化符号とを多重化してビットストリームを形成する。得られたビットストリームは、通信路を介して復号装置200(図7)に送信される。
図4はPCA変換部101の内部構成を示すブロック図である。共分散行列算出部1011は、ステレオ信号におけるフレーム単位の左信号L(n)および右信号R(n)を用いて、共分散行列を算出し、算出された共分散行列を固有ベクトル算出部1012に出力する。
固有ベクトル算出部1012は、共分散行列算出部1011から入力される共分散行列を用いて、共分散行列の固有ベクトルを算出する。ここで、固有ベクトル算出部1012で算出される固有ベクトルの各要素がPCA変換パラメータν1およびν2となる。そして、固有ベクトル算出部1012は、算出された固有ベクトル(PCA変換パラメータ)をPCA変換行列形成部1013および図3に示す量子化部103に出力する。
PCA変換行列形成部1013は、固有ベクトル算出部1012から入力される固有ベクトルを用いてPCA変換行列を形成し、形成されたPCA変換行列を変換部1014に出力する。
変換部1014は、PCA変換行列形成部1013から入力されるPCA変換行列を用いて、ステレオ信号における左信号L(n)および右信号R(n)を第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)に変換する(式(1)。ただし、P1(n)=P(n)、A1(n)=A(n))。
次に、適応的残差符号化部102−1〜102−Mにおける適応的残差符号化処理の一例として、第mレイヤに対応する適応的残差符号化部102−mの内部構成について図5を用いて説明する。図5は、適応的残差符号化部102−mの内部構成を示すブロック図である。図5に示す適応的残差符号化部102−mには、1つ下位の第(m−1)レイヤに対応する適応的残差符号化部102−(m−1)から、第mレイヤの主信号P^m(n)および第mレイヤの副信号A^m(n)が入力される。具体的には、図5に示す選択部1021−mおよび符号化部1022−mに、第mレイヤの主信号P^m(n)および第mレイヤの副信号A^m(n)が入力される。また、図5に示す減算器1024−mには第mレイヤの主信号P^m(n)が入力され、減算器1025−mには第mレイヤの副信号A^m(n)が入力される。ただし、図5に示す第1レイヤに対応する適応的残差符号化部102−mには、PCA変換部101から第1レイヤの主信号P1(n)および第1レイヤの副信号A1(n)が入力される。なお、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、図5に示す選択部1021−mおよび符号化部1022−mのみを備え、復号部1023−m、減算器1024−mおよび減算器1025−mを備えない。すなわち、適応的残差符号化部102−Mは、インジケータFmおよび符号化データCmのみを出力する。
図5に示す適応的残差符号化部102−mにおいて、選択部1021−mは、入力され
る第mレイヤの主信号P^m(n)のエネルギーと、第mレイヤの副信号A^m(n)のエネルギーとを比較し、エネルギーがより高い信号を選択する。そして、選択部1021−mは、選択された信号(主信号または副信号)を示すインジケータFmを符号化部1022−m、復号部1023−mおよび図3に示す多重化部104に出力する。
符号化部1022−mは、入力される第mレイヤの主信号P^m(n)および第mレイヤの副信号A^m(n)のうち、選択部1021−mから入力されるインジケータFmに示される信号、つまり、選択部1021−mで選択された信号を符号化して第mレイヤの符号化データCmを生成する。具体的には、符号化部1022−mは、インジケータFmに示される信号が主信号の場合、第mレイヤの主信号P^m(n)を符号化し、インジケータFmに示される信号が副信号の場合、第mレイヤの副信号A^m(n)を符号化する。そして、符号化部1022−mは、生成された第mレイヤの符号化データCmを復号部1023−mおよび図3に示す多重化部104に出力する。
復号部1023−mは、選択部1021−mから入力されるインジケータFmに基づいて、符号化部1022−mから入力される符号化データCmを特定し、符号化データCmを復号して第mレイヤの復号信号を生成する。ここで、復号部1023−mは、インジケータFmに示される信号以外の信号の復号信号を0とする。そして、復号部1023−mは、生成される第mレイヤの復号信号のうち、主信号の復号信号を減算器1024−mに出力し、副信号の復号信号を減算器1025−mに出力する。具体的には、復号部1023−mは、インジケータFmに示される信号が主信号である場合、第mレイヤの符号化データCmを用いて第mレイヤの主信号P^m(n)を復号する。そして、復号部1023−mは、主信号の復号信号P〜 m(n)を減算器1024−mに出力する一方、副信号の復号信号A〜 m(n)として「0」を減算器1025−mに出力する。これに対し、復号部1023−mは、インジケータFmに示される信号が副信号である場合、符号化データCmを用いて第mレイヤの副信号A^m(n)を復号する。そして、復号部1023−mは、副信号の復号信号A〜 m(n)を減算器1025−mに出力する一方、主信号の復号信号P〜 m(n)として「0」を減算器1024−mに出力する。
減算器1024−mは、入力信号である第mレイヤの主信号P^m(n)から、復号部1023−mから入力される主信号の復号信号P〜 m(n)を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。そして、減算器1024−mは、第(m+1)レイヤの主信号P^m+1(n)を次の符号化レイヤである第(m+1)レイヤに対応する適応的残差符号化部102−(m+1)に出力する。
減算器1025−mは、入力信号である第mレイヤの副信号A^m(n)から、復号部1023−mから入力される副信号の復号信号A〜 m(n)を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。そして、減算器1025−mは、第(m+1)レイヤの副信号A^m+1(n)を適応的残差符号化部102−(m+1)に出力する。
例えば、選択部1021−mで主信号が選択された場合、減算器1024−mは、第mレイヤの主信号P^m(n)から符号化データCmの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。また、減算器1025−mは、第mレイヤの副信号A^m(n)を第(m+1)レイヤの副信号A^m+1(n)として生成する。一方、選択部1021−mで副信号が選択された場合、減算器1025−mは、第mレイヤの副信号A^m(n)から符号化データCmの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。また、減算器1024−mは、第mレイヤの主信号P^m(n)を第(m+1)レイヤの主信号P^m+1(n)として生成する。
次に、選択部1021−mの内部構成について図6を用いて説明する。図6は、選択部1021−mの内部構成を示すブロック図である。
図6に示す選択部1021−mにおいて、エネルギー計算部1201−mは、第mレイヤの主信号P^
m(n)のエネルギーE
P^mを式(3)に従って計算する。そして、エネルギー計算部1201−mは、計算されたエネルギーE
P^mを比較部1203−mに出力する。
エネルギー計算部1202−mは、第mレイヤの副信号A^
m(n)のエネルギーE
A^mを式(4)に従って計算する。そして、エネルギー計算部1202−mは、計算されたエネルギーE
A^mを比較部1203−mに出力する。
比較部1203−mは、エネルギー計算部1201−mから入力されるエネルギーEP^mと、エネルギー計算部1202−mから入力されるエネルギーEA^mとを比較する。そして、比較部1203−mは、より大きいエネルギーに対応する信号(主信号または副信号)を第mレイヤにおいて符号化する信号として選択する。例えば、比較部1203−mは、エネルギーEP^mがエネルギーEA^m以上の場合、第mレイヤにおいて符号化される信号として主信号(すなわち、第mレイヤの主信号P^m(n))を選択する。一方、比較部1203−mは、エネルギーEP^mがエネルギーEA^m未満の場合、第mレイヤにおいて符号化される信号として副信号(すなわち、第mレイヤの副信号A^m(n))を選択する。そして、比較部1203−mは、選択された信号、つまり、第mレイヤにおいて符号化される信号(主信号または副信号)を示すインジケータFmを生成する。
上述したように、本実施の形態における符号化装置100は、符号化レイヤ毎に、主信号および副信号のいずれか一方の信号のみを符号化する。そのため、各符号化レイヤにおけるビット割当情報であるインジケータの情報量(ビット数)は、主信号と副信号とを区別するための1ビットでよい。
なお、上述した選択部1021−mは、主信号および副信号のエネルギーの算出を対数領域で行ってもよい。また、選択部1021−mは、主信号および副信号のエネルギーの算出に、左信号L(n)および右信号R(n)を利用してもよく、例えば左信号L(n)および右信号R(n)のエネルギーを用いてもよい。また、選択部1021−mは、マスキングを考慮して主信号および副信号のエネルギーを算出してもよい。
次に、図7に示す復号装置200について説明する。復号装置200は、通信路を介して符号化装置100から送信されるビットストリームを受信する。図7に示す復号装置200において、逆多重化部201は、ビットストリームを、第1レイヤ〜第Mレイヤそれぞれの符号化レイヤに対応する符号化データCmおよびインジケータFmと、PCA変換パラメータの量子化符号とに分離する。そして、逆多重化部201は、各符号化レイヤに対応する符号化データCmおよびインジケータFmを、第1レイヤ〜第Mレイヤそれぞれ
対応する復号部202−1〜202−Mに出力する。また、逆多重化部201は、PCA変換パラメータの量子化符号を逆量子化部205に出力する。
復号部202−1〜202−Mは、それぞれ逆多重化部201から入力されるインジケータFmに基づいて、逆多重化部201から入力される符号化データを復号する。例えば、復号部202−mは、インジケータFmに示される信号が主信号である場合、符号化データCmを用いて主信号を復号する。そして、復号部202−mは、復号信号P〜 m(n)を加算器203に出力する。一方、復号部202−mは、インジケータFmに示される信号が副信号である場合、符号化データCmを用いて副信号を復号する。そして、復号部202−mは、復号信号A〜 m(n)を加算器204に出力する。また、復号部202−mは、インジケータFmに示される信号以外の信号の復号信号として「0」を加算器203または加算器204に出力する。
加算器203は、復号部202−1〜202−Mからそれぞれ入力される復号信号P〜 m(n)を加算する。そして、加算器203は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号主信号P〜(n)を逆PCA変換部206に出力する。
加算器204は、復号部202−1〜202−Mからそれぞれ入力される復号信号A〜 m(n)を加算する。そして、加算器204は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号副信号A〜(n)を逆PCA変換部206に出力する。
なお、通信路の状況等によって、ビットストリームの一部が廃棄されてしまう場合がある。例えば、ビットストリームに第mレイヤ(m<M)までの符号化データしか含まれていない場合には、第1レイヤ〜第mレイヤまでの復号部が動作するとともに、これら符号化レイヤに対応する加算器203、204が動作して、復号主信号P〜(n)および復号副信号A〜(n)が求められ、復号主信号P〜(n)および復号副信号A〜(n)が逆PCA変換部206に出力される。
逆量子化部205は、逆多重化部201から入力される量子化符号を逆量子化し、得られるPCA変換パラメータν〜 1およびν〜 2を逆PCA変換部206に出力する。
逆PCA変換部206には、加算器203から復号主信号P〜(n)が入力され、加算器204から復号副信号A〜(n)が入力され、逆量子化部205からPCA変換パラメータν〜 1およびν〜 2が入力される。逆PCA変換部206は、復号主信号P〜(n)および復号副信号A〜(n)を、PCA変換パラメータν〜 1およびν〜 2を用いて、式(2)に従って逆PCA変換(inverse PCA transformation)し、ステレオ信号における左信号L〜(n)および右信号R〜(n)を得る。
このように、本実施の形態によれば、符号化装置100(図3)は、各符号化レイヤにおいて、主信号および副信号のうち、エネルギーがより高い信号のみを符号化対象として選択する。この結果、各符号化レイヤで符号化される信号は、主信号または副信号のいずれか1つのみであるため、符号化された信号(ビット列に割り当てられた信号)を示すインジケータの情報量(ビット数)は、1ビットのみでよい。つまり、符号化装置100は、各符号化レイヤにおける符号化データのビット割当情報を最小限に抑えることができる。
また、スケーラブル符号化においては、各符号化レイヤにおける主信号および副信号として、下位の符号化レイヤにおける符号化残差信号が入力される。そのため、各符号化レ
イヤにおける入力信号のエネルギーは、下位の符号化レイヤにおける符号化結果に依存して変化する。よって、符号化装置100(図3)が、各符号化レイヤにおいてエネルギーがより高い信号(重要度がより高い信号)を、下位の符号化レイヤにおける符号化結果に応じて適応的に選択することができる。これにより、復号装置200(図7)は、高品質なステレオ信号を復元することができる。
(実施の形態2)
実施の形態1では最下位レイヤである第1レイヤの主信号および副信号に対して適応的残差符号化処理を施したのに対し、本実施の形態では、第1レイヤの主信号に対して、第1レイヤをさらに階層化して分割周波数帯域単位の符号化を行う帯域分割符号化処理を施す。
分割周波数帯域単位のスケーラブル符号化方法としては、例えば、入力信号を複数の帯域に分割し、分割した帯域の信号単位で符号化することでスケーラブル符号化を実現する方法(例えば、米国特許出願公開第2008/0004883号明細書参照)、および、ITU−T勧告G.729.1のレイヤ4以降の符号化(TDAC:Time-Domain Aliasing Cancellation)において、MDCT係数上でサブ帯域単位の符号化を行い、エネルギーの大きいサブ帯域から優先的に符号化データを伝送することでスケーラブル符号化を実現する方法(ITU−T勧告G.729.1(2006)参照)等が検討されている。
帯域分割符号化に基づくスケーラブル符号化において、下位レイヤで符号化対象となる帯域の信号の符号化後の誤差信号(符号化残差信号)が大きい場合には、符号化残差信号が聴感的な復号音質に与える影響は、より上位の符号化レイヤで符号化対象となる帯域の信号が聴感的な復号音質に与える影響よりも大きい。
そこで、本実施の形態では、帯域分割符号化対象の符号化レイヤにおいて、各符号化レイヤより下位レイヤの符号化残差信号を符号化するか否かを適応的に判定する。
図8は本実施の形態に係る符号化装置の構成を示すブロック図である。なお、図8において図3に示す符号化装置100と同一の構成部には同一符号を付し、説明を省略する。
図8に示す符号化装置500において、PCA変換部101は、第1レイヤの主信号P1(n)を帯域分割符号化部501に出力し、第1レイヤの副信号A1(n)を第2レイヤの副信号A^2(n)として適応的残差符号化部102−2に出力する。
帯域分割符号化部501は、PCA変換部101から入力される主信号P1(n)を複数の帯域に分割し、分割した分割帯域単位の信号に対して階層的に符号化を行う。ここで、帯域分割符号化部501が第1レイヤから第Lレイヤ(Lは2以上の自然数)までの符号化を行う場合、適応的残差符号化部102−2〜102−Mは第(L+1)レイヤ以降の符号化を順次行う。そして、帯域分割符号化部501は、第Lレイヤまでの各符号化レイヤで生成された符号化データを含む符号化データCS、および、第1レイヤの符号化対象の帯域をさらに分割した各帯域(サブ帯域)で生成された判定結果を含むインジケータFSを多重化部104に出力する。また、帯域分割符号化部501は、符号化後の符号化残差信号を適応的残差符号化部102−2の入力信号P^2(n)として適応的残差符号化部102−2に出力する。
図9は、図8に示す帯域分割符号化部501の内部構成のうち、第1レイヤの符号化処理に関する構成部および第2レイヤ符号化処理に関する構成部への入力信号形成処理に関する構成部を示すブロック図である。
図9に示す帯域分割符号化部501において、帯域分割部551は、PCA変換部101(図8)から入力される第1レイヤの主信号P1(n)を、第1レイヤの符号化対象の第1帯域の信号である第1帯域信号S1と、第1帯域信号S1以外の信号S”1とに分割する。例えば、帯域分割部551は、第1レイヤの主信号P1(n)の周波数帯域のうち低域部から所定の周波数帯域までの信号を第1帯域信号S1とする。そして、帯域分割部551は、第1帯域信号S1をサブ帯域分割部552および符号化部553に出力し、第1帯域信号以外の信号S”1を信号形成部558に出力する。
サブ帯域分割部552は、帯域分割部551から入力される第1帯域信号S1を複数のサブ帯域信号S1,sb(sb=1,2,…,Nsb、Nsbはサブ帯域分割数)に分割する。そして、サブ帯域分割部552は、分割したサブ帯域信号S1,sbを評価部556および残差算出部557に出力する。
符号化部553は、帯域分割部551から入力される第1帯域信号S1を予め設定された符号化ビットレートで符号化して第1レイヤ符号化データを生成する。そして、符号化部553は、生成した第1レイヤ符号化データを復号部554に出力するとともに、多重化部104(図8)に出力する。
復号部554は、符号化部553から入力される第1レイヤ符号化データを復号して第1レイヤ復号信号S〜 1を生成する。そして、復号部554は、生成した第1レイヤ復号信号S〜 1をサブ帯域分割部555に出力する。
サブ帯域分割部555は、サブ帯域分割部552と同様にして、復号部554から入力される第1レイヤ復号信号S〜 1を複数のサブ帯域信号S〜 1,sbに分割する。そして、サブ帯域分割部555は、分割したサブ帯域信号S〜 1,sbを評価部556および残差算出部557に出力する。
評価部556は、サブ帯域分割部552から入力されるサブ帯域信号S
1,sbおよびサブ帯域分割部555から入力されるサブ帯域信号S
〜 1,sbを用いて、サブ帯域毎の符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、まず、評価部556は、サブ帯域信号S
1,sbおよびサブ帯域信号S
〜 1,sbを用いて、サブ帯域毎の第1レイヤにおける符号化性能に関する評価値を算出する。例えば、評価部556は、評価値として各サブ帯域の符号化残差信号に対するSNR(Signal to Noise Ratio)を用いる。具体的には、評価部556は、第sbサブ帯域におけるSNR
sbを式(5)に従って算出する。ただし、第sbサブ帯域におけるサブ帯域信号のサンプル数をP
1,sbとする。
そして、評価部556は、算出した各サブ帯域における符号化性能に関する評価値(SNR)に基づき、符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、評価部556は、各サブ帯域のSNRsbと所定の閾値SNRthrとを比較して、下記の第sbサブ帯域における判定結果F1,sbを生成する。
F1,sb = 1 if SNRsb < SNRthr
F1,sb = 0 else
つまり、評価部556は、各サブ帯域における評価値(SNR)が所定の閾値より小さい場合(すなわち、符号化残差エネルギーが所定の閾値より大きい場合)、判定結果F1,sbを「1」とし、評価値(SNR)が所定の閾値以上の場合(すなわち、符号化残差エネルギーが所定の閾値以下の場合)、判定結果F1,sbを「0」とする。ここで、評価部556は、SNRthrを予め設定してもよく、入力信号の特性に基づいて設定してもよく、サブ帯域毎に設定してもよい。そして、評価部556は、各サブ帯域の判定結果F1,sbを残差算出部557に出力するとともに、多重化部104(図8)に出力する。
残差算出部557は、評価部556から入力される判定結果F1,sbに基づいて、各サブ帯域における符号化残差信号を算出する。具体的には、残差算出部557は、判定結果F1,sbが「1」である第sbサブ帯域では、サブ帯域分割部552から入力されるサブ帯域信号S1,sbから、サブ帯域分割部555から入力されるサブ帯域信号S〜 1,sbを減じて第sbサブ帯域における符号化残差信号を算出する。一方、残差算出部557は、判定結果F1,sbが「0」である第sbサブ帯域では符号化残差信号を算出しない。そして、残差算出部557は、判定結果F1,sbが「1」であるサブ帯域のみに符号化残差信号を有する第1帯域全体の符号化残差信号Sr1を信号形成部558に出力する。
信号形成部558は、残差算出部557から入力される符号化残差信号Sr1と帯域分割部551から入力される信号S”1とを加算して信号S’1を形成する。すなわち、信号S’1は、第1レイヤの主信号P1(n)の周波数帯域において、第1帯域に符号化残差信号Sr1を有し、第1帯域以外の周波数帯域に信号S”1を有する。そして、信号形成部558は、生成した信号S’1を第2レイヤの符号化処理に関する構成部(図示せず)に出力する。
また、帯域分割符号化部501は、信号形成部558から出力された信号S’1を第2レイヤの入力信号として用いる。そして、第2レイヤでは、帯域分割符号化部501は、第1レイヤと同様にして、入力信号を、第2レイヤで符号化対象とする第2帯域の信号と第2帯域の信号以外の信号とに分割し、第2帯域の信号を予め設定された符号化ビットレートで符号化する。また、帯域分割符号化部501は、第2帯域の信号以外の信号を、第3レイヤの入力信号として用いる。ここで、帯域分割符号化部501は、第1帯域の一部を含む周波数帯域を第2帯域とする。そこで、帯域分割符号化部501は、第2帯域の信号のうち、第1帯域の一部に対応する周波数帯域の信号を優先的に符号化する。具体的には、帯域分割符号化部501は、第2帯域に含まれる第1帯域のうち、サブ帯域の判定結果F1,sbが「1」であるサブ帯域の一部またはすべての符号化残差信号を優先的に符号化する。第3レイヤ以降についても同様である。そして、帯域分割符号化部501は、すべての符号化レイヤの符号化データを含む符号化データCSおよび第1帯域の各サブ帯域の判定結果F1,sbを含むインジケータFSを多重化部104に出力する。
次いで、信号形成部558で形成した信号S’1を図10に示す。図10に示すように、第1レイヤの符号化対象である第1帯域では、判定結果F1,sbが「1」であるサブ帯域のみに符号化レイヤ残差信号が存在する。例えば、図10に示すように、判定結果F1,1が「1」である第1サブ帯域(sb=1)では、符号化残差信号(S1,1−S〜 1,1)が存在し、判定結果F1,3が「1」である第3サブ帯域(sb=3)では、符号化残差信号(S1,3−S〜 1,3)が存在する。一方、判定結果F1,2が「0」である第2サブ帯域(sb=2)および判定結果F1,4が「0」である第4サブ帯域(sb=4)では、符号化残差信号が存在しない。また、第1レイヤの符号化対象ではない帯域では、第1レイヤの主信号P1(n)の第1帯域以外の周波数帯域の信号S”1がそのまま存在する。
これにより、帯域分割符号化部501は、第1帯域の各サブ帯域のうち、符号化残差エネルギーが閾値より大きいサブ帯域の符号化残差信号を入力信号として上位レイヤに出力する。よって、帯域分割符号化部501は、下位レイヤで得る符号化残差信号のうち、符号化残差エネルギーがより高い信号(重要度がより高い信号)のみを上位レイヤで符号化する符号化残差信号として適応的に選択することができる。
次に、本実施の形態に係る復号装置について説明する。図11は復号装置600の構成を示すブロック図である。なお、図11において図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図11に示す復号装置600において、帯域分割復号部601には、逆多重化部201から、符号化装置500の帯域分割符号化部501で生成された各符号化レイヤの符号化データを含む符号化データCSおよび第1レイヤの複数のサブ帯域の判定結果F1、sbを含むインジケータFSが入力される。帯域分割復号部601は、判定結果F1、sbに基づいて、符号化データCSを復号する。具体的には、帯域分割復号部601は、逆多重化部201から入力される各符号化レイヤの符号化データを復号し、生成される復号信号と上位レイヤで生成した復号信号とを加算して各符号化レイヤの復号信号を形成する。そして、帯域分割復号部601は、帯域分割符号化処理を適用した符号化レイヤのうち最下位レイヤである第1レイヤの復号信号を復号信号P〜 1(n)として加算器203に出力する。
図12は、図11に示す帯域分割復号部601の内部構成のうち、第2レイヤの復号信号S〜’1を用いて、最下位レイヤである第1レイヤの復号信号P〜 1(n)を生成する復号処理に関する構成部を示すブロック図である。
図12に示す帯域分割復号部601において、復号部651は、逆多重化部201(図11)から入力される符号化データCSに含まれる第1レイヤ符号化データを復号する。そして、復号部651は、第1レイヤの復号信号S〜 1を帯域復号信号形成部653に出力する。
残差信号分離部652は、逆多重化部201から入力される判定結果F1,sbに基づいて、第2レイヤの復号処理に関する構成部(図示せず)から入力される第2レイヤの復号信号S〜’1(すなわち、第2レイヤから第Lレイヤで復号された復号信号)を第1帯域の復号残差信号S〜 r1と第1帯域以外の周波数帯域の復号信号S〜”1とに分離する。そして、残差信号分離部652は、第1帯域の復号残差信号S〜 r1を帯域復号信号形成部653に出力し、第1帯域以外の周波数帯域の復号信号S〜”1を復号信号形成部654に出力する。
帯域復号信号形成部653は、逆多重化部201から入力される判定結果F1,sbに基づいて、復号部651から入力される復号信号S〜 1および残差信号分離部652から入力される復号残差信号S〜 r1を加算することで、第1帯域の復号信号を形成する。具体的には、帯域復号信号形成部653は、復号信号S〜 1と、復号残差信号S〜 r1における判定結果F1,sbが「1」であるサブ帯域の復号残差信号とを加算する。そして、帯域復号信号形成部653は、形成した第1帯域の復号信号を復号信号形成部654に出力する。
復号信号形成部654は、帯域復号信号形成部653から入力される第1帯域の復号信号、および、残差信号分離部652から入力される第1帯域以外の周波数帯域の復号信号S〜”1を用いて復号信号P〜 1(n)を形成する。そして、復号信号形成部654は、
形成した復号信号P〜 1(n)を加算器203(図11)に出力する。
このように、本実施の形態によれば、符号化装置500(図8)は、主信号P1(n)に対して帯域分割符号化に基づくスケーラブル符号化を適用し、ステレオ符号化において聴感的に重要である周波数帯域(特に低域)の信号を適応的に選択して符号化するため、符号化歪をより低減することができる。よって、復号装置600(図11)は、復号音質を向上することができる。
また、本実施の形態によれば、第1レイヤの符号化対象である第1帯域の各サブ帯域のうち、評価値(SNR)が所定の閾値より小さいサブ帯域、つまり、符号化残差エネルギーが所定量より大きいサブ帯域のみを上位レイヤの符号化対象の信号とする。すなわち、各符号化レイヤにおいてエネルギーがより高いサブ帯域の信号(聴感的に重要度がより高いサブ帯域の信号)のみが上位レイヤに入力される。よって、符号化装置500では、帯域分割符号化部501内の各符号化レイヤにおいて、下位レイヤにおける符号化結果に応じて符号化残差エネルギーがより高い信号(重要度がより高い信号)を適応的に符号化するため、復号装置600(図11)は、高品質なステレオ信号を復元することができる。
なお、本実施の形態において、各符号化レイヤにおける符号化対象の信号は、時間領域信号でもよく、周波数領域信号(例えば、MDCT変換後の係数)でもよい。
また、本実施の形態では、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する符号化レイヤは、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに限定されない。例えば、符号化装置は、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤに対して帯域分割符号化処理を適用してもよい。
また、本実施の形態では、PCA変換後の主信号に対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する信号はPCA変換後の主信号に限定されない。例えば、符号化装置は、PCA変換後の副信号、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤにおける符号化残差信号、または、PCA変換後の信号以外の任意の入力信号に対して帯域分割符号化処理を適用してもよい。また、符号化装置は、帯域分割符号化処理と適応的残差符号化処理とを組み合わせず、帯域分割符号化処理を単独で適用してもよい。
また、本実施の形態では、帯域分割符号化部において、入力信号の低域部から所定の周波数帯域までの予め設定した周波数帯域を、各符号化レイヤにおける符号化対象の周波数帯域とする場合について説明した。しかし、本発明では、各符号化レイヤにおける符号化対象の周波数帯域として、例えば、入力信号の特性に応じた周波数帯域を適応的に設定してもよい。
また、本実施の形態では、符号化装置が判定結果F1,sbに基づいて第1帯域の各サブ帯域の符号化残差信号を算出するか否かを決定する場合について説明した。しかし、本発明では、符号化装置は判定結果F1,sbによらず第1帯域のすべてのサブ帯域の符号化残差信号を算出してもよい。
以上、本発明の各実施の形態について説明した。
なお、上記実施の形態では、信号の重要度の指標として、信号のエネルギーを用いる場合について説明した。しかし、本発明では、信号の重要度は、信号のエネルギーに限らず
、例えば、信号の信号対雑音比(Signal to Noise Ratio:SNR)でもよい。信号の重要度の指標としてSNRを用いる場合の適応的残差符号化部102−mの選択部3021−mの内部構成について図13のブロック図を用いて説明する。図13に示す選択部3021−mにおいて、符号化部3201−mは、第mレイヤの主信号P^
m(n)を符号化して符号化データを生成し、復号部3202−mは、第mレイヤの主信号P^
m(n)の符号化データを復号して第mレイヤの主信号の復号信号P
〜 m(n)を生成する。そして、減算器3203−mは、第mレイヤの主信号P^
m(n)から第mレイヤの主信号の復号信号P
〜 m(n)を減じて、第(m+1)レイヤの主信号P^
m+1(n)を生成する。逆PCA変換部3204−mは、第(m+1)レイヤの主信号P^
m+1(n)および第mレイヤの副信号A^
m(n)を逆PCA変換して、左信号L^
m1(n)および右信号R^
m1(n)を得る。すなわち、符号化部3201−m、復号部3202−m、減算器3203−mおよび逆PCA変換部3204−mは、第mレイヤの主信号P^
m(n)が符号化された場合(すなわち、選択部3021−mが主信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^
m1(n)および右信号R^
m1(n))を生成する。そして、測定値算出部3205−mは、左信号L^
m1(n)および右信号R^
m1(n)を用いて定量的測定値M
1(すなわち、SNR)を算出する(式(6))。
同様にして、符号化部3206−m、復号部3207−m、減算器3208−mおよび逆PCA変換部3209−mは、第mレイヤの副信号A^
m(n)が符号化された場合(すなわち、選択部3021−mが副信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^
m2(n)および右信号R^
m2(n))を生成する。そして、測定値算出部3210−mは、左信号L^
m2(n)および右信号R^
m2(n)を用いて定量的測定値M
2(すなわち、SNR)を算出する(式(7))。
比較部3211−mは、定量的測定値M1および定量的測定値M2を比較し、より大きい値の定量的測定値に対応する信号(主信号または副信号)を符号化される信号として選択し、選択された信号を示すインジケータFmを出力する。つまり、選択部3021−mは、主信号を符号化した際に復号装置200で得られる出力ステレオ信号、および、副信号を符号化した際に復号装置200で得られる出力ステレオ信号を選択部3021−mの内部で生成する。これにより、選択部3021−mは、定量的測定値として、復号装置200におけるSNRを算出することができる。よって、選択部3021−mは、復号装置200におけるSNRがより高い信号を選択するため、上記実施の形態と同様、ビット割当情報を通知するための情報量を最小限に抑えつつ、符号化効率を向上することができる。なお、信号の重要度を示す定量的測定値は式(6)および式(7)より算出されるSN
Rに限らず、例えば、マスク対雑音比(Mask to Noise Ratio:MNR)でもよい。例えば、ステレオ信号の重要度としてMNRを用いる場合、ステレオ信号における左信号L(n)および右信号R(n)の心理音響的モデル化を含む処理を経て導出することができる。
また、上記実施の形態では、時間領域のステレオ信号に対して本発明を適用する場合について説明した。しかし、本発明は、時間領域のステレオ信号に限らず、別の領域のステレオ信号に対して本発明を適用してもよい。例えば、MDCT(Modified Discrete Cosine Transform)領域のステレオ信号、または、ステレオ信号にLPC分析を施したLPC(Linear Prediction Coefficients)残差信号に対して本発明を適用してもよい。また、本発明は、例えば、MDCT領域のLPC残差信号に対して適用してもよい。
また、本発明に係る符号化装置は、入力信号の帯域を複数のサブ帯域(sub band)に分割し、入力信号の各サブ帯域の信号であるサブ帯域信号に対して本発明を適用してもよい。例えば、入力信号であるステレオ信号の左信号L(n)および右信号R(n)を、K個のサブ帯域に分割して、左信号L(n)のサブ帯域信号Lk(n)(k=1〜K)、および、右信号R(n)のサブ帯域信号Rk(n)(k=1〜K)を得る。
例えば、ステレオ信号において、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割した場合について、図14〜図17を用いて説明する。なお、図14は、符号化装置のうち、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割する処理に関する構成部300を示し、図15は、符号化装置のうち、本発明に係る符号化処理に関する構成部350を示す。同様に、図16は、復号装置のうち、本発明に係る復号処理に関する構成部400を示し、図17は、復号装置のうち、複数のサブ帯域信号に分割されたMDCT領域のLPC残差信号を結合してステレオ信号を復元する処理に関する構成部450を示す。なお、図14〜図17において図3に示す符号化装置100または図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図14において、LPC分析部301は、ステレオ信号における左信号L(n)を用いて線形予測分析を行い、左信号L(n)のスペクトルの概形を示すLPCパラメータ(線形予測パラメータ)AL(z)を得る。量子化部302は、LPCパラメータAL(z)を量子化して量子化符号IqLを得る。逆量子化部303は、LPCパラメータの量子化符号IqLを逆量子化し、復号LPCパラメータAdL(z)を得る。逆フィルタ304は、左信号L(n)に対し、復号LPCパラメータAdL(z)を用いて逆フィルタリング(LPC逆フィルタリング)を施すことにより、スペクトルの概形の特徴が取り除かれたフィルタリング後の左信号Le(n)を得る。T/F部305は、逆フィルタリング後の左信号Le(n)に対してMDCT(すなわち、時間/周波数領域変換)を行い、時間領域の左信号Le(n)をMDCT領域(周波数領域)の左信号Le(f)を得る。つまり、左信号のMDCT領域のLPC残差信号Le(f)が得られる。
帯域分割部306は、左信号のMDCT領域のLPC残差信号Le(f)を複数のサブ帯域(ここでは、K個のサブ帯域)に分割し、左信号Le(f)のサブ帯域信号Le1(f)〜LeK(f)を生成する。
一方、図14に示すLPC分析部307、量子化部308、逆量子化部309、逆フィルタ310、T/F部311および帯域分割部312は、LPC分析部301から帯域分割部306までの一連の処理と同様の処理を右信号R(n)に施すことで、右信号Re(f)のサブ帯域信号Re1(f)〜ReK(f)を生成する。
ここで、例えば、左信号Le(f)のサブ帯域信号Le1(f)〜LeK(f)および
右信号Re(f)のサブ帯域信号Re1(f)〜ReK(f)のうち、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)に対してのみ本発明を適用する場合について説明する。図15に示すように、PCA変換部351は、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)をPCA変換し、MDCT領域の主信号P(f)および副信号A(f)を得る。そして、適応的残差符号化部352−1〜352−Mは、上記実施の形態と同様にして、主信号P(f)および副信号A(f)に対して適応的残差符号化処理を施す。多重化部313は、適応的残差符号化部352−1〜352−Mから入力される符号化データCmおよびインジケータFmと、図14に示す量子化部302および量子化部308からそれぞれ入力されるLPCパラメータの量子化符号IqLおよびIqRとを多重化する。
一方、図16に示す復号装置の逆多重化部401は、ビットストリームに多重化された符号化データCmおよびインジケータFmを復号部402−1〜402−Mにそれぞれ出力する。また、逆多重化部401は、LPCパラメータの量子化符号IqLおよびIqRを、図17に示す逆量子化部451および逆量子化部455に出力する。復号部402−1〜402−Mは、上記実施の形態と同様にして、符号化データを復号し、MDCT領域の復号信号P〜 m(f)およびMDCT領域の復号信号A〜 m(f)を得る。逆PCA変換部403は、復号主信号P〜 m(f)および復号副信号A〜 m(f)を用いて、左信号のサブ帯域信号L〜 e1および右信号のサブ帯域信号R〜 e1を得る。左信号のサブ帯域信号L〜 e1は、図17に示す帯域結合部452に出力され、右信号のサブ帯域信号R〜 e1は、図17に示す帯域結合部456に出力される。
図17に示す逆量子化部451は、LPCパラメータの量子化符号IqLを逆量子化してLPCパラメータAdL(z)を得る。帯域結合部452は、左信号Le(f)のサブ帯域信号Le1(f)〜LeK(n)を結合し、MDCT領域の左信号L〜 e(f)を得る。F/T部453は、MDCT領域の左信号L〜 e(f)に対して逆MDCT(すなわち、周波数/時間領域変換)を行い、時間領域の左信号L〜 e(n)を得る。合成フィルタ454は、LPCパラメータAdL(z)を用いて、時間領域の左信号L〜 e(n)に対して合成フィルタを掛け、左信号L〜(n)を得る。
一方、図17に示す逆量子化部455、帯域結合部456、F/T部457および合成フィルタ458は、逆量子化部451、帯域結合部452、F/T部453および合成フィルタ454の一連の処理と同様の処理を量子化符号IqRおよび右信号Re(f)のサブ帯域信号Re1(f)〜ReK(n)に対して施すことにより、右信号R〜(n)を得る。
このように、ステレオ信号のLPC残差信号をMDCT領域に変換して、MDCT領域の信号を複数のサブ帯域に分割して、分割したサブ帯域の信号に対してPCA変換、適応的残差符号化を適用することで、サブ帯域毎に適した効率的な符号化を行うことができる。
また、上記実施の形態では、ステレオ信号をPCA変換する場合、量子化前のPCA変換パラメータ(すなわち、ステレオ信号から算出される共分散行列の固有ベクトルの各要素)を使用する場合について説明した。しかし、本発明では、PCA変換の際に使用するPCA変換パラメータとして、量子化後のPCA変換パラメータを用いてもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、最下位のレイヤである第1レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤでは主信号が副信号よりも重要な情報であるため、符号化装置は、第1レイヤにおいて、適
応的残差符号化処理を省略し、常に主信号を選択してもよい。この場合、符号化装置は、第2レイヤ〜第Mレイヤまでのインジケータを送信すればよい。つまり、第1レイヤのインジケータを送信しなくてよいため、ビット割当情報を1ビット削減することができる。また、符号化装置は、第1レイヤにおいて、主信号および副信号の双方を符号化し、第2レイヤ以降の符号化レイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、例えば、最下位のレイヤである第1レイヤから所定の符号化レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤ〜第(i−1)レイヤ(iは2以上の自然数)では、符号化装置は、適応的残差符号化処理を省略し、常に主信号を選択してもよい。つまり、符号化装置は、第iレイヤ〜第Mレイヤで本発明を適用してもよい。また、符号化装置は、第1レイヤ〜第(i−1)レイヤにおいて、主信号および副信号の双方を符号化し、第iレイヤ〜第Mレイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、第1レイヤ〜第Mレイヤのうち1つ以上の任意の符号化レイヤで本発明を適用してもよい。
また、PCA変換は、KL変換(KLT:Karhunen Loeve Transform)と呼ばれることもある。
また、上記実施の形態に係る復号装置は、上記実施の形態に係る符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明した。しかし、本発明はこれに限定されず、上記実施の形態に係る復号装置が受信して処理するビットストリームは、上記実施の形態に係る復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであればよい。
また、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、例えば音声符号化装置および音声復号装置等として、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2008年5月30日出願の特願2008−143863および2008年6月19日出願の特願2008−160954の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および復号装置等は、携帯電話、IP電話、テレビ会議等に用いるに好適である。