JPWO2009144953A1 - 符号化装置、復号装置およびこれらの方法 - Google Patents

符号化装置、復号装置およびこれらの方法 Download PDF

Info

Publication number
JPWO2009144953A1
JPWO2009144953A1 JP2010514382A JP2010514382A JPWO2009144953A1 JP WO2009144953 A1 JPWO2009144953 A1 JP WO2009144953A1 JP 2010514382 A JP2010514382 A JP 2010514382A JP 2010514382 A JP2010514382 A JP 2010514382A JP WO2009144953 A1 JPWO2009144953 A1 JP WO2009144953A1
Authority
JP
Japan
Prior art keywords
signal
layer
encoding
sub
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010514382A
Other languages
English (en)
Other versions
JP5383676B2 (ja
Inventor
ゾンシアン リウ
ゾンシアン リウ
コク セン チョン
コク セン チョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2010514382A priority Critical patent/JP5383676B2/ja
Publication of JPWO2009144953A1 publication Critical patent/JPWO2009144953A1/ja
Application granted granted Critical
Publication of JP5383676B2 publication Critical patent/JP5383676B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

ステレオ信号に対してスケーラブル符号化技術を用いる場合に、ビット割当情報の情報量を最小限に抑えつつ、高品質なステレオ信号を復元することができる符号化装置。この装置において、PCA変換部(101)は、ステレオ信号の左信号および右信号をPCA変換して第1レイヤの主信号および第1レイヤの副信号を生成する。第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、適応的残差符号化部(102−m)(mは1以上M以下の自然数)は、第mレイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、重要度が高い信号を選択し、選択された信号を符号化して第mレイヤの符号化データを生成する。第1レイヤから第M−1レイヤにおいて、適応的残差符号化部(102−m)は、選択された信号から第mレイヤの符号化データの復号信号を減じて得られる信号、および、選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する。

Description

本発明は、主成分分析変換を適用する符号化装置、復号装置およびこれらの方法に関する。
従来の音声通信システムでは、限定された伝送帯域制限下でモノラル音声信号を送信する。通信ネットワークのブロードバンド化に伴い、音声通信に対するユーザの期待は、単なる明瞭さからステレオ音像(stereo image)と自然らしさの提供へと移行しており、ステレオ音声を提供するトレンドが出現している。そのため、ステレオ音声を効率的に送信するための符号化方式が望まれている。
前述の目標を達成するため、ステレオ信号(すなわち、2チャネル)または複数のチャネルの符号化方法として、主成分分析(PCA:Principal Component Analysis)を使用した符号化方法が検討されている(非特許文献1および非特許文献2)。PCAを使用した符号化方法では、入力信号をPCAによって変換(PCA変換)して、変換後の各信号をそれぞれ独立して符号化する。PCA変換は、入力信号の共分散行列から得られる固有値の分布に従って、入力信号におけるエネルギーの集中化を達成させる線形変換である。
例えば、PCAによって変換されたステレオ信号は、ステレオ信号の主要成分(例えば、主旋律のオーディオ信号成分または支配的な音声成分)に対応する主信号(principal signal)と、ステレオ信号の主信号以外の残りの成分に対応する副信号(secondary signal)とに変換される。つまり、ステレオ信号のエネルギーが主信号に集中化される。これにより、PCAを使用した符号化方法では、エネルギーを集中化させた信号を符号化することで、入力信号における冗長性を除去することができるため、符号化効率を向上させることができる。また、ステレオ信号における主信号と副信号とは、互いに無相関の関係があるため、さらに入力信号における冗長性を除去することができる。
図1および図2は、PCAを使用したステレオ信号コーデックの一般的な符号化装置および復号装置を示すブロック図である。図1に示す符号化装置において、PCA変換部11は、ステレオ信号における左信号L(n)および右信号R(n)を主信号P(n)および副信号A(n)に変換する(式(1))。
Figure 2009144953
ここで、νおよびνは、左信号L(n)および右信号R(n)を主信号P(n)と副信号A(n)とに変換するために用いるPCA変換パラメータである。符号化部12および符号化部13は、主信号P(n)および副信号A(n)をそれぞれ独立して符号化(例えば、スカラ量子化またはベクトル量子化)し、主信号P(n)の符号化データおよび副信号A(n)の符号化データを多重化部15に出力する。また、量子化部14は、PCA変換部11で得られるPCA変換パラメータνおよびνを量子化して、PCA変換パラメータの量子化符号を生成する。多重化部15は、主信号P(n)の符号化データと、副信号A(n)の符号化データと、PCA変換パラメータの量子化符号とを多重化して、ビットストリームを形成する。
図2に示す復号装置においてステレオ信号を復号する場合、逆多重化部21は、ビットストリームから主信号P(n)の符号化データ、副信号A(n)の符号化データおよびPCA変換パラメータの量子化符号を多重分離する。そして、復号部22は、主信号P(n)の符号化データを復号して復号主信号P(n)を得る。また、復号部23は、副信号A(n)の符号化データを復号して復号副信号A(n)を得る。また、逆量子化部24は、PCA変換パラメータの量子化符号を逆量子化して、PCA変換パラメータν およびν を得る。逆PCA変換部25は、PCA変換パラメータν およびν を用いて、主信号P(n)および副信号A(n)を逆PCA変換し、ステレオ信号の左信号L(n)および右信号R(n)を復元する(式(2))。
Figure 2009144953
また、音声通信システムでは、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。スケーラブルな構成を有する音声符号化技術として、複数の符号化技術を階層的に統合するスケーラブル符号化(階層符号化)技術が検討されている。スケーラブル符号化技術においては、送信側は、入力音声信号に対して階層的な符号化処理を施し、複数の符号化レイヤに階層化された符号化データを伝送する。
また、音声通信システムでは、電波資源の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。低ビットレートの制約下では、上述したPCAを使用したステレオ信号符号化を行う場合、主信号および副信号の双方を共に高品質で符号化することは困難である。そのため、限られたビットを主信号および副信号で適切に割り当てる必要がある。例えば、非特許文献1および非特許文献2には、PCAを使用したステレオ信号符号化におけるビット割当方法が開示されている。
非特許文献1では、ステレオ信号の符号化処理において、パラメトリック符号化を副信号に対して適用する方法を開示している。すなわち、主信号および副信号において、主信号の符号化データの特性と副信号の特性との差に基づくパラメータ(パラメトリック符号化パラメータ)として副信号を表す。副信号をパラメトリック符号化することにより、副信号に含まれている冗長性が取り除かれるため、副信号のビットレートが減少する。このようにして、主信号の符号化データ、および、低ビットレートのパラメトリック符号化パラメータ(副信号)が限られたビットに割り当てられる。
非特許文献2では、入力信号がPCA変換されて得られる複数のチャネルそれぞれのエネルギーに応じてビットを適応的に割り当てるビット割当方法を開示している。例えば、ステレオ信号符号化処理において、ステレオ信号(すなわち、2チャネル)をPCA変換して得られる主信号および副信号それぞれのエネルギーに応じてビットを適応的に割り当てる。これにより、PCA変換後の複数のチャネルのうち、エネルギーがより高いチャネルを優先的に送信することができる。また、低ビットレートの制約下では、ステレオ信号を構成する複数のチャネルのうち、エネルギーがより低いチャネルを破棄することができる。このような送信方法は、チャネルスケーラビリティ送信方法(Channel scalability transmission method)と呼ばれる。
Manuel Briand, David Virette and Nadine Martin "Parametric coding of stereo audio based on principal component analysis", Proc of the 9thInternational Conference on Digital Audio Effects, Montreal, Canada, September 18-20, 2006. Dai Yang, Hongmei Ai, Chris Kyriakakis and C.-C. Jay Kuo "High-fidelity multichannel audio coding with Karhunen Loeve Transform", IEEE transactions on speech and audio processing, Vol.11, No.4, July 2003.
しかしながら、ステレオ信号に対してスケーラブル符号化技術を用いるスケーラブル符号化システムにおいて、上述したビット割当方法を適用する場合、符号化装置が復号装置に通知すべきビット割当情報の情報量(ビット数)が多くなり、符号化効率が悪くなってしまう。
具体的には、非特許文献1に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、スケーラブル符号化された主信号に基づくパラメトリック符号化パラメータをスケーラブル符号化の符号化レイヤ毎に更新しなければならない。また、このパラメトリック符号化パラメータは、各符号化レイヤで所定のビット数を要する。すなわち、符号化装置は、符号化レイヤ毎に異なるパラメトリック符号化パラメータの情報量(ビット数)を示すビット割当情報を復号装置に通知することが必要となるため、符号化効率が悪くなる。
また、非特許文献2に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、ステレオ信号における主信号および副信号との間での割り当てビット数は、符号化レイヤ毎に異なる。そのため、符号化装置は、符号化レイヤ毎に、主信号および副信号それぞれに割り当てられたビット数を示すビット割当情報を復号装置に通知する必要があるため、符号化効率が悪くなる。
このように、スケーラブル符号化システムにおいて、ステレオ信号をPCA変換して得られる主信号と副信号との間でビット割り当てを行う場合、符号化レイヤ毎に所定のビット数のビット割当情報を通知することが必要となるため、復号信号に通知すべきビット割当情報の情報量が増大してしまう。
本発明の目的は、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、ビット割当情報の情報量を最小限に抑えつつ、高品質なステレオ信号を復元することができる符号化装置、復号装置およびこれらの方法を提供することである。
本発明の符号化装置は、入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して第1レイヤの主信号および第1レイヤの副信号を生成する変換手段と、第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、第m(mは1以上M以下の自然数)レイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、前記重要度が高い信号を選択する第mレイヤの選択手段と、第1レイヤから第Mレイヤにおいて、前記第mレイヤの選択手段で選択された信号を符号化して第mレイヤの符号化データを生成する第mレイヤの符号化手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの符号化データを復号して第mレイヤの復号信号を生成する第mレイヤの復号手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの選択手段で選択された信号から前記第mレイヤの復号信号を減じて得られる信号、および、前記第mレイヤの選択手段で選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する第mレイヤの減算手段と、第1レイヤから第Mレイヤまでの符号化データ、および、第1レイヤから第Mレイヤまでの選択手段で選択された信号を示す信号情報を送信する送信手段と、を具備する構成を採る。
本発明によれば、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、符号化装置は、各符号化レイヤにおいて、ステレオ信号をPCA変換して得られる主信号および副信号の2つの信号のうち重要度が高い信号のみを符号化することにより、ビット割当情報の情報量を最小限に抑えつつ、復号装置は高品質なステレオ信号を復元することができる。
PCAを使用した一般的な符号化装置の構成を示すブロック図 PCAを使用した一般的な復号装置の構成を示すブロック図 本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係るPCA変換部の内部の構成を示すブロック図 本発明の実施の形態1に係る適応的残差符号化部の内部の構成を示すブロック図 本発明の実施の形態1に係る選択部の内部の構成を示すブロック図 本発明の実施の形態1に係る復号装置の構成を示すブロック図 本発明の実施の形態2に係る符号化装置の構成を示すブロック図 本発明の実施の形態2に係る帯域分割符号化部の内部の構成を示すブロック図 本発明の実施の形態2に係る帯域分割符号化部で形成される信号を示す図 本発明の実施の形態2に係る復号装置の構成を示すブロック図 本発明の実施の形態2に係る帯域分割復号部の内部の構成を示すブロック図 本発明のその他の選択処理を行う場合の選択部の構成を示すブロック図 本発明のLPC残差信号に対するMDCT後の信号を複数のサブ帯域に分割する処理を行う符号化装置の構成を示すブロック図 本発明のその他の符号化装置の構成を示すブロック図 本発明のその他の復号装置の構成を示すブロック図 本発明の複数のサブ帯域に分割された信号を結合する処理を行う復号装置の構成を示すブロック図
以下、本発明の各実施の形態について、図面を用いて説明する。
(実施の形態1)
図3は本実施の形態に係る符号化装置の構成を示すブロック図であり、図7は本実施の形態に係る復号装置の構成を示すブロック図である。本実施の形態に係る符号化装置および復号装置の構成として、Mレイヤのスケーラブル構成を一例として説明する。つまり、以下の説明では、スケーラブル符号化処理における符号化レイヤ数をM(Mは2以上の自然数)とする。図3に示す符号化装置100において、適応的残差符号化部102−1〜102−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。同様に、図7に示す復号装置200において、復号部202−1〜202−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。また、以下の説明では、ステレオ信号における左信号および右信号をNBサンプルずつ区切り(NBは自然数)、NBサンプルを1フレームとする。ここで、左信号および右信号は左信号L(n)および右信号R(n)で表される。nはNBサンプルずつ区切られた信号のうち、信号要素のn+1番目を示し、n=0〜NB−1とする。
図3に示す符号化装置100において、PCA変換部101には、ステレオ信号における左信号L(n)および右信号R(n)が入力される。PCA変換部101は、入力される左信号L(n)および右信号R(n)を、式(1)に従ってPCA変換を行い、第1レイヤの主信号P(n)および第1レイヤの副信号A(n)を生成する。そして、PCA変換部101は、第1レイヤの主信号P(n)および第1レイヤの副信号A(n)を適応的残差符号化部102−1に出力する。また、PCA変換部101は、PCA変換処理時に算出されるPCA変換パラメータνおよびνを量子化部103に出力する。
適応的残差符号化部102−1〜102−Mは、それぞれに対応する符号化レイヤの主信号の重要度および副信号の重要度に基づいて、2つの信号のいずれか一方を適応的に選択し、選択した信号を符号化(適応的残差符号化:adaptive residue encoding)する。具体的には、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−m(mは1以上M以下の自然数)は、第mレイヤの主信号の重要度と、第mレイヤの副信号の重要度とを比較し、重要度が高い信号を選択し、選択された信号を符号化して第mレイヤの符号化データ(ビット列)を生成する。また、第1レイヤから第(M−1)レイヤにおいて、適応的残差符号化部102−mは、選択された信号から符号化データの復号信号を減じて得られる符号化残差(coding residue)信号および選択された信号以外の信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。また、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−mは、符号化された信号(主信号または副信号)を示す信号情報であるインジケータを生成する。例えば、インジケータに示される信号が主信号の場合、符号化された信号は第mレイヤの主信号であり、インジケータに示される信号が副信号の場合、符号化された信号は第mレイヤの副信号である。つまり、各符号化レイヤに設定された符号化データ用のビット列に割り当てられる信号を示すビット割当情報としてインジケータが生成される。
例えば、最下位レイヤ(第1レイヤ)に対応する、適応的残差符号化部102−1は、PCA変換部101から入力される第1レイヤの主信号P(n)および第1レイヤの副信号A(n)に対して適応的残差符号化処理を施して、第1レイヤの符号化データCを生成する。また、適応的残差符号化部102−1は、入力信号(第1レイヤの主信号P(n)および第1レイヤの副信号A(n))のうち符号化された信号(選択された信号)から符号化データCの復号信号を減じて得られる符号化残差信号、および、入力信号(第1レイヤの主信号P(n)および第1レイヤの副信号A(n))のうち符号化された信号(選択された信号)以外の信号(選択されなかった信号)を、第2レイヤの主信号P^(n)および第2レイヤの副信号A^(n)として生成する。また、適応的残差符号化部102−1は、第1レイヤにおいて符号化された信号(第1レイヤの主信号P(n)または第1レイヤの副信号A(n))を示すインジケータFを生成する。そして、適応的残差符号化部102−1は、第2レイヤの主信号P^(n)および第2レイヤの副信号A^(n)を、次の符号化レイヤ(第2レイヤ)に対応する適応的残差符号化部102−2に出力し、インジケータFおよび符号化データCを多重化部104に出力する。
同様に、適応的残差符号化部102−2には、適応的残差符号化部102−1から第2レイヤの主信号P^(n)および第2レイヤの副信号A^(n)が入力される。そして、適応的残差符号化部102−2は、適応的残差符号化部102−1と同様にして、第2レイヤの符号化データC、第3レイヤの主信号P^(n)、第3レイヤの副信号A^(n)、および、インジケータFを生成する。そして、適応的残差符号化部102−2は、第3レイヤの主信号P^(n)および第3レイヤの副信号A^(n)を次の符号化レイヤ(第3レイヤ)に対応する適応的残差符号化部102−3に出力し、インジケータFおよび符号化データCを多重化部104に出力する。適応的残差符号化部102−3〜102−Mについても同様である。ただし、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、次の符号化レイヤの主信号および副信号として符号化残差信号を出力しない。すなわち、第1レイヤから第(M−1)レイヤにおいてのみ、つまり、適応的残差符号化部102−1〜102−(M−1)のみが、選択された信号から符号化データの復号信号を減じて得られる符号化残差信号および選択されなかった信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。
量子化部103は、PCA変換部101から入力されるPCA変換パラメータνおよびνを量子化してPCA変換パラメータの量子化符号を生成する。そして、量子化部103は、PCA変換パラメータの量子化符号を多重化部104に出力する。
多重化部104は、適応的残差符号化部102−1〜102−Mそれぞれから入力される符号化データCおよびインジケータFと、量子化部103から入力される量子化符号とを多重化してビットストリームを形成する。得られたビットストリームは、通信路を介して復号装置200(図7)に送信される。
図4はPCA変換部101の内部構成を示すブロック図である。共分散行列算出部1011は、ステレオ信号におけるフレーム単位の左信号L(n)および右信号R(n)を用いて、共分散行列を算出し、算出された共分散行列を固有ベクトル算出部1012に出力する。
固有ベクトル算出部1012は、共分散行列算出部1011から入力される共分散行列を用いて、共分散行列の固有ベクトルを算出する。ここで、固有ベクトル算出部1012で算出される固有ベクトルの各要素がPCA変換パラメータνおよびνとなる。そして、固有ベクトル算出部1012は、算出された固有ベクトル(PCA変換パラメータ)をPCA変換行列形成部1013および図3に示す量子化部103に出力する。
PCA変換行列形成部1013は、固有ベクトル算出部1012から入力される固有ベクトルを用いてPCA変換行列を形成し、形成されたPCA変換行列を変換部1014に出力する。
変換部1014は、PCA変換行列形成部1013から入力されるPCA変換行列を用いて、ステレオ信号における左信号L(n)および右信号R(n)を第1レイヤの主信号P(n)および第1レイヤの副信号A(n)に変換する(式(1)。ただし、P(n)=P(n)、A(n)=A(n))。
次に、適応的残差符号化部102−1〜102−Mにおける適応的残差符号化処理の一例として、第mレイヤに対応する適応的残差符号化部102−mの内部構成について図5を用いて説明する。図5は、適応的残差符号化部102−mの内部構成を示すブロック図である。図5に示す適応的残差符号化部102−mには、1つ下位の第(m−1)レイヤに対応する適応的残差符号化部102−(m−1)から、第mレイヤの主信号P^(n)および第mレイヤの副信号A^(n)が入力される。具体的には、図5に示す選択部1021−mおよび符号化部1022−mに、第mレイヤの主信号P^(n)および第mレイヤの副信号A^(n)が入力される。また、図5に示す減算器1024−mには第mレイヤの主信号P^(n)が入力され、減算器1025−mには第mレイヤの副信号A^(n)が入力される。ただし、図5に示す第1レイヤに対応する適応的残差符号化部102−mには、PCA変換部101から第1レイヤの主信号P(n)および第1レイヤの副信号A(n)が入力される。なお、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、図5に示す選択部1021−mおよび符号化部1022−mのみを備え、復号部1023−m、減算器1024−mおよび減算器1025−mを備えない。すなわち、適応的残差符号化部102−Mは、インジケータFおよび符号化データCのみを出力する。
図5に示す適応的残差符号化部102−mにおいて、選択部1021−mは、入力される第mレイヤの主信号P^(n)のエネルギーと、第mレイヤの副信号A^(n)のエネルギーとを比較し、エネルギーがより高い信号を選択する。そして、選択部1021−mは、選択された信号(主信号または副信号)を示すインジケータFを符号化部1022−m、復号部1023−mおよび図3に示す多重化部104に出力する。
符号化部1022−mは、入力される第mレイヤの主信号P^(n)および第mレイヤの副信号A^(n)のうち、選択部1021−mから入力されるインジケータFに示される信号、つまり、選択部1021−mで選択された信号を符号化して第mレイヤの符号化データCを生成する。具体的には、符号化部1022−mは、インジケータFに示される信号が主信号の場合、第mレイヤの主信号P^(n)を符号化し、インジケータFに示される信号が副信号の場合、第mレイヤの副信号A^(n)を符号化する。そして、符号化部1022−mは、生成された第mレイヤの符号化データCを復号部1023−mおよび図3に示す多重化部104に出力する。
復号部1023−mは、選択部1021−mから入力されるインジケータFに基づいて、符号化部1022−mから入力される符号化データCを特定し、符号化データCを復号して第mレイヤの復号信号を生成する。ここで、復号部1023−mは、インジケータFに示される信号以外の信号の復号信号を0とする。そして、復号部1023−mは、生成される第mレイヤの復号信号のうち、主信号の復号信号を減算器1024−mに出力し、副信号の復号信号を減算器1025−mに出力する。具体的には、復号部1023−mは、インジケータFに示される信号が主信号である場合、第mレイヤの符号化データCを用いて第mレイヤの主信号P^(n)を復号する。そして、復号部1023−mは、主信号の復号信号P (n)を減算器1024−mに出力する一方、副信号の復号信号A (n)として「0」を減算器1025−mに出力する。これに対し、復号部1023−mは、インジケータFに示される信号が副信号である場合、符号化データCを用いて第mレイヤの副信号A^(n)を復号する。そして、復号部1023−mは、副信号の復号信号A (n)を減算器1025−mに出力する一方、主信号の復号信号P (n)として「0」を減算器1024−mに出力する。
減算器1024−mは、入力信号である第mレイヤの主信号P^(n)から、復号部1023−mから入力される主信号の復号信号P (n)を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。そして、減算器1024−mは、第(m+1)レイヤの主信号P^m+1(n)を次の符号化レイヤである第(m+1)レイヤに対応する適応的残差符号化部102−(m+1)に出力する。
減算器1025−mは、入力信号である第mレイヤの副信号A^(n)から、復号部1023−mから入力される副信号の復号信号A (n)を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。そして、減算器1025−mは、第(m+1)レイヤの副信号A^m+1(n)を適応的残差符号化部102−(m+1)に出力する。
例えば、選択部1021−mで主信号が選択された場合、減算器1024−mは、第mレイヤの主信号P^(n)から符号化データCの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。また、減算器1025−mは、第mレイヤの副信号A^(n)を第(m+1)レイヤの副信号A^m+1(n)として生成する。一方、選択部1021−mで副信号が選択された場合、減算器1025−mは、第mレイヤの副信号A^(n)から符号化データCの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。また、減算器1024−mは、第mレイヤの主信号P^(n)を第(m+1)レイヤの主信号P^m+1(n)として生成する。
次に、選択部1021−mの内部構成について図6を用いて説明する。図6は、選択部1021−mの内部構成を示すブロック図である。
図6に示す選択部1021−mにおいて、エネルギー計算部1201−mは、第mレイヤの主信号P^(n)のエネルギーEP^mを式(3)に従って計算する。そして、エネルギー計算部1201−mは、計算されたエネルギーEP^mを比較部1203−mに出力する。
Figure 2009144953
エネルギー計算部1202−mは、第mレイヤの副信号A^(n)のエネルギーEA^mを式(4)に従って計算する。そして、エネルギー計算部1202−mは、計算されたエネルギーEA^mを比較部1203−mに出力する。
Figure 2009144953
比較部1203−mは、エネルギー計算部1201−mから入力されるエネルギーEP^mと、エネルギー計算部1202−mから入力されるエネルギーEA^mとを比較する。そして、比較部1203−mは、より大きいエネルギーに対応する信号(主信号または副信号)を第mレイヤにおいて符号化する信号として選択する。例えば、比較部1203−mは、エネルギーEP^mがエネルギーEA^m以上の場合、第mレイヤにおいて符号化される信号として主信号(すなわち、第mレイヤの主信号P^(n))を選択する。一方、比較部1203−mは、エネルギーEP^mがエネルギーEA^m未満の場合、第mレイヤにおいて符号化される信号として副信号(すなわち、第mレイヤの副信号A^(n))を選択する。そして、比較部1203−mは、選択された信号、つまり、第mレイヤにおいて符号化される信号(主信号または副信号)を示すインジケータFを生成する。
上述したように、本実施の形態における符号化装置100は、符号化レイヤ毎に、主信号および副信号のいずれか一方の信号のみを符号化する。そのため、各符号化レイヤにおけるビット割当情報であるインジケータの情報量(ビット数)は、主信号と副信号とを区別するための1ビットでよい。
なお、上述した選択部1021−mは、主信号および副信号のエネルギーの算出を対数領域で行ってもよい。また、選択部1021−mは、主信号および副信号のエネルギーの算出に、左信号L(n)および右信号R(n)を利用してもよく、例えば左信号L(n)および右信号R(n)のエネルギーを用いてもよい。また、選択部1021−mは、マスキングを考慮して主信号および副信号のエネルギーを算出してもよい。
次に、図7に示す復号装置200について説明する。復号装置200は、通信路を介して符号化装置100から送信されるビットストリームを受信する。図7に示す復号装置200において、逆多重化部201は、ビットストリームを、第1レイヤ〜第Mレイヤそれぞれの符号化レイヤに対応する符号化データCおよびインジケータFと、PCA変換パラメータの量子化符号とに分離する。そして、逆多重化部201は、各符号化レイヤに対応する符号化データCおよびインジケータFを、第1レイヤ〜第Mレイヤそれぞれ対応する復号部202−1〜202−Mに出力する。また、逆多重化部201は、PCA変換パラメータの量子化符号を逆量子化部205に出力する。
復号部202−1〜202−Mは、それぞれ逆多重化部201から入力されるインジケータFに基づいて、逆多重化部201から入力される符号化データを復号する。例えば、復号部202−mは、インジケータFに示される信号が主信号である場合、符号化データCを用いて主信号を復号する。そして、復号部202−mは、復号信号P (n)を加算器203に出力する。一方、復号部202−mは、インジケータFに示される信号が副信号である場合、符号化データCを用いて副信号を復号する。そして、復号部202−mは、復号信号A (n)を加算器204に出力する。また、復号部202−mは、インジケータFに示される信号以外の信号の復号信号として「0」を加算器203または加算器204に出力する。
加算器203は、復号部202−1〜202−Mからそれぞれ入力される復号信号P (n)を加算する。そして、加算器203は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号主信号P(n)を逆PCA変換部206に出力する。
加算器204は、復号部202−1〜202−Mからそれぞれ入力される復号信号A (n)を加算する。そして、加算器204は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号副信号A(n)を逆PCA変換部206に出力する。
なお、通信路の状況等によって、ビットストリームの一部が廃棄されてしまう場合がある。例えば、ビットストリームに第mレイヤ(m<M)までの符号化データしか含まれていない場合には、第1レイヤ〜第mレイヤまでの復号部が動作するとともに、これら符号化レイヤに対応する加算器203、204が動作して、復号主信号P(n)および復号副信号A(n)が求められ、復号主信号P(n)および復号副信号A(n)が逆PCA変換部206に出力される。
逆量子化部205は、逆多重化部201から入力される量子化符号を逆量子化し、得られるPCA変換パラメータν およびν を逆PCA変換部206に出力する。
逆PCA変換部206には、加算器203から復号主信号P(n)が入力され、加算器204から復号副信号A(n)が入力され、逆量子化部205からPCA変換パラメータν およびν が入力される。逆PCA変換部206は、復号主信号P(n)および復号副信号A(n)を、PCA変換パラメータν およびν を用いて、式(2)に従って逆PCA変換(inverse PCA transformation)し、ステレオ信号における左信号L(n)および右信号R(n)を得る。
このように、本実施の形態によれば、符号化装置100(図3)は、各符号化レイヤにおいて、主信号および副信号のうち、エネルギーがより高い信号のみを符号化対象として選択する。この結果、各符号化レイヤで符号化される信号は、主信号または副信号のいずれか1つのみであるため、符号化された信号(ビット列に割り当てられた信号)を示すインジケータの情報量(ビット数)は、1ビットのみでよい。つまり、符号化装置100は、各符号化レイヤにおける符号化データのビット割当情報を最小限に抑えることができる。
また、スケーラブル符号化においては、各符号化レイヤにおける主信号および副信号として、下位の符号化レイヤにおける符号化残差信号が入力される。そのため、各符号化レイヤにおける入力信号のエネルギーは、下位の符号化レイヤにおける符号化結果に依存して変化する。よって、符号化装置100(図3)が、各符号化レイヤにおいてエネルギーがより高い信号(重要度がより高い信号)を、下位の符号化レイヤにおける符号化結果に応じて適応的に選択することができる。これにより、復号装置200(図7)は、高品質なステレオ信号を復元することができる。
(実施の形態2)
実施の形態1では最下位レイヤである第1レイヤの主信号および副信号に対して適応的残差符号化処理を施したのに対し、本実施の形態では、第1レイヤの主信号に対して、第1レイヤをさらに階層化して分割周波数帯域単位の符号化を行う帯域分割符号化処理を施す。
分割周波数帯域単位のスケーラブル符号化方法としては、例えば、入力信号を複数の帯域に分割し、分割した帯域の信号単位で符号化することでスケーラブル符号化を実現する方法(例えば、米国特許出願公開第2008/0004883号明細書参照)、および、ITU−T勧告G.729.1のレイヤ4以降の符号化(TDAC:Time-Domain Aliasing Cancellation)において、MDCT係数上でサブ帯域単位の符号化を行い、エネルギーの大きいサブ帯域から優先的に符号化データを伝送することでスケーラブル符号化を実現する方法(ITU−T勧告G.729.1(2006)参照)等が検討されている。
帯域分割符号化に基づくスケーラブル符号化において、下位レイヤで符号化対象となる帯域の信号の符号化後の誤差信号(符号化残差信号)が大きい場合には、符号化残差信号が聴感的な復号音質に与える影響は、より上位の符号化レイヤで符号化対象となる帯域の信号が聴感的な復号音質に与える影響よりも大きい。
そこで、本実施の形態では、帯域分割符号化対象の符号化レイヤにおいて、各符号化レイヤより下位レイヤの符号化残差信号を符号化するか否かを適応的に判定する。
図8は本実施の形態に係る符号化装置の構成を示すブロック図である。なお、図8において図3に示す符号化装置100と同一の構成部には同一符号を付し、説明を省略する。
図8に示す符号化装置500において、PCA変換部101は、第1レイヤの主信号P(n)を帯域分割符号化部501に出力し、第1レイヤの副信号A(n)を第2レイヤの副信号A^(n)として適応的残差符号化部102−2に出力する。
帯域分割符号化部501は、PCA変換部101から入力される主信号P(n)を複数の帯域に分割し、分割した分割帯域単位の信号に対して階層的に符号化を行う。ここで、帯域分割符号化部501が第1レイヤから第Lレイヤ(Lは2以上の自然数)までの符号化を行う場合、適応的残差符号化部102−2〜102−Mは第(L+1)レイヤ以降の符号化を順次行う。そして、帯域分割符号化部501は、第Lレイヤまでの各符号化レイヤで生成された符号化データを含む符号化データC、および、第1レイヤの符号化対象の帯域をさらに分割した各帯域(サブ帯域)で生成された判定結果を含むインジケータFを多重化部104に出力する。また、帯域分割符号化部501は、符号化後の符号化残差信号を適応的残差符号化部102−2の入力信号P^(n)として適応的残差符号化部102−2に出力する。
図9は、図8に示す帯域分割符号化部501の内部構成のうち、第1レイヤの符号化処理に関する構成部および第2レイヤ符号化処理に関する構成部への入力信号形成処理に関する構成部を示すブロック図である。
図9に示す帯域分割符号化部501において、帯域分割部551は、PCA変換部101(図8)から入力される第1レイヤの主信号P(n)を、第1レイヤの符号化対象の第1帯域の信号である第1帯域信号Sと、第1帯域信号S以外の信号S”とに分割する。例えば、帯域分割部551は、第1レイヤの主信号P(n)の周波数帯域のうち低域部から所定の周波数帯域までの信号を第1帯域信号Sとする。そして、帯域分割部551は、第1帯域信号Sをサブ帯域分割部552および符号化部553に出力し、第1帯域信号以外の信号S”を信号形成部558に出力する。
サブ帯域分割部552は、帯域分割部551から入力される第1帯域信号Sを複数のサブ帯域信号S1,sb(sb=1,2,…,Nsb、Nsbはサブ帯域分割数)に分割する。そして、サブ帯域分割部552は、分割したサブ帯域信号S1,sbを評価部556および残差算出部557に出力する。
符号化部553は、帯域分割部551から入力される第1帯域信号Sを予め設定された符号化ビットレートで符号化して第1レイヤ符号化データを生成する。そして、符号化部553は、生成した第1レイヤ符号化データを復号部554に出力するとともに、多重化部104(図8)に出力する。
復号部554は、符号化部553から入力される第1レイヤ符号化データを復号して第1レイヤ復号信号S を生成する。そして、復号部554は、生成した第1レイヤ復号信号S をサブ帯域分割部555に出力する。
サブ帯域分割部555は、サブ帯域分割部552と同様にして、復号部554から入力される第1レイヤ復号信号S を複数のサブ帯域信号S 1,sbに分割する。そして、サブ帯域分割部555は、分割したサブ帯域信号S 1,sbを評価部556および残差算出部557に出力する。
評価部556は、サブ帯域分割部552から入力されるサブ帯域信号S1,sbおよびサブ帯域分割部555から入力されるサブ帯域信号S 1,sbを用いて、サブ帯域毎の符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、まず、評価部556は、サブ帯域信号S1,sbおよびサブ帯域信号S 1,sbを用いて、サブ帯域毎の第1レイヤにおける符号化性能に関する評価値を算出する。例えば、評価部556は、評価値として各サブ帯域の符号化残差信号に対するSNR(Signal to Noise Ratio)を用いる。具体的には、評価部556は、第sbサブ帯域におけるSNRsbを式(5)に従って算出する。ただし、第sbサブ帯域におけるサブ帯域信号のサンプル数をP1,sbとする。
Figure 2009144953
そして、評価部556は、算出した各サブ帯域における符号化性能に関する評価値(SNR)に基づき、符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、評価部556は、各サブ帯域のSNRsbと所定の閾値SNRthrとを比較して、下記の第sbサブ帯域における判定結果F1,sbを生成する。
1,sb = 1 if SNRsb < SNRthr
1,sb = 0 else
つまり、評価部556は、各サブ帯域における評価値(SNR)が所定の閾値より小さい場合(すなわち、符号化残差エネルギーが所定の閾値より大きい場合)、判定結果F1,sbを「1」とし、評価値(SNR)が所定の閾値以上の場合(すなわち、符号化残差エネルギーが所定の閾値以下の場合)、判定結果F1,sbを「0」とする。ここで、評価部556は、SNRthrを予め設定してもよく、入力信号の特性に基づいて設定してもよく、サブ帯域毎に設定してもよい。そして、評価部556は、各サブ帯域の判定結果F1,sbを残差算出部557に出力するとともに、多重化部104(図8)に出力する。
残差算出部557は、評価部556から入力される判定結果F1,sbに基づいて、各サブ帯域における符号化残差信号を算出する。具体的には、残差算出部557は、判定結果F1,sbが「1」である第sbサブ帯域では、サブ帯域分割部552から入力されるサブ帯域信号S1,sbから、サブ帯域分割部555から入力されるサブ帯域信号S 1,sbを減じて第sbサブ帯域における符号化残差信号を算出する。一方、残差算出部557は、判定結果F1,sbが「0」である第sbサブ帯域では符号化残差信号を算出しない。そして、残差算出部557は、判定結果F1,sbが「1」であるサブ帯域のみに符号化残差信号を有する第1帯域全体の符号化残差信号Sr1を信号形成部558に出力する。
信号形成部558は、残差算出部557から入力される符号化残差信号Sr1と帯域分割部551から入力される信号S”とを加算して信号S’を形成する。すなわち、信号S’は、第1レイヤの主信号P(n)の周波数帯域において、第1帯域に符号化残差信号Sr1を有し、第1帯域以外の周波数帯域に信号S”を有する。そして、信号形成部558は、生成した信号S’を第2レイヤの符号化処理に関する構成部(図示せず)に出力する。
また、帯域分割符号化部501は、信号形成部558から出力された信号S’を第2レイヤの入力信号として用いる。そして、第2レイヤでは、帯域分割符号化部501は、第1レイヤと同様にして、入力信号を、第2レイヤで符号化対象とする第2帯域の信号と第2帯域の信号以外の信号とに分割し、第2帯域の信号を予め設定された符号化ビットレートで符号化する。また、帯域分割符号化部501は、第2帯域の信号以外の信号を、第3レイヤの入力信号として用いる。ここで、帯域分割符号化部501は、第1帯域の一部を含む周波数帯域を第2帯域とする。そこで、帯域分割符号化部501は、第2帯域の信号のうち、第1帯域の一部に対応する周波数帯域の信号を優先的に符号化する。具体的には、帯域分割符号化部501は、第2帯域に含まれる第1帯域のうち、サブ帯域の判定結果F1,sbが「1」であるサブ帯域の一部またはすべての符号化残差信号を優先的に符号化する。第3レイヤ以降についても同様である。そして、帯域分割符号化部501は、すべての符号化レイヤの符号化データを含む符号化データCおよび第1帯域の各サブ帯域の判定結果F1,sbを含むインジケータFを多重化部104に出力する。
次いで、信号形成部558で形成した信号S’を図10に示す。図10に示すように、第1レイヤの符号化対象である第1帯域では、判定結果F1,sbが「1」であるサブ帯域のみに符号化レイヤ残差信号が存在する。例えば、図10に示すように、判定結果F1,1が「1」である第1サブ帯域(sb=1)では、符号化残差信号(S1,1−S 1,1)が存在し、判定結果F1,3が「1」である第3サブ帯域(sb=3)では、符号化残差信号(S1,3−S 1,3)が存在する。一方、判定結果F1,2が「0」である第2サブ帯域(sb=2)および判定結果F1,4が「0」である第4サブ帯域(sb=4)では、符号化残差信号が存在しない。また、第1レイヤの符号化対象ではない帯域では、第1レイヤの主信号P(n)の第1帯域以外の周波数帯域の信号S”がそのまま存在する。
これにより、帯域分割符号化部501は、第1帯域の各サブ帯域のうち、符号化残差エネルギーが閾値より大きいサブ帯域の符号化残差信号を入力信号として上位レイヤに出力する。よって、帯域分割符号化部501は、下位レイヤで得る符号化残差信号のうち、符号化残差エネルギーがより高い信号(重要度がより高い信号)のみを上位レイヤで符号化する符号化残差信号として適応的に選択することができる。
次に、本実施の形態に係る復号装置について説明する。図11は復号装置600の構成を示すブロック図である。なお、図11において図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図11に示す復号装置600において、帯域分割復号部601には、逆多重化部201から、符号化装置500の帯域分割符号化部501で生成された各符号化レイヤの符号化データを含む符号化データCおよび第1レイヤの複数のサブ帯域の判定結果F1、sbを含むインジケータFが入力される。帯域分割復号部601は、判定結果F1、sbに基づいて、符号化データCを復号する。具体的には、帯域分割復号部601は、逆多重化部201から入力される各符号化レイヤの符号化データを復号し、生成される復号信号と上位レイヤで生成した復号信号とを加算して各符号化レイヤの復号信号を形成する。そして、帯域分割復号部601は、帯域分割符号化処理を適用した符号化レイヤのうち最下位レイヤである第1レイヤの復号信号を復号信号P (n)として加算器203に出力する。
図12は、図11に示す帯域分割復号部601の内部構成のうち、第2レイヤの復号信号Sを用いて、最下位レイヤである第1レイヤの復号信号P (n)を生成する復号処理に関する構成部を示すブロック図である。
図12に示す帯域分割復号部601において、復号部651は、逆多重化部201(図11)から入力される符号化データCに含まれる第1レイヤ符号化データを復号する。そして、復号部651は、第1レイヤの復号信号S を帯域復号信号形成部653に出力する。
残差信号分離部652は、逆多重化部201から入力される判定結果F1,sbに基づいて、第2レイヤの復号処理に関する構成部(図示せず)から入力される第2レイヤの復号信号S(すなわち、第2レイヤから第Lレイヤで復号された復号信号)を第1帯域の復号残差信号S r1と第1帯域以外の周波数帯域の復号信号Sとに分離する。そして、残差信号分離部652は、第1帯域の復号残差信号S r1を帯域復号信号形成部653に出力し、第1帯域以外の周波数帯域の復号信号Sを復号信号形成部654に出力する。
帯域復号信号形成部653は、逆多重化部201から入力される判定結果F1,sbに基づいて、復号部651から入力される復号信号S および残差信号分離部652から入力される復号残差信号S r1を加算することで、第1帯域の復号信号を形成する。具体的には、帯域復号信号形成部653は、復号信号S と、復号残差信号S r1における判定結果F1,sbが「1」であるサブ帯域の復号残差信号とを加算する。そして、帯域復号信号形成部653は、形成した第1帯域の復号信号を復号信号形成部654に出力する。
復号信号形成部654は、帯域復号信号形成部653から入力される第1帯域の復号信号、および、残差信号分離部652から入力される第1帯域以外の周波数帯域の復号信号Sを用いて復号信号P (n)を形成する。そして、復号信号形成部654は、形成した復号信号P (n)を加算器203(図11)に出力する。
このように、本実施の形態によれば、符号化装置500(図8)は、主信号P(n)に対して帯域分割符号化に基づくスケーラブル符号化を適用し、ステレオ符号化において聴感的に重要である周波数帯域(特に低域)の信号を適応的に選択して符号化するため、符号化歪をより低減することができる。よって、復号装置600(図11)は、復号音質を向上することができる。
また、本実施の形態によれば、第1レイヤの符号化対象である第1帯域の各サブ帯域のうち、評価値(SNR)が所定の閾値より小さいサブ帯域、つまり、符号化残差エネルギーが所定量より大きいサブ帯域のみを上位レイヤの符号化対象の信号とする。すなわち、各符号化レイヤにおいてエネルギーがより高いサブ帯域の信号(聴感的に重要度がより高いサブ帯域の信号)のみが上位レイヤに入力される。よって、符号化装置500では、帯域分割符号化部501内の各符号化レイヤにおいて、下位レイヤにおける符号化結果に応じて符号化残差エネルギーがより高い信号(重要度がより高い信号)を適応的に符号化するため、復号装置600(図11)は、高品質なステレオ信号を復元することができる。
なお、本実施の形態において、各符号化レイヤにおける符号化対象の信号は、時間領域信号でもよく、周波数領域信号(例えば、MDCT変換後の係数)でもよい。
また、本実施の形態では、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する符号化レイヤは、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに限定されない。例えば、符号化装置は、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤに対して帯域分割符号化処理を適用してもよい。
また、本実施の形態では、PCA変換後の主信号に対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する信号はPCA変換後の主信号に限定されない。例えば、符号化装置は、PCA変換後の副信号、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤにおける符号化残差信号、または、PCA変換後の信号以外の任意の入力信号に対して帯域分割符号化処理を適用してもよい。また、符号化装置は、帯域分割符号化処理と適応的残差符号化処理とを組み合わせず、帯域分割符号化処理を単独で適用してもよい。
また、本実施の形態では、帯域分割符号化部において、入力信号の低域部から所定の周波数帯域までの予め設定した周波数帯域を、各符号化レイヤにおける符号化対象の周波数帯域とする場合について説明した。しかし、本発明では、各符号化レイヤにおける符号化対象の周波数帯域として、例えば、入力信号の特性に応じた周波数帯域を適応的に設定してもよい。
また、本実施の形態では、符号化装置が判定結果F1,sbに基づいて第1帯域の各サブ帯域の符号化残差信号を算出するか否かを決定する場合について説明した。しかし、本発明では、符号化装置は判定結果F1,sbによらず第1帯域のすべてのサブ帯域の符号化残差信号を算出してもよい。
以上、本発明の各実施の形態について説明した。
なお、上記実施の形態では、信号の重要度の指標として、信号のエネルギーを用いる場合について説明した。しかし、本発明では、信号の重要度は、信号のエネルギーに限らず、例えば、信号の信号対雑音比(Signal to Noise Ratio:SNR)でもよい。信号の重要度の指標としてSNRを用いる場合の適応的残差符号化部102−mの選択部3021−mの内部構成について図13のブロック図を用いて説明する。図13に示す選択部3021−mにおいて、符号化部3201−mは、第mレイヤの主信号P^(n)を符号化して符号化データを生成し、復号部3202−mは、第mレイヤの主信号P^(n)の符号化データを復号して第mレイヤの主信号の復号信号P (n)を生成する。そして、減算器3203−mは、第mレイヤの主信号P^(n)から第mレイヤの主信号の復号信号P (n)を減じて、第(m+1)レイヤの主信号P^m+1(n)を生成する。逆PCA変換部3204−mは、第(m+1)レイヤの主信号P^m+1(n)および第mレイヤの副信号A^(n)を逆PCA変換して、左信号L^m1(n)および右信号R^m1(n)を得る。すなわち、符号化部3201−m、復号部3202−m、減算器3203−mおよび逆PCA変換部3204−mは、第mレイヤの主信号P^(n)が符号化された場合(すなわち、選択部3021−mが主信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^m1(n)および右信号R^m1(n))を生成する。そして、測定値算出部3205−mは、左信号L^m1(n)および右信号R^m1(n)を用いて定量的測定値M(すなわち、SNR)を算出する(式(6))。
Figure 2009144953
同様にして、符号化部3206−m、復号部3207−m、減算器3208−mおよび逆PCA変換部3209−mは、第mレイヤの副信号A^(n)が符号化された場合(すなわち、選択部3021−mが副信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^m2(n)および右信号R^m2(n))を生成する。そして、測定値算出部3210−mは、左信号L^m2(n)および右信号R^m2(n)を用いて定量的測定値M(すなわち、SNR)を算出する(式(7))。
Figure 2009144953
比較部3211−mは、定量的測定値Mおよび定量的測定値Mを比較し、より大きい値の定量的測定値に対応する信号(主信号または副信号)を符号化される信号として選択し、選択された信号を示すインジケータFを出力する。つまり、選択部3021−mは、主信号を符号化した際に復号装置200で得られる出力ステレオ信号、および、副信号を符号化した際に復号装置200で得られる出力ステレオ信号を選択部3021−mの内部で生成する。これにより、選択部3021−mは、定量的測定値として、復号装置200におけるSNRを算出することができる。よって、選択部3021−mは、復号装置200におけるSNRがより高い信号を選択するため、上記実施の形態と同様、ビット割当情報を通知するための情報量を最小限に抑えつつ、符号化効率を向上することができる。なお、信号の重要度を示す定量的測定値は式(6)および式(7)より算出されるSNRに限らず、例えば、マスク対雑音比(Mask to Noise Ratio:MNR)でもよい。例えば、ステレオ信号の重要度としてMNRを用いる場合、ステレオ信号における左信号L(n)および右信号R(n)の心理音響的モデル化を含む処理を経て導出することができる。
また、上記実施の形態では、時間領域のステレオ信号に対して本発明を適用する場合について説明した。しかし、本発明は、時間領域のステレオ信号に限らず、別の領域のステレオ信号に対して本発明を適用してもよい。例えば、MDCT(Modified Discrete Cosine Transform)領域のステレオ信号、または、ステレオ信号にLPC分析を施したLPC(Linear Prediction Coefficients)残差信号に対して本発明を適用してもよい。また、本発明は、例えば、MDCT領域のLPC残差信号に対して適用してもよい。
また、本発明に係る符号化装置は、入力信号の帯域を複数のサブ帯域(sub band)に分割し、入力信号の各サブ帯域の信号であるサブ帯域信号に対して本発明を適用してもよい。例えば、入力信号であるステレオ信号の左信号L(n)および右信号R(n)を、K個のサブ帯域に分割して、左信号L(n)のサブ帯域信号L(n)(k=1〜K)、および、右信号R(n)のサブ帯域信号R(n)(k=1〜K)を得る。
例えば、ステレオ信号において、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割した場合について、図14〜図17を用いて説明する。なお、図14は、符号化装置のうち、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割する処理に関する構成部300を示し、図15は、符号化装置のうち、本発明に係る符号化処理に関する構成部350を示す。同様に、図16は、復号装置のうち、本発明に係る復号処理に関する構成部400を示し、図17は、復号装置のうち、複数のサブ帯域信号に分割されたMDCT領域のLPC残差信号を結合してステレオ信号を復元する処理に関する構成部450を示す。なお、図14〜図17において図3に示す符号化装置100または図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図14において、LPC分析部301は、ステレオ信号における左信号L(n)を用いて線形予測分析を行い、左信号L(n)のスペクトルの概形を示すLPCパラメータ(線形予測パラメータ)A(z)を得る。量子化部302は、LPCパラメータA(z)を量子化して量子化符号IqLを得る。逆量子化部303は、LPCパラメータの量子化符号IqLを逆量子化し、復号LPCパラメータAdL(z)を得る。逆フィルタ304は、左信号L(n)に対し、復号LPCパラメータAdL(z)を用いて逆フィルタリング(LPC逆フィルタリング)を施すことにより、スペクトルの概形の特徴が取り除かれたフィルタリング後の左信号L(n)を得る。T/F部305は、逆フィルタリング後の左信号L(n)に対してMDCT(すなわち、時間/周波数領域変換)を行い、時間領域の左信号L(n)をMDCT領域(周波数領域)の左信号L(f)を得る。つまり、左信号のMDCT領域のLPC残差信号L(f)が得られる。
帯域分割部306は、左信号のMDCT領域のLPC残差信号L(f)を複数のサブ帯域(ここでは、K個のサブ帯域)に分割し、左信号L(f)のサブ帯域信号Le1(f)〜LeK(f)を生成する。
一方、図14に示すLPC分析部307、量子化部308、逆量子化部309、逆フィルタ310、T/F部311および帯域分割部312は、LPC分析部301から帯域分割部306までの一連の処理と同様の処理を右信号R(n)に施すことで、右信号R(f)のサブ帯域信号Re1(f)〜ReK(f)を生成する。
ここで、例えば、左信号L(f)のサブ帯域信号Le1(f)〜LeK(f)および右信号R(f)のサブ帯域信号Re1(f)〜ReK(f)のうち、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)に対してのみ本発明を適用する場合について説明する。図15に示すように、PCA変換部351は、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)をPCA変換し、MDCT領域の主信号P(f)および副信号A(f)を得る。そして、適応的残差符号化部352−1〜352−Mは、上記実施の形態と同様にして、主信号P(f)および副信号A(f)に対して適応的残差符号化処理を施す。多重化部313は、適応的残差符号化部352−1〜352−Mから入力される符号化データCおよびインジケータFと、図14に示す量子化部302および量子化部308からそれぞれ入力されるLPCパラメータの量子化符号IqLおよびIqRとを多重化する。
一方、図16に示す復号装置の逆多重化部401は、ビットストリームに多重化された符号化データCおよびインジケータFを復号部402−1〜402−Mにそれぞれ出力する。また、逆多重化部401は、LPCパラメータの量子化符号IqLおよびIqRを、図17に示す逆量子化部451および逆量子化部455に出力する。復号部402−1〜402−Mは、上記実施の形態と同様にして、符号化データを復号し、MDCT領域の復号信号P (f)およびMDCT領域の復号信号A (f)を得る。逆PCA変換部403は、復号主信号P (f)および復号副信号A (f)を用いて、左信号のサブ帯域信号L e1および右信号のサブ帯域信号R e1を得る。左信号のサブ帯域信号L e1は、図17に示す帯域結合部452に出力され、右信号のサブ帯域信号R e1は、図17に示す帯域結合部456に出力される。
図17に示す逆量子化部451は、LPCパラメータの量子化符号IqLを逆量子化してLPCパラメータAdL(z)を得る。帯域結合部452は、左信号L(f)のサブ帯域信号Le1(f)〜LeK(n)を結合し、MDCT領域の左信号L (f)を得る。F/T部453は、MDCT領域の左信号L (f)に対して逆MDCT(すなわち、周波数/時間領域変換)を行い、時間領域の左信号L (n)を得る。合成フィルタ454は、LPCパラメータAdL(z)を用いて、時間領域の左信号L (n)に対して合成フィルタを掛け、左信号L(n)を得る。
一方、図17に示す逆量子化部455、帯域結合部456、F/T部457および合成フィルタ458は、逆量子化部451、帯域結合部452、F/T部453および合成フィルタ454の一連の処理と同様の処理を量子化符号IqRおよび右信号R(f)のサブ帯域信号Re1(f)〜ReK(n)に対して施すことにより、右信号R(n)を得る。
このように、ステレオ信号のLPC残差信号をMDCT領域に変換して、MDCT領域の信号を複数のサブ帯域に分割して、分割したサブ帯域の信号に対してPCA変換、適応的残差符号化を適用することで、サブ帯域毎に適した効率的な符号化を行うことができる。
また、上記実施の形態では、ステレオ信号をPCA変換する場合、量子化前のPCA変換パラメータ(すなわち、ステレオ信号から算出される共分散行列の固有ベクトルの各要素)を使用する場合について説明した。しかし、本発明では、PCA変換の際に使用するPCA変換パラメータとして、量子化後のPCA変換パラメータを用いてもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、最下位のレイヤである第1レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤでは主信号が副信号よりも重要な情報であるため、符号化装置は、第1レイヤにおいて、適応的残差符号化処理を省略し、常に主信号を選択してもよい。この場合、符号化装置は、第2レイヤ〜第Mレイヤまでのインジケータを送信すればよい。つまり、第1レイヤのインジケータを送信しなくてよいため、ビット割当情報を1ビット削減することができる。また、符号化装置は、第1レイヤにおいて、主信号および副信号の双方を符号化し、第2レイヤ以降の符号化レイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、例えば、最下位のレイヤである第1レイヤから所定の符号化レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤ〜第(i−1)レイヤ(iは2以上の自然数)では、符号化装置は、適応的残差符号化処理を省略し、常に主信号を選択してもよい。つまり、符号化装置は、第iレイヤ〜第Mレイヤで本発明を適用してもよい。また、符号化装置は、第1レイヤ〜第(i−1)レイヤにおいて、主信号および副信号の双方を符号化し、第iレイヤ〜第Mレイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、第1レイヤ〜第Mレイヤのうち1つ以上の任意の符号化レイヤで本発明を適用してもよい。
また、PCA変換は、KL変換(KLT:Karhunen Loeve Transform)と呼ばれることもある。
また、上記実施の形態に係る復号装置は、上記実施の形態に係る符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明した。しかし、本発明はこれに限定されず、上記実施の形態に係る復号装置が受信して処理するビットストリームは、上記実施の形態に係る復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであればよい。
また、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、例えば音声符号化装置および音声復号装置等として、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2008年5月30日出願の特願2008−143863および2008年6月19日出願の特願2008−160954の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および復号装置等は、携帯電話、IP電話、テレビ会議等に用いるに好適である。
本発明は、主成分分析変換を適用する符号化装置、復号装置およびこれらの方法に関する。
従来の音声通信システムでは、限定された伝送帯域制限下でモノラル音声信号を送信する。通信ネットワークのブロードバンド化に伴い、音声通信に対するユーザの期待は、単なる明瞭さからステレオ音像(stereo image)と自然らしさの提供へと移行しており、ステレオ音声を提供するトレンドが出現している。そのため、ステレオ音声を効率的に送信するための符号化方式が望まれている。
前述の目標を達成するため、ステレオ信号(すなわち、2チャネル)または複数のチャネルの符号化方法として、主成分分析(PCA:Principal Component Analysis)を使用した符号化方法が検討されている(非特許文献1および非特許文献2)。PCAを使用した符号化方法では、入力信号をPCAによって変換(PCA変換)して、変換後の各信号をそれぞれ独立して符号化する。PCA変換は、入力信号の共分散行列から得られる固有値の分布に従って、入力信号におけるエネルギーの集中化を達成させる線形変換である。
例えば、PCAによって変換されたステレオ信号は、ステレオ信号の主要成分(例えば、主旋律のオーディオ信号成分または支配的な音声成分)に対応する主信号(principal signal)と、ステレオ信号の主信号以外の残りの成分に対応する副信号(secondary signal)とに変換される。つまり、ステレオ信号のエネルギーが主信号に集中化される。これにより、PCAを使用した符号化方法では、エネルギーを集中化させた信号を符号化することで、入力信号における冗長性を除去することができるため、符号化効率を向上させることができる。また、ステレオ信号における主信号と副信号とは、互いに無相関の関係があるため、さらに入力信号における冗長性を除去することができる。
図1および図2は、PCAを使用したステレオ信号コーデックの一般的な符号化装置および復号装置を示すブロック図である。図1に示す符号化装置において、PCA変換部11は、ステレオ信号における左信号L(n)および右信号R(n)を主信号P(n)および副信号A(n)に変換する(式(1))。
Figure 2009144953
ここで、νおよびνは、左信号L(n)および右信号R(n)を主信号P(n)と副信号A(n)とに変換するために用いるPCA変換パラメータである。符号化部12および符号化部13は、主信号P(n)および副信号A(n)をそれぞれ独立して符号化(例えば、スカラ量子化またはベクトル量子化)し、主信号P(n)の符号化データおよび副信号A(n)の符号化データを多重化部15に出力する。また、量子化部14は、PCA変換部11で得られるPCA変換パラメータνおよびνを量子化して、PCA変換パラメータの量子化符号を生成する。多重化部15は、主信号P(n)の符号化データと、副信号A(n)の符号化データと、PCA変換パラメータの量子化符号とを多重化して、ビットストリームを形成する。
図2に示す復号装置においてステレオ信号を復号する場合、逆多重化部21は、ビット
ストリームから主信号P(n)の符号化データ、副信号A(n)の符号化データおよびPCA変換パラメータの量子化符号を多重分離する。そして、復号部22は、主信号P(n)の符号化データを復号して復号主信号P(n)を得る。また、復号部23は、副信号A(n)の符号化データを復号して復号副信号A(n)を得る。また、逆量子化部24は、PCA変換パラメータの量子化符号を逆量子化して、PCA変換パラメータν およびν を得る。逆PCA変換部25は、PCA変換パラメータν およびν を用いて、主信号P(n)および副信号A(n)を逆PCA変換し、ステレオ信号の左信号L(n)および右信号R(n)を復元する(式(2))。
Figure 2009144953
また、音声通信システムでは、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データの復号が可能な構成をいう。スケーラブルな構成を有する音声符号化技術として、複数の符号化技術を階層的に統合するスケーラブル符号化(階層符号化)技術が検討されている。スケーラブル符号化技術においては、送信側は、入力音声信号に対して階層的な符号化処理を施し、複数の符号化レイヤに階層化された符号化データを伝送する。
また、音声通信システムでは、電波資源の有効利用のために、音声信号を低ビットレートに圧縮して伝送することが要求されている。低ビットレートの制約下では、上述したPCAを使用したステレオ信号符号化を行う場合、主信号および副信号の双方を共に高品質で符号化することは困難である。そのため、限られたビットを主信号および副信号で適切に割り当てる必要がある。例えば、非特許文献1および非特許文献2には、PCAを使用したステレオ信号符号化におけるビット割当方法が開示されている。
非特許文献1では、ステレオ信号の符号化処理において、パラメトリック符号化を副信号に対して適用する方法を開示している。すなわち、主信号および副信号において、主信号の符号化データの特性と副信号の特性との差に基づくパラメータ(パラメトリック符号化パラメータ)として副信号を表す。副信号をパラメトリック符号化することにより、副信号に含まれている冗長性が取り除かれるため、副信号のビットレートが減少する。このようにして、主信号の符号化データ、および、低ビットレートのパラメトリック符号化パラメータ(副信号)が限られたビットに割り当てられる。
非特許文献2では、入力信号がPCA変換されて得られる複数のチャネルそれぞれのエネルギーに応じてビットを適応的に割り当てるビット割当方法を開示している。例えば、ステレオ信号符号化処理において、ステレオ信号(すなわち、2チャネル)をPCA変換して得られる主信号および副信号それぞれのエネルギーに応じてビットを適応的に割り当てる。これにより、PCA変換後の複数のチャネルのうち、エネルギーがより高いチャネルを優先的に送信することができる。また、低ビットレートの制約下では、ステレオ信号を構成する複数のチャネルのうち、エネルギーがより低いチャネルを破棄することができる。このような送信方法は、チャネルスケーラビリティ送信方法(Channel scalability transmission method)と呼ばれる。
Manuel Briand, David Virette and Nadine Martin "Parametric coding of stereo audio based on principal component analysis", Proc of the 9thInternational Conference on Digital Audio Effects, Montreal, Canada, September 18-20, 2006. Dai Yang, Hongmei Ai, Chris Kyriakakis and C.-C. Jay Kuo "High-fidelity multichannel audio coding with Karhunen Loeve Transform", IEEE transactions on speech and audio processing, Vol.11, No.4, July 2003.
しかしながら、ステレオ信号に対してスケーラブル符号化技術を用いるスケーラブル符号化システムにおいて、上述したビット割当方法を適用する場合、符号化装置が復号装置に通知すべきビット割当情報の情報量(ビット数)が多くなり、符号化効率が悪くなってしまう。
具体的には、非特許文献1に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、スケーラブル符号化された主信号に基づくパラメトリック符号化パラメータをスケーラブル符号化の符号化レイヤ毎に更新しなければならない。また、このパラメトリック符号化パラメータは、各符号化レイヤで所定のビット数を要する。すなわち、符号化装置は、符号化レイヤ毎に異なるパラメトリック符号化パラメータの情報量(ビット数)を示すビット割当情報を復号装置に通知することが必要となるため、符号化効率が悪くなる。
また、非特許文献2に開示されているビット割当方法を、スケーラブル符号化システムに適用する場合、ステレオ信号における主信号および副信号との間での割り当てビット数は、符号化レイヤ毎に異なる。そのため、符号化装置は、符号化レイヤ毎に、主信号および副信号それぞれに割り当てられたビット数を示すビット割当情報を復号装置に通知する必要があるため、符号化効率が悪くなる。
このように、スケーラブル符号化システムにおいて、ステレオ信号をPCA変換して得られる主信号と副信号との間でビット割り当てを行う場合、符号化レイヤ毎に所定のビット数のビット割当情報を通知することが必要となるため、復号信号に通知すべきビット割当情報の情報量が増大してしまう。
本発明の目的は、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、ビット割当情報の情報量を最小限に抑えつつ、高品質なステレオ信号を復元することができる符号化装置、復号装置およびこれらの方法を提供することである。
本発明の符号化装置は、入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して第1レイヤの主信号および第1レイヤの副信号を生成する変換手段と、第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、第m(mは1以上M以下の自然数)レイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、前記重要度が高い信号を選択する第mレイヤの選択手段と、第1レイヤから第Mレイヤにおいて、前記第mレイヤの選択手段で選択された信号を符号化して第mレイヤの符号化データを生成する第mレイヤの符号化手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの符号化データを復号して第mレイヤの復号信号を生成する第mレイヤの復号手段と、第1レイヤから第M−1レイヤにおいて、前記第mレイヤの選択手段で選択された信号から前記第mレイヤの復号信号を減じて得られる信号、および、前記第mレイヤの選択手段で選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する第mレイヤの減算手段と、第1レイヤから第Mレイヤまでの符号化データ
、および、第1レイヤから第Mレイヤまでの選択手段で選択された信号を示す信号情報を送信する送信手段と、を具備する構成を採る。
本発明によれば、ステレオ信号に対してスケーラブル符号化技術を用いる場合に、符号化装置は、各符号化レイヤにおいて、ステレオ信号をPCA変換して得られる主信号および副信号の2つの信号のうち重要度が高い信号のみを符号化することにより、ビット割当情報の情報量を最小限に抑えつつ、復号装置は高品質なステレオ信号を復元することができる。
PCAを使用した一般的な符号化装置の構成を示すブロック図 PCAを使用した一般的な復号装置の構成を示すブロック図 本発明の実施の形態1に係る符号化装置の構成を示すブロック図 本発明の実施の形態1に係るPCA変換部の内部の構成を示すブロック図 本発明の実施の形態1に係る適応的残差符号化部の内部の構成を示すブロック図 本発明の実施の形態1に係る選択部の内部の構成を示すブロック図 本発明の実施の形態1に係る復号装置の構成を示すブロック図 本発明の実施の形態2に係る符号化装置の構成を示すブロック図 本発明の実施の形態2に係る帯域分割符号化部の内部の構成を示すブロック図 本発明の実施の形態2に係る帯域分割符号化部で形成される信号を示す図 本発明の実施の形態2に係る復号装置の構成を示すブロック図 本発明の実施の形態2に係る帯域分割復号部の内部の構成を示すブロック図 本発明のその他の選択処理を行う場合の選択部の構成を示すブロック図 本発明のLPC残差信号に対するMDCT後の信号を複数のサブ帯域に分割する処理を行う符号化装置の構成を示すブロック図 本発明のその他の符号化装置の構成を示すブロック図 本発明のその他の復号装置の構成を示すブロック図 本発明の複数のサブ帯域に分割された信号を結合する処理を行う復号装置の構成を示すブロック図
以下、本発明の各実施の形態について、図面を用いて説明する。
(実施の形態1)
図3は本実施の形態に係る符号化装置の構成を示すブロック図であり、図7は本実施の形態に係る復号装置の構成を示すブロック図である。本実施の形態に係る符号化装置および復号装置の構成として、Mレイヤのスケーラブル構成を一例として説明する。つまり、以下の説明では、スケーラブル符号化処理における符号化レイヤ数をM(Mは2以上の自然数)とする。図3に示す符号化装置100において、適応的残差符号化部102−1〜102−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。同様に、図7に示す復号装置200において、復号部202−1〜202−Mは、第1レイヤ〜第Mレイヤにそれぞれ対応する。また、以下の説明では、ステレオ信号における左信号および右信号をNBサンプルずつ区切り(NBは自然数)、NBサンプルを1フレームとする。ここで、左信号および右信号は左信号L(n)および右信号R(n)で表される。nはNBサンプルずつ区切られた信号のうち、信号要素のn+1番目を示し、n=0〜NB−1とする。
図3に示す符号化装置100において、PCA変換部101には、ステレオ信号における左信号L(n)および右信号R(n)が入力される。PCA変換部101は、入力される左信号L(n)および右信号R(n)を、式(1)に従ってPCA変換を行い、第1レ
イヤの主信号P(n)および第1レイヤの副信号A(n)を生成する。そして、PCA変換部101は、第1レイヤの主信号P(n)および第1レイヤの副信号A(n)を適応的残差符号化部102−1に出力する。また、PCA変換部101は、PCA変換処理時に算出されるPCA変換パラメータνおよびνを量子化部103に出力する。
適応的残差符号化部102−1〜102−Mは、それぞれに対応する符号化レイヤの主信号の重要度および副信号の重要度に基づいて、2つの信号のいずれか一方を適応的に選択し、選択した信号を符号化(適応的残差符号化:adaptive residue encoding)する。具体的には、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−m(mは1以上M以下の自然数)は、第mレイヤの主信号の重要度と、第mレイヤの副信号の重要度とを比較し、重要度が高い信号を選択し、選択された信号を符号化して第mレイヤの符号化データ(ビット列)を生成する。また、第1レイヤから第(M−1)レイヤにおいて、適応的残差符号化部102−mは、選択された信号から符号化データの復号信号を減じて得られる符号化残差(coding residue)信号および選択された信号以外の信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。また、第1レイヤから第Mレイヤにおいて、適応的残差符号化部102−mは、符号化された信号(主信号または副信号)を示す信号情報であるインジケータを生成する。例えば、インジケータに示される信号が主信号の場合、符号化された信号は第mレイヤの主信号であり、インジケータに示される信号が副信号の場合、符号化された信号は第mレイヤの副信号である。つまり、各符号化レイヤに設定された符号化データ用のビット列に割り当てられる信号を示すビット割当情報としてインジケータが生成される。
例えば、最下位レイヤ(第1レイヤ)に対応する、適応的残差符号化部102−1は、PCA変換部101から入力される第1レイヤの主信号P(n)および第1レイヤの副信号A(n)に対して適応的残差符号化処理を施して、第1レイヤの符号化データCを生成する。また、適応的残差符号化部102−1は、入力信号(第1レイヤの主信号P(n)および第1レイヤの副信号A(n))のうち符号化された信号(選択された信号)から符号化データCの復号信号を減じて得られる符号化残差信号、および、入力信号(第1レイヤの主信号P(n)および第1レイヤの副信号A(n))のうち符号化された信号(選択された信号)以外の信号(選択されなかった信号)を、第2レイヤの主信号P^(n)および第2レイヤの副信号A^(n)として生成する。また、適応的残差符号化部102−1は、第1レイヤにおいて符号化された信号(第1レイヤの主信号P(n)または第1レイヤの副信号A(n))を示すインジケータFを生成する。そして、適応的残差符号化部102−1は、第2レイヤの主信号P^(n)および第2レイヤの副信号A^(n)を、次の符号化レイヤ(第2レイヤ)に対応する適応的残差符号化部102−2に出力し、インジケータFおよび符号化データCを多重化部104に出力する。
同様に、適応的残差符号化部102−2には、適応的残差符号化部102−1から第2レイヤの主信号P^(n)および第2レイヤの副信号A^(n)が入力される。そして、適応的残差符号化部102−2は、適応的残差符号化部102−1と同様にして、第2レイヤの符号化データC、第3レイヤの主信号P^(n)、第3レイヤの副信号A^(n)、および、インジケータFを生成する。そして、適応的残差符号化部102−2は、第3レイヤの主信号P^(n)および第3レイヤの副信号A^(n)を次の符号化レイヤ(第3レイヤ)に対応する適応的残差符号化部102−3に出力し、インジケータFおよび符号化データCを多重化部104に出力する。適応的残差符号化部102−3〜102−Mについても同様である。ただし、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、次の符号化レイヤの主信号および副信号として符号化残差信号を出力しない。すなわち、第1レイヤから第(M−1)レイヤにおいてのみ、つまり、適応的残差符号化部102−1〜102−(M−1)のみが、選択された信号から
符号化データの復号信号を減じて得られる符号化残差信号および選択されなかった信号を、第(m+1)レイヤの主信号および第(m+1)レイヤの副信号として生成する。
量子化部103は、PCA変換部101から入力されるPCA変換パラメータνおよびνを量子化してPCA変換パラメータの量子化符号を生成する。そして、量子化部103は、PCA変換パラメータの量子化符号を多重化部104に出力する。
多重化部104は、適応的残差符号化部102−1〜102−Mそれぞれから入力される符号化データCおよびインジケータFと、量子化部103から入力される量子化符号とを多重化してビットストリームを形成する。得られたビットストリームは、通信路を介して復号装置200(図7)に送信される。
図4はPCA変換部101の内部構成を示すブロック図である。共分散行列算出部1011は、ステレオ信号におけるフレーム単位の左信号L(n)および右信号R(n)を用いて、共分散行列を算出し、算出された共分散行列を固有ベクトル算出部1012に出力する。
固有ベクトル算出部1012は、共分散行列算出部1011から入力される共分散行列を用いて、共分散行列の固有ベクトルを算出する。ここで、固有ベクトル算出部1012で算出される固有ベクトルの各要素がPCA変換パラメータνおよびνとなる。そして、固有ベクトル算出部1012は、算出された固有ベクトル(PCA変換パラメータ)をPCA変換行列形成部1013および図3に示す量子化部103に出力する。
PCA変換行列形成部1013は、固有ベクトル算出部1012から入力される固有ベクトルを用いてPCA変換行列を形成し、形成されたPCA変換行列を変換部1014に出力する。
変換部1014は、PCA変換行列形成部1013から入力されるPCA変換行列を用いて、ステレオ信号における左信号L(n)および右信号R(n)を第1レイヤの主信号P(n)および第1レイヤの副信号A(n)に変換する(式(1)。ただし、P(n)=P(n)、A(n)=A(n))。
次に、適応的残差符号化部102−1〜102−Mにおける適応的残差符号化処理の一例として、第mレイヤに対応する適応的残差符号化部102−mの内部構成について図5を用いて説明する。図5は、適応的残差符号化部102−mの内部構成を示すブロック図である。図5に示す適応的残差符号化部102−mには、1つ下位の第(m−1)レイヤに対応する適応的残差符号化部102−(m−1)から、第mレイヤの主信号P^(n)および第mレイヤの副信号A^(n)が入力される。具体的には、図5に示す選択部1021−mおよび符号化部1022−mに、第mレイヤの主信号P^(n)および第mレイヤの副信号A^(n)が入力される。また、図5に示す減算器1024−mには第mレイヤの主信号P^(n)が入力され、減算器1025−mには第mレイヤの副信号A^(n)が入力される。ただし、図5に示す第1レイヤに対応する適応的残差符号化部102−mには、PCA変換部101から第1レイヤの主信号P(n)および第1レイヤの副信号A(n)が入力される。なお、最上位(第Mレイヤ)に対応する適応的残差符号化部102−Mは、図5に示す選択部1021−mおよび符号化部1022−mのみを備え、復号部1023−m、減算器1024−mおよび減算器1025−mを備えない。すなわち、適応的残差符号化部102−Mは、インジケータFおよび符号化データCのみを出力する。
図5に示す適応的残差符号化部102−mにおいて、選択部1021−mは、入力され
る第mレイヤの主信号P^(n)のエネルギーと、第mレイヤの副信号A^(n)のエネルギーとを比較し、エネルギーがより高い信号を選択する。そして、選択部1021−mは、選択された信号(主信号または副信号)を示すインジケータFを符号化部1022−m、復号部1023−mおよび図3に示す多重化部104に出力する。
符号化部1022−mは、入力される第mレイヤの主信号P^(n)および第mレイヤの副信号A^(n)のうち、選択部1021−mから入力されるインジケータFに示される信号、つまり、選択部1021−mで選択された信号を符号化して第mレイヤの符号化データCを生成する。具体的には、符号化部1022−mは、インジケータFに示される信号が主信号の場合、第mレイヤの主信号P^(n)を符号化し、インジケータFに示される信号が副信号の場合、第mレイヤの副信号A^(n)を符号化する。そして、符号化部1022−mは、生成された第mレイヤの符号化データCを復号部1023−mおよび図3に示す多重化部104に出力する。
復号部1023−mは、選択部1021−mから入力されるインジケータFに基づいて、符号化部1022−mから入力される符号化データCを特定し、符号化データCを復号して第mレイヤの復号信号を生成する。ここで、復号部1023−mは、インジケータFに示される信号以外の信号の復号信号を0とする。そして、復号部1023−mは、生成される第mレイヤの復号信号のうち、主信号の復号信号を減算器1024−mに出力し、副信号の復号信号を減算器1025−mに出力する。具体的には、復号部1023−mは、インジケータFに示される信号が主信号である場合、第mレイヤの符号化データCを用いて第mレイヤの主信号P^(n)を復号する。そして、復号部1023−mは、主信号の復号信号P (n)を減算器1024−mに出力する一方、副信号の復号信号A (n)として「0」を減算器1025−mに出力する。これに対し、復号部1023−mは、インジケータFに示される信号が副信号である場合、符号化データCを用いて第mレイヤの副信号A^(n)を復号する。そして、復号部1023−mは、副信号の復号信号A (n)を減算器1025−mに出力する一方、主信号の復号信号P (n)として「0」を減算器1024−mに出力する。
減算器1024−mは、入力信号である第mレイヤの主信号P^(n)から、復号部1023−mから入力される主信号の復号信号P (n)を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。そして、減算器1024−mは、第(m+1)レイヤの主信号P^m+1(n)を次の符号化レイヤである第(m+1)レイヤに対応する適応的残差符号化部102−(m+1)に出力する。
減算器1025−mは、入力信号である第mレイヤの副信号A^(n)から、復号部1023−mから入力される副信号の復号信号A (n)を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。そして、減算器1025−mは、第(m+1)レイヤの副信号A^m+1(n)を適応的残差符号化部102−(m+1)に出力する。
例えば、選択部1021−mで主信号が選択された場合、減算器1024−mは、第mレイヤの主信号P^(n)から符号化データCの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの主信号P^m+1(n)として生成する。また、減算器1025−mは、第mレイヤの副信号A^(n)を第(m+1)レイヤの副信号A^m+1(n)として生成する。一方、選択部1021−mで副信号が選択された場合、減算器1025−mは、第mレイヤの副信号A^(n)から符号化データCの復号信号を減じて得られる符号化残差信号を第(m+1)レイヤの副信号A^m+1(n)として生成する。また、減算器1024−mは、第mレイヤの主信号P^(n)を第(m+1)レイヤの主信号P^m+1(n)として生成する。
次に、選択部1021−mの内部構成について図6を用いて説明する。図6は、選択部1021−mの内部構成を示すブロック図である。
図6に示す選択部1021−mにおいて、エネルギー計算部1201−mは、第mレイヤの主信号P^(n)のエネルギーEP^mを式(3)に従って計算する。そして、エネルギー計算部1201−mは、計算されたエネルギーEP^mを比較部1203−mに出力する。
Figure 2009144953
エネルギー計算部1202−mは、第mレイヤの副信号A^(n)のエネルギーEA^mを式(4)に従って計算する。そして、エネルギー計算部1202−mは、計算されたエネルギーEA^mを比較部1203−mに出力する。
Figure 2009144953
比較部1203−mは、エネルギー計算部1201−mから入力されるエネルギーEP^mと、エネルギー計算部1202−mから入力されるエネルギーEA^mとを比較する。そして、比較部1203−mは、より大きいエネルギーに対応する信号(主信号または副信号)を第mレイヤにおいて符号化する信号として選択する。例えば、比較部1203−mは、エネルギーEP^mがエネルギーEA^m以上の場合、第mレイヤにおいて符号化される信号として主信号(すなわち、第mレイヤの主信号P^(n))を選択する。一方、比較部1203−mは、エネルギーEP^mがエネルギーEA^m未満の場合、第mレイヤにおいて符号化される信号として副信号(すなわち、第mレイヤの副信号A^(n))を選択する。そして、比較部1203−mは、選択された信号、つまり、第mレイヤにおいて符号化される信号(主信号または副信号)を示すインジケータFを生成する。
上述したように、本実施の形態における符号化装置100は、符号化レイヤ毎に、主信号および副信号のいずれか一方の信号のみを符号化する。そのため、各符号化レイヤにおけるビット割当情報であるインジケータの情報量(ビット数)は、主信号と副信号とを区別するための1ビットでよい。
なお、上述した選択部1021−mは、主信号および副信号のエネルギーの算出を対数領域で行ってもよい。また、選択部1021−mは、主信号および副信号のエネルギーの算出に、左信号L(n)および右信号R(n)を利用してもよく、例えば左信号L(n)および右信号R(n)のエネルギーを用いてもよい。また、選択部1021−mは、マスキングを考慮して主信号および副信号のエネルギーを算出してもよい。
次に、図7に示す復号装置200について説明する。復号装置200は、通信路を介して符号化装置100から送信されるビットストリームを受信する。図7に示す復号装置200において、逆多重化部201は、ビットストリームを、第1レイヤ〜第Mレイヤそれぞれの符号化レイヤに対応する符号化データCおよびインジケータFと、PCA変換パラメータの量子化符号とに分離する。そして、逆多重化部201は、各符号化レイヤに対応する符号化データCおよびインジケータFを、第1レイヤ〜第Mレイヤそれぞれ
対応する復号部202−1〜202−Mに出力する。また、逆多重化部201は、PCA変換パラメータの量子化符号を逆量子化部205に出力する。
復号部202−1〜202−Mは、それぞれ逆多重化部201から入力されるインジケータFに基づいて、逆多重化部201から入力される符号化データを復号する。例えば、復号部202−mは、インジケータFに示される信号が主信号である場合、符号化データCを用いて主信号を復号する。そして、復号部202−mは、復号信号P (n)を加算器203に出力する。一方、復号部202−mは、インジケータFに示される信号が副信号である場合、符号化データCを用いて副信号を復号する。そして、復号部202−mは、復号信号A (n)を加算器204に出力する。また、復号部202−mは、インジケータFに示される信号以外の信号の復号信号として「0」を加算器203または加算器204に出力する。
加算器203は、復号部202−1〜202−Mからそれぞれ入力される復号信号P (n)を加算する。そして、加算器203は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号主信号P(n)を逆PCA変換部206に出力する。
加算器204は、復号部202−1〜202−Mからそれぞれ入力される復号信号A (n)を加算する。そして、加算器204は、すべての符号化レイヤ(第1レイヤ〜第Mレイヤ)の復号信号が加算された信号である復号副信号A(n)を逆PCA変換部206に出力する。
なお、通信路の状況等によって、ビットストリームの一部が廃棄されてしまう場合がある。例えば、ビットストリームに第mレイヤ(m<M)までの符号化データしか含まれていない場合には、第1レイヤ〜第mレイヤまでの復号部が動作するとともに、これら符号化レイヤに対応する加算器203、204が動作して、復号主信号P(n)および復号副信号A(n)が求められ、復号主信号P(n)および復号副信号A(n)が逆PCA変換部206に出力される。
逆量子化部205は、逆多重化部201から入力される量子化符号を逆量子化し、得られるPCA変換パラメータν およびν を逆PCA変換部206に出力する。
逆PCA変換部206には、加算器203から復号主信号P(n)が入力され、加算器204から復号副信号A(n)が入力され、逆量子化部205からPCA変換パラメータν およびν が入力される。逆PCA変換部206は、復号主信号P(n)および復号副信号A(n)を、PCA変換パラメータν およびν を用いて、式(2)に従って逆PCA変換(inverse PCA transformation)し、ステレオ信号における左信号L(n)および右信号R(n)を得る。
このように、本実施の形態によれば、符号化装置100(図3)は、各符号化レイヤにおいて、主信号および副信号のうち、エネルギーがより高い信号のみを符号化対象として選択する。この結果、各符号化レイヤで符号化される信号は、主信号または副信号のいずれか1つのみであるため、符号化された信号(ビット列に割り当てられた信号)を示すインジケータの情報量(ビット数)は、1ビットのみでよい。つまり、符号化装置100は、各符号化レイヤにおける符号化データのビット割当情報を最小限に抑えることができる。
また、スケーラブル符号化においては、各符号化レイヤにおける主信号および副信号として、下位の符号化レイヤにおける符号化残差信号が入力される。そのため、各符号化レ
イヤにおける入力信号のエネルギーは、下位の符号化レイヤにおける符号化結果に依存して変化する。よって、符号化装置100(図3)が、各符号化レイヤにおいてエネルギーがより高い信号(重要度がより高い信号)を、下位の符号化レイヤにおける符号化結果に応じて適応的に選択することができる。これにより、復号装置200(図7)は、高品質なステレオ信号を復元することができる。
(実施の形態2)
実施の形態1では最下位レイヤである第1レイヤの主信号および副信号に対して適応的残差符号化処理を施したのに対し、本実施の形態では、第1レイヤの主信号に対して、第1レイヤをさらに階層化して分割周波数帯域単位の符号化を行う帯域分割符号化処理を施す。
分割周波数帯域単位のスケーラブル符号化方法としては、例えば、入力信号を複数の帯域に分割し、分割した帯域の信号単位で符号化することでスケーラブル符号化を実現する方法(例えば、米国特許出願公開第2008/0004883号明細書参照)、および、ITU−T勧告G.729.1のレイヤ4以降の符号化(TDAC:Time-Domain Aliasing Cancellation)において、MDCT係数上でサブ帯域単位の符号化を行い、エネルギーの大きいサブ帯域から優先的に符号化データを伝送することでスケーラブル符号化を実現する方法(ITU−T勧告G.729.1(2006)参照)等が検討されている。
帯域分割符号化に基づくスケーラブル符号化において、下位レイヤで符号化対象となる帯域の信号の符号化後の誤差信号(符号化残差信号)が大きい場合には、符号化残差信号が聴感的な復号音質に与える影響は、より上位の符号化レイヤで符号化対象となる帯域の信号が聴感的な復号音質に与える影響よりも大きい。
そこで、本実施の形態では、帯域分割符号化対象の符号化レイヤにおいて、各符号化レイヤより下位レイヤの符号化残差信号を符号化するか否かを適応的に判定する。
図8は本実施の形態に係る符号化装置の構成を示すブロック図である。なお、図8において図3に示す符号化装置100と同一の構成部には同一符号を付し、説明を省略する。
図8に示す符号化装置500において、PCA変換部101は、第1レイヤの主信号P(n)を帯域分割符号化部501に出力し、第1レイヤの副信号A(n)を第2レイヤの副信号A^(n)として適応的残差符号化部102−2に出力する。
帯域分割符号化部501は、PCA変換部101から入力される主信号P(n)を複数の帯域に分割し、分割した分割帯域単位の信号に対して階層的に符号化を行う。ここで、帯域分割符号化部501が第1レイヤから第Lレイヤ(Lは2以上の自然数)までの符号化を行う場合、適応的残差符号化部102−2〜102−Mは第(L+1)レイヤ以降の符号化を順次行う。そして、帯域分割符号化部501は、第Lレイヤまでの各符号化レイヤで生成された符号化データを含む符号化データC、および、第1レイヤの符号化対象の帯域をさらに分割した各帯域(サブ帯域)で生成された判定結果を含むインジケータFを多重化部104に出力する。また、帯域分割符号化部501は、符号化後の符号化残差信号を適応的残差符号化部102−2の入力信号P^(n)として適応的残差符号化部102−2に出力する。
図9は、図8に示す帯域分割符号化部501の内部構成のうち、第1レイヤの符号化処理に関する構成部および第2レイヤ符号化処理に関する構成部への入力信号形成処理に関する構成部を示すブロック図である。
図9に示す帯域分割符号化部501において、帯域分割部551は、PCA変換部101(図8)から入力される第1レイヤの主信号P(n)を、第1レイヤの符号化対象の第1帯域の信号である第1帯域信号Sと、第1帯域信号S以外の信号S”とに分割する。例えば、帯域分割部551は、第1レイヤの主信号P(n)の周波数帯域のうち低域部から所定の周波数帯域までの信号を第1帯域信号Sとする。そして、帯域分割部551は、第1帯域信号Sをサブ帯域分割部552および符号化部553に出力し、第1帯域信号以外の信号S”を信号形成部558に出力する。
サブ帯域分割部552は、帯域分割部551から入力される第1帯域信号Sを複数のサブ帯域信号S1,sb(sb=1,2,…,Nsb、Nsbはサブ帯域分割数)に分割する。そして、サブ帯域分割部552は、分割したサブ帯域信号S1,sbを評価部556および残差算出部557に出力する。
符号化部553は、帯域分割部551から入力される第1帯域信号Sを予め設定された符号化ビットレートで符号化して第1レイヤ符号化データを生成する。そして、符号化部553は、生成した第1レイヤ符号化データを復号部554に出力するとともに、多重化部104(図8)に出力する。
復号部554は、符号化部553から入力される第1レイヤ符号化データを復号して第1レイヤ復号信号S を生成する。そして、復号部554は、生成した第1レイヤ復号信号S をサブ帯域分割部555に出力する。
サブ帯域分割部555は、サブ帯域分割部552と同様にして、復号部554から入力される第1レイヤ復号信号S を複数のサブ帯域信号S 1,sbに分割する。そして、サブ帯域分割部555は、分割したサブ帯域信号S 1,sbを評価部556および残差算出部557に出力する。
評価部556は、サブ帯域分割部552から入力されるサブ帯域信号S1,sbおよびサブ帯域分割部555から入力されるサブ帯域信号S 1,sbを用いて、サブ帯域毎の符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、まず、評価部556は、サブ帯域信号S1,sbおよびサブ帯域信号S 1,sbを用いて、サブ帯域毎の第1レイヤにおける符号化性能に関する評価値を算出する。例えば、評価部556は、評価値として各サブ帯域の符号化残差信号に対するSNR(Signal to Noise Ratio)を用いる。具体的には、評価部556は、第sbサブ帯域におけるSNRsbを式(5)に従って算出する。ただし、第sbサブ帯域におけるサブ帯域信号のサンプル数をP1,sbとする。
Figure 2009144953
そして、評価部556は、算出した各サブ帯域における符号化性能に関する評価値(SNR)に基づき、符号化残差エネルギーが所定の閾値より小さいか否かを判定する。具体的には、評価部556は、各サブ帯域のSNRsbと所定の閾値SNRthrとを比較して、下記の第sbサブ帯域における判定結果F1,sbを生成する。
1,sb = 1 if SNRsb < SNRthr
1,sb = 0 else
つまり、評価部556は、各サブ帯域における評価値(SNR)が所定の閾値より小さい場合(すなわち、符号化残差エネルギーが所定の閾値より大きい場合)、判定結果F1,sbを「1」とし、評価値(SNR)が所定の閾値以上の場合(すなわち、符号化残差エネルギーが所定の閾値以下の場合)、判定結果F1,sbを「0」とする。ここで、評価部556は、SNRthrを予め設定してもよく、入力信号の特性に基づいて設定してもよく、サブ帯域毎に設定してもよい。そして、評価部556は、各サブ帯域の判定結果F1,sbを残差算出部557に出力するとともに、多重化部104(図8)に出力する。
残差算出部557は、評価部556から入力される判定結果F1,sbに基づいて、各サブ帯域における符号化残差信号を算出する。具体的には、残差算出部557は、判定結果F1,sbが「1」である第sbサブ帯域では、サブ帯域分割部552から入力されるサブ帯域信号S1,sbから、サブ帯域分割部555から入力されるサブ帯域信号S 1,sbを減じて第sbサブ帯域における符号化残差信号を算出する。一方、残差算出部557は、判定結果F1,sbが「0」である第sbサブ帯域では符号化残差信号を算出しない。そして、残差算出部557は、判定結果F1,sbが「1」であるサブ帯域のみに符号化残差信号を有する第1帯域全体の符号化残差信号Sr1を信号形成部558に出力する。
信号形成部558は、残差算出部557から入力される符号化残差信号Sr1と帯域分割部551から入力される信号S”とを加算して信号S’を形成する。すなわち、信号S’は、第1レイヤの主信号P(n)の周波数帯域において、第1帯域に符号化残差信号Sr1を有し、第1帯域以外の周波数帯域に信号S”を有する。そして、信号形成部558は、生成した信号S’を第2レイヤの符号化処理に関する構成部(図示せず)に出力する。
また、帯域分割符号化部501は、信号形成部558から出力された信号S’を第2レイヤの入力信号として用いる。そして、第2レイヤでは、帯域分割符号化部501は、第1レイヤと同様にして、入力信号を、第2レイヤで符号化対象とする第2帯域の信号と第2帯域の信号以外の信号とに分割し、第2帯域の信号を予め設定された符号化ビットレートで符号化する。また、帯域分割符号化部501は、第2帯域の信号以外の信号を、第3レイヤの入力信号として用いる。ここで、帯域分割符号化部501は、第1帯域の一部を含む周波数帯域を第2帯域とする。そこで、帯域分割符号化部501は、第2帯域の信号のうち、第1帯域の一部に対応する周波数帯域の信号を優先的に符号化する。具体的には、帯域分割符号化部501は、第2帯域に含まれる第1帯域のうち、サブ帯域の判定結果F1,sbが「1」であるサブ帯域の一部またはすべての符号化残差信号を優先的に符号化する。第3レイヤ以降についても同様である。そして、帯域分割符号化部501は、すべての符号化レイヤの符号化データを含む符号化データCおよび第1帯域の各サブ帯域の判定結果F1,sbを含むインジケータFを多重化部104に出力する。
次いで、信号形成部558で形成した信号S’を図10に示す。図10に示すように、第1レイヤの符号化対象である第1帯域では、判定結果F1,sbが「1」であるサブ帯域のみに符号化レイヤ残差信号が存在する。例えば、図10に示すように、判定結果F1,1が「1」である第1サブ帯域(sb=1)では、符号化残差信号(S1,1−S 1,1)が存在し、判定結果F1,3が「1」である第3サブ帯域(sb=3)では、符号化残差信号(S1,3−S 1,3)が存在する。一方、判定結果F1,2が「0」である第2サブ帯域(sb=2)および判定結果F1,4が「0」である第4サブ帯域(sb=4)では、符号化残差信号が存在しない。また、第1レイヤの符号化対象ではない帯域では、第1レイヤの主信号P(n)の第1帯域以外の周波数帯域の信号S”がそのまま存在する。
これにより、帯域分割符号化部501は、第1帯域の各サブ帯域のうち、符号化残差エネルギーが閾値より大きいサブ帯域の符号化残差信号を入力信号として上位レイヤに出力する。よって、帯域分割符号化部501は、下位レイヤで得る符号化残差信号のうち、符号化残差エネルギーがより高い信号(重要度がより高い信号)のみを上位レイヤで符号化する符号化残差信号として適応的に選択することができる。
次に、本実施の形態に係る復号装置について説明する。図11は復号装置600の構成を示すブロック図である。なお、図11において図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図11に示す復号装置600において、帯域分割復号部601には、逆多重化部201から、符号化装置500の帯域分割符号化部501で生成された各符号化レイヤの符号化データを含む符号化データCおよび第1レイヤの複数のサブ帯域の判定結果F1、sbを含むインジケータFが入力される。帯域分割復号部601は、判定結果F1、sbに基づいて、符号化データCを復号する。具体的には、帯域分割復号部601は、逆多重化部201から入力される各符号化レイヤの符号化データを復号し、生成される復号信号と上位レイヤで生成した復号信号とを加算して各符号化レイヤの復号信号を形成する。そして、帯域分割復号部601は、帯域分割符号化処理を適用した符号化レイヤのうち最下位レイヤである第1レイヤの復号信号を復号信号P (n)として加算器203に出力する。
図12は、図11に示す帯域分割復号部601の内部構成のうち、第2レイヤの復号信号Sを用いて、最下位レイヤである第1レイヤの復号信号P (n)を生成する復号処理に関する構成部を示すブロック図である。
図12に示す帯域分割復号部601において、復号部651は、逆多重化部201(図11)から入力される符号化データCに含まれる第1レイヤ符号化データを復号する。そして、復号部651は、第1レイヤの復号信号S を帯域復号信号形成部653に出力する。
残差信号分離部652は、逆多重化部201から入力される判定結果F1,sbに基づいて、第2レイヤの復号処理に関する構成部(図示せず)から入力される第2レイヤの復号信号S(すなわち、第2レイヤから第Lレイヤで復号された復号信号)を第1帯域の復号残差信号S r1と第1帯域以外の周波数帯域の復号信号Sとに分離する。そして、残差信号分離部652は、第1帯域の復号残差信号S r1を帯域復号信号形成部653に出力し、第1帯域以外の周波数帯域の復号信号Sを復号信号形成部654に出力する。
帯域復号信号形成部653は、逆多重化部201から入力される判定結果F1,sbに基づいて、復号部651から入力される復号信号S および残差信号分離部652から入力される復号残差信号S r1を加算することで、第1帯域の復号信号を形成する。具体的には、帯域復号信号形成部653は、復号信号S と、復号残差信号S r1における判定結果F1,sbが「1」であるサブ帯域の復号残差信号とを加算する。そして、帯域復号信号形成部653は、形成した第1帯域の復号信号を復号信号形成部654に出力する。
復号信号形成部654は、帯域復号信号形成部653から入力される第1帯域の復号信号、および、残差信号分離部652から入力される第1帯域以外の周波数帯域の復号信号Sを用いて復号信号P (n)を形成する。そして、復号信号形成部654は、
形成した復号信号P (n)を加算器203(図11)に出力する。
このように、本実施の形態によれば、符号化装置500(図8)は、主信号P(n)に対して帯域分割符号化に基づくスケーラブル符号化を適用し、ステレオ符号化において聴感的に重要である周波数帯域(特に低域)の信号を適応的に選択して符号化するため、符号化歪をより低減することができる。よって、復号装置600(図11)は、復号音質を向上することができる。
また、本実施の形態によれば、第1レイヤの符号化対象である第1帯域の各サブ帯域のうち、評価値(SNR)が所定の閾値より小さいサブ帯域、つまり、符号化残差エネルギーが所定量より大きいサブ帯域のみを上位レイヤの符号化対象の信号とする。すなわち、各符号化レイヤにおいてエネルギーがより高いサブ帯域の信号(聴感的に重要度がより高いサブ帯域の信号)のみが上位レイヤに入力される。よって、符号化装置500では、帯域分割符号化部501内の各符号化レイヤにおいて、下位レイヤにおける符号化結果に応じて符号化残差エネルギーがより高い信号(重要度がより高い信号)を適応的に符号化するため、復号装置600(図11)は、高品質なステレオ信号を復元することができる。
なお、本実施の形態において、各符号化レイヤにおける符号化対象の信号は、時間領域信号でもよく、周波数領域信号(例えば、MDCT変換後の係数)でもよい。
また、本実施の形態では、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する符号化レイヤは、適応的残差符号化処理を適用する符号化レイヤより下位の符号化レイヤに限定されない。例えば、符号化装置は、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤに対して帯域分割符号化処理を適用してもよい。
また、本実施の形態では、PCA変換後の主信号に対して帯域分割符号化処理を適用する場合について説明した。しかし、本発明では、帯域分割符号化処理を適用する信号はPCA変換後の主信号に限定されない。例えば、符号化装置は、PCA変換後の副信号、適応的残差符号化処理を適用する複数の符号化レイヤの途中の符号化レイヤにおける符号化残差信号、または、PCA変換後の信号以外の任意の入力信号に対して帯域分割符号化処理を適用してもよい。また、符号化装置は、帯域分割符号化処理と適応的残差符号化処理とを組み合わせず、帯域分割符号化処理を単独で適用してもよい。
また、本実施の形態では、帯域分割符号化部において、入力信号の低域部から所定の周波数帯域までの予め設定した周波数帯域を、各符号化レイヤにおける符号化対象の周波数帯域とする場合について説明した。しかし、本発明では、各符号化レイヤにおける符号化対象の周波数帯域として、例えば、入力信号の特性に応じた周波数帯域を適応的に設定してもよい。
また、本実施の形態では、符号化装置が判定結果F1,sbに基づいて第1帯域の各サブ帯域の符号化残差信号を算出するか否かを決定する場合について説明した。しかし、本発明では、符号化装置は判定結果F1,sbによらず第1帯域のすべてのサブ帯域の符号化残差信号を算出してもよい。
以上、本発明の各実施の形態について説明した。
なお、上記実施の形態では、信号の重要度の指標として、信号のエネルギーを用いる場合について説明した。しかし、本発明では、信号の重要度は、信号のエネルギーに限らず
、例えば、信号の信号対雑音比(Signal to Noise Ratio:SNR)でもよい。信号の重要度の指標としてSNRを用いる場合の適応的残差符号化部102−mの選択部3021−mの内部構成について図13のブロック図を用いて説明する。図13に示す選択部3021−mにおいて、符号化部3201−mは、第mレイヤの主信号P^(n)を符号化して符号化データを生成し、復号部3202−mは、第mレイヤの主信号P^(n)の符号化データを復号して第mレイヤの主信号の復号信号P (n)を生成する。そして、減算器3203−mは、第mレイヤの主信号P^(n)から第mレイヤの主信号の復号信号P (n)を減じて、第(m+1)レイヤの主信号P^m+1(n)を生成する。逆PCA変換部3204−mは、第(m+1)レイヤの主信号P^m+1(n)および第mレイヤの副信号A^(n)を逆PCA変換して、左信号L^m1(n)および右信号R^m1(n)を得る。すなわち、符号化部3201−m、復号部3202−m、減算器3203−mおよび逆PCA変換部3204−mは、第mレイヤの主信号P^(n)が符号化された場合(すなわち、選択部3021−mが主信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^m1(n)および右信号R^m1(n))を生成する。そして、測定値算出部3205−mは、左信号L^m1(n)および右信号R^m1(n)を用いて定量的測定値M(すなわち、SNR)を算出する(式(6))。
Figure 2009144953
同様にして、符号化部3206−m、復号部3207−m、減算器3208−mおよび逆PCA変換部3209−mは、第mレイヤの副信号A^(n)が符号化された場合(すなわち、選択部3021−mが副信号を選択した場合)の復号装置200における出力ステレオ信号(左信号L^m2(n)および右信号R^m2(n))を生成する。そして、測定値算出部3210−mは、左信号L^m2(n)および右信号R^m2(n)を用いて定量的測定値M(すなわち、SNR)を算出する(式(7))。
Figure 2009144953
比較部3211−mは、定量的測定値Mおよび定量的測定値Mを比較し、より大きい値の定量的測定値に対応する信号(主信号または副信号)を符号化される信号として選択し、選択された信号を示すインジケータFを出力する。つまり、選択部3021−mは、主信号を符号化した際に復号装置200で得られる出力ステレオ信号、および、副信号を符号化した際に復号装置200で得られる出力ステレオ信号を選択部3021−mの内部で生成する。これにより、選択部3021−mは、定量的測定値として、復号装置200におけるSNRを算出することができる。よって、選択部3021−mは、復号装置200におけるSNRがより高い信号を選択するため、上記実施の形態と同様、ビット割当情報を通知するための情報量を最小限に抑えつつ、符号化効率を向上することができる。なお、信号の重要度を示す定量的測定値は式(6)および式(7)より算出されるSN
Rに限らず、例えば、マスク対雑音比(Mask to Noise Ratio:MNR)でもよい。例えば、ステレオ信号の重要度としてMNRを用いる場合、ステレオ信号における左信号L(n)および右信号R(n)の心理音響的モデル化を含む処理を経て導出することができる。
また、上記実施の形態では、時間領域のステレオ信号に対して本発明を適用する場合について説明した。しかし、本発明は、時間領域のステレオ信号に限らず、別の領域のステレオ信号に対して本発明を適用してもよい。例えば、MDCT(Modified Discrete Cosine Transform)領域のステレオ信号、または、ステレオ信号にLPC分析を施したLPC(Linear Prediction Coefficients)残差信号に対して本発明を適用してもよい。また、本発明は、例えば、MDCT領域のLPC残差信号に対して適用してもよい。
また、本発明に係る符号化装置は、入力信号の帯域を複数のサブ帯域(sub band)に分割し、入力信号の各サブ帯域の信号であるサブ帯域信号に対して本発明を適用してもよい。例えば、入力信号であるステレオ信号の左信号L(n)および右信号R(n)を、K個のサブ帯域に分割して、左信号L(n)のサブ帯域信号L(n)(k=1〜K)、および、右信号R(n)のサブ帯域信号R(n)(k=1〜K)を得る。
例えば、ステレオ信号において、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割した場合について、図14〜図17を用いて説明する。なお、図14は、符号化装置のうち、MDCT領域のLPC残差信号を複数のサブ帯域信号に分割する処理に関する構成部300を示し、図15は、符号化装置のうち、本発明に係る符号化処理に関する構成部350を示す。同様に、図16は、復号装置のうち、本発明に係る復号処理に関する構成部400を示し、図17は、復号装置のうち、複数のサブ帯域信号に分割されたMDCT領域のLPC残差信号を結合してステレオ信号を復元する処理に関する構成部450を示す。なお、図14〜図17において図3に示す符号化装置100または図7に示す復号装置200と同一の構成部には同一符号を付し、説明を省略する。
図14において、LPC分析部301は、ステレオ信号における左信号L(n)を用いて線形予測分析を行い、左信号L(n)のスペクトルの概形を示すLPCパラメータ(線形予測パラメータ)A(z)を得る。量子化部302は、LPCパラメータA(z)を量子化して量子化符号IqLを得る。逆量子化部303は、LPCパラメータの量子化符号IqLを逆量子化し、復号LPCパラメータAdL(z)を得る。逆フィルタ304は、左信号L(n)に対し、復号LPCパラメータAdL(z)を用いて逆フィルタリング(LPC逆フィルタリング)を施すことにより、スペクトルの概形の特徴が取り除かれたフィルタリング後の左信号L(n)を得る。T/F部305は、逆フィルタリング後の左信号L(n)に対してMDCT(すなわち、時間/周波数領域変換)を行い、時間領域の左信号L(n)をMDCT領域(周波数領域)の左信号L(f)を得る。つまり、左信号のMDCT領域のLPC残差信号L(f)が得られる。
帯域分割部306は、左信号のMDCT領域のLPC残差信号L(f)を複数のサブ帯域(ここでは、K個のサブ帯域)に分割し、左信号L(f)のサブ帯域信号Le1(f)〜LeK(f)を生成する。
一方、図14に示すLPC分析部307、量子化部308、逆量子化部309、逆フィルタ310、T/F部311および帯域分割部312は、LPC分析部301から帯域分割部306までの一連の処理と同様の処理を右信号R(n)に施すことで、右信号R(f)のサブ帯域信号Re1(f)〜ReK(f)を生成する。
ここで、例えば、左信号L(f)のサブ帯域信号Le1(f)〜LeK(f)および
右信号R(f)のサブ帯域信号Re1(f)〜ReK(f)のうち、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)に対してのみ本発明を適用する場合について説明する。図15に示すように、PCA変換部351は、サブ帯域信号Le1(f)およびサブ帯域信号Re1(f)をPCA変換し、MDCT領域の主信号P(f)および副信号A(f)を得る。そして、適応的残差符号化部352−1〜352−Mは、上記実施の形態と同様にして、主信号P(f)および副信号A(f)に対して適応的残差符号化処理を施す。多重化部313は、適応的残差符号化部352−1〜352−Mから入力される符号化データCおよびインジケータFと、図14に示す量子化部302および量子化部308からそれぞれ入力されるLPCパラメータの量子化符号IqLおよびIqRとを多重化する。
一方、図16に示す復号装置の逆多重化部401は、ビットストリームに多重化された符号化データCおよびインジケータFを復号部402−1〜402−Mにそれぞれ出力する。また、逆多重化部401は、LPCパラメータの量子化符号IqLおよびIqRを、図17に示す逆量子化部451および逆量子化部455に出力する。復号部402−1〜402−Mは、上記実施の形態と同様にして、符号化データを復号し、MDCT領域の復号信号P (f)およびMDCT領域の復号信号A (f)を得る。逆PCA変換部403は、復号主信号P (f)および復号副信号A (f)を用いて、左信号のサブ帯域信号L e1および右信号のサブ帯域信号R e1を得る。左信号のサブ帯域信号L e1は、図17に示す帯域結合部452に出力され、右信号のサブ帯域信号R e1は、図17に示す帯域結合部456に出力される。
図17に示す逆量子化部451は、LPCパラメータの量子化符号IqLを逆量子化してLPCパラメータAdL(z)を得る。帯域結合部452は、左信号L(f)のサブ帯域信号Le1(f)〜LeK(n)を結合し、MDCT領域の左信号L (f)を得る。F/T部453は、MDCT領域の左信号L (f)に対して逆MDCT(すなわち、周波数/時間領域変換)を行い、時間領域の左信号L (n)を得る。合成フィルタ454は、LPCパラメータAdL(z)を用いて、時間領域の左信号L (n)に対して合成フィルタを掛け、左信号L(n)を得る。
一方、図17に示す逆量子化部455、帯域結合部456、F/T部457および合成フィルタ458は、逆量子化部451、帯域結合部452、F/T部453および合成フィルタ454の一連の処理と同様の処理を量子化符号IqRおよび右信号R(f)のサブ帯域信号Re1(f)〜ReK(n)に対して施すことにより、右信号R(n)を得る。
このように、ステレオ信号のLPC残差信号をMDCT領域に変換して、MDCT領域の信号を複数のサブ帯域に分割して、分割したサブ帯域の信号に対してPCA変換、適応的残差符号化を適用することで、サブ帯域毎に適した効率的な符号化を行うことができる。
また、上記実施の形態では、ステレオ信号をPCA変換する場合、量子化前のPCA変換パラメータ(すなわち、ステレオ信号から算出される共分散行列の固有ベクトルの各要素)を使用する場合について説明した。しかし、本発明では、PCA変換の際に使用するPCA変換パラメータとして、量子化後のPCA変換パラメータを用いてもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、最下位のレイヤである第1レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤでは主信号が副信号よりも重要な情報であるため、符号化装置は、第1レイヤにおいて、適
応的残差符号化処理を省略し、常に主信号を選択してもよい。この場合、符号化装置は、第2レイヤ〜第Mレイヤまでのインジケータを送信すればよい。つまり、第1レイヤのインジケータを送信しなくてよいため、ビット割当情報を1ビット削減することができる。また、符号化装置は、第1レイヤにおいて、主信号および副信号の双方を符号化し、第2レイヤ以降の符号化レイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、本発明では、例えば、最下位のレイヤである第1レイヤから所定の符号化レイヤにおける適応的残差符号化処理を省略してもよい。例えば、第1レイヤ〜第(i−1)レイヤ(iは2以上の自然数)では、符号化装置は、適応的残差符号化処理を省略し、常に主信号を選択してもよい。つまり、符号化装置は、第iレイヤ〜第Mレイヤで本発明を適用してもよい。また、符号化装置は、第1レイヤ〜第(i−1)レイヤにおいて、主信号および副信号の双方を符号化し、第iレイヤ〜第Mレイヤで本発明を適用してもよい。
また、上記実施の形態では、第1レイヤ〜第Mレイヤまでの符号化レイヤにおいて適応的残差符号化処理を行う場合について説明した。しかし、第1レイヤ〜第Mレイヤのうち1つ以上の任意の符号化レイヤで本発明を適用してもよい。
また、PCA変換は、KL変換(KLT:Karhunen Loeve Transform)と呼ばれることもある。
また、上記実施の形態に係る復号装置は、上記実施の形態に係る符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明した。しかし、本発明はこれに限定されず、上記実施の形態に係る復号装置が受信して処理するビットストリームは、上記実施の形態に係る復号装置で処理可能なビットストリームを生成可能な符号化装置が送信したものであればよい。
また、以上の説明は本発明の好適な実施の形態の例証であり、本発明の範囲はこれに限定されることはない。本発明は、符号化装置、復号装置を有するシステムであればどのような場合にも適用することができる。
また、本発明に係る符号化装置および復号装置は、例えば音声符号化装置および音声復号装置等として、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
また、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係るアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る符号化装置と同様の機能を実現することができる。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2008年5月30日出願の特願2008−143863および2008年6月19日出願の特願2008−160954の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る符号化装置および復号装置等は、携帯電話、IP電話、テレビ会議等に用いるに好適である。

Claims (9)

  1. 入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して第1レイヤの主信号および第1レイヤの副信号を生成する変換手段と、
    第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、第m(mは1以上M以下の自然数)レイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、前記重要度が高い信号を選択する第mレイヤの選択手段と、
    第1レイヤから第Mレイヤにおいて、前記第mレイヤの選択手段で選択された信号を符号化して第mレイヤの符号化データを生成する第mレイヤの符号化手段と、
    第1レイヤから第M−1レイヤにおいて、前記第mレイヤの符号化データを復号して第mレイヤの復号信号を生成する第mレイヤの復号手段と、
    第1レイヤから第M−1レイヤにおいて、前記第mレイヤの選択手段で選択された信号から前記第mレイヤの復号信号を減じて得られる信号、および、前記第mレイヤの選択手段で選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する第mレイヤの減算手段と、
    第1レイヤから第Mレイヤまでの符号化データ、および、第1レイヤから第Mレイヤまでの選択手段で選択された信号を示す信号情報を送信する送信手段と、
    を具備する符号化装置。
  2. 前記選択手段は、第1レイヤにおいて、前記主信号を常に選択し、
    前記送信手段は、第2レイヤから第Mレイヤまでの前記信号情報を送信する、
    請求項1記載の符号化装置。
  3. 前記選択手段は、第1レイヤから第i−1レイヤ(iは2以上M以下の自然数)において、前記主信号を常に選択し、
    前記送信手段は、第iレイヤから第Mレイヤまでの前記信号情報を送信する、
    請求項1記載の符号化装置。
  4. 前記重要度は、信号のエネルギーで表される指標である、
    請求項1記載の符号化装置。
  5. 前記重要度は、信号対雑音比で表される指標である、
    請求項1記載の符号化装置。
  6. 前記重要度は、マスク対雑音比で表される指標である、
    請求項1記載の符号化装置。
  7. 入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して得られる主信号および副信号が第1レイヤから第M(Mは2以上の自然数)レイヤで符号化された第1レイヤから第Mレイヤまでの符号化データ、および、第1レイヤから第Mレイヤまでの各レイヤで符号化された信号を示す信号情報を受信する受信手段と、
    第m(m=1〜M、mは自然数)レイヤにおいて、第mレイヤの前記信号情報に基づいて、第mレイヤの前記符号化データを復号して第mレイヤの復号信号を得る復号手段と、
    第1レイヤから第Mレイヤまでの復号信号を加算して、前記主信号および前記副信号を生成する加算手段と、
    前記主信号および前記副信号を用いて前記主成分分析変換の逆変換を行って前記第1チャネルおよび前記第2チャネルを得る逆変換手段と、
    を具備する復号装置。
  8. 入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して第1レイヤの主信号および第1レイヤの副信号を生成する変換工程と、
    第1レイヤから第M(Mは2以上の自然数)レイヤにおいて、第m(mは1以上M以下の自然数)レイヤの主信号の重要度と第mレイヤの副信号の重要度とを比較し、前記重要度が高い信号を選択する第mレイヤの選択工程と、
    第1レイヤから第Mレイヤにおいて、前記第mレイヤの選択工程で選択された信号を符号化して第mレイヤの符号化データを生成する第mレイヤの符号化工程と、
    第1レイヤから第M−1レイヤにおいて、前記第mレイヤの符号化データを復号して第mレイヤの復号信号を生成する第mレイヤの復号工程と、
    第1レイヤから第M−1レイヤにおいて、前記第mレイヤの選択工程で選択された信号から前記第mレイヤの復号信号を減じて得られる信号、および、前記第mレイヤの選択工程で選択されなかった信号を、第m+1レイヤの主信号および第m+1レイヤの副信号として生成する第mレイヤの減算工程と、
    第1レイヤから第Mレイヤまでの符号化データおよび、第1レイヤから第Mレイヤまでの選択工程で選択された信号を示す信号情報を送信する送信工程と、
    を具備する符号化方法。
  9. 入力ステレオ信号の第1チャネル信号および第2チャネル信号を主成分分析変換して得られる主信号および副信号が第1レイヤから第M(Mは2以上の自然数)レイヤで符号化された第1レイヤから第Mレイヤまでの符号化データ、および、第1レイヤから第Mレイヤまでの各レイヤで符号化された信号を示す信号情報を受信する受信工程と、
    第m(m=1〜M、mは自然数)レイヤにおいて、第mレイヤの前記信号情報に基づいて、第mレイヤの前記符号化データを復号して第mレイヤの復号信号を得る復号工程と、
    第1レイヤから第Mレイヤまでの復号信号を加算して、前記主信号および前記副信号を生成する加算工程と、
    前記主信号および前記副信号を用いて前記主成分分析変換の逆変換を行って前記第1チャネルおよび前記第2チャネルを得る逆変換工程と、
    を具備する復号方法。
JP2010514382A 2008-05-30 2009-05-29 符号化装置、復号装置およびこれらの方法 Expired - Fee Related JP5383676B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010514382A JP5383676B2 (ja) 2008-05-30 2009-05-29 符号化装置、復号装置およびこれらの方法

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2008143863 2008-05-30
JP2008143863 2008-05-30
JP2008160954 2008-06-19
JP2008160954 2008-06-19
PCT/JP2009/002384 WO2009144953A1 (ja) 2008-05-30 2009-05-29 符号化装置、復号装置およびこれらの方法
JP2010514382A JP5383676B2 (ja) 2008-05-30 2009-05-29 符号化装置、復号装置およびこれらの方法

Publications (2)

Publication Number Publication Date
JPWO2009144953A1 true JPWO2009144953A1 (ja) 2011-10-06
JP5383676B2 JP5383676B2 (ja) 2014-01-08

Family

ID=41376842

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010514382A Expired - Fee Related JP5383676B2 (ja) 2008-05-30 2009-05-29 符号化装置、復号装置およびこれらの方法

Country Status (4)

Country Link
US (1) US8452587B2 (ja)
EP (1) EP2287836B1 (ja)
JP (1) JP5383676B2 (ja)
WO (1) WO2009144953A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8452587B2 (en) * 2008-05-30 2013-05-28 Panasonic Corporation Encoder, decoder, and the methods therefor
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
CN102598124B (zh) 2009-10-30 2013-08-28 松下电器产业株式会社 编码装置、解码装置及其方法
US8942989B2 (en) 2009-12-28 2015-01-27 Panasonic Intellectual Property Corporation Of America Speech coding of principal-component channels for deleting redundant inter-channel parameters
PL3779977T3 (pl) * 2010-04-13 2023-11-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji
WO2011132368A1 (ja) * 2010-04-19 2011-10-27 パナソニック株式会社 符号化装置、復号装置、符号化方法及び復号方法
CN101950562A (zh) * 2010-11-03 2011-01-19 武汉大学 基于音频关注度的分级编码方法及系统
TW201223551A (en) * 2010-12-01 2012-06-16 guo-sheng Zhuang Hair dye containing one or multiple edible pigments or cosmetic pigments and hair dyeing method using the same
JP5648123B2 (ja) * 2011-04-20 2015-01-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 音声音響符号化装置、音声音響復号装置、およびこれらの方法
US9530419B2 (en) * 2011-05-04 2016-12-27 Nokia Technologies Oy Encoding of stereophonic signals
JP5998467B2 (ja) * 2011-12-14 2016-09-28 富士通株式会社 復号装置、復号方法、及び復号プログラム
CN102682779B (zh) * 2012-06-06 2013-07-24 武汉大学 面向3d音频的双声道编解码方法和编解码器
US10499176B2 (en) 2013-05-29 2019-12-03 Qualcomm Incorporated Identifying codebooks to use when coding spatial components of a sound field
US20150025894A1 (en) * 2013-07-16 2015-01-22 Electronics And Telecommunications Research Institute Method for encoding and decoding of multi channel audio signal, encoder and decoder
EP2838086A1 (en) * 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
CN105336334B (zh) * 2014-08-15 2021-04-02 北京天籁传音数字技术有限公司 多声道声音信号编码方法、解码方法及装置
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
CN105632505B (zh) * 2014-11-28 2019-12-20 北京天籁传音数字技术有限公司 主成分分析pca映射模型的编解码方法及装置
CN113196387B (zh) * 2019-01-13 2024-10-18 华为技术有限公司 一种用于音频编解码的计算机实现的方法和电子设备

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2682334B2 (ja) * 1992-05-29 1997-11-26 日本電気株式会社 画像信号の符号化伝送方法
US6571227B1 (en) * 1996-11-04 2003-05-27 3-Dimensional Pharmaceuticals, Inc. Method, system and computer program product for non-linear mapping of multi-dimensional data
JP3495336B2 (ja) * 2001-01-29 2004-02-09 日本電信電話株式会社 画像符号化方法及び装置並びに画像復号化方法及び装置
WO2003077425A1 (fr) * 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
US7437299B2 (en) * 2002-04-10 2008-10-14 Koninklijke Philips Electronics N.V. Coding of stereo signals
WO2003085645A1 (en) * 2002-04-10 2003-10-16 Koninklijke Philips Electronics N.V. Coding of stereo signals
EP1851866B1 (en) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
BRPI0608753B1 (pt) * 2005-03-30 2019-12-24 Koninl Philips Electronics Nv codificador de áudio, decodificador de áudio, método para codificar um sinal de áudio de multicanal, método para gerar um sinal de áudio de multicanal, sinal de áudio de multicanal codificado, e meio de armazenamento
KR100818268B1 (ko) * 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP4948401B2 (ja) * 2005-05-31 2012-06-06 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US8081764B2 (en) * 2005-07-15 2011-12-20 Panasonic Corporation Audio decoder
FR2898725A1 (fr) * 2006-03-15 2007-09-21 France Telecom Dispositif et procede de codage gradue d'un signal audio multi-canal selon une analyse en composante principale
US20080004883A1 (en) 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
JP5078337B2 (ja) 2006-12-12 2012-11-21 日本エンバイロケミカルズ株式会社 イソチアゾリン化合物および工業用殺菌組成物
JP2008160954A (ja) 2006-12-22 2008-07-10 Nec Corp 2次電池残量を報知する電子機器、それに用いられる2次電池残量報知方法及びプログラム
CN101802907B (zh) * 2007-09-19 2013-11-13 爱立信电话股份有限公司 多信道音频的联合增强
WO2009116280A1 (ja) * 2008-03-19 2009-09-24 パナソニック株式会社 ステレオ信号符号化装置、ステレオ信号復号装置およびこれらの方法
US8452587B2 (en) * 2008-05-30 2013-05-28 Panasonic Corporation Encoder, decoder, and the methods therefor
EP2293292B1 (en) * 2008-06-19 2013-06-05 Panasonic Corporation Quantizing apparatus, quantizing method and encoding apparatus

Also Published As

Publication number Publication date
WO2009144953A1 (ja) 2009-12-03
EP2287836A1 (en) 2011-02-23
EP2287836B1 (en) 2014-10-15
US20110046946A1 (en) 2011-02-24
JP5383676B2 (ja) 2014-01-08
US8452587B2 (en) 2013-05-28
EP2287836A4 (en) 2013-10-30

Similar Documents

Publication Publication Date Title
JP5383676B2 (ja) 符号化装置、復号装置およびこれらの方法
US8457319B2 (en) Stereo encoding device, stereo decoding device, and stereo encoding method
EP1808684B1 (en) Scalable decoding apparatus
RU2488897C1 (ru) Кодирующее устройство, декодирующее устройство и способ
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
JP4859670B2 (ja) 音声符号化装置および音声符号化方法
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
EP2345027B1 (en) Energy-conserving multi-channel audio coding and decoding
JP5413839B2 (ja) 符号化装置および復号装置
JP4606418B2 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
JPWO2006129615A1 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131001

R150 Certificate of patent or registration of utility model

Ref document number: 5383676

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees