JPWO2011045927A1 - 符号化装置、復号装置およびこれらの方法 - Google Patents

符号化装置、復号装置およびこれらの方法 Download PDF

Info

Publication number
JPWO2011045927A1
JPWO2011045927A1 JP2011536038A JP2011536038A JPWO2011045927A1 JP WO2011045927 A1 JPWO2011045927 A1 JP WO2011045927A1 JP 2011536038 A JP2011536038 A JP 2011536038A JP 2011536038 A JP2011536038 A JP 2011536038A JP WO2011045927 A1 JPWO2011045927 A1 JP WO2011045927A1
Authority
JP
Japan
Prior art keywords
encoding
information
layer
gain
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011536038A
Other languages
English (en)
Other versions
JP5544371B2 (ja
Inventor
智史 山梨
智史 山梨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011536038A priority Critical patent/JP5544371B2/ja
Publication of JPWO2011045927A1 publication Critical patent/JPWO2011045927A1/ja
Application granted granted Critical
Publication of JP5544371B2 publication Critical patent/JP5544371B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

各レイヤにおいて符号化対象となる帯域を選択するスケーラブル符号化方法において、現レイヤのエネルギ情報を効率的に符号化し、復号信号の品質を改善することができる符号化装置を開示する。この符号化装置(101)は、周波数領域を分割した複数のサブバンドの中から第1入力信号として第1レイヤ差分スペクトルの第1量子化対象帯域を選択してこの帯域の第1帯域情報を含む第2レイヤ符号化情報を生成する第2レイヤ符号化部(205)と、第2レイヤ符号化情報を用いて第1復号信号を生成する第2レイヤ復号部(206)と、第1入力信号と第1復号信号とを用いて第2入力信号である第2レイヤ差分スペクトルを生成する加算部(207)と、第2入力信号の第2量子化対象帯域を選択して求めた第2帯域情報と第1帯域情報及び第2帯域情報を用いて補正された利得(エネルギ情報)とを含む第3レイヤ符号化情報を生成する第3レイヤ符号化部(208)と、を具備する。

Description

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置、復号装置およびこれらの方法に関する。
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、より広帯域の音声・楽音信号を高品質に符号化する技術に対するニーズが高まっている。
このようなニーズに対して、複数の符号化技術を階層的に統合する様々な技術が開発されてきている。例えば非特許文献1では、基本構成単位をモジュール化されたTwinVQ(Transform Domain Weighted Interleave Vector Quantization;周波数領域重み付きインターリーブベクトル量子化)を用いて所望の周波数帯域のスペクトル(MDCT(Modified Discrete Cosine Transform)係数)を階層的に符号化する手法が開示されている。当該モジュールを共通化して複数回使用することにより、シンプルかつ自由度の高いスケーラブル符号化を実現できる。この手法では、各階層(レイヤ)の符号化対象となるサブバンドは予め定められている構成が基本となるが、入力信号の性質に応じて各階層(レイヤ)の符号化対象となるサブバンドの位置を予め定められた帯域の中で変動させる構成も開示されている。
神明夫他、「階層的変換符号化基本モジュールによって構成されるスケーラブル楽音符号化(Scalable Audio Coding Based on Hierarchical Transform Coding Modules)」、電子情報通信学会論文誌A, Vol. J83-A, No.3, pp.241-252, 2000年3月
しかしながら、上記非特許文献1では、各階層(レイヤ)において符号化対象となるサブバンドを複数の候補から選択する場合において、選択したサブバンドが既に下位レイヤで符号化されているかどうかを考慮せずに符号化を行っている。したがって、例えば、既に下位レイヤで選択されたサブバンドのエネルギ情報をベクトル量子化する際には、各サブバンドの残差エネルギの大きさに関係なくベクトル量子化することになり、高い符号化性能を得ることができないといった問題点がある。
本発明の目的は、各階層(レイヤ)において符号化対象となる帯域を選択するスケーラブル符号化方式において、現レイヤのエネルギ情報を効率的に符号化し、復号信号の品質を改善することができる符号化装置、復号装置およびこれらの方法を提供することである。
本発明に係る符号化装置の一つの態様は、少なくとも2つの符号化レイヤを有する符号化装置であって、周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化手段と、前記第2入力信号と前記第1符号化情報とを入力し、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択して第2帯域情報を求めるとともに、前記第2量子化対象帯域の前記第2入力信号の利得を求め、前記第1符号化情報を用いて、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2帯域情報と前記利得を符号化して得られる利得符号化情報とを含む第2符号化情報を生成する第2レイヤ符号化手段と、を具備する。
本発明に係る復号装置の一つの態様は、少なくとも2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号装置であって、前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む前記第1符号化情報と、前記第1符号化情報を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信手段と、前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号手段と、前記情報から得られる前記第1符号化情報及び前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する信号に、前記第1符号化情報及び前記第2符号化情報を用いた補正を行って第2復号信号を生成する第2レイヤ復号手段と、を具備する。
本発明に係る符号化方法の一つの態様は、少なくとも2つの符号化レイヤで符号化を行う符号化方法であって、周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化ステップと、前記第2入力信号と前記第1符号化情報とを入力し、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択して第2帯域情報を求めるとともに、前記第2量子化対象帯域の前記第2入力信号の利得を求め、前記第1符号化情報を用いて、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2帯域情報と前記利得を符号化して得られる利得符号化情報とを含む第2符号化情報を生成する第2レイヤ符号化ステップと、を具備する。
本発明に係る復号方法の一つの態様は、少なくとも2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号方法であって、前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む前記第1符号化情報と、前記第1符号化情報を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信ステップと、前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号ステップと、前記情報から得られる前記第1符号化情報及び前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する信号に、前記第1符号化情報及び前記第2符号化情報を用いた補正を行って第2復号信号を生成する第2レイヤ復号ステップと、を具備する。
本発明によれば、符号化対象とする帯域を階層(レイヤ)毎に選択する階層符号化(スケーラブル符号化)方式において、下位レイヤの符号化結果(量子化された帯域)に基づいて現レイヤの量子化対象帯域のエネルギ情報の符号化方法を切り替えることにより、効率的にエネルギ情報を符号化でき、その結果復号信号の品質を改善することができる。
本発明の一実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図 図1に示した符号化装置の内部の主要な構成を示すブロック図 図2に示した第2レイヤ符号化部の内部の主要な構成を示すブロック図 上記実施の形態に係るリージョンの構成を示す図 図2に示した第2レイヤ復号部の内部の主要な構成を示すブロック図 図2に示した第3レイヤ符号化部の内部の主要な構成を示すブロック図 図1に示した復号装置の内部の主要な構成を示すブロック図 図7に示した第3レイヤ復号部の内部の主要な構成を示すブロック図
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。
(実施の形態)
図1は、本発明の実施の形態に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図1において、通信システムは、符号化装置101と復号装置103とを備え、それぞれ伝送路102を介して通信可能な状態となっている。なお、符号化装置101および復号装置103はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。
符号化装置101は、入力信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をx(n)と表すこととする。n(n=0、…、N−1)は、Nサンプルずつ区切られた入力信号のうち、信号要素のn+1番目を示す。符号化装置101は、符号化された入力情報(以下「符号化情報」という)を、伝送路102を介して復号装置103に送信する。
復号装置103は、伝送路102を介して符号化装置101から送信された符号化情報を受信し、これを復号し出力信号を得る。
図2は、図1に示した符号化装置101の内部の主要な構成を示すブロック図である。符号化装置101は、一例として3つの符号化階層(レイヤ)からなる階層符号化装置とする。ここで、ビットレートの低い方から順に、第1レイヤ、第2レイヤ、第3レイヤと呼ぶことにする。
第1レイヤ符号化部201は、入力信号に対して、例えばCELP(Code Excited Linear Prediction)方式の音声符号化方法を用いて符号化を行って、第1レイヤ符号化情報を生成し、生成した第1レイヤ符号化情報を第1レイヤ復号部202および符号化情報統合部209に出力する。
第1レイヤ復号部202は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って、第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号を加算部203に出力する。
加算部203は、第1レイヤ復号信号の極性を反転させて、入力信号に加算することにより、入力信号と第1レイヤ復号信号との差分信号を算出し、得られた差分信号を第1レイヤ差分信号として直交変換処理部204に出力する。
直交変換処理部204は、バッファbuf1(n)(n=0、…、N−1)を内部に有し、第1レイヤ差分信号x1(n)を修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)することにより、周波数領域パラメータ(周波数領域信号)に変換する。
次に、直交変換処理部204における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。
まず、直交変換処理部204は、下記の式(1)によりバッファbuf1(n)を、「0」を初期値として初期化する。
Figure 2011045927
次いで、直交変換処理部204は、下記の式(2)に従って、第1レイヤ差分信号x1(n)に対し修正離散コサイン変換(MDCT)を行い、第1レイヤ差分信号x1(n)のMDCT係数(以下「第1レイヤ差分スペクトル」と呼ぶ)X1(k)を求める。
Figure 2011045927
ここで、kは1フレームにおける各サンプルのインデックスを示す。直交変換処理部204は、第1レイヤ差分信号x1(n)とバッファbuf1(n)とを結合させたベクトルであるx1’(n)を下記の式(3)により求める。
Figure 2011045927
次に、直交変換処理部204は、式(4)によりバッファbuf1(n)を更新する。
Figure 2011045927
そして、直交変換処理部204は、第1レイヤ差分スペクトルX1(k)を第2レイヤ符号化部205、および加算部207に出力する。
第2レイヤ符号化部205は、直交変換処理部204から入力される第1レイヤ差分スペクトルX1(k)を用いて第2レイヤ符号化情報を生成し、生成した第2レイヤ符号化情報を、第2レイヤ復号部206、第3レイヤ符号化部208、および符号化情報統合部209に出力する。なお、第2レイヤ符号化部205の詳細については後述する。
第2レイヤ復号部206は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報を復号し、第2レイヤ復号スペクトルを算出する。次に、第2レイヤ復号部206は、生成した第2レイヤ復号スペクトルを加算部207に出力する。なお、第2レイヤ復号部206の詳細については後述する。
加算部207は、第2レイヤ復号スペクトルの極性を反転させて、第1レイヤ差分スペクトルに加算することにより、第1レイヤ差分スペクトルと第2レイヤ復号スペクトルとの差分スペクトルを算出し、得られた差分スペクトルを第2レイヤ差分スペクトルとして第3レイヤ符号化部208に出力する。
第3レイヤ符号化部208は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報と、加算部207から入力される第2レイヤ差分スペクトルとを用いて第3レイヤ符号化情報を生成し、生成した第3レイヤ符号化情報を符号化情報統合部209に出力する。なお、第3レイヤ符号化部208の詳細については後述する。
符号化情報統合部209は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報と、第2レイヤ符号化部205から入力される第2レイヤ符号化情報と、第3レイヤ符号化部208から入力される第3レイヤ符号化情報とを統合する。そして、符号化情報統合部209は、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路102に出力する。
図3は、第2レイヤ符号化部205の主要な構成を示すブロック図である。
この図において、第2レイヤ符号化部205は、帯域選択部301、形状符号化部302、利得符号化部303、および多重化部304を備える。
帯域選択部301は、直交変換処理部204から入力される第1レイヤ差分スペクトルを複数のサブバンドに分割し、複数のサブバンドから量子化対象となる帯域(量子化対象帯域)を選択し、選択した帯域を示す帯域情報を形状符号化部302、多重化部304に出力する。また、帯域選択部301は、第1レイヤ差分スペクトルを形状符号化部302に出力する。なお、形状符号化部302への第1レイヤ差分スペクトルの入力は、直交変換処理部204から帯域選択部301への入力とは別に、直交変換処理部204から形状符号化部302へ直接入力されるようにしても良い。帯域選択部301の処理の詳細は後述する。
形状符号化部302は、帯域選択部301から入力される第1レイヤ差分スペクトルのうち、帯域選択部301から入力される帯域情報が示す帯域に対応するスペクトル(MDCT係数)を用いて形状情報の符号化を行って形状符号化情報を生成し、生成した形状符号化情報を多重化部304に出力する。また、形状符号化部302は、形状符号化時に算出される理想利得(利得情報)を求め、求められた理想利得を利得符号化部303に出力する。形状符号化部302の処理の詳細は後述する。
利得符号化部303には、形状符号化部302から理想利得が入力される。利得符号化部303は、形状符号化部302から入力される理想利得を量子化して利得符号化情報を得る。利得符号化部303は、得られる利得符号化情報を多重化部304に出力する。利得符号化部303の処理の詳細は後述する。
多重化部304は、帯域選択部301から入力される帯域情報、形状符号化部302から入力される形状符号化情報、および利得符号化部303から入力される利得符号化情報を多重化し、得られるビットストリームを第2レイヤ符号化情報として、第2レイヤ復号部206、第3レイヤ符号化部208、および符号化情報統合部209に出力する。
上記のような構成を有する第2レイヤ符号化部205は以下の動作を行う。
帯域選択部301には、直交変換処理部204から第1レイヤ差分スペクトルX1(k)が入力される。
帯域選択部301は、まず、第1レイヤ差分スペクトルX1(k)を複数のサブバンドに分割する。ここでは、J(Jは自然数)個のサブバンドに均等に分割する場合を例に挙げて説明する。そして、帯域選択部301は、J個のサブバンドの中で連続するL(Lは自然数)個のサブバンドを選択し、M(Mは自然数)種類のサブバンドのグループを得る。以下、このM種類のサブバンドのグループをリージョンと呼ぶ。
図4は、帯域選択部301において得られるリージョンの構成を例示する図である。
この図において、サブバンドの数は17個(J=17)であり、リージョンの種類は8種類(M=8)であり、各リージョンは連続する5個(L=5)のサブバンドで構成されている。そのうち、例えばリージョン4はサブバンド6〜10からなる。
次いで、帯域選択部301は、下記の式(5)に従い、M種類の各リージョンの平均エネルギE1(m)を算出する。
Figure 2011045927
この式において、jはJ個の各サブバンドのインデックスを示し、mは、M種類の各リージョンのインデックスを示す。なお、S(m)は、リージョンmを構成するL個のサブバンドのインデックスのうちの最小値を示し、B(j)は、サブバンドjを構成する複数のMDCT係数のインデックスのうちの最小値を示す。W(j)は、サブバンドjのバンド幅を示し、以下の説明では、J個の各サブバンドのバンド幅が全て等しい場合、すなわちW(j)が定数である場合を例にとって説明する。
次に、帯域選択部301は、平均エネルギE1(m)が最大となるリージョン、例えばサブバンドj”〜(j”+L−1)からなる帯域を量子化対象となる帯域(量子化対象帯域)として選択し、このリージョンを示すインデックスm_maxを帯域情報として形状符号化部302、および多重化部304に出力する。また、帯域選択部301は、量子化対象帯域の第1レイヤ差分スペクトルX1(k)を形状符号化部302に出力する。なお、以下の説明では、帯域選択部301で選択した量子化対象帯域を示すバンドインデックスをj”〜(j”+L−1)とする。
形状符号化部302は、帯域選択部301から入力される帯域情報m_maxが示す帯域に対応する第1レイヤ差分スペクトルX1(k)に対して、サブバンド毎に形状量子化を行う。具体的には、形状符号化部302はL個の各サブバンド毎に、SQ個の形状コードベクトルからなる内蔵の形状コードブックを探索して、下記の式(6)の評価尺度Shape_q(i)が最大となる形状コードベクトルのインデックスを求める。
Figure 2011045927
この式において、SC は形状コードブックを構成する形状コードベクトルを示し、iは形状コードベクトルのインデックスを示し、kは形状コードベクトルの要素のインデックスを示す。
形状符号化部302は、上記の式(6)の評価尺度Shape_q(i)が最大となる形状コードベクトルのインデックスS_maxを形状符号化情報として多重化部304に出力する。また、形状符号化部302は、下記の式(7)に従い、理想利得Gain_i(j)を算出し、算出した理想利得Gain_i(j)を利得符号化部303に出力する。
Figure 2011045927
利得符号化部303は、下記の式(8)に従い、形状符号化部302から入力される理想利得Gain_i(j)を量子化する。ここで、利得符号化部303は、理想利得をL次元ベクトルとして扱い、GQ個の利得コードベクトルからなる内蔵の利得コードブックを探索して、ベクトル量子化を行う。
Figure 2011045927
ここでは、上記の式(8)の二乗誤差Gain_q(i)を最小にする利得コードブックのインデックスをG_minと記す。
利得符号化部303は、G_minを利得符号化情報として多重化部304に出力する。
多重化部304は、帯域選択部301から入力される帯域情報m_max、形状符号化部302から入力される形状符号化情報S_max、および利得符号化部303から入力される利得符号化情報G_minを多重化し、得られるビットストリームを第2レイヤ符号化情報として第2レイヤ復号部206、第3レイヤ符号化部208、および符号化情報統合部209に出力する。
図5は、第2レイヤ復号部206の主要な構成を示すブロック図である。
この図において、第2レイヤ復号部206は、分離部401、形状復号部402、および利得復号部403を備える。
分離部401は、第2レイヤ符号化部205から出力される第2レイヤ符号化情報から帯域情報、形状符号化情報、および利得符号化情報を分離し、得られる帯域情報および形状符号化情報を形状復号部402に出力し、利得符号化情報を利得復号部403に出力する。
形状復号部402は、分離部401から入力される形状符号化情報を復号することにより、分離部401から入力される帯域情報が示す量子化対象帯域に対応するMDCT係数の形状の値を求め、求めた形状の値を利得復号部403に出力する。形状復号部402の処理の詳細は後述する。
利得復号部403は、内蔵の利得コードブックを用いて、分離部401から入力される利得符号化情報を逆量子化して利得値を得る。利得復号部403は、得られる利得値、および形状復号部402から入力される形状の値を用いて、量子化対象帯域の復号MDCT係数を求め、求めた復号MDCT係数を第2レイヤ復号スペクトルとして加算部207に出力する。利得復号部403の処理の詳細は後述する。
上記のような構成を有する第2レイヤ復号部206は以下の動作を行う。
分離部401は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報から帯域情報m_max、形状符号化情報S_max、および利得符号化情報G_minを分離し、得られる帯域情報m_maxおよび形状符号化情報S_maxを形状復号部402に出力し、利得符号化情報G_minを利得復号部403に出力する。
形状復号部402は、第2レイヤ符号化部205の形状符号化部302が備える形状コードブックと同様な形状コードブックを内蔵し、分離部401から入力される形状符号化情報S_maxをインデックスとする形状コードベクトルを探索する。形状復号部402は、探索した形状コードベクトルを、分離部401から入力される帯域情報m_maxが示す量子化対象帯域のMDCT係数の形状の値として利得復号部403に出力する。ここでは、形状の値として探索された形状コードベクトルをShape_q’(k)(k=B(j”),…,B(j”+L)−1)と記す。
利得復号部403は、第2レイヤ符号化部205の利得符号化部303が備える利得コードブックと同様な利得コードブックを内蔵し、下記の式(9)に従い利得の値を逆量子化する。ここでも、利得値をL次元ベクトルとして扱い、ベクトル逆量子化を行う。すなわち、利得符号化情報G_minに対応する利得コードベクトルGC G_minを、直接利得値とする。
Figure 2011045927
次いで、利得復号部403は、現フレームの逆量子化で得られる利得値、および形状復号部402から入力される形状の値を用いて、下記の式(10)に従い、第2レイヤ復号スペクトルX2”(k)として復号MDCT係数を算出する。また、復号MDCT係数の逆量子化において、kがB(j”)〜B(j”+1)−1内に存在する場合、利得値はGain_q’(j”)の値をとる。
Figure 2011045927
利得復号部403は、上記の式(10)に従い算出された第2レイヤ復号スペクトルX2”(k)を加算部207に出力する。
図6は、第3レイヤ符号化部208の主要な構成を示すブロック図である。
この図において、第3レイヤ符号化部208は、帯域選択部301、形状符号化部302、利得補正係数設定部601、利得符号化部602、および多重化部304を備える。なお、帯域選択部301、および形状符号化部302については、入出力される情報の名称が異なるという点以外は、第2レイヤ符号化部205内の構成要素と同一であるため、同一の符号を付し、説明は省略する。
利得補正係数設定部601には、帯域選択部301から帯域情報が入力される。この帯域情報は、第3レイヤ符号化部208にて符号化対象として選択された帯域の情報であり、以下「第3レイヤ帯域情報」と呼ぶ。
また、利得補正係数設定部601には、第2レイヤ符号化部205から第2レイヤ符号化情報が入力される。この第2レイヤ符号化情報には、第2レイヤ符号化部205にて符号化対象として選択された帯域の情報が含まれる。以下、第2レイヤ符号化部205にて符号化対象として選択された帯域の情報を、「第2レイヤ帯域情報」と呼ぶ。
利得補正係数設定部601は、第2レイヤ帯域情報、および第3レイヤ帯域情報から、第3レイヤ帯域情報が示す各サブバンドに対して、利得情報を量子化する際に利用する補正係数を設定する。
具体的には、第3レイヤ帯域情報が示すサブバンドに、第2レイヤ帯域情報が示すサブバンドが含まれていない場合(つまり、第3レイヤ符号化部208が、第2レイヤ符号化部205では符号化対象として選択されていない帯域を符号化する場合)には、以下の式(11)のように利得補正係数γを設定する。
Figure 2011045927
また、第3レイヤ帯域情報が示す各サブバンドに、第2レイヤ帯域情報が示すサブバンドが含まれている場合(つまり、第3レイヤ符号化部208が、第2レイヤ符号化部205で符号化対象として選択された帯域を再度符号化する場合)には、以下の式(12)のように利得補正係数γを設定する。
Figure 2011045927
利得補正係数設定部601は、設定した利得補正係数γを利得符号化部602に出力する。
利得符号化部602には、形状符号化部302から理想利得が入力される。また、利得符号化部602には、利得補正係数設定部601から利得補正係数γが入力される。利得符号化部602は、式(13)のようにして、形状符号化部302から入力される理想利得を利得補正係数γで割ることにより、理想利得を補正する。
Figure 2011045927
次に、利得符号化部602は、式(13)に従い、利得補正係数γを用いて補正した理想利得Gain_i’(j)を量子化し、利得符号化情報を得る。
具体的には、利得符号化部602は、式(13)に従い、利得補正係数γを用いて補正した理想利得Gain_i’(j)を利用し、L個の各サブバンド毎に、GQ個の利得コードベクトルからなる内蔵の利得コードブックを探索して、式(14)の二乗誤差Gainq_i(i)が最小となる利得コードベクトルのインデックスを求める。
Figure 2011045927
この式において、GC は利得コードブックを構成する利得コードベクトルを示し、iは利得コードベクトルのインデックスを示し、jは利得コードベクトルの要素のインデックスを示す。例えば、リージョンを構成するサブバンド数が5の場合(L=5の場合)、jは0〜4の値を取る。なお、利得符号化部602は、1リージョン内のL個のサブバンドをL次元ベクトルとして扱い、ベクトル量子化を行う。
利得符号化部602は、上記の式(14)の二乗誤差Gainq_i(i)が最小となる利得コードベクトルのインデックスG_minを、利得符号化情報として多重化部304に出力する。
このようにして、利得補正係数設定部601は、第3レイヤ帯域情報が示すサブバンドに、下位レイヤにおける第2レイヤ帯域情報が示すサブバンドが含まれていない場合と、含まれている場合とで、式(11)又は式(12)のように、理想利得を補正するための利得補正係数γを切り替える。
そして、利得符号化部602は、現レイヤの量子化対象帯域の利得情報の量子化時に、下位レイヤで量子化された量子化対象帯域については、利得コードブックの対応する要素に対して、利得補正係数γにより補正した理想利得を用いて、補正後の理想利得を最も近似する利得コードベクトルを、利得コードブックから探索する。
式(11)および式(12)から分かるように、本実施の形態では、現レイヤである第3レイヤ帯域情報が示すサブバンドが、下位レイヤにおける第2レイヤ帯域情報が示すサブバンドを含む場合、理想利得Gain_i(j)が大きくなるよう補正される。
すなわち、利得補正係数γは、現レイヤの量子化対象帯域の利得コードベクトルの大きさの分布を、下位レイヤの量子化対象帯域の利得コードベクトルの分布(利得コードブック内の利得コードベクトルの大きさの分布)に近づける係数といえる。
この結果、エネルギが大きく異なる複数の要素のベクトル量子化を行う場合においても、利得コードベクトルの各要素のエネルギの大きさを平滑化できるので、同一の利得コードブックを使って効率的にベクトル量子化を行うことができる。
以上が、第3レイヤ符号化部208の処理説明である。
以上が、符号化装置101の処理説明である。
図7は、図1に示した復号装置103の内部の主要な構成を示すブロック図である。復号装置103は、一例として3つの復号階層(レイヤ)からなる階層復号装置とする。ここでは、符号化装置101と同様、ビットレートの低い方から順に、第1レイヤ、第2レイヤ、第3レイヤと呼ぶことにする。
符号化情報分離部701は、伝送路102を介して符号化装置101から送られる符号化情報を入力とし、符号化情報を各レイヤの符号化情報に分離し、それぞれの復号処理を担当する復号部に出力する。具体的には、符号化情報分離部701は、符号化情報中に含まれる第1レイヤ符号化情報を第1レイヤ復号部702に出力し、符号化情報中に含まれる第2レイヤ符号化情報を第2レイヤ復号部703および第3レイヤ復号部704に出力し、符号化情報中に含まれる第3レイヤ符号化情報を第3レイヤ復号部704に出力する。
第1レイヤ復号部702は、符号化情報分離部701から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号を加算部707に出力する。
第2レイヤ復号部703は、符号化情報分離部701から入力される第2レイヤ符号化情報を復号し、得られる第2レイヤ復号スペクトルX2”(k)を加算部705に出力する。第2レイヤ復号部703の処理は、上述した第2レイヤ復号部206の処理と同一であるためここでは説明を省略する。
第3レイヤ復号部704は、符号化情報分離部701から入力される第3レイヤ符号化情報を復号し、得られる第3レイヤ復号スペクトルX3”(k)を加算部705に出力する。第3レイヤ復号部704における処理については後述する。
加算部705には、第2レイヤ復号部703から第2レイヤ復号スペクトルX2”(k)が入力される。また、加算部705には、第3レイヤ復号部704から第3レイヤ復号スペクトルX3”(k)が入力される。加算部705は、入力された第2レイヤ復号スペクトルX2”(k)および第3レイヤ復号スペクトルX3”(k)を加算し、加算したスペクトルを第1加算スペクトルX4”(k)として直交変換処理部706に出力する。
直交変換処理部706は、まず下記の式(15)に従い内蔵のバッファbuf’(k)を「0」値に初期化する。
Figure 2011045927
直交変換処理部706は、第1加算スペクトルX4”(k)を入力とし、下記の式(16)に従い第1加算復号信号y”(n)を求める。
Figure 2011045927
この式において、X5(k)は、第1加算スペクトルX4”(k)とバッファbuf’(k)とを結合させたベクトルであり、下記の式(17)を用いて求められる。
Figure 2011045927
次いで、直交変換処理部706は、下記の式(18)に従いバッファbuf’(k)を更新する。
Figure 2011045927
直交変換処理部706は、第1加算復号信号y”(n)を加算部707に出力する。
加算部707には、第1レイヤ復号部702から第1レイヤ復号信号が入力される。また、加算部707には、直交変換処理部706から第1加算復号信号が入力される。加算部707は、入力された第1レイヤ復号信号および第1加算復号信号を加算し、加算した信号を出力信号として出力する。
図8は、第3レイヤ復号部704の主要な構成を示すブロック図である。
この図において、第3レイヤ復号部704は、分離部801、形状復号部402、利得補正係数設定部802、および利得復号部803を備える。なお、形状復号部402は、上述した構成と同じであるため、同一の符号を付し、説明を省略する。
分離部801は、符号化情報分離部701から入力される第3レイヤ符号化情報から帯域情報、形状符号化情報、および利得符号化情報を分離し、得られる帯域情報を形状復号部402および利得補正係数設定部802に出力し、形状符号化情報を形状復号部402に出力し、利得符号化情報を利得復号部803に出力する。
利得補正係数設定部802には、分離部801から帯域情報が入力される。この帯域情報は、第3レイヤ符号化部208にて符号化対象として選択された第3レイヤ帯域情報である。
また、利得補正係数設定部802には、符号化情報分離部701から第2レイヤ符号化情報が入力される。この第2レイヤ符号化情報には、第2レイヤ符号化部205にて符号化対象として選択された第2レイヤ帯域情報が含まれる。
利得補正係数設定部802は、第2レイヤ帯域情報、および第3レイヤ帯域情報から、第3レイヤ帯域情報が示す各サブバンドに対して、利得情報を量子化する際に利用する補正係数を設定する。
具体的には、第3レイヤ帯域情報が示す各サブバンドに、第2レイヤ帯域情報が示すサブバンドが含まれていない場合(つまり、第3レイヤ復号部704が、第2レイヤ復号部703では復号対象として選択されていない帯域を復号する場合)には、上記式(11)のように利得補正係数γを設定する。
また、第3レイヤ帯域情報が示す各サブバンドに、第2レイヤ帯域情報が示すサブバンドが含まれている場合(つまり、第3レイヤ復号部704が、第2レイヤ復号部703では復号対象として選択されていない帯域を再度復号する場合)には、上記式(12)のように利得補正係数γを設定する。
利得補正係数設定部802は、設定した利得補正係数γを利得復号部803に出力する。
利得復号部803は、内蔵の利得コードブックを用いて、分離部801から入力される利得符号化情報を直接逆量子化して利得値を得る。具体的には、利得復号部803は、第3レイヤ符号化部208の利得符号化部602と同様な利得コードブックを内蔵しており、下記の式(19)に従い、利得補正係数γを利用し、利得の逆量子化を行って利得値Gain_q’を得る。ここで、利得復号部803は、1リージョン内のL個のサブバンドをL次元ベクトルとして扱い、ベクトル逆量子化を行う。
Figure 2011045927
次いで、利得復号部803は、現フレームの逆量子化で得られる利得値、および形状復号部402から入力される形状の値を用いて、下記の式(20)に従い、第3レイヤ復号スペクトルとして復号MDCT係数を算出する。ここでは、算出された復号MDCT係数をX3”(k)と記す。また、MDCT係数の逆量子化において、kがB(j”)〜B(j”+1)−1内に存在する場合、利得値Gain_q’(j)はGain_q’(j”)の値をとる。
Figure 2011045927
利得復号部803は、式(20)に従い算出された第3レイヤ復号スペクトルX3”(k)を加算部705に出力する。
以上が、第3レイヤ復号部704の処理説明である。
以上が、復号装置103の処理説明である。
このように、本実施の形態によれば、符号化対象とする帯域(量子化対象帯域)を階層(レイヤ)毎に選択する階層符号化(スケーラブル符号化)を行う符号化装置101において、下位レイヤの量子化対象帯域と現レイヤの量子化対象帯域との比較結果に基づいて、第3レイヤ符号化部208は、現レイヤの量子化対象帯域の利得情報(エネルギ情報)の量子化方法を切り替える。
すなわち、第3レイヤ符号化部208において現レイヤである第3レイヤ帯域情報が示すサブバンドが、下位レイヤにおける第2レイヤ帯域情報が示すサブバンドを含む場合、利得符号化部602は、理想利得Gain_i(j)が大きくなるよう補正してから量子化する。この結果、エネルギが大きく異なる複数の利得情報のベクトル量子化を行う場合においても、利得コードブックの各要素のエネルギの大きさを平滑化できる。そのため、下位レイヤにおいて選択され量子化されたサブバンドと、そうでないサブバンドとからなる複数のサブバンドの利得情報を、同一の利得コードブックを使って効率的にベクトル量子化することができ、復号信号の品質を改善することができる。
なお、本実施の形態における利得補正係数設定部では、下位レイヤにおいて選択されたサブバンドに対してはγ=0.5とし、そうでないサブバンドに対してはγ=1.0と設定する構成を例に挙げて説明したが、本発明はこれに限らず、上記以外の設定値についても同様に適用できる。
また、利得補正係数の設定方法についても、上述した説明のような設定方法に限られず、多くの入力サンプルを用いて統計的に算出して設定しても良い。
また、本実施の形態においては、まず理想利得を利得補正係数で割ってエネルギを平坦化し、その値をベクトル量子化する構成について説明したが、本発明はこれに限らず、探索する利得コードブック中の各利得コードベクトルに対して利得補正係数を乗じる構成についても同様に適用できる。但し、本実施の形態で説明した構成では、上記の構成に対して利得補正係数を利用した演算の回数が少なくなるため、演算量を大幅には増加させずに品質を向上させることができる。
なお、本実施の形態においては、下位レイヤで量子化されたサブバンドの利得値を大きくすることにより、ベクトル全体の利得値の大きさを揃える方法について説明したが、本発明はこれに限らず、上記の方法とは逆に、下位レイヤで量子化されていないサブバンドの利得値を小さくすることによってベクトル全体の利得値を揃える場合についても同様に適用できる。
また、本実施の形態においては、理想利得を利得補正係数で割った値について、二乗誤差が最小となる利得コードベクトルを探索し、利得値を符号化する構成について説明したが、本発明はこれに限らず、利得補正係数の大きさに基づいて二乗誤差を算出する場合にも同様に適用できる。具体的な方法を以下に説明する。例えば、利得補正係数の値が0.5であった場合、利得補正係数で割った後の値は元々の利得値の2倍となっている。そこで、該当するサブバンドについては、二乗誤差の値を0.5倍して計算する。これにより、利得補正係数によって補正する前の分布における距離(誤差)を算出することができ、結果として、復号信号の品質を向上させることができる。
なお、本実施の形態における第1レイヤ符号化部にはCELP方式の符号化方法を採る構成を例に挙げて説明したが、本発明はこれに限らず、第1レイヤ符号化部が存在しない場合についても同様に適用できる。また、第1レイヤ符号化部が、第2レイヤ符号化部と同様に周波数成分を符号化する構成についても同様に適用できる。
また、第1レイヤ符号化部が、第2レイヤ符号化部と同様に、全帯域を符号化するのではなく、符号化対象となる帯域を部分的に選択し、符号化する構成についても同様に適用できる。なお、この構成の場合には、第1レイヤ符号化部にて全帯域の周波数成分を量子化するわけではないため、第2レイヤ符号化部に対しても、本実施の形態で説明した第3レイヤ符号化部のような利得成分(エネルギ成分)の量子化方法を切り替える構成を適用することもできる。その場合、各レイヤの符号化部において同一の利得補正係数を使っても良いし、また各レイヤの符号化部において異なる利得補正係数を使ってもよい。
また、各帯域において、下位レイヤにおいて量子化対象帯域として選択された回数に応じて、異なる利得補正係数を設定することもできる。この場合の利得補正係数についても、多くの入力サンプルを用いて統計的に算出して設定することもできる。
なお、復号装置に対しても、上記の符号化装置の構成に対応した各構成についても同様に適用できる。
また、本実施の形態では、符号化装置が3つの符号化階層(3レイヤ)からなる構成について説明したが、本発明はこれに限らず、階層数が3以外の構成においても同様に適用できる。
また、本実施の形態では、最下位レイヤの第1レイヤ符号化部/復号部において、CELP方式の符号化/復号方法を採る構成について説明したが、本発明はこれに限らず、CELP方式の符号化/復号方法を採るレイヤが存在しない場合についても同様に適用できる。例えば、全て周波数変換符号化/復号方法のレイヤである構成に対しては、符号化装置、復号装置上で時間軸での加減算をする加算部は不要となる。
また、本実施の形態では、符号化装置において、第1レイヤ復号信号と入力信号との差分信号を算出した後に、それを直交変換処理し、差分スペクトルを算出する構成について説明したが、本発明はこれに限らず、まず入力信号および第1レイヤ復号信号に対してまず直交変換処理を行い、それぞれ入力スペクトル、および第1レイヤ復号スペクトルを算出した後に、差分スペクトルを算出するという構成についても同様に適用できる。
また、本実施の形態における復号装置は、上記各実施の形態における符号化装置から伝送された符号化情報を用いて処理を行うとしたが、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記各実施の形態における符号化装置からの符号化情報でなくても処理は可能である。
また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。
また、本実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、本実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2009年10月14日出願の特願2009−237684に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明にかかる符号化装置、復号装置およびこれらの方法は、階層的に量子化対象帯域を選択し符号化/復号する構成において、復号信号の品質を向上することができ、例えば、パケット通信システム、移動通信システムなどに適用できる。
101 符号化装置
102 伝送路
103 復号装置
201 第1レイヤ符号化部
202,702 第1レイヤ復号部
203,207,705,707 加算部
204,706 直交変換処理部
205 第2レイヤ符号化部
206,703 第2レイヤ復号部
208 第3レイヤ符号化部
209 符号化情報統合部
301 帯域選択部
302 形状符号化部
303,602 利得符号化部
304 多重化部
401,801 分離部
402 形状復号部
403,803 利得復号部
601,802 利得補正係数設定部
701 符号化情報分離部
704 第3レイヤ復号部

Claims (14)

  1. 少なくとも2つの符号化レイヤを有する符号化装置であって、
    周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化手段と、
    前記第2入力信号と前記第1符号化情報とを入力し、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択して第2帯域情報を求めるとともに、前記第2量子化対象帯域の前記第2入力信号の利得を求め、前記第1符号化情報を用いて、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2帯域情報と前記利得を符号化して得られる利得符号化情報とを含む第2符号化情報を生成する第2レイヤ符号化手段と、
    を具備する符号化装置。
  2. 前記第2レイヤ符号化手段は、
    前記複数のサブバンドの中から前記第2入力信号の前記第2量子化対象帯域を選択して前記第2帯域情報を生成するとともに、前記第2量子化対象帯域の前記第2入力信号を出力する帯域選択手段と、
    前記第2量子化対象帯域の前記第2入力信号の形状及び前記利得を符号化して形状符号化情報及び前記利得符号化情報を生成する形状・利得符号化手段と、
    を具備する、請求項1記載の符号化装置。
  3. 前記第2レイヤ符号化手段は、
    前記第1符号化情報を用いて、前記利得の符号化に用いる符号帳に格納されたコードベクトルのうち前記第1量子化対象帯域のコードベクトルの大きさを補正する利得補正係数を設定する係数設定手段をさらに具備し、
    前記形状・利得符号化手段は、
    前記利得補正係数を用いて前記第1量子化対象帯域のコードベクトルが補正された前記符号帳を用いて前記利得を符号化する、
    請求項2記載の符号化装置。
  4. 前記係数設定手段は、
    前記利得補正係数を、前記符号帳内の前記第2量子化対象帯域のコードベクトルの大きさの分布を、前記第2量子化対象帯域の利得の大きさの分布に近づけるように設定する、
    請求項3記載の符号化装置。
  5. 前記第2レイヤ符号化手段は、
    前記第1符号化情報に含まれる前記第1帯域情報を用いて求められる前記第1量子化対象帯域と、前記第2帯域情報を用いて求められる前記第2量子化対象帯域と、の比較結果を用いて前記利得の量子化方法を選択する選択手段をさらに具備し、
    前記形状・利得符号化手段は、
    前記選択手段により選択された前記量子化方法を用いて前記利得を符号化する、
    請求項2記載の符号化装置。
  6. 請求項1に記載の符号化装置を具備する通信端末装置。
  7. 請求項1に記載の符号化装置を具備する基地局装置。
  8. 少なくとも2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号装置であって、
    前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む前記第1符号化情報と、前記第1符号化情報を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信手段と、
    前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号手段と、
    前記情報から得られる前記第1符号化情報及び前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する信号に、前記第1符号化情報及び前記第2符号化情報を用いた補正を行って第2復号信号を生成する第2レイヤ復号手段と、
    を具備する復号装置。
  9. 前記第1レイヤ復号手段は、
    前記第1符号化情報に含まれる第1形状符号化情報と前記第1帯域情報とを用いて、前記第1量子化対象帯域に対する前記第1復号信号の形状を求める第1形状復号手段と、
    前記第1符号化情報に含まれる第1利得符号化情報を用いて前記第1復号信号の利得を求め、前記第1量子化対象帯域に対する前記第1復号信号の形状と前記第1復号信号の利得とを用いて前記第1復号信号を生成する第1利得復号手段と、
    を具備する、請求項8記載の復号装置。
  10. 前記第2レイヤ復号手段は、
    前記第2符号化情報に含まれる第2形状符号化情報と前記第2帯域情報とを用いて、前記第2量子化対象帯域に対する前記第2復号信号の形状を求める第2形状復号手段と、
    前記第2符号化情報に含まれる第2利得符号化情報を用いて前記第2復号信号の利得を求め、前記第1符号化情報に含まれる前記第1帯域情報及び前記第2符号化情報に含まれる前記第2帯域情報を用いて前記第2復号信号の利得を補正した前記第2復号信号の補正利得を生成し、前記第2量子化対象帯域に対する前記第2復号信号の形状と前記第2復号信号の補正利得とを用いて前記第2復号信号を生成する第2利得復号手段と、
    を具備する、請求項8記載の復号装置。
  11. 請求項8に記載の復号装置を具備する通信端末装置。
  12. 請求項8に記載の復号装置を具備する基地局装置。
  13. 少なくとも2つの符号化レイヤで符号化を行う符号化方法であって、
    周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化ステップと、
    前記第2入力信号と前記第1符号化情報とを入力し、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択して第2帯域情報を求めるとともに、前記第2量子化対象帯域の前記第2入力信号の利得を求め、前記第1符号化情報を用いて、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2帯域情報と前記利得を符号化して得られる利得符号化情報とを含む第2符号化情報を生成する第2レイヤ符号化ステップと、
    を具備する符号化方法。
  14. 少なくとも2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号方法であって、
    前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む前記第1符号化情報と、前記第1符号化情報を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信ステップと、
    前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号ステップと、
    前記情報から得られる前記第1符号化情報及び前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する信号に、前記第1符号化情報及び前記第2符号化情報を用いた補正を行って第2復号信号を生成する第2レイヤ復号ステップと、
    を具備する復号方法。

JP2011536038A 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法 Expired - Fee Related JP5544371B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011536038A JP5544371B2 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009237684 2009-10-14
JP2009237684 2009-10-14
PCT/JP2010/006088 WO2011045927A1 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法
JP2011536038A JP5544371B2 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法

Publications (2)

Publication Number Publication Date
JPWO2011045927A1 true JPWO2011045927A1 (ja) 2013-03-04
JP5544371B2 JP5544371B2 (ja) 2014-07-09

Family

ID=43875983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011536038A Expired - Fee Related JP5544371B2 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法

Country Status (4)

Country Link
US (1) US8949117B2 (ja)
EP (1) EP2490217A4 (ja)
JP (1) JP5544371B2 (ja)
WO (1) WO2011045927A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6523498B1 (ja) * 2018-01-19 2019-06-05 ヤフー株式会社 学習装置、学習方法および学習プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08223049A (ja) * 1995-02-14 1996-08-30 Sony Corp 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
JPWO2006025313A1 (ja) * 2004-08-31 2008-05-08 松下電器産業株式会社 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
CN101048649A (zh) * 2004-11-05 2007-10-03 松下电器产业株式会社 可扩展解码装置及可扩展编码装置
JP2008519991A (ja) * 2004-11-09 2008-06-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声の符号化及び復号化
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
US9454974B2 (en) 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting
EP2254110B1 (en) * 2008-03-19 2014-04-30 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
JP2009237684A (ja) 2008-03-26 2009-10-15 Hitachi Software Eng Co Ltd 携帯情報端末における文字変換システム

Also Published As

Publication number Publication date
EP2490217A4 (en) 2016-08-24
US8949117B2 (en) 2015-02-03
US20120203546A1 (en) 2012-08-09
WO2011045927A1 (ja) 2011-04-21
JP5544371B2 (ja) 2014-07-09
EP2490217A1 (en) 2012-08-22

Similar Documents

Publication Publication Date Title
RU2437172C1 (ru) Способ кодирования/декодирования индексов кодовой книги для квантованного спектра мдкп в масштабируемых речевых и аудиокодеках
JP4963963B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
WO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JPWO2008047795A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
JP5746974B2 (ja) 符号化装置、復号装置およびこれらの方法
JPWO2007114290A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法
JP5714002B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US20100017197A1 (en) Voice coding device, voice decoding device and their methods
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
WO2013051210A1 (ja) 符号化装置及び符号化方法
JP5606457B2 (ja) 符号化装置および符号化方法
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
CN112352277B (zh) 编码装置及编码方法
WO2020009082A1 (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140512

R151 Written notification of patent or utility model registration

Ref document number: 5544371

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees