JPWO2011045926A1 - 符号化装置、復号装置およびこれらの方法 - Google Patents

符号化装置、復号装置およびこれらの方法 Download PDF

Info

Publication number
JPWO2011045926A1
JPWO2011045926A1 JP2011536037A JP2011536037A JPWO2011045926A1 JP WO2011045926 A1 JPWO2011045926 A1 JP WO2011045926A1 JP 2011536037 A JP2011536037 A JP 2011536037A JP 2011536037 A JP2011536037 A JP 2011536037A JP WO2011045926 A1 JPWO2011045926 A1 JP WO2011045926A1
Authority
JP
Japan
Prior art keywords
encoding
layer
band
information
encoded information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011536037A
Other languages
English (en)
Other versions
JP5544370B2 (ja
Inventor
智史 山梨
智史 山梨
利幸 森井
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2011536037A priority Critical patent/JP5544370B2/ja
Publication of JPWO2011045926A1 publication Critical patent/JPWO2011045926A1/ja
Application granted granted Critical
Publication of JP5544370B2 publication Critical patent/JP5544370B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

量子化対象とする帯域を階層(レイヤ)毎に選択する階層符号化(スケーラブル符号化)方式において、復号信号の品質を改善する符号化装置を開示する。この符号化装置(101)は、周波数領域を分割した複数のサブバンドの中から第1入力信号である第1レイヤ差分スペクトルの第1量子化対象帯域を選択してこの帯域の第1帯域情報を含む第2レイヤ符号化情報を生成する第2レイヤ符号化部(205)と、第2レイヤ符号化情報を用いて第1復号信号を生成する第2レイヤ復号部(206)と、第1入力信号と第1復号信号とを用いて第2入力信号である第2レイヤ差分スペクトルを生成する加算部(207)と、第1復号信号を用いて第2入力信号の第2量子化対象帯域を選択してこの帯域の第2帯域情報を含む第3レイヤ符号化情報を生成する第3レイヤ符号化部(208)と、を具備する。

Description

本発明は、信号を符号化して伝送する通信システムに用いられる符号化装置、復号装置およびこれらの方法に関する。
インターネット通信に代表されるパケット通信システムや、移動通信システムなどで音声・楽音信号を伝送する場合、音声・楽音信号の伝送効率を高めるため、圧縮・符号化技術がよく使われる。また、近年では、単に低ビットレートで音声・楽音信号を符号化するという一方で、より広帯域の音声・楽音信号を高品質に符号化する技術に対するニーズが高まっている。
このようなニーズに対して、複数の符号化技術を階層的に統合する様々な技術が開発されてきている。例えば非特許文献1では、基本構成単位をモジュール化されたTwinVQ(Transform Domain Weighted Interleave Vector Quantization;周波数領域重み付きインターリーブベクトル量子化)を用いて所望の周波数帯域のスペクトル(MDCT(Modified Discrete Cosine Transform)係数)を階層的に符号化する手法が開示されている。当該モジュールを共通化して複数回使用することにより、シンプルかつ自由度の高いスケーラブル符号化を実現できる。この手法では、各階層(レイヤ)の量子化対象となるサブバンドは予め定められている構成が基本となるが、入力信号の性質に応じて各階層(レイヤ)の量子化対象となるサブバンドの位置を予め定められた帯域の中で変動させる構成も開示されている。
神明夫他、「階層的変換符号化基本モジュールによって構成されるスケーラブル楽音符号化(Scalable Audio Coding Based on Hierarchical Transform Coding Modules)」、電子情報通信学会論文誌A, Vol. J83-A, No.3, pp.241-252, 2000年3月
しかしながら、上記非特許文献1では、各階層(レイヤ)において量子化対象となるサブバンドの位置が予め定められており、先に符号化される下位の階層における符号化結果(量子化された帯域)を利用していないため、階層全体を考慮した場合には符号化精度がそれほど高くはならないという問題点がある。また、各階層の量子化対象となるサブバンドの位置の候補についても、全帯域ではなく予め定められた帯域に限定されており、ある階層(レイヤ)においては残差エネルギの大きいサブバンドが量子化対象として選択されないことが起こり得る。その結果、生成される復号音声の品質が不十分となる問題点もある。
本発明の目的は、量子化対象とする帯域を階層(レイヤ)毎に選択する階層符号化(スケーラブル符号化)方式において、復号信号の品質を改善することができる符号化装置、復号装置およびこれらの方法を提供することである。
本発明に係る符号化装置の一つの態様は、少なくとも2つの符号化レイヤを有する符号化装置であって、周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化手段と、前記第2入力信号と、前記第1復号信号または前記第1符号化情報とを入力し、前記第1復号信号または前記第1符号化情報を用いて、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択し、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2量子化対象帯域の第2帯域情報を含む第2符号化情報を生成する第2レイヤ符号化手段と、を具備する。
本発明に係る復号装置の一つの態様は、少なくても2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号装置であって、前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む第1符号化情報と、前記第1符号化情報を用いて生成された第1レイヤ復号信号を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信手段と、前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号手段と、前記情報から得られる前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する第2復号信号を生成する第2レイヤ復号手段と、を具備する。
本発明に係る符号化方法の一つの態様は、少なくとも2つの符号化レイヤで符号化を行う符号化方法であって、周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化ステップと、前記第2入力信号と、前記第1復号信号または前記第1符号化情報とを入力し、前記第1復号信号または前記第1符号化情報を用いて、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択し、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2量子化対象帯域の第2帯域情報を含む第2符号化情報を生成する第2レイヤ符号化ステップと、を具備する。
本発明に係る復号方法の一つの態様は、少なくても2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号方法であって、前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む第1符号化情報と、前記第1符号化情報を用いて生成された第1レイヤ復号信号を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信ステップと、前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号ステップと、前記情報から得られる前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する第2復号信号を生成する第2レイヤ復号ステップと、を具備する。
本発明によれば、量子化対象とする帯域を階層(レイヤ)毎に選択する階層符号化(スケーラブル符号化)方式において、下位レイヤの符号化結果(量子化された帯域)に基づいて、現レイヤの量子化対象帯域を選択することにより、各レイヤで聴感的に重要な帯域を符号化でき、その結果復号信号の品質を改善することができる。
本発明の実施の形態1に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図 図1に示した符号化装置の内部の主要な構成を示すブロック図 図2に示した第2レイヤ符号化部の内部の主要な構成を示すブロック図 図3に示した帯域選択部の主要な構成を示すブロック図 実施の形態1に係るリージョンの構成を示す図 図2に示した第2レイヤ復号部の内部の主要な構成を示すブロック図 図2に示した第3レイヤ符号化部の内部の主要な構成を示すブロック図 図7に示した帯域選択部の主要な構成を示すブロック図 図1に示した復号装置の内部の主要な構成を示すブロック図 本発明の実施の形態2に係る第3レイヤ符号化部内の帯域選択部の主要な構成を示すブロック図
以下、本発明の実施の形態について、図面を参照して詳細に説明する。なお、本発明に係る符号化装置および復号装置として、音声符号化装置および音声復号装置を例にとって説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る符号化装置および復号装置を有する通信システムの構成を示すブロック図である。図1において、通信システムは、符号化装置101と復号装置103とを備え、それぞれ伝送路102を介して通信可能な状態となっている。なお、符号化装置101および復号装置103はいずれも、通常、基地局装置あるいは通信端末装置等に搭載されて用いられる。
符号化装置101は、入力信号をNサンプルずつ区切り(Nは自然数)、Nサンプルを1フレームとしてフレーム毎に符号化を行う。ここで、符号化の対象となる入力信号をx(n)と表すこととする。n(n=0、…、N−1)は、Nサンプルずつ区切られた入力信号のうち、信号要素のn+1番目を示す。符号化装置101は、符号化された入力情報(以下「符号化情報」という)を、伝送路102を介して復号装置103に送信する。
復号装置103は、伝送路102を介して符号化装置101から送信された符号化情報を受信し、これを復号し出力信号を得る。
図2は、図1に示した符号化装置101の内部の主要な構成を示すブロック図である。符号化装置101は、一例として4つの符号化階層(レイヤ)からなる階層符号化装置とする。ここで、ビットレートの低い方から順に、第1レイヤ、第2レイヤ、第3レイヤ、第4レイヤと呼ぶことにする。
第1レイヤ符号化部201は、入力信号に対して、例えばCELP(Code Excited Linear Prediction)方式の音声符号化方法を用いて符号化を行って、第1レイヤ符号化情報を生成し、生成した第1レイヤ符号化情報を第1レイヤ復号部202および符号化情報統合部212に出力する。
第1レイヤ復号部202は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って、第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号を加算部203に出力する。
加算部203は、第1レイヤ復号信号の極性を反転させて、入力信号に加算することにより、入力信号と第1レイヤ復号信号との差分信号を算出し、得られた差分信号を第1レイヤ差分信号として直交変換処理部204に出力する。
直交変換処理部204は、バッファbuf1(n)(n=0、…、N−1)を内部に有し、第1レイヤ差分信号x1(n)を修正離散コサイン変換(MDCT:Modified Discrete Cosine Transform)することにより、周波数領域パラメータ(周波数領域信号)に変換する。
次に、直交変換処理部204における直交変換処理について、その計算手順と内部バッファへのデータ出力に関して説明する。
まず、直交変換処理部204は、下記の式(1)によりバッファbuf1(n)を、「0」を初期値として初期化する。
Figure 2011045926
次いで、直交変換処理部204は、下記の式(2)に従って、第1レイヤ差分信号x1(n)に対し修正離散コサイン変換(MDCT)を行い、第1レイヤ差分信号x1(n)のMDCT係数(以下「第1レイヤ差分スペクトル」と呼ぶ)X1(k)を求める。
Figure 2011045926
ここで、kは1フレームにおける各サンプルのインデックスを示す。直交変換処理部204は、第1レイヤ差分信号x1(n)とバッファbuf1(n)とを結合させたベクトルであるx1’(n)を下記の式(3)により求める。
Figure 2011045926
次に、直交変換処理部204は、式(4)によりバッファbuf1(n)を更新する。
Figure 2011045926
そして、直交変換処理部204は、第1レイヤ差分スペクトルX1(k)を第2レイヤ符号化部205、および加算部207に出力する。
第2レイヤ符号化部205は、直交変換処理部204から入力される第1レイヤ差分スペクトルX1(k)を用いて第2レイヤ符号化情報を生成し、生成した第2レイヤ符号化情報を第2レイヤ復号部206、および符号化情報統合部212に出力する。なお、第2レイヤ符号化部205の詳細については後述する。
第2レイヤ復号部206は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報を復号し、第2レイヤ復号スペクトルを算出する。次に、第2レイヤ復号部206は、生成した第2レイヤ復号スペクトルを加算部207、および第3レイヤ符号化部208に出力する。なお、第2レイヤ復号部206の詳細については後述する。
加算部207は、第2レイヤ復号スペクトルの極性を反転させて、第1レイヤ差分スペクトルに加算することにより、第1レイヤ差分スペクトルと第2レイヤ復号スペクトルとの差分スペクトルを算出し、得られた差分スペクトルを第2レイヤ差分スペクトルとして第3レイヤ符号化部208および加算部210に出力する。
第3レイヤ符号化部208は、第2レイヤ復号部206から入力される第2レイヤ復号スペクトルと、加算部207から入力される第2レイヤ差分スペクトルとを用いて第3レイヤ符号化情報を生成し、生成した第3レイヤ符号化情報を第3レイヤ復号部209、および符号化情報統合部212に出力する。なお、第3レイヤ符号化部208の詳細については後述する。
第3レイヤ復号部209は、第3レイヤ符号化部208から入力される第3レイヤ符号化情報を復号し、第3レイヤ復号スペクトルを算出する。次に、第3レイヤ復号部209は、生成した第3レイヤ復号スペクトルを加算部210、および第4レイヤ符号化部211に出力する。なお、第3レイヤ復号部209の詳細については後述する。
加算部210は、第3レイヤ復号スペクトルの極性を反転させて、第2レイヤ差分スペクトルに加算することにより、第2レイヤ差分スペクトルと第3レイヤ復号スペクトルとの差分スペクトルを算出し、得られた差分スペクトルを第3レイヤ差分スペクトルとして第4レイヤ符号化部211に出力する。
第4レイヤ符号化部211は、第3レイヤ復号部209から入力される第3レイヤ復号スペクトルと、加算部210から入力される第3レイヤ差分スペクトルとを用いて第4レイヤ符号化情報を生成し、生成した第4レイヤ符号化情報を符号化情報統合部212に出力する。なお、第4レイヤ符号化部211の詳細については後述する。
符号化情報統合部212は、第1レイヤ符号化部201から入力される第1レイヤ符号化情報と、第2レイヤ符号化部205から入力される第2レイヤ符号化情報と、第3レイヤ符号化部208から入力される第3レイヤ符号化情報と、第4レイヤ符号化部211から入力される第4レイヤ符号化情報とを統合し、統合された情報源符号に対し、必要であれば伝送誤り符号などを付加した上でこれを符号化情報として伝送路102に出力する。
図3は、第2レイヤ符号化部205の主要な構成を示すブロック図である。
この図において、第2レイヤ符号化部205は、帯域選択部301、形状符号化部302、適応予測判定部303、利得符号化部304、および多重化部305を備える。
帯域選択部301は、直交変換処理部204から入力される第1レイヤ差分スペクトルを複数のサブバンドに分割し、複数のサブバンドから量子化対象となる帯域(量子化対象帯域)を選択し、選択した帯域を示す帯域情報を形状符号化部302、適応予測判定部303、多重化部305に出力する。また、帯域選択部301は、第1レイヤ差分スペクトルを形状符号化部302に出力する。なお、形状符号化部302への第1レイヤ差分スペクトルの入力は、直交変換処理部204から帯域選択部301への入力とは別に、直交変換処理部204から形状符号化部302へ直接入力されるようにしても良い。帯域選択部301の処理の詳細は後述する。
形状符号化部302は、帯域選択部301から入力される第1レイヤ差分スペクトルのうち、帯域選択部301から入力される帯域情報が示す帯域に対応するスペクトル(MDCT係数)を用いて形状情報の符号化を行って形状符号化情報を生成し、生成した形状符号化情報を多重化部305に出力する。また、形状符号化部302は、形状符号化時に算出される理想利得(利得情報)を求め、求めた理想利得を利得符号化部304に出力する。形状符号化部302の処理の詳細は後述する。
適応予測判定部303は、過去に帯域選択部301から入力される帯域情報を記憶する内部バッファを有する。適応予測判定部303は、帯域選択部301から入力される帯域情報を用いて現フレームの量子化対象帯域と過去のフレームの量子化対象帯域との間で共通のサブバンドの数を求める。さらに、適応予測判定部303は、共通のサブバンドの数が予め定められた所定値以上である場合には、帯域情報が示す量子化対象帯域のスペクトル(MDCT係数)に対して予測符号化を行うと判定する。一方、共通のサブバンドの数が所定値より小さい場合には、適応予測判定部303は、帯域情報が示す量子化対象帯域のスペクトル(MDCT係数)に対して予測符号化を行わない(つまり、予測を適用しない符号化を行う)と判定する。適応予測判定部303は、判定結果を利得符号化部304に出力する。適応予測判定部303の処理の詳細は後述する。
利得符号化部304には、形状符号化部302からの理想利得と、適応予測判定部303からの判定結果とが入力される。利得符号化部304は、適応予測判定部303から入力される判定結果が予測符号化を行うという判定結果を示す場合には、内蔵のバッファに記憶されている過去のフレームの量子化利得値および内蔵の利得コードブックを用いて形状符号化部302から入力される理想利得に対して予測符号化を行って利得符号化情報を得る。一方、利得符号化部304は、適応予測判定部303から入力される判定結果が予測符号化を行わないという判定結果を示す場合には、形状符号化部302から入力される理想利得をそのまま量子化して(つまり、予測を適用せずに量子化して)利得符号化情報を得る。利得符号化部304は、得られる利得符号化情報を多重化部305に出力する。利得符号化部304の処理の詳細は後述する。
多重化部305は、帯域選択部301から入力される帯域情報、形状符号化部302から入力される形状符号化情報、および利得符号化部304から入力される利得符号化情報を多重化し、得られるビットストリームを第2レイヤ符号化情報として第2レイヤ復号部206および符号化情報統合部212に出力する。
上記のような構成を有する第2レイヤ符号化部205は以下の動作を行う。
図4は、帯域選択部301の主要な構成を示すブロック図である。
この図において、帯域選択部301は、サブバンドエネルギ算出部401、および帯域決定部402とから主に構成される。
サブバンドエネルギ算出部401には、直交変換処理部204から第1レイヤ差分スペクトルX1(k)が入力される。
サブバンドエネルギ算出部401は、まず、第1レイヤ差分スペクトルX1(k)を複数のサブバンドに分割する。ここでは、J(Jは自然数)個のサブバンドに均等に分割する場合を例に挙げて説明する。そして、サブバンドエネルギ算出部401は、J個のサブバンドの中で連続するL(Lは自然数)個のサブバンドを選択し、M(Mは自然数)種類のサブバンドのグループを得る。以下、このM種類のサブバンドのグループをリージョンと呼ぶ。
図5は、サブバンドエネルギ算出部401において得られるリージョンの構成を例示する図である。
この図において、サブバンドの数は17個(J=17)であり、リージョンの種類は8種類(M=8)であり、各リージョンは連続する5個(L=5)のサブバンドで構成されている。そのうち、例えばリージョン4はサブバンド6〜10からなる。
次いで、サブバンドエネルギ算出部401は、下記の式(5)に従い、M種類の各リージョンの平均エネルギE1(m)を算出する。
Figure 2011045926
この式において、jはJ個の各サブバンドのインデックスを示し、mは、M種類の各リージョンのインデックスを示す。なお、S(m)は、リージョンmを構成するL個のサブバンドのインデックスのうちの最小値を示し、B(j)は、サブバンドjを構成する複数のMDCT係数のインデックスのうちの最小値を示す。W(j)は、サブバンドjのバンド幅を示し、以下の説明では、J個の各サブバンドのバンド幅が全て等しい場合、すなわちW(j)が定数である場合を例にとって説明する。サブバンドエネルギ算出部401は、得られたリージョン毎の平均エネルギE1(m)を帯域決定部402に出力する。
帯域決定部402には、サブバンドエネルギ算出部401から、リージョン毎の平均エネルギE1(m)が入力される。帯域決定部402は、平均エネルギE1(m)が最大となるリージョン、例えばサブバンドj”〜(j”+L−1)からなる帯域を量子化対象となる帯域(量子化対象帯域)として選択し、このリージョンを示すインデックスm_maxを帯域情報として形状符号化部302、適応予測判定部303、および多重化部305に出力する。また、帯域決定部402は、量子化対象帯域の第1レイヤ差分スペクトルX1(k)を形状符号化部302に出力する。なお、帯域決定部402は、帯域選択部301に入力された第1レイヤ差分スペクトルを直接入力しても良く、あるいは、第1レイヤ差分スペクトルをサブバンドエネルギ算出部401経由で入力しても良い。また、以下の説明では、帯域決定部402で選択した量子化対象帯域を示すバンドインデックスをj”〜(j”+L−1)とする。
形状符号化部302は、帯域選択部301から入力される帯域情報m_maxが示す帯域に対応する第1レイヤ差分スペクトルX1(k)に対して、サブバンド毎に形状量子化を行う。具体的には、形状符号化部302はL個の各サブバンド毎に、SQ個の形状コードベクトルからなる内蔵の形状コードブックを探索して、下記の式(6)の評価尺度Shape(k)が最大となる形状コードベクトルのインデックスを求める。
Figure 2011045926
この式において、SC は形状状コードブックを構成する形状コードベクトルを示し、iは形状コードベクトルのインデックスを示し、kは形状コードベクトルの要素のインデックスを示す。
形状符号化部302は、上記の式(6)の結果が最大となる形状コードベクトルのインデックスS_maxを、形状符号化情報として多重化部305に出力する。また、形状符号化部302は、下記の式(7)に従い、理想利得Gain_i(j)を算出し、算出したGain_i(j)を利得符号化部304に出力する。
Figure 2011045926
適応予測判定部303は、過去のフレームにおいて帯域選択部301から入力された帯域情報m_maxを記憶するバッファを内蔵している。ここでは過去の3フレーム分の帯域情報m_maxを記憶するバッファを内蔵している場合を例に挙げて説明する。適応予測判定部303は、まず、過去のフレームにおいて帯域選択部301から入力された帯域情報m_maxおよび現フレームにおいて帯域選択部301から入力される帯域情報m_maxを用いて、過去のフレームの量子化対象帯域と現フレームの量子化対象帯域との間で共通のサブバンドの数を求める。そして、適応予測判定部303は、共通のサブバンドの数が所定値以上である場合は予測符号化を行うと判定し、共通のサブバンドの数が所定値より小さい場合は予測符号化を行わないと判定する。具体的には、適応予測判定部303は、時間的に1つ過去のフレームにおいて帯域選択部301から入力された帯域情報m_maxが示すL個のサブバンドと、現フレームにおいて帯域選択部301から入力される帯域情報m_maxが示すL個のサブバンドとを比較する。そして、適応予測判定部303は、共通のサブバンドの数がP個以上である場合は予測符号化を行うと判定し、共通のサブバンドの数がP個未満である場合は予測符号化を行わないと判定する。適応予測判定部303は、判定結果を利得符号化部304に出力する。次いで、適応予測判定部303は、現フレームにおいて帯域選択部301から入力される帯域情報m_maxを用いて、帯域情報を記憶する内蔵のバッファを更新する。
利得符号化部304は、過去のフレームにおいて得られた量子化利得を記憶するバッファを内蔵している。適応予測判定部303から入力される判定結果が予測符号化を行うという判定結果を示す場合、利得符号化部304は、内蔵のバッファに記憶されている過去フレームの量子化利得C を用いて、現フレームの利得値を予測することにより量子化する。具体的には、利得符号化部304は、L個の各サブバンド毎に、GQ個の利得コードベクトルからなる内蔵の利得コードブックを探索して、下記の式(8)の二乗誤差Gain_q(i)が最小となる利得コードベクトルのインデックスを求める。
Figure 2011045926
この式において、GC は利得コードブックを構成する利得コードベクトルを示し、iは利得コードベクトルのインデックスを示し、jは利得コードベクトルの要素のインデックスを示す。例えば、リージョンを構成するサブバンド数が5の場合(L=5の場合)、jは0〜4の値を取る。ここで、C は時間的にtフレーム前の利得を示し、例えばt=1の場合、C は時間的に1フレーム前の利得を示す。また、α0〜α3は、利得符号化部304に記憶されている4次の線形予測係数である。なお、利得符号化部304は、1リージョン内のL個のサブバンドをL次元ベクトルとして扱い、ベクトル量子化を行う。
利得符号化部304は、上記の式(8)の結果が最小となる利得コードベクトルのインデックスG_minを、利得符号化情報として多重化部305に出力する。なお、内蔵のバッファの中の過去フレームに対応するサブバンドの利得が存在しない場合、利得符号化部304は上記の式(8)において、内蔵のバッファの中の周波数的に最も近いサブバンドの利得を代用する。
一方、適応予測判定部303から入力される判定結果が予測符号化を行わないという判定結果を示す場合、利得符号化部304は、下記の式(9)に従い、形状符号化部302から入力される理想利得Gain_i(j)を、直接量子化する。ここでも、利得符号化部304は、理想利得をL次元ベクトルとして扱い、ベクトル量子化を行う。
Figure 2011045926
利得符号化部304は、上記の式(9)の結果が最小となる利得コードベクトルのインデックスG_minを利得符号化情報として多重化部305に出力する。
また、利得符号化部304は、現フレームで得られた利得符号化情報G_minおよび量子化利得C を用いて、下記の式(10)に従い、内蔵のバッファを更新する。
Figure 2011045926
多重化部305は、帯域選択部301から入力される帯域情報m_max、形状符号化部302から入力される形状符号化情報S_max、および利得符号化部304から入力される利得符号化情報G_minを多重化する。そして、多重化部305は、多重化により得られるビットストリームを第2レイヤ符号化情報として第2レイヤ復号部206および符号化情報統合部212に出力する。
図6は、第2レイヤ復号部206の主要な構成を示すブロック図である。
この図において、第2レイヤ復号部206は、分離部701、形状復号部702、適応予測判定部703、および利得復号部704を備える。
分離部701は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報から帯域情報、形状符号化情報、および利得符号化情報を分離し、得られる帯域情報を形状復号部702および適応予測判定部703に出力し、形状符号化情報を形状復号部702に出力し、利得符号化情報を利得復号部704に出力する。
形状復号部702は、分離部701から入力される形状符号化情報を復号することにより、分離部701から入力される帯域情報が示す量子化対象帯域に対応するMDCT係数の形状の値を求め、求めた形状の値を利得復号部704に出力する。形状復号部702の処理の詳細は後述する。
適応予測判定部703は、分離部701から入力される帯域情報を用いて現フレームの量子化対象帯域と過去のフレームの量子化対象帯域との間で共通のサブバンドの数を求める。そして、適応予測判定部703は、共通のサブバンドの数が予め定められた所定値以上である場合は、帯域情報が示す量子化対象帯域のMDCT係数に対して予測復号を行うと判定し、共通のサブバンドの数が所定値より小さい場合は、帯域情報が示す量子化対象帯域のMDCT係数に対して予測復号を行わないと判定する。適応予測判定部703は、判定結果を利得復号部704に出力する。適応予測判定部703の処理の詳細は後述する。
利得復号部704は、適応予測判定部703から入力される判定結果が予測復号を行うという判定結果を示す場合は、内蔵のバッファに記憶されている過去のフレームの利得値および内蔵の利得コードブックを用いて、分離部701から入力される利得符号化情報に対し予測復号を行って利得値を得る。一方、利得復号部704は、適応予測判定部703から入力される判定結果が予測復号を行わないという判定結果を示す場合、内蔵の利得コードブックを用いて、分離部701から入力される利得符号化情報を、直接、逆量子化して利得値を得る。利得復号部704は、得られる利得値、および形状復号部702から入力される形状の値を用いて量子化対象帯域の復号MDCT係数を求め、求めた復号MDCT係数を第2レイヤ復号スペクトルとして加算部207および第3レイヤ符号化部208に出力する。利得復号部704の処理の詳細は後述する。
上記のような構成を有する第2レイヤ復号部206は以下の動作を行う。
分離部701は、第2レイヤ符号化部205から入力される第2レイヤ符号化情報から帯域情報m_max、形状符号化情報S_max、および利得符号化情報G_minを分離する。そして、分離部701は、得られる帯域情報m_maxを形状復号部702および適応予測判定部703に出力し、形状符号化情報S_maxを形状復号部702に出力し、利得符号化情報G_minを利得復号部704に出力する。
形状復号部702は、第2レイヤ符号化部205の形状符号化部302が備える形状コードブックと同様な形状コードブックを内蔵し、分離部701から入力される形状符号化情報S_maxをインデックスとする形状コードベクトルを探索する。形状復号部702は、探索した形状コードベクトルを、分離部701から入力される帯域情報m_maxが示す量子化対象帯域のMDCT係数の形状の値として利得復号部704に出力する。ここでは、形状の値として探索された形状コードベクトルをShape_q(k)(k=B(j”),…,B(j”+L)−1)と記す。
適応予測判定部703は、過去のフレームにおいて分離部701から入力された帯域情報m_maxを記憶するバッファを内蔵している。ここでは過去の3フレーム分の帯域情報m_maxを記憶するバッファを内蔵している場合を例に挙げて説明する。適応予測判定部703は、まず、過去のフレームにおいて分離部701から入力された帯域情報m_maxおよび現フレームにおいて分離部701から入力される帯域情報m_maxを用いて、過去のフレームの量子化対象帯域と現フレームの量子化対象帯域との間で共通のサブバンドの数を求める。そして、適応予測判定部703は、共通のサブバンドの数が所定値以上である場合は予測復号を行うと判定し、共通のサブバンドの数が所定値より小さい場合は予測復号を行わないと判定する。具体的には、適応予測判定部703は、時間的に1つ過去のフレームにおいて分離部701から入力された帯域情報m_maxが示すL個のサブバンドと、現フレームにおいて分離部701から入力される帯域情報m_maxが示すL個のサブバンドとを比較する。そして、適応予測判定部703は、共通のサブバンドの数がP個以上である場合は予測復号を行うと判定し、共通のサブバンドの数がP個未満である場合は予測復号を行わないと判定する。適応予測判定部703は、判定結果を利得復号部704に出力する。次いで、適応予測判定部703は、現フレームにおいて分離部701から入力される帯域情報m_maxを用いて、帯域情報を記憶する内蔵のバッファを更新する。
利得復号部704は、過去のフレームにおいて得られた利得値を記憶するバッファを内蔵している。適応予測判定部703から入力される判定結果が予測復号を行うという判定結果を示す場合、利得復号部704は、内蔵のバッファに記憶されている過去のフレームの利得値を用いて、現フレームの利得値を予測することにより逆量子化を行う。具体的には、利得復号部704は、第2レイヤ符号化部205の利得符号化部304と同様な利得コードブックを内蔵しており、下記の式(11)に従い、利得の逆量子化を行って利得値Gain_q’を得る。ここで、C” は時間的にtフレーム前の利得値を示し、例えばt=1の場合、C” は1フレーム前の利得値を示す。また、α0〜α3は、利得復号部704に記憶されている4次の線形予測係数である。利得復号部704は、1リージョン内のL個のサブバンドをL次元ベクトルとして扱い、ベクトル逆量子化を行う。
Figure 2011045926
なお、内蔵のバッファの中に過去フレームに対応するサブバンドの利得値が存在しない場合、利得復号部704は、上記の式(11)において、内部バッファの中の周波数的に最も近いサブバンドの利得値を代用する。
一方、適応予測判定部703から入力される判定結果が予測復号を行わないという判定結果を示す場合、利得復号部704は、上記の利得コードブックを用いて、下記の式(12)に従い利得値を逆量子化する。ここでも、利得値をL次元ベクトルとして扱い、ベクトル逆量子化を行う。すなわち、予測復号を行わない場合は、利得符号化情報G_minに対応する利得コードベクトルGCG_min を、直接、利得値とする。
Figure 2011045926
次いで、利得復号部704は、現フレームの逆量子化で得られる利得値、および形状復号部702から入力される形状の値を用いて、下記の式(13)に従い、第2レイヤ復号スペクトルとして復号MDCT係数を算出し、下記の式(14)に従い内蔵のバッファを更新する。ここでは、算出された復号MDCT係数をX2”(k)と記す。また、復号MDCT係数の逆量子化において、kがB(j”)〜B(j”+1)−1内に存在する場合、利得値Gain_q’(j)はGain_q’(j”)の値をとる。
Figure 2011045926
Figure 2011045926
利得復号部704は、上記の式(13)に従い算出された第2レイヤ復号スペクトルX2”(k)を加算部207および第3レイヤ符号化部208に出力する。
図7は、第3レイヤ符号化部208の主要な構成を示すブロック図である。
この図において、第3レイヤ符号化部208は、帯域選択部311A、形状符号化部302、適応予測判定部303、利得符号化部304、および多重化部305を備える。なお、第3レイヤ符号化部208を構成する帯域選択部311A以外の構成要素は、上述した第2レイヤ符号化部205における構成要素と同一であるため、同一の符号を付し、説明を省略する。
図8は、帯域選択部311Aの主要な構成を示すブロック図である。
この図において、帯域選択部311Aは、聴感特性算出部501、サブバンドエネルギ算出部502、および帯域決定部503から主に構成される。
聴感特性算出部501には、加算部207から第2レイヤ差分スペクトルX2(k)が入力される。また、聴感特性算出部501には、第2レイヤ復号部206から第2レイヤ復号スペクトルX2”(k)が入力される。
まず、聴感特性算出部501は、第2レイヤ復号スペクトルX2”(k)に対して、第2レイヤ符号化部205で符号化されたスペクトルのピーク成分の周辺のインデックスを算出する。これは、第2レイヤ符号化部205の形状符号化部302において量子化されたピーク成分である。そのため、例えば、形状符号化部302において、正弦波符号化(Sinusoidal Encoding)方法でスペクトルを符号化していた場合などに対しては、形状符号化情報を復号することで容易にピーク成分を算出することが出来る。
聴感特性算出部501は、算出したピーク成分の周辺のインデックス、およびピーク成分の振幅値をサブバンドエネルギ算出部502に出力する。なお、ここでは、一例として、第2復号スペクトルX2”(k)に対して、サブバンド毎に最大振幅を有するスペクトル成分をピーク成分とする場合について説明する。
サブバンドエネルギ算出部502は、上述したサブバンドエネルギ算出部401と同様、まず、第2レイヤ差分スペクトルX2(k)を複数のサブバンドに分割する。なお、サブバンドエネルギ算出部502は、帯域選択部311Aに入力された第2レイヤ差分スペクトルを直接入力しても良く、あるいは、第2レイヤ差分スペクトルを聴感特性算出部501経由で入力しても良い。ここでは、J(Jは自然数)個のサブバンドに均等に分割する場合を例に挙げて説明する。そして、サブバンドエネルギ算出部502は、J個のサブバンドの中で連続するL(Lは自然数)個のサブバンドを選択し、M(Mは自然数)種類のサブバンドのグループを得る。上記で説明したように、以下、このM種類のサブバンドのグループをリージョンと呼ぶ。
次いで、サブバンドエネルギ算出部502は、聴感特性算出部501から入力されるピーク成分の周辺のインデックス情報、およびピーク成分の振幅値情報を用いて、下記の式(15−1)に従い、M種類の各リージョンの平均エネルギE2(m)を算出する。ここで、式(15−1)における一時スペクトルX(k)は、式(15−2)のように表すものとする。
Figure 2011045926
この式において、jはJ個の各サブバンドのインデックスを示し、mは、M種類の各リージョンのインデックスを示す。なお、S(m)は、リージョンmを構成するL個のサブバンドのインデックスのうちの最小値を示し、B(j)は、サブバンドjを構成する複数のMDCT係数のインデックスのうちの最小値を示す。W(j)は、サブバンドjのバンド幅を示し、以下の説明では、J個の各サブバンドのバンド幅が全て等しい場合、すなわちW(j)が定数である場合を例にとって説明する。
また、式(15−2)に示すように、インデックスkが聴感特性算出部501から入力されるピーク成分の周辺のインデックスに該当しない場合には、一時スペクトルX(k)の値を、そのまま用いて、リージョン毎の平均エネルギE2(m)を算出する。
一方、インデックスkが聴感特性算出部501から入力されるピーク成分の周辺のインデックスに該当する場合、つまりピーク成分の周辺の開始インデックスPeakstartからPeakend内に存在する場合には、サブバンドエネルギ算出部502は第2レイヤ差分スペクトルX2(k)の値から、聴感特性算出部501から入力されるピーク成分の振幅値PeakValueに予め定められた値βを乗じた値を減算する。そして、サブバンドエネルギ算出部502は、減算後の一時スペクトルX(k)を用いて、リージョン毎の平均エネルギE2(m)を算出する。
このようにして、サブバンドエネルギ算出部502は、下位レイヤで符号化したスペクトル成分のうち、大きな成分(ピーク成分)の周辺に存在するスペクトル成分のエネルギを小さく見積もる。この結果、聴感的に重要な他のスペクトル成分が選択されやすくなり、聴感的により良い復号信号を生成することができるようになる。
なお、この時、減算処理によって、一時スペクトルX(k)の符号が変わってしまう場合には、一時スペクトルX(k)の値を0とする。ここで、βは既に下位レイヤで量子化されたスペクトルのピーク成分の振幅値に乗ぜられる0以上1以下の係数であり、例えば0.5程度の値が一例として挙げられる。
聴感マスキング効果は、マスカー(マスクする側の成分であり、ここではピーク成分を示す)からの周波数軸上の距離が近いほど強くなるが、ここでは大幅に演算量を増やさないために、簡易的に定数βを用いてX(k)の値を算出する方法について説明する。なお、もちろん、正確な聴感マスキング特性値を算出する場合においても、本発明は同様に適用できる。
サブバンドエネルギ算出部502は、得られたリージョン毎の平均エネルギE2(m)を帯域決定部503に出力する。
帯域決定部503には、サブバンドエネルギ算出部502から、リージョン毎の平均エネルギE2(m)が入力される。帯域決定部503は、平均エネルギE2(m)が最大となるリージョン、例えばサブバンドj”〜(j”+L−1)からなる帯域を量子化対象となる帯域(量子化対象帯域)として選択し、このリージョンを示すインデックスm_maxを帯域情報として形状符号化部302、適応予測判定部303、および多重化部305に出力する。
上記で説明したように、サブバンドエネルギ算出部502は、インデックスkが聴感特性算出部501から入力されるピーク成分の周辺のインデックスに該当する場合、つまりピーク成分の周辺の開始インデックスPeakstartからPeakend内に存在する場合、X(k)の値から、聴感特性算出部501から入力されるピーク成分の振幅値PeakValueに予め定められた値βを乗じた値を減算し、聴覚マスキングする。
このようにして聴感マスキング効果を考慮して、サブバンドエネルギ算出部502は、減算後のX(k)を用いて、リージョン毎の平均エネルギE2(m)を算出することにより、下位レイヤで符号化したスペクトル成分のうち、大きな成分(ピーク成分)の周辺に存在するスペクトル成分のエネルギを小さく見積もる。そのため、帯域決定部503において、聴感的に重要な他のスペクトル成分が選択されやすくなる。これによって、聴感的により良い復号信号を生成することができるようになる。
また、帯域決定部503は、量子化対象帯域の第2レイヤ差分スペクトルX2(k)を形状符号化部302に出力する。なお、帯域決定部503は、帯域選択部311Aに入力された第2レイヤ差分スペクトルを直接入力しても良く、あるいは、第2レイヤ差分スペクトルを聴感特性算出部501及び/又はサブバンドエネルギ算出部502を経由して入力しても良い。また、以下の説明では、帯域決定部503で選択した量子化対象帯域を示すバンドインデックスをj”〜(j”+L−1)とする。
以上が、第3レイヤ符号化部208の処理説明である。
第3レイヤ復号部209については、入出力がそれぞれ第2レイヤ符号化情報および第2レイヤ復号スペクトルに代えて、第3レイヤ符号化情報および第3レイヤ復号スペクトルとなること以外は、上述した第2レイヤ復号部206の処理と同様であるため、ここでは説明を省略する。
また、第4レイヤ符号化部211については、入出力がそれぞれ第2レイヤ差分スペクトル、第2レイヤ復号スペクトルおよび第3レイヤ符号化情報に代えて、第3レイヤ差分スペクトル、第3レイヤ復号スペクトルおよび第4レイヤ符号化情報となること以外は、上述した第3レイヤ符号化部208の処理と同様であるため、ここでは説明を省略する。
以上が、符号化装置101の処理説明である。
図9は、図1に示した復号装置103の内部の主要な構成を示すブロック図である。復号装置103は、一例として4つの復号階層(レイヤ)からなる階層復号装置とする。ここでは、符号化装置101と同様、ビットレートの低い方から順に、第1レイヤ、第2レイヤ、第3レイヤ、第4レイヤと呼ぶことにする。
符号化情報分離部601は、伝送路102を介して符号化装置101から送られる符号化情報を入力とし、符号化情報を各レイヤの符号化情報に分離し、それぞれの復号処理を担当する復号部に出力する。具体的には、符号化情報分離部601は、符号化情報中に含まれる第1レイヤ符号化情報を第1レイヤ復号部602に出力し、符号化情報中に含まれる第2レイヤ符号化情報を第2レイヤ復号部603に出力し、符号化情報中に含まれる第3レイヤ符号化情報を第3レイヤ復号部604に出力し、符号化情報中に含まれる第4レイヤ符号化情報を第4レイヤ復号部606に出力する。
第1レイヤ復号部602は、符号化情報分離部601から入力される第1レイヤ符号化情報に対して、例えばCELP方式の音声復号方法を用いて復号を行って第1レイヤ復号信号を生成し、生成した第1レイヤ復号信号を加算部609に出力する。
第2レイヤ復号部603は、符号化情報分離部601から入力される第2レイヤ符号化情報を復号し、得られる第2レイヤ復号スペクトルX2”(k)を加算部605に出力する。第2レイヤ復号部603の処理は、上述した第2レイヤ復号部206の処理と同一であるためここでは説明を省略する。
第3レイヤ復号部604は、符号化情報分離部601から入力される第3レイヤ符号化情報を復号し、得られる第3レイヤ復号スペクトルX3”(k)を加算部605に出力する。第3レイヤ復号部604の処理は、上述した第3レイヤ復号部209の処理と同一であるためここでは説明を省略する。
加算部605には、第2レイヤ復号部603から第2レイヤ復号スペクトルX2”(k)が入力される。また、加算部605には、第3レイヤ復号部604から第3レイヤ復号スペクトルX3”(k)が入力される。加算部605は、入力された第2レイヤ復号スペクトルX2”(k)および第3レイヤ復号スペクトルX3”(k)を加算し、加算したスペクトルを第1加算スペクトルX5”(k)として加算部607に出力する。
第4レイヤ復号部606は、符号化情報分離部601から入力される第4レイヤ符号化情報を復号し、得られる第4レイヤ復号スペクトルX4”(k)を加算部607に出力する。第4レイヤ復号部606の処理は、入出力の名称が異なる以外は、上述した第3レイヤ復号部209の処理と同一であるためここでは説明を省略する。
加算部607には、加算部605から第1加算スペクトルX5”(k)が入力される。また、加算部607には、第4レイヤ復号部606から第4レイヤ復号スペクトルX4”(k)が入力される。加算部607は、入力された第1加算スペクトルX5”(k)および第4レイヤ復号スペクトルX4”(k)を加算し、加算したスペクトルを第2加算スペクトルX6”(k)として直交変換処理部608に出力する。
直交変換処理部608は、まず下記の式(16)に従い内蔵のバッファbuf’(k)を「0」値に初期化する。
Figure 2011045926
直交変換処理部608は、第2加算スペクトルX6”(k)を入力とし、下記の式(17)に従い第2加算復号信号y”(n)を求める。
Figure 2011045926
この式において、X7(k)は、第2加算スペクトルX6”(k)とバッファbuf’(k)とを結合させたベクトルであり、下記の式(18)を用いて求められる。
Figure 2011045926
次いで、直交変換処理部608は、下記の式(19)に従いバッファbuf’(k)を更新する。
Figure 2011045926
直交変換処理部608は、第2加算復号信号y”(n)を加算部609に出力する。
加算部609には、第1レイヤ復号部602から第1レイヤ復号信号が入力される。また、加算部609には、直交変換処理部608から第2加算復号信号が入力される。加算部609は、入力された第1レイヤ復号信号および第2加算復号信号を加算し、加算した信号を出力信号として出力する。
以上が、復号装置103の処理説明である。
このように、本実施の形態によれば、量子化対象とする帯域(量子化対象帯域)を階層(レイヤ)毎に選択する階層符号化(スケーラブル)を行う符号化装置101において、帯域選択部311Aは、下位レイヤの符号化結果(量子化された帯域情報)に基づいて、現レイヤの量子化対象帯域を選択するという構成を採る。具体的には、帯域選択部311Aにおいて、聴感特性算出部501は、下位レイヤで量子化されたスペクトル成分に対して、サブバンド毎に最大振幅を有するスペクトル成分(ピーク成分)を探索する。サブバンドエネルギ算出部502は、kがピーク成分の周辺の開始インデックスPeakstartからPeakend内に存在する場合には、第2レイヤ差分スペクトルX2(k)の値から、聴感特性算出部501から入力されるピーク成分の振幅値PeakValueに予め定められた値βを乗じた値を減算する。そして、サブバンドエネルギ算出部502は、減算後のX(k)を用いて、リージョン毎の平均エネルギE2(m)を算出する。そして、帯域決定部503は、平均エネルギE2(m)が最大となるリージョン、例えばサブバンドj”〜(j”+L−1)からなる帯域を量子化対象となる帯域(量子化対象帯域)として選択する。これにより、現レイヤにおいて、下位レイヤで符号化されたスペクトルによる聴感マスキング効果の影響を考慮した上で、聴感的に重要な帯域を符号化できるので、復号信号の品質を改善することができる。
なお、本実施の形態における聴感特性算出部501が、下位レイヤで量子化されたスペクトル成分に対して、サブバンド毎に最大振幅を有するスペクトル成分(ピーク成分)を探索し、サブバンドエネルギ算出部502が、ピーク成分に対する聴感マスキング効果を考慮して、リージョンの平均エネルギを算出する場合について説明したが、本発明はこれに限らない。本発明は、聴感特性算出部501が、複数のピーク成分を探索する構成の場合に対しても同様に適用できる。なお、この場合、サブバンドエネルギ算出部502では、複数のピーク成分それぞれに対して聴感マスキング効果を考慮して、リージョンの平均エネルギを算出する必要がある。
(実施の形態2)
本発明の実施の形態2は、第3レイヤ符号化部208、および第4レイヤ符号化部211内の利得符号化部304において、実施の形態1で示した帯域選択方法を用いず、さらに演算量を削減することが可能な構成について説明する。
実施の形態2に係る通信システム(図示せず)は、図1に示した通信システムと基本的に同様であり、符号化装置の構成および動作の一部のみにおいて、図1の通信システムの符号化装置101と相違する。以下、本実施の形態に係る通信システムの符号化装置に対し符号「111」を付し、説明を行う。具体的には、第3レイヤ符号化部208、および第4レイヤ符号化部211内の帯域選択部のみが、実施の形態1とは動作が異なる。そこで、本実施の形態における第3レイヤ符号化部208、および第4レイヤ符号化部211内の帯域選択部に対し符号「321」を付し、説明を行う。なお、復号装置103については、実施の形態1と同一であるため、説明は省略する。
本実施の形態に係る符号化装置111の構成図は図2と同様であり、本実施の形態における第3レイヤ符号化部208および第4レイヤ符号化部211には、それぞれ第2レイヤ復号部206および第3レイヤ復号部209から、第2レイヤ復号スペクトルおよび第3レイヤ復号スペクトルがそれぞれ入力される構成となっている。
なお、本実施の形態における第3レイヤ符号化部208および第4レイヤ符号化部211内の帯域選択部321においては、第2レイヤ復号スペクトルおよび第3レイヤ復号スペクトルに代えて、第2レイヤ符号化情報および第3レイヤ符号化情報がそれぞれ入力されるとしてもよい。帯域選択部321においては、下位レイヤにおいて量子化された帯域情報を利用するからである。
したがって、以下の説明においては、第3レイヤ符号化部208および第4レイヤ符号化部211には、それぞれ第2レイヤ復号部206および第3レイヤ復号部209から、第2レイヤ復号スペクトルおよび第3レイヤ復号スペクトルが入力される構成ではなく、それぞれ第2レイヤ符号化部205および第3レイヤ符号化部208から、第2レイヤ符号化情報および第3レイヤ符号化情報がそれぞれ入力される構成について説明する。
図10は、帯域選択部321の主要な構成を示すブロック図である。なお、帯域選択部321は、第3レイヤ符号化部208および第4レイヤ符号化部211に共通する処理ブロックである。以下では、代表して、第3レイヤ符号化部208における帯域選択部321の処理説明をする。
この図において、帯域選択部321は、サブバンド重要度算出部801、サブバンドエネルギ算出部802、および帯域決定部803から主に構成される。
サブバンド重要度算出部801には、第2レイヤ符号化部205から第2レイヤ符号化情報が入力される。
サブバンド重要度算出部801は、第2レイヤ差分スペクトルのサブバンド毎に聴感に対する重要度imp(k)(k=0〜N−1)を保持するバッファを有する。ここでは、例えば上記重要度の初期値を1.0とする。
サブバンド重要度算出部801は、入力される第2レイヤ符号化情報に含まれる帯域情報が示すサブバンド、つまり、下位レイヤである第2レイヤ符号化部205において量子化対象として選択され量子化された帯域については、上記重要度の値を小さく見積もる。
具体的には、サブバンド重要度算出部801は、式(20)に従って、第2レイヤ符号化情報に含まれる帯域情報が示すサブバンドの重要度に対して、予め定められた係数γを乗じる。ここでは、γを乗じた重要度をimp2(k)と表す。
Figure 2011045926
γの値の例としては、0以上1未満の値が望ましく、例えばγ=0.8程度にすると、良好な効果が現れることが、実験によって確かめられている。しかし、もちろんγの値を上記以外の数値に設定しても構わない。
なお、式(20)によるサブバンドの重要度の値の調整処理は、第4レイヤ符号化部211においても同様に適用できる。つまり、第2レイヤ符号化部205と第3レイヤ符号化部208との両方で量子化されたサブバンドについては、γが2回乗じられる。なお、γを乗じる回数は、符号化装置111を構成するレイヤ数による。そのため、γを、ここで説明した回数以外の回数だけ乗じる場合についても、本発明は同様に適用される。
サブバンド重要度算出部801は、サブバンド毎の重要度imp2(k)(k=0〜N−1)を、サブバンドエネルギ算出部802に出力する。なお、サブバンド重要度算出部801は、サブバンド毎の重要度imp2(k)(k=0〜N−1)によって、内部のバッファを式(21)のようにして更新する。
Figure 2011045926
サブバンドエネルギ算出部802には、サブバンド重要度算出部801からサブバンド毎の重要度imp2(k)(k=0〜N−1)が入力される。また、サブバンドエネルギ算出部802には、加算部207から第2レイヤ差分スペクトルが入力される。
サブバンドエネルギ算出部802は、まず、第2レイヤ差分スペクトルX2(k)を複数のサブバンドに分割する。ここでは、J(Jは自然数)個のサブバンドに均等に分割する場合を例に挙げて説明する。そして、サブバンドエネルギ算出部802は、J個のサブバンドの中で連続するL(Lは自然数)個のサブバンドを選択し、M(Mは自然数)種類のサブバンドのグループを得る。実施の形態1と同様に、以下、このM種類のサブバンドのグループをリージョンと呼ぶ。リージョンの構成についての説明は実施の形態1と同様であるため説明を省略する。
次いで、サブバンドエネルギ算出部802は、下記の式(22)に従い、M種類の各リージョンの平均エネルギE3(m)を算出する。
Figure 2011045926
この式において、jはJ個の各サブバンドのインデックスを示し、mは、M種類の各リージョンのインデックスを示す。なお、S(m)は、リージョンmを構成するL個のサブバンドのインデックスのうちの最小値を示し、B(j)は、サブバンドjを構成する複数のMDCT係数のインデックスのうちの最小値を示す。W(j)は、サブバンドjのバンド幅を示し、以下の説明では、J個の各サブバンドのバンド幅が全て等しい場合、すなわちW(j)が定数である場合を例にとって説明する。
式(21)から分かるように、本実施の形態では、サブバンドエネルギ算出部802は、各サブバンドのエネルギに各サブバンドの重要度を乗じ、重要度を乗じた後の各サブバンドのエネルギを合計することにより、各リージョンの平均エネルギを算出する。この点が、実施の形態1における各リージョンの平均エネルギ算出方法とは異なる。
先に説明したように、下位レイヤである第2レイヤ符号化部205において量子化されたサブバンドの重要度には、0以上1未満の値のγが乗じられて、重要度が低く補正されるので、上記式(21)により、量子化対象として選択されなかったサブバンドのエネルギが小さく見積もられる。このように、リージョンの平均エネルギに、各サブバンドの重要度を利用することにより、下位レイヤにおいて既に量子化されたサブバンドを含むリージョンが選択されにくくなる。
サブバンドエネルギ算出部802は、得られたリージョン毎の平均エネルギE3(m)を帯域決定部803に出力する。
帯域決定部803には、サブバンドエネルギ算出部802から、リージョン毎の平均エネルギE3(m)が入力される。帯域決定部803は、平均エネルギE3(m)が最大となるリージョン、例えばサブバンドj”〜(j”+L−1)からなる帯域を量子化対象となる帯域(量子化対象帯域)として選択し、このリージョンを示すインデックスm_maxを帯域情報として形状符号化部302、適応予測判定部303、および多重化部305に出力する。
また、帯域決定部803は、量子化対象帯域の第2レイヤ差分スペクトルX2(k)を形状符号化部302に出力する。なお、なお、帯域決定部803は、帯域選択部321に入力された第2レイヤ差分スペクトルを直接入力しても良く、あるいは、第2レイヤ差分スペクトルをサブバンドエネルギ算出部802経由で入力しても良い。以下の説明では、帯域決定部803で選択した量子化対象帯域を示すバンドインデックスをj”〜(j”+L−1)とする。
以上が、本実施の形態における第3レイヤ符号化部208、および第4レイヤ符号化部211内の帯域選択部321の処理説明である。
このように、本実施の形態によれば、第3レイヤ符号化部208、および第4レイヤ符号化部211内の帯域選択部321は、各サブバンドのエネルギを算出する際に、そのサブバンドが下位レイヤで既に量子化されているかどうかによって重要度を設定(補正)し、設定(補正)後の重要度を利用する。
具体的には、既に下位レイヤで量子化されているサブバンドの重要度を低く設定(補正)し、設定(補正)後の重要度を考慮してエネルギを算出する。これにより、下位レイヤで量子化されていないサブバンドに比べて、エネルギが小さく見積もられるので、下位レイヤで量子化されたサブバンドは、現レイヤにおいては量子化対象として選択されにくくなる。この結果、複数のレイヤに亘って、量子化対象として選択され量子化される帯域が一部に偏ることを防ぐことができる。そのため、全レイヤに亘り、より幅広い帯域を量子化することができるようになるので、結果として、復号信号の品質の向上(例えば、聴感的に幅広い帯域を感じることが出来る等)を図ることができる。
また、実施の形態1では、下位レイヤで量子化されたスペクトルのピーク毎に聴感マスキング効果を算出するのに対し、本実施の形態では、サブバンド毎に聴感的な重要度を設定(補正)するだけでよい。そのため、下位レイヤでの量子化結果に基づいて、上位レイヤにおける量子化帯域を選択することによって復号信号の品質向上を実現するにあたり、実施の形態1に比べて処理演算量を大きく削減できる。
以上、本発明の各実施の形態について説明した。
また、上記各実施の形態では、符号化装置が4つの符号化階層(レイヤ)からなる構成について説明したが、本発明はこれに限らず、階層数が4以外の構成においても同様に適用できる。
また、上記各実施の形態では、最下位の第1レイヤ符号化部/復号部において、CELP方式の符号化/復号方法を採る構成について説明したが、本発明はこれに限らず、CELP方式の符号化/復号方法を採るレイヤが存在しない場合についても同様に適用できる。例えば、全て周波数変換符号化/復号方法のレイヤである構成に対しては、符号化装置、復号装置上で時間軸での加減算をする加算部は不要となる。
また、上記各実施の形態では、符号化装置において、第1レイヤ復号信号と入力信号との差分信号を算出した後に、それを直交変換処理し、差分スペクトルを算出する構成について説明したが、本発明はこれに限らない。まず入力信号および第1レイヤ復号信号に対してまず直交変換処理を行い、それぞれ入力スペクトル、および第1レイヤ復号スペクトルを算出した後に、差分スペクトルを算出するという構成についても同様に適用できる。
また、上記各実施の形態では、符号化装置内において、符号化レイヤ毎にリージョンの平均エネルギを算出し、量子化対象とする帯域を選択する、という構成について説明したが、本発明はこれに限らない。下位レイヤで既に算出されたリージョンの平均エネルギから、下位レイヤにおいて符号化された形状符号化情報と利得符号化情報とから算出されるエネルギを減算することによって、各リージョンの平均エネルギを算出するという方法についても同様に適用できる。
また、上記各実施の形態では、第3レイヤ符号化部において、下位レイヤ(第2レイヤ符号化部)の符号化結果を利用して、量子化対象帯域を選択する構成を例に挙げて説明したが、本発明はこれに限らず、第2レイヤ符号化部における帯域選択部に対しても同様に適用できる。この構成においては、第1レイヤ符号化部における符号化結果を利用して量子化対象帯域を選択する。例えば、第1レイヤ符号化部内で算出された、ピッチ周期(ピッチ周波数)、ピッチ利得などを利用して量子化対象帯域を選択する構成が例に挙げられる。具体的にはピッチ周波数とその倍数に対応する帯域を含むサブバンドを選択しやすくなるような重みを乗じた上で、サブバンドのエネルギを評価する等の方法がある。
なお、形状符号化方法として、正弦波符号化方法(Sinusoid Encoding)を採っていた場合には、量子化した形状のエネルギ算出が容易であるため、特に効果がある。
また、本発明に係る符号化装置、復号装置およびこれらの方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
また、上記各実施の形態における復号装置は、上記各実施の形態における符号化装置から伝送された符号化情報を用いて処理を行うとしたが、本発明はこれに限定されず、必要なパラメータやデータを含む符号化情報であれば、必ずしも上記各実施の形態における符号化装置からの符号化情報でなくても処理は可能である。
また、信号処理プログラムを、メモリ、ディスク、テープ、CD、DVD等の機械読み取り可能な記録媒体に記録、書き込みをし、動作を行う場合についても、本発明は適用することができ、本実施の形態と同様の作用および効果を得ることができる。
また、上記各実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル/プロセッサを利用してもよい。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2009年10月14日出願の特願2009−237683に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明にかかる符号化装置、復号装置およびこれらの方法は、階層的に量子化対象帯域を選択し、符号化/復号する構成において、復号信号の品質を向上することができ、例えば、パケット通信システム、移動通信システムなどに適用できる。
101 符号化装置
103 復号装置
102 伝送路
201 第1レイヤ符号化部
202,602 第1レイヤ復号部
203,207,210,605,607,609 加算部
204,608 直交変換処理部
205 第2レイヤ符号化部
206,603 第2レイヤ復号部
208 第3レイヤ符号化部
209,604 第3レイヤ復号部
211 第4レイヤ符号化部
212 符号化情報統合部
301,311A,321 帯域選択部
302 形状符号化部
303 適応予測判定部
304 利得符号化部
305 多重化部
401,502,802 サブバンドエネルギ算出部
402,503,803 帯域決定部
701 分離部
702 形状復号部
703 適応予測判定部
704 利得復号部
501 聴感特性算出部
601 符号化情報分離部
606 第4レイヤ復号部
801 サブバンド重要度算出部

Claims (14)

  1. 少なくとも2つの符号化レイヤを有する符号化装置であって、
    周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化手段と、
    前記第2入力信号と、前記第1復号信号または前記第1符号化情報とを入力し、前記第1復号信号または前記第1符号化情報を用いて、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択し、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2量子化対象帯域の第2帯域情報を含む第2符号化情報を生成する第2レイヤ符号化手段と、
    を具備する符号化装置。
  2. 前記第2レイヤ符号化手段は、
    前記第1復号信号または前記第1符号化情報を用いて、前記複数のサブバンドの中から前記第2入力信号の前記第2量子化対象帯域を選択して前記第2帯域情報を生成するとともに、前記第2量子化対象帯域の前記第2入力信号を出力する帯域選択手段と、
    前記第2量子化対象帯域の前記第2入力信号の形状及び利得を符号化して形状符号化情報及び利得符号化情報を生成する形状・利得符号化手段と、
    を具備する、請求項1記載の符号化装置。
  3. 前記第2レイヤ符号化手段は、
    前記第2帯域情報を用いて前記利得の量子化方法を選択する判定手段をさらに具備し、
    前記形状・利得符号化手段は、
    前記判定手段により選択された前記量子化方法を用いて前記利得を符号化する、
    請求項2記載の符号化装置。
  4. 前記第2レイヤ符号化手段は、
    前記第1復号信号が入力された場合には、前記第1復号信号によるマスキング効果を利用して前記第2量子化対象帯域を選択する、
    請求項1記載の符号化装置。
  5. 前記第2レイヤ符号化手段は、
    前記第2量子化対象帯域を選択する際に、前記第1符号化情報に含まれる第1量子化対象帯域と前記第1量子化対象帯域以外の帯域とに対して、重要度に関する重みづけを相対的に前記第1量子化対象帯域に低く行って前記第2量子化対象帯域を選択する、
    請求項1記載の符号化装置。
  6. 請求項1に記載の符号化装置を具備する通信端末装置。
  7. 請求項1に記載の符号化装置を具備する基地局装置。
  8. 少なくても2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号装置であって、
    前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む第1符号化情報と、前記第1符号化情報を用いて生成された第1レイヤ復号信号を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信手段と、
    前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号手段と、
    前記情報から得られる前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する第2復号信号を生成する第2レイヤ復号手段と、
    を具備する復号装置。
  9. 前記第1レイヤ復号手段は、
    前記第1符号化情報に含まれる第1形状符号化情報と前記第1帯域情報とを用いて、前記第1量子化対象帯域に対する前記第1復号信号の形状を求める第1形状復号手段と、
    前記第1符号化情報に含まれる第1利得符号化情報を用いて前記第1復号信号の利得を求め、前記第1量子化対象帯域に対する前記第1復号信号の形状と前記第1復号信号の利得とを用いて前記第1復号信号を生成する第1利得復号手段と、
    を具備する、請求項8記載の復号装置。
  10. 前記第2レイヤ復号手段は、
    前記第2符号化情報に含まれる第2形状符号化情報と前記第2帯域情報とを用いて、前記第2量子化対象帯域に対する前記第2復号信号の形状を求める第2形状復号手段と、
    前記第2符号化情報に含まれる第2利得符号化情報を用いて前記第2復号信号の利得を求め、前記第2量子化対象帯域に対する前記第2復号信号の形状と前記第2復号信号の利得とを用いて前記第2復号信号を生成する第2利得復号手段と、
    を具備する、請求項8記載の復号装置。
  11. 請求項8に記載の復号装置を具備する通信端末装置。
  12. 請求項8に記載の復号装置を具備する基地局装置。
  13. 少なくとも2つの符号化レイヤで符号化を行う符号化方法であって、
    周波数領域の第1入力信号を入力し、前記周波数領域を分割した複数のサブバンドの中から前記第1入力信号の第1量子化対象帯域を選択し、前記第1量子化対象帯域の前記第1入力信号を符号化して、前記第1量子化対象帯域の第1帯域情報を含む第1符号化情報を生成するとともに、前記第1符号化情報を用いて第1復号信号を生成し、前記第1入力信号と前記第1復号信号とを用いて第2入力信号を生成する第1レイヤ符号化ステップと、
    前記第2入力信号と、前記第1復号信号または前記第1符号化情報とを入力し、前記第1復号信号または前記第1符号化情報を用いて、前記複数のサブバンドの中から前記第2入力信号の第2量子化対象帯域を選択し、前記第2量子化対象帯域の前記第2入力信号を符号化して、前記第2量子化対象帯域の第2帯域情報を含む第2符号化情報を生成する第2レイヤ符号化ステップと、
    を具備する符号化方法。
  14. 少なくても2つの符号化レイヤを有する符号化装置において生成された情報を受信して復号する復号方法であって、
    前記符号化装置の第1レイヤの符号化により得られた、周波数領域を分割した複数のサブバンドの中から前記第1レイヤの第1量子化対象帯域を選択して生成された第1帯域情報を含む第1符号化情報と、前記第1符号化情報を用いて生成された第1レイヤ復号信号を用いた前記符号化装置の第2レイヤの符号化により得られた、前記複数のサブバンドの中から前記第2レイヤの第2量子化対象帯域を選択して生成された第2帯域情報を含む前記第2符号化情報と、を有する前記情報を受信する受信ステップと、
    前記情報から得られる前記第1符号化情報を入力し、前記第1符号化情報に含まれる前記第1帯域情報に基づいて設定される前記第1量子化対象帯域に対する第1復号信号を生成する第1レイヤ復号ステップと、
    前記情報から得られる前記第2符号化情報を入力し、前記第2符号化情報に含まれる前記第2帯域情報に基づいて設定される前記第2量子化対象帯域に対する第2復号信号を生成する第2レイヤ復号ステップと、
    を具備する復号方法。
JP2011536037A 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法 Expired - Fee Related JP5544370B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011536037A JP5544370B2 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2009237683 2009-10-14
JP2009237683 2009-10-14
PCT/JP2010/006087 WO2011045926A1 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法
JP2011536037A JP5544370B2 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法

Publications (2)

Publication Number Publication Date
JPWO2011045926A1 true JPWO2011045926A1 (ja) 2013-03-04
JP5544370B2 JP5544370B2 (ja) 2014-07-09

Family

ID=43875982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011536037A Expired - Fee Related JP5544370B2 (ja) 2009-10-14 2010-10-13 符号化装置、復号装置およびこれらの方法

Country Status (4)

Country Link
US (1) US9009037B2 (ja)
EP (1) EP2490216B1 (ja)
JP (1) JP5544370B2 (ja)
WO (1) WO2011045926A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2525354B1 (en) * 2010-01-13 2015-04-22 Panasonic Intellectual Property Corporation of America Encoding device and encoding method
US10223810B2 (en) 2016-05-28 2019-03-05 Microsoft Technology Licensing, Llc Region-adaptive hierarchical transform and entropy coding for point cloud compression, and corresponding decompression
US10694210B2 (en) 2016-05-28 2020-06-23 Microsoft Technology Licensing, Llc Scalable point cloud compression with transform, and corresponding decompression
US11297346B2 (en) 2016-05-28 2022-04-05 Microsoft Technology Licensing, Llc Motion-compensated compression of dynamic voxelized point clouds
US11509897B2 (en) * 2020-08-07 2022-11-22 Samsung Display Co., Ltd. Compression with positive reconstruction error

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6446037B1 (en) * 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
KR100513729B1 (ko) * 2003-07-03 2005-09-08 삼성전자주식회사 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법
JP2008519991A (ja) * 2004-11-09 2008-06-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声の符号化及び復号化
KR100707177B1 (ko) * 2005-01-19 2007-04-13 삼성전자주식회사 디지털 신호 부호화/복호화 방법 및 장치
US20090210219A1 (en) * 2005-05-30 2009-08-20 Jong-Mo Sung Apparatus and method for coding and decoding residual signal
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
BRPI0617447A2 (pt) * 2005-10-14 2012-04-17 Matsushita Electric Ind Co Ltd codificador de transformada e método de codificação de transformada
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
JP5058152B2 (ja) * 2006-03-10 2012-10-24 パナソニック株式会社 符号化装置および符号化方法
JP5352454B2 (ja) * 2006-06-28 2013-11-27 サノフイ Cxcr2アンンタゴニスト
ES2474915T3 (es) * 2006-12-13 2014-07-09 Panasonic Intellectual Property Corporation Of America Dispositivo de codificación, dispositivo de decodificación y métodos correspondientes
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP2008261999A (ja) * 2007-04-11 2008-10-30 Toshiba Corp オーディオ復号装置
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
JP2009237683A (ja) 2008-03-26 2009-10-15 Oki Electric Ind Co Ltd 業務情報検索システム
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder

Also Published As

Publication number Publication date
EP2490216A4 (en) 2016-10-05
JP5544370B2 (ja) 2014-07-09
EP2490216B1 (en) 2019-04-24
US9009037B2 (en) 2015-04-14
EP2490216A1 (en) 2012-08-22
US20120245931A1 (en) 2012-09-27
WO2011045926A1 (ja) 2011-04-21

Similar Documents

Publication Publication Date Title
RU2502138C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5328368B2 (ja) 符号化装置、復号装置、およびこれらの方法
JP5339919B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5058152B2 (ja) 符号化装置および符号化方法
ES2629453T3 (es) Codificador, descodificador y procedimiento de codificación
TWI605448B (zh) 產生帶寬延伸訊號的裝置
JP5331249B2 (ja) 符号化方法、復号方法、装置、プログラムおよび記録媒体
KR20090104846A (ko) 디지털 오디오 신호에 대한 향상된 코딩/디코딩
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
WO2007132750A1 (ja) Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法
JP5746974B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5544370B2 (ja) 符号化装置、復号装置およびこれらの方法
JP5714002B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JPWO2008053970A1 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP5863765B2 (ja) 符号化方法および装置、そして、復号化方法および装置
JP6062861B2 (ja) 符号化装置及び符号化方法
WO2013057895A1 (ja) 符号化装置及び符号化方法
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP5544371B2 (ja) 符号化装置、復号装置およびこれらの方法
RU2459283C2 (ru) Кодирующее устройство, декодирующее устройство и способ
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140512

R151 Written notification of patent or utility model registration

Ref document number: 5544370

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees