JPWO2011016248A1 - 符号化方法、復号方法、符号化装置及び復号装置 - Google Patents
符号化方法、復号方法、符号化装置及び復号装置 Download PDFInfo
- Publication number
- JPWO2011016248A1 JPWO2011016248A1 JP2011525799A JP2011525799A JPWO2011016248A1 JP WO2011016248 A1 JPWO2011016248 A1 JP WO2011016248A1 JP 2011525799 A JP2011525799 A JP 2011525799A JP 2011525799 A JP2011525799 A JP 2011525799A JP WO2011016248 A1 JPWO2011016248 A1 JP WO2011016248A1
- Authority
- JP
- Japan
- Prior art keywords
- conversion
- signal
- decoded
- output signal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/132—Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/129—Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
本発明に係る符号化方法は、入力信号を変換する変換ステップ(S110a)と、変換出力信号を量子化する量子化ステップ(S120)と、量子化係数をエントロピー符号化するエントロピー符号化ステップ(S130)とを含み、変換ステップ(S110a)は、第1変換係数を用いて入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換ステップ(S112)と、第1変換出力信号の一部である第1部分信号に、第2変換係数を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、第1変換出力信号のうち第1部分信号以外の部分である第2部分信号とを含む変換出力信号を出力する第2変換ステップ(S116a)と、第1変換出力信号に対して補正を行う補正ステップとを含む。
Description
本発明は、オーディオ、静止画像、及び動画像を符号化する符号化方法に関し、特に、時空間ドメインから周波数ドメインへ入力信号を変換する変換処理を含む符号化方法に関する。
音声データや動画像データを圧縮するために、複数の音声符号化規格、動画像符号化規格が開発されてきた。動画像符号化規格の例として、H.26xと称されるITU−T規格やMPEG−xと称されるISO/IEC規格が挙げられる。最新の動画像符号化規格は、H.264/MPEG−4 AVCと称される規格である。
図1は、従来の符号化装置1600の構成を示すブロック図である。図1に示すように、符号化装置1600は、変換部1610と、量子化部1620と、エントロピー符号化部1630とを備え、音声データや動画像データを低ビットレートで符号化する。
変換部1610は、各種データである入力信号、又は入力信号に何らかの処理を加えた変換入力信号を時空間ドメインから周波数ドメインへ変換することで、相関を軽減した変換出力信号を生成する。生成された変換出力信号は、量子化部に出力される。
量子化部1620は、変換部1610から出力された変換出力信号を量子化することで、総データ量の少ない量子化係数を生成する。生成された量子化係数は、エントロピー符号化部に出力される。
エントロピー符号化部1630は、量子化部1620から出力された量子化係数を、エントロピー符号化アルゴリズムを用いて符号化することで、残りのデータを圧縮した符号化信号を生成する。生成された符号化信号は、例えば、記録媒体に記録され、あるいは、ネットワークを介して復号装置などに送信される。
以下では、変換部1610が行う変換処理について詳細に説明する。
変換部1610には、変換対象信号(すなわち、変換入力信号)であるn点のベクトル(n次元信号)が、変換入力(Transform Input)ベクトルxnとして入力される。変換部は、変換入力ベクトルxnに、所定の変換処理(変換T)を行い、変換出力信号として、変換出力(Transform Output)ベクトルynを出力する(式1参照)。
変換Tが線形変換である場合、式2に示すように、変換Tは、n×nの正方行列である変換行列(Transform Matrix)Aと変換入力ベクトルxnとの行列積として表現できる。なお、式3は、変換出力ベクトルynを、変換行列Aの各要素である変換係数aikを用いて要素yi毎に算出するための式であり、式1と式2とから導出される。
変換行列Aは、入力信号の相関を軽減し、変換出力ベクトルynの要素のうち小さいnを持つ要素(いわゆる低域側)へエネルギーが集中するように設計される。変換行列Aの設計にあたり、KLT(Karhunen Loeve Transform:カルーネンレーベ変換)という変換係数導出方法、又は変換方法が知られている。
KLTは、入力信号の統計的性質に基づいて、最適な変換係数を導出する方法、又は、導出した最適な変換係数を用いた変換方法である。KLTは、入力信号の相関性を完全に無くすことが可能で、最も効率良くエネルギーを低域へ集中させることができる技術として知られている。
つまり、KLTは、理想的な変換処理であり、優れた符号化効率で、KLTによって変換された符号化対象信号を符号化することができる。
しかしながら、上記従来技術に示すKLTには、演算量が大きく、かつ、変換に用いる変換行列の係数である変換係数のデータ量が多いという問題がある。具体的には、以下の通りである。
図2に示すように、バタフライ構成などの高速アルゴリズムの存在するDCT(Discrete Cosine Transform:離散コサイン変換)では、入力信号の次元数(以下、入力点数とも記載)がMの場合の乗算回数は、M×Log2(M)である。これに対して、KLTでは、乗算回数はM×Mになる。例えば、DCTの乗算回数は、入力点数が4点の場合8回、入力点数が8点の場合24回である。これに対して、KLTの乗算回数は、例えば、入力点数が4点の場合16回(DCT比2倍)、8点の場合64回(DCT比2.6倍)、16点の場合はDCT比4.0倍である。変換サイズが大きくなるほど、KLTの演算量の増加傾向は著しくなるため、KLTは、DCTと比べて演算量が膨大になるという課題がある。
また、KLTでは、入力信号ベクトルxnを含む集合SAの統計的性質に基づいて、変換行列Aを導出する。変換行列Aを用いた変換は、集合SAに含まれる入力信号ベクトルxnに対して、最適な無相関化と低域へのエネルギー圧縮とを行うことができる。しかし、設計時に想定した集合SAと異なる統計的特性を持つ集合SBに含まれる入力信号ベクトルが入力された場合、変換行列Aを用いた変換結果は、最適にならない。逆に、常に最適を求めて、入力の統計的性質のわずかな変化毎に変換係数を生成すれば、変換係数のデータ量が膨大になる。
以上のように、KLTなどの、入力信号の統計的性質に基づき計算される変換係数で構成される変換行列を用いる変換には、演算量が大きく、かつ、変換係数のデータ量が多いという課題があるため、従来の符号化の際にKLTを利用するのは困難であった。
そこで、本発明は、上記課題を解決するためになされたものであって、演算量の増加、及び、変換係数のデータ量の増加を抑制し、符号化効率を高めることができる符号化方法及び符号化装置を提供することを目的とする。さらに、本発明は、本発明に係る符号化方法及び符号化装置によって符号化された信号を正しく復号することができる復号方法及び復号装置を提供することを目的とする。
上記課題を解決するために、本発明の一態様に係る符号化方法は、入力信号を変換することで、変換出力信号を生成する変換ステップと、前記変換出力信号を量子化することで、量子化係数を生成する量子化ステップと、前記量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化ステップとを含み、前記変換ステップは、第1変換係数を用いて前記入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換ステップと、前記第1変換出力信号の一部である第1部分信号に、第2変換係数を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、前記第1変換出力信号のうち前記第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を生成する第2変換ステップと、前記第1変換出力信号に対して補正を行う補正ステップとを含む。
本構成によれば、入力信号に対して1段階目の第1変換を行うことで、第1変換出力信号を生成し、第1変換出力信号の一部である第1部分信号に2段階目の第2変換を行う。第2変換の対象となる第1部分信号は、第1変換出力信号よりも次元数が低減しているので、演算量の削減と変換係数の総数の削減とが可能となる。また、第1変換と第2変換との2回の変換によって、より相関を少なくするような変換を行うことができ、符号化効率を高めることができる。さらに、第2変換の前に第1変換出力信号を補正するので、より第2変換が適切に行われるように補正しておくことができる。
また、前記第1変換ステップでは、予め定められた係数を、前記第1変換係数として用いて前記第1変換を行ってもよい。
本構成によれば、予め定められた係数を用いた変換(例えば、DCT)を第1変換として行った場合、変換係数の基底の大きさが揃わない場合が存在するので、第2変換の前に第1変換出力信号を補正することで、第2変換をより適切に行うことができる。また、第1変換に用いる第1変換係数を導出しなくてもよいので、演算量を削減することができる。
また、前記補正ステップでは、前記第1変換係数に基づいて決定される補正パラメータを用いて前記第1変換出力信号を正規化することで、前記第1変換出力信号を補正してもよい。
本構成によれば、第1変換出力信号を正規化するので、基底の大きさが揃わないという問題が解消でき、第2変換をより適切に行うことができる。
また、前記補正ステップでは、前記量子化ステップにおいて用いられる量子化マトリクスのウェイトスケールを用いて前記第1変換出力信号を重み付けすることで、前記第1変換出力信号を補正してもよい。
本構成によれば、通常、量子化の際に行う量子化マトリクスのスケーリングの重み付けを、変換処理で合わせて行うことができる。
また、前記補正ステップでは、前記第1部分信号と前記第2部分信号とを、それぞれ別々に補正してもよい。
本構成によれば、第2変換が適用される部分と第2変換が適用されない部分とによって、信号の性質が異なる場合、信号をそれぞれ別々に補正することで、より適切な変換を行うことができる。
また、前記補正ステップでは、前記第2変換における有効データ長が所定の値以下に収まるように、前記第1部分信号を構成する係数値をシフトダウンすることで、前記第1変換出力信号を補正してもよい。
本構成によれば、第2変換の前後でメモリのデータサイズ(ビット長)を揃えることができる。
また、前記補正ステップでは、さらに、前記第1部分信号又は前記第2変換出力信号を構成する係数値のビット長が、前記第2部分信号を構成する係数値のビット長と同じになるように、前記第1部分信号又は前記第2変換出力信号を構成する係数値をシフトダウンしてもよい。
本構成によれば、第2変換の前後でメモリのデータサイズ(ビット長)を揃えることができる。
また、本発明の一態様に係る復号方法は、符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号ステップと、前記復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化ステップと、前記復号変換出力信号を逆変換することで、復号信号を生成する逆変換ステップとを含み、前記逆変換ステップは、第2逆変換係数を用いて、前記復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換ステップと、前記第1復号部分信号と、前記復号変換出力信号のうち前記第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数を用いて第1逆変換を行うことで、前記復号信号を生成する第1逆変換ステップと、前記第1復号変換出力信号に対して補正を行う補正ステップとを含む。
本構成によれば、少ない演算量と少ない変換係数で符号化信号を正しく復号することができる。
また、前記第1逆変換ステップでは、予め定められた係数を、前記第1逆変換係数として用いて前記第1逆変換を行ってもよい。
また、前記補正ステップでは、前記第1逆変換係数に基づいて決定される補正パラメータを用いて前記第1復号変換出力信号を正規化することで、前記第1復号変換出力信号を補正してもよい。
また、前記補正ステップでは、さらに、前記逆量子化ステップにおいて用いられる量子化マトリクスのウェイトスケールを用いて前記第1復号部分信号を重み付けすることで、前記第1復号変換出力信号を補正してもよい。
また、前記補正ステップでは、前記第1復号部分信号と前記第2復号部分信号とをそれぞれ別々に補正してもよい。
また、前記補正ステップでは、前記第2逆変換における有効データ長が所定の値以下に収まるように、前記第2復号変換出力信号を構成する係数値をシフトダウンすることで、前記第1復号変換出力信号を補正してもよい。
また、前記補正ステップでは、さらに、前記第1復号部分信号又は前記第2復号変換出力信号を構成する係数値のビット長が、前記第2復号部分信号を構成する係数値のビット長と同じになるように、前記第1復号部分信号又は前記第2復号変換出力信号を構成する係数値をシフトダウンしてもよい。
以上のいずれの復号方法においても、符号化方法の場合と同様に、演算量の増加及び変換係数のデータ量の増加を抑制することができる。また、上記の符号化方法によって符号化された信号を正しく復号することができる。
なお、本発明は、符号化方法及び復号方法として実現できるだけではなく、当該符号化方法及び復号方法に含まれる処理ステップを行う処理部を備える符号化装置及び復号装置として実現することもできる。また、これらステップをコンピュータに実行させるプログラムとして実現してもよい。さらに、当該プログラムを記録したコンピュータ読み取り可能なCD−ROM(Compact Disc−Read Only Memory)などの記録媒体、並びに、当該プログラムを示す情報、データ又は信号として実現してもよい。そして、それらプログラム、情報、データ及び信号は、インターネットなどの通信ネットワークを介して配信してもよい。
また、上記の各符号化装置及び復号装置を構成する構成要素の一部又は全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されていてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM及びRAM(Random Access Memory)などを含んで構成されるコンピュータシステムである。
本発明によれば、演算量の増加、及び、変換係数のデータ量の増加を抑制し、符号化効率を高めることができる。
以下、本発明の実施の形態について、図面を参照しながら説明する。
(実施の形態1)
本発明の実施の形態1に係る符号化装置は、入力信号を変換することで、変換出力信号を生成する変換部と、変換出力信号を量子化することで、量子化係数を生成する量子化部と、量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化部とを備える。そして、変換部は、第1変換係数で構成される第1変換行列を用いて入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換部と、第1変換出力信号の一部である第1部分信号に、第2変換係数で構成される第2変換行列を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、第1変換出力信号のうち第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を出力する第2変換部とを備える。
本発明の実施の形態1に係る符号化装置は、入力信号を変換することで、変換出力信号を生成する変換部と、変換出力信号を量子化することで、量子化係数を生成する量子化部と、量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化部とを備える。そして、変換部は、第1変換係数で構成される第1変換行列を用いて入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換部と、第1変換出力信号の一部である第1部分信号に、第2変換係数で構成される第2変換行列を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、第1変換出力信号のうち第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を出力する第2変換部とを備える。
言い換えると、本発明の実施の形態1に係る符号化装置は、入力信号に対して2段階の変換を行うことを特徴とする。具体的には、本発明の実施の形態1に係る符号化装置は、入力信号に第1変換を行い、第1変換後の信号の一部である第1部分信号に第2変換を行うことを特徴とする。
なお、本明細書においては、変換行列と変換係数とはほぼ同義として用いる場合がある。
なお、バタフライ構成やシフトと加算の演算を用いる構成のように、単純な行列演算でなくとも実現できる変換であっても、本明細書では行列表現で記述する場合がある。このように行列表現で記述することは、バタフライ構成や、シフトと加算の演算を用いる構成、あるいは、リフティング構造を用いる構成など、各種の演算量を軽減した変換を除外するものではない。
図3は、本発明の実施の形態1に係る符号化装置100の構成の一例を示すブロック図である。図3に示すように、符号化装置100は、変換部110と、量子化部120と、エントロピー符号化部130とを備える。
変換部110は、入力信号(変換入力信号)を変換することで、変換出力信号を生成する。変換部110は、図3に示すように、第1変換部200と、分割部210と、第2変換部220と、統合部230とを備える。
第1変換部200は、第1変換行列を用いて変換入力信号に第1変換を行うことで、第1変換出力信号を生成する。
分割部210は、第1変換出力信号を2つの部分に分割する。具体的には、分割部210は、第1変換部200によって生成された第1変換出力信号を、分割統合情報を用いて第1部分信号と第2部分信号とに分割する。なお、分割統合情報は、第1部分信号が第1変換出力信号のどの部分に対応するかを示す選択範囲情報の一例である。
第2変換部220は、第2変換行列を用いて第1部分信号に第2変換を行うことで、第2変換出力信号を生成する。
統合部230は、第2変換出力信号と第2部分信号とを統合することで、変換出力信号を生成する。
上記の変換部110が備える各処理部の詳細な動作については、後で説明する。
量子化部120は、変換部110によって生成された変換出力信号を量子化することで、量子化係数を生成する。
エントロピー符号化部130は、量子化部120によって生成された量子化係数をエントロピー符号化することで、符号化信号を生成する。
なお、符号化装置100には、音声データ、静止画像データ、動画像データなどの各種データである入力信号が符号化対象信号として入力される。変換部110には、符号化対象信号(Original Signal)、又は、この符号化対象信号と、以前に入力された符号化対象信号に基づいて作成された予測信号との差分である予測誤差信号が、変換入力信号として、入力される。一般的には、予測誤差信号が変換の対象として入力されることが多いが、伝送路にエラーが混入する場合を想定して予測を行わない場合、又は、エネルギーが小さい場合には、予測を行わずに入力信号が変換の対象として入力される。このような変換入力(Transform Input)信号を式4に示すようなベクトルxnと表す。
続いて、本発明の実施の形態1に係る符号化装置100の動作の一例について説明する。
図4は、本発明の実施の形態1に係る符号化装置100の動作の一例を示すフローチャートである。また、図5A及び図5Bは、本発明の実施の形態1に係る符号化装置100における変換部110のデータフローの一例を概念的に示す図である。
まず、変換部110は、変換入力信号xnを変換することで、変換出力信号ynを生成する(ステップS110)。
具体的には、まず、第1変換部200が、第1変換行列を用いて変換入力信号xnに第1変換を行うことで、第1変換出力信号y1 nを生成する(ステップS112)。具体的には、第1変換部200は、変換入力信号xnの相関を軽減し、低周波数帯域にエネルギーを集中させるように、変換入力信号xnを第1変換出力信号y1 nに変換する。
このとき、第1変換に用いる第1変換係数として、例えば、以前に入力された変換入力信号xnの第1変換の際に、既に算出されている係数を用いることができる。つまり、第1変換を行う度に第1変換係数を算出しなくてもよいので、第1変換係数の算出にかかる演算量を低減することができる。第1変換係数を算出する場合の具体的な処理については、後で説明する。
次に、分割部210は、第1変換出力信号y1 nを、第1部分信号y1L mと第2部分信号y1H n−mとに分割する(ステップS114)。具体的には、分割部210は、分割統合情報に基づいて、第1部分信号y1L mの相関エネルギーが第2部分信号y1H n−mの相関エネルギーよりも大きくなるように、第1変換出力信号y1 nを分割する。
分割統合情報とは、分割部210に対して、低周波数帯域を第1部分信号y1L mとし、高周波数帯域を第2部分信号y1H n−mとして分割する制御を行わせるような情報である。分割統合情報は、エネルギーの大きな成分を第1部分信号y1L mへ、エネルギーの小さな成分を第2部分信号y1H n−mへと入力に応じて、動的に制御するように指示する情報であってもよい。
このとき、分割統合情報として、例えば、以前に入力された第1変換出力信号y1 nの分割の際に既に決定された分割統合情報を用いることができる。つまり、分割を行う度に、新たな分割統合情報を決定する必要はない。
分割部210によって分割された第1部分信号y1L mは、図5Aに示すように、一次元に並び替えられ、第2変換部220に入力される。
次に、第2変換部220は、第2変換行列を用いて第1部分信号y1L mに第2変換を行うことで、第2変換出力信号y2 mを生成する(ステップS116)。具体的には、第2変換部220は、第1部分信号y1L mの相関を軽減し、より低周波数帯域にエネルギーを集中させるように、第1部分信号y1L mを第2変換出力信号y2 mに変換する。
このとき、第2変換係数として、例えば、以前に入力された第1部分信号y1L mの第2変換の際に既に算出された係数を用いることができる。つまり、第2変換を行う度に第2変換係数を算出しなくてもよいので、第2変換係数の算出にかかる演算量を低減することができる。第2変換係数を算出する場合の具体的な処理については、後で説明する。
次に、統合部230は、第2変換出力信号y2 mと第2部分信号y1H n−mとを統合することで、変換出力信号ynを生成する(ステップS118)。具体的には、統合部230は、第2変換出力信号y2 mを一次元に並び替えられる前の次元に並び替え、分割統合情報に基づいて、並び替えた後の第2変換出力信号y2 mと第2部分信号y1H n−mとを統合する。
次に、量子化部120は、以上のようにして生成された変換出力信号ynを量子化することで、量子化係数を生成する(ステップS120)。最後に、エントロピー符号化部130は、量子化係数をエントロピー符号化することで、符号化信号を生成する(ステップS130)。
なお、図5Bに示すように、分割部210は、第1部分信号y1L mを一次元に並び替えることなく、そのまま第2変換部220に出力してもよい。この場合、第2変換部220は、二次元の第1部分信号y1L mに第2変換を行うことで、二次元の第2変換出力信号y2 mを生成する。ここでは、第2変換部220は、例えば、非分離型の第2変換を行う。そして、統合部230では、第2変換出力信号y2 mの並び替えを行うことなく、第2変換出力信号y2 mと第2部分信号y1H n−mとを統合する。
また、図5A及び図5Bでは、第2変換の対象は、第1変換出力信号の任意の領域(非矩形領域)であるように図示したが、これに限るものではなく矩形領域であっても構わない。具体的には、図5A及び図5Bに示す例では、第2変換部220は、第1変換出力信号の低周波成分の係数値を含む、行列表現した場合における非矩形領域に含まれる信号を、第1部分信号として第2変換を行う。これに対して、第2変換部220は、第1変換出力信号の低周波成分の係数値を含む、行列表現した場合における矩形領域に含まれる係数値を含む信号を、第1部分信号として第2変換を行ってもよい。
次に、第1変換係数、第2変換係数及び分割統合情報を決定する場合の動作及び構成について説明する。
図6は、本発明の実施の形態1に係る変換部110における変換処理の一例を示すフローチャートである。また、図7は、本発明の実施の形態1に係る変換部110における変換係数の導出の一例を示す概念図である。
図7に示すように、変換部110は、さらに、第1変換係数導出部202と、第2変換係数導出部222とを備える。なお、図7には、分割部210及び統合部230は、図示していない。
まず、図6に示すように、第1変換係数導出部202は、変換入力信号xnに基づいて第1変換係数を決定する(ステップS111)。次に、第1変換部200は、第1変換係数導出部202によって決定された第1変換係数で構成される第1変換行列を用いて、変換入力信号xnに第1変換を行う(ステップS112)。
次に、分割統合情報が決定される(ステップS113)。分割統合情報は、予め決められた分割を行うように分割部210を制御するものであれば、符号化装置100のメモリ等から読み出す。また、分割統合情報が、第1変換出力信号y1 nに応じた分割を行うよう分割部210を制御するものであれば、第1変換出力信号y1 nに基づいてエネルギー状態の分布に鑑みて分割統合情報を導出する。
このようにして決定された分割統合情報に基づいて、分割部210は、第1変換出力信号y1 nを分割する(ステップS114)。
次に、第2変換係数導出部222は、第1部分信号y1L mに基づいて第2変換係数を決定する(ステップS115)。次に、第2変換部220は、決定された第2変換係数で構成される第2変換行列を用いて、第1部分信号y1 nに第2変換を行う(ステップS116)。
最後に、統合部230は、第2変換出力信号y2 mと分割された第2部分信号y1H n−mとを統合し、変換出力信号ynとして出力する(ステップS118)。
図7を用いて、第1変換部200における第1変換と第2変換部220における第2変換とについて詳細に説明する。
多くのサンプルを含むある集合SAには、第1変換部200に入力される変換入力信号xnが含まれている。第1変換係数導出部202は、例えば、KLTを用いて、この集合SAに含まれる多くのサンプルに平均的に最適化された第1変換係数を求める。
このように多くのサンプルを含む集合SAに基づいて、第1変換係数を求めることにより、個々の変換入力信号xnの統計的性質にあまり影響を受けず、多少異なる性質であっても同じ第1変換係数で構成される第1変換行列を用いて第1変換を行うことができる。よって、第1変換係数の更新頻度を抑えることができ、つまり、図4に示す処理のように、第1変換係数の決定を行わない場合を多くすることができるので、演算量を削減することができる。
また、第1変換係数の更新をする場合であっても、更新前と後の変換係数の個々の値の変化量は小さいため、差分情報量を少なくすることができる。したがって、第1変換係数を復号装置に送信する場合に、符号量の増加を抑制することができる。
一方、第2変換部220には、第1変換出力信号y1 nを構成する係数値のうち、相関エネルギーの大きな部分である第1部分信号y1L mが入力される。第2変換係数導出部222は、第1変換係数導出部202と同様に、例えばKLTを用いて、第1部分信号y1L mを含み、集合SAと比較してサンプル数の少ない集合SCに含まれるサンプルに平均的に最適化された第2変換係数を求める。
このように、集合SCを集合SAより小さい集合とすることで、入力される第1変換出力信号y1 nの統計的性質の変化に鋭敏に追従でき、さらなる相関の軽減とエネルギー圧縮とが可能となる。なお、小さい集合SCとすることで変換係数の更新頻度は高まるが、第1部分信号y1L mは、第1変換出力信号y1 nの一部であり、変換入力信号xnよりも次元数が少ないため、第2変換行列の要素数は少なくなり、高効率な変換と、演算量及びデータ量の削減とを両立させることができる。
なお、第2変換部220には、第1変換出力信号y1 nを構成する係数値のうち相関エネルギーの大きな部分である第1部分信号y1L mが入力されるとしたが、これは、第1変換出力信号y1 nの自己相関の高い位置を選択しているといえる。これに対して、類似の方法として、第1変換出力信号y1 nの相互相関の高い位置を第1部分信号y1L mとして選択してもよい。
なお、第1部分信号y1L mと第2変換出力信号y2 mとのそれぞれについて、次元の並び替えを分割部210と統合部230とが行うこととしたが、それぞれの並び替えを第2変換部220が行う構成であってもよい。また、符号化の対象が音声データ等の一次元信号である場合、あるいは、一次元信号処理と見なすことができる分離型の各次元の処理において、変換部110に入力される変換入力信号xnは一次元であるため、これらの並び替えの処理は不要となる。
以上のように、本発明の実施の形態1に係る符号化装置100は、入力信号に第1変換を行い、第1変換後の信号の一部である第1部分信号に第2変換を行うことを特徴とする。これにより、本発明の実施の形態1に係る符号化装置100によれば、入力信号の統計的性質に基づいて計算される変換係数を用いる変換において、変換の演算量の削減、及び、変換行列の要素数(データ量)の削減を実現することができる。
なお、上記の実施の形態1に係る符号化装置100では、第1変換出力信号y1 nを第1部分信号y1L mと第2部分信号y1H n−mとに分割し、第2変換後に統合するが、明示的に分割しなくてもよく、実質的に分割すればよい。すなわち、第1変換出力信号y1 nのうち、第2変換を実行する対象となる部分を決定すればよい。例えば、第2変換の際に、第2変換の対象とならない要素に対する行の対角要素を1、非対角要素を0にすることで、実質的に第1部分信号y1L mにのみ、第2変換を行うことができる。図8に行列演算の具体例を示す。
図8(a)のように、4点のベクトルXnのうちの3点(X1,X2,X3)に対して3×3の大きさの行列A3を乗算して得られる結果と、図8(b)のように、A3を4×4へ拡張し、拡張の際、対角要素は1、非対角要素は0を設定した拡張後の行列A4と4点のXとの乗算結果の3点の部分とは、一致する。
図9は、本発明の実施の形態1の変形例に係る符号化装置100aの構成の一例を示すブロック図である。
符号化装置100aは、変換部110aと、量子化部120と、エントロピー符号化部130とを備える。なお、図3に示す符号化装置100と同じ動作を行う処理部には、同じ符号を付しており、以下では説明を省略する。
変換部110aは、第1変換部200と、第2変換部220aとを備える。つまり、変換部110aは、図3に示す変換部110と比較して、分割部210と、統合部230とを備えていない点と、さらに、第2変換部220の代わりに第2変換部220aとを備える点とが異なっている。
第2変換部220aは、第1変換出力信号y1 nの一部である第1部分信号y1L mを含む集合の統計特性に基づいて決定された第2変換係数で構成される第2変換行列を用いて、第1部分信号y1L mに第2変換を行うことで、第2変換出力信号y2 mを生成する。具体的には、第2変換部220aは、第1変換出力信号y1 nを構成する係数値のうち、第2変換の対象となる係数値を決定し、決定した係数値から構成される信号を第1部分信号y1L mとして、第2変換を行う。より具体的には、第2変換部220aは、第1変換出力信号y1 nを構成する複数の係数値のうち、所定の閾値より値の大きな係数値を含む信号を、第1部分信号y1L mとして、第2変換を行う。
そして、第2変換部220aは、生成した第2変換出力信号y2 mと、第1変換出力信号y1 nのうち第1部分信号y1L m以外の部分である第2部分信号y1H n−mとを含む変換出力信号ynを出力する。
図10は、図9に示す符号化装置100aの動作の一例を示すフローチャートである。
まず、変換部110aが、入力された変換入力信号xnを変換することで、変換出力信号ynを生成する(ステップS110a)。具体的には、まず、入力された変換入力信号xnに対して、第1変換部200は、第1変換を行うことで、第1変換出力信号y1 nを生成する(ステップS112)。
次に、第2変換部220aが、第1部分信号y1L mに第2変換を行う(ステップS116a)。例えば、第2変換部220aは、第1変換出力信号y1 nのうち、第2変換を行う対象となる部分を、第1部分信号y1L mとして決定し、決定した第1部分信号y1L mに対して第2変換行列を用いて第2変換を行う。
次に、量子化部120は、第2変換出力信号y2 mを含む変換出力信号ynを量子化することで、量子化係数Cnを生成する(ステップS120)。最後に、エントロピー符号化部130は、量子化係数Cnをエントロピー符号化することで、符号化信号を生成する(ステップS130)。
以上のように、実施の形態1の変形例に係る符号化装置100aも、部分的に2段階の変換を行うことで、符号化処理における演算量の増加、及び、変換係数のデータ量の増加を抑制することができる。
(実施の形態2)
本発明の実施の形態2に係る復号装置は、符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号部と、復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化部と、復号変換出力信号を逆変換することで、復号信号を生成する逆変換部とを備える。そして、逆変換部は、第2逆変換係数で構成される第2逆変換行列を用いて、復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換部と、第1復号部分信号と、復号変換出力信号のうち第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数で構成される第1逆変換行列を用いて第1逆変換を行うことで、復号信号を生成する第1逆変換部とを備える。
本発明の実施の形態2に係る復号装置は、符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号部と、復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化部と、復号変換出力信号を逆変換することで、復号信号を生成する逆変換部とを備える。そして、逆変換部は、第2逆変換係数で構成される第2逆変換行列を用いて、復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換部と、第1復号部分信号と、復号変換出力信号のうち第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数で構成される第1逆変換行列を用いて第1逆変換を行うことで、復号信号を生成する第1逆変換部とを備える。
言い換えると、本発明の実施の形態2に係る復号装置は、符号化信号に対して2段階の逆変換を行うことを特徴とする。具体的には、本発明の実施の形態2に係る復号装置は、符号化信号にエントロピー復号及び逆量子化を行うことで生成される復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行い、第2逆変換後の信号と、復号変換出力信号の残りの部分である第2復号部分信号とを含む第1復号変換出力信号に第1逆変換を行うことを特徴とする。
図11Aは、本発明の実施の形態2に係る復号装置300の構成の一例を示すブロック図である。復号装置300には、音声データや動画像データを低ビットレートで符号化した符号化信号が入力され、復号装置300は、符号化信号から音声データや動画像データを復号することで、復号信号を生成する。
復号装置300は、符号化信号に対してエントロピー復号をし、逆量子化をし、逆変換をするという符号化の処理とほぼ逆の処理を行う。図11Aに示すように、復号装置300は、エントロピー復号部310と、逆量子化部320と、逆変換部330とを備える。
エントロピー復号部310は、入力された符号化信号をエントロピー復号することで、復号量子化係数を生成する。復号量子化係数は、実施の形態1に係る量子化部120が生成する量子化係数に相当する。
逆量子化部320は、エントロピー復号部310によって生成された復号量子化係数を逆量子化することで、復号変換出力信号を生成する。復号変換出力信号は、実施の形態1に係る変換部110が生成する変換出力信号に相当する。
逆変換部330は、逆量子化部320によって生成された復号変換出力信号を逆変換することで、復号信号を生成する。復号信号は、実施の形態1に係る変換部110に入力される変換入力信号に相当する。
以下では、本発明の実施の形態2に係る逆変換部330について、詳細に説明する。図11Bは、本発明の実施の形態2に係る復号装置300における逆変換部330の構成の一例を示すブロック図である。図11Bに示すように、逆変換部330は、分割部400と、第2逆変換部410と、統合部420と、第1逆変換部430とを備える。
分割部400は、復号変換出力信号を2つの部分に分割する。具体的には、分割部400は、逆量子化部320によって生成された復号変換出力信号を、分割統合情報を用いて第2復号変換出力信号と第2復号部分信号とに分割する。
第2復号変換出力信号は、実施の形態1に係る第2変換部220によって生成された第2変換出力信号に相当する。すなわち、第2復号変換出力信号は、符号化の際に、第2変換が実行された部分に相当し、第2逆変換の対象となる部分である。また、第2復号部分信号は、実施の形態1に係る分割部210によって分割された第2部分信号に相当する。
第2逆変換部410は、第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する。第1復号部分信号は、実施の形態1に係る分割部210によって分割された第1部分信号に相当する。
統合部420は、第2逆変換部410によって生成された第1復号部分信号と、第2復号部分信号とを統合することで、第1復号変換出力信号を生成する。第1復号変換出力信号は、実施の形態1に係る第1変換部200によって生成された第1変換出力信号に相当する。
第1逆変換部430は、第1逆変換行列を用いて第1復号変換出力信号に第1逆変換を行うことで、復号信号を生成する。第1復号変換出力信号は、第2復号変換出力信号と第2復号部分信号とを含む信号である。
なお、復号装置300には音声データ、静止画像データ、動画像データなどの各種データである信号を符号化することで生成された符号化信号が入力される。逆変換部330には、この符号化信号をエントロピー復号し、かつ、逆量子化することで生成された信号が、復号変換出力信号y^nとして入力される。ここで、記号「^(ハット)」は、それぞれ直前の文字の上に付される記号を示し、本明細書では、以下、記号「^(ハット)」を同様な意味で使用する。
続いて、本発明の実施の形態2に係る復号装置300の動作の一例について説明する。
図12は、本発明の実施の形態2に係る復号装置300の動作の一例を示すフローチャートである。また、図13A及び図13Bは、本発明の実施の形態2に係る復号装置300における逆変換部330のデータフローの一例を概念的に示す図である。
まず、エントロピー復号部310は、符号化信号をエントロピー復号することで、復号量子化係数を生成する(ステップS210)。次に、逆量子化部320は、復号量子化係数を逆量子化することで、復号変換出力信号y^nを生成する(ステップS220)。
次に、逆変換部330は、復号変換出力信号y^nを逆変換することで、復号信号x^nを生成する(ステップS230)。
具体的には、まず、分割部400が、分割統合情報に基づいて、復号変換出力信号y^nを、2つの領域に分割する(ステップS232)。つまり、分割部400は、復号変換出力信号y^nを第2復号変換出力信号y^2 mと第2復号部分信号y^1H n−mとに分割する。第2復号変換出力信号y^2 mは、復号変換出力信号y^nを構成する複数の係数値のうち、第2逆変換の対象となる部分である。第2復号部分信号y^1H n−mは、第2復号変換出力信号y^2 mは、復号変換出力信号y^nを構成する複数の係数値のうち、第2逆変換の対象とならない部分である。
このとき、分割統合情報として、例えば、以前に入力された復号変換出力信号y^nの分割の際に用いた分割統合情報を用いることができる。つまり、分割を行う度に、新たな分割統合情報を決定する必要はない。
分割部400によって分割された第2復号変換出力信号y^2 mは、図13Aに示すように、一次元に並び替えられ、第2逆変換部410に入力される。
次に、第2逆変換部410は、第2逆変換行列を用いて第2復号変換出力信号y^2 mに第2逆変換を行うことで、第1復号部分信号y^1L mを生成する(ステップS234)。
このとき、第2逆変換係数として、例えば、以前に入力された第2復号変換出力信号y^2 mの第2逆変換の際に既に決定された係数を用いることができる。つまり、第2逆変換を行う度に、新たな第2逆変換係数を決定する必要はない。
次に、統合部420は、第2復号部分信号y^1H n−mと、第1復号部分信号y^1L mとを統合することで、第1復号変換出力信号y^1 nを生成する(ステップS236)。具体的には、統合部420は、第1復号部分信号y^1L mを一次元に並び替えられる前の次元に並び替え、分割統合情報に基づいて、並び替えた後の第1復号部分信号y^1L mと第2復号部分信号y^1H n−mとを統合する。
次に、第1逆変換部430は、第1逆変換行列を用いて、第1復号変換出力信号y^1 nに第1逆変換を行うことで、復号信号x^nを生成する(ステップS238)。
このとき、第1逆変換係数として、例えば、以前に入力された第1復号変換出力信号y^1 nの第1逆変換の際に既に決定された係数を用いることができる。つまり、第1逆変換を行う度に、新たな第1逆変換係数を決定する必要はない。
なお、図13Bに示すように、分割部400は、第2復号変換出力信号y^2 mを一次元に並び替えることなく、そのまま第2逆変換部410に出力してもよい。この場合、第2逆変換部410は、二次元の第2復号変換出力信号y^2 mに第2逆変換を行うことで、二次元の第1復号部分信号y^1L mを生成する。そして、統合部420では、第1復号部分信号y^1L mの並び替えを行うことなく、第1復号部分信号y^1L mと第2復号部分信号y^1H n−mとを統合する。
また、図13A及び図13Bでは、第2逆変換の対象は、復号変換出力信号の任意の領域(非矩形領域)であるように図示したが、これに限るものではなく矩形領域であっても構わない。具体的には、図13A及び図13Bに示す例では、第2逆変換部410は、復号変換出力信号の低周波成分の係数値を含む、行列表現した場合における非矩形領域に含まれる信号を、第2復号変換出力信号として第2逆変換を行う。これに対して、第2逆変換部410は、復号変換出力信号の低周波成分の係数値を含む、行列表現した場合における矩形領域に含まれる係数値を含む信号を、第2復号変換出力信号として第2逆変換を行ってもよい。
次に、分割統合情報、第1逆変換係数及び第2逆変換係数を決定する場合の動作について説明する。
図14は、本発明の実施の形態2に係る逆変換部330における逆変換処理の一例を示すフローチャートである。
これらを用いて、逆変換処理について説明する。
まず、図14に示すように、分割部400は、分割統合情報を取得する(ステップS231)。そして、分割部400は、上記で説明した復号変換出力信号y^nを、低周波数帯域を含む第2復号変換出力信号y^2 mと、高周波数帯域を含む第2復号部分信号y^1H n−mとに分割する(ステップS232)。具体的には、分割部400は、分割統合情報に基づいて、第2復号変換出力信号y^2 mの相関エネルギーが、第2復号部分信号y^1H n−mの相関エネルギーよりも大きくなるように、復号変換出力信号y^nの分割を行う。
なお、分割統合情報は、実施の形態1で説明したものと同様であり、分割統合情報の取得とは、予め定められたメモリ等に保存されたものを読み出してもよいし、復号変換出力信号y^2 mに応じて動的に決定してもよい。
次に、第2逆変換部410は、第2逆変換に用いる第2逆変換係数を取得する(ステップS233)。第2逆変換係数で構成される第2逆変換行列は、実施の形態1で説明した第2変換の変換係数の逆行列又はそれに近似した行列である。この第2逆変換係数は、実施の形態1と同様に例えばKLTを用いて、第2復号変換出力信号y^2 mを含む集合SDに基づいて求めてもよいし、符号化装置での第2変換に用いられた第2変換係数から求めてもよい。
次に、第2逆変換部410は、決定された第2逆変換係数で構成される第2逆変換行列を用いて、第2復号変換出力信号y^2 mに第2逆変換を行うことで、第1復号部分信号y^1L mを生成する(ステップS234)。そして、統合部420は、第1復号部分信号y^1L mと、第2復号部分信号y^1H n−mとを統合することで、第1復号変換出力信号y^1 nを生成する(ステップS236)。
次に、第1逆変換部430は、第1逆変換に用いる第1逆変換係数を取得する(ステップS237)。第1逆変換係数で構成される第1逆変換行列は、実施の形態1で説明した第1変換の変換係数の逆行列又はそれに近似した行列である。この第1逆変換係数は、実施の形態1と同様に例えばKLTを用いて、第1復号変換出力信号y^1 nを含む集合SEに基づいて求めてもよいし、符号化装置での第1変換に用いられた第1変換係数から求めてもよい。このような逆変換係数の算出は以下の実施の形態でも同様に行ってよい。
第1逆変換部430は、決定された第1逆変換係数で構成される第1逆変換行列を用いて、第1復号変換出力信号y^1 nに第1逆変換を行うことで、復号信号x^nを生成する(ステップS238)。
なお、集合SDと集合SEは、実施の形態1の集合SCと集合SAの関係にあり、集合SDのほうが集合SEよりも含むサンプル数が少ない小さな集合である。以上のようにして、本発明の実施の形態2に係る逆変換部330を備えた復号装置300は、実施の形態1と同様に、高効率な変換と、演算量及びデータ量の削減とを両立させることができる。
なお、第2復号変換出力信号y^2 mと第1復号部分信号y^1L mとのそれぞれについて、次元の並び替えを分割部400と統合部420とが行うこととしたが、それぞれの並び替えを第2逆変換部410が行う構成であってもよい。つまり、分離型の変換を用いてもよいし、図8(b)で示すような対角要素は1で非対角要素は0という行を含む変換行列A4を用いてもよい。また、復号の対象が、音声データ等の一次元信号の場合、あるいは、多次元信号を分離型で構成する場合の各次元の信号は一次元信号と見なせるため、逆変換部330に入力される復号変換出力信号y^nは一次元であり、前述の次元の並び替え(分割部400における一次元信号への並び替え、及び、統合部420における元の次元への並び替え)の処理は不要となる。
以上のように、本発明の実施の形態2に係る復号装置300は、符号化信号にエントロピー復号及び逆量子化を行うことで生成される復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行い、第2逆変換後の信号と、復号変換出力信号の残りの部分である第2復号部分信号とを含む第1復号変換出力信号に第1逆変換を行うことを特徴とする。これにより、本発明の実施の形態2に係る復号装置300によれば、入力信号の統計的性質に基づいて計算される逆変換係数を用いる逆変換において、変換の演算量の削減、及び、逆変換行列の要素数の削減を実現することができる。また、実施の形態1に示す符号化装置100のように、入力信号の統計的性質に基づいて計算される変換係数を用いる変換を含む2段階の変換を行うことで生成された符号化信号を正しく復号することができる。
なお、上記の実施の形態2に係る復号装置300では、復号変換出力信号y^nを第2復号変換出力信号y^2 mと第2復号部分信号y^1H n−mとに分割し、第2逆変換後に統合するが、明示的に分割しなくてもよい。すなわち、復号変換出力信号y^nのうち、第2逆変換を実行する対象となる部分を決定すればよい。例えば、第2逆変換の際に、図8(b)で示すような対角要素は1で非対角要素は0という行を含む変換行列A4を用いることで、分割と統合とを実質的に第2逆変換の際に行うことができる。
図15は、本発明の実施の形態2の変形例に係る復号装置300aの構成の一例を示すブロック図である。
復号装置300aは、エントロピー復号部310と、逆量子化部320と、逆変換部330aとを備える。なお、図11Aに示す復号装置300と同じ動作を行う処理部には、同じ符号を付しており、以下では説明を省略する。
逆変換部330aは、第2逆変換部410aと、第1逆変換部430とを備える。つまり、逆変換部330aは、図11Bに示す逆変換部330と比較して、分割部400と、統合部420とを備えていない点と、さらに、第2逆変換部410の代わりに第2逆変換部410aを備える点とが異なっている。
第2逆変換部410aは、第2逆変換行列を用いて、復号変換出力信号y^nの一部である第2復号変換出力信号y^2 mに第2逆変換を行うことで、第1復号部分信号y^1L mを生成する。例えば、第2逆変換部410aは、復号変換出力信号y^nを構成する係数値のうち、第2逆変換の対象となる係数値を決定し、決定した係数値から構成される信号を第2復号変換出力信号y^2 mとして、第2逆変換を行う。より具体的には、第2逆変換部410aは、復号変換出力信号y^nを構成する複数の係数値のうち、所定の閾値より値の大きな係数値を含む信号を、第2復号変換出力信号y^2 mとして、第2変換を行う。
例えば、第2逆変換部410aは、復号変換出力信号y^nのうち第2逆変換の対象とならない部分である第2復号部分信号y^1H n−mに乗じられる第2逆変換係数の対角要素が1で非対角要素を0にすることで、実質的に第2復号変換出力信号y^2 mのみに、第2逆変換を行うことができる。
図16は、図15に示す復号装置300aの動作の一例を示すフローチャートである。
まず、エントロピー復号部310は、入力された符号化信号をエントロピー復号することで、復号量子化係数C^nを生成する(ステップS210)。次に、逆量子化部320は、復号量子化係数C^nを逆量子化することで、復号変換出力信号y^nを生成する(ステップS220b)。
次に、逆変換部330aが、復号変換出力信号y^nを逆変換することで、復号信号を生成する(ステップS230a)。具体的には、まず、第2逆変換部410aは、復号変換出力信号y^nのうち、第2逆変換の対象となる部分である第2復号変換出力信号y^2 mを逆変換することで、第1復号部分信号y^1L mを生成する(S234a)。そして、第2逆変換部410aは、生成した第1復号部分信号y^1L mと、復号変換出力信号y^nのうち第2逆変換の対象とならなかった部分である第2復号部分信号y^1H n−mとを含む第1復号変換出力信号y^1 nを出力する。
最後に、第1逆変換部430は、第1逆変換行列を用いて第1復号変換出力信号y^1 nに第1逆変換を行うことで、復号信号x^nを生成する(S238)。
以上のように、実施の形態2の変形例に係る復号装置300aによっても、演算量の増加及び逆変換係数のデータ量の増加を抑制するために、2段階の変換が行われた符号化信号を復号することができる。
(実施の形態3)
本発明の実施の形態3に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態3に係る符号化装置及び符号化方法は、変換入力信号として、符号化対象信号(入力信号)と予測信号との差分である予測誤差信号に対して、2段階の変換を行うことを特徴とする。
本発明の実施の形態3に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態3に係る符号化装置及び符号化方法は、変換入力信号として、符号化対象信号(入力信号)と予測信号との差分である予測誤差信号に対して、2段階の変換を行うことを特徴とする。
図17は、本発明の実施の形態3に係る符号化装置500の構成の一例を示すブロック図である。図17に示すように、本発明の実施の形態3に係る符号化装置500は、減算器505と、変換部510と、量子化部120と、エントロピー符号化部130と、逆量子化部540と、逆変換部550と、加算器560と、メモリ570と、予測部580と、制御部590とを備える。なお、図3に示す実施の形態1に係る符号化装置100と同じ構成については、同じ符号を付し、以下では説明を省略する。
減算器505は、符号化対象である入力信号と、以前の符号化対象信号から生成された予測信号との差分(予測誤差)を算出する。算出された予測誤差を示す信号が、変換入力信号として、変換部510に入力される。
変換部510は、実施の形態1で説明した変換部110と同様に、変換入力信号に対して2段階の変換を行う。すなわち、変換部510は、変換入力信号に第1変換を行うことで、第1変換出力信号を生成し、生成した第1変換出力信号の一部である第1部分信号に第2変換を行うことで、第2変換出力信号を生成する。そして、変換部510は、生成した第2変換出力信号と、第1変換出力信号のうち第1部分信号以外の部分である第2部分信号とを含む変換出力信号を量子化部120に出力する。変換部510の詳細については、後で説明する。ここでは、変換部510には、変換入力信号として、予測誤差画像を示す信号が入力される。
逆量子化部540は、量子化部120によって生成された量子化係数を逆量子化することで、復号変換出力信号を生成する。復号変換出力信号は、変換部510によって生成された変換出力信号に相当する。
逆変換部550は、逆量子化部540によって生成された復号変換出力信号を逆変換することで、復号変換入力信号を生成する。復号変換入力信号は、減算器505によって生成された変換入力信号に相当する。
加算器560は、逆変換部550によって生成された復号変換入力信号と、以前の符号化対象信号から生成された予測信号とを加算することで、復号信号を生成する。
メモリ570は、生成された復号信号を格納するための記憶部の一例である。
予測部580は、復号信号を用いて、符号化対象信号の予測を行うことで、予測信号を生成する。具体的には、予測部580は、所定の符号化パラメータに基づいて、符号化対象である入力画像に含まれる符号化対象ブロックの予測画素(予測信号)を生成する。減算器505では、符号化対象ブロックの画素と予測画素との差分である予測誤差画像が生成される。
制御部590は、局所情報に基づいて、変換部510の動作を制御するための制御信号を出力する。局所情報は、例えば、変換係数及び分割統合情報に対応付けられたインデックス、あるいは、予測モードなどを示す情報である。制御部590は、これらの局所情報に基づいて、変換係数及び分割統合情報を決定し、決定した係数及び情報を示す制御情報を変換部510に出力する。
本発明の実施の形態3に係る符号化装置500では、制御部590からの制御に基づいて、第2変換の際に、第1部分信号として、第1変換出力信号のうち第2変換の対象となる範囲と、第2変換係数との少なくとも一方を、時間的又は空間的に適応的に決定する。例えば、所定の符号化パラメータに基づいて、第1部分信号として、第1変換出力信号のうち第2変換の対象となる範囲と、第2変換係数との少なくとも一方を決定する。
なお、メモリ570は、符号化対象信号とそれ以前の対象信号から生成された予測信号との比較を可能にする遅延部として動作する。量子化部120の量子化処理によって情報量が圧縮される(情報の損失が発生する)ので、符号化信号に符号化された情報を取り出すために、逆量子化部540は、量子化係数を逆量子化することで、復号変換出力信号を生成し、逆変換部550は、復号変換出力信号を逆変換することで、復号変換入力信号を生成する。
なお、逆変換部550の逆変換処理は、変換部510の変換処理と逆変換の関係が成り立つ必要がある。ただし、演算に必要なビット長を抑えるための乗算の簡易化や丸め処理の挿入により、変換処理及び逆変換処理は厳密に行列で表現されない場合もあり、また、変換部510の変換処理と逆変換部550の逆変換処理とは、厳密な逆変換の関係を満たさないように設計する場合もある。
なお、音声又はオーディオのデータを符号化する場合には入力信号は一次元であり、静止画像又は動画像のデータを符号化する場合には入力信号は二次元となる。
次に、図18を用いて、本発明の実施の形態3に係る符号化装置500が実行する符号化処理を説明する。図18は、本発明の実施の形態3に係る符号化装置500の動作の一例を示すフローチャートである。
まず、符号化装置500に符号化対象信号(入力信号)が入力されると、予測部580は、メモリ570に格納された符号化済み信号(復号信号)を用いて予測信号を生成する。そして、減算器505は、入力信号と予測信号との誤差である予測誤差信号を生成する(ステップS305)。なお、予測誤差信号ではなく、入力信号を直接変換する場合には、ステップS305の予測誤差信号を生成するステップは省略される。
減算器505によって生成された予測誤差信号又は入力信号は、変換部510に入力される。変換へ入力される点のベクトル、すなわち、予測誤差信号を、変換入力(Transform Input)信号xnとする(式4参照)。なお、多くの圧縮符号化において予測が行われるため、変換入力信号xnは、予測誤差(Prediction Error)であることが多いが、伝送路にエラーが混入する場合を想定して予測を行わない場合、あるいは、十分にエネルギーが小さい場合には予測を行わずに、符号化対象信号(Original Signal)、すなわち、入力信号を直接に変換へ入力する場合もある。
変換部510は、変換入力信号xnを、ある変換Tで変換することで、変換出力(Transform Output)信号ynを生成する(式5参照)(ステップS110)。また、変換出力信号(変換出力ベクトル)ynは、単に係数(Coefficient)と呼ばれることもある。
次に、量子化部120は、変換出力信号ynを量子化することで、量子化係数(Quantized Coefficient)Cnを生成する(ステップS120)。量子化部120が行う量子化処理は、丸めオフセットaを加算後に一様量子化ステップsで除算する処理であり、式6のように表現される。a及びsは、符号化装置500において高能率符号化のために制御される。
次に、エントロピー符号化部130は、量子化係数Cnをエントロピー符号化することで、符号化信号を生成する(ステップS130)。生成された符号化信号は、復号装置へ送られる。
次に、逆量子化部540は、式7のように、量子化係数Cnに逆量子化を行うことで、復号変換出力(Decoded Transform Output)信号y^nを生成する(ステップS340)。
なお、データ量を大幅に削減する代わりに元のデータへ完全に復元することはできないロッシー符号化では、量子化処理によって情報量が失われるため、復号変換出力信号y^nと変換出力信号ynとは一致しない。つまり、復号変換出力信号y^nには、量子化による歪みが混入していることから、変換の前に予測をしている場合には、復号変換出力信号y^nは、量子化予測誤差(Quantized Prediction Error)と呼ばれることもある。なお、ロッシー符号化の場合でも十分なデータ量で符号化する場合には、情報はあまり失われず、y^nとynとはほぼ一致する。
次に、逆変換部550は、式8のように、復号変換出力信号y^nに逆変換T−1を行うことで、復号変換入力ベクトルx^nを生成する(ステップS350)。
次に、加算器560が、上記予測信号と復号変換入力信号とを加算することで、復号信号を生成する。そして、加算器560は、生成した復号信号をメモリ570に格納して、次のタイミングにて参照できるようにする(ステップS360)。
なお、変換T及び逆変換T−1はそれぞれ式9及び式10に示すようなn×nの大きさの変換行列A及びBとの行列積で表現される。
一般的な変換(いわゆる直交変換)では、変換行列Bは、Aの逆行列であり転置行列(B=AT)である。ただし、これに限るものではなく、符号化装置500内の逆変換T−1の演算量を抑えるために、BはAの厳密な逆行列や厳密な転置行列とならない場合もある。また、双直交(Biorthogonal)変換と呼ばれる、厳密には直交をしていない変換A及びその逆変換Bであってもよい。
式9における、変換入力xnに対する変換行列An×nの行列積は、式11で表現される。変換行列の乗算回数及び変換行列の要素数は、n^2である。
次に、本発明の実施の形態3に係る変換部510の構成及び動作について説明する。図19は、本発明の実施の形態3に係る変換部510の詳細な構成の一例を示すブロック図である。
図19に示すように、変換部510は、第1変換部200と、第1メモリ601と、第1変換係数導出部202と、分割部210と、第2メモリ611と、分割統合情報算出部612と、第2変換部220と、第3メモリ621と、第2変換係数導出部222と、統合部230とを有する。なお、図3に示す変換部110と同じ構成については、同じ符号を付している。
変換部510に入力された変換入力信号xnは、第1メモリ601と第1変換部200とに入力される。
第1メモリ601は、複数個の変換入力信号xnに関する情報を記憶するためのメモリである。
第1変換係数導出部202は、第1メモリ601の情報から第1変換T1に用いる第1変換行列A1 nを構成する第1変換係数を生成し、生成した第1変換係数を第1変換部200へ出力する。
第1変換部200は、入力された変換入力信号xnに対して、第1変換係数導出部202によって算出された第1変換係数で構成される第1変換行列A1 nを用いて第1変換T1を行うことで、第1変換出力信号y1 nを生成する。第1変換出力信号y1 nは、第2メモリ611及び分割部210に入力される。
第2メモリ611には、複数個の第1変換出力信号y1 nに関する情報を記憶するためのメモリである。
分割統合情報算出部612は、第2メモリ611の情報から分割統合情報を生成し、生成した分割統合情報を分割部210及び統合部230へ出力する。分割統合情報は、第1変換出力信号y1 nのうち低域の成分を第1部分信号y1L mへ、高域の成分を第2部分信号y1H n−mへ分割するような分割の制御情報である。その他、エネルギーの大きな成分を第1部分信号y1L mへ、エネルギーの小さな成分を第2部分信号y1H n−mへ分割するような分割するような情報であってもよい。
分割部210は、第1変換出力信号y1 nを、分割統合情報に基づいて、m点の第1部分信号y1L mと、n−m点の第2部分信号y1H n−mへ分割する(ここで、mはnより小さな自然数である)。つまり、分割部210は、n個の係数値から構成される第1変換出力信号y1 nを、m個の係数値から構成される第1部分信号y1L mと、n−m個の係数値から構成される第2部分信号y1H n−mとに分割する。第1部分信号y1L mは、第3メモリ621及び第2変換部220に入力される。また、第2部分信号y1H n−mは、統合部230に入力される。
第3メモリ621は、複数個の第1部分信号y1L mに関する情報を記憶するためのメモリである。
第2変換係数導出部222は、第3メモリ621の情報から第2変換T2に用いる第2変換行列A2 mを構成する第2変換係数を生成し、生成した第2変換係数を第2変換部220へ出力する。
第2変換部220は、第2変換係数導出部222によって算出された第2変換係数で構成される第2変換行列A2 mを用いて、第1部分信号y1L mに第2変換T2を行うことで、第2変換出力信号y2 mを生成する。
統合部230は、第2変換出力信号y2 mと第2部分信号y1H n−mとを、分割統合情報に従って統合することで変換出力信号ynを生成する。なお、統合とは、分割の反対の処理である。
第2変換係数導出部222によって決定される第2変換係数は、第1部分信号y1L mに最適に設計された変換係数である。このため、第2変換行列A2 mを用いた第2変換T2は、第1変換出力信号y1 nに残された冗長性を削減できる変換であり、符号化信号の圧縮に寄与する効果をもたらす。
また、分割部210が第1変換出力信号y1 nを分割することにより、第2変換部220への入力信号(つまり、第1部分信号)の点数(係数値の個数)を減らすことができる。点数が減ることにより、第2変換部220の演算量の削減効果、及び、第2変換部220の変換係数の総数(つまり、データ量)の削減効果が得られる。
ここで、第1変換係数導出部202による第1変換係数の生成、及び、第2変換係数導出部222による第2変換係数の生成について述べる。これらの変換係数の生成には、例えば、上述したKLTを用いる。
KLT(カルーネンレーベ変換)は、入力信号を含むある集合の統計的な性質に基づいて、入力信号を完全に無相関化できる周波数領域への変換を設計する手法である。具体的には、入力信号の分散共分散行列(Variance−covariance matrix)の非対角要素が0となるような変換を求めることであり、これは、分散共分散行列の固有値問題を解くことに等しい。導出した固有ベクトルが基底関数となり、固有値が変換係数の各成分の軸の大きさ(つまり、エネルギー)となる。固有値の値(分散、あるいは、エネルギー)の大きな軸から小さな軸へと変換係数を並べる。この順で並べることにより、例えば、変換入力信号がn点のベクトルであるとすると、変換出力信号のn点のベクトルのうち、i番目の要素(1≦i<n)とj番目(i<j≦n)の要素とのエネルギーを比較すると、i番目の要素のエネルギーは、j番目の要素のエネルギーよりも大きくなる(大きくなるように変換係数を設計できる)。
本発明において、低周波数帯域、及び、高周波数帯域という表現を使うとき、それらは、それぞれ、相対的に小さい番号を持つ要素、相対的に大きな番号を持つ要素に対応しており、厳密に区切りがどこにあるかを規定するものではない。本発明は、変換及び逆変換等にかかるリソース(演算量や使用メモリ量)の削減を主な目的としているが、リソースと変換性能とには広い意味でトレードオフの関係があり、本発明が使われる方法や装置の目的に応じて設定されるものである。
しかし、従来技術の課題で言及したように、変換係数を導出した際に参照した集合とは異なる統計的性質を持つ集合が入力されると、導出した変換係数を用いた変換は最適ではなくなる。これに対して、入力信号の性質に応じて、入力信号が入力される度に変換係数を導出すると、変換係数のデータ量が膨大となる。
この課題に対し、本実施の形態では、複数の変換を用いる。すなわち、第1変換において、より大きな集合SAの統計的性質に応じて最適に導出された変換係数で構成される変換行列を用いて変換し、第2変換において、より小さな集合SBの(第1変換出力信号の)統計的性質に応じて、最適に導出された変換係数で構成される変換行列を用いて変換する。
なお、本発明の実施の形態3に係る符号化装置500は、第2変換係数を導出する際に、入力信号の特徴を解析する局所集合判定部を備えていてもよい。つまり、本発明の実施の形態3に係る符号化装置500は、変換部510の代わりに、図20に示す変換部510aを備えていてもよい。変換部510aは、図20に示すように、局所集合判定部623を備える。
局所集合判定部623は、変換入力信号xnの特徴を解析し、解析結果に基づいて第2変換係数導出部222の制御を行う。なお、図20には図示していないが、局所集合判定部623は、図19に示す分割統合情報算出部612の制御を行ってもよい。局所集合判定部623の具体的な処理については、図21を用いて、以下に説明する。
図21は、本発明の実施の形態3に係る変換部510aにおける変換係数の導出の一例を概念的に示す図である。
変換入力信号xnは、大きな集合SAに属し、かつ、より小さな集合SB(1)とSB(2)のいずれかに属する場合を想定する。なお、図21では、集合SBは集合SAに含まれるよう図示しているが、変換入力信号xnが集合SBに属し、集合SAに属さないというような、集合SBが集合SAに含まれない場合でも同様の導出方法が適用可能である。
第1変換部200が用いる第1変換係数は、第1変換係数導出部202によって生成される。第1変換係数導出部202は、より多くのサンプルを含む集合SAに基づいて、第1変換係数を最適化する。
集合SAはより多くのサンプルを含むので、第1変換係数は、平均的に最適化され、個々の変換入力の違いの影響をあまり受けないようにできる。これによって、第1変換係数の更新頻度を抑えることができる。また、第1変換係数の更新を行う場合でも、変換係数の個々の値の変化量は小さくなるため、差分情報量を少なくできる。したがって、第1変換係数を復号装置に送信する場合の符号量を削減することができる。
第2変換係数は、変換入力が集合SB(1)とSB(2)のそれぞれに最適化して導出する。第2変換部220では、第2変換の対象となる第1部分信号の点数が、分割によって変換入力信号の点数よりも減らされているので、演算量と変換係数のデータ量とを削減できる。つまり、第2変換の対象となる第2変換部220への入力信号は、集合SB(1)、SB(2)に含まれる変換入力信号xnそのものではなく、第1変換出力信号y1 nの一部である第1部分信号y1L mである。
局所集合判定部623は、変換入力信号xnの特徴を解析することで、小集合の統計的な変動を検出する。変動を検出すると、小集合に属する複数個のサンプルを決定し、第2変換係数導出部222へ通知する。あるいは、局所集合判定部623は、変換入力信号xnが、予め定めた小集合のいずれに属するかを判定してもよい。
第2変換部220への入力信号(すなわち、第1部分信号y1L m)は、予測信号の生成方法に依存する場合がある。このため、局所集合判定部623は、予測信号の生成方法(予測信号モード)、例えば、H.264の面内予測の方向に応じて、第1変換出力信号y1 nを構成する複数の係数値のうち、第1部分信号y1L mとして第2変換の対象となる範囲を判定してもよい。あるいは、局所集合判定部623は、予めN個の小集合を定め、いずれに属することが最も情報量を軽減できるかを評価した指標を基に、第1部分信号y1L mとして第2変換の対象となる範囲を判定してもよい。
第2変換係数導出部222は、局所集合判定部623によって検出された統計的な変化の指示に基づき、小集合に属する複数個のサンプルの第1変換出力信号y1 nに対して、情報量が最小となるように設計された第2変換係数を導出する。あるいは、第2変換係数導出部222は、予め算出しておいた変換係数をメモリから呼び出す。
このとき、分割統合情報算出部612は、変換係数と同様に分割統合情報の決定を行う。あるいは、分割統合情報算出部612は、予め算出しておいた分割統合情報をメモリから呼び出してもよい。
より小さな集合SB(1)、SB(2)(の第1変換出力信号)のそれぞれに最適に設計された第2変換係数は、統計的性質の変化に追随でき、無相関化とエネルギー圧縮との効果の上乗せ効果を与える。さらに、第2変換は、分割部210によって入力信号の次元数を軽減しているため、変換行列の要素数及び変換の演算量を軽減できるため効率的である。
より小さな集合である集合SBは、局所的な変化が生じた変換入力信号xnが含まれる集合であり、例えば、集合SAを時間軸もしくは空間領域で局所に分割したような集合である。あるいは、集合SBは、集合SAに属する変換入力信号xnとは異なる統計的性質を持つ変換入力信号が短時間だけ入力された場合に、その異なる性質を持つような集合である。このように、集合SAに含まれないような集合SBに属する変換入力信号xnが短時間だけ入力された場合であっても、第1変換係数を大きな集合SAに基づいて決定し、第2変換係数を小さな集合SBに基づいて決定することで、変化に対応しながらも演算量が軽減した効率的な変換が可能である。
具体的には、局所集合判定部623が、所定の符号化パラメータに基づいて、変換係数及び分割統合情報の少なくとも1つを決定する。符号化パラメータは、予め定められた複数の予測方法のうちの1つの予測方法を示す。例えば、局所集合判定部623は、符号化パラメータの一例である面内予測あるいは面間予測の予測モードに応じて、変換係数及び分割統合情報を切り替えてもよい。あるいは、複数の変換係数と分割統合情報とのセットの中から、どれを選択するかを明示的に符号化ストリームに多重化してもよい。
また、面内予測あるいは面間予測モードから変換係数及び分割統合情報を切り替える際、複数の予測モードを1つの変換係数と分割統合情報と対応付けてもよい。分割統合情報は、比較的変化の少ない情報であるので、変換係数よりも切り替えの種類を少なくして、分割統合情報に関連するメモリ使用量を軽減してもよい。
なお、図19では、第1変換係数、分割統合情報、第2変換係数を導出するためのメモリ、及び、導出部を備えた構成を例示していたが、完全な最適解ではなくとも、これらのいずれか1つ又は全ては経験や準最適な方法に基づいて、事前に導出しておいてもよい。図22は、本発明の実施の形態3に係る変換部の別の一例を示すブロック図である。
図22に示す変換部510bは、図19に示す変換部510と比較して、第1メモリ601、第2メモリ611、第3メモリ621、第1変換係数導出部202、第2変換係数導出部222及び分割統合情報算出部612を備えていない点が異なっている。つまり、変換部510bは、予め事前に導出されていた第1変換係数、第2変換係数及び分割統合情報を外部から取得し、取得した係数及び情報に基づいて、変換及び分割を行う。
なお、第2変換において、高域側の信号に対する変換係数の乗算係数を少なくする(つまり、変換係数の有効精度を落とす)、あるいは、ゼロにすることにより、高域信号に対する演算量を削減する構成もありえる。この場合、分割部と統合部とは明示的にブロック図に現れない(図9参照)が、現れない構成であっても本発明の構成に該当するといえる。
図23は、図20に示す変換部510aを備える符号化装置500aの構成を示すブロック図である。図23に示す符号化装置500aは、図17に示す符号化装置500と比較して、変換部510の代わりに変換部510aを備える点と、制御部590を備えない点とが異なっている。
本発明の実施の形態3の変形例に係る変換部510aの変換処理のフローは、実施の形態1と同様である。具体的には、図6に示す通り、まず、第1変換係数導出部202が、第1変換係数を決定する(ステップS111)。次に、第1変換部200は、決定された第1変換係数で構成される第1変換行列を用いて変換入力信号に第1変換を行うことで、第1変換出力信号を生成する(ステップS112)。
次に、分割統合情報算出部612(図示せず)又は局所集合判定部623が、分割統合情報を決定する(ステップS113)。そして、分割部210は、第1変換出力信号を第1部分信号と第2部分信号とへ分割する(ステップS110)。このとき、分割部210は、第1部分信号の相関エネルギーが第2部分信号の相関エネルギーよりも大きくなるように分割する。
次に、局所集合判定部623は、第1部分信号の局所的な集合の統計的性質を解析し、第2変換係数導出部222は、解析結果に基づいて第2変換係数を決定する(ステップS115)。次に、第2変換部220は、第1部分信号に対して決定された第2変換係数で構成される第2変換行列を用いて第2変換を行うことで、第2変換出力信号を生成する(ステップS116)。
最後に、統合部230は、第2部分信号と第2変換出力信号とを統合することで、変換出力信号を生成する(ステップS118)。なお、ステップS111、ステップS113、ステップS115は別の方法によって決定され、本実施の形態の一部として動作しなくてもよい。
以上に示すように、本発明の実施の形態3に係る符号化装置及び符号化方法によれば、変換入力信号に応じて、適応的に変換係数及び分割統合情報を変更するので、変換処理の演算量と変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応することができる。
以下では、本発明の実施の形態3の変形例に係る符号化装置について、図24A及び図24Bを用いて説明する。
本発明の実施の形態3の変形例では、図24Aに示す符号化装置500cのように、予め定めた変換係数(予め導出された変換係数)で構成される所定の変換行列を用いて第2変換を行うこともできる。図24Aは、本発明の実施の形態3の変形例に係る符号化装置500cの構成の一例を示すブロック図である。
図24Aに示すように、符号化装置500cは、図23に示す符号化装置500aと比較して、変換部510aの代わりに変換部510cを備える点と、新たに、メモリ624を備える点とが異なっている。
変換部510cは、変換部510aと比較して、第2変換係数導出部222及び局所集合判定部623の代わりに、第2変換係数導出部222c及び局所集合判定部623cを備える点が異なっている。第2変換係数導出部222cは、局所集合判定部623cから出力される導出制御信号に基づいて、第2変換係数を生成する。生成した第2変換係数は、メモリ624に格納される。
メモリ624は、少なくとも1つの第2変換係数を記憶するための記憶部の一例である。メモリ624は、記憶している少なくとも1つの第2変換係数の中から、局所集合判定部623cから出力される選択信号に基づいて選択された第2変換係数を第2変換部220とエントロピー符号化部130とに出力する。
例えば、メモリ624は、インデックスと第2変換係数とを対応付けて記憶している。選択信号は、インデックスを示す信号であり、メモリ624は、選択信号が示すインデックスに対応付けられた第2変換係数を出力する。
具体的には、メモリ624は、互いに異なる係数値の組を有する複数の変換行列を、第2変換係数の候補として記憶している。複数の変換行列には、符号化パラメータの一例であるインデックス情報が1対1に対応付けられている。そして、第2変換の際に、選択信号が示すインデックス情報によって指定される変換行列が、第2変換係数として決定される。
図25は、本発明の実施の形態3の変形例に係る符号化装置において、メモリに格納された第2変換係数と分割統合情報との対応関係の一例を示す図である。上述したように、メモリ624には、インデックスと第2変換係数とが対応付けて記憶される。また、図25に示すように、メモリ624には、さらに選択範囲情報(ここでは、分割統合情報)とインデックスとが対応付けて記憶されていてもよい。
具体的には、まず、局所集合判定部623cは、入力信号の特性に基づき、あるいは、圧縮された情報量の推定値の大小に基づき、予め定めた変換係数、及び、分割統合情報のいずれを用いるかを選択するための選択信号を出力する。出力された選択信号に基づき、メモリ624は、予め定めた変換係数を第2変換部220へ出力する。また、メモリ624が分割統合情報も保持している場合は、分割統合情報を分割部210及び統合部230へ出力する(図24Aには示していない)。
選択信号は、必要に応じて情報量の圧縮が適用され(例えば、周辺隣接ブロックのインデックスから予測した予測インデックスとの差分信号を出力する)、エントロピー符号化部130において、符号化信号に多重化される。
また、局所集合判定部623cは、新しい第2変換係数を導出するように第2変換係数導出部222cへ指示する導出制御信号を出力することもある。このとき、新しく導出された第2変換係数は、メモリ624に格納される。また、局所集合判定部623cは、分割統合情報算出部(図示せず)に、導出制御信号を出力することで、新たな分割統合情報を算出させてもよい。なお、分割統合情報の算出は、第2変換係数導出部222cが行ってもよい。
新しい第2変換係数と分割統合情報とは、必要に応じて、情報量が圧縮され、エントロピー符号化部130において、符号化信号に多重化される。言い換えると、図24Aに示す実施の形態3の変形例に係る符号化装置500cは、第2変換係数及び分割統合情報を復号装置へ出力する。なお、第2変換係数そのものを出力するのではなく、インデックスを示す選択信号を送信することで、復号装置側で、復号装置が記憶している第2変換係数を選択させることもできる。
なお、前述のように変換入力信号は、入力信号と予測信号との差分であるため、予測信号の特性に依存する。予測信号がよく予測できている場合と、できていない場合とでは、変換入力信号の特性は異なる場合も考えられるため、局所集合判定部623cは、変換入力信号の大小に応じて第2変換係数と分割統合情報とを切り替えてもよい。
また、図24Bに示す符号化装置500dのように、予測方法の種別を示す情報(予測モード信号)に基づいて、第2変換係数の導出を制御することもできる。図24Bは、本発明の実施の形態3の変形例に係る符号化装置500dの構成の一例を示すブロック図である。
図24Bに示すように、符号化装置500dは、図24Aに示す符号化装置500cと比較して、変換部510cの代わりに変換部510dを備える点と、新たに予測制御部585を備える点とが異なっている。また、変換部510dは、変換部510cと比較して、局所集合判定部623cの代わりに、局所集合判定部623dを備える点が異なっている。
予測制御部585は、予測モード信号を決定し、予測部580へ出力するとともに、局所集合判定部623dへ出力する。予測モード信号は、必要に応じて、近傍ブロックの情報からの推定値との差分をとるなどして情報量を圧縮し、エントロピー符号化部130において、符号化信号へ多重化される。
局所集合判定部623dは、予測モード信号に基づいて、予め定めた変換係数と分割統合情報とを選択するための選択信号を出力する。選択信号に基づき、メモリ624は、予め定めた第2変換係数を第2変換部220へ、分割統合情報を分割部210及び統合部230へ出力する。
また、局所集合判定部623dは、新しい第2変換係数を導出するように第2変換係数導出部222cへ指示する導出制御信号を出力することもある。このとき、新しく導出された第2変換係数は、メモリ624に格納される。また、局所集合判定部623dは、分割統合情報算出部(図示せず)に、導出制御信号を出力することで、新たな分割統合情報を算出させてもよい。なお、分割統合情報の算出は、第2変換係数導出部222cが行ってもよい。
新しい第2変換係数と分割統合情報とは、必要に応じて、情報量が圧縮され、エントロピー符号化部130において、符号化信号に多重化される。
なお、局所集合判定部623dは、変換入力信号の大小に応じて、第2変換係数と分割統合情報とを切り替えてもよい。なお、予測の方法は複数種類あり、その1つが予測モード信号で指示される。予測は、フレーム間予測(インター予測)でもフレーム内予測(イントラ予測)でもよい。フレーム内予測は、符号化済み(復号済み)の周辺隣接画素を所定の方向で外挿して予測する方法であってもよい。
また、分割統合情報は、予測信号を生成した予測方法の角度(フレーム内予測の場合は所定の外挿角度)をもとに、その角度向けに最適化された分割統合を行うことができるように、決定されてもよい。分割統合情報について、図26A〜図26Cを用いて概念を説明する。
図26Aは、4x4ブロックの第1変換出力信号を示し、左上が低域の例を示している。一般的には、エネルギーが集中しやすい低域側を第1部分信号、それ以外の高域部分を第2部分信号として、第1部分信号に第2変換を行うことで、さらに圧縮を行う。なお、ここでは説明のために、第1変換出力信号のNxN個の要素がどちらの部分に属するかをGij={0,1}、(iは垂直下方向、jは水平右方向、ij共に1起点、第1部分信号に属するなら0、第2部分信号に属するなら1)と定義する。
図26Bは、複数個の分割統合情報の中からイントラ予測の予測方向に基づいて、分割統合情報を選択する例を示す概念図である。右上方向を角度の基点として、0からπ[rad]の範囲を幾つかに分割した角度単位に分割統合情報を設計する。図26Bは、4つの分割統合情報を定義した例である。
具体的には、設計角度が水平であるS0は、左側(水平方向でDC)にパワーが集中することを想定し、G0jを優先的に0(つまり、第1部分信号)とする。設計角度が垂直であるS1は、上側(垂直方向でDC)にパワーが集中することを想定し、Gj0を優先的に0(つまり、第1部分信号)とする。設計角度が斜めであるS1とS3とは、例えばGij(i<=1、j<=1)を優先的に0とする。
図26Cは、4x4のブロックのうち4要素を第1部分信号として選ぶ場合において、8種類の角度、すなわち、8種類の分割統合情報を準備する場合の例である。この例に示すように、角度と第1部分信号を構成する係数値との位置には関係性を定義することができ、任意の角度で、第1部分信号を構成する係数値の位置を決定することができる。
このように、第2変換の際に、符号化パラメータが所定の方向への外挿を示す予測方法を示す場合、第1変換出力信号を構成する複数の係数値のうち、当該所定の方向の係数値を含む範囲を、第2変換の対象として決定する。所定の方向の係数値を含む範囲とは、具体的には、所定の方向の始点側の係数値、すなわち、外挿方向の始点側の係数値を含む範囲である。
例えば、符号化パラメータが略水平方向(右方向)への外挿を示す予測方法を示す場合、第1変換出力信号を構成する複数の係数値のうち、横方向の係数値(具体的には、左側の係数値)を含む範囲を、第2変換の対象として決定する。また、符号化パラメータが略垂直方向(下方向)への外挿を示す予測方法を示す場合、第1変換出力信号を構成する複数の係数値のうち、縦方向の係数値(具体的には、上側の係数値)を含む範囲を、第2変換の対象として決定する。
言い換えると、第2変換の対象としてm個の係数値(要素)を決定する場合、第1変換出力信号を構成するn個の係数値の中から、外挿方向の始点側により近いm個の係数値を決定する。より具体的には、左上の係数値と、外挿方向の始点側に近い係数値とを含む。
例えば、図26BのS0のように右方向への外挿方向が選択された場合、当該外挿方向の始点は左側であるので、左側に近いm個の係数値が、第1部分信号として選択される。同様に、図26BのS1のように右下方向への外挿方向が選択された場合、当該外挿方向の始点は左上側であるので、左上側に近いm個の係数値が、第1部分信号として選択される。さらに、図26BのS2のように下方向への外挿方向が選択された場合、当該外挿方向の始点は上側であるので、上側に近いm個の係数値が、第1部分信号として選択される。
なお、図26BのS3、又は、図26CのS0、S1、S7のように、外挿方向の始点側が左下や右上などの場合は、第2変換の対象としてm個の係数値(要素)を決定する場合、左上の係数値と、外挿方向の始点側に近い係数値と、外挿方向に沿った係数値とを含むように、m個の係数値を決定する。例えば、図26CのS7は、S6より左に22.5度ずれているので、S7の第2部分信号は、S6のように、左上の係数値((1,1))と、上側の係数値((1,2)及び(1,3))とを含むとともに、外挿方向(左下方向)に沿った係数値((2,1))とを含んでいる。
(実施の形態4)
本発明の実施の形態4に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(例えば、実施の形態1又は3において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態4に係る復号装置及び復号方法は、符号化対象信号(入力信号)と予測信号との差分である予測誤差信号が符号化された信号に対して、2段階の逆変換を行うことを特徴とする。
本発明の実施の形態4に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(例えば、実施の形態1又は3において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態4に係る復号装置及び復号方法は、符号化対象信号(入力信号)と予測信号との差分である予測誤差信号が符号化された信号に対して、2段階の逆変換を行うことを特徴とする。
図27は、本発明の実施の形態4に係る復号装置700の構成の一例を示すブロック図である。図27に示すように、本発明の実施の形態4に係る復号装置700は、エントロピー復号部310と、逆量子化部320と、逆変換部730と、制御部740と、加算器750と、メモリ760と、予測部770とを備える。なお、図11Aに示す実施の形態2に係る復号装置300と同じ構成については、同じ符号を付し、以下では説明を省略する。
逆変換部730は、実施の形態2で説明した逆変換部330と同様に、逆量子化部320によって生成された復号変換出力信号を逆変換することで、復号変換入力信号を生成する。具体的には、逆変換部730は、復号変換出力信号に対して2段階の逆変換を行う。なお、制御部740からの制御信号に基づいて、逆変換に用いる逆変換係数及び分割の位置(第2逆変換の対象となる部分)が決定される。逆変換部730の詳細については、後で説明する。
制御部740は、局所情報に基づいて、逆変換部730の動作を制御するための制御信号を出力する。局所情報は、符号化パラメータの一例であり、例えば、逆変換係数及び分割統合情報に対応付けられたインデックス、あるいは、符号化の際に用いた予測モードなどを示す情報である。制御部740は、これらの局所情報に基づいて、逆変換係数及び分割統合情報を決定し、決定した係数及び情報を示す制御情報を逆変換部730に出力する。
加算器750は、逆変換部730によって生成された復号変換入力信号と、以前の符号化信号から生成された復号信号に基づいた予測により生成された予測信号とを加算することで、復号信号を生成する。
メモリ760は、生成された復号信号を格納するための記憶部の一例である。
予測部770は、以前の符号化信号から生成された復号信号に基づく予測を行うことで、予測信号を生成する。すなわち、予測部770は、メモリ760に格納された復号済みの復号信号をもとに予測信号を生成する。例えば、予測部770は、符号化パラメータに基づいて、予測誤差画像に含まれる復号対象ブロックの予測画素(予測信号)を生成する。そして、予測部770によって生成された予測画素と、復号対象ブロックの画素とが、加算器750によって加算され、入力画像(復号信号)が復元される。
なお、逆変換部730は、第2逆変換係数及び分割統合情報を符号化装置から取得してもよい。なお、符号化装置から取得するのは第2変換係数であって、第2変換係数から第2逆変換係数を求めても良い。分割統合情報は、第2復号変換出力信号が、復号変換出力信号のどの部分に対応するかを示す選択範囲情報の一例である。
本発明の実施の形態4に係る復号装置700では、制御部740からの制御に基づいて、第2逆変換の際に、第2復号変換出力信号として、復号変換出力信号のうち第2逆変換の対象となる範囲と、第2逆変換係数との少なくとも一方を、時間的又は空間的に適応的に決定する。例えば、所定の符号化パラメータに基づいて、第2復号変換出力信号として、復号変換出力信号のうち第2逆変換の対象となる範囲と、第2逆変換係数との少なくとも一方を決定する。
次に、図28を用いて、本発明の実施の形態4に係る復号装置700が行う復号処理を説明する。図28は、本発明の実施の形態4に係る復号装置700の動作の一例を示すフローチャートである。
まず、予測部770は、メモリ760に格納された復号済みの復号信号をもとに予測信号を生成する(ステップS405)。なお、入力信号を直接変換する符号化方法にて生成された符号化信号を復号する場合には、本ステップS405は省略される。
次に、エントロピー復号部310は、入力された符号化信号をエントロピー復号することで、量子化係数を生成する(ステップS210)。逆量子化部320は、量子化係数を逆量子化することで、復号変換出力信号y^nを生成する(ステップS220)。
次に、逆変換部730は、復号変換出力信号y^nを逆変換することで、復号変換入力信号x^nを生成する(ステップS230)。具体的には、逆変換部730は、図12又は図14に示すように、2段階の逆変換を行うことで、復号変換入力信号x^nを生成する。なお、ここで、逆変換部730における逆変換とは、復号装置における変換という意味であり、符号化装置の変換の逆変換に限定されるものではない。
次に、加算器750は、復号変換入力信号x^nと予測信号とを加算することで、復号信号を生成する。復号信号は、復号装置700全体の出力信号として出力される。また、復号信号は、メモリ760に格納され(ステップS440)、後続の符号化信号の復号の際に参照される。つまり、メモリ760は、遅延部として動作する。
なお、音声又はオーディオのデータを復号する場合では、出力信号は一次元であり、静止画像及び動画像復号装置では出力信号は二次元となる。また、予測を行わずに復号信号を直接出力信号とするような復号装置(あるいは動作モード)は、予測部770及びメモリ760を除いて例示できる。
次に、図29を用いて、本発明の実施の形態4に係る逆変換部730の構成に突いて説明する。図29は、本発明の実施の形態4に係る逆変換部730の構成の一例を示すブロック図である。
逆変換部730は、分割部400と、第2逆変換部410と、統合部420と、第1逆変換部430とを備える。逆変換部730には、復号変換出力信号y^nが入力される。なお、復号変換出力信号y^nは、図17に示す変換部510が生成した変換出力信号ynに相当する。
分割部400は、分割統合情報に従って、復号変換出力信号y^nを第2復号変換出力信号と、第2復号部分信号とに分割する。
第2逆変換部410は、第2逆変換行列を用いて、第2復号変換出力信号を逆変換することで、第1復号部分信号を生成する。
統合部420は、第2復号部分信号と第1復号部分信号とを、分割統合情報に従って統合することで、第1復号変換出力信号を生成する。
第1逆変換部430は、第1逆変換行列を用いて、第1復号変換出力信号を逆変換することで、復号変換入力信号を生成する。なお、復号変換入力信号は、図17に示す変換部510に入力される変換入力信号に相当する。
分割統合情報は、上述した実施の形態に記載したものと同等であり、分割部400への入力(復号変換出力信号)の次元数はn、第2逆変換部410への入力(第2復号変換出力信号)の次元数はmである(m<nの自然数)。なお、第2逆変換部410への入力時の次元数はnとしておき、第2逆変換部410は、図8(b)で示すような対角要素は1で非対角要素は0という行を含む変換行列A4を用いてもよい。第2変換部は分離型であってもよい。
第2逆変換に用いる第2逆変換行列は、実施の形態1又は3に記載した第2変換の変換行列の逆行列又は逆行列の近似の関係にある。第1逆変換に用いる第1逆変換行列は、実施の形態1又は3に記載した第1変換行列の逆行列又は逆行列の近似の関係にある。逆変換の演算に必要な演算精度を低く抑えるために、第1逆変換係数と、第2逆変換係数との有効精度を低くすることもある。この場合、逆変換部の演算精度が符号化及び復号全体に与える歪みにおいて支配的になるので、実施の形態2又は本実施の形態に記載する第1逆変換係数をもとに、実施の形態1又は3に記載した第1変換係数を導出し、同様に第2逆変換係数をもとに第2変換係数を導出することが好ましい。
なお、第2逆変換係数、第1逆変換係数、及び、分割統合情報は、符号化信号に多重化されて、符号化装置から復号装置に通知される。なお、別の伝送チャネルを用いて、符号化信号に多重化されずに通知される、又は、伝送・蓄積フォーマットによって通知されてもよい。あるいは、ある規格や規格のプロファイル・レベルの規定値として通知される、又は、復号装置と符号化装置との両者で得られる情報に基づいて通知される、などでもよい。
本発明の実施の形態4の逆変換処理の動作は、実施の形態2と同様である。具体的には、図14に示す通り、まず、分割部400は、分割統合情報を取得する(ステップS231)。そして、分割部400は、取得した分割統合情報に従い、復号変換出力信号を第2復号変換出力信号と第2復号部分信号とに分割する(ステップS232)。
次に、第2逆変換部410は、第2逆変換係数を取得する(ステップS233)。そして、第2逆変換部410は、第2復号変換出力信号に対して第2逆変換を行うことで、第1復号部分信号を生成する(ステップS234)。
次に、統合部420は、分割統合情報に従い、第1復号部分信号と第2復号部分信号とを統合することで、第1復号変換出力信号を生成する(ステップS236)。
次に、第1逆変換部430は、第1逆変換係数を取得する(ステップS237)。そして、第1逆変換部430は、第1復号変換出力信号に対して第1逆変換を行うことで、復号変換入力信号を生成する(ステップS238)。
なお、分割統合情報を取得するステップS231、逆変換係数を取得するステップS232及びステップS234は、前述したように通知のバリエーションが多数あるため、本フローのタイミングで実施されるとは限らず、また、本実施の形態の一部として必須の動作ではない。
以上のように、本発明の実施の形態4に係る復号装置及び復号方法により、変換処理の演算量と逆変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。また、実施の形態3に示す符号化装置500のように、入力信号の統計的性質に基づいて計算される変換係数を用いる変換を含む2段階の変換を行うことで生成された符号化信号を正しく復号することができる。
なお、図30に示す復号装置700aのように、予め定めた逆変換係数及び分割統合情報を、符号化信号から復号した選択信号に基づき選択し、選択した逆変換係数及び分割統合情報を用いて逆変換することもできる。図30は、本発明の実施の形態4に係る復号装置700aの構成の一例を示すブロック図である。
図30に示すように、復号装置700aは、図27に示す復号装置700と比較して、新たに、メモリ781及び782を備える点が異なっている。
メモリ781には、第2逆変換係数がインデックスと対応付けて記憶されている。また、メモリ782には、分割及び統合に用いる分割統合情報がインデックスと対応付けて記憶されている。
具体的には、メモリ781は、互いに異なる係数値の組を有する複数の変換行列を、第2逆変換行列の候補として記憶している。複数の変換行列には、符号化パラメータの一例であるインデックス情報が1対1に対応付けられている。そして、第2逆変換の際に、選択信号が示すインデックス情報によって指定される変換行列の係数が、第2逆変換係数として決定される。
メモリ781及び782はそれぞれ、エントロピー復号部310から出力される選択信号に基づいて、逆変換部730に逆変換係数及び分割統合情報を選択して出力する。具体的には、選択信号は、例えば、インデックスを示す信号であり、選択信号が示すインデックスに対応付けられた逆変換係数及び分割統合情報が出力される。
具体的には、エントロピー復号部310は、符号化信号をエントロピー復号することで、圧縮済み選択信号を取り出し、圧縮済み選択信号から選択信号を復号する。そして、エントロピー復号部310は、復号した選択信号を、メモリ781とメモリ782とへ出力する。メモリ781及び782のそれぞれから、第2逆変換係数と、分割統合情報とが、逆変換部730へ出力される。
この選択的な仕組みは、時間空間的に適応され、選択信号に基づいて、ブロック単位、マクロブロック単位、マクロブロックを複数個まとめた単位、又は、スライス単位で行われてもよい。また、面内予測モードと選択信号とを組み合わせて、適応的に行ってもよい。なお、復号量子化係数の非ゼロ係数の総数、低域領域の非ゼロ係数の総数、非ゼロ係数のレベルの総和、逆量子化部320の出力する復号変換出力信号y^の総和、低域領域の総和などに応じて、第2逆変換係数、及び、分割統合情報を切り替えてもよい。
また、図31に示す復号装置700bのように、予め定めた逆変換係数及び分割統合情報を、符号化信号から復号した予測信号に基づき選択し、選択した逆変換係数及び分割統合情報を用いて逆変換することもできる。図31は、本発明の実施の形態4に係る復号装置700bの構成の一例を示すブロック図である。
図31に示すように、復号装置700bは、図30に示す復号装置700aと比較して、新たに選択信号決定部790を備える点が異なっている。
選択信号決定部790は、エントロピー復号部310から出力される予測モード信号を取得し、取得した予測モード信号に基づいて、選択信号を生成する。選択信号は、例えば、インデックスを示す信号であり、メモリ781及び782からは、選択信号が示すインデックスに対応付けられた逆変換係数及び分割統合情報が逆変換部730に出力される。
具体的には、エントロピー復号部310は、符号化信号をエントロピー復号することで、圧縮済み予測モード信号を取り出し、近傍ブロックの情報からの推定値と組み合わせて予測モード信号を復号する。予測モード信号は、予測部770へ出力され、予測部770は予測信号を生成する。
また、予測モード信号は、選択信号決定部790へ送られ、選択信号決定部790は、予測モード信号に対応する、逆変換係数、及び、分割統合情報を選択するための選択信号を出力する。選択信号は、メモリ781と、メモリ782とへ出力され、それぞれのメモリから、第2逆変換係数と分割統合情報とが、逆変換部730へ出力される。
この選択的な仕組みは、時間空間的に適応され、選択信号に基づいて、ブロック単位、マクロブロック単位、マクロブロックを複数個まとめた単位、又は、スライス単位で行われてもよい。また、図31で述べる予測モード信号に対応する選択信号と、図30で説明した符号化信号から復号した選択信号とを組み合わせてもよい。
なお、復号量子化係数の非ゼロ係数の個数、低域領域の非ゼロ係数の個数、非ゼロ係数のレベルの総和、逆量子化部320の出力する復号変換出力y^の総和、低域領域の総和などに応じて、第2逆変換係数、及び、分割統合情報を切り替えてもよい。なお、復号量子化係数の総和のパリティ(偶数又は奇数の状態)に基づいて、第2逆変換係数、及び、分割統合情報を切り替えてもよい。なお、復号量子化係数の総和が1であるとき、第2逆変換は行わないとしてもよい。
なお、本発明の実施の形態4では、実施の形態3で示したように、第2逆変換の際に、符号化パラメータが所定の方向への外挿を示す予測方法を示す場合、復号変換出力信号を構成する複数の係数値のうち、当該所定の方向の係数値を含む範囲を、第2逆変換の対象として決定する。所定の方向の係数値を含む範囲とは、具体的には、所定の方向の始点側の係数値を含む範囲である。
例えば、符号化パラメータが略水平方向への外挿を示す予測方法を示す場合、復号変換出力信号を構成する複数の係数値のうち、横方向の係数値(具体的には、左側の係数値)を含む範囲を、第2逆変換の対象として決定する。また、符号化パラメータが略垂直方向への外挿を示す予測方法を示す場合、復号変換出力信号を構成する複数の係数値のうち、縦方向の係数値(具体的には、上側の係数値)を含む範囲を、第2逆変換の対象として決定する。
(実施の形態5)
本発明の実施の形態5に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態5に係る符号化装置及び符号化方法では、予め定められた固定の変換係数で構成される固定の変換行列を用いて第1変換を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態5に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態5に係る符号化装置及び符号化方法では、予め定められた固定の変換係数で構成される固定の変換行列を用いて第1変換を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態5における変換部及び変換方法を、図32を用いて説明する。図32は、本発明の実施の形態5に係る変換部810の構成の一例を示すブロック図である。なお、本発明の実施の形態5に係る符号化装置は、実施の形態1又は3と比較して、変換部の構成のみが異なっているので、以下では、変換部の構成及び動作について説明する。
図32に示すように、変換部810は、第1変換部200と、分割部210と、第2変換部220と、統合部230と、第2メモリ611と、分割統合情報算出部612と、第3メモリ621と、第2変換係数導出部222とを備える。変換部810は、図19に示す変換部510と比較して、第1変換部200の代わりに第1変換部900を備える点と、第1メモリ601と、第1変換係数導出部202とを備えない点が異なっている。
変換入力信号は、第1変換部900へ入力される。第1変換部900は、予め定められた変換係数及び/又は基底関数で構成される変換行列を用いて変換入力信号に第1変換を行うことで、第1変換出力信号を生成する。第1変換部900は、変換係数を任意に取りうる自由度を放棄して、規定の変換を行うように限定する。これにより、処理の複雑度を軽減し、演算量を削減することができる。なお、ここでは、このような変換を固定変換と呼ぶこととする。
なお、図32では、分割統合情報、第2変換係数を導出するためのメモリ及び導出部を備えた構成を示したが、実施の形態3で説明した場合と同様に完全な最適解ではなくとも、これらのいずれか1つ又は全てを、経験や準最適な方法に基づいて、事前に導出しておいてもよい。
本発明の実施の形態5に係る変換部810では、複数の変換を用いて、第1変換として、固定変換を用いて変換し、第2変換として、より小さな集合SBの(第1変換出力信号の)統計的性質に応じて最適に導出された変換係数で構成される変換行列を用いた変換を行う。以下では、図33を用いて、本発明の実施の形態5に係る変換方法の概念を説明する。なお、図7及び図21とほぼ同じであり、相違する点のみ説明する。
第1変換係数は、集合SAを非常に大きくとったときに、集合SAの統計的な性質に基づいて最適となるように予め設計する。集合SAを非常に大きくとって設計することで、第1変換部900の変換係数を更新する必要を無くすことができ、固定変換にできる。したがって、入力信号に対して異なる変換係数をとる自由度がないので、変換部810は、実施の形態3に記載の第1メモリ601及び第1変換係数導出部202を備える必要がなくなる。
さらには、既存規格の変換を第1変換として用いてもよい。例えば、MPEG−1/2/4ビデオ符号化規格搭載の離散コサイン変換や、H.264/AVC規格採用の整数精度DCTなどを用いてもよい。これらの変換はバタフライ構成をとることができ、n次元の入力に対する乗算回数をn×Log2(n)まで軽減できる(実施の形態3の第1変換の場合はn×n)。
なお、既存規格の変換は、変換入力信号を含む非常に大きな集合SAに対して厳密には最適化されていない可能性がある。符号化装置への入力信号が撮像素子などの特性の影響を受けて特殊な相関を持つ場合、あるいは、変換入力信号が予測誤差である場合などは、予測信号が特殊な相関を持っているために、変換入力信号が特殊な相関を持っていることが原因として考えられる。
このような相関は、各実施の形態の第2変換係数の設計時に反映させることで、第2変換において無相関化とエネルギー圧縮とを行うことで補償できる。具体的には、第1変換出力信号の集合SCのうち、集合SB(1)を第1変換部900で変換した集合を集合SC(1)とし、集合SB(2)を第1変換部900で変換した集合を集合SC(2)とする。この場合に、集合SC(1)、及び、集合SC(2)に対してそれぞれ独立に、第2変換係数導出部222において、第2変換係数を導出する。
ただし、第2変換部220は、分割部210によって信号の一部のみが入力される構成のため、実施の形態3と比べると、無相関化とエネルギー圧縮との性能は、若干低下する。しかしながら、本発明の実施の形態5に係る符号化装置によれば、第1変換係数を算出する必要がなくなるため、演算量の低下を実現することができる。また、第1変換係数を導出するためのメモリ及び導出部を備える必要がなくなるので、回路の小型化を実現することができる。
なお、本発明の実施の形態5の変換処理のフローは、実施の形態1又は3のフローとほぼ同様である。第1変換が固定変換であるため、図6のステップS111が省略され、ステップS112〜ステップS118の処理が実行される。このとき、第1変換は既存の変換であり、第1変換入力信号に対して最適な設計がされていないので、第2変換の変換係数の最適化(ステップS115)にて反映させる。なお、ステップS113、ステップS115は別の方法によって決定され、本実施の形態の一部として動作しなくてもよい。
以上のように、本発明の実施の形態5に係る符号化装置及び符号化方法により、変換処理の演算量と変換係数のデータ量を抑えつつ、入力信号の統計的性質の変化に適応できる。さらに、固定変換を用いることで、演算量を削減できる。
なお、固定変換として、H.264/AVC規格採用の整数精度DCTなどの、乗算を用いずにシフトと加算演算で構成される変数は、変換行列の基底の大きさ(ノルム)が揃わない場合がある。したがって、第1変換として固定変換を用いた場合には、ノルムの補正を行うことが好ましい。
図34は、本発明の実施の形態5の変形例に係る変換部810aの構成の一例を示すブロック図である。変換部810aは、変換部810と比較して、さらに、ノルム補正部940を備える。
ノルム補正部940は、第1変換部900によって生成された第1変換出力信号にノルム補正を行う。そして、ノルム補正後の信号が、分割部210に出力される。ノルム補正部940は、第1変換行列に基づいて決定される補正パラメータを用いて、第1変換出力信号を正規化することで、第1変換出力信号を補正する。補正パラメータは、例えば、第1変換行列のノルムである。
ノルム補正部940は、第1変換に用いた第1変換行列A1 nから算出したノルムを用いて、入力される第1変換出力信号y1 nを補正する。ノルムは、以下の式12によって算出される。
ここで、a(i,k)は、第1変換行列A1 nに含まれる要素である。
なお、第1変換行列A1 nが適応的に変化する場合、ノルムも変化するので、ノルム補正部940は、ノルムを算出し、算出したノルムを用いて第1変換出力信号y1 nを補正する。第1変換行列A1 nが固定の行列である場合、ノルム補正部940は、内部メモリなどにノルムを保持しておけばよい。
ノルム補正部940は、式13に従って、第1変換出力信号y1 nを補正する。つまり、ノルム補正部940は、第1変換出力信号y1 nにノルムの逆数を乗じることで、補正後の第1変換出力信号y’1 nを生成する。言い換えると、ノルム補正部940は、第1変換出力信号y1 nをノルムで除算することで、補正後の第1変換出力信号y’1 nを生成する。
なお、ノルムを用いた乗算及び除算は、第1変換出力信号y1 nに含まれる要素毎に行われる。すなわち、ノルム補正部940は、第1変換出力信号y1 nの要素y1(i)にノルムN(i)の逆数を乗じることで、補正後の第1変換出力信号y’1 nの要素y’1(i)を生成する。
なお、上記のノルム補正は、分割部210による分割後の第1部分信号と第2部分信号とに別々に行ってもよい。
図35は、本発明の実施の形態5の変形例に係る変換部810bの構成の一例を示すブロック図である。変換部810bは、変換部810と比較して、さらに、ノルム補正部941及び942を備える。
ノルム補正部941は、第1部分信号y1L mにノルム補正を行う。そして、ノルム補正後の第1部分信号y’1L mが第2変換部220に出力される。具体的には、ノルム補正部941は、第1変換に用いた第1変換行列A1 nから算出したノルムNを用いて、入力される第1部分信号y1L mを補正する(式13参照、y’1(i)はy’1L(i)に、y1(i)はy1L(i)に読み替える)。また、ノルムNは、上記の式12によって算出される。
ノルム補正部942は、第2部分信号y1H n−mにノルム補正を行う。そして、ノルム補正後の第2部分信号y’1H n−mが統合部230に出力される。具体的には、ノルム補正部942は、第1変換に用いた第1変換行列A1 nから算出したノルムNを用いて、入力される第2部分信号y1H n−mを補正する(式13参照、y’1(i)はy’1H(i)に、y1(i)はy1H(i)に読み替える)。また、ノルムNは、上記の式12によって算出される。
なお、第1部分信号y1L mにノルム補正を行うのではなく、第2変換行列A2 mにノルム補正を行っても同様の効果が得られる。以下では、第2変換行列A2 mにノルム補正を行う場合について説明する。
ノルム補正部941は、第1変換行列A1 nから算出したノルムを用いて、第2変換行列A2 mを構成する第2変換係数を補正することで、修正係数を導出する。なお、ノルムは、式12によって算出される。
具体的には、ノルム補正部941は、式14に従って、第2変換行列A2 mを構成する第2変換係数を補正する。つまり、ノルム補正部941は、第2変換行列A2 mにノルムの逆数を乗じることで、補正後の第2変換行列A’2 mを生成する。言い換えると、ノルム補正部941は、第2変換係数をノルムで除算することで、修正係数である補正後の第2変換係数を生成する。
なお、ノルムを用いた乗算及び除算は、第2変換行列A2 mの第2変換係数である要素毎に行われる。すなわち、ノルム補正部941は、第2変換係数a2(i,j)にノルムN(i)の逆数を乗じることで、補正後の第2変換係数a’2(i,j)を生成する。
そして、第2変換部220は、補正後の第2変換行列A’2 mを用いて第1部分信号y1L mを変換することで、第2変換出力信号y2 mを生成する。
以上のように、第1変換後の信号に対してノルム補正を行うことで、変換行列の基底を揃えることができ、変換の精度を高めることができる。
また、ノルム補正を行うとともに、H.264では量子化部で行っていた量子化マトリクス(Qmatrix)のウェイトスケールの重み付けを、上記のノルム補正部940(又はノルム補正部941及び942)が行ってもよい。なお、量子化マトリクスのウェイトスケールは、補正パラメータの一例である。
ノルム補正部940は、量子化部120で用いられる量子化マトリクスを用いて第1部分信号を重み付けることで、第1変換出力信号y1 nを補正する。具体的には、ノルム補正部940は、式15及び式16に従って、第1変換出力信号y1 nを補正する。つまり、ノルム補正部940は、第1変換出力信号y1 nに量子化マトリクスの逆数mfを乗じることで、補正後の第1変換出力信号y’1 nを生成する。言い換えると、ノルム補正部940は、第1変換出力信号y1 nを量子化マトリクスで除算することで、補正後の第1変換出力信号y’1 nを生成する。
なお、f(i)は、量子化マトリクスから導出されるウェイトスケール(weightScale)の各要素の値である。
なお、第2変換後に、さらに、ポストスケール補正を行うことが好ましい。
量子化マトリクスから算出される補正係数mf_2を統合部230から出力される信号y’nに乗じることで、変換出力信号ynを生成する。具体的には、式17及び式18に従って、統合後の信号y’nを補正することで、変換出力信号ynを生成する。
なお、S(i)は、式19で示される行列の要素である。
図35に示す変換部810bにおいても、上記と同様にして、量子化マトリクスのウェイトスケールの重み付けを行うことができる。なお、上記のポストスケール補正は、第2変換部220によって生成された第2変換出力信号に行えばよい。
また、図35の例において、量子化マトリクスのウェイトスケールの重み付けにおいても、第1部分信号y1L mではなく、第2変換行列A2 mを補正してもよい。
このとき、ノルム補正部941は、量子化マトリクスを用いて第2変換行列A2 mを補正する。具体的には、ノルム補正部941は、式20に従って、第2変換行列A2 mを補正する。式20に示すように、ノルム補正部941は、第2変換係数a2(i,j)毎に、量子化マトリクスの要素の逆数mf(i)と、量子化マトリクスから算出される補正係数mf_2(j)とを乗じる。
以上のように、第1部分信号y1L mではなく、第2変換行列A2 mを補正することによっても、同様に、符号化効率を高める効果を得ることができる。
なお、ノルム補正と量子化マトリクスの重み付けとを組み合わせてもよい。すなわち、ノルム補正部941は、第1部分信号y1L m又は第2変換行列A2 mに、ノルム補正と量子化マトリクスの補正との両方を行ってもよい。
例えば、第1部分信号y1L mを補正する場合、ノルム補正部941は、式21に従って、第1部分信号y1L mを補正する。具体的には、ノルム補正部941は、第1部分信号y1L mの要素y1L(i)毎に、第1変換行列A1 nから算出されたノルムN(i)の逆数と、量子化マトリクスの要素の逆数mf(i)とを乗じることで、補正後の第1部分信号y’1L mを生成する。
また、第2変換行列A2 mを補正する場合、ノルム補正部941は、式22に従って、第2変換行列A2 mを補正する。具体的には、ノルム補正部941は、第2変換係数a2(i,j)毎に、第1変換行列A1 nから算出されたノルムN(i)の逆数と、量子化マトリクスの要素の逆数mf(i)と、量子化マトリクスから算出される補正係数mf_2(j)とを乗じることで、補正後の第2変換行列A’2 mを生成する。
以上のような構成であっても、より適した第2変換を第1部分信号に適用することができる。
なお、第2変換における有効データ長が所定の値以下に収まるように、第2変換部220へ入力する第1部分信号を構成する係数値をシフトダウンすることで、第1変換出力信号を補正してもよい。これにより、第2変換部220の内部処理の必要精度を下げ、回路資源を節約することができる。
また、第1変換前の第1部分信号又は第2変換後の第1部分信号(第2変換出力信号)を構成する係数値のビット長が、第2部分信号を構成する係数値のビット長と同じになるように、第1部分信号又は第2変換出力信号を構成する係数値をシフトダウンしてもよい。
(実施の形態6)
本発明の実施の形態6に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(例えば、実施の形態5において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態6に係る復号装置及び復号方法では、予め定められた固定の逆変換係数で構成される逆変換行列を用いて第1逆変換を行うことを特徴とする。上述した実施の形態と同様の構成については同じ符号を付し、説明を省略する場合がある。
本発明の実施の形態6に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(例えば、実施の形態5において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態6に係る復号装置及び復号方法では、予め定められた固定の逆変換係数で構成される逆変換行列を用いて第1逆変換を行うことを特徴とする。上述した実施の形態と同様の構成については同じ符号を付し、説明を省略する場合がある。
本発明の実施の形態6に係る逆変換部及び逆変換方法を、図36を用いて説明する。図36は、本発明の実施の形態6に係る逆変換部1030の構成の一例を示すブロック図である。なお、本発明の実施の形態6に係る復号装置は、実施の形態2又は4と比較して、逆変換部の構成のみが異なっているので、以下では、逆変換部の構成及び動作について説明する。
図36に示すように、逆変換部1030は、分割部400と、第2逆変換部410と、統合部420と、第1逆変換部1130とを備える。逆変換部1030は、図29に示す逆変換部730と比較して、第1逆変換部430の代わりに第1逆変換部1130を備える点が異なっている。
第1逆変換部1130は、第1復号変換出力信号に対して、予め定められた固定の逆変換処理を行うことで、復号変換入力信号を生成する。第1逆変換部1130は、予め定められた固定の逆変換を行うので、外部(例えば、符号化装置)から第1(逆)変換係数を取得する必要はない。
さらに、第1逆変換部1130は、例えば、MPEG−1/2/4ビデオ符号化規格搭載の離散コサイン変換や、H.264/AVC規格採用の整数精度DCTを第1逆変換として用いて、演算量を軽減してもよい。
本発明の実施の形態6の逆変換処理のフローは、実施の形態2又は4のフローとほぼ同様である。第1逆変換が固定の逆変換であるため、図14のステップS237が省略され、ステップS231〜S236、S238の処理が実行される。なお、分割統合情報を取得するステップS231、第2逆変換係数を取得するステップS233は、前述したように通知のバリエーションが多数あるため、本フローのタイミングで実施されるとは限らず、また、本実施の形態の一部として必須の動作ではない。
以上のように、本発明の実施の形態6に係る復号装置及び復号方法により、変換処理の演算量と逆変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。さらに、固定変換を用いることで、演算量を削減できる。
なお、固定の逆変換として、H.264/AVC規格採用の整数精度DCTなど、乗算を用いずシフトと加算演算で構成させる変換は、逆変換行列の基底の大きさ(ノルム)が揃わない場合がある。したがって、第1逆変換としてノルムの不揃いな逆変換を用いた場合には、ノルムの補正を行うことが好ましい。
H.264では、逆量子化部においてノルム補正処理を行っているが、本発明の実施の形態6に係る復号装置では、例えば、図37に示すように、第1逆変換部1130への入力信号に対して行う。つまり、第2逆変換を行った後に、第1復号変換出力信号を補正する。
図37は、本発明の実施の形態6の変形例に係る逆変換部1030aの構成の一例を示すブロック図である。逆変換部1030aは、逆変換部1030と比較して、さらに、ノルム補正部1140を備える。
ノルム補正部1140は、統合部420によって統合された第1復号部分信号と第2復号部分信号とを含む信号に、ノルム補正を行うことで、第1復号変換出力信号を生成する。ノルム補正部1140は、第1逆変換行列に基づいて決定される補正パラメータを用いて、第1復号部分信号を正規化することで、第1復号変換出力信号を補正する。補正パラメータは、例えば、第1逆変換行列のノルムである。
ノルム補正部1140は、第1逆変換行列A−1 1 nから算出したノルムを用いて、統合後の信号y^’1 nを補正する。ノルムは、実施の形態5と同様に、式12に従って算出される。
なお、符号化信号に第1逆変換係数行列A−1 1 nが含まれている場合など、第1逆変換行列A−1 1 nが適応的に変化する場合、ノルムも変化するので、ノルム補正部1140は、ノルムを算出し、算出したノルムを用いて統合後の信号y^’1 nを補正する。第1逆変換係数が固定の係数である場合、ノルム補正部1140は、内部メモリなどにノルムを保持しておけばよい。
ノルム補正部1140は、実施の形態5の変形例に係るノルム補正部940と反対の処理を行う。具体的には、ノルム補正部1140は、式23に示すように、統合後の信号y^’1 nにノルムを乗じることで、第1復号変換出力信号y^1 nを生成する。
なお、式23に示す乗算は、統合後の信号y^’1 nに含まれる要素毎に行われる。すなわち、ノルム補正部1140は、統合後の信号y^’1 nの要素y^’1(i)に、ノルムN(i)を乗じることで、第1復号変換出力信号y^1 nの要素y^1(i)を生成する。
なお、上記のノルム補正は、統合部420による統合前の2つの入力信号である第2復号部分信号、及び、第1復号部分信号に別々に行ってもよい。
図38は、本発明の実施の形態6の変形例に係る逆変換部1030bの構成の一例を示すブロック図である。逆変換部1030bは、逆変換部1030と比較して、さらに、ノルム補正部1141及び1142を備える。
ノルム補正部1141は、第1復号部分信号y^’1L mにノルム補正を行う。具体的には、ノルム補正部1141は、第1逆変換に用いる第1逆変換行列A−1 1 nから算出したノルムNを用いて、入力される第1復号部分信号y^’1L mを補正する(式23参照、y^1(i)はy^1L(i)に、y^’1(i)はy^’1L(i)に読み替える)。なお、ノルムNは、上記の式12によって算出される。
ノルム補正部1142は、第2復号部分信号y^’1H n−mにノルム補正を行う。具体的には、ノルム補正部1142は、第1逆変換に用いる第1逆変換行列A−1 1 nから算出したノルムNを用いて、入力される第2復号部分信号y^’1H n−mを補正する(式23参照、y^1(i)はy^1H(i)に、y^’1(i)はy^’1H(i)に読み替える)。
統合部420は、ノルム補正が行われた第1復号部分信号と第2復号部分信号とを統合することで、第1復号変換出力信号を生成する。なお、ノルムNは、上記の式12によって算出される。
なお、第2逆変換後の第2復号変換出力信号y^’1L mにノルム補正を行うのではなく、第2逆変換行列A−1 2 mにノルム補正を行っても同様の効果が得られる。
ノルム補正部1141は、第1逆変換行列A−1 1 nから算出したノルムを用いて、第2変換係数を補正する。なお、ノルムは、式12によって算出される。具体的には、ノルム補正部1141は、式24に従って第2逆変換係数を補正する。つまり、ノルム補正部1141は、第2逆変換係数にノルムを乗じることで、補正後の第2逆変換係数を生成する。
第2逆変換部410は、補正後の第2逆変換行列A−1’2 mを用いて、第2復号変換出力信号y^2 mを逆変換することで、第1復号部分信号y^1L mを生成する。
以上のように、第1逆変換前の信号に対してノルム補正を行うことで、逆変換行列の基底を揃えることができ、変換の精度を高めることができる。
なお、図37に示す構成と図38に示す構成とを比較すると、図37の構成は、ノルム補正部が単一であるので、実装が単純化することができるという効果がある。一方で、図38の構成は、2つの信号の有効性が異なる場合に、それぞれの有効精度に応じた最小限の有効精度を備えるノルム補正部を実現できる効果がある。
また、ノルム補正と同様に、H.264では逆量子化部で行っていた、量子化マトリクス(Qmatrix)のウェイトスケールの重み付け処理を、図37又は図38で示すノルム補正部で行ってもよい。つまり、量子化マトリクスのウェイトスケールを用いて第1復号部分信号を重み付けすることで、第1復号変換出力信号を補正してもよい。
ノルム補正部1140は、実施の形態5の変形例に係るノルム補正部940が行う処理と反対の処理を行う。具体的には、ノルム補正部1140は、統合後の信号y^’1 nに量子化パラメータを乗じることで、第1復号変換出力信号y1 nを生成する。なお、これは、式25に示すように、補正係数mfで統合後の信号y^’1 nを除算することと等価である。
なお、補正係数mfは、式16によって表される。
また、図38に示すように、第1復号部分信号に量子化マトリクスのスケーリングを行う場合は、第2逆変換前にポストスケール逆補正を行うことが好ましい。
具体的には、量子化マトリクスから算出される補正係数mf_2の逆数を第2復号変換出力信号y^2 mに乗じることで、逆補正後の第2復号変換出力信号y^’2 mを生成する。なお、これは、式26に示すように、補正係数mf_2で第2復号変換出力信号y^2 mを除算することと等価である。
なお、補正係数mf_2(j)は、式18及び式19によって表される。
また、図38の例において、量子化マトリクスのウェイトスケールの重み付けにおいても、逆変換後の第2復号変換出力信号y^’1L mではなく、第2逆変換行列A−1 2 mを補正してもよい。
このとき、ノルム補正部1141は、量子化マトリクスを用いて第2逆変換行列A−1 2 mを補正する。具体的には、ノルム補正部1141は、式27に従って、第2逆変換行列A−1 2 mを補正する。式27に示すように、ノルム補正部1141は、第2逆変換係数a−1 2(i,j)毎に、量子化マトリクスの要素の逆数mf(i)と、量子化マトリクスから算出される補正係数mf_2(j)とで除算する。
以上のように、逆変換後の第2復号変換出力信号y^’1L mではなく、第2逆変換行列A−1 2 mを補正することによっても、同様に、符号化効率を高める効果を得ることができる。
なお、ノルム補正と量子化パラメータの重み付けとを組み合わせてもよい。すなわち、ノルム補正部1141は、逆変換後の第2復号変換出力信号y^’1L m又は第2逆変換行列A−1 2 mに、ノルム補正と量子化マトリクスの重み付けとの両方を行ってもよい。
例えば、逆変換後の第2復号変換出力信号y^’1L mを補正する場合、ノルム補正部1141は、式28に従って、逆変換後の第2復号変換出力信号y^’1L mを補正する。具体的には、ノルム補正部1141は、逆変換後の第2復号変換出力信号y^’1L mの要素y^’1L(i)毎に、第1逆変換行列A−1 1 nから算出されたノルムN(i)を乗じ、量子化マトリクスの要素の逆数mf(i)を除算することで、第1復号部分信号y^1L mを生成する。
また、第2逆変換行列A−1 2 mを補正する場合、ノルム補正部1141は、式29に従って、第2逆変換行列A−1 2 mを補正する。具体的には、ノルム補正部1141は、第2変換係数a−1 2(i,j)毎に、第1逆変換行列A−1 1 nから算出されたノルムN(i)を乗じ、量子化マトリクスの要素の逆数mf(i)と、量子化マトリクスから算出される補正係数mf_2(j)とで除算することで、補正後の第2逆変換行列A−1’2 mを生成する。
以上のような構成であっても、より適した第2逆変換を第2復号変換出力信号に適用することができる。
なお、変換入力信号のデータ量が多い場合には、ノルムの補正処理とウェイトスケールの重み付け処理とを省略して、演算量を削減し、変換入力信号のデータ量が少ない場合のみ、これらの処理を行ってもよい。なお、ノルムの補正処理とウェイトスケールの重み付けとは、補正対象の信号が非ゼロの場合のみに限定し、演算量を削減してもよい。
なお、変換入力信号のデータ量が多い場合とは、具体的には、変換のブロックのサイズが4×4画素、8×8画素、16×16画素、32×32画素などのように複数種類定義される時、32×32は4×4や8×8よりデータ量が多いと考える。あるいは、変換行列の非ゼロ係数が多い場合を指すと考えてもよい。
なお、変換入力信号のデータ量が多い場合には、ノルムの補正処理とウェイトスケールの重み付け処理とについて、乗算ではなく、シフトと加算とのみからなるように近似して、乗算回数を削減してもよい。
なお、数値を正確に表現するのに必要なメモリのデータサイズ(ここでは必要ビット長とする)は、一般的に行列演算によって増加する。第2復号部分信号は、第2逆変換が行われない一方で、第1復号部分信号は第2逆変換部410において乗算が行われているため、必要ビット長が相違する可能性がある。したがって、第2逆変換部410において必要ビット長がMビット増加する場合、第2復号部分信号は、Mビット分シフトアップしておいてもよい。
例えば、図36の構成においては、第1逆変換部1130へ入力する前の時点でビット長を一致させる補正を行うことで、第1逆変換部1130を切り替える必要がなくなり、第1逆変換部1130の構成を簡略化できる。また、図37に示す構成において、ノルム補正部1140へ入力する前の時点で必要ビット長を一致させる補正を行うことで、ノルム補正部1140の処理を、第2復号部分信号と、第1復号部分信号とに切り替える必要がなくなり、ノルム補正部1140の構成を簡略化できる。
また、図38に示す構成の場合、第2復号部分信号が入力されるノルム補正部1142は、入力信号の必要ビット長が低いままのため、内部の信号処理に必要な必要ビット長を低く抑え、回路資源を節約することができる。あるいは、入力信号の必要ビット長の低い分だけ、ノルム補正部1142において乗算する、ノルム補正量、及び、ウェイトスケールの重み付け量の有効精度を上げてもよく、この場合、ノルム補正とウェイトスケールの重み付けとの演算精度を向上できる。
あるいは、第2逆変換部410へ入力する第2復号変換出力信号を予めNビットシフトダウンしておき、第2逆変換部410の内部処理の必要精度を下げ、回路資源を節約してもよい。なお、第2逆変換部410の変換によって増加するビット長がMビットであるとき、NはMよりも小さく設定してもよい。この場合、第2逆変換への入力時にNビットのシフトダウンを行うとき、第2逆変換の出力に対してM−Nビットのシフトダウンを行う。
このように、第2逆変換における有効データ長が所定の値以下に収まるように、第2逆変換部410へ入力する第2復号変換出力信号を構成する係数値をシフトダウンすることで、第2復号変換出力信号を補正してもよい。これにより、第2逆変換部410の内部処理の必要精度を下げ、回路資源を節約することができる。
また、第1復号部分信号又は第2復号変換出力信号を構成する係数値のビット長が、第2復号部分信号を構成する係数値のビット長と同じになるように、第1復号部分信号又は第2復号変換出力信号を構成する係数値をシフトダウンしてもよい。
なお、本実施の形態で述べたビット操作のビット長は、シーケンス単位、GOP単位、フレーム単位、ブロック単位に制御してもよい。第2復号変換出力信号のブロックの有効ビット長(ある瞬間に実際にメモリを消費しているサイズ)に基づいて、ブロック単位にビット長を制御することにより、演算精度を高めることができる。例えば、第2復号変換出力のブロックの有効ビット長が長いときは、第2逆変換部410への入力前のシフトダウン量を大きくし、そうではないときは、第2逆変換部410への入力前のシフトダウン量を小さくしてもよい。
また、第1変換及び第1逆変換は、離散コサイン変換と、離散サイン変換とを切り替える構成であってもよい。切り替えフラグ情報は符号化装置において符号化信号に多重化され、復号装置において復号され、符号化装置から復号装置へ通知される。離散コサイン変換と、離散サイン変換とは、位相が相互pi/2にずれた変換であるため、第2変換と第2逆変換係数は、相互にpi/2だけずれた関係を持たせ、逆変換係数の情報量を削減してもよい。
(実施の形態7)
本発明の実施の形態7に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態7に係る符号化装置及び符号化方法では、多次元の信号に対して分離型及び非分離型の変換を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態7に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態7に係る符号化装置及び符号化方法では、多次元の信号に対して分離型及び非分離型の変換を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態7に係る符号化装置では、変換入力信号、第1変換出力信号、第2部分信号、及び、変換出力信号は、P(Pは2以上の整数)次元信号である。第2変換部220は、P次元信号を入出力する場合と、一次元信号を入出力する場合のどちらであってもよい。第2変換部220が一次元信号を入出力する場合、第2変換部220は、実施の形態1、3及び5と同じである。
分割部210は、P次元の変換入力信号を分割統合情報に従って第1部分信号と第2部分信号とに分割した後、さらに、第1部分信号を一次元に並び替える。並び替えの順序情報は、分割統合情報に追加的に格納される。
統合部230は、第2変換出力信号と第2部分信号とを分割統合情報に従って統合することで、変換出力信号を生成する。この際、統合部230は、一次元信号である第2変換出力信号を、分割統合情報に格納された並び替え情報に基づいてP次元信号へ並び替えた後、P次元の第2変換出力信号とP次元の第2部分信号とを統合する。なお、第2変換部220がP次元信号を入出力する場合、一次元信号への並び替えを行わなくてもよい。
さらにこの場合、第2変換部220は、分離型(水平軸方向と垂直軸方向の2段階変換)の変換を行ってもよい。すなわち、第2変換部220は、水平方向に行単位に変換を行い、垂直方向に列単位に変換を行う。なお、水平と垂直の順は逆でもよい。
また、要素数が1個の行または列単位の変換は、実質処理をしていないのと同等であるため処理をスキップしてもよく、あるいは、後段のノルム補正の処理をここで行ってもよい。また、行変換の変換係数と列変換の変換係数とは、同じでも異なってもよい。行変換の変換係数は、全ての行で同じ変換係数を用いて変換係数のデータ量を削減してもよく、行単位に異なる変換係数を用いて、行単位の統計的な性質の違いに適応させ変換性能を上げてもよい。列変換についても行変換と同様であり、全列で同じ変換係数を用いてもよく、あるいは、異なる変換係数を用いてもよい。
これらの相違は、P次元信号を変換の入力時点で一次元に並び替える非分離型であるか、変換内部で一次元単位で処理を行う分離型の構成をとるかである。
なお、第2変換係数の一部にゼロを設定することで、その係数の乗算処理を削減してもよい。ゼロに設定する係数は、上記のようにエネルギーの低い要素とする。特に、第2変換行列の大きさが第1変換行列の大きさと同じ場合は、分割部210において、第2変換部220へ入力する信号(第1部分信号)と入力しない信号(第2部分信号)とを分ける必要はなくなる。したがって、統合部230も必要ではなくなる。
つまり、分割部210と統合部230とを用いない場合は、図8(b)で示すように、第2変換の対象ではない要素に対応する変換行列の行について、対角要素は1で非対角要素は0という変換行列を用いることで、当該第2変換の対象ではない要素にかかる乗算処理を削減することを特徴としてもよい。第2変換の対象外とするのは、第1変換出力のうちエネルギーの小さな要素に対応する行としてもよい。あるいは、第1変換出力の相互相関の小さな要素に対応する変換行列の要素をゼロに設定してもよい。
第2変換部220の前後の動作について、4×4×2の三次元ブロック信号(入力点数n=32)が入力された場合について、図39を用いて説明する。
P次元(例ではP=3)の第1変換出力信号は、分割部210において分割統合情報に従い、第1部分信号と第2部分信号とに分割される。第2変換部220は、第1部分信号に、第2変換行列を用いて第2変換を行うことで、第2変換出力信号を生成する。統合部230は、第2変換出力信号と、第2部分信号とを統合することで、変換出力信号として出力される。
まず、第1変換部200が行う第1変換について説明する。第1変換部200は、P次元の入力信号(例えば、複数の二次元の変換入力信号)のそれぞれに第1変換を行うことで、複数の第1変換出力信号を生成する。
P次元の信号である変換入力信号に対して、図39に示すようにP−1次元の第1変換を複数回適用し、第1変換出力信号を生成してもよい。例えば、図39で示す例では、第1変換部200は、4×4×2の三次元の変換入力信号に対して、4×4の二次元の第1変換を2回行う。
なお、図39では、説明を分かりやすくするため、2つの第1変換部200を示しているが、1つの第1変換部200が2回の二次元の第1変換を行えばよい。また、実際に変換部が2つの第1変換部200を備え、2つの第1変換部200がそれぞれ1回ずつ二次元の第1変換を行ってもよい。
あるいは、第1変換部200は、P次元の変換入力信号に対して、P次元の第1変換を1回行ってもよい。P次元の第1変換は分離型でもよく、あるいは、非分離型であってもよい。
次に、第2変換部220が行う第2変換について説明する。第2変換部220は、複数の第1変換出力信号の一部である複数の第1部分信号を含む一括信号に、一括して第2変換を行う。
図40は、分離型の構成の第2変換のデータフローを概念的に示す図である。2つの二次元ブロックを含む信号が入力された場合、まず、第2変換部220は、二次元信号の水平方向に変換を行う(S501)。次に、第2変換部220は、垂直方向に変換を行う(S502)。最後に、第2変換部220は、ブロックをまたがる方向に変換を行う(S503)。なお、この順序は一例であり、水平、垂直、ブロックをまたがる方向の処理の順番は、これに限るものではない。また、分離型の構成の第2逆変換も、図40と同様に、水平方向、垂直方向、ブロックをまたがる方向などの順で逆変換を行う。逆変換の順番も、これに限るものではない。
このように、本発明の実施の形態7に係る第2変換部220は、P次元のそれぞれに対して一次元の変換をP回行う分離型の第2変換を、P次元の第1部分信号に行う。すなわち、図40に示す例では、三次元のそれぞれに対して一次元の変換を3回行う分離型の第2変換を、三次元の第1部分信号に行う。
本発明の実施の形態7の変換処理のフローは、実施の形態1、3、5とほぼ同様であるため、ここでは、図6を用いて説明する。
なお、本発明の実施の形態7に係る符号化装置に入力される入力信号は、例えば、入力画像又は予測誤差画像を構成する複数のブロックのそれぞれに対応する画像信号である。具体的には、複数のブロックは、図41に示すように、入力画像又は予測誤差画像の輝度ブロック又は色差ブロックを含む。あるいは、複数のブロックは、図42に示すように、入力画像又は予測誤差画像内において互いに空間的に隣接するブロックを含んでもよい。
まず、第1変換係数導出部202は、第1変換係数を決定する(ステップS111)。次に、第1変換部200は、P次元の変換入力信号に第1変換を行うことで、第1変換出力信号を生成する(ステップS112)。このとき、第1変換は、入力信号の次元よりも低い次元で複数回行われてもよい。
次に、分割統合情報算出部612は、分割統合情報を決定する(ステップS113)。次に、分割部210は、分割統合情報に基づいて、第1変換出力信号を第1部分信号と第2部分信号へ分割する(ステップS114)。このとき、分割部210は、第1部分信号の相関エネルギーが第2部分信号の相関エネルギーよりも大きくなるように分割する。
次に、第2変換係数導出部222は、第1部分信号の局所的な集合の統計的性質に基づいて、第2変換係数を決定する(ステップS115)。そして、第2変換部220は、第1部分信号に対して第2変換行列を用いて第2変換を行うことで、第2変換出力信号を生成する(ステップS116)。
最後に、統合部230は、第2変換出力信号と第2部分信号とを統合することで、変換出力信号を生成する(ステップS118)。
なお、第1変換が固定変換の場合には、ステップS111は省略される。なお、ステップS111、ステップS113、ステップS115は別の方法によって決定され、本実施の形態の一部として動作しなくてもよい。また、第2変換が分離型である場合は、ステップS114において、分割部210が、第1部分信号をP次元から一次元へ並び替え、ステップS118において、統合部230が、第2変換出力信号を一次元からP次元に並び替えた後、統合する。
なお、上述したように、本実施の形態では、多次元の変換入力信号は、輝度信号(Y信号)及び色差信号(U信号、V信号)でもよい。図41は、多次元の変換入力信号がYUVの信号である場合のデータフローの一例を概念的に示す図である。
輝度信号(Y信号)と2つの色差信号(U信号とV信号)とは、第1変換部200において、同時に三次元の第1変換が行われるか、あるいは、個別に二次元の第1変換が行われる。
第2変換部220は、Y信号の第1変換出力信号と、U信号の第1変換出力信号と、V信号の第1変換出力信号とのうち、エネルギーの大きな低域側領域である第1部分信号に対して、第2変換を行い、第2変換出力信号を生成する。このとき、第2変換部220は、例えば、図40に示すような順で、複数の第2変換出力信号に一括して第2変換を行う。
そして、第2変換出力信号と、第2変換を適用されなかった領域である第2部分信号とは統合されることで、変換出力信号が生成される。Y信号の変換出力信号、U信号の変換出力信号、及び、V信号の変換出力信号は、それぞれ個別にスキャンされ、量子化される。なお、実施の形態11で述べるように、第2変換出力信号に対しては、第2部分信号とは独立のスキャン、量子化を行ってもよい。
また、本実施の形態では、多次元の変換入力信号は、空間的に隣接するブロックの画像信号でもよい。図42は、多次元の変換入力信号が空間的に隣接するブロックの信号である場合のデータフローの一例を概念的に示す図である。
空間的に隣接する複数個の小ブロック(図42に示す例では、4個)は、第1変換部200によって、個別に第1変換が行われる。次に、第2変換部220は、それぞれの第1変換出力信号のうち、エネルギーの大きい要素を含む低域側領域である第1部分信号に対して、第2変換を行うことで、第2変換出力信号を生成する。このとき、第2変換部220は、例えば、図40に示すような順で、複数の第2変換出力信号に一括して第2変換を行う。
そして、第2変換出力信号と、第2変換を適用されなかった領域である第2部分信号とは統合されることで、変換出力信号が生成される。小ブロックの変換出力信号は、それぞれ個別にスキャンされ、量子化される。なお、実施の形態11で述べるように、第2変換出力信号に対しては、第2部分信号とは独立のスキャン、量子化を行ってもよい。
以上のように、本発明の実施の形態7に係る符号化装置及び符号化方法により、変換処理の演算量と変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。特に、P次元(Pは2以上の整数)の入力信号に対して効果的である。
なお、本発明の実施の形態7において、第2変換部220は、非分離型の第2変換を行ってもよい。すなわち、第2変換部220は、P次元の信号を一次元の信号に並び替え、並び替えた後の信号に変換を行う非分離型の第2変換を、P次元の第1部分信号に行ってもよい。具体的には、実施の形態1などで説明した場合と同様であるので、ここでは説明を省略する。
(実施の形態8)
本発明の実施の形態8に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(例えば、実施の形態7において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態8に係る復号装置及び復号方法は、多次元の信号に対して分離型及び非分離型の逆変換を行うことを特徴とする。上述した実施の形態と同様の構成については同じ符号を付し、説明を省略する場合がある。
本発明の実施の形態8に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(例えば、実施の形態7において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態8に係る復号装置及び復号方法は、多次元の信号に対して分離型及び非分離型の逆変換を行うことを特徴とする。上述した実施の形態と同様の構成については同じ符号を付し、説明を省略する場合がある。
本発明の実施の形態8に係る復号装置では、復号変換出力信号、復号変換入力信号、復号信号、予測信号がP次元信号(Pは2以上の整数)である。つまり、復号変換出力信号、第2復号部分信号、第1復号変換出力信号、復号変換入力信号は、P次元信号である。第2逆変換部410は、P次元信号を入出力する場合と一次元信号を入出力する場合のどちらであってもよい。第2逆変換部410が一次元信号を入出力する場合、第2逆変換部410は、実施の形態2、4及び6と同じである。
分割部400は、P次元信号を分割統合情報に従って、第2復号変換出力信号と第2復号部分信号とに分割した後、さらに、第2復号変換出力信号を一次元に並び替える。並び替えの順序情報は、分割統合情報に追加的に格納されている。
統合部420は、第1復号部分信号と第2復号部分信号とを分割統合情報に従って統合することで、第1復号変換出力信号を生成する。この際、統合部420は、一次元信号である第1復号部分信号を、分割統合情報に格納された並び替え情報に基づいてP次元信号へ並び替えた後、P次元の第1復号部分信号とP次元の第2復号部分信号とを統合する。なお、第2逆変換部410がP次元信号を入出力する場合、一次元信号への並び替えを行わなくてもよい。この場合のデータフローの概念図は、図13Bになる。
さらに、この場合、第2逆変換部410は、分離型(水平軸方向と垂直軸方向の2段階変換)の変換を行ってもよい。この場合のデータフローの概念図は、図43となる。すなわち、第2逆変換部410は、水平方向に行単位に逆変換を行い、垂直方向に列単位に逆変換を行う。なお、水平と垂直の順は逆でもよい。
また、要素数が1個の行または列単位の変換は実質処理をしていないのと同等であるため処理をスキップしてもよく、あるいは、後段のノルム補正の処理をここで行ってもよい。また、行変換の逆変換係数と列変換の逆変換係数とは、同じでも異なってもよい。行変換の逆変換係数は、全ての行で同じ逆変換係数を用いることで、逆変換係数のデータ量を削減してもよく、行単位に異なる逆変換係数を用いて、行単位の統計的な性質の違いに適応させ変換性能を上げてもよい。列変換についても行変換と同様であり、全列で同じ逆変換係数を用いてもよく、あるいは、異なる逆変換係数を用いてもよい。
これらの相違は、P次元信号を逆変換の入力時点で一次元に並び替える非分離型であるか、逆変換の内部で一次元単位で処理を行う分離型の構成をとるかである。
なお、第2逆変換係数の一部にゼロを設定することで、その係数の乗算処理を削減してもよい。ゼロに設定する係数は、上記のようにエネルギーの低い要素とする。特に、第2逆変換行列の大きさが第1逆変換行列の大きさと同じ場合は、分割部400において、第2逆変換部410へ入力する信号(第2復号変換出力信号)と入力しない信号(第2復号部分信号)とを分ける必要はなくなる。したがって、統合部420も必要ではなくなる。
つまり、分割部400と統合部420とを用いない場合は、第2逆変換係数に複数個の非ゼロ係数を設定することで、当該係数にかかる乗算処理を削減することを特徴としてもよい。また、このとき、ゼロ係数を設定するのは、エネルギーの小さな位置としてもよく、相互相関の小さな係数のみとしてもよい。なお、非対角要素を全て0とする基底では、対角要素は1とする。
図44は、本発明の実施の形態8に係る逆変換部のデータフローを概念的に示す図である。
P次元(図44の例では、4×4×2の三次元信号、入力点数n=32)の復号変換出力信号は、分割部400において、分割統合情報に従って、第2復号変換出力信号(入力点数m=6)と、第2復号部分信号とに分割される。第2逆変換部410は、第2復号変換出力信号に対して、第2逆変換係数で構成される第2逆変換行列を用いて第2逆変換を行うことで、第1復号部分信号を生成する。すなわち、第2逆変換部410は、複数の符号化信号の一部に対応する第2復号変換出力信号(図44の例では、2つの二次元の第2復号変換出力信号)を含む一括信号に、一括して第2逆変換を行うことで、複数の第1復号部分信号を生成する。
統合部420は、第1復号部分信号と第2復号部分信号とを統合することで、第1復号変換出力信号を生成する。そして、第1逆変換部430は、第1復号変換出力信号に対して、第1逆変換係数で構成される第1逆変換行列を用いて第1逆変換することで、復号変換入力信号を生成する。すなわち、第1逆変換部430は、複数の第1部分信号のそれぞれと、対応する第2復号部分信号とを含む第1復号変換出力信号のそれぞれに、第1逆変換を行うことで、復号変換入力信号を生成する。
なお、第2逆変換部410は、2つの二次元ブロックを含む信号が入力された場合、図40と同様に、水平方向、垂直方向、ブロックをまたがる方向などの順で逆変換を行う。逆変換の順番は、これに限るものではない。
また、第1逆変換部430では、図44に示すようにP−1次元の第1逆変換を複数回適用することで、復号変換入力信号を生成してもよい。例えば、図44で示す例では、第1逆変換部430は、4×4×2の三次元の第1復号変換出力信号に対して、4×4の二次元の第1逆変換を2回行う。
なお、図44では、説明を分かりやすくするため、2つの第1逆変換部430を示しているが、1つの第1逆変換部430が2回の二次元の第1変換を行えばよい。また、実際に変換部が2つの第1逆変換部430を備え、2つの第1逆変換部430がそれぞれ1回ずつ二次元の第1変換を行ってもよい。
あるいは、第1逆変換部430は、P次元の変換入力信号に対して、P次元の第1変換を1回行ってもよい。P次元の第1変換は分離型でもよく、あるいは、非分離型であってもよい。
このように、本発明の実施の形態8に係る第2逆変換部410は、P次元のそれぞれに対して一次元の変換をP回行う分離型の第2逆変換を、P次元の第2復号変換出力信号に行う。すなわち、図44に示す例では、三次元のそれぞれに対して一次元の変換を3回行う分離型の第2逆変換を、三次元の第2復号変換出力信号に行う(図40参照)。
本発明の実施の形態8の逆変換処理のフローは、実施の形態2、4、6とほぼ同様であるため、ここでは、図14を用いて説明する。
なお、本発明の実施の形態8に係る復号装置に入力される符号化信号は、例えば、入力画像又は予測誤差画像を構成する複数のブロックのそれぞれに対応する画像信号が符号化された信号である。具体的には、複数のブロックは、図45に示すように、入力画像又は予測誤差画像の輝度ブロック又は色差ブロックを含む。あるいは、複数のブロックは、図46に示すように、入力画像又は予測誤差画像内において互いに空間的に隣接するブロックを含んでもよい。
まず、分割部400は、分割統合情報を取得する(ステップS231)。次に、分割部400は、分割統合情報に従い、復号変換出力信号を第2復号変換出力信号と第2復号部分信号とに分割する(ステップS232)。
次に、第2逆変換部410は、第2逆変換係数を取得する(ステップS233)。そして、第2逆変換部410は、第2復号変換出力信号に対して第2逆変換を行うことで、第1復号部分信号を生成する(ステップS234)。
次に、統合部420は、分割統合情報に従い、第1復号部分信号と第2復号部分信号とを統合することで、第1復号変換出力信号を生成する(ステップS236)。
次に、第1逆変換部430は、第1逆変換係数を取得する(ステップS237)。そして、第1逆変換部430は、第1復号変換出力信号に対して第1逆変換を行うことで、復号変換入力信号を生成する(ステップS238)。
なお、分割統合情報を取得するステップS231、逆変換係数を取得するステップS233、S237などは、前述したように通知のバリエーションが多数あるため、本フローのタイミングで実施されるとは限らず、また、本実施の形態の一部として必須の動作ではない。また、第2逆変換が分離型である場合は、ステップS232において、分割部400が、第2復号変換出力信号をP次元から一次元へ並び替え、ステップS236において、第1復号部分信号を一次元からP次元に並び替えた後、統合する。
なお、上述したように本実施の形態では、多次元の復号変換出力信号は、輝度信号(Y信号)及び色差信号(U信号、V信号)でもよい。図45は、多次元の復号変換出力信号がYUVの信号である場合の逆変換のデータフローの一例を概念的に示す図である。
Y信号の復号量子化係数、U信号の復号量子化係数、V信号の復号量子化係数は、逆量子化部320において逆量子化され、復号変換出力信号が生成される。逆量子化は、YUV信号それぞれに対して行ってもよく、実施の形態11で述べるように、第2逆変換部410に入力される部分については、まとめて逆量子化されてもよい。
第2逆変換部410は、復号変換出力信号のうちエネルギーの大きな低域側領域である第2復号変換出力信号に、第2逆変換を行うことで、第1復号部分信号を生成する。第1復号部分信号は、第2逆変換が行われなかった部分である第2復号部分信号と統合されることで、第1復号変換出力が生成される。
第1逆変換部430は、第1復号変換出力信号に対して第1逆変換を行うことで、Y信号、U信号、V信号の復号変換入力信号を生成する。第1逆変換部430は、YUV信号をまとめた三次元の変換を一括して行ってもよく、あるいは、YUV信号を個別に二次元の変換を行ってもよい。なお、実施の形態11で述べるように、第2逆変換が適用される部分(第1復号部分信号)に対しては、適用されない部分(第2復号部分信号)とは独立の逆スキャン、逆量子化を行ってもよい。
また、本実施の形態では、多次元の復号変換出力信号は、空間的に隣接するブロックの画像信号でもよい。図46は、多次元の復号変換出力信号が空間的に隣接するブロックの信号である場合のデータフローの一例を概念的に示す図である。
空間的に隣接する複数個の小ブロック(図46に示す例では、4個)に対応する復号量子化係数は、逆量子化部320において逆量子化され、復号変換出力信号が生成される。逆量子化は、4つの小ブロックに対応するデータに対して個別に行われる。あるいは、第2逆変換部410に入力される部分に対応するデータをまず逆量子化し、4つの小ブロックに対応するデータのうち、第2逆変換部410に入力されない部分を個別に逆量子化してもよい。
第2逆変換部410は、4つの小ブロックに対応する復号変換出力信号のうち、エネルギーの大きい要素を含む低域側領域である第2復号変換出力信号に対して、第2逆変換を行うことで、第1復号部分信号を生成する。そして、第2逆変換の出力である第1復号部分信号と、第2逆変換を適用されなかった領域である第2復号部分信号とは統合されることで、第1復号変換出力信号が生成される。
第1逆変換部430は、第1復号変換出力信号のそれぞれの小ブロック単位に、第1逆変換を行うことで、復号変換入力信号を生成する。なお、実施の形態11で述べるように、第2逆変換が適用される部分(第1復号部分信号)に対しては、第2逆変換が適用されない領域(第2復号部分信号)とは、独立の逆スキャン、逆量子化を行ってもよい。また、第2逆変換が適用される領域の量子化係数の状態に応じて、第2逆変換が適用されない領域に対する逆スキャン、逆量子化、エントロピー復号の内部状態変数を切り替えてもよい。
また、第1逆変換行列のノルムを補正する処理は、図37及び図38に示すように、第1逆変換の前で行う。具体的には、第2逆変換が行われる部分については、第2逆変換の後で行い、第2逆変換が行われない部分については、第1逆変換の前のいずれの時点で行ってもよい。
以上のように、本発明の実施の形態8に係る復号装置及び復号方法により、変換処理の演算量と逆変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。特に、P次元(Pは2以上の整数)の入力信号に対して効果的である。
なお、本発明の実施の形態8において、第2逆変換部410は、非分離型の第2逆変換を行ってもよい。すなわち、第2逆変換部410は、P次元の信号を一次元の信号に並び替え、並び替えた後の信号に変換を行う非分離型の第2変換を、P次元の第2復号変換出力信号に行ってもよい。具体的には、実施の形態1などで説明した場合と同様であるので、ここでは説明を省略する。
(実施の形態9)
本発明の実施の形態9に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態9に係る符号化装置は、分離型の変換を第1変換及び第2変換の少なくとも一方で実行することを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態9に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態9に係る符号化装置は、分離型の変換を第1変換及び第2変換の少なくとも一方で実行することを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態9に係る符号化装置及び符号化方法では、入力信号がP次元信号(Pは2以上の整数)である。そのため、変換出力信号、復号変換出力信号、復号変換入力信号、復号信号、予測信号もP次元となる。
本発明の実施の形態9における第1変換部200は、演算処理の一部又は全てにおいて、固定の変換処理を用いる。具体的には、例えば、MPEG−1/2/4ビデオ符号化規格搭載の離散コサイン変換や、H.264/AVC規格採用の整数精度DCTを用いる。あるいは、実施の形態1、3、5、7で説明した変換を分離型変換の一部として用いてもよい。
4×4の二次元信号が変換入力信号として入力された場合について、図47を用いて説明する。図47は、本発明の実施の形態9に係る変換部のデータフローの一例を概念的に示す図である。
第1変換部200は、P次元信号(図47に示す例では、P=2)の変換入力信号に、分離型変換である第1変換を行うことで、第1変換出力信号を生成する。分離型変換である第1変換部200は、行方向の変換を行う第1座標軸変換を行い、次に、列方向の変換を行う第2座標軸変換を行う。なお、行方向と列方向との処理は入れ替わる構成もありえる。
n×nの二次元信号の入力は、次元数がn×nであり、変換の演算量が膨大となるため、分離型の構成をとることが好ましい。分離型では、行又は列の1つの変換単位において、次元数はnであり、分離型ではない変換の次元数n×nと比べて低いため、演算量を軽減できる。分割部210、第2変換部220、統合部230の動作は、実施の形態1、3、5、7と同じであるため説明を省略する。
図48Aを用いて、本発明の実施の形態9に係る変換部110が行う変換方法を説明する。図48Aは、本発明の実施の形態9に係る変換部110の動作の一例を示すフローチャートである。
まず、第1変換部200は、変換入力信号に第1変換を行うことで、第1変換出力信号を生成する(ステップS112)。ステップS112は、次の2つのステップを含んでいる。
具体的には、まず、第1変換部200は、変換入力信号を第1座標軸方向に変換することで、第1座標軸変換信号を生成する(ステップS112a)。そして、第1変換部200は、第1座標軸変換信号を第2座標軸方向に変換することで、第2座標軸変換信号を生成する(ステップS112b)。このようにして生成された第2座標軸変換信号が、実施の形態1、3、5、7における第1変換出力信号に相当する。
次に、分割統合情報算出部612は、分割統合情報を決定する(ステップS113)。そして、分割部210は、分割統合情報に基づいて、第1変換出力信号である第2座標軸変換信号を第1部分信号と第2部分信号とへ分割する(ステップS114)。このとき、分割部210は、第1部分信号の相関エネルギーが第2部分信号の相関エネルギーよりも大きくなるように分割する。さらに、分割部210は、P次元(Pは2以上の整数)の第1部分信号を一次元に並び替える。
次に、第2変換係数導出部222は、第1部分信号の局所的な集合の統計的性質に基づいて、第2変換係数を決定する(ステップS115)。そして、第2変換部220は、第1部分信号に対して第2変換行列を用いて第2変換を行うことで、第2変換出力信号を生成する(ステップS116)。
最後に、統合部230は、一次元信号の第2変換出力信号をP次元に並び替え、第2部分信号と、一次元からP次元に並び替えた第2変換出力信号とを統合することで、変換出力信号を生成する(ステップS118)。
なお、図48Bに示すように、分割統合情報の決定(ステップS113)と、第2変換係数の決定(ステップS115)とは別の方法によって決定され、本実施の形態の一部として動作しなくてもよい。
また、前述の第1座標軸変換及び第2座標軸変換(ステップS112a、ステップS112b)は、実施の形態1、3、5、7記載の第1変換であってもよい。前述の第1座標軸変換及び第2座標軸変換(ステップS112a、ステップS112b)は、例えば、MPEG−1/2/4ビデオ符号化規格搭載の離散コサイン変換や、H.264/AVC規格採用の整数精度DCTの変換であってもよい。
また、本実施の形態で第1変換について述べたのと同様に、第2変換も分離型の構成であってもよい。第1変換と第2変換とが分離型である場合、例えば、入力が二次元信号とすると、分離された各次元において一次元の信号処理となり、本実施の形態1から8で述べた2段階の変換処理が適用可能である。
図49は、本発明の実施の形態9の変形例に係る変換部110の動作の一例を示すフローチャートである。図48A及び図48Bと同じ動作をするステップには同じ符号を付与し、説明を省略する。
分割部210は、第1変換出力信号を第1部分信号と第2部分信号とに分割する(ステップS114)。このとき、分割部210は、P次元の第1部分信号を一次元に並び替えない。
そして、第2変換部220は、第2変換の第1座標軸変換として行方向の変換処理を行うことで、第1座標軸変換信号を生成する(S116a)。続いて、第2変換部220は、第1座標軸変換信号に対して、第2変換の第2座標軸変換として列方向の変換処理を行うことで、第2座標軸変換信号を生成する(S116b)。このようにして、生成された第2座標軸変換信号が、第2変換出力信号に相当する。なお、行と列の変換の順序は、入れ替わってもよい。
なお、第1方向の変換処理と第2方向の変換処理とを続けて行ってもよい。図50は、本発明の実施の形態9の変形例に係る変換部110の動作の一例を示すフローチャートである。
図49とは、処理の順番を入れ替え、第1変換部200が、行方向の第1変換の第1座標軸変換を行った後(S112a)、分割部210が、行方向に分割を行う(S114a)。そして、第2変換部220は、行方向の第2変換の第1座標軸変換を行った後(S116a)、統合部230が、行方向の統合処理を行う(S118a)。
続いて、第1変換部200が、列方向の第1変換の第2座標軸変換を行った後(S112b)、分割部210が、列方向の分割を行う(S114b)。そして、第2変換部220は、列方向の第2変換の第2座標軸変換を行った後(S116b)、統合部230が、列方向の統合処理を行う(S118b)。
なお、行と列の処理順番は入れ替わってもよい。また、分割処理と統合処理とは、変換係数がゼロ係数を含む場合は、明示的なステップとして現れなくてもよい。
以上のように、本発明の実施の形態9に係る符号化装置及び符号化方法により、変換処理の演算量と変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。特に、P次元(Pは2以上の整数)の入力信号に対して効果的である。
(実施の形態10)
本発明の実施の形態10に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(実施の形態9において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態10に係る復号装置及び復号方法は、分離型の逆変換を第1逆変換及び第2逆変換の少なくとも一方で実行することを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態10に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(実施の形態9において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態10に係る復号装置及び復号方法は、分離型の逆変換を第1逆変換及び第2逆変換の少なくとも一方で実行することを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態10に係る復号装置及び復号方法では、復号変換出力信号、復号変換入力信号、復号信号、予測信号がP次元信号(Pは2以上の整数)である。
第1逆変換部430は、演算処理の一部又は全てにおいて、固定の変換処理を用いる。具体的には、例えば、MPEG−1/2/4ビデオ符号化規格搭載の離散コサイン変換や、H.264/AVC規格採用の整数精度DCTを用いる。あるいは、上述した実施の形態2、4、6、8の逆変換を分離型変換の一部として用いてもよい。
分割部400は、P次元(例えば、P=2)の復号変換出力信号が入力され、分割統合情報に従って、復号変換出力信号を、第2復号変換出力信号と第2復号部分信号とに分割する。第2逆変換部410は、第2逆変換行列を用いて、第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する。
統合部420は、第2復号部分信号と第1復号部分信号とを、分割統合情報に従って統合することで、第1復号変換出力信号を生成する。
第1逆変換部430は、第1復号変換出力信号に、分離型変換である第1逆変換を行うことで、復号変換入力信号を生成する。第1逆変換部430では、行方向の変換を行う第1分離変換(すなわち、第1座標軸逆変換)を行い、次に、列方向の変換を行う第2分離変換(すなわち、第2座標軸逆変換)を行う。行方向と列方向の処理は、入れ替わる構成もありえる。
n×nの二次元信号の入力は、次元数がn×nであり、変換の演算量が膨大となるため、分離型の構成をとることが好ましい。分離型では、行又は列の1つの変換単位において、次元数はnであり、分離型ではない変換の次元数n×nと比べて低いため、演算量を軽減できる。分割部400、第2逆変換部410、統合部420の動作は、上述した実施の形態2、4、6、8と同じであるため説明を省略する。
図51Aを用いて、本発明の実施の形態10に係る逆変換部330が行う逆変換方法を説明する。図51Aは、本発明の実施の形態10に係る逆変換部330の動作の一例を示すフローチャートである。
まず、分割部400は、分割統合情報を取得する(ステップS231)。そして、分割部400は、分割統合情報に従い、P次元信号(Pは2以上の整数)である復号変換出力信号を一次元に並び替え、第2復号変換出力信号と第2復号部分信号とに分割する(ステップS232)。
次に、第2逆変換部410は、第2逆変換係数を取得する(ステップS233)。そして、第2逆変換部410は、第2復号変換出力信号に対して第2逆変換を行うことで、第1復号部分信号を生成する(ステップS234)。
次に、統合部420は、分割統合情報に従い、一次元信号である第1復号部分信号をP次元信号に並び替え、並び替えた信号と第2復号部分信号を統合することで、第1復号変換出力信号を生成する(ステップS236)。
次に、第1逆変換部430は、第1逆変換係数を取得する(ステップS237)。そして、第1逆変換部430は、第1復号変換出力信号に対して第1逆変換を行うことで、復号変換入力信号を生成する(ステップS238)。ここで、ステップS238は、次の2つのステップを含んでいる。
すなわち、具体的には、第1逆変換部430は、第1復号変換出力信号を第1座標軸方向に逆変換することで、第1座標軸逆変換信号を生成する(ステップS238a)。次に、第1逆変換部430は、第1座標軸逆変換信号を第2座標軸方向に逆変換することで、第2座標軸逆変換信号を生成する(ステップS238b)。このようにして生成された第2座標軸逆変換信号が、上述した実施の形態2、4、6、8における、復号変換入力信号に相当する。
なお、図51Bに示すように、分割統合情報の取得(ステップS231)と、逆変換係数の取得(ステップS233及びステップS237)は、前述したように通知のバリエーションが多数あるため、本フローのタイミングで実施されるとは限らない。
また、前述の第1座標軸逆変換及び第2座標軸逆変換(ステップS238a、ステップS238b)は、上述した実施の形態2、4、6、8に記載の第1逆変換であってもよい。また、前述の第1座標軸逆変換及び第2座標軸逆変換(ステップS238a、ステップS238b)は、例えば、MPEG−1/2/4ビデオ符号化規格搭載の離散コサイン変換や、H.264/AVC規格採用の整数精度DCTの変換であってもよい。
また、本実施の形態で第1逆変換について述べたのと同様に、第2逆変換も分離型の構成であってもよい。第1逆変換と第2逆変換とが分離型である場合、例えば、入力が二次元信号とすると、分離された各次元において一次元の信号処理となり、本実施の形態1から8で述べた2段階の変換処理が適用可能である。
図52は、本発明の実施の形態10の変形例に係る逆変換部330の動作の一例を示すフローチャートである。図51A及び図51Bと同じ動作をするステップには同じ符号を付与し、説明を省略する。
分割部400は、復号変換出力信号を第1部分信号と第2部分信号とに分割する(ステップS232)。このとき、分割部400は、P次元の第1部分信号を一次元に並び替えない。
第2逆変換部410は、第2逆変換の第1座標軸変換として、行方向の逆変換処理を行うことで、第1座標軸逆変換信号を生成する(S234a)。続いて、第2逆変換部410は、第2逆変換の第2座標軸変換として、列方向の逆変換処理を行うことで、第2座標軸逆変換信号を生成する(S234b)。このようにして、生成された第2座標軸変換信号が、第1復号部分信号に相当する。なお、行と列の変換の順序は入れ替わってもよい。
なお、第1方向の逆変換処理と第2方向の逆変換処理とを続けて行ってもよい。図53は、本発明の実施の形態10の変形例に係る逆変換部330の動作の一例を示すフローチャートである。
まず、分割部400が、行方向の分割を行い(S232a)、第2逆変換部410が、行方向の第2逆変換の第1座標軸変換を行う(S234a)。そして、統合部420が、行方向の統合処理を行い(S236a)、第1逆変換部430が、行方向の第1逆変換の第1座標軸変換を行う(S238a)。
続いて、分割部400が、列方向の分割を行い(S232b)、第2逆変換部410が、列方向の第2逆変換の第2座標軸変換を行う(S234b)。そして、統合部420が、列方向の統合処理を行い(S236b)、第1逆変換部430が、列方向の第1逆変換の第2座標軸変換を行う(S238b)。
なお、行と列の処理順番は入れ替わってもよい。分割処理と統合処理とは、逆変換係数がゼロ係数を含む場合は、明示的なステップとして現れなくてもよい。
以上のように、本発明の実施の形態10に係る復号装置及び復号方法により、変換処理の演算量と逆変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。特に、P次元(Pは2以上の整数)の入力信号に対して効果的である。
(実施の形態11)
本発明の実施の形態11に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態11に係る符号化装置及び符号化方法は、第2変換が適用された部分と、第2変換が適用されなかった部分とに対して異なる処理を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態11に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態11に係る符号化装置及び符号化方法は、第2変換が適用された部分と、第2変換が適用されなかった部分とに対して異なる処理を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態11に係る符号化装置について、図54Aを用いて説明する。図54Aは、本発明の実施の形態11に係る符号化装置1200の構成の一例を示すブロック図である。
図54Aに示すように、符号化装置1200は、図17に示す実施の形態3に係る符号化装置500と比較して、変換部510、量子化部120、エントロピー符号化部130、逆量子化部540及び逆変換部550の代わりに、変換部1210、量子化部1220、エントロピー符号化部1230、逆量子化部1240及び逆変換部1250を備える点が異なっている。以下では、実施の形態3に係る符号化装置500と同じ構成については、説明を省略し、異なる点を中心に説明する。
本実施の形態では、変換部1210の出力は、第2変換の適用の有無によって、2つに分離されて出力される。つまり、変換部1210は、変換入力信号に第1変換及び第2変換を行うことで、変換出力信号を生成し、生成した変換出力信号のうち、第2変換が適用された部分と、第2変換が適用されなかった部分とをそれぞれ2つの信号として出力する。言い換えると、変換部1210は、前述の第2変換出力信号を変換出力信号Lとして出力し、前述の第2部分信号を、変換出力信号Hとして出力する。
第2変換出力信号は、統計的な性質が第2部分信号とは異なっているため、後続の処理も別々に行うことで、さらなる性能向上ができる。具体的には、量子化部1220は、変換出力信号Lと変換出力信号Hとをスキャンし、量子化することで、それぞれ、量子化係数Lと量子化係数Hとを生成する。言い換えると、量子化部1220は、変換出力信号を構成する係数値をスキャンし、スキャンされた係数値を含むスキャン信号を量子化することで、量子化係数を生成する。
その際において、量子化部1220は、量子化係数Lの量子化による損失を低く抑えるように制御し、主観画質に与える影響の大きい低域信号に割り当てるデータ量を優遇してもよい。すなわち、量子化部1220は、スキャン信号のうち、第2変換出力信号に対応する第1スキャン信号を第1精度で量子化し、第2部分信号に対応する第2スキャン信号を、第1精度より低い第2精度で量子化する。なお、量子化部1220では、量子化精度の切り替えが可能である。
また、量子化部1220は、変換出力信号Lに含まれる係数値に対するスキャンの動作と、変換出力信号Hに含まれる係数値に対するスキャンの動作とを切り替えてもよい。なお、量子化部1220では、スキャン方式が切り替え可能である。
例えば、量子化部1220は、第2変換が非分離型の構成の場合、一次元に並び替えた列である第2変換出力信号の順にスキャンし、第2変換を適用しない第2部分信号については、ジグザグスキャン等の水平方向と垂直方向とにほぼ同時に移動し、ブロックの端で切り返すスキャンを行う。つまり、量子化部1220は、第2変換出力信号を構成する係数値を、第2変換のパワー順にスキャンし、かつ、第2部分信号を構成する係数値を、ジグザグスキャンでスキャンする。
なお、変換の入出力が多次元信号の場合、第2部分信号については、多次元のジグザグスキャンを行ってもよく、あるいは、二次元のジグザグスキャンを逐次行ってもよい。例えば、YUV信号を入力とする例では、Y信号の第2部分信号をジグザグスキャンし、U信号の第2部分信号をジグザグスキャンし、V信号の第2部分信号をジグザグスキャンしてもよい。YUVの処理の順序はこれに限るものではない。
エントロピー符号化部1230は、量子化係数Lをエントロピー符号化することで、符号化信号Lを生成し、量子化係数Hをエントロピー符号化することで、符号化信号Hを生成する。そして、エントロピー符号化部1230は、符号化信号Lと符号化信号Hとを多重化して出力する。
また、量子化係数Lと量子化係数Hとは、統計的な性質が異なるため、エントロピー符号化部1230は、内部状態変数(発生確率、コンテキスト等)を独立に管理する。なお、エントロピー符号化部1230では、エントロピー符号化方式の切り替えが可能である。また、2値化、コンテキスト導出方法を切り替えてもよい。エントロピー符号化の内部状態変数は、状態を記憶するためにメモリを消費するため、削減が望まれる場合がある。したがって、例えば、変換出力信号Lに対するそれらは密に設け、変換出力信号Hに対するそれらは疎に設ける構成であってもよい。密あるいは疎というのは、変換出力信号の個数に対する独立な内部状態変数の個数の比の大小関係を示すものである。
つまり、エントロピー符号化部1230は、量子化係数のうち、第2変換出力信号に対応する第1量子化係数と、第2部分信号に対応する第2量子化係数とに対して、それぞれ異なる確率テーブルを用いてエントロピー符号化する。あるいは、エントロピー符号化部1230は、量子化係数のうち第1量子化係数と第2量子化係数とに対して、それぞれ異なるコンテキスト導出を行うことで、量子化係数をエントロピー符号化してもよい。
逆量子化部1240は、量子化係数Lを逆量子化することで、復号変換出力信号Lを生成し、量子化係数Hを逆量子化することで復号変換出力信号Hを生成する。逆量子化部1240は、量子化部1220が行う処理と反対の処理を行う。
逆変換部1250は、復号変換出力信号Lと復号変換出力信号Hとを逆変換することで、復号信号を生成する。逆変換部1250は、変換部1210が行う処理と反対の処理を行う。
なお、変換出力信号Lに対する処理(スキャン、量子化、エントロピー符号化)は、変換出力信号Hに対する処理(スキャン、量子化、エントロピー符号化)よりも処理順は、早めにしておいてもよい。この処理優先順位とした場合、変換出力信号Lに対するそれら処理の結果に応じて、変換出力信号Hに対するそれら処理の動作を切り替えてもよい。例えば、変換出力信号Lの非ゼロ係数の量に応じて、量子化係数Hに対するエントロピー符号化の内部状態変数を切り替えてもよい。
図54Bは、本発明の実施の形態11に係る符号化装置1200における、信号毎の処理の違いの一例を示す図である。図54Bに示すように、本発明の実施の形態11に係る符号化装置1200では、スキャン、量子化、エントロピー符号化の少なくとも1つにおいて、第2変換出力信号と第2部分信号とのそれぞれに対応する信号に対して異なる処理を行う。
本発明の実施の形態11の符号化処理フローは、上述した実施の形態の符号化処理フローとほぼ同様であるため、以下では、図18を用いて説明する。
まず、予測誤差信号を入力信号として用いる場合には、予測部580は、予測誤差信号を生成する(ステップS305)。次に、変換部1210は、予測誤差信号あるいは入力信号を変換することで、第2変換が適用された変換出力信号Lと第2変換が適用されていない変換出力信号Hとを生成する(ステップS110)。
次に、量子化部1220は、変換出力信号Lを量子化することで、量子化係数Lを生成し、変換出力信号Hを量子化することで、量子化係数Hを生成する(ステップS120)。続いて、エントロピー符号化部1230は、量子化係数Lをエントロピー符号化し、かつ、量子化係数Hをエントロピー符号化することで、符号化信号を生成する(ステップS130)。なお、量子化係数Lのエントロピー符号化と量子化係数Hのエントロピー符号化とは、内部状態変数が独立である。
次に、逆量子化部1240は、量子化係数Lを逆量子化することで、復号変換出力信号Lを生成し、量子化係数Hを逆量子化することで、復号変換出力信号Hを生成する(ステップS340)。次に、逆変換部1250は、復号変換出力信号Lと復号変換出力信号Hとを逆変換することで、復号信号を生成する(ステップS350)。最後に、生成した復号信号をメモリ570に格納する(ステップS360)。
なお、実施の形態3で述べた入力信号の局所的な統計的性質の変動に応じて第2変換係数を制御する構成では、それらの変動に応じて、スキャン、量子化、エントロピー符号化の内部状態変数を切り替えてもよい。ただし、切り替えの種類の増加によって、内部メモリ量が増加するというデメリットがあるため、変換出力信号Lに対する、スキャン、量子化、エントロピー符号化の内部状態変数、エントロピー符号化のコンテキスト導出方法、は切り替えるが、変換出力信号Hに対するそれらは連動させない、つまり、同一のメモリを使用して、メモリ使用量を抑えてもよい。また、スキャン、量子化、エントロピー符号化の内部状態変数、コンテキスト導出方法は、同時に連動と非連動とを切り替えるのではなく、個別に、連動と非連動とを切り替えてもよい。
なお、スキャンは、予め定めた固定のパターンや、量子化係数の発生頻度に基づいて更新される動的なパターンでもよい。スキャン方式、量子化精度、エントロピー符号化方式の切り替えの頻度は、第2変換出力信号に対応する信号の方が、第2部分信号に対応する信号より高くてもよい。
以上のように、本発明の実施の形態11に係る符号化装置及び符号化方法により、変換処理の演算量と変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。
(実施の形態12)
本発明の実施の形態12に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(実施の形態11において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態12に係る復号装置及び復号方法は、第2変換が適用された部分と、第2変換が適用されなかった部分とに異なる処理を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態12に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(実施の形態11において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態12に係る復号装置及び復号方法は、第2変換が適用された部分と、第2変換が適用されなかった部分とに異なる処理を行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態12に係る復号装置について、図55Aを用いて説明する。図55Aは、本発明の実施の形態12に係る復号装置1300の構成の一例を示すブロック図である。
図55Aに示すように、復号装置1300は、図27に示す実施の形態4に係る復号装置700と比較して、エントロピー復号部310、逆量子化部320及び逆変換部730の代わりに、エントロピー復号部1310、逆量子化部1320及び逆変換部1330を備える点が異なっている。以下では、実施の形態4に係る復号装置700と同じ構成については説明を省略し、異なる点を中心に説明する。
エントロピー復号部1310は、符号化信号をエントロピー復号することで、復号量子化係数Lと復号量子化係数Hとを生成する。エントロピー復号において、復号量子化係数Lと復号量子化係数Hとに対する内部状態変数(確率状態変数、コンテキスト)は独立である。
また、2値化、コンテキスト導出方法を切り替えてもよい。なお、エントロピー復号部1310では、エントロピー復号方式の切り替えが可能である。エントロピー復号の内部状態変数は、状態を記憶するためにメモリを消費するため、削減が望まれる場合がある。復号量子化係数Lに対するそれらは密に設け、復号量子化係数Hに対するそれらは疎に設ける構成であってもよい。密あるいは疎というのは、復号量子化係数の個数に対する独立な内部状態変数の個数の比の大小関係を示すものである。
つまり、エントロピー復号部1310は、符号化信号のうち、第2復号変換出力信号に対応する第1符号化信号と、第2復号部分信号に対応する第2符号化信号とに対して、それぞれ異なる確率テーブルを用いてエントロピー復号する。あるいは、エントロピー復号部1310は、符号化信号のうち第1符号化信号と第2符号化信号とに対して、それぞれ異なるコンテキスト導出を行うことで、符号化信号をエントロピー復号してもよい。
逆量子化部1320は、復号量子化係数Lを逆量子化し、逆スキャンすることで、復号変換出力信号Lを生成する。さらに、逆量子化部1320は、復号量子化係数Hを逆量子化し、逆スキャンすることで、復号変換出力信号Hを生成する。すなわち、逆量子化部1320は、復号量子化係数を逆量子化することで、復号スキャン信号を生成し、復号スキャン信号を構成する係数値を構成する係数値をスキャンする。これにより、スキャンされた係数値を含む復号変換出力信号を生成する。
なお、逆量子化部1320は、復号量子化係数のうち、第2復号変換出力信号に対応する第1復号量子化係数を第1精度で逆量子化し、第2復号部分信号に対応する第2復号量子化係数を、第1精度より低い第2精度で逆量子化してもよい。なお、量子化部1220では、量子化精度の切り替えが可能である。
逆変換部1330は、復号変換出力信号Lと復号変換出力信号Hとを逆変換することで、復号変換入力信号を生成する。なお、復号変換出力信号Lと復号変換出力信号Hとはそれぞれ、第2復号変換出力信号、第2復号部分信号に相当する。
なお、逆量子化部1320において、復号量子化係数Lに対する逆スキャンと、復号量子化係数Hに対する逆スキャンの動作を切り替えてもよい。なお、逆量子化部1320では、スキャン方式の切り替えが可能である。第2逆変換が非分離型の構成の場合、一次元に並び替えた列である第1復号部分信号の順に逆スキャンし、第2逆変換を適用しない第2復号部分信号については、ジグザグスキャン等の水平方向と垂直方向とにほぼ同時に移動しブロックの端で切り返す逆スキャンを行う。
つまり、逆量子化部1320は、復号スキャン信号のうち、第2復号変換出力信号に対応する第1復号スキャン信号を構成する係数値を、第2逆変換のパワー順にスキャンし、かつ、第2復号部分信号に対応する第2復号スキャン信号を構成する係数値を、ジグザグスキャンでスキャンする。
なお、変換の入出力が多次元信号の場合、第2復号部分信号については、多次元のジグザグスキャンを行ってもよく、あるいは、二次元のジグザグスキャンを逐次行ってもよい。例えば、YUV信号を入力とする構成では、Y信号の第2復号部分信号を逆ジグザグスキャンし、U信号の第2復号部分信号を逆ジグザグスキャンし、V信号の第2復号部分信号を逆ジグザグスキャンしてもよい。YUVの処理の順序は、これに限るものではない。
なお、復号量子化係数Lに対する処理は、復号量子化係数Hに対する処理よりも処理順は早めにしておいてもよい。この処理優先順位とした場合、復号量子化係数Lに対するそれら処理の結果に応じて、復号量子化係数Hに対するそれら処理の動作を切り替えてもよい。
図55Bは、本発明の実施の形態12に係る復号装置1300における、信号毎の各処理の違いの一例を示す図である。図55Bに示すように、本発明の実施の形態12に係る復号装置1300では、エントロピー復号、逆量子化及びスキャンの少なくとも1つにおいて、第2復号変換出力信号と第2復号部分信号とのそれぞれに対応する信号に対して異なる処理を行う。
本発明の実施の形態12の復号処理フローは、上述した実施の形態の復号処理フローとほぼ同様であるため、図28を用いて説明する。
まず、予測部770は、メモリ760に格納された符号化済み信号をもとに、予測信号を生成する(ステップS405)。なお、入力信号を直接変換する符号化方法にて生成された符号化信号を復号する場合には、本ステップS405は省略される。
次に、エントロピー復号部1310は、符号化信号をエントロピー復号することで、復号量子化係数Lと復号量子化係数Hとを生成する(ステップS210)。ここで、エントロピー復号において、復号量子化係数Lと復号量子化係数Hとに対する内部状態変数(確率状態変数、コンテキスト)は独立である。
次に、逆量子化部1320は、復号量子化係数Lを逆量子化することで、復号変換出力信号Lを生成し、復号量子化係数Hを逆量子化することで、復号変換出力信号Hを生成する(ステップS220)。そして、逆変換部1330は、復号変換出力信号Lと復号変換出力信号Hとを逆変換することで、復号変換入力信号を生成する(ステップS230)。
次に、加算器750は、前述の予測信号と復号変換入力信号とを加算することで、復号信号を生成する。そして、復号信号をメモリ760に格納し、次のタイミングにて参照できるようにする(ステップS440)。
なお、実施の形態3で述べた入力信号の局所的な統計的性質の変動に応じて第2逆変換係数を制御する構成では、それら変動に応じて、エントロピー復号のコンテキストの導出方法、エントロピー復号の内部状態変数、逆量子化、逆スキャンを切り替えてもよい。ただし、切り替えの種類の増加によって、内部メモリ量が増加するというデメリットがあるため、復号量子化係数Lを出力するエントロピー復号の内部状態変数、復号量子化係数Lに対する逆量子化、それに対する逆スキャンは切り替えるが、復号量子化係数Hに関連するそれら処理は連動させない、つまり、同一のメモリを使用して、メモリ使用量を抑えてもよい。エントロピー復号のコンテキスト導出方法、エントロピー復号の内部状態変数、逆量子化、逆スキャンは、同時に連動と非連動を切り替えるのではなく、個別に、連動と非連動を切り替えてもよい。
なお、逆スキャンは予め定めた固定のパターンや、量子化係数の発生頻度に基づいて更新される動的なパターンでもよい。スキャン方式、逆量子化精度、エントロピー復号方式の切り替えの頻度は、第2復号変換出力信号に対応する信号の方が、第2復号部分信号に対応する信号より高くてもよい。
以上のように、本発明の実施の形態12に係る復号装置及び復号方法により、変換処理の演算量と逆変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。
(実施の形態13)
本発明の実施の形態13に係る符号化装置、符号化方法、復号装置及び復号方法は、第2変換係数及び第2逆変換係数の特徴を利用して、符号化効率が高まるように、変換係数を符号化及び復号することを特徴とする。第2変換行列、及び、第2逆変換行列は、以下に示すような、特徴的な行列であるため、変換性能の向上、又は、変換係数のデータ量削減ができる。
本発明の実施の形態13に係る符号化装置、符号化方法、復号装置及び復号方法は、第2変換係数及び第2逆変換係数の特徴を利用して、符号化効率が高まるように、変換係数を符号化及び復号することを特徴とする。第2変換行列、及び、第2逆変換行列は、以下に示すような、特徴的な行列であるため、変換性能の向上、又は、変換係数のデータ量削減ができる。
本実施の形態では、一例として、4個の要素からなる第1部分信号y1L mが第2変換部220に入力され、第2変換部220は、4×4行列の第2変換行列A2 mを用いて第1部分信号y1L mを変換することで、第1部分変換出力信号y2 mを出力する場合を想定する。
図56Aに示すように、第2変換行列A2 mを構成する第2変換係数は、a(i,j)(あるいは、aij)で表される。なお、i=1、2、3、4、及びj=1、2、3、4である。このとき、図56Aに示すように、i=jとなる要素(aii)が対角要素であり、i≠jとなる要素が非対角要素である。さらに、非対角要素は、i<jとなる要素である上三角要素と、i>jとなる要素である下三角要素とに分類される。
以下では、まず、第2変換行列A2 mの対角要素の特徴について説明する。
仮に、第1変換が完全な無相関化を達成できる変換である場合、第2変換は、第1変換出力信号をそれ以上無相関化することができないので、対角要素を全て1(すなわち、8ビット精度の係数の場合255)に設定し、非対角要素の全てを0に設定することができる。
しかしながら、上述したように、第1変換係数導出部202は、集合SAに含まれる複数の変換入力信号xnに平均的に最適化された第1変換行列A1 nを導出するので、個々の変換入力信号xnには最適化されていない。このため、第1変換部200は、完全な無相関化を達成することはできず、第1変換出力信号y1 n、及び、その一部である第1部分信号y1L mは、完全に無相関化されていない。したがって、第2変換係数導出部222が導出する第2変換係数で構成される第2変換行列A2 mの対角要素は必ずしも1にはならず、非対角要素は必ずしも0にはならない。
しかしながら、第1部分信号y1L mは、第1変換によりある程度は無相関化されているので、第2変換行列A2 mの対角要素は1に近い値に、非対角要素は0に近い値に設定してもよい。したがって、第2変換係数を符号化する際には、対角要素a(i,i)と1との差分は、0に近い値となるので、符号化すべき情報量を削減することができるので、より符号化効率を高めることができる。
また、対角要素は、高域成分になるほど特殊な相関の影響を受けやすいため、1から外れるように設定してもよい。つまり、右下の対角要素ほど、1から外れるように設定してもよい。例えば、左上から右下にかけて、一次関数又は等差級数的に値が小さくなるように、第2変換行列の対角要素を決定してもよい。逆行列についても同様である。
図56Bは、第2変換行列及び第2逆変換行列の一例を示す図である。図56Bに示すように、対角要素の値の大きさは、非対角要素の値の大きさの4倍以上に設定してもよい。さまざまなノイズ信号などの外乱が入る場合などでは、対角要素の値の大きさは、非対角要素の値の大きさの2倍以上に設定してもよい。言い換えると、第2変換部220は、行列表現した場合において、全ての対角要素の値が、非対角要素の値の2倍以上の値である変換係数を、第2変換係数として用いて第2変換を行ってもよい。同様に、第2逆変換部410は、行列表現した場合において、全ての対角要素の値が、非対角要素の値の2倍以上の値である逆変換係数を、第2逆変換係数として用いて第2逆変換を行ってもよい。
続いて、非対角要素の係数に関して、変換係数がa(i,j)で示される場合、a(j,i)で示される折り返し要素は、ほぼ絶対値を同等に設定してもよい。図56Bは、非対角要素の変換係数が、折り返し要素とほぼ同等の絶対値を持たせた例である。a12=48とa21=−58のペア、a13=64とa31=−57のペアなどが典型例である。なお、ほぼ同等とは絶対値で2割以内の誤差の意味である。
図56Cは、所定の要素と折り返し要素との絶対値の平均値を示す図である。図56B及び図56Cに示すように、各要素と、対応する平均値とが略同じになるように、変換係数を決定する。
なお、図56Dは、図56Bに示す非対角要素と図56Cに示す絶対平均値との差分を示す図である。本実施の形態では、図56Dに示す差分が小さくなるように、第2変換係数値を決定することができる。
また、第2変換係数には、特徴的な関係として、対象要素の符号(a(i,j))と折り返し要素a(j,i)との符号とは互いに異なっていることが多いという関係がある。例えば、図56Bに示すように、a12=48とa21=−58のペア、a13=64とa31=−57のペアなどが典型例である。
また、図56Eに示すような関係を満たすように、変換係数を決定することもできる。なお、図56Eは、上三角要素と下三角要素との間の符号の関係を示す図である。具体的には、上三角要素の符号は正であることが多く、下三角要素の符号は負であることが多いという関係である。
なお、変換係数にゼロを設定することで、乗算処理回数の削減と、変換係数を保持するメモリ量の削減とを実現できるが、本実施の形態で述べた特徴を持つ変換係数を基準として、絶対値が小さい変換係数をゼロに設定してもよい。言い換えると、第2変換部220は、行列表現した場合における少なくとも1つの非対角要素の値が0である変換係数を、第2変換係数として用いて第2変換を行ってもよい。同様に、第2逆変換部410は、行列表現した場合における少なくとも1つの非対角要素の値が0である逆変換係数を、第2逆変換係数として用いて第2逆変換を行ってもよい。
例えば、図56Bでは、a14=10、a24=10、a34=2、a41=−3、a42=−25、a43=−28をゼロに設定してもよい。非対角要素の少なくとも1つが0に設定された第2変換係数の例を、図56Fに示す。
以上のように、本発明の実施の形態3に係る符号化装置、符号化方法、復号装置及び復号方法によれば、特徴的な性質を有するように変換係数を決定するので、当該特徴的な性質を利用して変換係数を符号化又は復号することができ、符号化効率を高めることができる。
(実施の形態14)
本発明の実施の形態14に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態14に係る符号化装置及び符号化方法は、第2変換処理と量子化処理とを並列して行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態14に係る符号化装置及び符号化方法は、音声データ、静止画像データ、動画像データなど符号化対象となる信号を、複数種類の変換の組み合わせによって変換を行う変換部及び変換方法を備える。本発明の実施の形態14に係る符号化装置及び符号化方法は、第2変換処理と量子化処理とを並列して行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態14では、変換部110と量子化部120とは、一部の処理を並行して行うことで、処理時間を短縮する。図57Aは、本発明の実施の形態14に係る変換及び量子化のタイミングチャートの一例を示す図である。
図57Aに示す例では、変換入力信号の次元数nは8、第2変換への入力(第1部分信号)の次元数mは3である。第1変換処理T1の後、第2変換処理1401(T2(1)〜T2(3))を行う。この例では、第1部分信号に含まれる要素数は、3要素であるので、3単位時間かかるとする。なお、1単位時間は、例えば、1つの要素の第2変換処理に係る時間である。
そして、図57Aに示すように、1単位時間遅れて並行して、第2変換出力信号に対して、量子化処理1402(Q2(1)〜Q2(3))を行う。この後、第2部分信号に対して量子化処理1403(Q1(1)〜Q1(5))を行う。
以上のように、本発明の実施の形態14に係る符号化装置及び符号化方法では、第1部分信号のk+1(kは自然数)番目の要素の第2変換と、第2変換出力信号のk番目の要素の量子化とを、並列して行う。例えば、図57Aに示すように、第1部分信号の2番目の要素の第2変換(T2(2))と、第2変換出力信号の1番目の量子化(Q2(1))とが、同じ時間に並列して行われる。これにより、変換部における処理時間を短縮することができる。
なお、図57Aに示す例では、第2変換処理1401とこれに対する量子化処理1402を1単位時間の遅れのみで並列化できており、第2変換の導入による遅延は小さい。第2変換の1要素に対する処理は、m回の積和演算が必要であり、演算量が多い。したがって、この第2変換処理の処理時間を延ばし、演算回路の並列度を落とすことで、回路規模を抑えることができる。
具体的には、図57Bに示すように、第2変換処理1401とこれに対する量子化処理1402とを1単位時間の遅れで並列化する。ただし、第2変換処理1401の処理時間が延びているので、これに対する量子化処理1402には空き時間が発生している。この空き時間を利用して、第2部分信号に対する量子化処理1403を並行して行う。
例えば、図57Bに示すように、第1部分信号の1番目の要素に対する第2変換処理(T2(1))中に、第2部分信号の1番目の要素と2番目の要素とに対する量子化処理((Q2(1)、Q2(2))とを行う。これにより、回路規模を抑えつつ、処理時間の短縮を実現することができる。
以上のように、本発明の実施の形態14に係る符号化装置及び符号化方法により、変換処理の演算量と変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。特に、処理時間の増加量を軽減できる。
(実施の形態15)
本発明の実施の形態15に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(実施の形態14において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態15に係る復号装置及び復号方法は、第2逆変換処理と逆量子化処理とを並列して行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態15に係る復号装置及び復号方法は、音声データ、静止画像データ、動画像データなどの信号が符号化された符号化信号(実施の形態14において生成された符号化信号)を、複数種類の変換の組み合わせによって逆変換を行う逆変換部及び逆変換方法を備える。本発明の実施の形態15に係る復号装置及び復号方法は、第2逆変換処理と逆量子化処理とを並列して行うことを特徴とする。上述した実施の形態と同様の構成については同様の符号を付し、説明を省略する場合がある。
本発明の実施の形態15では、逆量子化部320と逆変換部330とは、一部の処理を並行して行うことで、処理時間を短縮する。図58Aは、本発明の実施の形態14に係る変換及び量子化のタイミングチャートの一例を示す図である。
図58Aに示す例では、復号量子化係数の次元数nは8、第2逆変換への入力(第2復号変換出力信号)の次元数mは3である。第2復号量子化係数の逆量子化処理1501(Q2(1)〜Q2(3))の後、第2変換出力信号の第2逆変換処理1502(T2(1)〜T2(3))、及び、第2復号部分信号の逆量子化処理1503(Q1(1)〜Q1(5))を行う。
以上のように、本発明の実施の形態15に係る復号装置及び復号方法では、第2復号変換出力信号のk(kは自然数)番目の要素の第2逆変換と、第2復号量子化係数のk番目の要素の逆量子化とを、並列して行う。例えば、図58Aに示すように、第2復号変換出力信号の1番目の要素の第2逆変換(T2(1))と、第2復号量子化係数の1番目の逆量子化(Q1(1))とが、同じ時間に並列して行われる。このように、第2逆変換処理1502と逆量子化処理1503とを並行して実行するので、逆量子化及び逆変換の全体の処理時間を短く抑えることができる。
なお、並列の構成は、上記の例には限られない。例えば、第2復号変換出力信号のk(kは自然数)番目の要素の第2逆変換と、第1復号量子化係数のk+1番目の要素の逆量子化とを、並列して行うこともできる。
また、逆変換処理の並列度を下げ、所要時間を延ばすことも可能である。図58Bに示すように、第2逆変換処理1502と逆量子化処理1503とを並行して実行する。具体的には、第2逆変換処理1502の空き時間に、第2復号量子化係数に対する逆量子化処理1503を並行して行う。
例えば、図58Bに示すように、第2復号変換出力信号の1番目の要素に対する第2変換処理(T2(1))中に、第2復号量子化係数の1番目の要素と2番目の要素とに対する量子化処理((Q2(1)、Q2(2))とを行う。これにより、回路規模を抑えつつ、処理時間の短縮を実現することができる。
以上のように、本発明の実施の形態15に係る復号装置及び復号方法により、変換処理の演算量と逆変換係数のデータ量とを抑えつつ、入力信号の統計的性質の変化に適応できる。特に、処理時間の増加量を軽減できる。
(実施の形態16)
上記各実施の形態で示した動画像符号化方法又は動画像復号方法の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
上記各実施の形態で示した動画像符号化方法又は動画像復号方法の構成を実現するためのプログラムを記憶メディアに記録することにより、上記各実施の形態で示した処理を独立したコンピュータシステムにおいて簡単に実施することが可能となる。記憶メディアは、磁気ディスク、光ディスク、光磁気ディスク、ICカード、半導体メモリ等、プログラムを記録できるものであればよい。
さらにここで、上記各実施の形態で示した動画像符号化方法や動画像復号方法の応用例とそれを用いたシステムを説明する。
図59は、コンテンツ配信サービスを実現するコンテンツ供給システムex100の全体構成を示す図である。通信サービスの提供エリアを所望の大きさに分割し、各セル内にそれぞれ固定無線局である基地局ex107〜ex110が設置されている。
このコンテンツ供給システムex100は、インターネットex101にインターネットサービスプロバイダex102及び電話網ex104、及び基地局ex107〜ex110を介して、コンピュータex111、PDA(Personal Digital Assistant)ex112、カメラex113、携帯電話ex114、ゲーム機ex115などの各機器が接続される。
しかし、コンテンツ供給システムex100は図59のような構成に限定されず、いずれかの要素を組み合わせて接続するようにしてもよい。また、固定無線局である基地局ex107〜ex110を介さずに、各機器が電話網ex104に直接接続されてもよい。また、各機器が近距離無線等を介して直接相互に接続されていてもよい。
カメラex113はデジタルビデオカメラ等の動画撮影が可能な機器であり、カメラex116はデジタルカメラ等の静止画撮影、動画撮影が可能な機器である。また、携帯電話ex114は、GSM(Global System for Mobile Communications)方式、CDMA(Code Division Multiple Access)方式、W−CDMA(Wideband−Code Division Multiple Access)方式、もしくはLTE(Long Term Evolution)方式、HSPA(High Speed Packet Access)の携帯電話機、又はPHS(Personal Handyphone System)等であり、いずれでも構わない。
コンテンツ供給システムex100では、カメラex113等が基地局ex109、電話網ex104を通じてストリーミングサーバex103に接続されることで、ライブ配信等が可能になる。ライブ配信では、ユーザがカメラex113を用いて撮影するコンテンツ(例えば、音楽ライブの映像等)に対して上記各実施の形態で説明したように符号化処理を行い、ストリーミングサーバex103に送信する。一方、ストリーミングサーバex103は要求のあったクライアントに対して送信されたコンテンツデータをストリーム配信する。クライアントとしては、上記符号化処理されたデータを復号することが可能な、コンピュータex111、PDAex112、カメラex113、携帯電話ex114、ゲーム機ex115等がある。配信されたデータを受信した各機器では、受信したデータを復号処理して再生する。
なお、撮影したデータの符号化処理はカメラex113で行っても、データの送信処理をするストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。同様に配信されたデータの復号処理はクライアントで行っても、ストリーミングサーバex103で行ってもよいし、互いに分担して行ってもよい。また、カメラex113に限らず、カメラex116で撮影した静止画像及び/又は動画像データを、コンピュータex111を介してストリーミングサーバex103に送信してもよい。この場合の符号化処理はカメラex116、コンピュータex111、ストリーミングサーバex103のいずれで行ってもよいし、互いに分担して行ってもよい。
また、これら符号化・復号処理は、一般的にコンピュータex111や各機器が有するLSIex500において処理する。LSIex500は、ワンチップであっても複数チップからなる構成であってもよい。なお、動画像符号化・復号用のソフトウェアをコンピュータex111等で読み取り可能な何らかの記録メディア(CD−ROM、フレキシブルディスク、ハードディスクなど)に組み込み、そのソフトウェアを用いて符号化・復号処理を行ってもよい。さらに、携帯電話ex114がカメラ付きである場合には、そのカメラで取得した動画データを送信してもよい。このときの動画データは携帯電話ex114が有するLSIex500で符号化処理されたデータである。
また、ストリーミングサーバex103は複数のサーバや複数のコンピュータであって、データを分散して処理したり記録したり配信するものであってもよい。
以上のようにして、コンテンツ供給システムex100では、符号化されたデータをクライアントが受信して再生することができる。このようにコンテンツ供給システムex100では、ユーザが送信した情報をリアルタイムでクライアントが受信して復号し、再生することができ、特別な権利や設備を有さないユーザでも個人放送を実現できる。
このコンテンツ供給システムを構成する各機器の符号化、復号には上記各実施の形態で示した画像符号化方法あるいは画像復号方法を用いるようにすればよい。
その一例として携帯電話ex114について説明する。
図60は、上記実施の形態で説明した画像符号化方法と画像復号方法を用いた携帯電話ex114を示す図である。携帯電話ex114は、基地局ex110との間で電波を送受信するためのアンテナex601、CCDカメラ等の映像、静止画を撮ることが可能なカメラ部ex603、カメラ部ex603で撮影した映像、アンテナex601で受信した映像等が復号されたデータを表示する液晶ディスプレイ等の表示部ex602、操作キーex604群から構成される本体部、音声出力をするためのスピーカ等の音声出力部ex608、音声入力をするためのマイク等の音声入力部ex605、撮影した動画もしくは静止画のデータ、受信したメールのデータ、動画のデータもしくは静止画のデータ等、符号化されたデータまたは復号されたデータを保存するための記録メディアex607、携帯電話ex114に記録メディアex607を装着可能とするためのスロット部ex606を有している。記録メディアex607はSDカード等のプラスチックケース内に電気的に書換えや消去が可能な不揮発性メモリであるEEPROM(Electrically Erasable and Programmable Read Only Memory)の一種であるフラッシュメモリ素子を格納したものである。
さらに、携帯電話ex114について図61を用いて説明する。携帯電話ex114は表示部ex602及び操作キーex604を備えた本体部の各部を統括的に制御するようになされた主制御部ex711に対して、電源回路部ex710、操作入力制御部ex704、画像符号化部ex712、カメラインターフェース部ex703、LCD(Liquid Crystal Display)制御部ex702、画像復号部ex709、多重分離部ex708、記録再生部ex707、変復調回路部ex706及び音声処理部ex705が同期バスex713を介して互いに接続されている。
電源回路部ex710は、ユーザの操作により終話及び電源キーがオン状態にされると、バッテリパックから各部に対して電力を供給することによりカメラ付デジタル携帯電話ex114を動作可能な状態に起動する。
携帯電話ex114は、CPU、ROM及びRAM等でなる主制御部ex711の制御に基づいて、音声通話モード時に音声入力部ex605で集音した音声信号を音声処理部ex705によってデジタル音声データに変換し、これを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex601を介して送信する。また携帯電話ex114は、音声通話モード時にアンテナex601で受信した受信データを増幅して周波数変換処理及びアナログデジタル変換処理を施し、変復調回路部ex706でスペクトラム逆拡散処理し、音声処理部ex705によってアナログ音声データに変換した後、これを音声出力部ex608を介して出力する。
さらに、データ通信モード時に電子メールを送信する場合、本体部の操作キーex604の操作によって入力された電子メールのテキストデータは操作入力制御部ex704を介して主制御部ex711に送出される。主制御部ex711は、テキストデータを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex601を介して基地局ex110へ送信する。
データ通信モード時に画像データを送信する場合、カメラ部ex603で撮像された画像データをカメラインターフェース部ex703を介して画像符号化部ex712に供給する。また、画像データを送信しない場合には、カメラ部ex603で撮像した画像データをカメラインターフェース部ex703及びLCD制御部ex702を介して表示部ex602に直接表示することも可能である。
画像符号化部ex712は、本願発明で説明した画像符号化装置を備えた構成であり、カメラ部ex603から供給された画像データを上記実施の形態で示した画像符号化装置に用いた符号化方法によって圧縮符号化することにより符号化画像データに変換し、これを多重分離部ex708に送出する。また、このとき同時に携帯電話ex114は、カメラ部ex603で撮像中に音声入力部ex605で集音した音声を音声処理部ex705を介してデジタルの音声データとして多重分離部ex708に送出する。
多重分離部ex708は、画像符号化部ex712から供給された符号化画像データと音声処理部ex705から供給された音声データとを所定の方式で多重化し、その結果得られる多重化データを変復調回路部ex706でスペクトラム拡散処理し、送受信回路部ex701でデジタルアナログ変換処理及び周波数変換処理を施した後にアンテナex601を介して送信する。
データ通信モード時にホームページ等にリンクされた動画像ファイルのデータを受信する場合、アンテナex601を介して基地局ex110から受信した受信データを変復調回路部ex706でスペクトラム逆拡散処理し、その結果得られる多重化データを多重分離部ex708に送出する。
また、アンテナex601を介して受信された多重化データを復号するには、多重分離部ex708は、多重化データを分離することにより画像データのビットストリームと音声データのビットストリームとに分け、同期バスex713を介して当該符号化画像データを画像復号部ex709に供給すると共に当該音声データを音声処理部ex705に供給する。
次に、画像復号部ex709は、本願発明で説明した画像復号装置を備えた構成であり、画像データのビットストリームを上記実施の形態で示した符号化方法に対応した復号方法で復号することにより再生動画像データを生成し、これをLCD制御部ex702を介して表示部ex602に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まれる動画データが表示される。このとき同時に音声処理部ex705は、音声データをアナログ音声データに変換した後、これを音声出力部ex608に供給し、これにより、例えばホームページにリンクされた動画像ファイルに含まる音声データが再生される。
なお、上記システムの例に限られず、最近は衛星、地上波によるデジタル放送が話題となっており、図62に示すようにデジタル放送用システムにも上記実施の形態の少なくとも画像符号化装置または画像復号装置のいずれかを組み込むことができる。具体的には、放送局ex201では音声データ、映像データ又はそれらのデータが多重化されたビットストリームが電波を介して通信または放送衛星ex202に伝送される。これを受けた放送衛星ex202は、放送用の電波を発信し、この電波を衛星放送受信設備をもつ家庭のアンテナex204で受信し、テレビ(受信機)ex300またはセットトップボックス(STB)ex217などの装置によりビットストリームを復号してこれを再生する。また、記録媒体であるCDやDVD等の蓄積メディアex215、216に記録した画像データと、音声データが多重化されたビットストリームを読み取り、復号するリーダ/レコーダex218にも上記実施の形態で示した画像復号装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示される。また、ケーブルテレビ用のケーブルex203または衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に画像復号装置を実装し、これをテレビのモニタex219で再生する構成も考えられる。このときセットトップボックスではなく、テレビ内に画像復号装置を組み込んでも良い。また、アンテナex205を有する車ex210で衛星ex202からまたは基地局等から信号を受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。
また、DVD、BD等の記録メディアex215に記録した音声データ、映像データ又はそれらのデータが多重化された符号化ビットストリームを読み取り復号する、又は記録メディアex215に音声データ、映像データ又はそれらのデータを符号化し、多重化データとして記録するリーダ/レコーダex218にも上記各実施の形態で示した動画像復号装置又は動画像符号化装置を実装することが可能である。この場合、再生された映像信号はモニタex219に表示され、符号化ビットストリームが記録された記録メディアex215により他の装置やシステムにおいて映像信号を再生することができる。また、ケーブルテレビ用のケーブルex203又は衛星/地上波放送のアンテナex204に接続されたセットトップボックスex217内に動画像復号装置を実装し、これをテレビのモニタex219で表示してもよい。このときセットトップボックスではなく、テレビ内に動画像復号装置を組み込んでもよい。
図63は、上記各実施の形態で説明した動画像復号方法及び動画像符号化方法を用いたテレビ(受信機)ex300を示す図である。テレビex300は、上記放送を受信するアンテナex204又はケーブルex203等を介して映像情報のビットストリームを取得、又は出力するチューナex301と、受信した符号化データを復調する、又は外部に送信する符号化データに変調する変調/復調部ex302と、復調した映像データ、音声データを分離する、又は符号化された映像データ、音声データを多重化する多重/分離部ex303を備える。また、テレビex300は、音声データ、映像データそれぞれを復号する、又はそれぞれの情報を符号化する音声信号処理部ex304、映像信号処理部ex305を有する信号処理部ex306と、復号した音声信号を出力するスピーカex307、復号した映像信号を表示するディスプレイ等の表示部ex308を有する出力部ex309とを有する。さらに、テレビex300は、ユーザ操作の入力を受け付ける操作入力部ex312等を有するインターフェース部ex317を有する。さらに、テレビex300は、各部を統括的に制御する制御部ex310、各部に電力を供給する電源回路部ex311を有する。インターフェース部ex317は、操作入力部ex312以外に、リーダ/レコーダex218等の外部機器と接続されるブリッジex313、SDカード等の記録メディアex216を装着可能とするためのスロット部ex314、ハードディスク等の外部記録メディアと接続するためのドライバex315、電話網と接続するモデムex316等を有していてもよい。なお記録メディアex216は、格納する不揮発性/揮発性の半導体メモリ素子により電気的に情報の記録を可能としたものである。テレビex300の各部は同期バスを介して互いに接続されている。
まず、テレビex300がアンテナex204等により外部から取得したデータを復号し、再生する構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、CPU等を有する制御部ex310の制御に基づいて、変調/復調部ex302で復調した映像データ、音声データを多重/分離部ex303で分離する。さらにテレビex300は、分離した音声データを音声信号処理部ex304で復号し、分離した映像データを映像信号処理部ex305で上記各実施の形態で説明した復号方法を用いて復号する。復号した音声信号、映像信号は、それぞれ出力部ex309から外部に向けて出力される。出力する際には、音声信号と映像信号が同期して再生するよう、バッファex318、ex319等に一旦これらの信号を蓄積するとよい。また、テレビex300は、放送等からではなく、磁気/光ディスク、SDカード等の記録メディアex215、ex216から符号化された符号化ビットストリームを読み出してもよい。次に、テレビex300が音声信号や映像信号を符号化し、外部に送信又は記録メディア等に書き込む構成について説明する。テレビex300は、リモートコントローラex220等からのユーザ操作を受け、制御部ex310の制御に基づいて、音声信号処理部ex304で音声信号を符号化し、映像信号処理部ex305で映像信号を上記各実施の形態で説明した符号化方法を用いて符号化する。符号化した音声信号、映像信号は多重/分離部ex303で多重化され外部に出力される。多重化する際には、音声信号と映像信号が同期するように、バッファex320、ex321等に一旦これらの信号を蓄積するとよい。なお、バッファex318〜ex321は図示しているように複数備えていてもよいし、一つ以上のバッファを共有する構成であってもよい。さらに、図示している以外に、例えば変調/復調部ex302や多重/分離部ex303の間等でもシステムのオーバフロー、アンダーフローを避ける緩衝材としてバッファにデータを蓄積することとしてもよい。
また、テレビex300は、放送等や記録メディア等から音声データ、映像データを取得する以外に、マイクやカメラのAV入力を受け付ける構成を備え、それらから取得したデータに対して符号化処理を行ってもよい。なお、ここではテレビex300は上記の符号化処理、多重化、及び外部出力ができる構成として説明したが、これらの処理を行うことはできず、上記受信、復号処理、外部出力のみが可能な構成であってもよい。
また、リーダ/レコーダex218で記録メディアから符号化ビットストリームを読み出す、又は書き込む場合には、上記復号処理又は符号化処理はテレビex300、リーダ/レコーダex218のいずれで行ってもよいし、テレビex300とリーダ/レコーダex218が互いに分担して行ってもよい。
一例として、光ディスクからデータの読み込み又は書き込みをする場合の情報再生/記録部ex400の構成を図64に示す。情報再生/記録部ex400は、以下に説明する要素ex401〜ex407を備える。光ヘッドex401は、光ディスクである記録メディアex215の記録面にレーザスポットを照射して情報を書き込み、記録メディアex215の記録面からの反射光を検出して情報を読み込む。変調記録部ex402は、光ヘッドex401に内蔵された半導体レーザを電気的に駆動し記録データに応じてレーザ光の変調を行う。再生復調部ex403は、光ヘッドex401に内蔵されたフォトディテクタにより記録面からの反射光を電気的に検出した再生信号を増幅し、記録メディアex215に記録された信号成分を分離して復調し、必要な情報を再生する。バッファex404は、記録メディアex215に記録するための情報及び記録メディアex215から再生した情報を一時的に保持する。ディスクモータex405は記録メディアex215を回転させる。サーボ制御部ex406は、ディスクモータex405の回転駆動を制御しながら光ヘッドex401を所定の情報トラックに移動させ、レーザスポットの追従処理を行う。システム制御部ex407は、情報再生/記録部ex400全体の制御を行う。上記の読み出しや書き込みの処理はシステム制御部ex407が、バッファex404に保持された各種情報を利用し、また必要に応じて新たな情報の生成・追加を行うと共に、変調記録部ex402、再生復調部ex403、サーボ制御部ex406を協調動作させながら、光ヘッドex401を通して、情報の記録再生を行うことにより実現される。システム制御部ex407は例えばマイクロプロセッサで構成され、読み出し書き込みのプログラムを実行することでそれらの処理を実行する。
以上では、光ヘッドex401はレーザスポットを照射するとして説明したが、近接場光を用いてより高密度な記録を行う構成であってもよい。
図65に光ディスクである記録メディアex215の模式図を示す。記録メディアex215の記録面には案内溝(グルーブ)がスパイラル状に形成され、情報トラックex230には、あらかじめグルーブの形状の変化によってディスク上の絶対位置を示す番地情報が記録されている。この番地情報はデータを記録する単位である記録ブロックex231の位置を特定するための情報を含み、記録や再生を行う装置において情報トラックex230を再生し番地情報を読み取ることで記録ブロックを特定することができる。また、記録メディアex215は、データ記録領域ex233、内周領域ex232、外周領域ex234を含んでいる。ユーザデータを記録するために用いる領域がデータ記録領域ex233であり、データ記録領域ex233より内周又は外周に配置されている内周領域ex232と外周領域ex234は、ユーザデータの記録以外の特定用途に用いられる。情報再生/記録部ex400は、このような記録メディアex215のデータ記録領域ex233に対して、符号化された音声データ、映像データ又はそれらのデータを多重化した符号化データの読み書きを行う。
以上では、1層のDVD、BD等の光ディスクを例に挙げ説明したが、これらに限ったものではなく、多層構造であって表面以外にも記録可能な光ディスクであってもよい。また、ディスクの同じ場所にさまざまな異なる波長の色の光を用いて情報を記録したり、さまざまな角度から異なる情報の層を記録したりなど、多次元的な記録/再生を行う構造の光ディスクであってもよい。
また、デジタル放送用システムex200において、アンテナex205を有する車ex210で衛星ex202等からデータを受信し、車ex210が有するカーナビゲーションex211等の表示装置に動画を再生することも可能である。なお、カーナビゲーションex211の構成は例えば図63に示す構成のうち、GPS受信部を加えた構成が考えられ、同様なことがコンピュータex111や携帯電話ex114等でも考えられる。また、上記携帯電話ex114等の端末は、テレビex300と同様に、符号化器・復号器を両方持つ送受信型端末の他に、符号化器のみの送信端末、復号器のみの受信端末という3通りの実装形式が考えられる。
このように、上記各実施の形態で示した動画像符号化方法あるいは動画像復号方法を上述したいずれの機器・システムに用いることは可能であり、そうすることで、上記各実施の形態で説明した効果を得ることができる。
また、本発明は係る上記実施形態に限定されるものではなく、本発明の範囲を逸脱することなく種々の変形又は修正が可能である。
(実施の形態17)
上記各実施の形態で示した動画像符号化方法及び装置、動画像復号方法及び装置は、典型的には集積回路であるLSIで実現される。一例として、図66に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501〜ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
上記各実施の形態で示した動画像符号化方法及び装置、動画像復号方法及び装置は、典型的には集積回路であるLSIで実現される。一例として、図66に1チップ化されたLSIex500の構成を示す。LSIex500は、以下に説明する要素ex501〜ex509を備え、各要素はバスex510を介して接続している。電源回路部ex505は電源がオン状態の場合に各部に対して電力を供給することで動作可能な状態に起動する。
例えば符号化処理を行う場合には、LSIex500は、CPUex502、メモリコントローラex503、ストリームコントローラex504等を有する制御部ex501の制御に基づいて、AV I/Oex509によりマイクex117やカメラex113等からAV信号を入力する。入力されたAV信号は、一旦SDRAM等の外部のメモリex511に蓄積される。制御部ex501の制御に基づいて、蓄積したデータは処理量や処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られ、信号処理部ex507において音声信号の符号化及び/又は映像信号の符号化が行われる。ここで映像信号の符号化処理は上記各実施の形態で説明した符号化処理である。信号処理部ex507ではさらに、場合により符号化された音声データと符号化された映像データを多重化するなどの処理を行い、ストリームI/Oex506から外部に出力する。この出力されたビットストリームは、基地局ex107に向けて送信されたり、又は記録メディアex215に書き込まれたりする。なお、多重化する際には同期するよう、一旦バッファex508にデータを蓄積するとよい。
また、例えば復号処理を行う場合には、LSIex500は、制御部ex501の制御に基づいて、ストリームI/Oex506によって基地局ex107を介して、又は記録メディアex215から読み出して得た符号化データを一旦メモリex511等に蓄積する。制御部ex501の制御に基づいて、蓄積したデータは処理量や処理速度に応じて適宜複数回に分けるなどされ信号処理部ex507に送られ、信号処理部ex507において音声データの復号及び/又は映像データの復号が行われる。ここで映像信号の復号処理は上記各実施の形態で説明した復号処理である。さらに、場合により復号された音声信号と復号された映像信号を同期して再生できるようそれぞれの信号を一旦バッファex508等に蓄積するとよい。復号された出力信号はメモリex511等を適宜介しながら、携帯電話ex114、ゲーム機ex115、テレビex300等の各出力部から出力される。
なお、上記では、メモリex511がLSIex500の外部の構成として説明したが、LSIex500の内部に含まれる構成であってもよい。バッファex508も一つに限ったものではなく、複数のバッファを備えていてもよい。また、LSIex500は1チップ化されてもよいし、複数チップ化されてもよい。
なお、ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
以上、本発明に係る符号化方法、符号化装置、復号方法及び復号装置について、実施の形態に基づいて説明したが、本発明は、これらの実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を当該実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の範囲内に含まれる。
本発明は、符号化処理における演算量の増加、及び、変換係数のデータ量の増加を抑制することができるという効果を奏し、オーディオ、静止画像、及び動画像を符号化する符号化装置、及び、当該符号化装置によって符号化されたデータを復号する復号装置に利用することができる。例えば、本発明は、オーディオ機器、携帯電話、デジタルカメラ、BDレコーダ、デジタルテレビなどの各種AV機器に利用することができる。
100、100a、500、500a、500c、500d、1200、1600 符号化装置
110、110a、510、510a、510b、510c、510d、810、810a、810b、1210、1610 変換部
120、1220、1620 量子化部
130、1230、1630 エントロピー符号化部
200、900 第1変換部
202 第1変換係数導出部
210、400 分割部
220、220a 第2変換部
222、222c 第2変換係数導出部
230、420 統合部
300、300a、700、700a、700b、1300 復号装置
310、1310 エントロピー復号部
320、540、1240、1320 逆量子化部
330、330a、550、730、1030、1030a、1030b、1250、1330 逆変換部
410、410a 第2逆変換部
430、1130 第1逆変換部
505 減算器
560、750 加算器
570、624、760、781、782 メモリ
580、770 予測部
585 予測制御部
590、740 制御部
601 第1メモリ
611 第2メモリ
612 分割統合情報算出部
621 第3メモリ
623、623c、623d 局所集合判定部
790 選択信号決定部
940、941、942、1140、1141、1142 ノルム補正部
1401 第2変換処理
1402、1403 量子化処理
1501、1503 逆量子化処理
1502 第2逆変換処理
ex100 コンテンツ供給システム
ex101 インターネット
ex102 インターネットサービスプロバイダ
ex103 ストリーミングサーバ
ex104 電話網
ex106、ex107、ex108、ex109、ex110 基地局
ex111 コンピュータ
ex112 PDA
ex113、ex116 カメラ
ex114 カメラ付デジタル携帯電話(携帯電話)
ex115 ゲーム機
ex117 マイク
ex200 デジタル放送用システム
ex201 放送局
ex202 放送衛星(衛星)
ex203 ケーブル
ex204、ex205、ex601 アンテナ
ex210 車
ex211 カーナビゲーション(カーナビ)
ex212 再生装置
ex213、ex219 モニタ
ex214、ex215、ex216、ex607 記録メディア
ex217 セットトップボックス(STB)
ex218 リーダ/レコーダ
ex220 リモートコントローラ
ex230 情報トラック
ex231 記録ブロック
ex232 内周領域
ex233 データ記録領域
ex234 外周領域
ex300 テレビ
ex301 チューナ
ex302 変調/復調部
ex303 多重/分離部
ex304 音声信号処理部
ex305 映像信号処理部
ex306、ex507 信号処理部
ex307 スピーカ
ex308、ex602 表示部
ex309 出力部
ex310、ex501 制御部
ex311、ex505、ex710 電源回路部
ex312 操作入力部
ex313 ブリッジ
ex314、ex606 スロット部
ex315 ドライバ
ex316 モデム
ex317 インタフェース部
ex318、ex319、ex320、ex321、ex404、ex508 バッファ
ex400 情報再生/記録部
ex401 光ヘッド
ex402 変調記録部
ex403 再生復調部
ex405 ディスクモータ
ex406 サーボ制御部
ex407 システム制御部
ex500 LSI
ex502 CPU
ex503 メモリコントローラ
ex504 ストリームコントローラ
ex506 ストリームI/O
ex509 AV I/O
ex510 バス
ex511 メモリ
ex603 カメラ部
ex604 操作キー
ex605 音声入力部
ex608 音声出力部
ex701 送受信回路部
ex702 LCD制御部
ex703 カメラインターフェース部(カメラI/F部)
ex704 操作入力制御部
ex705 音声処理部
ex706 変復調回路部
ex707 記録再生部
ex708 多重分離部
ex709 画像復号部
ex711 主制御部
ex712 画像符号化部
ex713 同期バス
110、110a、510、510a、510b、510c、510d、810、810a、810b、1210、1610 変換部
120、1220、1620 量子化部
130、1230、1630 エントロピー符号化部
200、900 第1変換部
202 第1変換係数導出部
210、400 分割部
220、220a 第2変換部
222、222c 第2変換係数導出部
230、420 統合部
300、300a、700、700a、700b、1300 復号装置
310、1310 エントロピー復号部
320、540、1240、1320 逆量子化部
330、330a、550、730、1030、1030a、1030b、1250、1330 逆変換部
410、410a 第2逆変換部
430、1130 第1逆変換部
505 減算器
560、750 加算器
570、624、760、781、782 メモリ
580、770 予測部
585 予測制御部
590、740 制御部
601 第1メモリ
611 第2メモリ
612 分割統合情報算出部
621 第3メモリ
623、623c、623d 局所集合判定部
790 選択信号決定部
940、941、942、1140、1141、1142 ノルム補正部
1401 第2変換処理
1402、1403 量子化処理
1501、1503 逆量子化処理
1502 第2逆変換処理
ex100 コンテンツ供給システム
ex101 インターネット
ex102 インターネットサービスプロバイダ
ex103 ストリーミングサーバ
ex104 電話網
ex106、ex107、ex108、ex109、ex110 基地局
ex111 コンピュータ
ex112 PDA
ex113、ex116 カメラ
ex114 カメラ付デジタル携帯電話(携帯電話)
ex115 ゲーム機
ex117 マイク
ex200 デジタル放送用システム
ex201 放送局
ex202 放送衛星(衛星)
ex203 ケーブル
ex204、ex205、ex601 アンテナ
ex210 車
ex211 カーナビゲーション(カーナビ)
ex212 再生装置
ex213、ex219 モニタ
ex214、ex215、ex216、ex607 記録メディア
ex217 セットトップボックス(STB)
ex218 リーダ/レコーダ
ex220 リモートコントローラ
ex230 情報トラック
ex231 記録ブロック
ex232 内周領域
ex233 データ記録領域
ex234 外周領域
ex300 テレビ
ex301 チューナ
ex302 変調/復調部
ex303 多重/分離部
ex304 音声信号処理部
ex305 映像信号処理部
ex306、ex507 信号処理部
ex307 スピーカ
ex308、ex602 表示部
ex309 出力部
ex310、ex501 制御部
ex311、ex505、ex710 電源回路部
ex312 操作入力部
ex313 ブリッジ
ex314、ex606 スロット部
ex315 ドライバ
ex316 モデム
ex317 インタフェース部
ex318、ex319、ex320、ex321、ex404、ex508 バッファ
ex400 情報再生/記録部
ex401 光ヘッド
ex402 変調記録部
ex403 再生復調部
ex405 ディスクモータ
ex406 サーボ制御部
ex407 システム制御部
ex500 LSI
ex502 CPU
ex503 メモリコントローラ
ex504 ストリームコントローラ
ex506 ストリームI/O
ex509 AV I/O
ex510 バス
ex511 メモリ
ex603 カメラ部
ex604 操作キー
ex605 音声入力部
ex608 音声出力部
ex701 送受信回路部
ex702 LCD制御部
ex703 カメラインターフェース部(カメラI/F部)
ex704 操作入力制御部
ex705 音声処理部
ex706 変復調回路部
ex707 記録再生部
ex708 多重分離部
ex709 画像復号部
ex711 主制御部
ex712 画像符号化部
ex713 同期バス
Claims (20)
- 入力信号を変換することで、変換出力信号を生成する変換ステップと、
前記変換出力信号を量子化することで、量子化係数を生成する量子化ステップと、
前記量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化ステップとを含み、
前記変換ステップは、
第1変換係数を用いて前記入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換ステップと、
前記第1変換出力信号の一部である第1部分信号に、第2変換係数を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、前記第1変換出力信号のうち前記第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を生成する第2変換ステップと、
前記第1変換出力信号に対して補正を行う補正ステップとを含む
符号化方法。 - 前記第1変換ステップでは、予め定められた係数を、前記第1変換係数として用いて前記第1変換を行う
請求項1記載の符号化方法。 - 前記補正ステップでは、前記第1変換係数に基づいて決定される補正パラメータを用いて前記第1変換出力信号を正規化することで、前記第1変換出力信号を補正する
請求項1又は2記載の符号化方法。 - 前記補正ステップでは、前記量子化ステップにおいて用いられる量子化マトリクスのウェイトスケールを用いて前記第1変換出力信号を重み付けすることで、前記第1変換出力信号を補正する
請求項1又は2記載の符号化方法。 - 前記補正ステップでは、前記第1部分信号と前記第2部分信号とを、それぞれ別々に補正する
請求項1〜4のいずれか1項に記載の符号化方法。 - 前記補正ステップでは、前記第2変換における有効データ長が所定の値以下に収まるように、前記第1部分信号を構成する係数値をシフトダウンすることで、前記第1変換出力信号を補正する
請求項1〜3のいずれか1項に記載の符号化方法。 - 前記補正ステップでは、さらに、前記第1部分信号又は前記第2変換出力信号を構成する係数値のビット長が、前記第2部分信号を構成する係数値のビット長と同じになるように、前記第1部分信号又は前記第2変換出力信号を構成する係数値をシフトダウンする
請求項1〜6のいずれか1項に記載の符号化方法。 - 符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号ステップと、
前記復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化ステップと、
前記復号変換出力信号を逆変換することで、復号信号を生成する逆変換ステップとを含み、
前記逆変換ステップは、
第2逆変換係数を用いて、前記復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換ステップと、
前記第1復号部分信号と、前記復号変換出力信号のうち前記第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数を用いて第1逆変換を行うことで、前記復号信号を生成する第1逆変換ステップと、
前記第1復号部分信号に対して補正を行う補正ステップとを含む
復号方法。 - 前記第1逆変換ステップでは、予め定められた係数を、前記第1逆変換係数として用いて前記第1逆変換を行う
請求項8記載の復号方法。 - 前記補正ステップでは、前記第1逆変換係数に基づいて決定される補正パラメータを用いて前記第1復号変換出力信号を正規化することで、前記第1復号変換出力信号を補正する
請求項8又は9記載の復号方法。 - 前記補正ステップでは、さらに、前記逆量子化ステップにおいて用いられる量子化マトリクスのウェイトスケールを用いて前記第1復号部分信号を重み付けすることで、前記第1復号変換出力信号を補正する
請求項8又は9記載の復号方法。 - 前記補正ステップでは、前記第1復号部分信号と前記第2復号部分信号とをそれぞれ別々に補正する
請求項8〜11のいずれか1項に記載の復号方法。 - 前記補正ステップでは、前記第2逆変換における有効データ長が所定の値以下に収まるように、前記第2復号変換出力信号を構成する係数値をシフトダウンすることで、前記第1復号変換出力信号を補正する
請求項8〜10のいずれか1項に記載の復号方法。 - 前記補正ステップでは、さらに、前記第1復号部分信号又は前記第2復号変換出力信号を構成する係数値のビット長が、前記第2復号部分信号を構成する係数値のビット長と同じになるように、前記第1復号部分信号又は前記第2復号変換出力信号を構成する係数値をシフトダウンする
請求項8〜13のいずれか1項に記載の復号方法。 - 入力信号を変換することで、変換出力信号を生成する変換部と、
前記変換出力信号を量子化することで、量子化係数を生成する量子化部と、
前記量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化部とを備え、
前記変換部は、
第1変換係数を用いて前記入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換部と、
前記第1変換出力信号の一部である第1部分信号に、第2変換係数を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、前記第1変換出力信号のうち前記第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を生成する第2変換部と、
前記第1変換出力信号に対して補正を行う補正部とを備える
符号化装置。 - 符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号部と、
前記復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化部と、
前記復号変換出力信号を逆変換することで、復号信号を生成する逆変換部とを備え、
前記逆変換部は、
第2逆変換係数を用いて、前記復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換部と、
前記第1復号部分信号と、前記復号変換出力信号のうち前記第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数を用いて第1逆変換を行うことで、前記復号信号を生成する第1逆変換部と、
前記第1復号部分信号に対して補正を行う補正部とを備える
復号装置。 - 入力信号を変換することで、変換出力信号を生成する変換部と、
前記変換出力信号を量子化することで、量子化係数を生成する量子化部と、
前記量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化部とを備え、
前記変換部は、
第1変換係数を用いて前記入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換部と、
前記第1変換出力信号の一部である第1部分信号に、第2変換係数を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、前記第1変換出力信号のうち前記第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を生成する第2変換部と、
前記第1変換出力信号に対して補正を行う補正部とを備える
集積回路。 - 符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号部と、
前記復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化部と、
前記復号変換出力信号を逆変換することで、復号信号を生成する逆変換部とを備え、
前記逆変換部は、
第2逆変換係数を用いて、前記復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換部と、
前記第1復号部分信号と、前記復号変換出力信号のうち前記第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数を用いて第1逆変換を行うことで、前記復号信号を生成する第1逆変換部と、
前記第1復号部分信号に対して補正を行う補正部とを備える
集積回路。 - 入力信号を変換することで、変換出力信号を生成する変換ステップと、
前記変換出力信号を量子化することで、量子化係数を生成する量子化ステップと、
前記量子化係数をエントロピー符号化することで、符号化信号を生成するエントロピー符号化ステップとを含み、
前記変換ステップは、
第1変換係数を用いて前記入力信号に第1変換を行うことで、第1変換出力信号を生成する第1変換ステップと、
前記第1変換出力信号の一部である第1部分信号に、第2変換係数を用いて第2変換を行うことで、第2変換出力信号を生成し、生成した第2変換出力信号と、前記第1変換出力信号のうち前記第1部分信号以外の部分である第2部分信号とを含む前記変換出力信号を生成する第2変換ステップと、
前記第1変換出力信号に対して補正を行う補正ステップとを含む
符号化方法をコンピュータに実行させるためのプログラム。 - 符号化信号をエントロピー復号することで、復号量子化係数を生成するエントロピー復号ステップと、
前記復号量子化係数を逆量子化することで、復号変換出力信号を生成する逆量子化ステップと、
前記復号変換出力信号を逆変換することで、復号信号を生成する逆変換ステップとを含み、
前記逆変換ステップは、
第2逆変換係数を用いて、前記復号変換出力信号の一部である第2復号変換出力信号に第2逆変換を行うことで、第1復号部分信号を生成する第2逆変換ステップと、
前記第1復号部分信号と、前記復号変換出力信号のうち前記第2復号変換出力信号以外の部分である第2復号部分信号とを含む第1復号変換出力信号に、第1逆変換係数を用いて第1逆変換を行うことで、前記復号信号を生成する第1逆変換ステップと、
前記第1復号部分信号に対して補正を行う補正ステップとを含む
復号方法をコンピュータに実行させるためのプログラム。
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009183791 | 2009-08-06 | ||
JP2009183791 | 2009-08-06 | ||
JP2009192618 | 2009-08-21 | ||
JP2009192627 | 2009-08-21 | ||
JP2009192627 | 2009-08-21 | ||
JP2009192618 | 2009-08-21 | ||
US32940610P | 2010-04-29 | 2010-04-29 | |
US61/329,406 | 2010-04-29 | ||
US34570310P | 2010-05-18 | 2010-05-18 | |
US61/345,703 | 2010-05-18 | ||
US36458010P | 2010-07-15 | 2010-07-15 | |
US61/364,580 | 2010-07-15 | ||
PCT/JP2010/004951 WO2011016248A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2011016248A1 true JPWO2011016248A1 (ja) | 2013-01-10 |
Family
ID=43544155
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011525799A Pending JPWO2011016248A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
JP2011525798A Pending JPWO2011016247A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
JP2011525800A Pending JPWO2011016249A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
JP2011525797A Pending JPWO2011016246A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
Family Applications After (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011525798A Pending JPWO2011016247A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
JP2011525800A Pending JPWO2011016249A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
JP2011525797A Pending JPWO2011016246A1 (ja) | 2009-08-06 | 2010-08-06 | 符号化方法、復号方法、符号化装置及び復号装置 |
Country Status (7)
Country | Link |
---|---|
US (4) | US20120134408A1 (ja) |
EP (4) | EP2464016A4 (ja) |
JP (4) | JPWO2011016248A1 (ja) |
KR (4) | KR20120046727A (ja) |
CN (4) | CN102474269A (ja) |
TW (4) | TW201132129A (ja) |
WO (4) | WO2011016248A1 (ja) |
Families Citing this family (71)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8638863B1 (en) * | 2010-05-18 | 2014-01-28 | Google Inc. | Apparatus and method for filtering video using extended edge-detection |
US8913666B2 (en) | 2010-10-01 | 2014-12-16 | Qualcomm Incorporated | Entropy coding coefficients using a joint context model |
US9210442B2 (en) | 2011-01-12 | 2015-12-08 | Google Technology Holdings LLC | Efficient transform unit representation |
US9380319B2 (en) | 2011-02-04 | 2016-06-28 | Google Technology Holdings LLC | Implicit transform unit representation |
US20130003856A1 (en) * | 2011-07-01 | 2013-01-03 | Samsung Electronics Co. Ltd. | Mode-dependent transforms for residual coding with low latency |
PL3346708T3 (pl) * | 2012-04-16 | 2021-03-08 | Electronics And Telecommunications Research Institute | Sposób kodowania obrazu |
WO2013187060A1 (ja) * | 2012-06-12 | 2013-12-19 | パナソニック株式会社 | 動画像符号化方法、動画像復号化方法、動画像符号化装置および動画像復号化装置 |
US10154258B2 (en) | 2012-07-09 | 2018-12-11 | Vid Scale, Inc. | Power aware video decoding and streaming |
JP6210368B2 (ja) * | 2012-09-18 | 2017-10-11 | サン パテント トラスト | 画像復号方法および画像復号装置 |
WO2014078068A1 (en) | 2012-11-13 | 2014-05-22 | Intel Corporation | Content adaptive transform coding for next generation video |
JP2014123865A (ja) * | 2012-12-21 | 2014-07-03 | Xacti Corp | 画像処理装置及び撮像装置 |
JP6157114B2 (ja) | 2012-12-28 | 2017-07-05 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
US9219915B1 (en) | 2013-01-17 | 2015-12-22 | Google Inc. | Selection of transform size in video coding |
EP2952003B1 (en) | 2013-01-30 | 2019-07-17 | Intel Corporation | Content adaptive partitioning for prediction and coding for next generation video |
US9544597B1 (en) | 2013-02-11 | 2017-01-10 | Google Inc. | Hybrid transform in video encoding and decoding |
US9967559B1 (en) | 2013-02-11 | 2018-05-08 | Google Llc | Motion vector dependent spatial transformation in video coding |
US9674530B1 (en) | 2013-04-30 | 2017-06-06 | Google Inc. | Hybrid transforms in video coding |
US9554152B2 (en) * | 2013-07-12 | 2017-01-24 | Qualcomm Incorporated | Concurrent processing of horizontal and vertical transforms |
US9154782B2 (en) | 2013-09-16 | 2015-10-06 | Magnum Semiconductor, Inc. | Apparatuses and methods for adjusting coefficients using dead zones |
KR101789954B1 (ko) * | 2013-12-27 | 2017-10-25 | 인텔 코포레이션 | 차세대 비디오 코딩을 위한 콘텐츠 적응적 이득 보상된 예측 |
US9516345B2 (en) | 2014-03-17 | 2016-12-06 | Qualcomm Incorporated | Systems and methods for low complexity forward transforms using mesh-based calculations |
US9432696B2 (en) | 2014-03-17 | 2016-08-30 | Qualcomm Incorporated | Systems and methods for low complexity forward transforms using zeroed-out coefficients |
US10095123B2 (en) * | 2014-04-04 | 2018-10-09 | Asml Netherlands B.V. | Control system, positioning system, lithographic apparatus, control method, device manufacturing method and control program |
TWI551124B (zh) * | 2014-07-11 | 2016-09-21 | 晨星半導體股份有限公司 | 應用於視訊系統之編碼/解碼方法及編碼/解碼裝置 |
CN105516730B (zh) * | 2014-09-24 | 2018-04-24 | 晨星半导体股份有限公司 | 视讯编码装置及视讯解码装置以及其编码与解码方法 |
US9565451B1 (en) | 2014-10-31 | 2017-02-07 | Google Inc. | Prediction dependent transform coding |
US9769499B2 (en) | 2015-08-11 | 2017-09-19 | Google Inc. | Super-transform video coding |
EP3340632B1 (en) * | 2015-08-19 | 2021-08-11 | LG Electronics Inc. | Method and device for processing video signals |
WO2017039501A1 (en) * | 2015-09-01 | 2017-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Spatial improvement of transform blocks |
US10277905B2 (en) | 2015-09-14 | 2019-04-30 | Google Llc | Transform selection for non-baseband signal coding |
US10164655B2 (en) * | 2015-09-25 | 2018-12-25 | Western Digital Technologies, Inc. | Cache oblivious algorithm for butterfly code |
US10681379B2 (en) | 2015-09-29 | 2020-06-09 | Qualcomm Incorporated | Non-separable secondary transform for video coding with reorganizing |
US9807423B1 (en) | 2015-11-24 | 2017-10-31 | Google Inc. | Hybrid transform scheme for video coding |
EP3723085B1 (en) * | 2016-03-21 | 2022-11-16 | Huawei Technologies Co., Ltd. | Adaptive quantization of weighted matrix coefficients |
US10623774B2 (en) | 2016-03-22 | 2020-04-14 | Qualcomm Incorporated | Constrained block-level optimization and signaling for video coding tools |
FR3050598B1 (fr) * | 2016-04-26 | 2020-11-06 | Bcom | Procede de decodage d'une image numerique, procede de codage, dispositifs, et programmes d'ordinateurs associes |
JP6868786B2 (ja) * | 2016-05-13 | 2021-05-12 | ソニーグループ株式会社 | 画像処理装置および方法 |
US10595046B2 (en) * | 2016-05-13 | 2020-03-17 | Sony Corporation | Image processing apparatus and method |
WO2018037737A1 (ja) | 2016-08-24 | 2018-03-01 | ソニー株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US11095893B2 (en) | 2016-10-12 | 2021-08-17 | Qualcomm Incorporated | Primary transform and secondary transform in video coding |
EP3349451A1 (en) * | 2017-01-11 | 2018-07-18 | Thomson Licensing | Method and apparatus for selecting a coding mode used for encoding/decoding a residual block |
EP4007277A1 (en) * | 2017-03-16 | 2022-06-01 | HFI Innovation Inc. | Method and apparatus of enhanced multiple transforms and non-separable secondary transform for video coding |
AU2018239635A1 (en) * | 2017-03-21 | 2019-10-17 | Lg Electronics Inc. | Transform method in image coding system and apparatus for same |
US10855997B2 (en) * | 2017-04-14 | 2020-12-01 | Mediatek Inc. | Secondary transform kernel size selection |
JP2020109884A (ja) * | 2017-04-28 | 2020-07-16 | シャープ株式会社 | 動画像符号化装置及び動画像復号装置 |
US10979736B2 (en) | 2017-06-08 | 2021-04-13 | Lg Electronics Inc. | Method and apparatus for performing low-complexity computation of transform kernel for video compression |
WO2019004749A1 (ko) * | 2017-06-28 | 2019-01-03 | 엘지전자 주식회사 | 비디오 압축을 위한 변환 커널의 저복잡도 연산을 수행하는 방법 및 장치 |
KR102389869B1 (ko) | 2017-07-04 | 2022-04-22 | 삼성전자주식회사 | 다중 코어 변환에 의한 비디오 복호화 방법 및 장치, 다중 코어 변환에 의한 비디오 부호화 방법 및 장치 |
TWI761552B (zh) * | 2017-07-13 | 2022-04-21 | 美商松下電器(美國)知識產權公司 | 編碼裝置、編碼方法、解碼裝置及解碼方法 |
TWI777907B (zh) * | 2017-07-13 | 2022-09-11 | 美商松下電器(美國)知識產權公司 | 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體 |
KR20200031102A (ko) * | 2017-07-28 | 2020-03-23 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법 |
EP4395317A3 (en) | 2017-07-28 | 2024-08-14 | Panasonic Intellectual Property Corporation of America | Encoding device and encoding method |
EP4376412A3 (en) * | 2017-12-15 | 2024-07-17 | LG Electronics Inc. | Image coding method on basis of transformation and device therefor |
US10915338B2 (en) * | 2018-03-26 | 2021-02-09 | Bank Of America Corporation | Computer architecture for emulating a correlithm object processing system that places portions of correlithm objects in a distributed node network |
US10915340B2 (en) * | 2018-03-26 | 2021-02-09 | Bank Of America Corporation | Computer architecture for emulating a correlithm object processing system that places multiple correlithm objects in a distributed node network |
US10860348B2 (en) * | 2018-03-26 | 2020-12-08 | Bank Of America Corporation | Computer architecture for emulating a correlithm object processing system that places portions of correlithm objects and portions of a mapping table in a distributed node network |
CN111937398B (zh) * | 2018-03-30 | 2023-04-21 | 索尼公司 | 图像处理装置和方法 |
US11070837B2 (en) | 2018-04-02 | 2021-07-20 | Panasonic Intellectual Property Corporation Of America | Encoding method, decoding method, encoder, and decoder |
CN117097892A (zh) | 2018-07-06 | 2023-11-21 | Lg电子株式会社 | 图像编码/解码设备和图像数据发送设备 |
US11412260B2 (en) * | 2018-10-29 | 2022-08-09 | Google Llc | Geometric transforms for image compression |
US11240534B2 (en) * | 2019-04-05 | 2022-02-01 | Qualcomm Incorporated | Extended multiple transform selection for video coding |
AU2020258920B2 (en) | 2019-04-16 | 2023-06-29 | Lg Electronics Inc. | Transform in intra prediction-based image coding |
CN116684613A (zh) | 2019-04-16 | 2023-09-01 | Lg电子株式会社 | 解码设备、编码设备和数据发送设备 |
US11122297B2 (en) | 2019-05-03 | 2021-09-14 | Google Llc | Using border-aligned block functions for image compression |
KR20210096281A (ko) | 2019-06-17 | 2021-08-04 | 엘지전자 주식회사 | 루마 맵핑 기반 비디오 또는 영상 코딩 |
CN118573851A (zh) | 2019-06-17 | 2024-08-30 | Lg 电子株式会社 | 基于亮度映射与色度缩放的视频或图像编译 |
CN111103829B (zh) * | 2019-12-11 | 2024-05-17 | 旋智电子科技(上海)有限公司 | 一种电机控制装置和方法 |
BR112022010886A2 (pt) * | 2019-12-11 | 2022-08-23 | Sony Group Corp | Dispositivo de processamento de imagem, e, métodos de geração de fluxo de bits, de geração de coeficiente de quantização e de geração de dados de coeficiente |
KR20220152299A (ko) * | 2020-03-12 | 2022-11-15 | 인터디지털 브이씨 홀딩스 프랑스 | 비디오 인코딩 및 디코딩을 위한 방법 및 장치 |
US11197004B1 (en) * | 2020-07-02 | 2021-12-07 | Google Llc | Inter-prediction mode-dependent transforms for video coding |
WO2022238616A2 (en) * | 2021-05-12 | 2022-11-17 | Nokia Technologies Oy | A method, an apparatus and a computer program product for video encoding and video decoding |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2526675B2 (ja) * | 1989-08-28 | 1996-08-21 | 日本電気株式会社 | 動画像の直交変換符号化方式およびその復号化の方式 |
GB2252002B (en) * | 1991-01-11 | 1995-01-04 | Sony Broadcast & Communication | Compression of video signals |
KR960006762B1 (ko) * | 1992-02-29 | 1996-05-23 | 삼성전자주식회사 | 화상부호화를 위한 효율적인 2차원 데이타의 주사선택회로 |
JPH09200762A (ja) * | 1995-12-29 | 1997-07-31 | Daewoo Electron Co Ltd | 映像信号符号化方法及びその装置 |
US5942002A (en) * | 1996-03-08 | 1999-08-24 | Neo-Lore | Method and apparatus for generating a transform |
US6611626B1 (en) * | 1999-12-10 | 2003-08-26 | Xerox Corporation | Method of compressing JPEG files using a conditional transform |
US6934730B2 (en) * | 2000-10-13 | 2005-08-23 | Xpriori, Llc | Method and system for generating a transform |
JP2004046499A (ja) * | 2002-07-11 | 2004-02-12 | Matsushita Electric Ind Co Ltd | データ処理システム |
JP4055203B2 (ja) * | 2002-09-12 | 2008-03-05 | ソニー株式会社 | データ処理装置およびデータ処理方法、記録媒体、並びにプログラム |
US7630435B2 (en) * | 2004-01-30 | 2009-12-08 | Panasonic Corporation | Picture coding method, picture decoding method, picture coding apparatus, picture decoding apparatus, and program thereof |
JP2006054846A (ja) * | 2004-07-12 | 2006-02-23 | Sony Corp | 符号化方法、符号化装置、復号方法、復号装置およびそれらのプログラム |
US7933337B2 (en) * | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
WO2007035056A1 (en) * | 2005-09-26 | 2007-03-29 | Samsung Electronics Co., Ltd. | Method and apparatus for entropy encoding and entropy decoding fine-granularity scalability layer video data |
JP4334533B2 (ja) * | 2005-11-24 | 2009-09-30 | 株式会社東芝 | 動画像符号化/復号化方法および装置 |
JP2007243399A (ja) * | 2006-03-07 | 2007-09-20 | Matsushita Electric Ind Co Ltd | データ圧縮方式およびその関連技術 |
BRPI0621935A2 (pt) * | 2006-07-28 | 2016-09-13 | Toshiba Kk Toshiba Corp | método e aparelho para codificar e decodificar imagem |
US8369638B2 (en) * | 2008-05-27 | 2013-02-05 | Microsoft Corporation | Reducing DC leakage in HD photo transform |
-
2010
- 2010-08-06 TW TW099126306A patent/TW201132129A/zh unknown
- 2010-08-06 EP EP10806249A patent/EP2464016A4/en not_active Withdrawn
- 2010-08-06 KR KR1020127002866A patent/KR20120046727A/ko not_active Application Discontinuation
- 2010-08-06 EP EP10806246A patent/EP2464013A4/en not_active Withdrawn
- 2010-08-06 US US13/388,385 patent/US20120134408A1/en not_active Abandoned
- 2010-08-06 JP JP2011525799A patent/JPWO2011016248A1/ja active Pending
- 2010-08-06 JP JP2011525798A patent/JPWO2011016247A1/ja active Pending
- 2010-08-06 EP EP10806248A patent/EP2464015A4/en not_active Withdrawn
- 2010-08-06 TW TW099126304A patent/TW201138475A/zh unknown
- 2010-08-06 CN CN2010800337392A patent/CN102474269A/zh active Pending
- 2010-08-06 JP JP2011525800A patent/JPWO2011016249A1/ja active Pending
- 2010-08-06 JP JP2011525797A patent/JPWO2011016246A1/ja active Pending
- 2010-08-06 WO PCT/JP2010/004951 patent/WO2011016248A1/ja active Application Filing
- 2010-08-06 WO PCT/JP2010/004949 patent/WO2011016246A1/ja active Application Filing
- 2010-08-06 KR KR1020127002863A patent/KR20120046724A/ko not_active Application Discontinuation
- 2010-08-06 CN CN2010800329786A patent/CN102474268A/zh active Pending
- 2010-08-06 KR KR1020127002865A patent/KR20120046726A/ko not_active Application Discontinuation
- 2010-08-06 US US13/388,341 patent/US20120127003A1/en not_active Abandoned
- 2010-08-06 TW TW099126299A patent/TW201119406A/zh unknown
- 2010-08-06 TW TW099126302A patent/TW201136319A/zh unknown
- 2010-08-06 KR KR1020127002864A patent/KR20120046725A/ko not_active Application Discontinuation
- 2010-08-06 WO PCT/JP2010/004953 patent/WO2011016249A1/ja active Application Filing
- 2010-08-06 EP EP10806247A patent/EP2464014A4/en not_active Withdrawn
- 2010-08-06 WO PCT/JP2010/004950 patent/WO2011016247A1/ja active Application Filing
- 2010-08-06 CN CN2010800342988A patent/CN102474271A/zh active Pending
- 2010-08-06 CN CN2010800343444A patent/CN102474272A/zh active Pending
- 2010-08-06 US US13/388,368 patent/US20120128066A1/en not_active Abandoned
- 2010-08-06 US US13/388,179 patent/US20120134412A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JPWO2011016247A1 (ja) | 2013-01-10 |
CN102474268A (zh) | 2012-05-23 |
WO2011016246A1 (ja) | 2011-02-10 |
TW201132129A (en) | 2011-09-16 |
WO2011016248A1 (ja) | 2011-02-10 |
TW201119406A (en) | 2011-06-01 |
EP2464014A1 (en) | 2012-06-13 |
KR20120046725A (ko) | 2012-05-10 |
US20120127003A1 (en) | 2012-05-24 |
KR20120046726A (ko) | 2012-05-10 |
US20120128066A1 (en) | 2012-05-24 |
EP2464013A4 (en) | 2012-07-18 |
EP2464016A1 (en) | 2012-06-13 |
TW201138475A (en) | 2011-11-01 |
EP2464015A4 (en) | 2012-07-11 |
EP2464016A4 (en) | 2012-07-18 |
KR20120046727A (ko) | 2012-05-10 |
EP2464013A1 (en) | 2012-06-13 |
WO2011016247A1 (ja) | 2011-02-10 |
CN102474272A (zh) | 2012-05-23 |
JPWO2011016246A1 (ja) | 2013-01-10 |
CN102474271A (zh) | 2012-05-23 |
CN102474269A (zh) | 2012-05-23 |
US20120134412A1 (en) | 2012-05-31 |
US20120134408A1 (en) | 2012-05-31 |
EP2464015A1 (en) | 2012-06-13 |
WO2011016249A1 (ja) | 2011-02-10 |
TW201136319A (en) | 2011-10-16 |
EP2464014A4 (en) | 2012-08-01 |
KR20120046724A (ko) | 2012-05-10 |
JPWO2011016249A1 (ja) | 2013-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011016248A1 (ja) | 符号化方法、復号方法、符号化装置及び復号装置 | |
JP5588438B2 (ja) | 画像符号化方法及び画像符号化装置 | |
WO2011016250A1 (ja) | 符号化方法、復号方法、符号化装置及び復号装置 | |
WO2010050156A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、集積回路およびプログラム | |
WO2011016251A1 (ja) | 符号化方法、復号方法、符号化装置及び復号装置 | |
WO2010026770A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、システム、プログラム、及び集積回路 | |
WO2010087157A1 (ja) | 画像符号化方法及び画像復号方法 | |
WO2010061607A1 (ja) | 動画像復号方法、動画像符号化方法、動画像復号装置、動画像符号化方法、プログラム、及び集積回路 | |
WO2010070897A1 (ja) | 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、プログラム、及び集積回路 | |
CN102365868A (zh) | 运动图像编码方法及装置、运动图像解码方法及装置 | |
JP5546044B2 (ja) | 画像復号装置、画像符号化装置、画像復号回路及び画像復号方法 | |
WO2011052216A1 (ja) | 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置 | |
WO2011089865A1 (ja) | 画像符号化方法、画像復号方法、それらの装置、プログラムおよび集積回路 | |
JP2011182132A (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、集積回路およびプログラム |