JP5739714B2 - 符号化装置、復号装置及びプログラム - Google Patents

符号化装置、復号装置及びプログラム Download PDF

Info

Publication number
JP5739714B2
JP5739714B2 JP2011082856A JP2011082856A JP5739714B2 JP 5739714 B2 JP5739714 B2 JP 5739714B2 JP 2011082856 A JP2011082856 A JP 2011082856A JP 2011082856 A JP2011082856 A JP 2011082856A JP 5739714 B2 JP5739714 B2 JP 5739714B2
Authority
JP
Japan
Prior art keywords
signal
orthogonal transform
orthogonal
unit
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011082856A
Other languages
English (en)
Other versions
JP2012222401A (ja
Inventor
市ヶ谷 敦郎
敦郎 市ヶ谷
境田 慎一
慎一 境田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2011082856A priority Critical patent/JP5739714B2/ja
Publication of JP2012222401A publication Critical patent/JP2012222401A/ja
Application granted granted Critical
Publication of JP5739714B2 publication Critical patent/JP5739714B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、異なる種類の直交変換を複数併用する符号化装置、復号装置及びプログラムに関する。
従来、信号を符号化する符号化装置においては、符号化対象の信号の性質に合わせて、最適な直交変換タイプを1つ選択し、そのタイプの直交変換を用いることで符号化を行う。例えば、画像を符号化する場合、広くDCT(離散コサイン変換)が用いられる。これは、画像信号の基本的な性質として、隣接する信号間の相関が非常に高いことが知られており、DCTを用いることにより、信号間の相関が高い信号源に対し、直交変換係数列の電力集中度が高くなるからである。また、音声を符号化する場合、MDCT(変形離散コサイン変換)が用いられ、信号解析を行うスペクトルアナライザでは、信号の位相及び振幅情報を把握するのが容易なフーリエ変換が用いられる。
しかし、演算能力の増大に伴って様々な信号予測技術が実用化され、符号化対象の信号が従来の信号そのものではなく、予測技術によって予測された信号との間の差分信号へと変化してきた。例えば、最新の映像符号化方式であるH.264等では、面内予測技術、動き補償予測技術等の高度な信号予測技術を採用し、実際に符号化する信号は画像信号そのものではなく、高度に予測された信号と画像信号との間の差分信号になっている。このことから、信号処理の入力信号は、画像信号に比べ相関が低い信号となり、DCT以外の直交変換を採用することによって、符号化効率を改善する場合が増えている。このように、符号化対象となる信号の変化によって、従来の直交変換では最適な符号化効率が得られない場合が生じてきた。そこで、従来の直交変換に加え、複数の直交変換を選択的に切り替え、最適な直交変換を用いて符号化を行う符号化装置が提案されている(例えば、非特許文献1を参照)。
このような、複数の直交変換を選択的に切り替え、最適な直交変換を用いて符号化を行う手法では、複数の異なる種類の直交変換を用意すればするほど、より最適な直交変換を用いて符号化を行うことができるから、符号化効率が高まることが予想される。
Y.Ye and M.Karczewicz, "Improved H.264 intra coding based on bi-directional intra prediction, directional transform, and adaptive coefficient scanning", IEEE Int’l Conf. Image Process. ’08 (ICIP08), San Diego, U.S.A., Oct. 2008.
しかし、非特許文献1に記載された、複数の直交変換を選択的に切り替え、最適な直交変換を用いて符号化を行う符号化装置では、直交変換の種類が増えれば増えるほど、使用する直交変換の種別を識別するための識別子を付加情報として持つ必要があり、これが符号化効率を下げる要因となってしまう。そのため、多くの種類の直交変換を備えることによる符号化効率の改善効果と、それらを識別するために付加される識別子による符号化効率の低減効果とを評価し、少ない種類の直交変換を備えることで、効果を最大限に発揮するようにバランスよく設計することが重要となる。また、限られた直交変換を用いる際には、個々の直交変換の特徴が異なっていること、及び、個々の直交変換の相関が過度に高くならないようにする、すなわち異なる直交変換同士の直交変換基底の相関が相互に低くなることも重要である。
このような重要性を考慮すると、理想的には、識別子を用いることなく直交変換タイプを識別することができれば最も効率的であるが、現在のところそのような技術は存在しない。
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、異なる種類の直交変換を複数併用する際に、直交変換タイプの識別子を用いることなく、直交変換係数列から直交変換タイプを予測し、符号化効率を向上させることが可能な符号化装置、復号装置及びプログラムを提供することにある。
前記目的を達成するために、本発明による請求項1の符号化装置は、入力した信号に対して複数の異なる直交変換を併用し、前記複数の直交変換のうちの1つの直交変換により生成した直交変換係数列を、符号化信号として出力する符号化装置において、前記直交変換係数列に対し、前記複数の異なる直交変換に対応した逆直交変換をそれぞれ行って復号信号を生成し、それぞれの前記復号信号と、それぞれの前記復号信号に隣接する復号済みの信号との間のそれぞれの隣接差分量を求め、それら前記隣接差分量に基づいて、直交変換タイプを予測し、予測した結果を前記符号化信号の一部とするとともに、該予測結果または前記直交変換係数列の生成に使われた1つの直交変換の識別情報に基づいて、前記複数の復号信号のうちの1つの復号信号を選択する直交変換タイプ予測部を備えたことを特徴とする。
また、本発明による請求項2の符号化装置は、請求項1に記載の符号化装置において、前記直交変換タイプ予測部が、前記直交変換係数列に対し、個々の直交変換によって逆変換して予測差分信号を生成する逆変換処理部と、前記逆変換処理部により生成された予測差分信号と予測信号を加算し、復号信号をそれぞれ生成する加算部と、前記加算部により生成されたそれぞれの復号信号と、当該直交変換タイプ予測部により選択された復号信号のうちの、前記生成された復号信号に隣接する信号との間の差分を、隣接差分量としてそれぞれ算出する比較部と、前記比較部により算出された隣接差分量のうちの最小の隣接差分量に対応する逆直交変換を特定し、前記特定した逆直交変換の直交変換タイプを予測し、前記直交変換タイプの復号信号を選択する選択部と、を備えたことを特徴とする。
また、本発明による請求項3の符号化装置は、請求項1または2に記載の符号化装置において、前記直交変換タイプ予測部が、さらに、前記予測した直交変換タイプを第1の直交変換タイプとし、前記複数の直交変換のうち実際に選択された直交変換タイプを第2の直交変換タイプとし、両直交変換タイプが同じである場合、一致を示す判定フラグを生成し、両直交変換タイプが異なる場合、不一致を示す判定フラグを生成し、前記直交変換係数列と共に、前記一致を示す判定フラグ、または、前記第2の直交変換タイプを付加した、前記不一致を示す判定フラグを符号化信号として生成する、ことを特徴とする。
さらに、本発明による請求項4の復号装置は、入力した符号化信号を逆直交変換し、復号信号を生成する復号装置において、前記符号化信号から得られた直交変換係数列に対し、複数の異なる逆直交変換をそれぞれ行って復号信号を生成し、それぞれの記復号信号と、それぞれの前記復号信号に隣接する復号済みの信号との間のそれぞれの隣接差分量を求め、それら前記隣接差分量に基づいて、直交変換タイプを予測し、前記複数の復号信号のうちの1つの復号信号を選択する直交変換タイプ予測部を備えたことを特徴とする。
また、本発明による請求項5の復号装置は、請求項4に記載の復号装置において、前記直交変換タイプ予測部が、前記直交変換係数列に対し、個々の直交変換によって逆変換して予測差分信号を生成する逆変換処理部と、前記逆変換処理部により生成された予測差分信号と予測信号を加算し、復号信号をそれぞれ生成する加算部と、前記加算部により生成されたそれぞれの復号信号と、当該直交変換タイプ予測部により選択された復号信号のうちの、前記生成された復号信号に隣接する信号との間の差分を、隣接差分量としてそれぞれ算出する比較部と、前記比較部により算出された隣接差分量のうちの最小の隣接差分量に対応する逆直交変換を特定し、前記特定した逆直交変換の直交変換タイプを予測し、前記直交変換タイプの復号信号を選択する選択部と、を備えたことを特徴とする。
また、本発明による請求項6の復号装置は、請求項3の符号化装置により生成された符号化信号を入力する請求項4または5に記載の復号装置において、前記直交変換タイプ予測部が、前記符号化信号から得られた判定フラグが一致を示している場合、前記予測した直交変換タイプの復号信号を選択し、前記判定フラグが不一致を示している場合、前記判定フラグに付加された前記第2の直交変換タイプの復号信号を選択する、ことを特徴とする。
さらに、本発明による請求項7のプログラムは、コンピュータを、請求項1から3までのいずれか一項に記載の符号化装置として機能させることを特徴とする。
また、本発明による請求項8のプログラムは、コンピュータを、請求項4から6までのいずれか一項に記載の復号装置として機能させることを特徴とする。
以上のように、本発明によれば、直交変換タイプの識別子を用いることなく、直交変換係数列から直交変換タイプを予測し、必ずしも識別子を符号化する必要がないから、符号化効率を向上させることができる。
本発明の実施形態による符号化装置及び復号装置に用いる直交変換タイプ予測器(直交変換タイプ予測部)の基本的な構成を示すブロック図である。 画像信号のような2次元信号における復号信号及び隣接復号信号の例を示す図である。 図1の比較部及び選択部による処理を示すフローチャートである。 本発明の実施形態による符号化装置の構成を示すブロック図である。 図4の符号化装置に用いる直交変換タイプ予測部の構成を示すブロック図である。 図5の選択部による処理を示すフローチャートである。 本発明の実施形態による復号装置の構成を示すブロック図である。 図7の復号装置に用いる直交変換タイプ予測部の構成を示すブロック図である。 図8の選択部による処理を示すフローチャートである。
以下、本発明を実施するための形態について図面を用いて詳細に説明する。
〔発明の概要〕
まず、本発明の概要について説明する。本発明では、入力信号の基本的性質を利用し、直交変換した直交変換係数列と、その直交変換係数列を復号した信号とに基づいて、個々の直交変換の相関が低いことを前提に、復号信号の信号間相関の性質を利用することで、直交変換係数列から直交変換タイプを予測する。
一般的に、複数の直交変換を併用する符号化装置及び復号装置では、いずれの直交変換によっても符号化及び復号できるように、全ての直交変換の変換処理部及び逆変換処理部を備えている。識別子を付加して直交変換係数列を生成する場合は、識別子の示す直交変換/逆変換処理を選択し、処理を行う。その際、他の直交変換/逆変換処理は、通常使用されない。
本発明の実施形態では、入力した直交変換係数列を全ての逆変換処理部で処理し、それぞれの逆変換処理の結果を用いて複数の復号信号を生成する。それぞれの逆変換処理の結果得られた復号信号と、当該符号化領域の周囲に存在する(隣接する)既復号領域との接続部における信号との間の特徴(相関)が、入力信号として想定した特徴を最も示している場合、その復号信号における直交変換タイプを、正しい直交変換タイプであると予測するものである。符号化装置では、直交変換処理を行う際、入力信号を最も効率的に符号化できる直交変換タイプを選択するのが通常であるから、正しい直交変換タイプの逆変換処理を選択した場合、最も信号の特徴を忠実に再現すると考えられるからである。例えば、画像信号の場合、隣接画素の相関が高いという特徴を持つため、隣接差分信号の平均または平均二乗誤差が最小となる結果を正しい出力結果として採用することができる。
また、この結果を直交変換タイプの予測値として利用することもできる。長いサンプル数の信号を直交変換する場合、信号境界点における信号特徴の再現が悪い場合もあり得る。このような場合、前述した処理に従って直交変換タイプを選択した予測結果に対して、その予測結果が正しいか、または正しくないかを1ビットのフラグで表現する。例えば、正しい場合のフラグを1、正しくない場合のフラグを0とすると、フラグが1である場合、直交変換タイプは1ビットで表現することができ、正しくない場合は、フラグ0に引き続き、正当な直交変換タイプを識別する直交変換の識別子を付加すればよい。
例えば、4つの直交変換タイプを併用する場合、2ビットの識別子を必要とするが、予測が正しくない場合、1ビット(フラグ0)+2ビット(正しい識別子)=3ビットで表現する。この場合、2ビットの固定長で符号化する場合に比べ、フラグ及び識別子を合わせて固定長よりも長い符号を生成することになるが、正しい場合のフラグが1ビットで表現でき、1または0の発生確率に偏りを作ることができる。したがって、算術符号化によって符号化する際に、符号化効率を大幅に改善することができる。
〔直交変換タイプ予測器〕
次に、本発明の実施形態による符号化装置及び復号装置に用いる直交変換タイプ予測器の基本的な構成及び処理について説明する。図1は、直交変換タイプ予測器の基本的な構成を示すブロック図である。この直交変換タイプ予測器1は、4個の逆変換処理部(ITr1〜4)2、4個の加算部3、4個の比較部(Diff)4、及び選択部(Selector)5を備えている。直交変換タイプ予測器1は、所定の直交変換により生成された直交変換係数列、当該直交変換タイプ予測器1にて処理した復号信号に隣接する信号(隣接復号信号)、及び、復号信号から得られた予測信号を入力し、4種類の逆直交変換及び予測信号から生成されたそれぞれの復号信号及び隣接復号信号に基づいて、入力した直交変換係数列がいかなる直交変換の種類で生成されたかを示す直交変換タイプを予測し、予測した直交変換タイプの復号信号を出力する。予測信号は、例えばH.264等の映像符号化方式で採用されている画面内予測または動き補償予測により得られた信号であり、その予測方法は高度な方法でもよく、特定の方法に依存するものではない。
各逆変換処理部2は、直交変換係数列を入力し、個々の直交変換によって逆変換し、予測差分信号である逆直交変換結果を生成する。各加算部3は、対応する逆変換処理部2から逆直交変換結果を入力すると共に、予測信号を入力し、逆直交変換結果に予測信号を加算し、復号信号を生成する。各比較部4は、対応する加算部3から復号信号を入力すると共に、既に復号されている信号であって、入力した復号信号に隣接する信号(隣接復号信号)を入力し、復号信号と隣接復号信号とを比較して差分を算出し、隣接差分信号を生成する。
選択部5は、加算部3からそれぞれの復号信号を入力すると共に、比較部4からそれぞれの隣接差分信号を入力し、復号信号及び隣接差分信号に基づいて、4個の復号信号の中から、最も想定する復号信号の隣接画素間相関に近い出力結果(復号信号)を求め、その出力結果の復号信号を選択し、出力する。選択部5により選択され出力された復号信号は、予測信号を得るために用いられ、また、隣接復号信号としても用いられる。
ここで、図1に示した直交変換タイプ予測器1を画像符号化装置に用いる場合、画像の隣接画素間の信号は相関が高いため、直交変換タイプ予測器1の選択部5では、隣接画素の差分が最小となる復号信号(逆直交変換により得られた復号信号)が選択され、出力される。
図2は、画像信号のような2次元信号における復号信号及び隣接復号信号の例を示す図である。図2には、H.264のように、画面の左上からブロックに分割し順次符号化を行う方式の場合の例が示されている。黒丸の信号が復号信号であり、白丸の信号が隣接復号信号である。符号化対象ブロック(黒丸で示した領域)の左側及び上側のブロックは、既に局所復号が終了した隣接復号信号の領域であり(白丸で示した領域)、その値は既知である。尚、画面の右または下の両方またはいずれかから先に復号する方式の場合には、右または下に隣接する既知の信号(隣接復号信号)を利用する。
図3は、図1に示した比較部4及び選択部5の処理を示すフローチャートである。まず、比較部4は、加算部3から復号信号を入力すると共に、隣接復号信号を入力する(ステップS301)。そして、比較部4は、復号信号と隣接復号信号との間の垂直方向差分信号Qを算出する(ステップS302)。ここで、nは、逆変換処理部2及び加算部3の系統番号であるインデックスを示す。また、比較部4は、復号信号と隣接復号信号との間の水平方向差分信号Rを算出する(ステップS303)。垂直方向差分信号Q及び水平方向差分信号Rの具体例については、図2を参照されたい。
図3に戻って、比較部4は、垂直方向差分信号Q及び水平方向差分信号Rを用いて、これらの隣接差分信号Q,Rの二乗和(絶対値和)Sを、以下の式により算出する(ステップS304)。
=ΣQ +ΣR
比較部4により算出された隣接差分信号Q,Rの二乗和は、選択部5に出力される。尚、比較部4は、隣接差分信号Q,Rの二乗和ではなく、絶対値和を算出するようにしてもよいし、隣接差分信号Q,Rの和Sを、以下の式により算出するようにしてもよい。
=ΣQ+ΣR
選択部5は、比較部4から各系統の隣接差分信号Q,Rの二乗和Sを入力すると、以下の式に示すように、各系統の二乗和Sを比較し、系統を示すインデックスnを特定する(ステップS305)。
n=Comp(S,S,S,S
尚、Compを示す比較関数の処理内容は、信号の特性に応じて予め設定される。例えば画像信号または音声信号の場合、Compは、最小の二乗和Sのインデックスnを特定する処理を行う。Sが隣接差分信号Q,Rの和の場合、Compは、最小の和Sのインデックスnを特定する処理を行う。
選択部5は、以下の式に示すように、インデックスnの示す復号信号を選択し、選択した復号信号を出力する(ステップS306)。
OutPut=Sel(ITr,ITr,ITr,ITr,n)
ここで、Sel(*)は、4系統の復号信号ITr,ITr,ITr,ITrのうち、n番目の系統の復号信号(逆直交変換による復号結果)を出力する関数とする。
このように、図1に示した直交変換タイプ予測器1によれば、比較部4が、各系統における復号信号と隣接復号信号とを比較して隣接差分量Sを生成し、選択部5が、各系統の隣接差分量を比較することで、系統を特定するようにした。これにより、直交変換タイプを予測することができる。つまり、対象となる信号の特性に応じて、比較部4及び選択部5における比較及び選択処理を行うことにより、直交変換タイプを正確に予測することができる。
〔符号化装置〕
次に、本発明の実施形態による符号化装置について説明する。図4は、符号化装置の構成を示すブロック図である。この符号化装置10は、前処理部11、減算部12、直交変換部13、量子化部14、逆量子化部15、エントロピー符号化部16、直交変換タイプ予測部17、フレームメモリ18及び信号予測部19を備えている。
前処理部11は、符号化対象となる信号を入力し、この入力信号に対し、符号化のために必要な所定の前処理を行う。前処理については既知であるから、ここでは説明を省略する。減算部12は、前処理部11から前処理後の信号を入力すると共に、後述する信号予測部19から予測信号を入力し、前処理後の信号から予測信号を減算する。
直交変換部13は、複数の(例えば、図1の逆変換処理部2に対応した4種類の)直交変換手段を備えており、それぞれの直交変換手段は、互いに異なる直交変換を行う。直交変換部13は、減算部12から減算結果の信号を入力し、それぞれの直交変換手段が入力した信号に対して直交変換を行う。そして、直交変換部13は、例えばRD最適化法(Rate-Distortion Optimization)によって、入力信号の特性に応じて直交変換後の信号の符号化効率が最も高くなる直交変換手段を選択し、選択した直交変換手段にて直交変換した直交変換係数列を量子化部14に出力すると共に、この実際に選択した直交変換手段の識別子(直交変換タイプを示す識別子)を直交変換タイプ予測部17に出力する。
量子化部14は、直交変換部13から直交変換係数列を入力し、量子化を行う。逆量子化部15は、量子化部14から量子化した直交変換係数列を入力し、逆量子化を行い、逆量子化した直交変換係数列を直交変換タイプ予測部17に出力する。量子化及び逆量子化の処理については既知であるから、ここでは説明を省略する。
エントロピー符号化部16は、量子化部14から量子化した直交変換係数列を入力すると共に、直交変換タイプ予測部17から判定フラグ(及び識別子)を入力し、直交変換係数列及び判定フラグ(及び識別子)をエントロピー符号化し、符号化信号として出力する。判定フラグ(及び識別子)は、直交変換部13にて選択された直交変換係数列の直交変換タイプと、後述する直交変換タイプ予測部17にて予測された直交変換タイプとが一致する場合、一致を示す判定フラグのみを示し、一致しない場合、不一致を示す判定フラグ及び識別子(直交変換部13にて選択された直交変換係数列の直交変換タイプを示す識別子(正しい識別子))を示す。詳細については後述する。
直交変換タイプ予測部17は、直交変換部13から識別子(正しい識別子)を、逆量子化部15から直交変換係数列を、信号予測部19から予測信号をそれぞれ入力すると共に、フレームメモリ18から隣接復号信号を読み出す。そして、直交変換タイプ予測部17は、図1に示したように、直交変換係数列を逆直交変換し、予測信号に基づいて例えば4種類の復号信号を生成し、生成した4種類の復号信号及び隣接復号信号に基づいて、4種類の直交変換の中から直交変換タイプを予測する。そして、直交変換タイプ予測部17は、予測した直交変換タイプを示す識別子と、直交変換部13から入力した識別子とを比較することで、判定フラグを生成し、一致する場合は判定フラグのみを、一致しない場合は判定フラグ及び識別子(正しい識別子)をエントロピー符号化部16に出力する。また、直交変換タイプ予測部17は、予測した直交変換タイプの復号信号をフレームメモリ18に格納する。直交変換タイプ予測部17の詳細については後述する。
フレームメモリ18は、直交変換タイプ予測部17から復号信号を入力し、記憶する。フレームメモリ18に記憶された復号信号は、直交変換タイプ予測部17により、直交変換タイプを予測する際に用いる復号信号に隣接する信号(隣接復号信号)として読み出される(図2を参照)。また、後述する信号予測部19により、予測信号を生成する際の参照信号として読み出される。
信号予測部19は、フレームメモリ18から参照信号を読み出し、参照信号に基づいて、所定の予測方式により予測信号を生成し、減算部12及び直交変換タイプ予測部17に出力する。予測信号を生成する方式については既知であるから、ここでは説明を省略する。尚、信号予測部19の処理に用いる予測方式は、例えばH.264で用いられるイントラ予測、動き補償予測等であってもよく、特定の方式に限定されるものではない。
〔符号化装置に用いる直交変換タイプ予測部〕
次に、図4に示した符号化装置10の直交変換タイプ予測部17について詳細に説明する。図5は、直交変換タイプ予測部17の構成を示すブロック図である。この直交変換タイプ予測部17は、4個の逆変換処理部(ITr1〜4)2、4個の加算部3、4個の比較部(Diff)4、及び選択部(Selector)6を備えている。
図1に示した直交変換タイプ予測器1と図5に示す直交変換タイプ予測部17とを比較すると、両者とも4個の逆変換処理部2、4個の加算部3及び4個の比較部4を備えている点で同一であるが、直交変換タイプ予測部17は、直交変換タイプ予測器1の選択部5とは異なる選択部6を備えている点で相違する。逆変換処理部2、加算部3及び比較部4については図1において説明済みであるから、ここでは説明を省略する。
図6は、図5の選択部6の処理を示すフローチャートである。まず、選択部6は、直交変換部13から識別子(正しい識別子)を、加算部3から各系統の復号信号を、比較部4から各系統の隣接差分信号をそれぞれ入力する(ステップS601)。そして、選択部6は、図3に示したステップS305及びステップS306に示したように、各系統の隣接差分信号を比較して系統を特定することにより、4種類の直交変換の中から直交変換タイプを予測する(ステップS602)。これにより、各系統の復号信号(4種類の復号信号)の中から、最も想定する復号信号の隣接画素間相関に近い復号信号が特定される。
選択部6は、予測した直交変換タイプを示す識別子と、直交変換部13から入力した識別子(正しい識別子)とを比較する(ステップS603)。そして、選択部6は、ステップS603において、両識別子が一致したと判定した場合(ステップS603:Y)、一致(予測可能)を示す判定フラグを生成する(ステップS604)。そして、選択部6は、入力した各系統(4種類の)復号信号の中から、ステップS602にて予測した直交変換タイプの復号信号を選択してフレームメモリ18に格納すると共に、ステップS604にて生成した一致を示す判定フラグを、エントロピー符号化部16に出力する(ステップS605)。
一方、選択部6は、ステップS603において、両識別子が一致しないと判定した場合(ステップS603:N)、不一致(予測不可能)を示す判定フラグを生成する(ステップS606)。そして、選択部6は、入力した各系統(4種類の)復号信号の中から、ステップS601にて直交変換部13から入力した識別子(正しい識別子)に対応する直交変換タイプの復号信号を選択し、フレームメモリ18に格納すると共に、ステップS606にて生成した不一致を示す判定フラグ、及び、ステップS601にて直交変換部13から入力した識別子(正しい識別子)をエントロピー符号化部16に出力する(ステップS607)。
このように、図5に示した符号化装置10によれば、直交変換タイプ予測部17が、隣接差分信号に基づいて、最も想定する復号信号の隣接画素間相関に近い信号の直交変換タイプを予測し、この予測結果である直交変換タイプを示す識別子と、直交変換部13において実際に選択された直交変換の識別子(正しい識別子)とを比較し、両識別子が一致する場合、一致(予測可能)を示す判定フラグを生成し、両識別子が一致しない場合、不一致(予測不可能)を示す判定フラグを生成するようにした。また、エントロピー符号化部16が、直交変換タイプが予測可能であると判定された場合、直交変換部13において実際に直交変換が行われ量子化部14において量子化された直交変換係数列と共に、一致を示す判定フラグを符号化し、符号化信号を出力するようにした。一方、直交変換タイプが予測不可能であると判定された場合、前記直交変換係数列と共に、不一致を示す判定フラグ及び直交変換部13において実際に選択された直交変換の識別子(正しい識別子)とを符号化し、符号化信号を出力するようにした。
これにより、直交変換タイプの識別子を用いて直交変換タイプを特定するのではなく、直交変換係数列に基づいて直交変換タイプを予測することができる。また、直交変換タイプが予測可能である場合、判定フラグのみが符号化され、予測不可能である場合、判定フラグ及び正しい識別子が符号化される。したがって、複数の直交変換を適切に切り替えて符号化を行う場合に、直交変換を識別するための信号を少なくすることが可能となり、符号化効率を向上させることができる。
〔復号装置〕
次に、本発明の実施形態による復号装置について説明する。図7は、復号装置の構成を示すブロック図である。この復号装置20は、エントロピー復号部21、逆量子化部22、直交変換タイプ予測部23、後処理部24、フレームメモリ25及び信号予測部26を備えている。
エントロピー復号部21は、図4に示した符号化装置10により出力された符号化信号を入力し、図4に示したエントロピー符号化部16のエントロピー符号化に対応するエントロピー復号を行い、直交変換係数列及び判定フラグ(及び識別子)を生成する。そして、エントロピー復号部21は、直交変換係数列を逆量子化部22に出力し、判定フラグ(及び識別子)を直交変換タイプ予測部23に出力する。逆量子化部22は、エントロピー復号部21から直交変換係数列を入力し、図4に示した逆量子化部15と同様に、逆量子化を行い、逆量子化した直交変換係数列を直交変換タイプ予測部23に出力する。
直交変換タイプ予測部23は、逆量子化部22から逆量子化した直交変換係数列を、エントロピー復号部21から判定フラグ(及び識別子)を、信号予測部26から予測信号をそれぞれ入力すると共に、フレームメモリ25から隣接復号信号を読み出す。そして、直交変換タイプ予測部23は、図1に示したように、直交変換係数列をそれぞれ逆直交変換し、予測信号に基づいて例えば4種類の復号信号を生成する。
直交変換タイプ予測部23は、入力した判定フラグが一致を示している場合(すなわち、直交変換タイプを予測可能である場合)、4種類の復号信号及び隣接復号信号に基づいて、直交変換タイプを予測し、予測した直交変換タイプの復号信号を後処理部24に出力すると共に、フレームメモリ25に格納する。一方、直交変換タイプ予測部23は、入力した判定フラグが不一致を示している場合(すなわち、直交変換タイプを予測不可能である場合)、判定フラグと共に入力した識別子(正しい識別子)に対応する直交変換タイプの復号信号を後処理部24に出力すると共に、フレームメモリ25に格納する。直交変換タイプ予測部23の詳細については後述する。
後処理部24は、直交変換タイプ予測部23から復号信号を入力し、この入力信号に対し、図4に示した前処理部11の前処理に対応する所定の後処理を行い、出力信号として出力する。後処理については既知であるから、ここでは説明を省略する。
フレームメモリ25は、図4に示したフレームメモリ18と同様に、直交変換タイプ予測部23から復号信号を入力し、記憶する。フレームメモリ25に記憶された復号信号は、直交変換タイプ予測部23により、直交変換タイプを予測する際に用いる復号信号に隣接する信号(隣接復号信号)として読み出される(図2を参照)。また、後述する信号予測部26により、予測信号を生成する際の参照信号として読み出される。
信号予測部26は、図4に示した信号予測部19と同様に、フレームメモリ25から参照信号を読み出し、参照信号に基づいて、所定の予測方式により予測信号を生成し、直交変換タイプ予測部23に出力する。予測信号を生成する方式については既知であるから、ここでは説明を省略する。
〔復号装置に用いる直交変換タイプ予測部〕
次に、図7に示した復号装置20の直交変換タイプ予測部23について詳細に説明する。図8は、直交変換タイプ予測部23の構成を示すブロック図である。この直交変換タイプ予測部23は、4個の逆変換処理部(ITr1〜4)2、4個の加算部3、4個の比較部(Diff)4、及び選択部(Selector)7を備えている。
図1に示した直交変換タイプ予測器1及び図5に示した直交変換タイプ予測部17と、図8に示す直交変換タイプ予測部23とを比較すると、これらは4個の逆変換処理部2、4個の加算部3及び4個の比較部4を備えている点で同一であるが、直交変換タイプ予測部23は、直交変換タイプ予測器1及び直交変換タイプ予測部17の選択部5,6とは異なる選択部7を備えている点で相違する。逆変換処理部2、加算部3及び比較部4については図1において説明済みであるから、ここでは説明を省略する。
図9は、図8の選択部7の処理を示すフローチャートである。まず、選択部7は、エントロピー復号部21から判定フラグ(及び識別子)を、加算部3から各系統の復号信号を、比較部4から各系統の隣接差分信号をそれぞれ入力する(ステップS901)。そして、選択部7は、判定フラグが一致を示しているか、または不一致を示しているかを判定する(ステップS902)。
選択部7は、ステップS902において、判定フラグが一致を示していると判定した場合(ステップS902:一致)、すなわち、直交変換タイプを予測可能であると判定した場合、図3に示したステップS305及びステップS306に示したように、各系統の隣接差分信号を比較して系統を特定することにより、4種類の直交変換の中から直交変換タイプを予測する(ステップS903)。そして、選択部7は、4種類の復号信号の中から、予測した直交変換タイプの復号信号を選択し、後処理部24に出力すると共に、フレームメモリ25に格納する(ステップS904)。
一方、選択部7は、ステップS902において、判定フラグが不一致を示していると判定した場合(ステップS902:不一致)、すなわち、直交変換タイプを予測不可能であると判定した場合、判定フラグと共に入力した識別子(正しい識別子)に対応する直交変換タイプの復号信号を選択し、後処理部24に出力すると共に、フレームメモリ25に格納する(ステップS905)。
このように、図7に示した復号装置20によれば、エントロピー復号部21が、符号化装置10から符号化信号を入力し、エントロピー復号によって直交変換係数列及び判定フラグ(及び識別子)を生成するようにした。そして、直交変換タイプ予測部23は、判定フラグが一致を示していると判定した場合(すなわち、直交変換タイプを予測可能である場合)、それぞれの逆直交変換により生成した4種類の復号信号及び隣接復号信号に基づいて、4種類の直交変換の中から直交変換タイプを予測し、予測した直交変換タイプの復号信号を選択して出力するようにした。一方、直交変換タイプ予測部23は、判定フラグが不一致を示していると判定した場合(すなわち、直交変換タイプを予測不可能である場合)、正しい識別子に対応する直交変換タイプの復号信号を選択して出力するようにした。
これにより、直交変換タイプの識別子を用いて直交変換タイプを特定するのではなく、直交変換係数列に基づいて直交変換タイプを予測することができる。また、復号信号を選択するために、直交変換タイプが予測可能である場合は、符号化された判定フラグのみが用いられ、予測不可能である場合は、判定フラグ及び正しい識別子が用いられる。したがって、直交変換を識別するための信号を少なくすることが可能となり、符号化を行う際の符号化効率を向上させることができる。
また、例えば、判定フラグとして、一致を示す場合(直交変換タイプを予測可能である場合)に1が生成され、不一致を示す場合(直交変換タイプを予測不可能である場合)に0が生成されるものとする。4回の直交変換のうちの、例えば1,2番目の直交変換係数列が予測可能であり、3番目が予測不可能な場合、判定フラグ(及び識別子)は、「11010」となる。「11010」のうちの最初の3ビット「110」は、1,2番目が予測可能、3番目が予測不可能であることを示している。また、これに続く2ビット「10」は、識別子(3番目の判定フラグが0であるから、その直交変換タイプの識別子)を示しており、この例では、符号化装置10によって、3番目の復号信号が選択される。つまり、本発明の実施形態では、判定フラグ等として5ビットが必要になる。これに対し、識別子を符号化する従来技術の場合には、1,2番目の直交変換係数列の直交変換タイプを識別するために4ビット(1信号あたり2ビット)が必要になるから、この例では、6ビット(2ビット×3信号)が必要になる。したがって、本発明の実施形態の判定フラグ等の方が、従来の識別子よりも1ビット少なくて済むから、1ビットの符号化効率の改善を図ることができる。
以上、実施形態を挙げて本発明を説明したが、本発明は前記実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。前記実施形態では、最適な直交変換を正しく使用するために、正しい識別子を伝送する例を示した。しかし、誤推定を許容できるシステムの場合、図5及び図8に示した直交変換タイプ予測部17,23の代わりに、図1に示した識別子を用いない直交変換タイプ予測器1を用いることにより、識別子を追加することなく、符号化効率を向上させることができ、画質の改善を実現することができる。また、本発明の実施形態では、直交変換タイプ予測部23の選択部7は、判定フラグが不一致を示す場合(直交変換タイプを予測不可能である場合)、予測を行うことなく識別子に基づいて直交変換タイプを決定するようにしたが、不一致を示す場合も、一致を示す場合と同様に予測を行い、選択された直交変換タイプが誤りであることを利用して、識別子が示す直交変換を更に1つ増やすようにしてもよい。図5に示した直交変換タイプ予測部17では、2ビットの識別子の例を示しており、直交変換は、2ビットで表現できる4種類を想定している。しかし、復号装置20が、不一致を示す判定フラグを受信し、予測された直交変換タイプが正しくないことを確実に認識できる場合には、2ビットの識別子によって、予測による不正解である1つの直交変換を除く、さらに4種類の直交変換を識別することが可能になる。つまり、全体のシステムとして、5種類の直交変換を用いることができ、バリエーションが一層増え、効率を落とすことなく符号化性能を改善することができる。
尚、本発明の実施形態による符号化装置10及び復号装置20のハードウェア構成としては、通常のコンピュータを使用することができる。符号化装置10及び復号装置20は、それぞれCPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。符号化装置10に備えた前処理部11、減算部12、直交変換部13、量子化部14、逆量子化部15、エントロピー符号化部16、直交変換タイプ予測部17、フレームメモリ18、フレームメモリ18及び信号予測部19の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。同様に、復号装置20に備えたエントロピー復号部21、逆量子化部22、直交変換タイプ予測部23、後処理部24、フレームメモリ25及び信号予測部26の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもできる。
1 直交変換タイプ予測器
2 逆変換処理部
3 加算部
4 比較部
5,6,7 選択部
10 符号化装置
11 前処理部
12 減算部
13 直交変換部
14 量子化部
15,22 逆量子化部
16 エントロピー符号化部
17,23 直交変換タイプ予測部
18,25 フレームメモリ
19,26 信号予測部
20 復号装置
21 エントロピー復号部
24 後処理部

Claims (8)

  1. 入力した信号に対して複数の異なる直交変換を併用し、前記複数の直交変換のうちの1つの直交変換により生成した直交変換係数列を、符号化信号として出力する符号化装置において、
    前記直交変換係数列に対し、前記複数の異なる直交変換に対応した逆直交変換をそれぞれ行って復号信号を生成し、それぞれの前記復号信号と、それぞれの前記復号信号に隣接する復号済みの信号との間のそれぞれの隣接差分量を求め、それら前記隣接差分量に基づいて、直交変換タイプを予測し、予測した結果を前記符号化信号の一部とするとともに、該予測結果または前記直交変換係数列の生成に使われた1つの直交変換の識別情報に基づいて、前記複数の復号信号のうちの1つの復号信号を選択する直交変換タイプ予測部を備えたことを特徴とする符号化装置。
  2. 請求項1に記載の符号化装置において、
    前記直交変換タイプ予測部は、
    前記直交変換係数列に対し、個々の直交変換によって逆変換して予測差分信号を生成する逆変換処理部と、
    前記逆変換処理部により生成された予測差分信号と予測信号を加算し、復号信号をそれぞれ生成する加算部と、
    前記加算部により生成されたそれぞれの復号信号と、当該直交変換タイプ予測部により選択された復号信号のうちの、前記生成された復号信号に隣接する信号との間の差分を、隣接差分量としてそれぞれ算出する比較部と、
    前記比較部により算出された隣接差分量のうちの最小の隣接差分量に対応する逆直交変換を特定し、前記特定した逆直交変換の直交変換タイプを予測し、前記直交変換タイプの復号信号を選択する選択部と、を備えたことを特徴とする符号化装置。
  3. 請求項1または2に記載の符号化装置において、
    前記直交変換タイプ予測部は、
    さらに、前記予測した直交変換タイプを第1の直交変換タイプとし、前記複数の直交変換のうち実際に選択された直交変換タイプを第2の直交変換タイプとし、両直交変換タイプが同じである場合、一致を示す判定フラグを生成し、両直交変換タイプが異なる場合、不一致を示す判定フラグを生成し、
    前記直交変換係数列と共に、前記一致を示す判定フラグ、または、前記第2の直交変換タイプを付加した、前記不一致を示す判定フラグを符号化信号として生成する、ことを特徴とする符号化装置。
  4. 入力した符号化信号を逆直交変換し、復号信号を生成する復号装置において、
    前記符号化信号から得られた直交変換係数列に対し、複数の異なる逆直交変換をそれぞれ行って復号信号を生成し、それぞれの記復号信号と、それぞれの前記復号信号に隣接する復号済みの信号との間のそれぞれの隣接差分量を求め、それら前記隣接差分量に基づいて、直交変換タイプを予測し、前記複数の復号信号のうちの1つの復号信号を選択する直交変換タイプ予測部を備えたことを特徴とする復号装置。
  5. 請求項4に記載の復号装置において、
    前記直交変換タイプ予測部は、
    前記直交変換係数列に対し、個々の直交変換によって逆変換して予測差分信号を生成する逆変換処理部と、
    前記逆変換処理部により生成された予測差分信号と予測信号を加算し、復号信号をそれぞれ生成する加算部と、
    前記加算部により生成されたそれぞれの復号信号と、当該直交変換タイプ予測部により選択された復号信号のうちの、前記生成された復号信号に隣接する信号との間の差分を、隣接差分量としてそれぞれ算出する比較部と、
    前記比較部により算出された隣接差分量のうちの最小の隣接差分量に対応する逆直交変換を特定し、前記特定した逆直交変換の直交変換タイプを予測し、前記直交変換タイプの復号信号を選択する選択部と、を備えたことを特徴とする復号装置。
  6. 請求項3の符号化装置により生成された符号化信号を入力する請求項4または5に記載の復号装置において、
    前記直交変換タイプ予測部は、
    前記符号化信号から得られた判定フラグが一致を示している場合、前記予測した直交変換タイプの復号信号を選択し、前記判定フラグが不一致を示している場合、前記判定フラグに付加された前記第2の直交変換タイプの復号信号を選択する、ことを特徴とする復号装置。
  7. コンピュータを、請求項1から3までのいずれか一項に記載の符号化装置として機能させるためのプログラム。
  8. コンピュータを、請求項4から6までのいずれか一項に記載の復号装置として機能させるためのプログラム。
JP2011082856A 2011-04-04 2011-04-04 符号化装置、復号装置及びプログラム Expired - Fee Related JP5739714B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011082856A JP5739714B2 (ja) 2011-04-04 2011-04-04 符号化装置、復号装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011082856A JP5739714B2 (ja) 2011-04-04 2011-04-04 符号化装置、復号装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2012222401A JP2012222401A (ja) 2012-11-12
JP5739714B2 true JP5739714B2 (ja) 2015-06-24

Family

ID=47273516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011082856A Expired - Fee Related JP5739714B2 (ja) 2011-04-04 2011-04-04 符号化装置、復号装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5739714B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108235007B (zh) * 2016-12-12 2023-06-27 上海天荷电子信息有限公司 各模式使用不同精度同种编码参数的数据压缩方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4594561B2 (ja) * 2001-07-26 2010-12-08 財団法人エヌエイチケイエンジニアリングサービス 符号化装置及び符号化プログラム
JP4447197B2 (ja) * 2002-01-07 2010-04-07 三菱電機株式会社 動画像符号化装置および動画像復号装置
BRPI0818444A2 (pt) * 2007-10-12 2016-10-11 Qualcomm Inc codificação adaptativa de informação de cabeçalho de bloco de vídeo
KR20190143460A (ko) * 2009-01-27 2019-12-30 인터디지탈 매디슨 페이튼트 홀딩스 비디오 인코딩 및 디코딩에서 변환 선택을 위한 방법 및 장치

Also Published As

Publication number Publication date
JP2012222401A (ja) 2012-11-12

Similar Documents

Publication Publication Date Title
KR101145698B1 (ko) 인터 프레임 예측 코딩 방법, 디바이스 및 시스템
RU2514929C2 (ru) Способ и устройство для кодирования и декодирования вектора движения
RU2559738C2 (ru) Способ и устройство для кодирования/декодирования вектора движения
RU2504103C1 (ru) Способ и устройство для кодирования и декодирования изображения посредством использования вращательного преобразования
JP5367097B2 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
WO2011099468A1 (ja) 動きベクトル予測符号化方法,動きベクトル予測復号方法,動画像符号化装置,動画像復号装置およびそれらのプログラム
JP7330243B2 (ja) 低減されたメモリアクセスを用いてfrucモードでビデオデータを符号化又は復号する方法及び装置
CN103348651A (zh) 具有降低复杂性的变换单元分割的方法及装置
JP5306485B2 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
KR20110045908A (ko) 공간 분할을 이용한 움직임 벡터 부호화/복호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
JP5739714B2 (ja) 符号化装置、復号装置及びプログラム
JP2010278519A (ja) 動きベクトル検出装置
JP5358485B2 (ja) 画像符号化装置
JP2013017128A (ja) イントラ予測モード推定装置、画像符号化装置、画像復号装置、及びプログラム
JP2012120108A (ja) 補間画像生成装置及びプログラム、並びに、動画像復号装置及びプログラム
JP4385869B2 (ja) 動きベクトル検出装置、動画符号化装置、および、プログラム
KR101086163B1 (ko) 차분 영상의 좌표 변환을 이용한 영상 부호화 장치 및 방법
JP5298082B2 (ja) 適応的に直交変換係数の走査順序を決定する符号化装置及び復号装置
JP5294037B2 (ja) 画像復号化方法、画像復号化装置及び画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140107

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141125

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150331

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150424

R150 Certificate of patent or registration of utility model

Ref document number: 5739714

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees