JP2012039590A - 画像処理装置、画像処理方法、及びプログラム - Google Patents

画像処理装置、画像処理方法、及びプログラム Download PDF

Info

Publication number
JP2012039590A
JP2012039590A JP2010241769A JP2010241769A JP2012039590A JP 2012039590 A JP2012039590 A JP 2012039590A JP 2010241769 A JP2010241769 A JP 2010241769A JP 2010241769 A JP2010241769 A JP 2010241769A JP 2012039590 A JP2012039590 A JP 2012039590A
Authority
JP
Japan
Prior art keywords
image
orthogonal transform
inverse
frequency component
dct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010241769A
Other languages
English (en)
Inventor
Kenji Kondo
健治 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010241769A priority Critical patent/JP2012039590A/ja
Priority to TW100121641A priority patent/TW201208383A/zh
Priority to US13/809,819 priority patent/US20130108185A1/en
Priority to KR20137000110A priority patent/KR20130088114A/ko
Priority to AU2011277552A priority patent/AU2011277552A1/en
Priority to BR112013000637A priority patent/BR112013000637A2/pt
Priority to EP11806719.8A priority patent/EP2595384A1/en
Priority to CN2011800340205A priority patent/CN102986223A/zh
Priority to RU2013100169/08A priority patent/RU2013100169A/ru
Priority to CA2802439A priority patent/CA2802439A1/en
Priority to MX2013000355A priority patent/MX2013000355A/es
Priority to PCT/JP2011/065735 priority patent/WO2012008389A1/ja
Publication of JP2012039590A publication Critical patent/JP2012039590A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/007Transform coding, e.g. discrete cosine transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/439Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using cascaded computational arrangements for performing a single operation, e.g. filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]

Abstract

【課題】ROTおよびDCTまたは逆DCTおよび逆ROTの処理量を削減する。
【解決手段】
符号化された画像を復号した画像情報を逆量子化することで、第一の直交変換手段により求められた、前記画像情報における低周波成分と、第二の直交変換手段により求められた、前記画像情報における前記低周波成分より高い高周波数成分とを求め、前記低周波数成分と前記高周波数成分とを同様の手法により逆直交変換する。本発明は、例えば、画像を符号化する場合や復号する場合に適用できる。
【選択図】図2

Description

本発明は、画像処理装置、画像処理方法、及びプログラムに関し、特に、直交変換処理または逆直交変換処理の演算量を削減することができるようにした画像処理装置、画像処理方法、及びプログラムに関する。
AVC(Advanced Video Coding)の次世代に相当する符号化方式において、Rotation transform(ROT)という直交変換を用いることが検討されている(例えば、特許文献1参照)。ビデオ符号化で広く使われている従来の離散コサイン変換(DCT(Discrete Cosine Transform))は、いくつかの状況では最適ではない。例えば、変換対象が強い方向成分をもっている場合、DCT基底ベクトルは、その強い方向成分を良好に表現できない。
通常、ROT(Directional transform)では上記の問題を解決することができるが、多くの浮動小数点演算が要求されたり、変換対象のブロックが正方形であることが求められたりするため、ROTを行うことは困難である。特に、ROT のブロックサイズの種類が多い場合にはより困難である。
そこで、ブロックサイズの種類の少ないROT を行う処理部を設計しておき、 DCT の後に2nd transform として低周波数成分に対してのみROT を施す方法が考案されている。
図1は、このような方法で直交変換を行うことにより符号化された画像データを復号するデコーダにおける逆ROTの工程例を示したものである。
左の白い箱は、符号化された画像データから取り出された残差情報としての画像データである。この画像データは、4×4画素,8×8画素,16×16画素,32×32画素,64×64画素、または128×128画素の画素値からなるブロックごとに逆量子化される。そして、逆量子化後のブロックのうちの低い周波数成分からなる4×4または8×8画素のブロックだけが逆ROTされ、その逆ROT後の係数と逆量子化後のブロックのうちの残りの高い周波数成分が併せられて逆DCT変換される。
こうすることで、上述した方法では、ROTおよび逆ROTのブロックサイズとして、4×4画素または8×8画素の2種類だけ用意すればよくなる。
http://wftp3.itu.int/av-arch/jctvc-site/2010_04_A_Dresden/JCTVC-A124.zip[平成22年10月28日検索]
しかしながら、イントラ予測のブロックサイズが4×4画素のように小さい場合、問題が起こる。具体的には、各ブロックのイントラ予測を行うためには、そのブロックの左のブロックを含む周囲のブロックの復号後の画像データが必要であるため、各ブロックのイントラ予測を並列に行うことはできない。そして、上述した方法では、復号後の画像データを得るために、DCT,ROT、量子化、逆量子化、逆ROT、および逆DCTといった非常に多くの処理が必要である。
従って、イントラ予測のブロックサイズが小さい場合、マクロブロックあるいはCU(Cording Unit)のエンコードおよびデコードに要する最長時間が大きくなり、リアルタイム性を要求するアプリケーションにおいて上述した方法を用いることは極めて困難になる。ここでCUとはAVC方式におけるマクロブロックと同じ概念である。
本発明は、このような状況に鑑みてなされたものであり、ROTおよびDCTまたは逆DCTおよび逆ROTの処理量を削減することができるようにするものである。
本発明の一側面の画像処理装置、又は、プログラムは、量子化された画像を逆量子化することで、第1の直交変換後に第2の直交変換が行われることにより求められた、前記画像の所定のサイズの低周波成分と、前記第1の直交変換により求められた、前記画像の前記低周波成分以外の成分である高周波数成分とを求める逆量子化手段と、前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して、前記第1の直交変換に対応する第1の逆直交変換と前記第2の直交変換に対応する第2の逆直交変換を合成した変換である第3の逆直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行う逆直交変換手段とを備える画像処理装置、又は、画像処理装置として、コンピュータを機能させるためのプログラムである。
本発明の一側面の画像処理方法は、量子化された画像を逆量子化することで、第1の直交変換後に第2の直交変換が行われることにより求められた、前記画像の所定のサイズの低周波成分と、前記第1の直交変換により求められた、前記画像の前記低周波成分以外の成分である高周波数成分とを求め、前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して、前記第1の直交変換に対応する第1の逆直交変換と前記第2の直交変換に対応する第2の逆直交変換を合成した変換である第3の逆直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行うステップを含む画像処理方法である。
本発明の一側面においては、量子化された画像を逆量子化することで、第1の直交変換後に第2の直交変換が行われることにより求められた、前記画像の所定のサイズの低周波成分と、前記第1の直交変換により求められた、前記画像の前記低周波成分以外の成分である高周波数成分とが求められ、前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して、前記第1の直交変換に対応する第1の逆直交変換と前記第2の直交変換に対応する第2の逆直交変換を合成した変換である第3の逆直交変換が行われ、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換が行われる。
本発明の一側面によれば、ROTおよびDCTまたは逆DCTおよび逆ROTの処理量を削減することができる。
デコーダにおけるROT の工程例を示す図である。 AVC方式のエンコーダの構成例を示すブロック図である。 AVC方式のデコーダの構成例を示すブロック図である。 ROTを導入したときの、直交変換装置、量子化装置、逆量子化装置、及び、逆直交変換装置に相当する部分の構成例を示すブロック図である。 エンコーダ側でのROTの改善を説明するための図である。 ROTを導入したときの、逆量子化装置、及び、逆直交変換装置に相当する部分の構成例を示すブロック図である。 デコーダ側でのROTの改善を説明するための図である。 エンコーダ処理を説明するフローチャートである。 エンコーダ処理を説明するフローチャートである。 エンコーダ処理を説明するフローチャートである。 エンコーダ処理を説明するフローチャートである。 エンコーダ処理を説明するフローチャートである。 デコーダ処理を説明するフローチャートである。 デコーダ処理を説明するフローチャートである。 デコーダ処理を説明するフローチャートである。 本発明を適用したコンピュータの一実施の形態の構成例を示すブロック図である。
<一実施の形態>
[エンコーダの構成例]
図2は、本発明を適用したAVC方式のエンコーダの一実施の形態の構成例を示すブロック図である。
図2のエンコーダは、A/D変換装置101、画面並べ替えバッファ102、演算装置103、直交変換装置104、量子化装置105、可逆符号化装置106、蓄積バッファ107、逆量子化装置108、逆直交変換装置109、加算装置110、デブロックフィルタ111、フレームメモリ112、動き補償装置113、イントラ予測装置114、レート制御装置115、動き予測装置116、および選択装置117により構成される。図1のエンコーダは、入力された画像をAVC方式で圧縮符号化する。
具体的には、エンコーダのA/D変換装置101は、入力信号として入力されたフレーム単位の画像をA/D変換し、画面並べ替えバッファ102に出力し、記憶させる。画面並べ替えバッファ102は、記憶した表示の順番のフレームの画像を、GOP(Group of Picture)構造に応じて、符号化のための順番に並べ替える。
演算装置103は、必要に応じて、画面並べ替えバッファ102から読み出された画像から、選択装置117から供給される予測画像を減算する。演算装置103は、減算の結果得られる画像を、残差情報として直交変換装置104に出力する。演算装置103は、選択装置117から予測画像が供給されない場合、画面並べ替えバッファ102から読み出された画像をそのまま残差情報として直交変換装置104に出力する。
直交変換装置104は、演算装置103からの残差情報に対して、ブロックサイズに応じた直交変換処理を行う。具体的には、ブロックサイズが4×4画素である場合、直交変換装置104は、残差情報に対してDCTとROTを合成した変換を行う。一方、ブロックサイズが8×8画素である場合、直交変換装置104は、残差情報に対してDCTを行い、その結果得られる係数に対してROTを行う。また、ブロックサイズが8×8画素より大きい場合、直交変換装置104は、残差情報に対してDCTを行い、その結果得られる係数のうちの8×8画素の低周波数成分に対してROTを行い、その結果得られる係数と残りの高周波数成分を最終的な係数とする。直交変換装置104は、直交変換処理の結果得られる係数を量子化装置105に供給する。
量子化装置105は、直交変換装置104から供給される係数を量子化する。量子化された係数は、可逆符号化装置106に入力される。
可逆符号化装置106は、最適イントラ予測モードを示す情報(以下、イントラ予測モード情報という)をイントラ予測装置114から取得し、最適インター予測モードを示す情報(以下、インター予測モード情報という)、動きベクトルの情報などを動き予測装置116から取得する。
可逆符号化装置106は、量子化装置105から供給される量子化された係数に対して、可変長符号化(例えば、CAVLC(Context-Adaptive Variable Length Coding)など)、算術符号化(例えば、CABAC(Context-Adaptive Binary Arithmetic Coding)など)などの可逆符号化を行い、その結果得られる情報を圧縮画像とする。また、可逆符号化装置106は、イントラ予測モード情報、インター予測モード情報、動きベクトルの情報などを可逆符号化し、その結果得られる情報を圧縮画像に付加されるヘッダ情報とする。可逆符号化装置106は、可逆符号化の結果得られるヘッダ情報が付加された圧縮画像を画像圧縮情報として蓄積バッファ107に供給し、蓄積させる。
蓄積バッファ107は、可逆符号化装置106から供給される画像圧縮情報を、一時的に記憶し、例えば、後段の図示せぬ記録装置や伝送路などに出力する。
また、量子化装置105より出力された、量子化された係数は、逆量子化装置108にも入力され、逆量子化された後、逆直交変換装置109に供給される。
逆直交変換装置109は、逆量子化装置108から供給される係数に対して、ブロックサイズに応じた逆直交変換処理を行う。具体的には、ブロックサイズが4×4画素である場合、逆直交変換装置109は、係数に対して逆ROTと逆DCTを合成した変換を行う。一方、ブロックサイズが8×8画素である場合、逆直交変換装置109は、係数に対して逆ROTを行い、その結果得られる係数に対して逆DCTを行う。また、ブロックサイズが8×8画素より大きい場合、逆直交変換装置109は、係数の8×8の低周波数成分に対して逆ROTを行い、その結果得られる係数と残りの高周波数成分に対して逆DCTを行う。逆直交変換装置109は、逆直交変換処理の結果得られる残差情報を加算装置110に供給する。
加算装置110は、逆直交変換装置109から供給される残差情報を、必要に応じて、イントラ予測装置114または動き補償装置113から供給される予測画像と加算し、局部的に復号された画像を得る。加算装置110は、得られた画像をデブロックフィルタ111に供給するとともに、参照画像としてイントラ予測装置114に供給する。
デブロックフィルタ111は、加算装置110から供給される局部的に復号された画像をフィルタリングすることにより、ブロック歪を除去する。デブロックフィルタ111は、その結果得られる画像をフレームメモリ112に供給し、蓄積させる。フレームメモリ112に蓄積された画像は、参照画像として動き補償装置113および動き予測装置116に出力される。
動き補償装置113は、動き予測装置116から供給される動きベクトルとインター予測モード情報に基づいて、フレームメモリ112から供給される参照画像に対して補償処理を行い、予測画像を生成する。動き補償装置113は、動き予測装置116から供給されるコスト関数値(詳細は後述する)と、生成された予測画像とを選択装置117に供給する。
なお、コスト関数値は、RD(Rate Distortion)コストともいい、例えば、AVC方式における参照ソフトウェアであるJM(Joint Model)で定められているような、High Complexity モードか、Low Complexity モードのいずれかの手法に基づいて算出される。
具体的には、コスト関数値の算出手法としてHigh Complexity モードが採用される場合、候補となる全ての予測モードに対して、仮に可逆符号化までが行われ、次の式(1)で表わされるコスト関数値が各予測モードに対して算出される。
Cost(Mode)=D+λ・R ・・・(1)
Dは、原画像と復号画像の差分(歪)、Rは、直交変換の係数まで含んだ発生符号量、λは、量子化パラメータQPの関数として与えられるラグランジュ乗数である。
一方、コスト関数値の算出手法としてLow Complexity モードが採用される場合、候補となる全ての予測モードに対して、復号画像の生成、および、予測モードを示す情報などのヘッダビットの算出が行われ、次の式(2)で表わされるコスト関数が各予測モードに対して算出される。
Cost(Mode)=D+QPtoQuant(QP)・Header_Bit ・・・(2)
Dは、原画像と復号画像の差分(歪)、Header_Bitは、予測モードに対するヘッダビット、QPtoQuantは、量子化パラメータQPの関数として与えられる関数である。
Low Complexity モードにおいては、全ての予測モードに対して、復号画像を生成するだけでよく、可逆符号化を行う必要がないため、演算量が少なくて済む。なお、ここでは、コスト関数値の算出手法としてHigh Complexity モードが採用されるものとする。
イントラ予測装置114は、画面並べ替えバッファ102から読み出された画像と、加算装置110から供給された参照画像とに基づいて、候補となる全てのブロックサイズのブロック単位で、候補となる全てのイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。
また、イントラ予測装置114は、候補となる全てのイントラ予測モードおよびブロックサイズに対してコスト関数値を算出する。そして、イントラ予測装置114は、コスト関数値が最小となるイントラ予測モードおよびブロックサイズの組み合わせを最適イントラ予測モードに決定する。イントラ予測装置114は、最適イントラ予測モードで生成された予測画像、および、対応するコスト関数値を、選択装置117に供給する。イントラ予測装置114は、選択装置117から最適イントラ予測モードで生成された予測画像の選択が通知された場合、イントラ予測モード情報を可逆符号化装置106に供給する。
動き予測装置116は、画面並べ替えバッファ102から供給される画像と、フレームメモリ112から供給される参照画像とに基づいて、候補となる全てのインター予測モードの動き予測行い、動きベクトルを生成する。このとき、動き予測装置116は、候補となる全てのインター予測モードに対してコスト関数値を算出し、コスト関数値が最小となるインター予測モードを最適インター測モードに決定する。そして、動き予測装置116は、インター予測モード情報、並びに、対応する動きベクトルおよびコスト関数値を動き補償装置113に供給する。動き予測装置116は、選択装置117から最適インター予測モードで生成された予測画像の選択が通知された場合、インター予測モード情報、対応する動きベクトルの情報などを可逆符号化装置106に出力する。
選択装置117は、イントラ予測装置114および動き補償装置113から供給されるコスト関数値に基づいて、最適イントラ予測モードと最適インター予測モードのうちのいずれかを、最適予測モードに決定する。そして、選択装置117は、最適予測モードの予測画像を、演算装置103および加算装置110に供給する。また、選択装置117は、最適予測モードの予測画像の選択をイントラ予測装置114または動き予測装置116に通知する。
レート制御装置115は、蓄積バッファ107に蓄積された画像圧縮情報に基づいて、オーバーフローあるいはアンダーフローが発生しないように、量子化装置105の量子化動作のレートを制御する。
[復号装置の構成例]
図3は、図2のエンコーダに対応するAVC方式のデコーダのブロック図である。
図3のデコーダは、蓄積バッファ216、可逆復号化装置217、逆量子化装置218、逆直交変換装置219、加算装置220、画面並べ替えバッファ221、D/A変換装置222、フレームメモリ223、動き補償装置224、イントラ予測装置225、デブロックフィルタ226、およびスイッチ227により構成されている。
蓄積バッファ216は、図2のエンコーダより伝送されてきた画像圧縮情報を蓄積する。可逆復号化装置217は、蓄積バッファ216から画像圧縮情報を読み出して取得し、その画像圧縮情報を図2の可逆符号化装置106の可逆符号化方式に対応する方式で可逆復号化する。
具体的には、可逆復号化装置217は、画像圧縮情報のうちのヘッダ情報を可逆復号し、イントラ予測モード情報、インター予測モード情報、動きベクトル情報などを取得する。また、可逆復号化装置217は、画像圧縮情報のうちの圧縮画像を可逆復号する。
また、可逆復号化装置217は、圧縮画像を可逆復号した結果得られる量子化された係数を逆量子化装置218に供給する。可逆復号化装置217は、可逆復号の結果得られるイントラ予測モード情報をイントラ予測装置225に供給し、インター予測モード情報、動きベクトル情報などを動き補償装置224に供給する。
逆量子化装置218は、図2の逆量子化装置108と同様に構成され、可逆復号化装置217から供給される量子化された係数を、図2の量子化装置105の量子化方式に対応する方式で逆量子化する。逆量子化装置218は、逆量子化の結果得られる係数を逆直交変換装置219に供給する。
逆直交変換装置219は、図2の逆直交変換装置109と同様に、逆量子化装置218から供給される係数に対して、ブロックサイズに応じた逆直交変換処理を行う。逆直交変換装置219は、逆直交変換処理の結果得られる残差情報を加算装置220に供給する。
加算装置220は、逆直交変換装置219から供給される残差情報を、必要に応じて、スイッチ227から供給される予測画像と加算し、復号する。加算装置220は、その結果得られるデコード画像をイントラ予測装置225とデブロックフィルタ226に供給する。
デブロックフィルタ226は、加算装置220から供給されるデコード画像をフィルタリングすることによりブロック歪を除去する。デブロックフィルタ226は、その結果得られる画像をフレームメモリ223に供給し、蓄積させるとともに、画面並べ替えバッファ221に出力する。
画面並べ替えバッファ221は、デブロックフィルタ226から供給される画像の並べ替えを行う。具体的には、図2の画面並べ替えバッファ102により符号化するための順番に並べ替えられた画像の順番が、元の表示の順番に並べ替えられる。D/A変換装置222は、画面並べ替えバッファ221により並べ替えられた画像をD/A変換し、図示せぬディスプレイに出力信号として出力し、表示させる。
フレームメモリ223は、蓄積している画像を参照画像として読み出し、動き補償装置224に出力する。
イントラ予測装置225は、可逆復号化装置217から供給されるイントラ予測モード情報に基づいて、そのイントラ予測モード情報が示す最適イントラ予測モードのイントラ予測処理を行い、予測画像を生成する。イントラ予測装置225は、予測画像をスイッチ227に供給する。
動き補償装置224は、可逆復号化装置217から供給されるインター予測モード情報、動きベクトル情報などに基づいて、フレームメモリ223から供給される参照画像に動き補償処理を行い、予測画像を生成する。動き補償装置224は、予測画像をスイッチ227に供給する。
スイッチ227は、動き補償装置224またはイントラ予測装置225により生成された予測画像を選択し、加算装置220に供給する。
[直交変換処理と逆直交変換処理の説明]
まず、図4は、直交変換処理としてDCTとROTを行う場合の従来のエンコーダの直交変換装置、量子化装置、逆量子化装置、および逆直交変換装置を示すブロック図である。
図4に示すように、従来のエンコーダの直交変換装置は、4×4DCT411,8×8DCT412,16×16DCT413,32×32DCT414,64×64DCT415,128×128DCT416,4×4ROT417、および8×8ROT418により構成される。
4×4DCT411,8×8DCT412,16×16DCT413,32×32DCT414,64×64DCT415、および128×128DCT416には、残差情報がブロックサイズに応じて入力され、DCTされる。
具体的には、4×4DCT411は、4×4画素の残差情報に対してDCTを行い、その結果得られる4×4画素の係数の演算精度を丸めて、4×4ROT417に供給する。
8×8DCT412は、8×8画素の残差情報に対してDCTを行い、その結果得られる8×8画素の係数の演算精度を丸めて、8×8ROT418に供給する。16×16DCT413は、16×16画素の残差情報に対してDCTを行い、その結果得られる16×16画素の係数の演算精度を丸める。16×16DCT413は、その結果得られる16×16画素の係数のうちの8×8画素の低周波数成分を8×8ROT418に供給し、残りの高周波数成分を量子化装置に供給する。
同様に、32×32DCT414,64×64DCT415、および128×128DCT416は、それぞれ、32×32画素,64×64画素,128×128画素の残差情報に対してDCTを行い、その結果得られる係数の演算精度を丸める。そして、32×32DCT414,64×64DCT415、および128×128DCT416は、その結果得られる係数のうちの8×8画素の低周波数成分だけ8×8ROT418に供給し、残りの高周波数成分を量子化装置に供給する。
4×4ROT417は、4×4DCT411から供給される4×4画素の係数に対して、角度インデックス(index)を用いてROTを行う。
なお、ROTとは、以下の式(1)に示す垂直方向の回転行列Rverticalおよび水平方向の回転行列Rhorizontalを用いた回転変換であり、角度インデックスとは、式(1)におけるα乃至αである。
Figure 2012039590
8×8ROT418は、8×8DCT412,16×16DCT413,32×32DCT414,64×64DCT415、および128×128DCT416から供給される8×8画素の係数に対して、角度インデックスを用いてROTを行う。
4×4ROT417によるROTの結果得られる4×4画素の係数および8×8ROT418によるROTの結果得られる8×8画素の係数は、それぞれ、演算精度が丸められ、量子化装置に供給される。
量子化装置は、4×4Quant419,8×8Quant420,16×16Quant421,32×32Quant422,64×64Quant423、および128×128Quant424により構成される。
4×4Quant419は、4×4ROT417から供給される4×4画素の係数を量子化する。4×4Quant419は、量子化された4×4画素の係数を逆量子化装置に供給するとともに、図2の可逆符号化装置106と同様の図示せぬ可逆符号化装置に供給する。
8×8Quant420は、8×8ROT418から供給される8×8画素の係数を量子化する。8×8Quant420は、量子化された8×8画素の係数を逆量子化装置に供給するとともに、可逆符号化装置106と同様の図示せぬ可逆符号化装置に供給する。
16×16Quant421は、8×8ROT418から供給される8×8画素の係数と、16×16DCT413から供給される、16×16画素の残差情報に対するDCTの結果得られる係数のうちの8×8画素の低周波数成分以外の高周波数成分とを量子化する。16×16Quant421は、量子化された16×16画素の係数を逆量子化装置に供給するとともに、可逆符号化装置106と同様の図示せぬ可逆符号化装置に供給する。
同様に、32×32Quant422,64×64Quant423、および128×128Quant424は、それぞれ、8×8ROT418から供給される8×8画素の係数と、32×32画素,64×64画素,128×128画素の残差情報に対するDCTの結果得られる係数のうちの8×8画素の低周波数成分以外の高周波数成分とを量子化する。32×32Quant422,64×64Quant423、および128×128Quant424は、それぞれ、量子化された32×32画素,64×64画素,128×128画素の係数を逆量子化装置に供給するとともに、可逆符号化装置106と同様の図示せぬ可逆符号化装置に供給する。
逆量子化装置は、4×4Inv Quant451,8×8Inv Quant452,16×16Inv Quant453,32×32Inv Quant454,64×64Inv Quant455、および128×128Inv Quant456により構成される。
4×4Inv Quant451,8×8Inv Quant452,16×16Inv Quant453,32×32Inv Quant454,64×64Inv Quant455、および128×128Inv Quant456は、それぞれ、4×4Quant419,8×8Quant420,16×16Quant421,32×32Quant422,64×64Quant423,128×128Quant424から供給される量子化された係数を逆量子化し、逆直交変換装置に供給する。
逆直交変換装置は、4×4Inv ROT457,8×8Inv ROT458,4×4Inv DCT459,8×8Inv DCT460,16×16Inv DCT461,32×32Inv DCT462,64×64Inv DCT463、および128×128Inv DCT464により構成される。
4×4Inv ROT457は、4×4Inv Quant451から供給される逆量子化された4×4画素の係数に対して、角度インデックスを用いて逆ROTを行う。4×4Inv ROT457は、その結果得られる4×4画素の係数を4×4Inv DCT459に供給する。
8×8Inv ROT458は、8×8Inv Quant452から供給される逆量子化された8×8画素の係数に対して、角度インデックスを用いて逆ROTを行い、その結果得られる8×8画素の係数を8×8Inv DCT460に供給する。
また、8×8Inv ROT458は、16×16Inv Quant453から供給される逆量子化された16×16画素の係数のうちの8×8画素の低周波数成分に対して、角度インデックスを用いて逆ROTを行う。そして、8×8Inv ROT458は、逆ROTの結果得られる8×8画素の係数を16×16Inv DCT461に供給する。
同様に、8×8Inv ROT458は、32×32Inv Quant454,64×64Inv Quant455、および128×128Inv Quant456から供給される逆量子化された32×32画素,64×64画素,128×128画素の係数のうちの8×8画素の低周波数成分に対して、角度インデックスを用いて逆ROTを行う。そして、8×8Inv ROT458は、逆量子化された32×32画素,64×64画素,128×128画素の係数のうちの8×8画素の低周波数成分に対する逆ROTの結果得られる8×8画素の係数を、32×32Inv DCT462,64×64Inv DCT463,128×128Inv DCT464に供給する。
4×4Inv DCT459は、4×4Inv Rot457から供給される4×4画素の係数に対して逆DCTを行う。4×4Inv DCT459は、その結果得られる4×4画素の残差情報を図2の加算装置110と同様の図示せぬ加算装置に供給する。
8×8Inv DCT460は、8×8Inv Rot458から供給される8×8画素の係数に対して逆DCTを行う。8×8Inv DCT460は、その結果得られる8×8画素の残差情報を加算装置110と同様の図示せぬ加算装置に供給する。16×16Inv DCT461は、8×8Inv Rot458から供給される8×8画素の係数と、16×16Inv Quant453から供給される16×16画素の係数のうちの8×8画素の低周波数成分以外の高周波数成分とに対して逆DCTを行う。16×16Inv DCT461は、その結果得られる16×16画素の残差情報を加算装置110と同様の図示せぬ加算装置に供給する。
同様に、32×32Inv DCT462,64×64Inv DCT463、および128×128Inv DCT464は、それぞれ、8×8Inv Rot458から供給される8×8画素の係数と、32×32Inv Quant454,64×64Inv Quant455,128×128Inv Quant456から供給される係数のうちの8×8画素の低周波数成分以外の高周波数成分とに対して逆DCTを行う。32×32Inv DCT462,64×64Inv DCT463、および128×128Inv DCT464は、それぞれ、逆DCTの結果得られる32×32画素,64×64画素,128×128画素の残差情報を加算装置110と同様の図示せぬ加算装置に供給する。
以上のようにして図示せぬ加算装置に残差情報が入力されることにより、復号後の画像が得られる。
次に、図5は、図2のエンコーダの直交変換装置104、量子化装置105、逆量子化装置108、および逆直交変換装置109の詳細を示すブロック図である。
なお、図5に示す構成のうち、図4の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図5の構成は、主に、直交変換装置104において4×4DCT411と4×4ROT417の代わりに4×4DCT×ROT501が設けられている点、逆直交変換装置109において4×4Inv ROT457と4×4Inv DCT459の代わりに4×4Inv ROT×Inv DCT502が設けられている点が図4の構成と異なる。
直交変換装置104の4×4DCT×ROT501は、角度インデックスを用いて、図2の演算装置103から供給される4×4画素の残差情報に対してDCTとROTを合成した変換を行う。具体的には、4×4DCT×ROT501は、角度インデックスに応じたDCTとROTを合成した変換のための行列を予め用意しており、4×4DCT×ROT501は、その行列を用いた1回の変換で、DCTおよびROT後の4×4画素の係数を得る。4×4DCT×ROT501は、その4×4画素の係数の演算精度を丸め、4×4Quant419に供給する。
なお、DCTとROTは直交変換の一種であり、通常、行列演算により行われる。従って、DCTとROTを合成した変換のための行列とは、DCTの行列演算で用いられる行列とROTの行列演算で用いられる行列の積によって得られる行列である。
以上のように、直交変換装置104では、4×4画素の残差情報に対して1回の変換でDCTとROTを行うことができるので、図4の直交変換装置に比べて直交変換処理の演算量を削減することができる。また、DCT後の演算精度の丸めが必要なくなり、図4の直交変換装置に比べて演算精度を高めることができる。従って、図4の4×4ROT417の出力と図5の4×4DCT×ROT501の出力は同一ではない。
また、逆直交変換装置109の4×4Inv ROT×Inv DCT502は、角度インデックスを用いて、4×4Inv Quant451から供給される4×4画素の係数に対して逆DCTと逆ROTを合成した変換を行う。具体的には、4×4Inv ROT×Inv DCT502は、角度インデックスに応じた逆DCTと逆ROTを合成した変換のための行列を予め用意しており、4×4Inv ROT×Inv DCT502は、その行列を用いた1回の変換で、逆DCTおよび逆ROT後の4×4画素の残差情報を得る。なお、逆DCTと逆ROTを合成した変換は、4×4DCT×ROT501で行われる変換の逆変換である。4×4Inv ROT×Inv DCT502は、変換の結果得られる4×4画素の残差情報を図2の加算装置110に供給する。
以上のように、逆直交変換装置109では、4×4画素の係数に対して1回の変換で逆DCTと逆ROTを行うことができるので、図4の逆直交変換装置に比べて逆直交変換処理の演算量を削減することができる。また、逆ROT後の演算精度の丸めが必要なくなり、図4の逆直交変換装置に比べて演算精度を高めることができる。従って、図4の4×4Inv DCT459の出力と図5の4×4Inv ROT×Inv DCT502の出力は同一ではない。
次に、図6は、直交変換処理としてDCTとROTを行う場合の従来のデコーダの逆量子化装置および逆直交変換装置を示すブロック図である。
図6の従来のデコーダの逆量子化装置は、図4の逆量子化装置と同様に構成され、図6の逆直交変換装置は、図4の逆直交変換装置と同様に構成される。
具体的には、図6の逆量子化装置は、4×4Inv Quant601,8×8Inv Quant602,16×16Inv Quant603,32×32Inv Quant604,64×64Inv Quant605、および128×128Inv Quant606により構成される。4×4Inv Quant601,8×8Inv Quant602,16×16Inv Quant603,32×32Inv Quant604,64×64Inv Quant605、および128×128Inv Quant606は、エンコーダから可逆符号化されて伝送されてくる画像圧縮情報を可逆復号した結果得られる量子化された係数に対して、図4の逆量子化装置と同様に逆量子化を行う。
また、図6の逆直交変換装置は、4×4Inv ROT607,8×8Inv ROT608,4×4Inv DCT609,8×8Inv DCT610,16×16Inv DCT611,32×32Inv DCT612,64×64Inv DCT613、および128×128Inv DCT614により構成される。4×4Inv ROT607および8×8Inv ROT608は、それぞれ、図4の4×4Inv ROT457,8×8Inv ROT458と同様に逆ROTを行う。また、4×4Inv DCT609,8×8Inv DCT610,16×16Inv DCT611,32×32Inv DCT612,64×64Inv DCT613、および128×128Inv DCT614は、それぞれ、図4の対応するブロックサイズのInv DCTと同様に、逆DCTを行う。
次に、図7は、図3のデコーダの逆量子化装置218および逆直交変換装置219の詳細を示すブロック図である。
図7の逆量子化装置218は、図5の逆量子化装置108と同様に構成され、図7の逆直交変換装置219は、図5の逆直交変換装置109と同様に構成される。
なお、図7に示す構成のうち、図6の構成と同じ構成には同じ符号を付してある。重複する説明については適宜省略する。
図7の構成は、主に、逆直交変換装置219において、逆直交変換装置109と同様に、4×4Inv ROT607と4×4Inv DCT609の代わりに4×4Inv ROT×Inv DCT701が設けられている点が図6の構成と異なる。
逆直交変換装置219の4×4Inv ROT×Inv DCT701は、図5の4×4Inv ROT×Inv DCT502と同様に、角度インデックスを用いて、4×4Inv Quant601から供給される4×4画素の係数に対して逆DCTと逆ROTを合成した変換を行う。4×4Inv ROT×Inv DCT701は、変換の結果得られる4×4画素の残差情報を図3の加算装置220に供給する。
なお、角度インデックスは、例えば、エンコーダで決定され、可逆符号化装置106でヘッダ情報に含められてデコーダに伝送される。
本実施の形態では、4×4画素の残差情報に対するDCTとROTが1度の変換で行われるようにしたが、4×4画素だけでなく8×8画素の残差情報に対するDCTとROTも1度の変換で行われるようにしてもよい。逆DCTと逆ROTについても同様である。
また、本実施の形態では、DCTの結果得られる8×8画素以上のサイズの係数については、8×8画素の低周波数成分に対してのみROTが行われるようにしたが、ROTが行われる係数の最大限のサイズは、8×8画素以外のサイズ(4×4画素、16×16画素等)にしてもよい。このことは、逆ROTについても同様である。
[エンコーダの処理の説明]
図8、図9、図10、図11、及び、図12は、図2のエンコーダの処理のフローチャートである。
図8は、マクロブロック(MB)のエンコード処理を説明するフローチャートである。
図8のステップS11において、エンコーダは、インター予測を用いた時のRDコスト(P)を算出する。インター予測を用いた時のRDコスト(P)を算出する処理の詳細は、後述する図9を参照して説明する。
ステップS12において、エンコーダは、イントラ予測を用いた時のRDコスト(I)を算出する。イントラ予測を用いた時のRDコスト(I)を算出する処理の詳細は、後述する図12を参照して説明する。
ステップS13において、選択装置117は、RDコスト(I)がRDコスト(P)より大きいかどうかを判定する。
ステップS13でRDコスト(I)がRDコスト(P)より大きくはないと判定された場合、即ちRDコスト(I)がRDコスト(P)以下である場合、選択装置117は、最適イントラ予測モードを最適予測モードに決定する。そして、選択装置117は、最適イントラ予測モードの予測画像を、演算装置103および加算装置110に供給する。また、選択装置117は、最適イントラ予測モードの予測画像の選択をイントラ予測装置114に通知する。これにより、イントラ予測装置114は、イントラ予測モード情報を可逆符号化装置106に供給する。
そして、ステップS14において、エンコーダは、処理対象のマクロブロック(当該MB)を最適イントラ予測モードのイントラ予測で符号化する。具体的には、エンコーダの演算装置103が、画面並べ替えバッファ102から読み出された画像の処理対象のマクロブロックから、選択装置117から供給される予測画像を減算し、直交変換装置104が、その結果得られる残差情報を直交変換する。量子化装置105は、直交変換装置104による直交変換の結果得られる係数を量子化し、可逆符号化装置106は、量子化された係数を可逆符号化するとともに、イントラ予測モード情報などを可逆符号化してヘッダ情報とする。蓄積バッファ107は、可逆符号化の結果得られるヘッダ情報が付加された圧縮画像を、画像圧縮情報として一時的に蓄積し、出力する。
一方、ステップS13でRDコスト(I)がRDコスト(P)より大きいと判定された場合、選択装置117は、最適インター予測モードを最適予測モードに決定する。そして、選択装置117は、最適インター予測モードの予測画像を、演算装置103および加算装置110に供給する。また、選択装置117は、最適インター予測モードの予測画像の選択を動き予測装置116に通知する。これにより、動き予測装置116は、インター予測モード情報、対応する動きベクトルの情報などを可逆符号化装置106に出力する。
そして、ステップS15において、エンコーダは、処理対象のマクロブロックを最適インター予測モードのインター予測で符号化する。具体的には、エンコーダの演算装置103が、画面並べ替えバッファ102から読み出された画像の処理対象のマクロブロックから、選択装置117から供給される予測画像を減算し、直交変換装置104が、その結果得られる残差情報を直交変換する。量子化装置105は、直交変換装置104による直交変換の結果得られる係数を量子化し、可逆符号化装置106は、量子化された係数を可逆符号化するとともに、インター予測モード情報、動きベクトルの情報などを可逆符号化してヘッダ情報とする。蓄積バッファ107は、可逆符号化の結果得られるヘッダ情報が付加された圧縮画像を、画像圧縮情報として一時的に蓄積し、出力する。
図9は、図8のステップS11のインター予測を用いた時のRDコスト(P)を算出する処理の詳細を説明するフローチャートである。
図9のステップS31において、動き予測装置116は、インター予測のブロックサイズを、各インター予測モードに対応する4×4画素,8×8画素,16×16画素,32×32画素,64×64画素,128×128画素のうち、まだ設定されていないものに設定する。
ステップS32において、動き予測装置116は、ステップS31で設定されたサイズで動き予測を行う。具体的には、動き予測装置116は、画面並べ替えバッファ102から供給される画像とフレームメモリ112から供給される参照画像とを用いて、ステップS31で設定されたサイズのブロック単位で動き予測を行う。その結果、ブロック単位の動きベクトル(MV)が得られる。動き予測装置116は、その動きベクトルを動き補償装置113に供給する。
ステップS33において、動き補償装置113は、動き予測装置116から供給される動きベクトルに応じて、動き補償(MC)を行う。具体的には、動き補償装置113は、動きベクトルに応じて、フレームメモリ112から供給される参照画像から予測画像を生成する。動き補償装置113は、生成された予測画像を、選択装置117を介して演算装置103に供給する。
ステップS34において、演算装置103は、入力信号に対応する画像とMC画像(予測画像)の差分を計算する。演算装置103は、計算の結果得られる差分を残差情報として直交変換装置104に供給する。
ステップS35において、直交変換装置104は、角度インデックスを、インデックス番号0,1,2、および3の角度インデックスのうちのまだ設定されていない角度インデックスに設定する。なお、インデックス番号とは、角度インデックスα乃至αの組み合わせに固有の番号であり、本実施の形態では、0乃至3の番号の4種類の角度インデックスの組み合わせが用意されている。
ステップS36において、直交変換装置104は、演算装置103から供給される残差情報(差分情報)に対して角度インデックスに応じてROTを行う処理であるROT処理等を施す。ステップS36の処理の詳細は、後述する図10を参照して説明する。
ステップS37において、量子化装置105は、ステップS36でROT処理等が施された結果得られる係数に対して量子化する処理である量子化処理を施す。具体的には、量子化装置105のインター予測のブロックサイズに対応する4×4Quant419,8×8Quant420,16×16Quant421,32×32Quant422,64×64Quant423、または128×128Quant424が、直交変換装置104から供給される係数を量子化する。量子化装置105は、量子化処理の結果得られる係数を可逆符号化装置106と逆量子化装置108に供給する。
ステップS38において、可逆符号化装置106は、量子化装置105から供給される係数(量子化後係数)を可逆符号化し、圧縮画像を得る。
ステップS39において、逆量子化装置108は、量子化装置105から供給される係数に対して逆量子化する処理である逆量子化処理を施す。具体的には、逆量子化装置108のインター予測のブロックサイズに対応する4×4Inv Quant451,8×8Inv Quant452,16×16Inv Quant453,32×32Inv Quant454,64×64Inv Quant455、または128×128Inv Quant456が、量子化装置105から供給される係数を逆量子化する。逆量子化処理の結果得られる係数は、逆直交変換装置109に供給される。
ステップS40において、逆直交変換装置109は、残差情報(差分情報)に対応する係数に対して、ステップS35で設定された角度インデックスに応じて、逆ROTを行う処理である逆ROT処理等を施す。ステップS40の処理の詳細は、後述する図11を参照して説明する。
ステップS40の処理後、処理はステップS35に戻り、インデックス番号0乃至3の角度インデックスの全てが角度インデックスに設定されるまで、ステップS35乃至S40の処理が繰り返される。そして、インデックス番号0乃至3の角度インデックスの全てが角度インデックスに設定されると、処理はステップS31に戻る。そして、4×4画素,8×8画素,16×16画素,32×32画素,64×64画素、および128×128画素の全てのサイズがインター予測のブロックサイズに設定されるまで、ステップS31乃至S40の処理が繰り返される。
そして、4×4画素,8×8画素,16×16画素,32×32画素,64×64画素、および128×128画素の全てのサイズがインター予測のブロックサイズに設定され、各ブロックサイズのインター予測のブロックに対して、インデックス番号0乃至3の角度インデックスの全てが角度インデックスとして設定された場合、処理はステップS41に進む。
ステップS41において、動き予測装置116は、インター予測モードと角度インデックスの組み合わせごとに、MV情報、量子化後符号情報、デコード画像からRDコストを計算する。具体的には、動き予測装置116は、インター予測モードと角度インデックスの組み合わせごとに、動きベクトルとフレームメモリ112から供給される参照画像を用いて予測画像を生成する。そして、動き予測装置116は、その予測画像と画面並べ替えバッファ102から供給される画像との差分を演算する。そして、動き予測装置116は、その差分、ステップS38の処理により得られる圧縮画像の発生符号量などを用いて、上述した式(1)を演算し、RDコストを算出する。
そして、動き予測装置116により、インター予測のブロックサイズに対応するインター予測モードと角度インデックスの組み合わせごとのRDコストから最も小さかったRDコストがRDコスト(P)として使われる。即ち、動き予測装置116は、インター予測モードと角度インデックスの組み合わせごとのRDコストのうちの最も小さかったRDコストであるRDコスト(P)と、対応する動きベクトルおよびインター予測モード情報を動き補償装置113に供給する。
これにより、動き補償装置113は、動き予測装置116から供給される動きベクトルとインター予測モード情報に基づいて、フレームメモリ112から供給される参照画像に対して補償処理を行い、予測画像を生成する。そして、動き補償装置113は、動き予測装置116から供給されるRDコスト(P)と、生成された予測画像とを選択装置117に供給する。
図10は、図9のステップS36の処理の詳細を説明するフローチャートである。
図10のステップS51において、直交変換装置104は、インター予測のブロックサイズが4×4画素であるかどうかを判定する。
ステップS51でインター予測のブロックサイズが4×4画素であると判定された場合、ステップS52において、直交変換装置104は、角度インデックスに応じてROT×DCT処理を施す。具体的には、直交変換装置104の4×4DCT×ROT501(図5)は、図9のステップS35で設定された角度インデックスに応じて、演算装置103から供給される残差情報に対して、DCTとROTを合成した変換を行う。4×4DCT×ROT501は、変換の結果得られる係数を量子化装置105の4×4Quant419に供給する。
ステップS51でインター予測のブロックサイズが4×4画素ではないと判定された場合、ステップS53において、直交変換装置104は、演算装置103から供給される残差情報に対して、DCTを行う処理であるDCT処理を施す。具体的には、直交変換装置104のインター予測のブロックサイズに対応する8×8DCT412,16×16DCT413,32×32DCT414,64×64DCT415、または128×128DCT416が、残差情報に対してDCTを行う。DCTの結果得られる係数のうちの8×8画素の低周波数成分は、8×8ROT418に供給され、残りの高周波数成分は、インター予測のブロックサイズに対応する16×16Quant421,32×32Quant422,64×64Quant423、または128×128Quant424に供給される。
ステップS54において、直交変換装置104の8×8ROT418は、低周波数成分の8×8画素(8×8サイズ)の係数に対して、図9のステップS35で設定された角度インデックスに応じてROT処理を施す。8×8ROT418は、ROT処理の結果得られる8×8画素の係数を、イントラ予測のブロックサイズに対応する8×8Quant420,16×16Quant421,32×32Quant422,64×64Quant423、または128×128Quant424に供給する。
図11は、図9のステップS40の処理を詳細に説明するフローチャートである。
図11のステップS71において、逆直交変換装置109は、インター予測のブロックサイズが4×4画素であるかどうかを判定する。
ステップS71でインター予測のブロックサイズが4×4画素であると判定された場合、ステップS72において、逆直交変換装置109は、角度インデックスに応じて逆ROT×DCT処理を施す。具体的には、逆直交変換装置109の4×4Inv ROT×Inv DCT502(図5)は、図9のステップS35で設定された角度インデックスに応じて、逆量子化装置108の4×4Inv Quant451から供給される係数に対して、逆ROTと逆DCTを合成した変換を行う。4×4Inv ROT×Inv DCT502は、変換の結果得られる残差情報を加算装置110に供給する。
ステップS71でインター予測のブロックサイズが4×4画素ではないと判定された場合、処理はステップS73に進む。ステップS73において、逆直交変換装置109の8×8Inv ROT458(図7)は、逆量子化装置108から供給される8×8画素以上のサイズの係数のうちの低周波数成分の8×8画素(8×8サイズ)の係数に対して、図9のステップS35で設定された角度インデックスに応じて、逆ROTを行う処理である逆ROT処理を施す。8×8Inv ROT458は、逆ROT処理の結果得られる係数を、インター予測のブロックサイズに対応する8×8Inv DCT460,16×16Inv DCT461,32×32Inv DCT462,64×64Inv DCT463、または128×128Inv DCT464に供給する。
ステップS74において、逆直交変換装置109の8×8Inv DCT460,16×16Inv DCT461,32×32Inv DCT462,64×64Inv DCT463、または128×128Inv DCT464は、8×8Inv ROT458から供給される係数と逆量子化装置108から供給される係数に対して、逆DCTを行う処理である逆DCT処理を施す。逆DCT処理の結果得られる残差情報は、加算装置110に供給される。
図12は、図8のステップS12のイントラ予測を用いた時のRDコスト(I)を算出する処理を詳細に説明するフローチャートである。
図12のステップS101において、イントラ予測装置114は、イントラ予測のブロックサイズを4×4画素,8×8画素,16×16画素,32×32画素,64×64画素、および128×128画素のうち、まだ設定されていないものに設定する。
ステップS102において、イントラ予測装置114は、イントラ予測モード(Intra direction mode)を、イントラ予測モード番号が0,1,2,3,4,5,6,7、または8であるイントラ予測モードのうち、まだ設定されていないものに設定する。なお、イントラ予測モード番号とは、イントラ予測モードに固有の番号であり、本実施の形態では、0乃至8の番号の8種類のイントラ予測モードが用意されている。
ステップS103において、イントラ予測装置114は、ステップS101で設定されたブロックサイズおよびイントラ予測モードで動き予測を行う。具体的には、イントラ予測装置114は、画面並べ替えバッファ102から供給される画像と加算装置110から供給される参照画像とを用いて、ステップS101で設定されたブロックサイズのブロック単位で、設定されたイントラ予測モードのイントラ予測処理を行い、予測画像を生成する。イントラ予測装置114は、生成された予測画像を、選択装置117を介して演算装置103に供給する。
ステップS104において、演算装置103は、入力信号に対応する画像とイントラ予測画像(イントラ予測処理により生成された予測画像)の差分を計算する。演算装置103は、計算の結果得られる差分を残差情報として直交変換装置104に供給する。
ステップS105乃至S110の処理は、図9のステップS35乃至S40の処理と同様であるので、説明は省略する。
ステップS110の処理後、処理はステップS105に戻り、インデックス番号0乃至3の角度インデックスの全てが角度インデックスに設定されるまで、ステップS105乃至S110の処理が繰り返される。そして、インデックス番号0乃至3の角度インデックスの全てが角度インデックスに設定されると、処理はステップS102に戻る。そして、イントラ予測モード番号0乃至8のイントラ予測モードの全てがイントラ予測モードに設定されるまで、ステップS102乃至S110の処理が繰り返される。
そして、イントラ予測モード番号0乃至8の全てがイントラ予測モードに設定されると、処理はステップS101に戻る。そして、4×4画素,8×8画素,16×16画素,32×32画素,64×64画素、および128×128画素の全てのサイズがイントラ予測のブロックサイズに設定されるまで、ステップS101乃至S110の処理が繰り返される。
そして、4×4画素,8×8画素,16×16画素,32×32画素,64×64画素、および128×128画素の全てのサイズがイントラ予測のブロックサイズに設定され、各ブロックサイズのブロックに対して、インデックス番号0乃至3の角度インデックスの全てが角度インデックスとして設定され、かつ、イントラ予測モード0乃至8のイントラ予測モードの全てがイントラ予測モードとして設定された場合、処理はステップS111に進む。
ステップS111において、イントラ予測装置114は、イントラ予測のブロックサイズ、イントラ予測モード、および角度インデックスの組み合わせごとに、量子化後符号情報、デコード画像からRDコストを計算する。具体的には、イントラ予測装置114は、イントラ予測のブロックサイズ、イントラ予測モード、および角度インデックスの組み合わせごとに、フレームメモリ112から供給される参照画像を用いて予測画像を生成する。そして、イントラ予測装置114は、その予測画像と画面並べ替えバッファ102から供給される画像との差分を演算する。そして、動き予測装置116は、その差分、ステップS108の処理により得られる圧縮画像の発生符号量などを用いて、上述した式(1)を演算し、RDコストを算出する。
そして、イントラ予測装置114により、イントラ予測のブロックサイズ、イントラ予測モード、および角度インデックスの組み合わせごとのRDコストから最も小さかったRDコストがRDコスト(I)として使われる。即ち、イントラ予測装置114は、イントラ予測のブロックサイズ、イントラ予測モード、および角度インデックスの組み合わせごとのRDコストのうちの最も小さかったRDコストであるRDコスト(I)と、対応する予測画像を選択装置117に供給する。
図13、図14、及び、図15は、図3のデコーダの処理のフローチャートである。
図13は、マクロブロック(MB)のデコード処理を説明するフローチャートである。
図13のステップS121において、可逆復号化装置217は、蓄積バッファ216から処理対象のマクロブロックの画像圧縮情報を読み出して取得し、その画像圧縮情報を図2の可逆符号化装置106の可逆符号化方式に対応する方式で可逆復号化する。この可逆復号化によって処理対象のマクロブロックの最適予測モードを示す情報として、イントラ予測モード情報またはインター予測モード情報が取り出される。
ステップS122において、可逆復号化装置217は、ステップS121で取り出された最適予測モードを示す情報が、イントラ予測モード情報であるかどうかを判定する。ステップS122でイントラ予測モード情報であると判定された場合、ステップS123において、デコーダは、処理対象のマクロブロック(当該MB)を、イントラ予測で復号化する。ステップS123の処理の詳細は、後述する図15を参照して説明する。
一方、ステップS122でイントラ予測モード情報ではないと判定された場合、即ちステップS121で取り出された最適予測モードを示す情報が、インター予測モード情報である場合、処理はステップS124に進む。
ステップS124において、デコーダは、処理対象のマクロブロックを、インター予測で復号化する。ステップS124の処理の詳細は、後述する図14を参照して説明する。
図14は、図13のステップS124の処理の詳細を説明するフローチャートである。
図14のステップS141において、可逆復号化装置217は、蓄積バッファ216から取得された画像圧縮情報(ストリーム情報)から、インター予測のブロックサイズ、動きベクトル(MV)、角度インデックス情報、残差情報(差分情報)に対応する量子化された係数を取り出す。具体的には、可逆復号化装置217は、画像圧縮情報を可逆復号化し、インター予測モード情報、動きベクトル、角度インデックス情報、および量子化された係数を得る。そして、可逆復号化装置217は、インター予測モード情報に対応するインター予測のブロックサイズを認識する。可逆復号化装置217は、インター予測モード情報に対応するブロックサイズのブロック単位で、量子化された係数を逆量子化装置218に供給する。また、可逆復号化装置217は、インター予測モード情報および動きベクトルを動き補償装置224に供給し、角度インデックスを逆直交変換装置219に供給する。
ステップS142において、動き補償装置224は、可逆復号化装置217から供給されるインター予測モード情報および動きベクトルに応じて、フレームメモリ223から供給される参照画像に対して動き補償処理(MC処理)を施す。そして、動き補償装置224は、動き補償処理の結果得られる予測画像を、スイッチ227を介して加算装置220に供給する。
ステップS143において、逆量子化装置218は、可逆復号化装置217から供給される量子化された係数に対して逆量子化処理を施す。具体的には、逆量子化装置218のインター予測のブロックサイズに対応する4×4Inv Quant601,8×8Inv Quant602,16×16Inv Quant603,32×32Inv Quant604,64×64Inv Quant605、または128×128Inv Quant606は、量子化された係数を逆量子化する。逆量子化装置218は、逆量子化処理の結果得られる係数を逆直交変換装置219に供給する。
ステップS144において、逆直交変換装置219は、逆量子化装置218から供給される差分情報(残差情報)に対応する係数に対して、可逆復号化装置217から供給される角度インデックスに応じて逆ROT処理等を施す。ステップS144の処理の詳細は、図11で説明した場合と同様であるので、説明は省略する。
ステップS145において、加算装置220は、動き補償装置224からスイッチ227を介して供給される予測画像(予測信号)に、ステップS144の処理の結果得られる残差情報(逆ROT情報)を加えて、デコード画像を得る。このデコード画像は、イントラ予測装置225に供給されたり、デブロックフィルタ226を介してフレームメモリ223に供給されたり、デブロックフィルタ226、画面並べ替えバッファ221、D/A変換装置222を介して外部に出力されたりする。
図15は、図13のステップS123の処理の詳細を説明するフローチャートである。
図15のステップS161において、可逆復号化装置217は、蓄積バッファ216から取得された画像圧縮情報(ストリーム情報)から、イントラ予測のブロックサイズ、イントラ予測モード、角度インデックス情報、残差情報(差分情報)に対応する量子化された係数を取り出す。具体的には、可逆復号化装置217は、画像圧縮情報を可逆復号化し、イントラ予測モード情報、角度インデックス情報、および量子化された係数を得る。そして、可逆復号化装置217は、イントラ予測モード情報からイントラ予測モードとイントラ予測のブロックサイズを認識する。可逆復号化装置217は、イントラ予測のブロックサイズのブロック単位で、量子化された係数を逆量子化装置218に供給する。また、可逆復号化装置217は、イントラ予測モード情報をイントラ予測装置225に供給し、角度インデックスを逆直交変換装置219に供給する。
ステップS162において、イントラ予測装置225は、可逆復号化装置217から供給されるイントラ予測モード情報に応じて、加算装置220から供給される参照画像に対してイントラ予測処理を行う。そして、イントラ予測装置225は、イントラ予測処理の結果得られる予測画像を、スイッチ227を介して加算装置220に供給する。
ステップS163において、逆量子化装置218は、図14のステップS143の処理と同様に、可逆復号化装置217から供給される量子化された係数に対して逆量子化処理を施す。逆量子化装置218は、逆量子化処理の結果得られる係数を逆直交変換装置219に供給する。
ステップS164において、逆直交変換装置219は、ステップS144の処理と同様に、逆量子化装置218から供給される差分情報に対応する係数に対して、可逆復号化装置217から供給される角度インデックスに応じて逆ROT処理等を施す。
ステップS165において、加算装置220は、イントラ予測装置225からスイッチ227を介して供給される予測画像(予測信号)に、ステップS164の処理の結果得られる残差情報(逆ROT情報)を加えて、デコード画像を得る。このデコード画像は、イントラ予測装置225に供給されたり、デブロックフィルタ226を介してフレームメモリ223に供給されたり、デブロックフィルタ226、画面並べ替えバッファ221、D/A変換装置222を介して外部に出力されたりする。
[本発明を適用したコンピュータの説明]
次に、上述した一連の処理は、ハードウェアにより行うこともできるし、ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には、そのソフトウェアを構成するプログラムが、汎用のコンピュータ等にインストールされる。
そこで、図16は、上述した一連の処理を実行するプログラムがインストールされるコンピュータの一実施の形態の構成例を示している。
プログラムは、コンピュータに内蔵されている記録媒体としてのハードディスク705やROM703に予め記録しておくことができる。
あるいはまた、プログラムは、リムーバブル記録媒体711に格納(記録)しておくことができる。このようなリムーバブル記録媒体711は、いわゆるパッケージソフトウエアとして提供することができる。ここで、リムーバブル記録媒体711としては、例えば、フレキシブルディスク、CD-ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc)、磁気ディスク、半導体メモリ等がある。
なお、プログラムは、上述したようなリムーバブル記録媒体711からコンピュータにインストールする他、通信網や放送網を介して、コンピュータにダウンロードし、内蔵するハードディスク705にインストールすることができる。すなわち、プログラムは、例えば、ダウンロードサイトから、ディジタル衛星放送用の人工衛星を介して、コンピュータに無線で転送したり、LAN(Local Area Network)、インターネットといったネットワークを介して、コンピュータに有線で転送することができる。
コンピュータは、CPU(Central Processing Unit)702を内蔵しており、CPU702には、バス701を介して、入出力インタフェース710が接続されている。
CPU702は、入出力インタフェース710を介して、ユーザによって、入力部707が操作等されることにより指令が入力されると、それに従って、ROM(Read Only Memory)703に格納されているプログラムを実行する。あるいは、CPU702は、ハードディスク705に格納されたプログラムを、RAM(Random Access Memory)704にロードして実行する。
これにより、CPU702は、上述したフローチャートにしたがった処理、あるいは上述したブロック図の構成により行われる処理を行う。そして、CPU702は、その処理結果を、必要に応じて、例えば、入出力インタフェース710を介して、出力部706から出力、あるいは、通信部708から送信、さらには、ハードディスク705に記録等させる。
なお、入力部707は、キーボードや、マウス、マイク等で構成される。また、出力部706は、LCD(Liquid Crystal Display)やスピーカ等で構成される。
ここで、本明細書において、コンピュータがプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。
また、プログラムは、1のコンピュータ(プロセッサ)により処理されるものであっても良いし、複数のコンピュータによって分散処理されるものであっても良い。さらに、プログラムは、遠方のコンピュータに転送されて実行されるものであっても良い。
なお、本発明の実施の形態は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。
104 直交変換装置, 105 量子化装置, 108 逆量子化装置, 109 逆直交変換装置, 218 逆量子化装置, 219 逆直交変換装置, 701 バス, 702 CPU, 703 ROM, 704 RAM, 705 ハードディスク, 706 出力部, 707 入力部, 708 通信部, 709 ドライブ, 710 入出力インタフェース, 711 リムーバブル記録媒体

Claims (7)

  1. 量子化された画像を逆量子化することで、第1の直交変換後に第2の直交変換が行われることにより求められた、前記画像の所定のサイズの低周波成分と、前記第1の直交変換により求められた、前記画像の前記低周波成分以外の成分である高周波数成分とを求める逆量子化手段と、
    前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して、前記第1の直交変換に対応する第1の逆直交変換と前記第2の直交変換に対応する第2の逆直交変換を合成した変換である第3の逆直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行う逆直交変換手段と
    を備える画像処理装置。
  2. 前記所定のサイズは、4×4画素である
    請求項1に記載の画像処理装置。
  3. 前記所定のサイズは、前記画像のサイズが4×4画素である場合4×4画素であり、前記画像のサイズが8×8画素以上である場合8×8画素であり、
    前記逆直交変換手段は、前記画像のサイズが4×4画素である場合、前記低周波数成分である前記画像に対して前記第3の逆直交変換を行い、前記画像のサイズが8×8画素以上である場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行う
    請求項1に記載の画像処理装置。
  4. 前記第1の直交変換は、DCT(Discrete Cosine Transform)であり、
    前記第2の直交変換は、ROT(Rotation transform)である
    請求項1に記載の画像処理装置。
  5. 前記画像のサイズが前記所定のサイズである場合、前記画像に対して前記第1の直交変換と前記第2の直交変換を合成した変換である第3の直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記画像に対して前記第1の直交変換を行い、前記第1の直交変換後の画像における前記所定のサイズの低周波成分に対して第2の直交変換を行う直交変換手段と、
    前記第3の直交変換後の前記所定のサイズの前記画像を量子化するか、または、前記第1の直交変換により求められた前記低周波成分以外の成分である高周波成分と前記第2の直交変換により求められた前記低周波成分を量子化する量子化手段と
    をさらに備える
    請求項1に記載の画像処理装置。
  6. 量子化された画像を逆量子化することで、第1の直交変換後に第2の直交変換が行われることにより求められた、前記画像の所定のサイズの低周波成分と、前記第1の直交変換により求められた、前記画像の前記低周波成分以外の成分である高周波数成分とを求める逆量子化手段と、
    前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して、前記第1の直交変換に対応する第1の逆直交変換と前記第2の直交変換に対応する第2の逆直交変換を合成した変換である第3の逆直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行う逆直交変換手段と
    を備える画像処理装置の、
    前記逆量子化手段が、前記低周波成分と、前記高周波数成分とを求め、
    前記逆直交変換手段が、前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して前記第3の逆直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行う
    ステップを含む画像処理方法。
  7. 量子化された画像を逆量子化することで、第1の直交変換後に第2の直交変換が行われることにより求められた、前記画像の所定のサイズの低周波成分と、前記第1の直交変換により求められた、前記画像の前記低周波成分以外の成分である高周波数成分とを求める逆量子化手段と、
    前記画像のサイズが前記所定のサイズである場合、前記低周波成分である前記画像に対して、前記第1の直交変換に対応する第1の逆直交変換と前記第2の直交変換に対応する第2の逆直交変換を合成した変換である第3の逆直交変換を行い、前記画像のサイズが前記所定のサイズより大きい場合、前記低周波数成分に対して前記第2の逆直交変換を行い、前記第2の逆直交変換後の前記低周波数成分と前記逆量子化手段により求められた前記高周波数成分に対して前記第1の逆直交変換を行う逆直交変換手段と
    して、コンピュータを機能させるためのプログラム。
JP2010241769A 2010-07-16 2010-10-28 画像処理装置、画像処理方法、及びプログラム Withdrawn JP2012039590A (ja)

Priority Applications (12)

Application Number Priority Date Filing Date Title
JP2010241769A JP2012039590A (ja) 2010-07-16 2010-10-28 画像処理装置、画像処理方法、及びプログラム
TW100121641A TW201208383A (en) 2010-07-16 2011-06-21 Image processing device, image processing method, and program
US13/809,819 US20130108185A1 (en) 2010-07-16 2011-07-08 Image processing device, image processing method, and program
KR20137000110A KR20130088114A (ko) 2010-07-16 2011-07-08 화상 처리 장치, 화상 처리 방법, 및 프로그램
AU2011277552A AU2011277552A1 (en) 2010-07-16 2011-07-08 Image processing device, image processing method, and program
BR112013000637A BR112013000637A2 (pt) 2010-07-16 2011-07-08 dispositivo de processamento de imagem, método de processamento de imagem, e, programa
EP11806719.8A EP2595384A1 (en) 2010-07-16 2011-07-08 Image processing device, image processing method, and program
CN2011800340205A CN102986223A (zh) 2010-07-16 2011-07-08 图像处理设备、图像处理方法和程序
RU2013100169/08A RU2013100169A (ru) 2010-07-16 2011-07-08 Устройство обработки изображения, способ обработки изображения и программа
CA2802439A CA2802439A1 (en) 2010-07-16 2011-07-08 Image processing device, image processing method, and program
MX2013000355A MX2013000355A (es) 2010-07-16 2011-07-08 Dispositivo de procesamiento de imagenes, metodo de procesamiento de imagenes, y programa.
PCT/JP2011/065735 WO2012008389A1 (ja) 2010-07-16 2011-07-08 画像処理装置、画像処理方法、及びプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010162279 2010-07-16
JP2010162279 2010-07-16
JP2010241769A JP2012039590A (ja) 2010-07-16 2010-10-28 画像処理装置、画像処理方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2012039590A true JP2012039590A (ja) 2012-02-23

Family

ID=45469389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010241769A Withdrawn JP2012039590A (ja) 2010-07-16 2010-10-28 画像処理装置、画像処理方法、及びプログラム

Country Status (12)

Country Link
US (1) US20130108185A1 (ja)
EP (1) EP2595384A1 (ja)
JP (1) JP2012039590A (ja)
KR (1) KR20130088114A (ja)
CN (1) CN102986223A (ja)
AU (1) AU2011277552A1 (ja)
BR (1) BR112013000637A2 (ja)
CA (1) CA2802439A1 (ja)
MX (1) MX2013000355A (ja)
RU (1) RU2013100169A (ja)
TW (1) TW201208383A (ja)
WO (1) WO2012008389A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5741076B2 (ja) * 2010-12-09 2015-07-01 ソニー株式会社 画像処理装置及び画像処理方法
JP5854612B2 (ja) * 2011-02-18 2016-02-09 ソニー株式会社 画像処理装置および方法
US9712829B2 (en) 2013-11-22 2017-07-18 Google Inc. Implementation design for hybrid transform coding scheme
JP6476900B2 (ja) * 2015-01-21 2019-03-06 富士通株式会社 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
US11375220B2 (en) * 2019-11-27 2022-06-28 Tencent America LLC Method and apparatus for video decoding using a nominal directional mode and an angular offset

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167092A (en) * 1999-08-12 2000-12-26 Packetvideo Corporation Method and device for variable complexity decoding of motion-compensated block-based compressed digital video
US7221708B1 (en) * 2002-12-16 2007-05-22 Emblaze V Con Ltd Apparatus and method for motion compensation
BRPI0414397A (pt) * 2003-09-17 2006-11-21 Thomson Licensing geração de imagem de referência adaptativa
US20080008246A1 (en) * 2006-07-05 2008-01-10 Debargha Mukherjee Optimizing video coding
KR20110017303A (ko) * 2009-08-13 2011-02-21 삼성전자주식회사 회전변환을 이용한 영상 부호화, 복호화 방법 및 장치
KR20110065092A (ko) * 2009-12-09 2011-06-15 삼성전자주식회사 회전 변환을 이용한 영상 부호화, 복호화 방법 및 장치
US9172968B2 (en) * 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US8693795B2 (en) * 2010-10-01 2014-04-08 Samsung Electronics Co., Ltd. Low complexity secondary transform for image and video compression
US20120320972A1 (en) * 2011-06-16 2012-12-20 Samsung Electronics Co., Ltd. Apparatus and method for low-complexity optimal transform selection

Also Published As

Publication number Publication date
TW201208383A (en) 2012-02-16
WO2012008389A1 (ja) 2012-01-19
EP2595384A1 (en) 2013-05-22
CA2802439A1 (en) 2012-01-19
MX2013000355A (es) 2013-01-28
US20130108185A1 (en) 2013-05-02
BR112013000637A2 (pt) 2016-05-24
RU2013100169A (ru) 2014-07-20
CN102986223A (zh) 2013-03-20
KR20130088114A (ko) 2013-08-07
AU2011277552A1 (en) 2013-01-10

Similar Documents

Publication Publication Date Title
DK3282705T3 (en) PROCEDURE FOR DECODING AND APPARATUS FOR ENCODING A PICTURE THROUGH INTRAPHIC PREDICTION.
WO2010119757A1 (ja) 画像符号化装置、方法およびプログラム、並びに、画像復号装置、方法およびプログラム
JP2014158305A (ja) 予測映像の生成方法、装置及び記録媒体
RU2679285C2 (ru) Обеспечение информации точности в устройстве кодирования изображения, способ и программа кодирования изображения, устройство декодирования изображения и способ и программа декодирования изображения
JPWO2012042646A1 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
CN103283231A (zh) 在视频编码器中参考图像的压缩和解压缩
WO2012008389A1 (ja) 画像処理装置、画像処理方法、及びプログラム
KR20120030537A (ko) 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법 및 화상 복호 방법
JP2023168518A (ja) 予測ブロック生成装置、画像符号化装置、画像復号装置、及びプログラム
JP5378939B2 (ja) 画像符号化方法、画像復号化方法、画像符号化装置、及び画像復号化装置、並びにプログラム
KR20120034044A (ko) 영상 변환 부호화/복호화 방법 및 장치
CN103154970A (zh) 视觉优化量化
JPWO2016194380A1 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
JP6564315B2 (ja) 符号化装置、復号装置、及びプログラム
JP7456441B2 (ja) 画像処理装置及び画像処理方法
JP4367354B2 (ja) 画像符号化装置
JPWO2017082304A1 (ja) 情報圧縮装置、情報圧縮方法、情報圧縮プログラム、及び、符号化装置
JP6854816B2 (ja) 符号化及び復号方法並びに対応するデバイス
JP2007266861A (ja) 画像符号化装置
JP2015186120A (ja) 符号化方式変換装置及びプログラム
JP6557483B2 (ja) 符号化装置、符号化システム、及びプログラム
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
WO2011161823A1 (ja) 動画像符号化方法および復号方法
JP6727900B2 (ja) 符号化装置、復号装置、及びプログラム
JP6154588B2 (ja) 画像符号化装置、画像復号装置及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20140107