JP5421757B2 - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP5421757B2
JP5421757B2 JP2009281585A JP2009281585A JP5421757B2 JP 5421757 B2 JP5421757 B2 JP 5421757B2 JP 2009281585 A JP2009281585 A JP 2009281585A JP 2009281585 A JP2009281585 A JP 2009281585A JP 5421757 B2 JP5421757 B2 JP 5421757B2
Authority
JP
Japan
Prior art keywords
signal
prediction
inter
intra
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009281585A
Other languages
English (en)
Other versions
JP2011124846A (ja
JP2011124846A5 (ja
Inventor
晴久 加藤
整 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Research Inc
Original Assignee
KDDI R&D Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI R&D Laboratories Inc filed Critical KDDI R&D Laboratories Inc
Priority to JP2009281585A priority Critical patent/JP5421757B2/ja
Priority to US12/961,974 priority patent/US8351721B2/en
Publication of JP2011124846A publication Critical patent/JP2011124846A/ja
Publication of JP2011124846A5 publication Critical patent/JP2011124846A5/ja
Application granted granted Critical
Publication of JP5421757B2 publication Critical patent/JP5421757B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Description

本発明は、画像を圧縮して符号化する場合の画像符号化技術に関し、特に、画像内における相関のある情報から符号対象を予測し、予測誤差を符号化することで符号化効率の向上を図る画像符号化装置に関する。
従来の画像符号化において符号化効率を向上させる方式としては、時間冗長性を削減する方法と空間冗長性を削減する方法が存在した。
時間冗長性を削減する方法としては、フレーム差分方式や動き補償方式がある。フレーム差分方式は、連続する2枚の画像を単純に減算し差分を符号化するものである。
動き補償方式は、参照フレームに対して動きベクトルを適用することで符号対象フレームの近似画像を生成し、符号対象フレームとの差分を符号化する。この動き補償方式は、画像間の相違を小さくした上で符号化するため、フレーム差分方式より符号化効率の面で優れている。
その一方、動き補償方式で用いる動きベクトルの推定方法は、時間冗長度の削減を可能とするものの、静止画には利用できないという課題があった。
符号化効率の向上のための空間冗長性削減方法としては、例えば直交変換係数を量子化する方式が存在する。この方式は、直交変換は画素信号を周波数領域に写像し、エネルギーを低域に集中させるものである。この方式によれば、人間の視覚特性が高域に敏感でないことを利用して、高域成分を量子化で除去することで符号化効率を上げることが可能となる。
また、符号化を行う場合、特許文献1に示されるように、符号化の処理対象となっている領域の周囲に存在する符号化済みブロックに対して局部復号を行うことで復号信号を生成し、この復号信号を用いて面内予測(イントラ予測)を行うことで予測信号を生成し、符号化対象となっているブロック内の信号成分と、生成した予測信号との差分によって得られる残差信号に対して、所定の直交変換および量子化を行うことで空間冗長性削減し、符号化効率の改善を図ることが一般的に行われている。
特許第3734492号
上述した直交変換と量子化の組み合わせや空間予測方法による空間冗長性削減方法は、フレーム内の空間冗長性を削減するが、同一フレームの異なる色信号については独立して処理するため、色信号の冗長性まで削減することはできないという課題があった。
本発明は上記事情に鑑みて提案されたもので、画像を分離して得られた複数の色信号の中から基準となる基準信号を適応的に選択し、この基準信号から他の信号(被予測信号)を予測することで、被予測信号の情報量を削減し符号化効率を向上させる画像符号化装置を提供することを目的としている。
上記目的を達成するため本発明は、複数の画素から構成される単位ブロックの各画素に対して信号内予測される各画素との間で差分処理を行って得られた信号内予測残差信号について直交変換・量子化・符号化を行って単位ブロック毎に符号化を行うに際し、単位ブロック内の信号内予測残差信号を一つの基準信号と被予測信号で構成される複数信号に分離し、信号間予測を行うことで色信号の冗長性の削減を可能とする。
請求項1に係る発明は、複数画素を有する複数の単位ブロックから構成される入力画像信号を直交変換・量子化・符号化を行って単位ブロック毎に符号化を行う画像符号化装置において、
直交変換・量子化された画像信号を復号することで得られた符号化済領域に該当する再構成画像信号を基に前記入力画像信号の符号化対象領域に該当する各画素に対して信号内予測するための信号内予測情報を算出する信号内予測手段と、
前記信号内予測手段からの前記信号内予測情報と前記再構成画像信号とから信号内予測信号を得る信号内補償手段と、
符号化対象領域となっている入力画像信号と前記信号内予測信号との差分処理により得られた信号内予測残差信号について基準信号と被予測信号とに分離し基準信号の各画素に対応する被予測信号の各画素について信号間予測するための信号間予測情報を算出する信号間予測手段と、
直交変換・量子化された画像信号を復号することで得られた復号信号内予測残差信号と前記信号間予測手段からの信号間予測情報とから符号化対象領域の信号間予測信号を得る信号間補償手段とを有し、
前記信号内予測残差信号と前記信号間予測信号との差分処理を行って得られた信号間予測残差信号について直交変換・量子化・符号化を行うことで前記被予測信号の各画素の符号化を行う一方、
前記信号間予測手段における基準信号及び被予測信号は、前記信号内予測残差信号を色信号に分離した分離信号であり、
前記信号間予測手段は、色信号に分離した信号から基準信号の選択及び各被予測信号への信号間予測の適用の可否について、基準信号の選択及び各被予測信号への信号間予測の全て非適用を含めた色信号の全ての組み合わせを決定する場合に、適用する信号の組み合わせを発生符号量と歪量との重み和から算出される符号化コストを最小化するように選定し、当該組み合わせを信号間予測情報として符号化を行うことを特徴としている。
請求項2は、請求項1の画像符号化装置において、前記信号間予測手段は、基準信号と被予測信号との信号間の信号を予測する場合に、前記単位ブロック毎に予測可能とし、予測する場合は単位ブロック内の画素信号毎に予測の有無を設定可能としたことを特徴としている。
請求項3は、請求項1の画像符号化装置において、前記信号間予測手段は、分離した信号から基準信号の選択及び被予測信号への信号間予測の適用の可否の組み合わせを決定する場合に、前記組み合わせを近傍画素の分散又は振幅、平均、信号内予測情報を用いて算出することを特徴としている。
請求項4は、請求項1の画像符号化装置において、前記信号間予測手段は,分離した信号から基準信号の選択及び被予測信号への信号間予測の適用の可否の組み合わせを決定する場合に、発生符号量と歪量との重み和から算出される符号化コストを最小化する基準信号及び最適な組み合わせと入力信号とから統計的機械学習によって予め辞書を作成しておき、該辞書をもとに入力された信号に対する前記組み合わせを推定することを特徴としている。
請求項5は、請求項1の画像符号化装置において、前記信号間予測手段は、変化の小さい信号を基準信号としない選択することを特徴としている。
請求項6は、請求項1の画像符号化装置において、前記信号間予測手段は、変化の大きい信号を被予測信号としない選択することを特徴としている。
請求項7は、請求項1の画像符号化装置において、前記信号間予測手段は、基準信号が選定され被予測信号について信号間予測を適用する場合に、前記信号間予測は、領域毎に予測係数を推定して行うことを特徴としている。
請求項8は、請求項7の画像符号化装置において、前記信号間予測手段における予測係数は、乗数と補正値で構成することを特徴としている。
請求項9は、請求項7の画像符号化装置において、前記信号間予測手段における予測係数は、基準信号による予測信号と被予測信号との誤差を最小になるよう推定することを特徴としている。
請求項1の画像符号化装置によれば、画像符号化装置において、画像信号を分離して得られた複数の信号の中から基準となる基準信号を適応的に選択し、その他の信号を基準信号から予測することで、空間冗長性を削減して被予測信号の情報量を削減し、符号化効率を向上させることができる。
また、基準信号及び被予測信号を色信号に分離した分離信号で信号間予測を行うことで、色信号の冗長性の削減を可能とする。
分離した信号から基準信号の選択及び各被予測信号への信号間予測の適用の可否の組み合わせを決定する信号間予測情報について、適用する信号の組み合わせを符号量及び歪み量から算出される符号化コストを最小化するように選定することで、適正な信号予測を行うことができる。
請求項2の画像符号化装置によれば、信号間の信号予測について、単位ブロック毎に予測可能とするとともに、単位ブロック内の画素信号毎に予測の有無を設定できるので、画素毎に適した信号予測を行うことができる。
請求項3の画像符号化装置によれば、分離した信号から基準信号の選択及び被予測信号への信号間予測の適用の可否の組み合わせを決定する場合に、適用する信号の組み合わせを近傍画素の分散又は振幅、平均、信号内予測情報を用いて算出することができる。
請求項4の画像符号化装置によれば、辞書をもとに入力された信号に対する基準信号及び組み合わせを推定することで、適正な信号予測を行うことができる。
請求項5の画像符号化装置によれば、変化の小さい信号を基準信号としない選択することで画質向上を図ることができる。
請求項6の画像符号化装置によれば、変化の大きい信号を被予測信号としない選択することで符号量削減を図ることができる。
請求項7の画像符号化装置によれば、基準信号が選定され被予測信号について信号間予測を適用する場合に、領域毎に予測係数を推定して行うことで、領域毎に適した信号間予測を行うことができる。
請求項8の画像符号化装置によれば、基準信号が選定され被予測信号について信号間予測を適用する場合に、乗数と補正値で構成する予測係数により信号間予測を行うことができる。
請求項9の画像符号化装置によれば、信号間予測手段における予測係数について、基準信号による予測信号と被予測信号との誤差を最小になるよう推定することで、精度良好な信号間予測を行うことができる。
本発明の画像符号化装置の実施の形態の一例を示すブロック図である。 画像符号化装置に入力される入力画像の説明図である。 画像符号化装置の信号間予測手段及び信号間補償手段における信号間予測情報及び信号間予測信号の算出手順を示すフローチャート図である。
本発明による画像符号化装置の実施形態の一例について、図1及び図2を参照しながら説明する。
本発明の画像符号化装置は、従来から存在する複数の画素から構成される単位ブロックの各画素に対して、符号化済画素から信号内予測される各画素との間で差分処理を行って得られた信号内予測残差信号について直交変換・量子化・符号化を行って単位ブロック毎に符号化を行う画像符号化装置に対して、前記単位ブロック内の信号内予測残差信号を一つの基準信号と被予測信号で構成される複数信号に分離し、複数の信号間の信号を予測する機能を付加した構成を特徴とするものである。
すなわち、本発明の画像符号化装置は、図1に示すように、直交変換で周波数領域に変換する変換手段1と、直交変換係数を量子化する量子化手段2と、量子化された直交変換係数を可変長符号化する符号化手段3と、量子化された直交変換係数を逆量子化する逆量子化手段4と、逆量子化された直交変換係数を逆変換する逆変換手段5と、空間冗長性を削減する信号内予測情報を決定する信号内予測手段6と、空間冗長性を予測して信号内予測信号を再構成する信号内補償手段7とを備えた画像符号化装置に対して、複数の信号間の信号を予測する信号間予測手段8及び信号間予測信号を得る信号間補償手段9を備えて構成されている。
第一の差分器11は、空間冗長性を削減するもので、符号化対象領域の画素について、入力画像信号と、信号内補償手段7から送られる符号化済画素から予測された信号内予測信号との差分を計算する。差分して得られた信号内予測残差信号は、信号間予測手段8及び第二の差分器12にそれぞれ送られる。
第二の差分器12は、信号間冗長性を削減するもので、符号化対象領域の画素について、第一の差分器11から送られる信号内予測残差信号と、信号間補償手段9から送られる符号化済画素から予測された信号間予測信号との差分を計算する。差分して得られた信号間予測残差信号は、変換手段1に送られる。
第一の加算器13は、信号間冗長性を補償するもので、逆変換手段5から送られる再生(復号)された信号間予測残差信号と、信号間補償手段9から送られる信号間予測信号との合計を計算することで信号内予測残差信号を再構成(復号)する。加算して得られた信号内予測残差信号は、信号間予測手段8,信号間補償手段9,第二の加算器14にそれぞれ送られる。
第二の加算器14は、信号間冗長性を補償するもので、第一の加算器13から送られる信号内予測残差信号と、信号内補償手段7から送られる信号内予測信号との合計を計算することで符号化済画素に対応する画像信号(再構成画像信号)を再構成する。加算して得られた再構成画素信号は、信号内予測手段6及び信号内補償手段7にそれぞれ送られる。
変換手段1へは、入力画像及び第二の差分器12から送られる信号間予測誤差信号が入力され、直交変換によって周波数領域に変換し、直交変換によって得られた変換係数を量子化手段2に出力する。直交変換としてはDCT乃至DCTの近似変換またはDWTなどを利用することができる。
入力画像の各ピクチャ(フレーム)は、予め規定された数の画素(例えば、32×32画素、16×16画素、8×8画素、4×4画素あるいはそれらの組み合わせ)から構成される単位ブロックに分割され、単位ブロック毎に符号化が行われる。入力画像の各ピクチャ(フレーム)は、図2に示すように、例えば色空間においてRGB信号に分離されるR信号フレーム20,G信号フレーム30,B信号フレーム40から構成される。各単位ブロックは、R信号ブロック21に対して、空間的に対応するG信号ブロック及びB信号ブロックを有して構成されている。
従前の方法で画像符号化を行う場合、RGB信号の各フレームについて、信号内予測信号に基づいて空間冗長性を削減する処理のみが行われていた。例えば、R信号ブロック21の画像に輪郭や模様等(斜線部分)が存在するような場合、画像内における相関のある周囲の情報から符号対象を予測し、予測誤差を符号化することが行われている。
本例では、変換手段1に対して、各ピクチャが単位ブロックに分割された入力画像が入力され、変換手段1では、RGBの各信号ブロックの各画素の信号若しくは、第二の差分器12から入力される信号間予測残差信号に基づいて空間的に対応する各画素との間で求めた差分値を変換することで信号間冗長性を削減する処理が行われる。
量子化手段2は、変換手段1から送られた変換係数を量子化する。量子化によって得られた量子化値は、符号化手段3及び逆量子化手段4に出力される。
量子化処理に用いられる量子化パラメータは、定数値の組み合わせとして設定することが可能である。または、変換係数の情報量に応じて制御することで出力するビットレートを一定に保つことも可能である。
符号化手段3は、量子化手段2から送られた量子化された変換係数を符号化し、符号情報として出力する。符号化は、符号間の冗長性を取り除く可変長符号又は算術符号などを利用することができる。
逆量子化手段4は、量子化処理の逆の手順を行うことで、量子化手段2から送られた量子化された変換係数を逆量子化する。逆量子化によって得られた量子化誤差を含む変換係数は逆変換手段5に送られる。
逆変換手段5は、直交変換の逆の手順を行うことで、逆量子化手段4から送られた量子化誤差を含む変換係数を逆直交変換する。逆変換によって得られた量子化誤差を含む信号間予測残差信号は第一の加算器13に送られる。
次に、本発明の画像符号化装置の特徴的構成である変換手段1に入力される信号間予測残差信号を得るために第二の差分器12に入力される信号間予測信号の算出について説明する。
信号間予測信号の算出は、信号内予測手段6及び信号内補償手段7に対して、第一の加算器13を介して信号内予測残差信号が入力される信号間予測手段8及び信号間補償手段9を設けることで行われる。以下、信号内予測手段6,信号内補償手段7,信号間予測手段8及び信号間補償手段9の各機能について説明する。
信号内予測手段6は、空間冗長性を削減する信号内予測情報を決定するものであり、第二の加算器14から送られた量子化誤差を含む符号化済画素に対応する再構成画素信号を基に、入力信号を近似するための信号内予測情報を決定する。決定された信号内予測情報は信号内補償手段7及び符号化手段3に送られる。図1中、量子化手段2への線は省略しているが、信号内予測情報の一部は量子化され符号化される。
信号内予測については、従来から各種方法が行われている。例えば一例として、規格化されているH.264のイントラ予測を利用する場合は、各イントラ予測モードで個別に符号化し、符号量と歪量から算出される符号化コストを最小化するイントラ予測モード(レート歪み最適化法)を選択し、信号内予測情報とする。例えば、図2において、R信号ブロック(単位ブロック)21の符号化を行う場合、既に符号化されている同じR信号フレーム21における斜線部分の画像(特に、直上や左部の画像)22から予測して信号内予測情報を求める。
信号内補償手段7は、空間冗長性を予測して信号内予測信号を再構成するものであり、信号内予測手段6から送られる信号内予測情報と第二の加算器14から送られる再構成画素信号から当該領域の信号内予測信号を生成する。信号内予測信号は第一の差分器11及び第二の加算器14に送られる。
信号間予測手段8は、信号間冗長性を削減する信号間予測情報を決定するものである。
信号間予測手段8は、前記単位ブロック内の信号内予測残差信号を一つの基準信号と被予測信号で構成される複数信号に分離することで複数の信号間の信号を予測する。
信号間予測手段8は、第一の加算器13から送られた量子化誤差を含む信号内予測残差信号を基に、第一の差分器11から送られた信号内予測残差信号を近似するための係数を算出する。
算出された予測係数は、信号間予測情報として信号間補償手段9及び符号化手段3に送られる。図1中、量子化手段2への線は省略しているが、信号間予測情報の一部は量子化され符号化される。
以下、信号間予測手段8による予測係数の算出及び信号間補償手段9による信号間予測信号の生成手順について、図3を参照しながら説明する。
先ず、信号間予測手段8において、予測係数の算出には入力された信号を複数の信号に分離する(ステップ51)。信号を分離する種類や数は問わないが、一例として上述したように、単位ブロックを色空間のRGB信号に分離する。また、色空間の信号に分離する場合、YUV信号,YCbCr信号等の色空間の信号を利用することも可能である。
次に、分離された信号を信号間予測手段8の基準となる基準信号と予測される被予測信号とに分類するとともに、被予測信号に対して信号間予測情報の適用の可否を判断し(ステップ52)、基準信号から信号間予測情報を算出する(ステップ53)。基準信号と被予測信号は、いずれも単一であっても複数であっても良い。基準信号は予め決定したものを固定して使用してもよいし、また、領域など一定範囲で基準信号を変化させるようにしてもよい。
例えば、入力画像に対してRGB信号で信号分離を行った場合、木の葉等の緑が多い画像に対しては、G信号を基準信号とすることで、被予測信号の滑らかさを正確に再現できるため被予測信号と予測信号との差を小さくして符号化の効率化を図ることができる。
すなわち、画像信号として変化の大きい信号を基準信号として選択することで、画質向上を図ることができる。逆に、画像信号として変化の大きい信号は符号量も多く占めるため、変化の大きい信号を被予測信号として選択することで、符号量削減を図ることができる。
被予測信号を求めるに際しては、基準信号からの信号間予測を適用するかどうかの選択が行われる。この選択は、信号間予測情報等を考慮したレート歪み最適化法で決める。
信号間予測情報の算出は、単位ブロック毎に予測可能とし、予測する場合は単位ブロック内の画素信号毎に予測の有無を設定可能とすることが好ましい。
基準信号を領域などに応じて変化させる場合は、基準信号の選定及び信号予測を適用するかどうかを表す情報を符号化(明示)することも、符号化しない(暗示する)ことも可能である。
明示する場合は、全ての信号を個別に符号化し符号量と歪量から算出される符号化コストを最小化する信号を選択し、その信号を表す情報を信号間予測情報に含める。被予測信号を限定する場合も同様に、その信号を表す情報を信号間予測情報に含める。例えば、符号化コストは、符号量をR、歪量をDとした場合、重み和(R+λD)で算出する。
すなわち、RGBの各色信号に対して、基準信号の選定及び信号間予測の適用の可否については、下のような10通りの組み合わせが存在する。
(1)Rを基準信号とする(基準),G信号間予測を適用する(適用),B適用
(2)R基準,G適用,B信号間予測を適用しない(非適用)
(3)R基準,G非適用,B適用
(4)G基準,R適用,B適用
(5)G基準,R適用,B非適用
(6)G基準,R非適用,B適用
(7)B基準,G適用,R適用
(8)B基準,G適用,R非適用
(9)B基準,G非適用,R適用
(10)非適
これらの全ての符号化コストを求め、符号化コストが最小となるものを選択することで、RGB信号に対する基準信号の選定、及び、各被予測信号に対する信号予測の適用の可否を判断することができる。
この場合(明示する場合)は、信号間予測情報に対して、例えば基準信号がRGBのどの信号であるか表示する2ビットと、被予測信号について信号間予測を適用するかどうか表示する2ビットで表現し、可変長符号化で符号化できる。
一方、暗示する場合は、変化に富んだ信号を基準信号として用いると予測の精度が向上するので、近傍画素の分散又は振幅、平均が最大となる信号を選択し、復号側も同様の手段で基準信号を選択することで、その信号を表す情報を信号間予測情報に含めないようにする。
または、変化に富んだ信号を被予測信号として用いると符号化効率が向上するので、基準信号と被予測信号との近傍画素同士の分散又は振幅、平均が最大となる信号を選択し、復号側も同様の手段で被予測信号を選択することで、その信号を表す情報を信号間予測情報に含めないようにする。
または、信号内予測が原画像の高い相関を損なわないモードを選択していれば、信号内予測誤差信号に信号間の冗長性が残るため、信号内予測情報に基づいて信号間予測の適用の是非を決定することもできる。
前記信号間予測手段は,分離した信号から基準信号と被予測信号の組み合わせを決定する場合に、予め入力信号と最適な組み合わせを統計的に機械学習させておき、生成された辞書をもとに入力された信号に対する基準信号及び組み合わせを推定するように構成してもよい。機械学習には公知のDecision Tree やRandom Forest,Neural Network など任意の識別器を用いることができる。識別器に用いる特徴量としては、符号化対象領域の近傍画素情報や信号内予測情報、入力画像信号そのものを用いる。動画像の符号化においては、辞書を予め作成しておくだけでなく、一定のフレーム毎若しくはカット点毎に上述の符号化コスト(発生符号量と歪量との重み和から算出される値)を最小化する最適な組み合わせを全探索し逐次学習を適用しても良い。
次に、基準信号が決定され、信号間予測を適用する場合に、基準信号から被予測信号を近似するための予測式と予測係数について説明する。
一例として、YUV信号の色空間の信号に分離し、Y信号を基準信号、U信号及びV信号を被予測信号とする場合、予測手段は線形結合の乗数a及び補正値bを予測係数とし、小領域単位で推定できる。ある小領域Rに属する座標ベクトルxのU信号及びV信号の予測式は数1で与えられる。
Figure 0005421757
ここで、Y(x),U(x),V(x)は、それぞれYUV信号の画素値を表す。()内のxはベクトルである。ただし、基準信号には誤差の伝播を防ぐため量子化誤差が含まれている。
予測係数は、予測誤差の2乗を最小にするように推定する。
具体的にU信号に対する予測係数a及びbについて、算出方法の一例を述べる。予測誤差の2乗E2は、数2で表される。
Figure 0005421757
このとき、2乗誤差E 2の係数a及びbによる偏微分は数3で表される。
Figure 0005421757
ここで、nは小領域Rに属する画素数を表す。
2乗誤差E2を最小化するには数3が「0」になることが必要なので、数4を解けば、予測係数a及びbを算出できる。
Figure 0005421757
数4を解くと2乗誤差E2を最小にする乗数aと補正値bは数5で求められる。
Figure 0005421757
なお、補正値bは乗数aを用いて導出できるので、乗数aを量子化して符号化する場合は、量子化誤差を含む乗数で補正値を算出することで予測精度を向上させることが可能となる。
上述の計算では、U信号に対する予測係数a及びbを求めたが、V信号に対する予測係数a及びbも数5のU(ベクトルx)をV(ベクトルx)に差し替えるだけで同様の方式を用いることが可能である。
信号間補償手段9は、信号間冗長性を予測して信号間予測信号を再構成するもので、信号間予測手段8からの信号間予測情報と、第一の加算器13からの信号内予測残差信号とから信号間予測信号を得る(ステップ54)。すなわち、信号間補償手段9は、信号間予測手段8から送られる信号間予測情報と第一の加算器13から送られる信号間予測残差信号から被予測信号を近似する信号間予測信号を生成する。生成された信号間予測信号は、第一の加算器13及び第二の差分器12に出力される。
上述の例で、信号間予測手段8が線形結合を利用し、信号間予測情報が乗数aおよび補正値bから構成されている場合は、予測信号は上述した数1で生成される。
上述した構成の画像符号化装置によれば、変換手段1で各単位ブロックの符号化対象領域の画素についての変換を行うに際して、色空間で分離された信号(RGB信号,YUV信号,YCbCr信号等)について、第二の差分器12から入力される信号間予測誤差信号に基づいて空間的に対応する各画素の差分値を変換し、量子化手段2及び符号化手段3により符号化される。
変換手段1に入力される信号間予測誤差信号は、既に符号化された画像領域の再生画素信号及び再生された信号内予測誤差信号から信号内予測及び信号間予測を行うことで算出する。
すなわち、単位ブロックの符号化対象領域の各画素信号について符号化を行う場合、符号化対象画素の周辺の符号化済の画素信号について、逆量子化手段4及び逆変換手段5を介することで、信号間予測残差信号を再生し、第一の加算器13及び第二の加算器14を介して信号内予測残差信号を再生し、信号内予測手段6及び信号内補償手段7に出力される。同時に、第一の加算器13を介して信号内予測残差信号が再生され、信号間予測手段8及び信号間補償手段9に出力される。
信号内予測手段6へは、入力画像が入力され、信号内予測情報により信号内補償手段7で信号内予測信号が生成され、第一の差分器11に出力される。
第一の差分器11では、入力画像と信号内予測信号の差分により信号内予測残差信号が生成され、信号間予測手段8及び第二の差分器12に出力される。
信号間予測手段8では、第一の差分器11からの信号内予測残差信号と、第一の加算器13からの信号内予測残差信号により信号間予測情報が算出されて信号間予測信号が生成され、第二の差分器12に出力される。
第二の差分器12では、第一の差分器11からの信号内予測残差信号と信号間予測信号の差分により信号間予測残差信号が生成され、この信号間予測残差信号が変換手段1に入力されることで、既に符号化された画像領域の画素信号からのイントラ予測を行うとともに、色空間における基準信号から他の信号を予測して被予測信号とすることで、空間冗長性を削減して被予測信号の情報量を削減し、符号化効率を向上させることができる。
上述した画像符号化装置によれば、入力信号を複数の信号に分離し、基準となる信号から他の信号を予測して被予測信号における情報の発生量を削減する信号予測を採用することで、高い符号化効率が可能となる。また、時間的冗長性などを削減する従来の予測方式と組み合わせることが可能であり、更なる符号化効率の向上を図ることが可能となる。
1…変換手段、 2…量子化手段、 3…符号化手段、 4…逆量子化手段、 5…逆変換手段、 6…信号内予測手段、 7…信号内補償手段、 8…信号間予測手段、 9…信号間補償手段、 11…第一の差分器、 12…第二の差分器、 13…第一の加算器、 14…第二の加算器、 20…R信号フレーム、 21…R信号ブロック(単位ブロック)。

Claims (9)

  1. 複数画素を有する複数の単位ブロックから構成される入力画像信号を直交変換・量子化・符号化を行って単位ブロック毎に符号化を行う画像符号化装置において、
    直交変換・量子化された画像信号を復号することで得られた符号化済領域に該当する再構成画像信号を基に前記入力画像信号の符号化対象領域に該当する各画素に対して信号内予測するための信号内予測情報を算出する信号内予測手段と、
    前記信号内予測手段からの前記信号内予測情報と前記再構成画像信号とから信号内予測信号を得る信号内補償手段と、
    符号化対象領域となっている入力画像信号と前記信号内予測信号との差分処理により得られた信号内予測残差信号について基準信号と被予測信号とに分離し基準信号の各画素に対応する被予測信号の各画素について信号間予測するための信号間予測情報を算出する信号間予測手段と、
    直交変換・量子化された画像信号を復号することで得られた復号信号内予測残差信号と前記信号間予測手段からの信号間予測情報とから符号化対象領域の信号間予測信号を得る信号間補償手段とを有し、
    前記信号内予測残差信号と前記信号間予測信号との差分処理を行って得られた信号間予測残差信号について直交変換・量子化・符号化を行うことで前記被予測信号の各画素の符号化を行う一方、
    前記信号間予測手段における基準信号及び被予測信号は、前記信号内予測残差信号を色信号に分離した分離信号であり、
    前記信号間予測手段は、色信号に分離した信号から基準信号の選択及び各被予測信号への信号間予測の適用の可否について、基準信号の選択及び各被予測信号への信号間予測の全て非適用を含めた色信号の全ての組み合わせを決定する場合に、適用する信号の組み合わせを発生符号量と歪量との重み和から算出される符号化コストを最小化するように選定し、当該組み合わせを信号間予測情報として符号化を行うことを特徴とする画像符号化装置。
  2. 前記信号間予測手段は、基準信号と被予測信号との信号間の信号を予測する場合に、前記単位ブロック毎に予測可能とし、予測する場合は単位ブロック内の画素信号毎に予測の有無を設定可能とした請求項1に記載の画像符号化装置。
  3. 前記信号間予測手段は、分離した信号から基準信号の選択及び被予測信号への信号間予測の適用の可否の組み合わせを決定する場合に、適用する信号の組み合わせを近傍画素の分散又は振幅、平均、信号内予測情報を用いて算出する請求項1に記載の画像符号化装置。
  4. 前記信号間予測手段は,分離した信号から基準信号の選択及び被予測信号への信号間予測の適用の可否の組み合わせを決定する場合に、発生符号量と歪量との重み和から算出される符号化コストを最小化する基準信号及び最適な組み合わせと入力信号とから統計的機械学習によって予め辞書を作成しておき、該辞書をもとに入力された信号に対する前記組み合わせを推定する請求項1に記載の画像符号化装置。
  5. 前記信号間予測手段は、変化の小さい信号を基準信号としない選択する請求項1に記載の画像符号化装置。
  6. 前記信号間予測手段は、変化の大きい信号を被予測信号としない選択する請求項1に記載の画像符号化装置。
  7. 前記信号間予測手段は、基準信号が選定され被予測信号について信号間予測を適用する場合に、前記信号間予測は、領域毎に予測係数を推定して行う請求項1に記載の画像符号化装置。
  8. 前記信号間予測手段における予測係数は、乗数と補正値で構成する請求項7に記載の画像符号化装置。
  9. 前記信号間予測手段における予測係数は、基準信号による予測信号と被予測信号との誤差を最小になるよう推定する請求項7に記載の画像符号化装置。
JP2009281585A 2009-12-11 2009-12-11 画像符号化装置 Expired - Fee Related JP5421757B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009281585A JP5421757B2 (ja) 2009-12-11 2009-12-11 画像符号化装置
US12/961,974 US8351721B2 (en) 2009-12-11 2010-12-07 Image encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009281585A JP5421757B2 (ja) 2009-12-11 2009-12-11 画像符号化装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013217818A Division JP5667269B2 (ja) 2013-10-18 2013-10-18 画像符号化装置、画像復号装置、画像符号化・復号装置、画像符号化・復号方法及び画像符号化・復号プログラム

Publications (3)

Publication Number Publication Date
JP2011124846A JP2011124846A (ja) 2011-06-23
JP2011124846A5 JP2011124846A5 (ja) 2012-10-25
JP5421757B2 true JP5421757B2 (ja) 2014-02-19

Family

ID=44142990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009281585A Expired - Fee Related JP5421757B2 (ja) 2009-12-11 2009-12-11 画像符号化装置

Country Status (2)

Country Link
US (1) US8351721B2 (ja)
JP (1) JP5421757B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102195103B1 (ko) 2017-06-26 2020-12-24 삼성전자주식회사 프로그램 컴파일 방법

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8805104B1 (en) * 2011-05-11 2014-08-12 Google Inc. Selecting example-based predictors based on spatial continuity
JP5753062B2 (ja) * 2011-11-16 2015-07-22 Kddi株式会社 色コンポーネント間予測型画像符号化装置および復号装置
JP5872929B2 (ja) * 2012-03-06 2016-03-01 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
US9547915B2 (en) * 2013-03-19 2017-01-17 Thomson Licensing Inter-image prediction method and device and corresponding coding method and apparatus
ES2665908T3 (es) 2013-04-08 2018-04-30 Ge Video Compression, Llc Predicción inter-componente
JP6555856B2 (ja) * 2014-06-19 2019-08-07 三菱電機株式会社 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
CN106034235B (zh) * 2015-03-11 2020-01-03 杭州海康威视数字技术股份有限公司 计算编码失真度和编码模式控制的方法及其系统
JP6416060B2 (ja) 2015-09-02 2018-10-31 株式会社東芝 画像圧縮装置、画像伸張装置および画像伝送システム
KR20170089777A (ko) * 2016-01-27 2017-08-04 한국전자통신연구원 예측을 사용하는 비디오의 부호화 및 복호화를 위한 방법 및 장치
JP7210568B2 (ja) * 2017-10-13 2023-01-23 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ブロック単位の画像符号化のためのイントラ予測モード概念
KR20190056888A (ko) * 2017-11-17 2019-05-27 삼성전자주식회사 비디오 부호화 장치 및 방법

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1553782A3 (en) 2002-05-28 2005-07-27 Sharp Kabushiki Kaisha Methods and systems for image intra-prediction mode estimation, communication, and organization
US7469069B2 (en) * 2003-05-16 2008-12-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding image using image residue prediction
KR101246915B1 (ko) * 2005-04-18 2013-03-25 삼성전자주식회사 동영상 부호화 또는 복호화 방법 및 장치
JP2006304107A (ja) * 2005-04-22 2006-11-02 Ntt Electornics Corp 符号化装置、及び、この符号化装置に適用されるプログラム
JP4726047B2 (ja) * 2005-04-26 2011-07-20 Kddi株式会社 画像符号化装置
US7903306B2 (en) * 2005-07-22 2011-03-08 Samsung Electronics Co., Ltd. Sensor image encoding and/or decoding system, medium, and method
CN101218831B (zh) * 2005-09-20 2010-07-21 三菱电机株式会社 图像解码方法以及图像解码装置
KR101256548B1 (ko) * 2005-12-30 2013-04-19 삼성전자주식회사 영상 부호화 및 복호화 장치 및 그 방법
KR101330630B1 (ko) * 2006-03-13 2013-11-22 삼성전자주식회사 최적인 예측 모드를 적응적으로 적용하여 동영상을부호화하는 방법 및 장치, 동영상을 복호화하는 방법 및장치
KR101311402B1 (ko) * 2006-03-23 2013-09-25 삼성전자주식회사 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
JP2008193627A (ja) * 2007-01-12 2008-08-21 Mitsubishi Electric Corp 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法
KR101362757B1 (ko) * 2007-06-11 2014-02-14 삼성전자주식회사 인터 컬러 보상을 이용한 영상의 부호화 방법 및 장치,복호화 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102195103B1 (ko) 2017-06-26 2020-12-24 삼성전자주식회사 프로그램 컴파일 방법

Also Published As

Publication number Publication date
US8351721B2 (en) 2013-01-08
JP2011124846A (ja) 2011-06-23
US20110142358A1 (en) 2011-06-16

Similar Documents

Publication Publication Date Title
JP5421757B2 (ja) 画像符号化装置
KR101362757B1 (ko) 인터 컬러 보상을 이용한 영상의 부호화 방법 및 장치,복호화 방법 및 장치
KR101311403B1 (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
KR101261526B1 (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
US11240496B2 (en) Low complexity mixed domain collaborative in-loop filter for lossy video coding
KR101311402B1 (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
KR101369746B1 (ko) 적응적 보간 필터를 이용한 영상 부호화, 복호화 방법 및장치
KR101403338B1 (ko) 영상의 부호화, 복호화 방법 및 장치
KR101200865B1 (ko) 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
JP5545783B2 (ja) 画像シーケンスを表す符号化されたデータのストリームを復号する方法および画像シーケンスを符号化する方法
KR101354151B1 (ko) 영상 변환 방법 및 장치, 역변환 방법 및 장치
KR20090097688A (ko) 영상의 인트라 예측 부호화/복호화 방법 및 장치
JP2010534015A (ja) 画像処理方法及び対応する電子装置
JP5909149B2 (ja) 色変換装置、符号化器および復号器ならびにそれらのプログラム
JP2004215275A (ja) 動き補償に基づいた改善されたノイズ予測方法及びその装置とそれを使用した動画符号化方法及びその装置
KR20060034277A (ko) 낮은 복잡도로 잡음을 경감하는 비디오 인코더
KR20130046377A (ko) 화소 블록 코딩 및 재구성 방법 및 대응 장치
WO2014084674A2 (ko) 잔차 변환을 이용한 인트라 예측 방법 및 장치
WO2013038888A1 (ja) 画像符号化装置及び画像復号装置
JP5667269B2 (ja) 画像符号化装置、画像復号装置、画像符号化・復号装置、画像符号化・復号方法及び画像符号化・復号プログラム
JP5358485B2 (ja) 画像符号化装置
KR101737006B1 (ko) 인지 품질 기반의 변환 부호화 고속화 방법 및 장치
JP2014222936A (ja) 画像復号装置、画像復号方法、画像符号化復号方法及び画像復号プログラム
KR102506115B1 (ko) 타겟 태스크별 양자화 테이블 생성 방법
KR101070173B1 (ko) 동영상 압축 효율을 높이기 위한 변환블록의 부호화 장치와 방법

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120910

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130501

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131122

R150 Certificate of patent or registration of utility model

Ref document number: 5421757

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees