JP5254565B2 - 動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム - Google Patents

動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム Download PDF

Info

Publication number
JP5254565B2
JP5254565B2 JP2007114669A JP2007114669A JP5254565B2 JP 5254565 B2 JP5254565 B2 JP 5254565B2 JP 2007114669 A JP2007114669 A JP 2007114669A JP 2007114669 A JP2007114669 A JP 2007114669A JP 5254565 B2 JP5254565 B2 JP 5254565B2
Authority
JP
Japan
Prior art keywords
target
signal
pixel group
approximate
adjacent pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007114669A
Other languages
English (en)
Other versions
JP2008271422A (ja
Inventor
チュンセン ブン
ティオ ケン タン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2007114669A priority Critical patent/JP5254565B2/ja
Publication of JP2008271422A publication Critical patent/JP2008271422A/ja
Application granted granted Critical
Publication of JP5254565B2 publication Critical patent/JP5254565B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラムに関するものである。
動画像データの伝送や蓄積を効率よく行うために、圧縮符号化技術が用いられる。動画像の場合はMPEG1、MPEG2、MPEG4やH.261〜H.264の方式が広く用いられている。動画像の符号化では、時間方向で隣接する他の画像を用いて符号化の対象となる対象画像についての予測信号を生成して、対象画像の画像信号と予測信号との差分を符号化することにより、データ量の削減を実現する。
例えばH.264では、1フレームの画像を16×16画素からなるブロックの領域に分割し、当該画像をこのブロック単位で符号化処理を行う。フレーム間符号化では、符号化対象となる画像内の対象ブロックについて、符号化済で復元された他のフレームを参照画像として動き検出を行い、誤差の最も少ない予測信号を決定する。次にこの対象ブロックの画像信号と該予測信号との差分値を求めて、離散コサイン変換と量子化処理を行う。そして、量子化された離散コサイン変換の係数と、予測信号を特定するための動きベクトルとをエントロピー符号化し符号化データを生成する。
画面内の符号化効率を高めるため、画面内においても予測符号化を行う。H.264の場合、対象ブロックと同じ画面内の隣接する画素群の既再生の画像信号(一旦圧縮された画像データから復元されたもの)を用いて予測信号を生成し、該予測信号を対象ブロックの画像信号から引き算して得られた差分(残差信号)を符号化する。
画面間の予測信号を生成する具体的な方法は例えば特許文献1に、画面内の予測信号を生成する具体的な方法は例えば特許文献2に、それぞれ記載されている。
一方、フェードインやフェードアウトのように部分的な輝度変化がある場合、画面間の予測信号について、さらに輝度の補正を行った上で、対象ブロックの画像信号と予測信号との差分を符号化する手法が知られている。このような輝度補正に関する従来技術は例えば特許文献3に記載されている。
米国特許公報第5200820号 米国特許公報第6765964号 米国特許公報第6934331号
しかし、従来技術における輝度補正方法では、その補正に用いられる近似パラメータ(補正パラメータや補助情報ともいう)は、受信側で正しく予測信号を補正するために必要不可欠なものであるため、これらの近似パラメータは、残差信号とともに符号化され、蓄積もしくは伝送される必要がある。したがって、圧縮されたデータの量は近似パラメータの分だけ増加してしまう。
また、予測信号の性能を高めるには、画像を従来より細かい領域に分割して、それぞれの小領域に対し輝度補正を行うことが望ましい。しかし、増加する小領域の数に比例して近似パラメータのデータ量が急増するため、全体のデータ量が増大してしまう。
更に、従来技術では、例えば輝度信号をスケーリングした上でオフセット値を加える場合、近似パラメータとして2つのパラメータが含まれることとなるが、もし対象ブロックの画像信号が予測信号に対し非線形的な変化を示す場合には、近似パラメータのパラメータ数がさらに増えることとなり、近似パラメータ等の補助情報のデータ量はさらに増大してしまう。
本発明は、上記の課題を解決し、少ない補助情報で予測信号を補正し、より精度良く対象信号に近似させることができる動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラムを提供することを目的とする。
本発明に係る動画像予測符号化装置は、入力画像を複数の領域に分割する領域分割手段と、領域分割手段により分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、予測信号生成手段により生成された近似信号と対象画素信号との残差信号を生成する残差信号生成手段と、残差信号生成手段により生成された残差信号を符号化する符号化手段と、を備え、予測信号生成手段は、所定の方法で対象領域についての予測信号を決定し、対象領域に隣接する既再生画素からなる対象隣接画素群と、予測信号を含む参照領域に対し、対象領域と対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、近似パラメータをもとに対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、ことを特徴とする。
また、本発明に係る動画像予測符号化装置は、入力画像を複数の領域に分割する領域分割手段と、領域分割手段により分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、予測信号生成手段により生成された近似信号と対象画素信号との残差信号を生成する残差信号生成手段と、残差信号生成手段により生成された残差信号を符号化する符号化手段と、を備え、予測信号生成手段は、対象領域より前に再生された画素から構成される領域を参照領域とし、対象領域に隣接する既再生画素からなる対象隣接画素群に対して、参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、対象隣接画素群と対象領域の位置関係と同じ位置関係にある、予測隣接画素群に対応した参照領域の画素信号を、対象領域についての予測信号として取得し、予測隣接画素群と対象隣接画素群とを用いて予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、近似パラメータをもとに対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、ことを特徴とする。
本発明に係る動画像予測復号装置は、圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析手段と、データ解析手段により抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元手段と、対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、予測信号生成手段により生成された近似信号と残差信号復元手段により復元された再生残差信号とを加算することによって、対象領域の対象画素信号を復元する画像復元手段と、を備え、予測信号生成手段は、所定の方法で対象領域についての予測信号を取得し、対象領域に隣接する既再生画素からなる対象隣接画素群と、予測信号を含む参照領域に対し、対象領域と対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、近似パラメータをもとに対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、ことを特徴とする。
また、本発明に係る動画像予測復号装置は、圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析手段と、データ解析手段により抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元手段と、対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、予測信号生成手段により生成された近似信号と残差信号復元手段により復元された再生残差信号とを加算することによって、対象領域の対象画素信号を復元する画像復元手段と、を備え、予測信号生成手段は、対象領域より前に再生された画素から構成される領域を参照領域とし、対象領域に隣接する既再生画素からなる対象隣接画素群に対して、参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、予測隣接画素群と対象隣接画素群とを用いて予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、対象隣接画素群と対象領域の位置関係と同じ位置関係にある、予測隣接画素群に対応した参照領域の画素信号を近似パラメータに基づいて変換することで、対象領域についての近似信号を生成する、ことを特徴とする。
本発明に係る動画像予測符号化方法は、動画像予測符号化装置により実行される動画像予測符号化方法であって、入力画像を複数の領域に分割する領域分割ステップと、領域分割ステップにより分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、予測信号生成ステップにより生成された近似信号と対象画素信号との残差信号を生成する残差信号生成ステップと、残差信号生成ステップにより生成された残差信号を符号化する符号化ステップと、を備え、予測信号生成ステップでは、所定の方法で対象領域についての予測信号を決定し、対象領域に隣接する既再生画素からなる対象隣接画素群と、予測信号を含む参照領域に対し、対象領域と対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、近似パラメータをもとに対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、ことを特徴とする。
また、本発明に係る動画像予測符号化方法は、動画像予測符号化装置により実行される動画像予測符号化方法であって、入力画像を複数の領域に分割する領域分割ステップと、領域分割ステップにより分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、予測信号生成ステップにより生成された近似信号と対象画素信号との残差信号を生成する残差信号生成ステップと、残差信号生成ステップにより生成された残差信号を符号化する符号化ステップと、を備え、予測信号生成ステップでは、対象領域より前に再生された画素から構成される領域を参照領域とし、対象領域に隣接する既再生画素からなる対象隣接画素群に対して、参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、対象隣接画素群と対象領域の位置関係と同じ位置関係にある、予測隣接画素群に対応した参照領域の画素信号を、対象領域についての予測信号として取得し、予測隣接画素群と対象隣接画素群とを用いて予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、近似パラメータをもとに対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、ことを特徴とする。
本発明に係る動画像予測復号方法は、動画像予測復号装置により実行される動画像予測復号方法であって、圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析ステップと、データ解析ステップにより抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元ステップと、対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、予測信号生成ステップにより生成された近似信号と残差信号復元ステップにより復元された再生残差信号とを加算することによって、対象領域の対象画素信号を復元する画像復元ステップと、を備え、予測信号生成ステップでは、所定の方法で対象領域についての予測信号を取得し、対象領域に隣接する既再生画素からなる対象隣接画素群と、予測信号を含む参照領域に対し、対象領域と対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、近似パラメータをもとに対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、ことを特徴とする。
また、本発明に係る動画像予測復号方法は、動画像予測復号装置により実行される動画像予測復号方法であって、圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析ステップと、データ解析ステップにより抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元ステップと、対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、予測信号生成ステップにより生成された近似信号と残差信号復元ステップにより復元された再生残差信号とを加算することによって、対象領域の対象画素信号を復元する画像復元ステップと、を備え、予測信号生成ステップでは、対象領域より前に再生された画素から構成される領域を参照領域とし、対象領域に隣接する既再生画素からなる対象隣接画素群に対して、参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、予測隣接画素群と対象隣接画素群とを用いて予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、対象隣接画素群と対象領域の位置関係と同じ位置関係にある、予測隣接画素群に対応した参照領域の画素信号を近似パラメータに基づいて変換することで、対象領域についての近似信号を生成する、ことを特徴とする。
本発明に係る動画像予測符号化プログラムは、コンピュータを、特許請求の範囲の請求項1又は2に記載の動画像予測符号化装置として機能させるための動画像予測符号化プログラムである。
本発明に係る動画像予測復号プログラムは、コンピュータを、特許請求の範囲の請求項3又は4に記載の動画像予測復号装置として機能させるための動画像予測復号プログラムである。
本発明によれば、対象領域に隣接する既再生画素からなる対象隣接画素群と、予測信号を含む参照領域に対し、対象領域と対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、該近似パラメータを用いて予測信号を変換することで対象領域についての近似信号を求める。このため、受信側でも近似パラメータを正しく導出することができ、近似パラメータを残差信号とともに符号化した上で蓄積もしくは伝送する必要がなくなり、近似パラメータによるデータ量の増加を抑えることができる。
これに伴い、画像を従来よりも細かい領域に分割して、それぞれの小領域に対し輝度補正を行う場合や、対象信号が予測信号に対し非線形的な変化を示す場合でも、近似パラメータの増加に起因した補助情報のデータ量の増加を回避しつつ、高精度な近似信号を生成することできる。
以上より、本発明によれば、少ない補助情報で高精度の近似信号を生成することができる。このため、残差信号が減少し、動画像全体の符号量を大きく減らすことができる。
以下、本発明に係る実施形態について、図1から図14を用いて説明する。
[動画像予測符号化装置について]
図1は、本実施形態に係る動画像予測符号化装置100のブロック図を示す。図1に示すように、動画像予測符号化装置100は、入力端子101、ブロック分割器102、信号生成器103、フレームメモリ104、減算器105、変換器106、量子化器107、逆量子化器108、逆変換器109、加算器110、エントロピー符号化器111、及び、出力端子112を備えている。
[動画像予測符号化装置における動作概要]
このような動画像予測符号化装置100について、以下、各構成部の動作を述べる。複数枚の画像からなる動画像の信号は入力端子101に入力される。入力された画像に対し、ブロック分割器102は、符号化処理の対象となる画像を複数の領域に分割する。本実施形態では、例えば、8×8の画素からなるブロックに分割するが、それ以外のブロックの大きさ又は形に分割してもよい。次に、信号生成器103は、符号化処理の対象となる領域(以下「対象ブロック」とよぶ)についての近似信号を生成する。本実施形態では、信号生成器103は画面間予測と画面内予測の少なくとも一方で近似信号を生成する。その生成処理は、後述する。
信号生成器103で生成された近似信号は、減算器105に送られる。減算器105は、ラインL102経由で入力される対象ブロックの信号から、ラインL103経由で入力される近似信号を引き算することで残差信号を生成する。この残差信号は変換器106により離散コサイン変換され、変換後の各係数は量子化器107により量子化される。量子化された変換後の各係数は、エントロピー符号化器111により符号化され出力端子112より送出される。
一方、後続の対象ブロックについて画面間予測と画面内予測の少なくとも一方を行うために、量子化器107により量子化された変換後の各係数は、以下のように逆変換処理され復元される。すなわち、量子化された変換後の各係数は、逆量子化器108にて逆量子化された後、逆変換器109にて逆離散コサイン変換される。これにより、残差信号が復元される。復元された残差信号は、加算器110により、ラインL103から入力された予測信号と加算される。これにより、対象ブロックの信号が再生され、該再生された信号はフレームメモリ104に格納される。なお、本実施形態では、変換器106と逆変換器109を用いているが、これらの変換器に代わる他の変換処理を用いてもよい。場合によっては、動画像予測符号化装置100が変換器106と逆変換器109を備えずに、変換処理及び逆変換処理を実行しない態様を採用してもよい。
次に、図2を用いて、動画像予測符号化装置100に設けられた信号生成器103の構成・動作について説明する。図2に示すように信号生成器103は、予測信号を生成する予測信号生成器201、近似パラメータを推定するパラメータ推定器202、及び、近似信号を生成する近似信号生成器203を備える。以下、信号生成器103の動作について、(1)画面間予測の場合、(2)画面内予測の場合の順に説明する。
[(1)画面間予測の場合]
本実施形態の画面間予測では、信号生成器103に設けられた予測信号生成器201は、過去に符号化された後に復元された再生画像を参照画像として、該参照画像から、対象ブロックについての誤差の最も小さい予測信号を与える動き情報(「動きベクトル」ともいうが本明細書では「動き情報」を用いる。)を求める。具体的には、対象ブロックの画像信号はラインL102経由で、参照画像の画像信号はL104経由で、それぞれ予測信号生成器201に入力され、予測信号生成器201は、参照画像から、対象ブロックについての誤差の最も小さい予測信号(最適な予測信号)を与える動き情報を、ブロックマッチングの方法で検出する。なお、動き情報の検出の一例は、前述した特許文献1に記載されている。本実施形態では、過去に符号化された後に復元された1枚もしくは複数枚の画像を参照画像として用いるが、場合に応じて、対象ブロックを再分割し、再分割された小領域について画面間予測を行い、動き情報を求めてもよい。この場合、各種の分割方法の各々で、対象ブロックを再分割して画面間予測を行い動き情報を求めてみて、対象ブロック全体のトータルの誤差が最も小さくなる(対象ブロック全体に対し最も効率のよい)分割方法及び該分割方法で得られた動き情報を決定することが望ましい。
このように決定された動き情報は、ラインL112経由で図1のエントロピー符号化器111に送られ、エントロピー符号化器111により符号化され出力端子112から送出される。また、上記動き情報はラインL201経由でパラメータ推定器202に送られる。パラメータ推定器202は、予測信号生成器201にて決定された動き情報により与えられる最適な予測信号をさらに近似させるための近似パラメータを以下のようにして推定する。
図3を用いて、パラメータ推定器202の動作を説明する。図3に示す領域302は、現在の処理対象とする対象ブロック302である。対象画像301のうち、対象ブロック302を含まない領域304は既に符号化された後に復元された画素(以下「既再生画素」という)からなる領域であり、対象ブロック302を含む領域305は符号化及び復元が未だ行われていない画素からなる領域である。
パラメータ推定器202は、対象ブロック302の位置情報に基づいて、該対象ブロック302に隣接する画素群303を、ラインL104経由でフレームメモリ104から取得する。本実施形態では、画素群303を「対象隣接画素群303」とよび、対象ブロック302の上と左に隣接するN/2画素を含む逆「L」字の領域にある既再生画素から構成されている。ここでNは対象ブロック302の縦または横の画素数である。
次に、パラメータ推定器202は、ラインL201経由で入力された動き情報に基づいて、参照画像306において該動き情報により与えられる最適予測信号307に隣接する画素群308を取得する。本実施形態では、動き情報によって予測信号307の左上端の画素が特定され、該左上端の画素から上と左にN/2画素を離れた逆「L」字の画素群308を取得する。この画素群308を「予測隣接画素群308」とよぶ。図3より明らかなように、予測信号307と予測隣接画素群308との位置関係は、対象ブロック302と対象隣接画素群303との位置関係に等しいことがわかる。なお、逆「L」字のほかに、対象画像301において対象ブロック302の上に位置するN×N個の画素からなるブロックを対象隣接画素群としてもよいし、対象ブロック302の左に位置するN×N個の画素からなるブロックを対象隣接画素群としてもよいし、さらに、対象ブロック302の上に位置するN×N個の画素からなるブロックと、対象ブロック302の左に位置するN×N個の画素からなるブロックの計2個のブロックを対象隣接画素群としてもよい。これらの場合、予測隣接画素群308は、対象隣接画素群303に対応させる必要がある。
さらに、パラメータ推定器202は、取得された対象隣接画素群303と予測隣接画素群308とを用いて近似パラメータを以下のように導出する。本実施形態では、以下の式(1)により、予測隣接画素群308を対象隣接画素群303の近似とする。
Figure 0005254565


ここで、x(i,j)は対象隣接画素群303にある(i,j)番目の画素であり、y(i,j)は予測隣接画素群308にある(i,j)番目の画素である。また、近似パラメータsとvを用いて予測隣接画素群308を変換する。これら近似パラメータsとvは最小2乗法で決定する。即ち、以下の式(2)に示す評価式の最小点を与えるsとvを求める。sとvはそれぞれ式(3)と式(4)に示すように対象隣接領域と予測隣接領域の全ての画素によって決定される。ここで、Mは対象隣接領域(または予測隣接領域)に含まれる画素の数である。
Figure 0005254565


なお、式(1)の代わりにそれ以外の近似式(例えば上記の式(5))を用いてもよい。式(5)を用いる場合、近似パラメータはa,b,cとなる。この場合、予測信号を湾曲させて近似することができる。
このようにして求められた近似パラメータは、動き情報とともに、図2のラインL202経由で近似信号生成器203に送られる。近似信号生成器203は、近似パラメータを用いて近似信号を生成する。具体的には、近似信号生成器203は、ラインL202経由で送られた動き情報に基づいて、ラインL104経由でフレームメモリ104から、図3の予測信号307を取得する。この予測信号307の各画素を以下の式(6)のy(i,j)として、近似パラメータsとvを用いて式(6)に示すように予測信号を変換し、近似信号の各画素x(i,j)を得る。このように求めた近似信号は、ラインL103経由で図1の減算器105に送られる。
Figure 0005254565


なお、近似信号生成器203は、必ずしもフレームメモリ104から予測信号を取得する必要はなく、例えば予測信号生成器201により決定された最適な予測信号を予測信号生成器201から取得してもよい。本実施形態では、上記の近似パラメータsとvは、符号化されて蓄積又は送信されることはない。
図4は、信号生成器103により実行される、近似信号を生成するための画面間予測処理の流れ図を示す。図4のステップ411では、予測信号生成器201は、前述したようにブロックマッチングの方法で対象ブロックに対する最適な予測信号を求める。これにより、最適な予測信号のアドレスを示す動き情報が決定され、パラメータ推定器202に入力される。ステップ412では、パラメータ推定器202は、対象ブロックに隣接する対象隣接画素群の画素を取得する。対象隣接画素群としては、例えば図3に示す対象隣接画素群303が用いられる。ステップ413では、パラメータ推定器202は、ステップ411にて決定された動き情報によって特定される予測信号、に隣接する図3の予測隣接画素群308を取得する。
次に、パラメータ推定器202は、対象隣接画素群と予測隣接画素群とを用いて近似パラメータを求める(ステップ414)。具体的には、上記式(2)の最小値を与える式(3)と式(4)を用いて、近似パラメータsとvを求める。求められた近似パラメータsとvは、動き情報とともに、近似信号生成器203に入力される。
そして、ステップ415では、近似信号生成器203は、近似パラメータsとvを用いて、動き情報によって特定される図3の予測信号307を式(6)のように変換し、近似信号x(i,j)を算出する。最後に、近似信号生成器203は、算出された近似信号を減算器105に送出する(ステップ416)。以上の図4の処理は、符号化対象の画像にある対象ブロックの全部について実行してもよいし、符号化対象の画像にある対象ブロックの一部について実行してもよい。
[(2)画面内予測の場合]
次に、本実施形態の画面内予測の場合について説明する。画面内予測では、信号生成器103に設けられた予測信号生成器201は、対象ブロックに空間的に隣接する既再生の画素値を用いて画面内予測信号を生成する。予測信号生成器201は、フレームメモリ104から、対象ブロックと同じ画面内にある既再生の画素信号を取得し、例えば図5(A)〜図5(I)に示す9通りの方法で画面内の予測信号を生成し、生成された9通りの予測信号の中から対象ブロックに最も近い(誤差の少ない)予測信号を決定し、該最も近い予測信号(最適な予測信号)を生成するための補間方法を上記9通りの方法の中から決定する。
なお、図5(A)〜図5(I)は、画面内予測で予測信号を生成する具体的な方法を示す模式図であり、該具体的な方法は例えば前述した特許文献2に記載されている。図5(A)〜図5(I)のうち、例えば図5(A)では、ブロック502は対象ブロックを示し、その対象ブロック502の境界に隣接する画素A〜Mからなる画素群501は、過去の処理において既に再生された画像信号(既再生の画像信号)である。この図5(A)では、対象ブロック502の各列に下向きの矢印が示されているように、対象ブロック502における最も左側の列の4つの画素の画像信号は全て、真上にある画素Aの画像信号と同じとする。対象ブロック502における他の列についても同様に、それぞれの真上にある画素B〜Dの画像信号と同じとする。このようにして対象ブロック502についての予測信号を生成する。また、図5(B)では、対象ブロック504の各列に右向きの矢印が示されているように、対象ブロック504における最も上の行の4つの画素の画像信号は全て、当該行の左にある画素Iの画像信号と同じとする。対象ブロック504における他の行についても同様に、それぞれの左にある画素J〜Lの画像信号と同じとする。このようにして対象ブロック504についての予測信号を生成する。また、図5(C)では、対象ブロック506の各画素の画像信号は全て、計8つの画素A〜D、I〜Lの画像信号の平均値とすることで、対象ブロック506についての予測信号を生成する。その他の図5(D)〜図5(I)では、各図内の矢印に沿った方向に位置する複数の画素の既再生画像信号に対し、該矢印に相関した所定の加重平均演算式による加重平均演算を行うことで、対象ブロックの各画素の画像信号を求め、対象ブロックについての予測信号を生成する。
このように図5(A)〜図5(I)に示す方法で生成された9通りの予測信号のそれぞれについて、対象ブロックの画素信号との差分を算出し、該差分が最も小さい予測信号を最適な予測信号として決定し、該最適な予測信号を求める際に用いた方法を最適な補間方法として決定する。
このようにして決定された補間方法に関する情報は、ラインL112経由で図1のエントロピー符号化器111に送られ、エントロピー符号化器111により符号化された上で出力端子112から出力される。また、上記補間方法に関する情報は、ラインL201経由でパラメータ推定器202に送られ、パラメータ推定器202は、以下のようにして、予測信号生成器201にて決定された最適な予測信号をさらに近似させるための近似パラメータを推定する。
図6を用いてパラメータ推定器202の動作を説明する。ブロック601は現在の処理対象とする対象ブロックである。パラメータ推定器202は、対象ブロック601の位置情報に基づいて、該対象ブロック601に隣接する画素群602をラインL104経由でフレームメモリ104から取得する。本実施形態では、対象ブロック601に隣接する画素群602を「対象隣接画素群602」とよび、対象隣接画素群602は、対象ブロック601の上と左に隣接するN/2画素を含む逆「L」字の領域にある既再生画素から構成されている。ここでNは対象ブロック601の縦または横の画素数である。
次に、パラメータ推定器202は、ラインL201経由で入力された補間方法に関する情報によって指定される補間方法で、対象隣接画素群602に隣接する画素603〜621を用いて、対象隣接画素群602に対応する補間信号を生成する。生成された補間信号は対象隣接画素群602と同じ形状をもち、同じ数の画素から構成される。この生成された補間信号は、画面内予測の場合の「予測隣接画素群」である。なお、上記の逆「L」字のほかに、対象ブロック601の上に位置するN×N個の画素からなるブロックを対象隣接画素群としてもよいし、対象ブロック601の左に位置するN×N個の画素からなるブロックを対象隣接画素群としてもよいし、さらに、対象ブロック601の上に位置するN×N個の画素からなるブロックと、対象ブロック601の左に位置するN×N個の画素からなるブロックの計2個のブロックを対象隣接画素群としてもよい。これらの場合、予測隣接画素群は、対象隣接画素群に対応させる必要がある。
次に、パラメータ推定器202は、対象隣接画素群602と上記のように補間により生成した予測隣接画素群とを用いて近似パラメータを以下のように導出する。本実施形態では、前述した式(1)により、予測隣接画素群を対象隣接画素群602の近似とする。
式(1)でのx(i,j)は対象隣接画素群602にある(i,j)番目の画素であり、y(i,j)は予測隣接画素群にある(i,j)番目の画素である。sとvは近似パラメータであり、これら近似パラメータsとvは、前述した式(2)に示す評価式の最小点を与えるsとvを算出することで求める。なお、式(1)の代わりにそれ以外の近似式(例えば前述した式(5))を用いてもよい。式(5)を用いる場合、近似パラメータはa,b,cとなる。この場合、予測信号を湾曲させて近似することができる。
このようにして求めた近似パラメータは、補間方法に関する情報とともに、図2のラインL202経由で近似信号生成器203に送られる。近似信号生成器203は、近似パラメータを用いて近似信号を生成する。具体的には、近似信号生成器203は、ラインL104経由でフレームメモリ104から、対象ブロックに隣接する画素(図5の画素A〜M)を取得し、ラインL202経由で入力された補間方法に関する情報に基づいて、予測信号を生成する。この予測信号の各画素を前述した式(6)のy(i,j)として、近似パラメータsとvを用いて式(6)に示すように予測信号を変換し、近似信号の各画素x(i,j)を得る。このように求めた近似信号は、ラインL103経由で図1の減算器105に送られる。
なお、近似信号生成器203は、必ずしも予測信号を生成する必要はなく、例えば予測信号生成器201により決定された最適な予測信号を予測信号生成器201から取得してもよい。本実施形態では、上記の近似パラメータsとvは、符号化されて蓄積又は送信されることはない。
図7は、信号生成器103により実行される、近似信号を生成するための画面内予測処理の流れ図を示す。図7のステップ711では、予測信号生成器201は、前述したように図5(A)〜図5(I)に示す9通りの方法の中から、周辺画素を用いて対象ブロックについての最適な予測信号を決定し、該最適な予測信号を求めることができる補間方法(即ち、最適な補間方法)を決定する。これにより、最適な補間方法が決定され、該補間方法に関する情報はパラメータ推定器202に入力される。ステップ712では、パラメータ推定器202は、対象ブロックに隣接する対象隣接画素群の画素を取得する。対象隣接画素群としては、例えば図6に示す対象隣接画素群602が用いられる。ステップ713では、パラメータ推定器202は、ステップ711にて決定された補間方法に従って、対象隣接画素群の周辺画素(図6の画素603〜621)を用いて対象隣接画素群602に対応する予測隣接画素群の補間信号を生成する。
次に、パラメータ推定器202は、対象隣接画素群と予測隣接画素群とを用いて近似パラメータを求める(ステップ714)。具体的には、前述した式(2)の最小値を与える式(3)と式(4)を用いて、近似パラメータsとvを求める。求められた近似パラメータsとvは、ステップ711にて決定された補間方法に関する情報とともに、近似信号生成器203に入力される。
そして、ステップ715では、近似信号生成器203は、近似パラメータを用いて近似信号を生成する。具体的には、近似信号生成器203は、ラインL104経由でフレームメモリ104から、対象ブロックに隣接する画素(図5の画素A〜M)を取得し、ラインL202経由で入力された補間方法に関する情報に基づいて、予測信号を生成する。さらに近似信号生成器203は、近似パラメータsとvを用いて、上記予測信号を、前述した式(6)により変換し、近似信号x(i,j)を算出する。最後に、近似信号生成器203は、算出された近似信号を減算器105に送出する(ステップ716)。以上の図7の処理は、符号化対象の画像にある対象ブロックの全部について実行してもよいし、符号化対象の画像にある対象ブロックの一部について実行してもよい。
[信号生成器の別の形態]
図8は、本実施形態に係る信号生成器103の別の形態を示すブロック図である。この図8に示す信号生成器103には、図1のラインL102とラインL112が接続されていない。それ以外の構成については、図8の信号生成器103は図2の信号生成器と同じである。なお、動画像予測符号化装置に図8の信号生成器と図2の信号生成器の両方を設け、これらの信号生成器を切り替えて動作させる構成としてもよい。以下、図8に示す信号生成器103の動作を述べる。
信号生成器103に設けられた予測信号生成器801は、対象ブロックについての最適な予測信号を生成する。再び図3を用いて予測信号生成器801の処理を説明する。現在の処理対象となる対象ブロック302は、システム全体の制御部(不図示)によって管理されている位置情報によって特定される。予測信号生成器801は、対象ブロック302の位置情報に基づいて、該対象ブロック302に隣接する画素群303を、ラインL104経由でフレームメモリ104から取得する。本実施形態では、画素群303を「対象隣接画素群303」とよび、この対象隣接画素群は、対象ブロック302の上と左に隣接するN/2画素を含む逆「L」字の領域にある既再生された画素から構成されている。ここでNは対象ブロック302の縦または横の画素数である。
次に、予測信号生成器801は、対象画像301とは異なる参照画像306にある参照領域309の範囲内で、対象隣接画素群303との間で最も誤差の少ない画素群を求める。具体的には、予測信号生成器801は、参照領域309の範囲内にある画素群を一画素ずつ、ずらしながら、該画素群と対象隣接画素群303とのマッチングをとり、画素群同士の差分の絶対値の和が最も小さいものを見つけ、該差分の絶対値の和が最も小さくなる画素群を対象隣接画素群303についての予測信号とする。この予測信号を「予測隣接画素群」とよぶ。図3では画素群308を、対象隣接画素群303についての予測隣接画素群308として取得する。そして、予測信号生成器801は、対象隣接画素群303と対象ブロック302の位置関係と同じ位置関係にある、予測隣接画素群308に対応した領域307の画素信号を、対象ブロック302についての予測信号307として取得する。このようなマッチング方法はテンプレートマッチングと呼ぶ。上記のように逆「L」字の対象隣接画素群を用いたマッチングを行うことにより、対象ブロックについての予測信号を特定することができる。そのため、予測信号を特定するための動き情報を符号化する必要がない。
次に、パラメータ推定器802は、上記のように取得した対象隣接画素群303と予測隣接画素群308とを用いて、前述した方法で近似パラメータを導出する。導出した近似パラメータは近似信号生成器803に送られ、近似信号生成器803は、前述した方法で近似パラメータを用いて予測信号307を変換することで、対象ブロック302についての近似信号を生成する。生成された近似信号は、ラインL103経由で図1の減算器105に送られる。
なお、上記の方法では、対象画像301とは異なる参照画像306を参照領域としたが、対象画像301にある既再生画素からなる領域304又は該領域304の一部を参照領域とし、上記と同様にマッチング処理を行うことにより画面内予測を実現することができる。この場合、受信側でも、同じマッチング処理を行うことにより対象ブロックについての予測信号を特定することができる。そのため、動画像予測符号化装置において、予測信号を生成するための補間方法に関する情報を符号化し送信する必要がない。
図9は、図8に示した実施形態による近似信号を生成するための予測処理の流れ図である。図9のステップ911では、予測信号生成器801は、対象ブロック302の位置情報に基づいて、該対象ブロック302に隣接する対象隣接画素群303を、ラインL104経由でフレームメモリ104から取得し、前述したテンプレートマッチングの方法で、対象隣接画素群303との間で最も誤差の少ない予測隣接画素群308を参照領域から取得する。次のステップ912で予測信号生成器801は、対象隣接画素群303と対象ブロック302の位置関係と同じ位置関係にある、予測隣接画素群308に対応した領域307の画素信号を、対象ブロック302についての予測信号307として取得する。
次にステップ913では、パラメータ推定器802は、上記のように取得した対象隣接画素群303と予測隣接画素群308とを用いて、前述した方法で近似パラメータを求める。具体的には、前述した式(2)の最小値を与える式(3)と式(4)を用いて、近似パラメータsとvを求める。
求められた近似パラメータsとvは近似信号生成器803に送られ、近似信号生成器803は、前述した方法で近似パラメータsとvを用いて予測信号を式(6)のように変換することで、対象ブロック302についての近似信号x(i,j)を生成する(ステップ914)。最後に、近似信号生成器803は、生成した近似信号を図1の減算器105に出力する(ステップ915)。
なお、以上の図9の処理は、符号化対象の画像にある対象ブロックの全部について実行してもよいし、符号化対象の画像にある対象ブロックの一部について実行してもよい。また、ステップ914で変換される予測信号は、近似信号生成器803が生成したものでもよいし、ステップ912で予測信号生成器801により生成され近似信号生成器803に送られたものでもよい。
[動画像予測復号装置について]
次に、本実施形態に係る動画像予測復号装置について説明する。図10は、本実施形態に係る動画像予測復号装置1000のブロック図を示す。図10に示すように、動画像予測復号装置1000は、入力端子1001、データ解析器1002、逆量子化器1003、逆変換器1004、加算器1005、信号生成器1008、フレームメモリ1007、及び、出力端子1006を備えている。
[動画像予測復号装置における動作概要]
このような動画像予測復号装置1000について、以下、各構成部の動作を述べる。上述した図1の動画像予測符号化装置100により圧縮符号化された圧縮データは入力端子1001から入力される。この圧縮データには、符号化された残差信号、量子化パラメータ、及び、近似信号の生成に関連する情報が含まれている。近似信号の生成に関連する情報としては、前述した画面間予測のための動き情報、及び画面内予測のための補間方法に関する情報の少なくとも一方が含まれる。なお、テンプレートマッチングにより近似信号を生成する場合には、近似信号の生成に関連する情報は含まれない。
データ解析器1002は、圧縮データより、対象ブロックの残差信号、近似信号の生成に関連する情報、量子化パラメータを抽出する。このうち対象ブロックの残差信号と量子化パラメータはラインL1002経由で逆量子化器1003に送られ、逆量子化器1003は量子化パラメータをもとに対象ブロックの残差信号を逆量子化する。逆量子化後の残差信号はラインL1003経由で逆変換器1004に送られ、逆変換器1004は該逆量子化後の残差信号を逆離散コサイン変換する。これにより残差信号は復元され、復元された残差信号はラインL1004経由で加算器1005に送られる。
一方、近似信号の生成に関連する情報はラインL1002b経由で信号生成器1008に送られ、信号生成器1008は、近似信号の生成に関連する情報をもとに、ラインL1007経由でフレームメモリ1007から参照信号を取得し、後述する方法で近似信号を生成する。この近似信号はラインL1008経由で加算器1005に送られ、加算器1005は上記復元された残差信号と近似信号とを加算することで対象ブロック信号を再生する。再生された対象ブロック信号は、ラインL1005経由で、出力端子1006から外部へ出力されるとともにフレームメモリ1007に格納される。
次に、図11を用いて、動画像予測復号装置1000に設けられた信号生成器1008の構成・動作について説明する。図11に示すように信号生成器1008は、近似パラメータを推定するパラメータ推定器1101、及び、近似信号を生成する近似信号生成器1102を備える。以下、信号生成器1008の動作について、(1)画面間予測の場合、(2)画面内予測の場合の順に説明する。
[(1)画面間予測の場合]
本実施形態の画面間予測では、信号生成器1008に設けられたパラメータ推定器1101は、予測信号を変換するための近似パラメータを以下のようにして推定する。具体的には、パラメータ推定器1101は、現在の復号対象となる対象ブロックの位置情報に基づいて、該対象ブロックに隣接する画素群をラインL1007経由でフレームメモリ1007から取得する。対象ブロックの位置情報は、システム全体の制御部(不図示)によって管理されている。本実施形態では、対象ブロックに隣接する画素群を「対象隣接画素群」とよび、図3では対象隣接画素群303が該当する。
次に、パラメータ推定器1101は、参照画像からラインL1002b経由で送られた動き情報によって特定される予測信号に隣接する画素群を取得する。この画素群を「予測隣接画素群」とよぶ。予測隣接画素群と予測信号との位置関係は、対象隣接画素群と対象ブロックとの位置関係と同じである。
そして、パラメータ推定器1101は、取得した対象隣接画素群x(i,j)と予測隣接画素群y(i,j)とを用いて近似パラメータを導出する。本実施形態では、前述した式(2)の最小値を与える式(3)と式(4)を用いて、近似パラメータsとvを求める。これらの近似パラメータsとvはラインL1101経由で近似信号生成器1102に送られる。
近似信号生成器1102は、ラインL1002b経由で送られた動き情報をもとに、対象ブロックに対応した予測信号をフレームメモリ1007から取得する。次に、近似信号生成器1102は、近似パラメータsとvを用いて、予測信号を式(6)のように変換し、近似信号の各画素x(i,j)を得る。このように求めた近似信号は、ラインL1008経由で図10の加算器1005に送られる。
[(2)画面内予測の場合]
画面内予測の場合も画面間予測と類似する処理で近似信号が生成される。具体的には、パラメータ推定器1101は、現在の復号対象となる対象ブロックの位置情報に基づいて、該対象ブロックに隣接する画素群(対象隣接画素群)をラインL1007経由でフレームメモリ1007から取得する。対象ブロックの位置情報はシステム全体の制御部(不図示)によって管理されている。対象隣接画素群は例えば図6の画素群602に該当する。
次に、パラメータ推定器1101は、ラインL1002b経由で送られた補間方法に関する情報に基づいて対象隣接画素群についての補間信号を生成する。具体的には、パラメータ推定器1101は、ラインL1002b経由で送られた補間方法に関する情報によって特定される補間方法で、対象隣接画素群に隣接する画素(図6の画素603〜621)を用いて、対象隣接画素群に対応した補間信号(予測隣接画素群)を生成する。生成された予測隣接画素群は対象隣接画素群と同じ形状をもち、同じ数の画素から構成される。
さらに、パラメータ推定器1101は、このようにして生成された予測隣接画素群y(i,j)と対象隣接画素群x(i,j)とを用いて近似パラメータを導出する。本実施形態では、前述した式(2)の最小値を与える式(3)と式(4)を用いて近似パラメータsとvを求める。これらの近似パラメータsとvはラインL1101経由で近似信号生成器1102に送られる。
近似信号生成器1102は、ラインL1002b経由で入力される補間方法に関する情報により特定される補間方法で、対象ブロックの周辺にある既に再生された画素を用いて予測信号を生成する。具体的には、近似信号生成器1102は、ラインL1007経由でフレームメモリ1007から、対象ブロックに隣接する画素(図5の画素A〜M)を取得し、ラインL1002b経由で送られた補間方法に関する情報に基づいて、予測信号を生成する。この予測信号の各画素を式(6)のy(i,j)とし、近似パラメータsとvを用いて式(6)に示すように予測信号を変換することで、近似信号の各画素x(i,j)を求める。求められた近似信号はラインL1008経由で加算器1005に送られる。
図12は、信号生成器1008により実行される、近似信号を生成するための予測処理の流れ図を示す。この流れ図は、画面間予測の場合と画面内予測の場合で共通なので、以下、両方の場合を併せて説明する。
図12のステップ1211では、パラメータ推定器1101は、現在の復号対象となる対象ブロックの位置情報に基づいて、該対象ブロックに隣接する画素群(対象隣接画素群)をラインL1007経由でフレームメモリ1007から取得する。次にステップ1212では、パラメータ推定器1101は、外部から入力された識別情報に基づいて、予測隣接画素群の信号を取得もしくは生成する。画面間予測の場合は、識別情報は動き情報であり、パラメータ推定器1101は動き情報に基づいて予測隣接画素群を取得する。一方、画面内予測の場合は、識別情報は補間方法に関する情報であり、パラメータ推定器1101は、補間方法に関する情報に基づいて予測隣接画素群を生成する。次のステップ1213では、パラメータ推定器1101は、対象隣接画素群と予測隣接画素群とから上述した方法で近似パラメータを求める。求められた近似パラメータは、近似信号生成器1102へ送られる。
次のステップ1214では、近似信号生成器1102は、ステップ1212と同じ識別情報に基づいて、予測信号を取得もしくは生成する。画面間予測の場合は、識別情報は動き情報であり、近似信号生成器1102は動き情報に基づいて予測信号を取得する。一方、画面内予測の場合は、識別情報は補間方法に関する情報であり、近似信号生成器1102は、補間方法に関する情報に基づいて予測信号を生成する。さらにステップ1215では、近似信号生成器1102は、取得または生成された予測信号を、ステップ1213で求められた近似パラメータにより変換することで、近似信号を生成する。生成された近似信号はラインL1008経由で加算器1005に出力される(ステップ1216)。
なお、動画像予測符号化装置における図2の信号生成器103は、動画像予測復号装置における図11の信号生成器1008に対応し、信号生成処理の流れ図(画面間予測の場合は図4、画面内予測の場合は図7)は図12の流れ図に対応する。
ところで、図8に示す信号生成器103の別の形態は、動画像予測符号化装置に設けられた場合と、動画像予測復号装置に設けられた場合とで同じ動作をし、図9の信号生成処理の流れ図も同様に、符号化処理と復号処理とで同じ処理となる。即ち、動画像予測復号装置に設けられた信号生成器103は、前述した動画像予測符号化装置に設けられた場合の動作と同じ動作をするため、ここでは、重複した説明は省略する。
つまり、受信側となる動画像予測復号装置の信号生成器103でも、動画像予測符号化装置の信号生成器と同じマッチング処理を行うことにより、対象ブロックについての予測信号を特定することができる。そのため、動画像予測復号装置は、動画像予測符号化装置から、予測信号を生成するための補間方法に関する情報を受信する必要がない。
[動画像予測符号化プログラム・動画像予測復号プログラムと動作環境]
ところで、動画像予測符号化装置に係る発明は、コンピュータを動画像予測符号化装置として機能させるための動画像予測符号化プログラムに係る発明として捉えることができる。また、動画像予測復号装置に係る発明は、コンピュータを動画像予測復号装置として機能させるための動画像予測復号プログラムに係る発明として捉えることができる。動画像予測符号化プログラム及び動画像予測復号プログラムは、例えば、記録媒体に格納されて提供される。記録媒体としては、フレキシブルディスク、CD−ROM、DVD等の記録媒体や、半導体メモリ等が例示される。
図13は、記録媒体10に記録されたプログラムを実行するためのコンピュータ30のハードウェア構成を示す図であり、図14は、記録媒体10に記録されたプログラムを実行するためのコンピュータ30の斜視図である。ここでのコンピュータ30としては、CPUを具備しソフトウエアによる処理や制御を行うDVDプレーヤ、セットトップボックス、携帯電話などを含む。
図13に示すように、コンピュータ30は、フレキシブルディスクドライブ装置、CD−ROMドライブ装置、DVDドライブ装置等の読み取り装置12と、オペレーティングシステムを常駐させた作業用メモリ(RAM)14と、記録媒体10に記憶されたプログラムを記憶するメモリ16と、ディスプレイ18と、入力装置であるマウス20及びキーボード22と、データ等の送受信を行うための通信装置24と、プログラムの実行を制御するCPU26とを備えている。コンピュータ30は、記録媒体10が読み取り装置12に挿入されると、読み取り装置12から記録媒体10に格納された動画像予測符号化プログラム及び動画像予測復号プログラムにアクセス可能になり、当該動画像予測符号化プログラム及び動画像予測復号プログラムによって、コンピュータ30は、本実施形態に係る動画像予測符号化装置及び動画像予測復号装置として動作することが可能になる。
図14に示すように、動画像予測符号化プログラム及び動画像予測復号プログラムは、搬送波に重畳されたコンピュータデータ信号40として、有線ネットワーク・無線ネットワークを介して提供されるものであってもよい。この場合、コンピュータ30は、通信装置24によって受信した動画像予測符号化プログラム及び動画像予測復号プログラムをメモリ16に格納し、当該動画像予測符号化プログラム及び動画像予測復号プログラムを実行することができる。
以上説明した本実施形態によれば、既再生画素からなる対象隣接画素群と、予測信号を含む予測ブロックに対し、対象隣接画素群と対象ブロックの位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、予測隣接画素群を対象隣接画素群に近似させるための近似パラメータを決定し、該近似パラメータを用いて予測信号を変換することで対象ブロックについての近似信号を求めるため、受信側でも近似パラメータを正しく導出することができ、近似パラメータを残差信号とともに符号化した上で蓄積もしくは伝送する必要がなくなり、近似パラメータによるデータ量の増加を抑えることができる。
これに伴い、画像を従来よりも細かいブロックに分割して、それぞれの小ブロックに対し輝度補正を行う場合や、対象信号が予測信号に対し非線形的な変化を示す場合でも、近似パラメータの増加に起因した補助情報のデータ量の増加を回避しつつ、高精度な近似信号を生成することできる。
以上より、少ない補助情報で高精度の近似信号を生成することができ、残差信号が減少し、動画像全体の符号量を大きく減らすことができる。
なお、受信側で上述の方法に従い近似パラメータを導出せずに、圧縮データの中に近似パラメータを示す関連情報(近似パラメータそのものか、あらかじめ定められた近似パラメータを識別するための識別情報)を含め、受信側でその近似パラメータを示す関連情報を抽出した上で、補間方法によって指定された方法に従い生成した予測信号、もしくはテンプレートマッチングで決定した予測信号にその近似パラメータを適用して近似信号を生成する。また、図5に示す補間方法の場合、近似パラメータを対象ブロックの境界に隣接する画素群(図5のA〜M)に直接に適用した上で予測信号を生成してもよい。
また、上記の近似方法を予測信号に適用するかどうかについて動画像予測符号化装置が決定した上で、近似方法を適用する場合に識別情報「1」を、近似方法を適用しない場合に「0」を、動画像予測復号装置に送信してもよい。この識別情報はシーケンス単位、フレーム単位または小領域単位で送受信される。識別情報の決定方法としては、例えば、予測信号と対象ブロックの信号との誤差値Aと、予測信号に近似パラメータを適用することによって生成された近似信号と対象ブロックの信号との誤差値Bとを求め、誤差値Aが誤差値Bより大きい場合に識別情報を「1」とし、誤差値Bが誤差値Aより大きい場合に識別情報を「0」とする方法を採用することができる。そして、動画像予測復号装置は、受信された識別情報をもとに近似信号を生成する。すなわち、動画像予測復号装置は、識別情報が「1」のときには上述した方法で予測信号を生成した上で近似パラメータを適用して近似信号を生成し、識別情報が「0」のときには近似パラメータを適用しないで予測信号をそのまま近似信号とする。
本実施形態の動画像予測符号化装置を示すブロック図である。 動画像予測符号化装置に用いられる信号生成器を示すブロック図である。 近似信号の生成を説明するための模式図である。 動画像予測符号化装置で実行される画面間予測に係る近似信号生成の第1の処理を示す流れ図である。 画面内予測で予測信号を生成する具体的な方法を示す模式図である。 画面内における近似信号の生成を説明するための模式図である。 動画像予測符号化装置で実行される画面内予測に係る近似信号生成の第2の処理を示す流れ図である。 動画像予測符号化装置及び動画像予測復号装置に用いられる別の信号生成器を示すブロック図である。 図8の信号生成器によりテンプレートマッチングで近似信号を生成するため第3の処理を示す流れ図である。 本実施形態の動画像予測復号装置を示すブロック図である。 動画像予測復号装置に用いられる信号生成器を示すブロック図である。 動画像予測復号装置で実行される画面間予測及び画面内予測に係る近似信号生成の処理を示す流れ図である。 記録媒体に記録されたプログラムを実行するためのコンピュータのハードウェア構成を示す図である 記録媒体に記憶されたプログラムを実行するためのコンピュータの斜視図である。
符号の説明
10…記録媒体、12…読み取り装置、14…作業用メモリ、16…メモリ、18…ディスプレイ、20…マウス、22…キーボード、24…通信装置、30…コンピュータ、40…コンピュータデータ信号、100…動画像予測符号化装置、101…入力端子、102…ブロック分割器、103…信号生成器、104…フレームメモリ、105…減算器、106…変換器、107…量子化器、108…逆量子化器、109…逆変換器、110…加算器、111…エントロピー符号化器、112…出力端子、201…予測信号生成器、202…パラメータ推定器、203…近似信号生成器、801…予測信号生成器、802…パラメータ推定器、803…近似信号生成器、1000…動画像予測復号装置、1001…入力端子、1002…データ解析器、1003…逆量子化器、1004…逆変換器、1005…加算器、1006…出力端子、1007…フレームメモリ、1008…信号生成器、1101…パラメータ推定器、1102…近似信号生成器。

Claims (10)

  1. 入力画像を複数の領域に分割する領域分割手段と、
    前記領域分割手段により分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、
    前記予測信号生成手段により生成された近似信号と前記対象画素信号との残差信号を生成する残差信号生成手段と、
    前記残差信号生成手段により生成された残差信号を符号化する符号化手段と、
    を備え、
    前記予測信号生成手段は、所定の方法で前記対象領域についての予測信号を決定し、前記対象領域に隣接する既再生画素からなる対象隣接画素群と、前記予測信号を含む参照領域に対し、前記対象領域と前記対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記近似パラメータをもとに前記対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、
    ことを特徴とする動画像予測符号化装置。
  2. 入力画像を複数の領域に分割する領域分割手段と、
    前記領域分割手段により分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、
    前記予測信号生成手段により生成された近似信号と前記対象画素信号との残差信号を生成する残差信号生成手段と、
    前記残差信号生成手段により生成された残差信号を符号化する符号化手段と、
    を備え、
    前記予測信号生成手段は、前記対象領域より前に再生された画素から構成される領域を参照領域とし、前記対象領域に隣接する既再生画素からなる対象隣接画素群に対して、前記参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、前記対象隣接画素群と前記対象領域の位置関係と同じ位置関係にある、前記予測隣接画素群に対応した参照領域の画素信号を、前記対象領域についての予測信号として取得し、前記予測隣接画素群と前記対象隣接画素群とを用いて前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記近似パラメータをもとに前記対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、
    ことを特徴とする動画像予測符号化装置。
  3. 圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析手段と、
    前記データ解析手段により抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元手段と、
    前記対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、
    前記予測信号生成手段により生成された近似信号と前記残差信号復元手段により復元された再生残差信号とを加算することによって、前記対象領域の対象画素信号を復元する画像復元手段と、
    を備え、
    前記予測信号生成手段は、所定の方法で前記対象領域についての予測信号を取得し、前記対象領域に隣接する既再生画素からなる対象隣接画素群と、前記予測信号を含む参照領域に対し、前記対象領域と前記対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記近似パラメータをもとに前記対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、
    ことを特徴とする動画像予測復号装置。
  4. 圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析手段と、
    前記データ解析手段により抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元手段と、
    前記対象領域の対象画素信号についての近似信号を生成する予測信号生成手段と、
    前記予測信号生成手段により生成された近似信号と前記残差信号復元手段により復元された再生残差信号とを加算することによって、前記対象領域の対象画素信号を復元する画像復元手段と、
    を備え、
    前記予測信号生成手段は、前記対象領域より前に再生された画素から構成される領域を参照領域とし、前記対象領域に隣接する既再生画素からなる対象隣接画素群に対して、前記参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、前記予測隣接画素群と前記対象隣接画素群とを用いて前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記対象隣接画素群と前記対象領域の位置関係と同じ位置関係にある、前記予測隣接画素群に対応した参照領域の画素信号を前記近似パラメータに基づいて変換することで、前記対象領域についての近似信号を生成する、
    ことを特徴とする動画像予測復号装置。
  5. 動画像予測符号化装置により実行される動画像予測符号化方法であって、
    入力画像を複数の領域に分割する領域分割ステップと、
    前記領域分割ステップにより分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、
    前記予測信号生成ステップにより生成された近似信号と前記対象画素信号との残差信号を生成する残差信号生成ステップと、
    前記残差信号生成ステップにより生成された残差信号を符号化する符号化ステップと、
    を備え、
    前記予測信号生成ステップでは、所定の方法で前記対象領域についての予測信号を決定し、前記対象領域に隣接する既再生画素からなる対象隣接画素群と、前記予測信号を含む参照領域に対し、前記対象領域と前記対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記近似パラメータをもとに前記対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、
    ことを特徴とする動画像予測符号化方法。
  6. 動画像予測符号化装置により実行される動画像予測符号化方法であって、
    入力画像を複数の領域に分割する領域分割ステップと、
    前記領域分割ステップにより分割された複数の領域のうちの処理対象である対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、
    前記予測信号生成ステップにより生成された近似信号と前記対象画素信号との残差信号を生成する残差信号生成ステップと、
    前記残差信号生成ステップにより生成された残差信号を符号化する符号化ステップと、
    を備え、
    前記予測信号生成ステップでは、前記対象領域より前に再生された画素から構成される領域を参照領域とし、前記対象領域に隣接する既再生画素からなる対象隣接画素群に対して、前記参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、前記対象隣接画素群と前記対象領域の位置関係と同じ位置関係にある、前記予測隣接画素群に対応した参照領域の画素信号を、前記対象領域についての予測信号として取得し、前記予測隣接画素群と前記対象隣接画素群とを用いて前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記近似パラメータをもとに前記対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、
    ことを特徴とする動画像予測符号化方法。
  7. 動画像予測復号装置により実行される動画像予測復号方法であって、
    圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析ステップと、
    前記データ解析ステップにより抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元ステップと、
    前記対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、
    前記予測信号生成ステップにより生成された近似信号と前記残差信号復元ステップにより復元された再生残差信号とを加算することによって、前記対象領域の対象画素信号を復元する画像復元ステップと、
    を備え、
    前記予測信号生成ステップでは、所定の方法で前記対象領域についての予測信号を取得し、前記対象領域に隣接する既再生画素からなる対象隣接画素群と、前記予測信号を含む参照領域に対し、前記対象領域と前記対象隣接画素群の位置関係と同じ位置関係にある、既再生画素からなる予測隣接画素群とを用いて、前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記近似パラメータをもとに前記対象領域についての予測信号を変換することで、当該対象領域の対象画素信号についての近似信号を生成する、
    ことを特徴とする動画像予測復号方法。
  8. 動画像予測復号装置により実行される動画像予測復号方法であって、
    圧縮データの中から、処理対象である対象領域についての残差信号の符号化データを抽出するデータ解析ステップと、
    前記データ解析ステップにより抽出された残差信号の符号化データから再生残差信号を復元する残差信号復元ステップと、
    前記対象領域の対象画素信号についての近似信号を生成する予測信号生成ステップと、
    前記予測信号生成ステップにより生成された近似信号と前記残差信号復元ステップにより復元された再生残差信号とを加算することによって、前記対象領域の対象画素信号を復元する画像復元ステップと、
    を備え、
    前記予測信号生成ステップでは、前記対象領域より前に再生された画素から構成される領域を参照領域とし、前記対象領域に隣接する既再生画素からなる対象隣接画素群に対して、前記参照領域の中から最も相関の高い画素群を予測隣接画素群として導出し、前記予測隣接画素群と前記対象隣接画素群とを用いて前記予測隣接画素群を前記対象隣接画素群に近似させるための近似パラメータを決定し、前記対象隣接画素群と前記対象領域の位置関係と同じ位置関係にある、前記予測隣接画素群に対応した参照領域の画素信号を前記近似パラメータに基づいて変換することで、前記対象領域についての近似信号を生成する、
    ことを特徴とする動画像予測復号方法。
  9. コンピュータを、請求項1又は2に記載の動画像予測符号化装置として機能させるための動画像予測符号化プログラム。
  10. コンピュータを、請求項3又は4に記載の動画像予測復号装置として機能させるための動画像予測復号プログラム。
JP2007114669A 2007-04-24 2007-04-24 動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム Expired - Fee Related JP5254565B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007114669A JP5254565B2 (ja) 2007-04-24 2007-04-24 動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007114669A JP5254565B2 (ja) 2007-04-24 2007-04-24 動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2008271422A JP2008271422A (ja) 2008-11-06
JP5254565B2 true JP5254565B2 (ja) 2013-08-07

Family

ID=40050305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007114669A Expired - Fee Related JP5254565B2 (ja) 2007-04-24 2007-04-24 動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5254565B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015070488A (ja) 2013-09-30 2015-04-13 Kddi株式会社 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006108932A (ja) * 2004-10-01 2006-04-20 Ntt Docomo Inc 複数参照画像を用いた動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム及び動画像復号プログラム
KR100943912B1 (ko) * 2006-01-12 2010-03-03 엘지전자 주식회사 다시점 비디오의 처리 방법 및 장치

Also Published As

Publication number Publication date
JP2008271422A (ja) 2008-11-06

Similar Documents

Publication Publication Date Title
JP6000398B2 (ja) 画像予測復号方法及び画像予測復号装置
US8761254B2 (en) Image prediction encoding device, image prediction decoding device, image prediction encoding method, image prediction decoding method, image prediction encoding program, and image prediction decoding program
JP5372910B2 (ja) イントラコーディングのための方向変換
JP5686499B2 (ja) 画像予測符号化装置、方法及びプログラム、画像予測復号装置、方法及びプログラム、並びに、符号化・復号システム及び方法
JP6559309B2 (ja) 画像予測復号方法
TWI508532B (zh) Animation encoding apparatus, animation decoding apparatus, animation encoding method, animation decoding method, animation coding program, animation decoding program, animation processing system and animation processing method
JP5650294B2 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
WO2010064396A1 (ja) 動画像復号化方法および動画像符号化方法
JP2007043651A (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
JP2007300380A (ja) 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP6636615B2 (ja) 動きベクトル場の符号化方法、復号方法、符号化装置、および復号装置
JP2007189276A (ja) 画像圧縮装置及び画像圧縮プログラム
JP5909149B2 (ja) 色変換装置、符号化器および復号器ならびにそれらのプログラム
JP5254565B2 (ja) 動画像予測符号化装置、方法及びプログラム、並びに、動画像予測復号装置、方法及びプログラム
JP2006005659A (ja) 画像符号化装置及びその方法
JP2005244749A (ja) 動画像符号化装置
JP2015076765A (ja) 画像処理装置及びその制御方法、並びに、コンピュータプログラム
JP2008193501A (ja) 画像符号化装置及び画像符号化方法
JP4451759B2 (ja) 可逆ビデオ符号化装置,可逆ビデオ符号化方法,可逆ビデオ復号装置,可逆ビデオ復号方法,可逆ビデオ符号化プログラム,可逆ビデオ復号プログラムおよびそれらのプログラムの記録媒体
JP6557483B2 (ja) 符号化装置、符号化システム、及びプログラム
JP5415495B2 (ja) 画像予測符号化装置、画像予測符号化方法、画像予測符号化プログラム、画像予測復号装置、画像予測復号方法及び画像予測復号プログラム
JP2616552B2 (ja) 動画像の符号化・復号化装置
JP2002152049A (ja) データ処理装置及びデータ処理方法
JP2010010768A (ja) 画像符号化装置及び画像符号化方法
JP5318827B2 (ja) 画像予測符号化装置、方法およびプログラム、並びに、画像予測復号装置、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100420

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130418

R150 Certificate of patent or registration of utility model

Ref document number: 5254565

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees