JP4113696B2 - Lossless video encoding method, decoding method thereof, and apparatus thereof - Google Patents

Lossless video encoding method, decoding method thereof, and apparatus thereof Download PDF

Info

Publication number
JP4113696B2
JP4113696B2 JP2001308796A JP2001308796A JP4113696B2 JP 4113696 B2 JP4113696 B2 JP 4113696B2 JP 2001308796 A JP2001308796 A JP 2001308796A JP 2001308796 A JP2001308796 A JP 2001308796A JP 4113696 B2 JP4113696 B2 JP 4113696B2
Authority
JP
Japan
Prior art keywords
prediction
signal
dimensional
motion vector
switching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001308796A
Other languages
Japanese (ja)
Other versions
JP2003116140A (en
Inventor
孝之 仲地
竜也 藤井
知子 澤邉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001308796A priority Critical patent/JP4113696B2/en
Publication of JP2003116140A publication Critical patent/JP2003116140A/en
Application granted granted Critical
Publication of JP4113696B2 publication Critical patent/JP4113696B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、動画像を効率よく伝送、蓄積するための、符号化および復号化の技術に関する。
【0002】
【従来の技術】
可逆画像符号化方式としては、JPEG−LSやJPEG2000の可逆符号化モードが知られている。JPEG−LSは、フレーム内予測器を使用して、予測器の出力である予測信号と原信号の差を符号化している。フレーム内予測器を使用していることにより、フレーム内の信号の相関を利用して符号化効率を高めている。JPEG2000では、ロスレスWavelet変換を行い、Wavelet係数を符号化している。Wavelet変換を用いて画像信号を空間周波数帯域で分割し帯域毎に符号化を行っているために、空間解像度スケーラビリティを有する。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の両方式とも静止画像を対象としているために、動画に適応した場合、フレーム間の信号相関を利用することができない。動画像の非可逆符号化としては、空間解像度スケーラビリティを有し、フレーム間相関を利用した方法として、サブバンド領域で動き補償を行う方法があるが、動き補償はブロック単位に予測を行うことから符号化効率は必ずしも良くない。空間解像度スケーラビリティを有するとは、一つの符号化ビットストリームから異なる空間解像度の画像を直接復号化可能であることを示す。
【0004】
本発明は、空間解像度スケーラビリティを有し、符号化効率に優れる動画像可逆符号化方法とその復号化方法、及びそれらの装置を提案することが課題である。
【0005】
【課題を解決するための手段】
上記の課題を解決するため本発明は、動画像を対象とする可逆符号化方法において、原画像を帯域分割し、該分割した帯域毎に動き推定により時空間適応予測を行って予測残差信号を求め、該帯域毎の予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化する際に、
該時空間適応予測では、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出し、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出することを特徴とする動画像可逆符号化方法を手段とする。
【0006】
あるいは、動画像を出力する可逆復号化方法において、請求項1記載の動画像可逆符号化方法により符号化された帯域毎の予測残差信号と動きベクトルを復号し、該帯域毎の予測残差信号と該動きベクトルを用いて該帯域毎に時空間適応予測復号を行い、該時空間適応予測復号された帯域を帯域合成して動画像を復号する際に、
該時空間適応予測復号では、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出し、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出し、
該予測信号に該予測残差信号を付加して対象信号を復号化することを特徴とする動画像可逆復号化方法を手段とする。
【0007】
あるいは、動画像を対象とする可逆符号化方法において、原画像を帯域分割し、該分割した帯域のうち最低周波数帯域に動き推定により時空間適応予測を行って予測残差信号を求め、該予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化するとともに該最低周波数帯域以外の帯域を直接符号化する際に、
該時空間適応予測では、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出し、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出することを特徴とする動画像可逆符号化方法を手段とする。
【0008】
あるいは、動画像を出力する可逆復号化方法において、請求項3記載の動画像可逆符号化方法により符号化された信号のうち、最低周波数帯域の予測残差信号と動きベクトルを復号して用いて時空間適応予測復号を行い、該最低周波数帯域以外の帯域を直接復号し、該時空間適応予測復号された最低周波数帯域と該直接復号された該最低周波数帯域以外の帯域とを帯域合成して動画像を復号する際に、
該時空間適応予測復号では、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出し、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出し、
該予測信号に該予測残差信号を付加して対象信号を復号化することを特徴とする動画像可逆復号化方法を手段とする。
【0009】
あるいは、動画像を対象とする可逆符号化方法において、原画像を帯域分割し、該分割した最低周波数帯域では第1の時空間適応予測を行い、他の周波数帯域では第2の時空間適応予測を行い、帯域ごとに予測残差信号を求め、該帯域毎の予測残差信号と該最低周波数帯域の動きベクトルである基準動きベクトルとを符号化する際に、
第1の時空間適応予測では、現フレームと参照フレームからブロック単位推定手段により該基準動きベクトルを得、該基準動きベクトルを用いて、そして該第2の時空間適応予測では、該基準動きベクトルを基準にした動きベクトルを用いて、それぞれ現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出し、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出することを特徴とする動画像可逆符号化方法を手段とする。
【0010】
あるいは、動画像を出力する可逆復号化方法において、請求項5記載の動画像可逆符号化方法により符号化された帯域毎の予測残差信号と最低周波数帯域の動きベクトルである基準動きベクトルを復号し、該帯域毎に時空間適応予測復号を行い、該時空間適応予測復号された帯域を帯域合成して動画像を復号する際に、
最低周波数帯域に係る時空間適応予測復号では該基準動きベクトルを用いて、その他の周波数帯域に係る時空間適応予測では該基準動きベクトルを基準にした動きベクトルを用いて、シフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出し、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測信号を算出し、
該予測信号に該予測残差信号を付加して対象信号を復号化することを特徴とする動画像可逆復号化方法を手段とする。
【0015】
また同じく本発明は、動画像を対象とする可逆符号化装置において、原画像を帯域分割する手段と、該分割した帯域毎に動き推定により時空間適応予測を行って予測残差信号を求める手段と、該帯域毎の予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化する手段を有し、
該時空間適応予測を行って予測残差信号を求める手段は、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出する手段とを、有することを特徴とする動画像可逆符号化装置を手段とする。
【0016】
あるいは、動画像を出力する可逆復号化装置において、請求項7記載の動画像可逆符号化装置により符号化された帯域毎の予測残差信号と動きベクトルを復号する手段と、該帯域毎の予測残差信号と該動きベクトルを用いて該帯域毎に時空間適応予測復号を行う手段と、該時空間適応予測復号された帯域を帯域合成して動画像を復号する手段とを有し、
該時空間適応予測復号する手段は、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出する手段と、
該予測信号に該予測残差信号を付加して対象信号を復号化する手段とを、有することを特徴とする動画像可逆復号化装置を手段とする。
【0017】
あるいは、動画像を対象とする可逆符号化装置において、原画像を帯域分割する手段と、該分割した帯域のうち最低周波数帯域に動き推定により時空間適応予測を行って予測残差信号を求める手段と、該予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化するとともに該最低周波数帯域以外の帯域を直接符号化する手段とを有し、
該時空間適応予測を行う手段は、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出する手段とを、有することを特徴とする動画像可逆符号化装置を手段とする。
【0018】
あるいは、動画像を出力する可逆復号化装置において、請求項9記載の動画像可逆符号化装置により符号化された信号のうち、最低周波数帯域の予測残差信号と動きベクトルを復号するとともに該最低周波数帯域以外の帯域を直接復号する手段と、該最低周波数帯域の予測残差信号と該動きベクトルを用いて時空間適応予測復号を行う手段と、該時空間適応予測復号された最低周波数帯域と該直接復号された該最低周波数帯域以外の帯域とを帯域合成して動画像を復号する手段とを有し、
該時空間適応予測復号する手段は、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出する手段と、
該予測信号に該予測残差信号を付加して対象信号を復号化する手段とを、有することを特徴とする動画像可逆復号化装置を手段とする。
【0019】
あるいは、動画像を対象とする可逆符号化装置において、原画像を帯域分割する手段と、該分割した最低周波数帯域では第1の時空間適応予測を行い、他の周波数帯域では第2の時空間適応予測を行い、帯域ごとに予測残差信号を求める手段と、該帯域毎の予測残差信号と該最低周波数帯域の動きベクトルである基準動きベクトルとを符号化する手段とを有し、
第1の時空間適応予測を行う手段は、現フレームと参照フレームからブロック単位推定手段により該基準動きベクトルを得、該基準動きベクトルを用いて、そして該第2の時空間適応予測では、該基準動きベクトルを基準にした動きベクトルを用いて、それぞれ現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出する手段とを、有することを特徴とする動画像可逆符号化装置を手段とする。
【0020】
あるいは、動画像を出力する可逆復号化装置において、請求項11記載の動画像可逆符号化装置により符号化された帯域毎の予測残差信号と最低周波数帯域の動きベクトルである基準動きベクトルを復号する手段と、該帯域毎に時空間適応予測復号を行う手段と、該時空間適応予測復号された帯域を帯域合成して動画像を復号する手段とを有し、
該時空間適応予測復号する手段は、最低周波数帯域に係る復号では該基準動きベクトルを用いて、その他の周波数帯域に係る復号では該基準動きベクトルを基準にした動きベクトルを用いて、シフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測信号を算出する手段と、
該予測信号に該予測残差信号を付加して対象信号を復号化する手段とを、有することを特徴とする動画像可逆復号化装置を手段とする。
【0025】
本発明では、空間解像度スケーラビリティを実現するために、画像信号を空間解像度の帯域で分割し、帯域毎に符号化を行う。符号化には、画素毎にフレーム内予測(2次元予測)とフレーム間予測(3次元予測)を切換える時空間適応予測符号化を用いて符号化効率を高める。
【0026】
【発明の実施の形態】
以下、本発明の実施の形態について図を用いて詳細に説明する。
【0027】
[第1実施形態例]
図1に空間解像度スケーラビリティを持つ動画像符号化方法を実現するための基本構成を示す。図1において、10は帯域分割部、11は分割された帯域毎に設けた時空間適応予測符号化部、12はエントロピー符号化部である。
【0028】
図1の構成の動作例としての動画像符号化方法を以下に示す。まず、入力された画像信号は帯域分割部10において、複数の空間解像度の帯域に分割される。次に、分割した帯域毎に、時空間適応予測符号化部11で生成される残差信号をエントロピー符号化部12において符号化する。
【0029】
帯域分割部10では、図2で示すオクターブ分割を画像の水平方向、垂直方向にそれぞれ適用する。オクターブ分割では、2分割フィルタを用いて次々に帯域を分割することによって、入力信号を複数の帯域に分割することができ、最終的に、図3で示すように帯域が分割される。
【0030】
図3において、Lは低周波数成分、Hは高周波数成分を示す。ここで用いる2分割フィルタと復号化側で用いる帯域合成フィルタは、可逆性を保つために完全再構成フィルタとする。
【0031】
時空間適応予測符号化部11では、以下の式で予測を行う。
【0032】
f(a0,a1,a2,a3,……,b0,b1,b2,b3,……)
但し、
f:予測関数
a0,a1,a2,a3,……:符号化対象のフレームの画素の値
b0,b1,b2,b3,……:参照フレームの画素の値
参照フレームとしては、時間的に前方のフレーム、後方のフレーム、前方と後方のフレームの両方のいずれかを用いるが、復号器側では、参照フレームは先に復号する必要がある。予測に用いる画素の位置は以下の条件で決定する。符号化対象の画素の位置を(x,y)とする(xは水平方向の位置、yは垂直方向の位置)。符号化対象のフレームの場合、近傍かつ復号側で先に復号化する画素とする。例えば、1行目の左端の画素から右へと復号し、次に2行目を左から右へと行毎に復号する場合は、予測に用いる画素の位置(xa,ya)は、以下の条件を満たす必要がある。
【0033】
y−y0<ya<yかつx−x0<xa<x+x1
または、
ya=yかつx−x2<xa<x
但し、
y0:垂直方向の近傍の範囲を定める適当な整数
x0,x1,x2:水平方向の近傍の範囲を定める適当な整数
参照フレームの予測に用いる画素の位置(xb,yb)は以下の条件を満たす必要がある。
【0034】
y+vy−y3<ya<y+vy+y4かつx+vx−x3<xa<x+vx+x4
但し、
y3,y4:垂直方向の近傍の範囲を定める適当な整数
x3,x4:水平方向の近傍の範囲を定める適当な整数
V(vx,vy):参照フレームヘの動きベクトル
動きベクトルV(vx,vy)は、参照フレームヘの動き推定を行うことによって得られる。
【0035】
エントロピー符号化部12では、各帯域の残差信号と時空間適応予測符号化部11で用いた動きベクトルをエントロピー符号化して、符号化ビットストリームを作成する。
【0036】
図5に時空間適応予測符号化方法を実現する時空間適応予測符号化部の基本構成を示す。図5において、31はブロック単位動き推定手段、32はシフト手段、33は2次元予測器、34は動き推定3次元予測器、35は相関係数R計算手段、36は第1の判断分岐手段、37は加減算手段、38は加減算手段である。
【0037】
予測器としては、3種類の2次元予測器、7種類の3次元予測器を用意し、フレーム間相関により予測器を切換える。
【0038】
3次元予測器は、フレーム間相関が強い場合には有効であるが、フレーム間相関が弱い場合には逆に残差信号が大きくなる可能性がある。そのために、フレーム間相関が弱い場合には2次元予測器に切換える方法を採用する。2次元予測器と3次元予測器とを切換えるために、現フレームと参照フレームの被符号化対象画素近傍の復号済み信号の相関係数を計算する。相関係数が大きい場合、すなわち、現フレーム内信号と参照フレーム内信号の波形が似ている場合には、予測精度が向上すると考えられることから、3次元予測を行う。それ以外の場合には、2次元予測を行う。
【0039】
各予測器の予測方法と予測器の具体的切換え方法について以下に説明する。各予測器の予測方法を次に示す。
【0040】
2次元予測器0 予測信号y=min(a,b) …(1)
2次元予測器1 予測信号y=max(a,b) …(2)
2次元予測器2 予測信号y=a+b−c …(3)
3次元予測器3 予測信号y=min(a,x’) …(4)
3次元予測器4 予測信号y=max(a,x’) …(5)
3次元予測器5 予測信号y=a+x’−a …(6)
3次元予測器6 予測信号y=min(b,x’) …(7)
3次元予測器7 予測信号y=max(b,x’) …(8)
3次元予測器8 予測信号y=b+x’−b …(9)
3次元予測器9 予測信号y=(a+b+x’)/3 …(10)
ここで用いたa,b,cは、図7(a)で示すように、符号化対象の画素xに隣接する上、左、右上の画素の復号値である。a’,b’,x’は、参照フレームの画素の復号値であり、符号化対象のフレームと参照フレーム間の動きベクトル(k,l)(k:水平方向、l:垂直方向)から画素位置を定める。動きベクトルは、L×L画素の小ブロック単位であらかじめブロックマッチング法などにより計算し、付加情報として伝送する。符号化対象の画素xの位置を(i,j)とすると、x’の位置は(i+k,j+l)となる。また、図7(b)に示す通り、a’,b’は、x’の隣接する上、左の画素である。参照フレームとしては、時間的に前方のフレーム、後方のフレーム、前方と後方のフレームの両方のいずれかを用いるが、復号器側では、参照フレームは先に復号する必要がある。
【0041】
R≦T0かつc≧max(a,b)の場合 2次元予測器0を選択
R≦T0かつc≦min(a,b)の場合 2次元予測器1を選択
R≦T0かつmin(a,b)<c<max(a,b)の場合 2次元予測器2を選択
R>T0かつS>T1かつa’≧max(a,x’)の場合 3次元予測器3を選択
R>T0かつS>T1かつa’≦min(a,x’)の場合 3次元予測器4を選択
R>T0かつS>T1かつmin(a,x’)<a’<max(a,x’)の場合 3次元予測器5を選択
R>T0かつS<−T1かつb’≧max(b,x’)の場合 3次元予測器6を選択
R>T0かつS<−T1かつb’≦min(b,x’)の場合 3次元予測器7を選択
R>T0かつS<−T1かつmin(b,x’)<b’<max(b,x’)の場合 3次元予測器8を選択
R>T0かつ−T1<S<T1の場合 3次元予測器9を選択
但し、
R=aa’+bb’+cc’+dd’−(a+b+c+d)(a’+b’+c’+d’) …(11)
S=|x’−b’|−|x’−a’| …(12)
T0,T1:閾値
a,b,c,d,a’,b’,c’,d’,x’:図7に示す画素の復号値
である。
【0042】
ここで、Rは相関係数であり、Rが閾値T0より大きい場合には、3次元予測器を選択する。それ以外の場合には、2次元予測器を選択する。この選択は、実際には2段階で行われている。つまり、図5中の第1の判断分岐手段36によりR値によって第1の判断分岐を行い、2次元予測器か3次元予測器かをまず切換えて2次元予測器33または3次元予測器34内で残る第2の判断分岐を行って各予測器1〜9の一つを選択する。
【0043】
2次元予測器の3つの予測器の切換え方法は、既に提案されているものであり、静止画像可逆圧縮国際標準規格JPEG−LSにおいて採用された方法と同じである。縦方向および横方法にエッジがあると判断された場合には、それぞれのエッジ方向に隣接する1画素を用いて予測し、それ以外の場合には隣接する3画素を用いて予測している。
【0044】
3次元予測の場合にも2次元予測器と同様に、符号化対象画素の近傍信号値の状態により予測器を切換える適応予測を行う。縦方向または横方向にエッジがあると判断された場合は、現フレームおよび参照フレームのそれぞれのエッジ方向に隣接する信号を用いて予測する。エッジの方向は、参照フレームの縦方向の差分絶対値|x’−a’|と横方向の差分絶対値|x’−b’|を比較して、閾値T1よりも大きい方向をエッジと判断する。式(12)のSはそれらの差分値であり、エッジ方向を判断するパラメータとなる。エッジ方向を判断する縦方向のエッジと判断された場合、現フレームおよび参照フレームの縦方向の信号に関して、2次元予測器と同様な方法で予測信号を選択する。横方向のエッジの場合も同様な方法で予測器を選択する。エッジでないと判断された場合には、近傍の3画素の平均値を予測値とする。
【0045】
加減算手段37または38は、予測器の出力である予測信号と原フレーム信号の差、すなわち予測残差信号を出力する。予測残差信号は、図略の量子化器で量子化する。量子化された残差信号と、3次元予測器で用いた動きベクトルを、図1のエントロピー符号化部12に入力し、符号化ビットストリームを出力する。量子化器の量子化ステップを1にした場合は、本符号化方法は可逆符号化法になる。
【0046】
[第2実施形態例]
図4に、上記第1実施形態例で符号化されたデータを復号する復号化方法を実現するための基本構成を示す。図4において、20はエントロピー復号部、21は帯域毎に設けた時空間適応予測復号化部、22は帯域合成部である。
【0047】
図4の構成の動作例としての復号化方法を以下に示す。最初にエントロピー復号化部20において符号化ビットストリームから予測に用いる動きベクトルと予測残差信号を求める。次に、時空間適応予測符号化部21において既に復号化された画像信号と残差信号を用いて被符号化信号を復号する。次に帯域合成部22に、各時空間適応予測符号化部21の出力を合成して画像を復号化する。
【0048】
図6に、時空間適応予測復号化部の基本構成を示す。図6において、41はシフト手段、42は2次元予測器、43は加算手段、44は動き推定3次元予測器、45は加算手段、46は相関係数R計算手段、47は第1の判断分岐手段である。
【0049】
図6の動作例としての時空間適応予測復号化方法は、以下のとおりである。まず、2次元予測器42を用いるか3次元予測器44を用いるかを判断するために、動きベクトルを用いてシフト手段41でシフトした参照フレーム内信号と現フレーム内信号の復号済み信号から、相関係数R計算手段46により相関係数Rを計算する。第1の判断分岐手段47は、相関係数Rが閾値T0より大きい場合には、動き推定3次元予測器44側に切換えて3次元予測を行い、それ以外の場合には2次元予測器42側に切換えて2次元予測を行う。2次元予測器42および動き推定3次元予測器44の構成と内部に用意した複数の予測器の切換えは第1実施形態例のものと同様である。動き推定3次元予測器44では、現フレーム内信号の復号済み信号と動きベクトルを用いてシフトした参照フレーム内信号を用いて予測信号を生成し、加算手段45は、この予測信号に残差信号を付加することで、現フレームの対象信号を復元する。2次元予測器42では、現フレーム内信号の復号済み信号を用いて予測信号を生成し、加算手段43がこの予測信号に残差信号を付加することで、現フレームの対象信号を復元する。
【0050】
[第3実施形態例]
本実施形態例では、第1実施形態例の時空間適応予測符号化部11において、各帯域における対象物体の動きをブロックマッチング法により推定する。ブロックマッチング法においては、動きベクトルを求めるために、次のSAD(Sumof Absolute Difference)値を計算する。
【0051】
SAD(k,l)=Σi=1 LΣj=1 L|x(i,j)−y(i+k,j+l)| …(13)
ここで、(k,l)を−w<k,1<wの範囲(wはウインドウサイズ)でSAD(k,l)を計算し、最小のSAD値を与えるベクトル(k,l)が動きベクトルとして選ばれる。3次元予測器の予測精度を向上させるために、通常、SADは各帯域毎に計算される。SADの計算には、かなりの時間を要する。これを考慮に入れ、符号化効率の低下をできるだけ抑えたうえで、計算時間を削減するために以下の3つの簡易符号化の手法(1),(2),(3)を提案する。
【0052】
(1)帯域分割された信号のフレーム間相関ならびにフレーム内相関は、低域ほど強く、高域ほど弱い。最低周波数帯域以外の信号はフレーム間相関ならびにフレーム内相関が弱いことから、時空間適応予測符号化の効果がそれほど顕著に現れてこない。その性質を利用して、時空間適応予測符号化を最低周波数帯域のみに適用する。SADの計算量が極端に減少するとともに、2次元および3次元予測処理時間も減少する。最低周波数帯域の動きベクトルと予測残差信号はエントロピー符号化され、最低周波数帯域以外の信号は、直接エントロピー符号化される。
【0053】
図8に本方法を実現するための基本構成図を示す。図8において、50は帯域分割部、51は最低周波数帯域用の時空間適応予測符号化部、52はエントロピー符号化部52である。まず、入力された画像信号は帯域分割部50において、複数の空間解像度の帯域に分割される。次に、分割した帯域のうち最低周波数帯域についてのみ時空間適応予測符号化部51で残差信号を生成し、エントロピー符号化部52でエントロピー符号化する。それ以外の帯域の信号はエントロピー符号化部52において直接符号化する。
【0054】
(2)動き推定を最低周波数帯域のみにて行い、動きベクトルを求める。他の帯域では、最低周波数帯域の動きベクトルを基準にした動きベクトルを用いて時空間適応予測符号化を行う。対象物体の動きは、帯域毎に変化するわけではないので、高域の物体の動きも低域の物体の動きも等しいはずである。すなわち、低域から高域に向けて同じ方向に存在する小ブロック動きベクトルは同じであると仮定する。例えば、図3の矢印で示した小ブロックの動きはほぼ等しい。但し、一つ高域に帯域が上がる毎に、画素数は縦および横方向に2倍になるので、一つ高域での動きベクトルは、
(2k,2l)
となる。N段高域の動きベクトルは、
(N×k,N×l)
となる。
【0055】
本方法を実現するための基本構成図は、図1と同様であるが、各帯域毎の時空間適応予測符号化部11で用いる動きベクトルは最低周波数帯域の動きベクトルを基準にした動きベクトルを用いる。最低周波数帯域の動きベクトルおよび全帯域の予測残差信号はエントロピー符号化部12でエントロピー符号化される。
【0056】
(3)SADを計算するときに低域から高域に向かって行う。図3の例においては、LL3→HL3→LH3→HH3→HL2→LH2→HH2→HL1→LH1→HH1の順となる。まず、最低周波数帯域の各小ブロックに対してSADを計算する。SADが、
SAD(k,l)>T(閾値) …(14)
の小ブロック内の信号に関してはフレーム間相関が弱いと判断し、時空間適応予測処理は行わず2次元予測を行う。および対応する高域の小ブロックの信号に関しては時空間適応予測符号化を行わず、直接エントロピー符号化を行う。
【0057】
式(14)を満たさないブロック内の信号に関しては、通常どおり、時空間適応予測符号化を行う。引き続く高帯域のブロックにおいて、SADが、
SAD(k,l)>Tx(高帯域での閾値。帯域によって閾値は異なる。) …(15)
の場合にはフレーム間相関が弱いと判断し、時空間適応予測符号化を行わず、直接エントロピー符号化を行う。なお、対応する低域のブロックのSADが既に式(14)を満足している場合には、直接エントロピー符号化を行うことが確定しているため、SADの計算ならびに式(15)の判断は行わない。
【0058】
式(14)および(15)の条件を満足する小ブロックは、付加情報として動きベクトルの代りに固有の符号LIMITを伝送し、対応する高域の小ブロックでは付加情報を伝送しない。動きベクトルならびに固有の符号LIMIT、予測残差信号がエントロピー符号化される。
【0059】
本方法を実現するための基本構成図は、図1と同様であるが、各時空間適応予測符号化器11は、ブロック単位動き推定において、低域から高域に向かってSADを計算する機能、時空間適応予測符号化を行うか否かの判断機能、及び固有の符号LIMITを伝送する機能等を有する。エントロピー符号化部12は、各時空間適応予測符号化器11からの、動きベクトルまたは固有の符号LIMIT、時空間適応予測符号化されない信号または予測残差信号をエントロピー符号化する。
【0060】
[第4実施形態例]
第3実施形態例による簡易符号化の手法で符号化された信号の簡易復号化方法を示す。
【0061】
(1)図9に、簡易符号化(1)で符号化された信号を復号するための基本構成図を示す。図9において、60はエントロピー復号部、61は最低周波数帯域用の時空間適応予測復号化部、62は帯域合成部である。
【0062】
本方法では、エントロピー復号部60でエントロピー復号化された動きベクトルと予測残差信号を用いて、最低周波数帯域は時空間予測復号化部61により信号を復号する。それ以外の帯域は、エントロピー復号部60でエントロピー復号化により、直接復号される。帯域合成部62は、各帯域の出力を合成して画像を復号化する。
【0063】
(2)簡易符号化(2)で符号化された信号を復号する復号化方法を実現するための基本構成図は、図4と同様であるが、各帯域毎の時空間適応予測復号化部21で用いる動きベクトルは最低周波数帯域の動きベクトルを基準にした動きベクトルを用いる。すなわち、エントロピー復号部20でエントロピー復号化された最低周波数帯域の動きベクトル(k,l)をもとにして、N段高域の動きベクトルを、
(N×k,N×l)
により計算する。その結果をもとに、各帯域毎に時空間適応予測復号化部21で復号処理を行い、帯域合成部22において、各帯域の出力を合成して画像を復号化する。
【0064】
(3)簡易符号化(3)で符号化された信号を復号する復号化方法を実現するための基本構成図も、図4と同様であるが、各帯域毎の時空間適応予測復号化部21では、エントロピー復号部20でエントロピー復号化された最低周波数帯域の動きベクトル(k,l)ならびに予測残差信号を用いて、最低周波数帯帯域から最高周波数帯域の順番(図3の例においては、LL3→HL3→LH3→HH3→HL2→LH2→HH2→HL1→LH1→HH1の順)で、時空間適応予測復号処理を行って出力するか、または固有符号LIMITにより、エントロピー復号化された高周波数帯域の信号を直接出力する。帯域合成部22は、各帯域の出力を合成して画像を復号化する。
【0065】
【発明の効果】
以上の説明で明らかなように本発明によれば、動画像の効率の良い可逆符号化ができ、少ないディスク容量で保存が可能となる。さらに、空間解像度スケーラビリティ性を有するために、画像表示機器の性能や用途に応じた空間解像度で、画像を復号化することが可能である。低域から任意の帯域までを復号化すると、原画像よりも低い空間解像度の画像を再生でき、全てのデータを復号化すると、原画像と同じ解像度の画像が再生される。画像表示装置の精度や用途に応じて原画像より低い解像度の画像を再生したい場合は、必要な帯域までに対する復号化のみが必要であり、復号化を行えば画像を符号化データより直接復号化でき、原画像と同じ解像度の画像を再生してから解像度変換を行うよりも処理時間が短くなる。また、符号化ビットストリームを伝送する場合は、必要なデータのみを伝送するので、伝送レートも小さくなる。
【図面の簡単な説明】
【図1】本発明の第1実施形態例による動画像符号化方法を実現するための基本構成を示す図である。
【図2】オクターブ分割を説明する図である。
【図3】画像の帯域分割を説明する図である。
【図4】本発明の第2実施形態例による動画像復号化方法を実現するための基本構成を示す図である。
【図5】本発明における時空間適応予測符号化部の基本構成を示す図である。
【図6】本発明における時空間適応予測復号化部の基本構成を示す図である。
【図7】(a),(b)は、予測に用いる信号を説明する図である。
【図8】本発明の第3実施形態例による簡易符号化(1)を実現するための基本構成を示す図である。
【図9】本発明の第4実施形態例による簡易復号化(1)を実現するための基本構成を示す図である。
【符号の説明】
10…帯域分割部
11…時空間適応予測符号化部
12…エントロピー符号化部
20…エントロピー復号部
21…時空間適応予測復号化部
22…帯域合成部
31…ブロック単位動き推定手段
32…シフト手段
33…2次元予測器
34…動き推定3次元予測器
35…相関係数R計算手段
36…第1の判断分岐手段
37…加減算手段
38…加減算手段
41…シフト手段
42…2次元予測器
43…加算手段
44…動き推定3次元予測器
45…加算手段
46…相関係数R計算手段
47…第1の判断分岐手段
50…帯域分割部
51…時空間適応予測符号化部
52…エントロピー符号化部
60…エントロピー復号部
61…時空間適応予測復号化部
62…帯域合成部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to encoding and decoding techniques for efficiently transmitting and storing moving images.
[0002]
[Prior art]
As a lossless image encoding method, JPEG-LS or JPEG2000 lossless encoding modes are known. JPEG-LS encodes a difference between a prediction signal that is an output of a predictor and an original signal by using an intra-frame predictor. By using the intra-frame predictor, the coding efficiency is improved by utilizing the correlation of signals in the frame. In JPEG2000, lossless Wavelet conversion is performed, and Wavelet coefficients are encoded. Since the image signal is divided into spatial frequency bands by using Wavelet transform and encoding is performed for each band, spatial resolution scalability is provided.
[0003]
[Problems to be solved by the invention]
However, since both of the conventional systems are intended for still images, signal correlation between frames cannot be used when adapted to moving images. As lossy encoding of moving images, there is a method that performs spatial compensation in the subband region as a method that has spatial resolution scalability and uses inter-frame correlation, but motion compensation performs prediction in units of blocks. Encoding efficiency is not always good. Having spatial resolution scalability indicates that images of different spatial resolutions can be directly decoded from one encoded bitstream.
[0004]
An object of the present invention is to propose a moving image lossless encoding method, a decoding method thereof, and a device thereof having spatial resolution scalability and excellent encoding efficiency.
[0005]
[Means for Solving the Problems]
In order to solve the above-described problem, the present invention provides a lossless encoding method for moving images, in which an original image is band-divided, and space-time adaptive prediction is performed by motion estimation for each divided band to generate a prediction residual signal. And encoding the prediction residual signal for each band and the motion vector used in the space-time adaptive prediction,
In the spatio-temporal adaptive prediction, a motion vector is obtained from the current frame and the reference frame by the block unit estimation means, and the target frame neighboring signal value of the current frame and the reference frame shifted by the shift means is used using the motion vector. When the correlation coefficient is calculated and the correlation coefficient is large, switching to the three-dimensional prediction in which prediction is performed using the encoding target pixel neighboring signal values of the current frame and the reference frame, and when the correlation coefficient is small , Switch to two-dimensional prediction in which prediction is performed using only the encoding target pixel neighborhood signal value of the current frame,
In the case of switching to the two-dimensional prediction, a prediction residual signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame,
When switching to the three-dimensional prediction, the prediction residual signal is calculated by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame. The moving image lossless encoding method is used as means.
[0006]
Alternatively, in a lossless decoding method for outputting a moving image, a prediction residual signal and a motion vector for each band encoded by the moving image lossless encoding method according to claim 1 are decoded, and a prediction residual for each band is decoded. When performing space-time adaptive prediction decoding for each band using a signal and the motion vector, and decoding a moving image by performing band synthesis on the space-time adaptive prediction decoded band,
The said time space adaptive prediction decoding, correlation coefficients and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal When the correlation coefficient is large, switch to 3D prediction, and when the correlation coefficient is small, switch to 2D prediction.
In the case of switching to the two-dimensional prediction, a prediction signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the decoding target pixel neighboring signal value including the decoded signal of the signal in the current frame,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Calculate prediction signals by switching multiple 3D predictors for each pixel,
A moving image lossless decoding method characterized by adding the prediction residual signal to the prediction signal and decoding the target signal.
[0007]
Alternatively, in a lossless encoding method for moving images, the original image is band-divided, and a prediction residual signal is obtained by performing space-time adaptive prediction by motion estimation in the lowest frequency band among the divided bands, When encoding the residual signal and the motion vector used in the spatiotemporal adaptive prediction and directly encoding the band other than the lowest frequency band,
In the spatio-temporal adaptive prediction, a motion vector is obtained from the current frame and the reference frame by the block unit estimation means, and the target frame neighboring signal value of the current frame and the reference frame shifted by the shift means is used using the motion vector. When the correlation coefficient is calculated and the correlation coefficient is large, switching to the three-dimensional prediction in which prediction is performed using the encoding target pixel neighboring signal values of the current frame and the reference frame, and when the correlation coefficient is small , Switch to two-dimensional prediction in which prediction is performed using only the encoding target pixel neighborhood signal value of the current frame,
In the case of switching to the two-dimensional prediction, a prediction residual signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame,
When switching to the three-dimensional prediction, the prediction residual signal is calculated by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame. The moving image lossless encoding method is used as means.
[0008]
Alternatively, in the lossless decoding method for outputting a moving image, among the signals encoded by the moving image lossless encoding method according to claim 3 , the prediction residual signal and the motion vector in the lowest frequency band are decoded and used. Perform space-time adaptive predictive decoding, directly decode bands other than the lowest frequency band, and perform band synthesis of the lowest frequency band subjected to space-time adaptive predictive decoding and the band other than the directly decoded lowest frequency band. When decoding video,
The said time space adaptive prediction decoding, correlation coefficients and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal When the correlation coefficient is large, switch to 3D prediction, and when the correlation coefficient is small, switch to 2D prediction.
In the case of switching to the two-dimensional prediction, a prediction signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the decoding target pixel neighboring signal value including the decoded signal of the signal in the current frame,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Calculate prediction signals by switching multiple 3D predictors for each pixel,
A moving image lossless decoding method characterized by adding the prediction residual signal to the prediction signal and decoding the target signal.
[0009]
Alternatively, in the lossless encoding method for moving images, the original image is band-divided, the first space-time adaptive prediction is performed in the divided lowest frequency band , and the second space-time adaptive prediction is performed in the other frequency bands. When calculating the prediction residual signal for each band and encoding the prediction residual signal for each band and the reference motion vector that is the motion vector of the lowest frequency band ,
The In the first space-time adaptive prediction, give the reference motion vector by a block unit estimating means from the reference frame and the current frame, by using the reference motion vector, and the space-time adaptive prediction of the second, the reference motion Using the motion vector based on the vector, the correlation coefficient of the signal near the pixel to be encoded for the current frame and the reference frame shifted by the shift means is calculated. Switch to three-dimensional prediction that uses the signal to be encoded pixel neighboring signal value of the frame and reference frame, and if the correlation coefficient is small, predict using only the signal to be encoded pixel neighboring signal value of the current frame Switch to two-dimensional prediction
In the case of switching to the two-dimensional prediction, a prediction residual signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame,
When switching to the three-dimensional prediction, the prediction residual signal is calculated by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame. The moving image lossless encoding method is used as means.
[0010]
Alternatively, in a lossless decoding method for outputting a moving image, a prediction residual signal for each band encoded by the moving image lossless encoding method according to claim 5 and a reference motion vector which is a motion vector in the lowest frequency band are decoded. and performs space-time adaptive prediction decoding for each said zone, when decoding a moving image by band synthesizing the band that has been said time space adaptive prediction decoding,
In the spatio-temporal adaptive prediction decoding related to the lowest frequency band, the reference motion vector is used, and in the spatio-temporal adaptive prediction related to other frequency bands, the shifted reference frame is decoded using the motion vector based on the reference motion vector. a-target pixel proximity signal value, calculates the correlation coefficient between the decoding target pixel sensor signal values consisting decoded signal of the current frame signal, when the correlation coefficient is large switched to 3D prediction, correlation If the number is small, switch to 2D prediction,
In the case of switching to the two-dimensional prediction, a prediction signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the decoding target pixel neighboring signal value including the decoded signal of the signal in the current frame,
When switched to the three-dimensional prediction, pixels from the decoded and decoded pixel neighboring signal value and a signal, decoded pixel near the signal value of the reference frame is shifted by using the motion vector of the current frame signal Each time a plurality of 3D predictors are switched to calculate a prediction signal,
A moving image lossless decoding method characterized by adding the prediction residual signal to the prediction signal and decoding the target signal.
[0015]
Similarly, in the lossless encoding apparatus for moving images, the present invention provides means for dividing an original image into bands, and means for obtaining a prediction residual signal by performing space-time adaptive prediction by motion estimation for each divided band. And means for encoding the prediction residual signal for each band and the motion vector used in the space-time adaptive prediction,
The means for obtaining the prediction residual signal by performing the spatiotemporal adaptive prediction obtains a motion vector from the current frame and the reference frame by the block unit estimation means, and uses the motion vector to shift the current frame and the reference frame shifted by the shift means. When the correlation coefficient of the encoding target pixel neighboring signal value is calculated and the correlation coefficient is large, the prediction is performed using the encoding target pixel neighboring signal value of the current frame and the reference frame. Switching, when the correlation coefficient is small, means for switching to two-dimensional prediction for performing prediction using only the pixel target signal neighborhood signal value of the current frame;
In the case of switching to the two-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame;
In the case of switching to the three-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame , A moving image lossless encoding apparatus characterized by comprising:
[0016]
Alternatively, in a lossless decoding apparatus that outputs a moving image, means for decoding a prediction residual signal and a motion vector for each band encoded by the moving image lossless encoding apparatus according to claim 7 , and prediction for each band Means for performing space-time adaptive prediction decoding for each band using the residual signal and the motion vector, and means for band-combining the space-time adaptive prediction decoded band to decode a moving image,
Said time space adaptive prediction decoding to means, phase and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal Means for calculating the number of relationships, switching to three-dimensional prediction when the correlation coefficient is large, and switching to two-dimensional prediction when the correlation coefficient is small;
Means for calculating a prediction signal by switching a plurality of two-dimensional predictors for each pixel from a decoding target pixel neighborhood signal value made up of a decoded signal of a signal in the current frame when switched to the two-dimensional prediction; ,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Means for calculating a prediction signal by switching a plurality of three-dimensional predictors for each pixel;
And a means for decoding the target signal by adding the prediction residual signal to the prediction signal.
[0017]
Alternatively, in a lossless encoding apparatus for moving images, means for dividing an original image into bands and means for obtaining a prediction residual signal by performing space-time adaptive prediction by motion estimation in the lowest frequency band of the divided bands And means for encoding the prediction residual signal and the motion vector used in the space-time adaptive prediction, and directly encoding a band other than the lowest frequency band,
The spatio-temporal adaptive prediction means obtains a motion vector from the current frame and the reference frame by a block unit estimation means, and uses the motion vector to detect the vicinity of the encoding target pixel of the current frame and the reference frame shifted by the shift means. When the correlation coefficient of the signal value is calculated, and the correlation coefficient is large, switching to three-dimensional prediction in which prediction is performed using the signal value near the encoding target pixel in the current frame and the reference frame, and the correlation coefficient is small In this case, a means for switching to two-dimensional prediction for performing prediction using only the encoding target pixel neighborhood signal value of the current frame;
In the case of switching to the two-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame;
In the case of switching to the three-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame , A moving image lossless encoding apparatus characterized by comprising:
[0018]
Alternatively, in a lossless decoding device that outputs a moving image, among the signals encoded by the moving image lossless encoding device according to claim 9 , the prediction residual signal and the motion vector in the lowest frequency band are decoded and the lowest Means for directly decoding a band other than the frequency band, means for performing space-time adaptive prediction decoding using the prediction residual signal of the lowest frequency band and the motion vector, and the lowest frequency band subjected to space-time adaptive prediction decoding Means for band-combining a band other than the lowest frequency band directly decoded and decoding a moving image,
Said time space adaptive prediction decoding to means, phase and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal Means for calculating the number of relationships, switching to three-dimensional prediction when the correlation coefficient is large, and switching to two-dimensional prediction when the correlation coefficient is small;
Means for calculating a prediction signal by switching a plurality of two-dimensional predictors for each pixel from a decoding target pixel neighborhood signal value made up of a decoded signal of a signal in the current frame when switched to the two-dimensional prediction; ,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Means for calculating a prediction signal by switching a plurality of three-dimensional predictors for each pixel;
And a means for decoding the target signal by adding the prediction residual signal to the prediction signal.
[0019]
Alternatively, in a lossless encoding device for moving images, a unit for band-dividing an original image and first space-time adaptive prediction in the divided lowest frequency band , and a second space-time in other frequency bands Means for performing adaptive prediction and obtaining a prediction residual signal for each band; and means for encoding a prediction residual signal for each band and a reference motion vector that is a motion vector of the lowest frequency band;
The first means for performing a space-time adaptive prediction, give the reference motion vector by a block unit estimating means from the reference frame and the current frame, by using the reference motion vector, and the space-time adaptive prediction of the second, When using the motion vector based on the reference motion vector to calculate the correlation coefficient of the signal to be encoded pixel neighboring signal values of the current frame and the reference frame shifted by the shift means , respectively , when the correlation coefficient is large Is switched to three-dimensional prediction in which prediction is performed using the encoding target pixel neighboring signal values of the current frame and the reference frame, and when the correlation coefficient is small, only the encoding target pixel neighboring signal value of the current frame is used. Means for switching to two-dimensional prediction using prediction,
In the case of switching to the two-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame;
In the case of switching to the three-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame , A moving image lossless encoding apparatus characterized by comprising:
[0020]
Alternatively, in a lossless decoding device that outputs a moving image, the prediction residual signal for each band encoded by the moving image lossless encoding device according to claim 11 and a reference motion vector that is a motion vector in the lowest frequency band are decoded. a means for, and means for performing a space-time adaptive prediction decoding for each said zone, and means for decoding the moving image by band synthesizing the band that has been said time space adaptive prediction decoding,
The spatio-temporal adaptive predictive decoding means uses the reference motion vector for decoding related to the lowest frequency band, and uses a motion vector based on the reference motion vector for decoding related to the other frequency bands . Calculate the correlation coefficient between the decoding target pixel neighborhood signal value of the frame and the decoding target pixel neighborhood signal value consisting of the decoded signal of the signal in the current frame, and switch to three-dimensional prediction when the correlation coefficient is large Means for switching to two-dimensional prediction when the correlation coefficient is small;
Means for calculating a prediction signal by switching a plurality of two-dimensional predictors for each pixel from a decoding target pixel neighborhood signal value made up of a decoded signal of a signal in the current frame when switched to the two-dimensional prediction; ,
When switched to the three-dimensional prediction, pixels from the decoded and decoded pixel neighboring signal value and a signal, decoded pixel near the signal value of the reference frame is shifted by using the motion vector of the current frame signal Means for calculating a prediction signal by switching a plurality of three-dimensional predictors every time;
And a means for decoding the target signal by adding the prediction residual signal to the prediction signal.
[0025]
In the present invention, in order to realize spatial resolution scalability, an image signal is divided into spatial resolution bands, and encoding is performed for each band. For encoding, spatiotemporal adaptive prediction encoding is used to increase the encoding efficiency by switching between intra-frame prediction (two-dimensional prediction) and inter-frame prediction (three-dimensional prediction) for each pixel.
[0026]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0027]
[First Embodiment]
FIG. 1 shows a basic configuration for realizing a moving picture coding method having spatial resolution scalability. In FIG. 1, 10 is a band dividing unit, 11 is a spatio-temporal adaptive prediction encoding unit provided for each divided band, and 12 is an entropy encoding unit.
[0028]
A moving picture encoding method as an operation example of the configuration of FIG. 1 will be described below. First, the input image signal is divided into a plurality of spatial resolution bands by the band dividing unit 10. Next, the residual signal generated by the space-time adaptive prediction encoding unit 11 is encoded by the entropy encoding unit 12 for each divided band.
[0029]
The band dividing unit 10 applies the octave division shown in FIG. 2 to the horizontal direction and the vertical direction of the image, respectively. In the octave division, the input signal can be divided into a plurality of bands by dividing the band one after another using a two-division filter, and finally the band is divided as shown in FIG.
[0030]
In FIG. 3, L represents a low frequency component, and H represents a high frequency component. The two-division filter used here and the band synthesis filter used on the decoding side are completely reconstructed filters in order to maintain reversibility.
[0031]
The space-time adaptive prediction encoding unit 11 performs prediction using the following equation.
[0032]
f (a0, a1, a2, a3, ..., b0, b1, b2, b3, ...)
However,
f: prediction function a0, a1, a2, a3,...: pixel value b0, b1, b2, b3,... of encoding target frame, reference frame pixel value. Frame, the rear frame, and both the front and rear frames, the reference frame needs to be decoded first on the decoder side. The position of the pixel used for prediction is determined under the following conditions. Let the position of the pixel to be encoded be (x, y) (x is the position in the horizontal direction and y is the position in the vertical direction). In the case of a frame to be encoded, it is a pixel that is decoded first in the vicinity and on the decoding side. For example, when decoding from the leftmost pixel of the first row to the right and then decoding the second row from left to right for each row, the position (xa, ya) of the pixel used for prediction is as follows: It is necessary to satisfy the conditions.
[0033]
y−y0 <ya <y and x−x0 <xa <x + x1
Or
ya = y and x−x2 <xa <x
However,
y0: Appropriate integers x0, x1, x2 that define the neighborhood in the vertical direction: Pixel position (xb, yb) used for prediction of an appropriate integer reference frame that defines the neighborhood in the horizontal direction satisfies the following conditions There is a need.
[0034]
y + vy-y3 <ya <y + vy + y4 and x + vx-x3 <xa <x + vx + x4
However,
y3, y4: Appropriate integers x3 and x4 for determining the vicinity of the vertical direction V3: Appropriate integers V (vx, vy) for determining the vicinity of the horizontal direction: Motion vector motion vector V (vx, vy) to the reference frame Is obtained by performing motion estimation on the reference frame.
[0035]
The entropy encoding unit 12 entropy-encodes the residual signal of each band and the motion vector used in the space-time adaptive prediction encoding unit 11 to create an encoded bitstream.
[0036]
FIG. 5 shows a basic configuration of a space-time adaptive predictive coding unit that realizes the space-time adaptive predictive coding method. In FIG. 5, 31 is a block unit motion estimation means, 32 is a shift means, 33 is a two-dimensional predictor, 34 is a motion estimation three-dimensional predictor, 35 is a correlation coefficient R calculation means, and 36 is a first decision branching means. , 37 is addition / subtraction means, and 38 is addition / subtraction means.
[0037]
As predictors, three types of two-dimensional predictors and seven types of three-dimensional predictors are prepared, and the predictors are switched by inter-frame correlation .
[0038]
The three-dimensional predictor is effective when the inter-frame correlation is strong, but there is a possibility that the residual signal becomes large when the inter-frame correlation is weak. Therefore, a method of switching to a two-dimensional predictor is adopted when the inter-frame correlation is weak. In order to switch between the two-dimensional predictor and the three-dimensional predictor, the correlation coefficient of the decoded signal in the vicinity of the encoding target pixel in the current frame and the reference frame is calculated. When the correlation coefficient is large, that is, when the waveform of the signal in the current frame and the signal in the reference frame are similar, the prediction accuracy is considered to improve, so that three-dimensional prediction is performed. In other cases, two-dimensional prediction is performed.
[0039]
A prediction method for each predictor and a specific switching method for the predictor will be described below. The prediction method of each predictor is as follows.
[0040]
Two-dimensional predictor 0 Predicted signal y = min (a, b) (1)
Two-dimensional predictor 1 Predicted signal y = max (a, b) (2)
Two-dimensional predictor 2 Predicted signal y = a + bc (3)
Three-dimensional predictor 3 Predicted signal y = min (a, x ′) (4)
Three-dimensional predictor 4 Prediction signal y = max (a, x ′) (5)
Three-dimensional predictor 5 Predicted signal y = a + x′−a (6)
Three-dimensional predictor 6 Predicted signal y = min (b, x ′) (7)
Three-dimensional predictor 7 Prediction signal y = max (b, x ′) (8)
Three-dimensional predictor 8 Predicted signal y = b + x′−b (9)
Three-dimensional predictor 9 Predicted signal y = (a + b + x ′) / 3 (10)
As shown in FIG. 7A, a, b, and c used here are decoded values of the upper, left, and upper right pixels adjacent to the pixel x to be encoded. a ′, b ′, and x ′ are the decoded values of the pixels of the reference frame, and are based on the motion vector (k, l) (k: horizontal direction, l: vertical direction) between the frame to be encoded and the reference frame. Determine the pixel location. The motion vector is calculated in advance by a block matching method or the like in units of small blocks of L × L pixels and transmitted as additional information. If the position of the pixel x to be encoded is (i, j), the position of x ′ is (i + k, j + l). Further, as shown in FIG. 7B, a ′ and b ′ are the pixels on the left side adjacent to x ′. As the reference frame, any one of a temporally forward frame, a backward frame, and a forward and backward frame is used. However, on the decoder side, the reference frame needs to be decoded first.
[0041]
When R ≦ T0 and c ≧ max (a, b), select 2D predictor 0 When R ≦ T0 and c ≦ min (a, b) Select 2D predictor 1 R ≦ T0 and min (a, b) b) If <c <max (a, b) Select 2D predictor 2 Select R> T0 and S> T1 and a ′ ≧ max (a, x ′) Select 3D predictor 3 R> T0 And when S> T1 and a ′ ≦ min (a, x ′), the three-dimensional predictor 4 is selected R> T0, S> T1, and min (a, x ′) <a ′ <max (a, x ′) In the case of selecting the three-dimensional predictor 5 In the case of R> T0 and S <−T1 and b ′ ≧ max (b, x ′), the three-dimensional predictor 6 is selected R> T0 and S <−T1 and b ′ ≦ min. In the case of (b, x ′), the three-dimensional predictor 7 is selected. In the case of R> T0, S <−T1, and min (b, x ′) <b ′ <max (b, x ′), the three-dimensional predictor 8 is selected. Select-option R> T0 and -T1 <3 dimensional predictor 9 For S <T1 where
R = aa ′ + bb ′ + cc ′ + dd ′ − (a + b + c + d) (a ′ + b ′ + c ′ + d ′) (11)
S = | x′−b ′ | − | x′−a ′ | (12)
T0, T1: Threshold values a, b, c, d, a ′, b ′, c ′, d ′, x ′: Decoded values of the pixels shown in FIG.
[0042]
Here, R is a correlation coefficient, and when R is larger than the threshold value T0, a three-dimensional predictor is selected. In other cases, a two-dimensional predictor is selected. This selection is actually performed in two stages. That is, the first decision branch means 36 in FIG. 5 performs the first decision branch based on the R value, and first switches between the two-dimensional predictor or the three-dimensional predictor to switch the two-dimensional predictor 33 or the three-dimensional predictor 34. The remaining second decision branch is performed to select one of the predictors 1 to 9.
[0043]
The switching method of the three predictors of the two-dimensional predictor has been proposed and is the same as the method adopted in the international standard JPEG-LS for still image lossless compression. When it is determined that there is an edge in the vertical direction and the horizontal method, prediction is performed using one pixel adjacent to each edge direction, and prediction is performed using three adjacent pixels in other cases.
[0044]
In the case of three-dimensional prediction as well as the two-dimensional predictor, adaptive prediction is performed in which the predictor is switched depending on the state of the neighborhood signal value of the pixel to be encoded. When it is determined that there is an edge in the vertical direction or the horizontal direction, prediction is performed using signals adjacent to each edge direction of the current frame and the reference frame. As for the edge direction, the difference absolute value | x′−a ′ | in the vertical direction of the reference frame is compared with the absolute difference value | x′−b ′ | in the horizontal direction, and a direction larger than the threshold T1 is determined as an edge. To do. S in the equation (12) is a difference value between them and is a parameter for determining the edge direction. When it is determined that the edge is a vertical edge for determining the edge direction, a prediction signal is selected in the same manner as the two-dimensional predictor with respect to the vertical signals of the current frame and the reference frame. The predictor is selected in the same manner for the edge in the horizontal direction. When it is determined that it is not an edge, the average value of three neighboring pixels is set as the predicted value.
[0045]
The addition / subtraction means 37 or 38 outputs a difference between the prediction signal output from the predictor and the original frame signal, that is, a prediction residual signal. The prediction residual signal is quantized by a quantizer (not shown). The quantized residual signal and the motion vector used in the three-dimensional predictor are input to the entropy encoding unit 12 in FIG. 1, and an encoded bit stream is output. When the quantization step of the quantizer is set to 1, the present encoding method is a lossless encoding method.
[0046]
[Second Embodiment]
FIG. 4 shows a basic configuration for realizing the decoding method for decoding the data encoded in the first embodiment. In FIG. 4, 20 is an entropy decoding unit, 21 is a space-time adaptive predictive decoding unit provided for each band, and 22 is a band synthesizing unit.
[0047]
A decoding method as an operation example of the configuration of FIG. 4 is shown below. First, the entropy decoding unit 20 obtains a motion vector and a prediction residual signal used for prediction from the encoded bit stream. Next, the encoded signal is decoded using the image signal and residual signal that have already been decoded by the space-time adaptive predictive encoding unit 21. Next, the band synthesizing unit 22 synthesizes the outputs of the spatiotemporal adaptive prediction encoding units 21 to decode the image.
[0048]
FIG. 6 shows a basic configuration of the space-time adaptive predictive decoding unit. In FIG. 6, 41 is a shift means, 42 is a two-dimensional predictor, 43 is an adder, 44 is a motion estimation three-dimensional predictor, 45 is an adder, 46 is a correlation coefficient R calculator, and 47 is a first determination. It is a branching means.
[0049]
The space-time adaptive predictive decoding method as the operation example of FIG. 6 is as follows. First, in order to determine whether to use the two-dimensional predictor 42 or the three-dimensional predictor 44, from the decoded signal of the reference intra-frame signal and the current intra-frame signal shifted by the shift means 41 using the motion vector, The correlation coefficient R is calculated by the correlation coefficient R calculation means 46. When the correlation coefficient R is larger than the threshold value T0, the first decision branching unit 47 switches to the motion estimation three-dimensional predictor 44 side to perform three-dimensional prediction, and otherwise, the two-dimensional predictor 42. Switch to the side and perform 2D prediction. The configuration of the two-dimensional predictor 42 and the motion estimation three-dimensional predictor 44 and the switching of a plurality of predictors prepared therein are the same as those in the first embodiment. The motion estimation three-dimensional predictor 44 generates a prediction signal using the decoded signal of the current intraframe signal and the reference intraframe signal shifted using the motion vector, and the adder 45 adds the residual signal to the prediction signal. Is added to restore the target signal of the current frame. The two-dimensional predictor 42 generates a prediction signal using the decoded signal of the signal in the current frame, and the adding unit 43 adds the residual signal to the prediction signal, thereby restoring the target signal of the current frame.
[0050]
[Third Embodiment]
In this embodiment, the spatio-temporal adaptive predictive coding unit 11 of the first embodiment estimates the motion of the target object in each band by the block matching method. In the block matching method, the following SAD (Sumof Absolute Difference) value is calculated in order to obtain a motion vector.
[0051]
SAD (k, l) = Σi = 1 L Σj = 1 L | x (i, j) −y (i + k, j + l) | (13)
Here, SAD (k, l) is calculated in the range of (k, l) -w <k, 1 <w (w is the window size), and the vector (k, l) giving the minimum SAD value moves. Selected as a vector. In order to improve the prediction accuracy of the three-dimensional predictor, SAD is usually calculated for each band. The calculation of SAD takes a considerable amount of time. Considering this, the following three simple encoding methods (1), (2), and (3) are proposed to reduce the calculation time while minimizing the decrease in encoding efficiency.
[0052]
(1) The inter-frame correlation and intra-frame correlation of the band-divided signal are stronger as the frequency is lower and weaker as the frequency is higher. Since signals other than the lowest frequency band have weak inter-frame correlation and intra-frame correlation, the effect of space-time adaptive prediction coding does not appear so significantly. Using this property, space-time adaptive predictive coding is applied only to the lowest frequency band. The calculation amount of SAD is extremely reduced, and the two-dimensional and three-dimensional prediction processing times are also reduced. The motion vector in the lowest frequency band and the prediction residual signal are entropy coded, and the signal other than the lowest frequency band is directly entropy coded.
[0053]
FIG. 8 shows a basic configuration diagram for realizing this method. In FIG. 8, 50 is a band dividing unit, 51 is a space-time adaptive prediction encoding unit for the lowest frequency band, and 52 is an entropy encoding unit 52. First, the input image signal is divided into a plurality of spatial resolution bands by the band dividing unit 50 . Next, a residual signal is generated by the spatio-temporal adaptive prediction encoding unit 51 only for the lowest frequency band among the divided bands, and entropy encoding unit 52 performs entropy encoding. The entropy encoding unit 52 directly encodes signals in other bands.
[0054]
(2) A motion vector is obtained by performing motion estimation only in the lowest frequency band. In other bands, space-time adaptive prediction encoding is performed using motion vectors based on the motion vector in the lowest frequency band. Since the movement of the target object does not change for each band, the movement of the high-frequency object and the movement of the low-frequency object should be equal. That is, it is assumed that the small block motion vectors existing in the same direction from the low range to the high range are the same. For example, the movements of the small blocks indicated by the arrows in FIG. However, the number of pixels doubles in the vertical and horizontal directions each time the band increases in one high region, so the motion vector in one high region is
(2k, 2l)
It becomes. The motion vector of the N stage high region is
(N × k, N × l)
It becomes.
[0055]
The basic configuration diagram for realizing this method is the same as that in FIG. 1, but the motion vector used in the space-time adaptive prediction encoding unit 11 for each band is a motion vector based on the motion vector in the lowest frequency band. Use. The motion vector in the lowest frequency band and the prediction residual signal in the entire band are entropy encoded by the entropy encoding unit 12.
[0056]
(3) When calculating SAD, it is performed from low to high. In the example of FIG. 3, the order is LL3->HL3->LH3->HH3->HL2->LH2->HH2->HL1->LH1-> HH1. First, SAD is calculated for each small block in the lowest frequency band. SAD
SAD (k, l)> T (threshold value) (14)
For the signals in the small blocks, it is determined that the inter-frame correlation is weak, and the two-dimensional prediction is performed without performing the spatiotemporal adaptive prediction process. In addition, the entropy coding is directly performed on the corresponding high-frequency small block signals without performing the space-time adaptive prediction coding.
[0057]
For a signal in a block that does not satisfy Expression (14), space-time adaptive prediction coding is performed as usual. In the subsequent high-band block, SAD
SAD (k, l)> Tx (threshold in high band. Threshold varies depending on band) (15)
In this case, it is determined that the correlation between frames is weak, and direct entropy coding is performed without performing space-time adaptive prediction coding. In addition, when the SAD of the corresponding low-frequency block already satisfies the equation (14), it is determined that the direct entropy encoding is performed, so the calculation of the SAD and the determination of the equation (15) Not performed.
[0058]
A small block that satisfies the conditions of equations (14) and (15) transmits a unique code LIMIT instead of a motion vector as additional information, and does not transmit additional information in the corresponding high-frequency small block. The motion vector, the unique code LIMIT, and the prediction residual signal are entropy encoded.
[0059]
The basic configuration diagram for realizing this method is the same as that in FIG. 1, but each space-time adaptive predictive encoder 11 has a function of calculating SAD from low to high in block unit motion estimation. And a function for determining whether to perform space-time adaptive predictive coding, a function for transmitting a unique code LIMIT, and the like. The entropy encoder 12 entropy-encodes the motion vector, the unique code LIMIT, a signal not subjected to space-time adaptive prediction encoding, or a prediction residual signal from each space-time adaptive prediction encoder 11.
[0060]
[Fourth Embodiment]
A simple decoding method of a signal encoded by a simple encoding method according to a third embodiment will be described.
[0061]
(1) FIG. 9 shows a basic configuration diagram for decoding a signal encoded by the simple encoding (1). In FIG. 9, 60 is an entropy decoding unit, 61 is a space-time adaptive prediction decoding unit for the lowest frequency band, and 62 is a band synthesizing unit.
[0062]
In this method, using the motion vector entropy-decoded by the entropy decoding unit 60 and the prediction residual signal, the spatio-temporal prediction decoding unit 61 decodes the signal in the lowest frequency band. Other bands are directly decoded by the entropy decoding unit 60 by entropy decoding. The band synthesizer 62 synthesizes the output of each band and decodes the image.
[0063]
(2) The basic configuration diagram for realizing the decoding method for decoding the signal encoded by the simple encoding (2) is the same as that in FIG. 4, but the spatio-temporal adaptive predictive decoding unit for each band. The motion vector used in 21 is a motion vector based on the motion vector in the lowest frequency band. That is, based on the motion vector (k, l) of the lowest frequency band entropy decoded by the entropy decoding unit 20, the motion vector of the N-stage high band is
(N × k, N × l)
Calculate according to Based on the result, the spatio-temporal adaptive predictive decoding unit 21 performs decoding processing for each band, and the band synthesizing unit 22 synthesizes the output of each band to decode the image.
[0064]
(3) The basic configuration diagram for realizing the decoding method for decoding the signal encoded by the simple encoding (3) is the same as that in FIG. 4, but the space-time adaptive predictive decoding unit for each band. 21, using the motion vector (k, l) of the lowest frequency band entropy decoded by the entropy decoding unit 20 and the prediction residual signal, the lowest frequency band to the highest frequency band (in the example of FIG. 3). LL3->HL3->LH3->HH3->HL2->LH2->HH2->HL1->LH1-> HH1) in order, and output by performing spatio-temporal adaptive predictive decoding processing, or entropy-decoded by the eigencode LIMIT Direct output of frequency band signals. The band synthesizer 22 synthesizes the output of each band and decodes the image.
[0065]
【The invention's effect】
As is apparent from the above description, according to the present invention, lossless encoding with high efficiency of moving images can be performed, and storage with a small disk capacity is possible. Furthermore, since it has spatial resolution scalability, it is possible to decode an image with a spatial resolution according to the performance and application of the image display device. When decoding from a low band to an arbitrary band, an image having a lower spatial resolution than the original image can be reproduced, and when all data is decoded, an image having the same resolution as the original image is reproduced. If you want to reproduce an image with a resolution lower than the original image depending on the accuracy and application of the image display device, you only need to decode up to the required bandwidth. If you perform decoding, the image is directly decoded from the encoded data. The processing time is shorter than when the resolution conversion is performed after the image having the same resolution as the original image is reproduced. Also, when transmitting an encoded bit stream, only the necessary data is transmitted, so the transmission rate is also reduced.
[Brief description of the drawings]
FIG. 1 is a diagram showing a basic configuration for realizing a moving picture coding method according to a first embodiment of the present invention.
FIG. 2 is a diagram for explaining octave division;
FIG. 3 is a diagram illustrating band division of an image.
FIG. 4 is a diagram showing a basic configuration for realizing a moving picture decoding method according to a second embodiment of the present invention.
FIG. 5 is a diagram illustrating a basic configuration of a spatiotemporal adaptive prediction encoding unit in the present invention.
FIG. 6 is a diagram illustrating a basic configuration of a spatiotemporal adaptive predictive decoding unit according to the present invention.
FIGS. 7A and 7B are diagrams illustrating signals used for prediction. FIGS.
FIG. 8 is a diagram showing a basic configuration for realizing simple encoding (1) according to a third embodiment of the present invention.
FIG. 9 is a diagram showing a basic configuration for realizing simple decoding (1) according to a fourth embodiment of the present invention.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 10 ... Band division part 11 ... Spatio-temporal adaptive prediction encoding part 12 ... Entropy encoding part 20 ... Entropy decoding part 21 ... Spatio-temporal adaptive prediction decoding part 22 ... Band synthesis part 31 ... Block unit motion estimation means 32 ... Shift means 33 ... Two-dimensional predictor 34 ... Motion estimation three-dimensional predictor 35 ... Correlation coefficient R calculation means 36 ... First decision branching means 37 ... Addition / subtraction means 38 ... Addition / subtraction means 41 ... Shift means 42 ... Two-dimensional predictor 43 ... Addition unit 44 ... motion estimation three-dimensional predictor 45 ... addition unit 46 ... correlation coefficient R calculation unit 47 ... first decision branching unit 50 ... band division unit 51 ... spatio-temporal adaptive prediction encoding unit 52 ... entropy encoding unit 60 ... Entropy decoding unit 61 ... Spatio-temporal adaptive prediction decoding unit 62 ... Band synthesis unit

Claims (12)

動画像を対象とする可逆符号化方法において、原画像を帯域分割し、該分割した帯域毎に動き推定により時空間適応予測を行って予測残差信号を求め、該帯域毎の予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化する際に、
該時空間適応予測では、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出し、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出することを特徴とする動画像可逆符号化方法。
In a lossless encoding method for a moving image, an original image is band-divided, and a prediction residual signal is obtained by performing space-time adaptive prediction by motion estimation for each of the divided bands to obtain a prediction residual signal for each band. And the motion vector used in the spatio-temporal adaptive prediction,
In the spatio-temporal adaptive prediction, a motion vector is obtained from the current frame and the reference frame by the block unit estimation means, and the target frame neighboring signal value of the current frame and the reference frame shifted by the shift means is used using the motion vector. When the correlation coefficient is calculated and the correlation coefficient is large, switching to the three-dimensional prediction in which prediction is performed using the encoding target pixel neighboring signal values of the current frame and the reference frame, and when the correlation coefficient is small , Switch to two-dimensional prediction in which prediction is performed using only the encoding target pixel neighborhood signal value of the current frame,
In the case of switching to the two-dimensional prediction, a prediction residual signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame,
When switching to the three-dimensional prediction, the prediction residual signal is calculated by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame. A moving image lossless encoding method.
動画像を出力する可逆復号化方法において、請求項1記載の動画像可逆符号化方法により符号化された帯域毎の予測残差信号と動きベクトルを復号し、該帯域毎の予測残差信号と該動きベクトルを用いて該帯域毎に時空間適応予測復号を行い、該時空間適応予測復号された帯域を帯域合成して動画像を復号する際に、
該時空間適応予測復号では、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出し、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出し、
該予測信号に該予測残差信号を付加して対象信号を復号化することを特徴とする動画像可逆復号化方法。
In the lossless decoding method which outputs a moving image, the prediction residual signal and the motion vector for each band encoded by the moving image lossless encoding method according to claim 1 are decoded, and the prediction residual signal for each band is decoded. When performing space-time adaptive prediction decoding for each band using the motion vector, and decoding a moving image by performing band synthesis on the space-time adaptive prediction decoded band,
The said time space adaptive prediction decoding, correlation coefficients and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal When the correlation coefficient is large, switch to 3D prediction, and when the correlation coefficient is small, switch to 2D prediction.
In the case of switching to the two-dimensional prediction, a prediction signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the decoding target pixel neighboring signal value including the decoded signal of the signal in the current frame,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Calculate prediction signals by switching multiple 3D predictors for each pixel,
A moving picture lossless decoding method comprising decoding the target signal by adding the prediction residual signal to the prediction signal.
動画像を対象とする可逆符号化方法において、原画像を帯域分割し、該分割した帯域のうち最低周波数帯域に動き推定により時空間適応予測を行って予測残差信号を求め、該予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化するとともに該最低周波数帯域以外の帯域を直接符号化する際に、
該時空間適応予測では、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出し、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出することを特徴とする動画像可逆符号化方法。
In a lossless encoding method for moving images, an original image is band-divided, and a prediction residual signal is obtained by performing space-time adaptive prediction by motion estimation in the lowest frequency band of the divided bands, and the prediction residual is obtained. When encoding a signal and a motion vector used in the space-time adaptive prediction and directly encoding a band other than the lowest frequency band,
In the spatio-temporal adaptive prediction, a motion vector is obtained from the current frame and the reference frame by the block unit estimation means, and the target frame neighboring signal value of the current frame and the reference frame shifted by the shift means is used using the motion vector. When the correlation coefficient is calculated and the correlation coefficient is large, switching to the three-dimensional prediction in which prediction is performed using the encoding target pixel neighboring signal values of the current frame and the reference frame, and when the correlation coefficient is small , Switch to two-dimensional prediction in which prediction is performed using only the encoding target pixel neighborhood signal value of the current frame,
In the case of switching to the two-dimensional prediction, a prediction residual signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame,
When switching to the three-dimensional prediction, the prediction residual signal is calculated by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame. A moving image lossless encoding method.
動画像を出力する可逆復号化方法において、請求項3記載の動画像可逆符号化方法により符号化された信号のうち、最低周波数帯域の予測残差信号と動きベクトルを復号して用いて時空間適応予測復号を行い、該最低周波数帯域以外の帯域を直接復号し、該時空間適応予測復号された最低周波数帯域と該直接復号された該最低周波数帯域以外の帯域とを帯域合成して動画像を復号する際に、
該時空間適応予測復号では、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出し、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出し、
該予測信号に該予測残差信号を付加して対象信号を復号化することを特徴とする動画像可逆復号化方法。
4. A lossless decoding method for outputting a moving image, wherein among the signals encoded by the moving image lossless encoding method according to claim 3, a prediction residual signal in the lowest frequency band and a motion vector are decoded and used in a spatio-temporal manner. Performs adaptive predictive decoding, directly decodes bands other than the lowest frequency band, and performs band synthesis of the lowest frequency band subjected to space-time adaptive predictive decoding and the band other than the directly decoded lowest frequency band. When decrypting
The said time space adaptive prediction decoding, correlation coefficients and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal When the correlation coefficient is large, switch to 3D prediction, and when the correlation coefficient is small, switch to 2D prediction.
In the case of switching to the two-dimensional prediction, a prediction signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the decoding target pixel neighboring signal value including the decoded signal of the signal in the current frame,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Calculate prediction signals by switching multiple 3D predictors for each pixel,
A moving picture lossless decoding method comprising decoding the target signal by adding the prediction residual signal to the prediction signal.
動画像を対象とする可逆符号化方法において、原画像を帯域分割し、該分割した最低周波数帯域では第1の時空間適応予測を行い、他の周波数帯域では第2の時空間適応予測を行い、帯域ごとに予測残差信号を求め、該帯域毎の予測残差信号と該最低周波数帯域の動きベクトルである基準動きベクトルとを符号化する際に、
第1の時空間適応予測では、現フレームと参照フレームからブロック単位推定手段により該基準動きベクトルを得、該基準動きベクトルを用いて、そして該第2の時空間適応予測では、該基準動きベクトルを基準にした動きベクトルを用いて、それぞれ現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出し、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出することを特徴とする動画像可逆符号化方法。
In a lossless encoding method for moving images, the original image is divided into bands, and the first spatiotemporal adaptive prediction is performed in the divided lowest frequency band , and the second spatiotemporal adaptive prediction is performed in the other frequency bands. When obtaining a prediction residual signal for each band and encoding the prediction residual signal for each band and a reference motion vector that is a motion vector of the lowest frequency band ,
The In the first space-time adaptive prediction, give the reference motion vector by a block unit estimating means from the reference frame and the current frame, by using the reference motion vector, and the space-time adaptive prediction of the second, the reference motion Using the motion vector based on the vector, the correlation coefficient of the signal near the pixel to be encoded for the current frame and the reference frame shifted by the shift means is calculated. Switch to three-dimensional prediction that uses the signal to be encoded pixel neighboring signal value of the frame and reference frame, and if the correlation coefficient is small, predict using only the signal to be encoded pixel neighboring signal value of the current frame Switch to two-dimensional prediction
In the case of switching to the two-dimensional prediction, a prediction residual signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame,
When switching to the three-dimensional prediction, the prediction residual signal is calculated by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame. A moving image lossless encoding method.
動画像を出力する可逆復号化方法において、請求項5記載の動画像可逆符号化方法により符号化された帯域毎の予測残差信号と最低周波数帯域の動きベクトルである基準動きベクトルを復号し、該帯域毎に時空間適応予測復号を行い、該時空間適応予測復号された帯域を帯域合成して動画像を復号する際に、
最低周波数帯域に係る時空間適応予測復号では該基準動きベクトルを用いて、その他の周波数帯域に係る時空間適応予測では該基準動きベクトルを基準にした動きベクトルを用いて、シフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換え、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出し、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測信号を算出し、
該予測信号に該予測残差信号を付加して対象信号を復号化することを特徴とする動画像可逆復号化方法。
In the lossless decoding method for outputting a moving image, the prediction residual signal for each band encoded by the moving image lossless encoding method according to claim 5 and a reference motion vector which is a motion vector in the lowest frequency band are decoded . It performs space-time adaptive prediction decoding for each said zone, when decoding a moving image by band synthesizing the band that has been said time space adaptive prediction decoding,
In the spatio-temporal adaptive prediction decoding related to the lowest frequency band, the reference motion vector is used, and in the spatio-temporal adaptive prediction related to other frequency bands, the shifted reference frame is decoded using the motion vector based on the reference motion vector. a-target pixel proximity signal value, calculates the correlation coefficient between the decoding target pixel sensor signal values consisting decoded signal of the current frame signal, when the correlation coefficient is large switched to 3D prediction, correlation If the number is small, switch to 2D prediction,
In the case of switching to the two-dimensional prediction, a prediction signal is calculated by switching a plurality of two-dimensional predictors for each pixel from the decoding target pixel neighboring signal value including the decoded signal of the signal in the current frame,
When switched to the three-dimensional prediction, pixels from the decoded and decoded pixel neighboring signal value and a signal, decoded pixel near the signal value of the reference frame is shifted by using the motion vector of the current frame signal Each time a plurality of 3D predictors are switched to calculate a prediction signal,
A moving picture lossless decoding method comprising decoding the target signal by adding the prediction residual signal to the prediction signal.
動画像を対象とする可逆符号化装置において、原画像を帯域分割する手段と、該分割した帯域毎に動き推定により時空間適応予測を行って予測残差信号を求める手段と、該帯域毎の予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化する手段を有し、
該時空間適応予測を行って予測残差信号を求める手段は、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出する手段とを、有することを特徴とする動画像可逆符号化装置。
In a lossless encoding apparatus for moving images, means for dividing an original image into bands, means for performing space-time adaptive prediction by motion estimation for each divided band, obtaining a prediction residual signal, Means for encoding a prediction residual signal and a motion vector used in the space-time adaptive prediction;
The means for obtaining the prediction residual signal by performing the spatiotemporal adaptive prediction obtains a motion vector from the current frame and the reference frame by the block unit estimation means, and uses the motion vector to shift the current frame and the reference frame shifted by the shift means. When the correlation coefficient of the encoding target pixel neighboring signal value is calculated and the correlation coefficient is large, the prediction is performed using the encoding target pixel neighboring signal value of the current frame and the reference frame. Switching, when the correlation coefficient is small, means for switching to two-dimensional prediction for performing prediction using only the pixel target signal neighborhood signal value of the current frame;
In the case of switching to the two-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame;
In the case of switching to the three-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame , A moving image lossless encoding apparatus comprising:
動画像を出力する可逆復号化装置において、請求項7記載の動画像可逆符号化装置により符号化された帯域毎の予測残差信号と動きベクトルを復号する手段と、該帯域毎の予測残差信号と該動きベクトルを用いて該帯域毎に時空間適応予測復号を行う手段と、該時空間適応予測復号された帯域を帯域合成して動画像を復号する手段とを有し、
該時空間適応予測復号する手段は、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出する手段と、
該予測信号に該予測残差信号を付加して対象信号を復号化する手段とを、有することを特徴とする動画像可逆復号化装置。
A lossless decoding apparatus for outputting a moving image, wherein the prediction residual signal and motion vector for each band encoded by the lossless video encoding apparatus according to claim 7 are decoded, and the prediction residual for each band. Means for performing spatiotemporal adaptive prediction decoding for each band using a signal and the motion vector; and means for decoding a moving image by performing band synthesis on the spatiotemporal adaptive prediction decoded band;
Said time space adaptive prediction decoding to means, phase and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal Means for calculating the number of relationships, switching to three-dimensional prediction when the correlation coefficient is large, and switching to two-dimensional prediction when the correlation coefficient is small;
Means for calculating a prediction signal by switching a plurality of two-dimensional predictors for each pixel from a decoding target pixel neighborhood signal value made up of a decoded signal of a signal in the current frame when switched to the two-dimensional prediction; ,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Means for calculating a prediction signal by switching a plurality of three-dimensional predictors for each pixel;
And a means for decoding the target signal by adding the prediction residual signal to the prediction signal.
動画像を対象とする可逆符号化装置において、原画像を帯域分割する手段と、該分割した帯域のうち最低周波数帯域に動き推定により時空間適応予測を行って予測残差信号を求める手段と、該予測残差信号と該時空間適応予測で用いた動きベクトルとを符号化するとともに該最低周波数帯域以外の帯域を直接符号化する手段とを有し、
該時空間適応予測を行う手段は、現フレームと参照フレームからブロック単位推定手段により動きベクトルを得、その動きベクトルを用いて現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出する手段とを、有することを特徴とする動画像可逆符号化装置。
In a lossless encoding apparatus for moving images, means for band-dividing an original image, means for obtaining a prediction residual signal by performing space-time adaptive prediction by motion estimation in the lowest frequency band of the divided bands, Means for encoding the prediction residual signal and the motion vector used in the spatiotemporal adaptive prediction and directly encoding a band other than the lowest frequency band;
The spatio-temporal adaptive prediction means obtains a motion vector from the current frame and the reference frame by a block unit estimation means, and uses the motion vector to detect the vicinity of the encoding target pixel of the current frame and the reference frame shifted by the shift means. When the correlation coefficient of the signal value is calculated, and the correlation coefficient is large, switching to three-dimensional prediction in which prediction is performed using the signal value near the encoding target pixel in the current frame and the reference frame, and the correlation coefficient is small In this case, a means for switching to two-dimensional prediction for performing prediction using only the encoding target pixel neighborhood signal value of the current frame;
In the case of switching to the two-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame;
In the case of switching to the three-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame , A moving image lossless encoding apparatus comprising:
動画像を出力する可逆復号化装置において、請求項9記載の動画像可逆符号化装置により符号化された信号のうち、最低周波数帯域の予測残差信号と動きベクトルを復号するとともに該最低周波数帯域以外の帯域を直接復号する手段と、該最低周波数帯域の予測残差信号と該動きベクトルを用いて時空間適応予測復号を行う手段と、該時空間適応予測復号された最低周波数帯域と該直接復号された該最低周波数帯域以外の帯域とを帯域合成して動画像を復号する手段とを有し、
該時空間適応予測復号する手段は、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から、画素毎に複数の3次元予測器を切換えて予測信号を算出する手段と、
該予測信号に該予測残差信号を付加して対象信号を復号化する手段とを、有することを特徴とする動画像可逆復号化装置。
10. A lossless decoding apparatus that outputs a moving picture, wherein the prediction residual signal and the motion vector of the lowest frequency band are decoded from the signals encoded by the moving picture lossless encoding apparatus according to claim 9 , and the lowest frequency band is decoded. Means for directly decoding a band other than the above, means for performing space-time adaptive prediction decoding using the prediction residual signal of the lowest frequency band and the motion vector, and the lowest frequency band subjected to space-time adaptive prediction decoding and the direct Means for decoding a moving image by performing band synthesis with a band other than the decoded lowest frequency band,
Said time space adaptive prediction decoding to means, phase and decoded pixel near the signal value of the reference frame is shifted by using the motion vector, a decoded pixel near the signal value consisting decoded signal of the current frame signal Means for calculating the number of relationships, switching to three-dimensional prediction when the correlation coefficient is large, and switching to two-dimensional prediction when the correlation coefficient is small;
Means for calculating a prediction signal by switching a plurality of two-dimensional predictors for each pixel from a decoding target pixel neighborhood signal value made up of a decoded signal of a signal in the current frame when switched to the two-dimensional prediction; ,
When switched to the three-dimensional prediction, a decoded pixel near the signal value consisting decoded signal of the current frame signal, from the decoded pixel near the signal value of the reference frame is shifted by using the motion vector, Means for calculating a prediction signal by switching a plurality of three-dimensional predictors for each pixel;
And a means for decoding the target signal by adding the prediction residual signal to the prediction signal.
動画像を対象とする可逆符号化装置において、原画像を帯域分割する手段と、該分割した最低周波数帯域では第1の時空間適応予測を行い、他の周波数帯域では第2の時空間適応予測を行い、帯域ごとに予測残差信号を求める手段と、該帯域毎の予測残差信号と該最低周波数帯域の動きベクトルである基準動きベクトルとを符号化する手段とを有し、
第1の時空間適応予測を行う手段は、現フレームと参照フレームからブロック単位推定手段により該基準動きベクトルを得、該基準動きベクトルを用いて、そして該第2の時空間適応予測では、該基準動きベクトルを基準にした動きベクトルを用いて、それぞれ現フレームと、シフト手段でシフトした参照フレームの被符号化対象画素近傍信号値の相関係数を計算し、相関係数が大きい場合には、現フレームと参照フレームの被符号化対象画素近傍信号値を用いて予測を行う3次元予測に切換え、相関係数が小さい場合には、現フレームの被符号化対象画素近傍信号値のみを用いて予測を行う2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレームの被符号化対象画素近傍信号値から画素毎に複数の2次元予測器を切換えて予測残差信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレームと参照フレームの被符号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測残差信号を算出する手段とを、有することを特徴とする動画像可逆符号化装置。
In a lossless encoding apparatus for moving images, means for band-dividing an original image and first space-time adaptive prediction in the divided lowest frequency band , and second space-time adaptive prediction in other frequency bands was carried out, comprising means for obtaining a prediction residual signal for each band, and means for encoding a reference motion vector is a motion vector of the prediction residual signal and the outermost low-frequency band of each band-,
The first means for performing a space-time adaptive prediction, give the reference motion vector by a block unit estimating means from the reference frame and the current frame, by using the reference motion vector, and the space-time adaptive prediction of the second, When using the motion vector based on the reference motion vector to calculate the correlation coefficient of the signal to be encoded pixel neighboring signal values of the current frame and the reference frame shifted by the shift means , respectively , when the correlation coefficient is large Is switched to three-dimensional prediction in which prediction is performed using the encoding target pixel neighboring signal values of the current frame and the reference frame, and when the correlation coefficient is small, only the encoding target pixel neighboring signal value of the current frame is used. Means for switching to two-dimensional prediction using prediction,
In the case of switching to the two-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of two-dimensional predictors for each pixel from the encoding target pixel vicinity signal value of the current frame;
In the case of switching to the three-dimensional prediction, a means for calculating a prediction residual signal by switching a plurality of three-dimensional predictors for each pixel from the encoding target pixel neighboring signal values of the current frame and the reference frame , A moving image lossless encoding apparatus comprising:
動画像を出力する可逆復号化装置において、請求項11記載の動画像可逆符号化装置により符号化された帯域毎の予測残差信号と最低周波数帯域の動きベクトルである基準動きベクトルを復号する手段と、該帯域毎に時空間適応予測復号を行う手段と、該時空間適応予測復号された帯域を帯域合成して動画像を復号する手段とを有し、
該時空間適応予測復号する手段は、最低周波数帯域に係る復号では該基準動きベクトルを用いて、その他の周波数帯域に係る復号では該基準動きベクトルを基準にした動きベクトルを用いて、シフトした参照フレームの復号化対象画素近傍信号値と、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値との相関係数を計算し、相関係数が大きい場合には3次元予測に切換え、相関係数が小さい場合には2次元予測に切換える手段と、
該2次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値から、画素毎に複数の2次元予測器を切換えて予測信号を算出する手段と、
該3次元予測に切換えられた場合には、現フレーム内信号の復号済み信号からなる復号化対象画素近傍信号値と、動きベクトルを用いてシフトした参照フレームの復号化対象画素近傍信号値から画素毎に複数の3次元予測器を切換えて予測信号を算出する手段と、
該予測信号に該予測残差信号を付加して対象信号を復号化する手段とを、有することを特徴とする動画像可逆復号化装置。
12. A lossless decoding apparatus for outputting a moving picture, wherein the means for decoding a prediction residual signal for each band and a reference motion vector , which is a motion vector in the lowest frequency band, encoded by the moving picture lossless encoding apparatus according to claim 11. When, and means for decoding and means for performing a space-time adaptive prediction decoding for each said zone, a moving image and band synthesizing the band that has been said time space adaptive prediction decoding,
The spatio-temporal adaptive predictive decoding means uses the reference motion vector for decoding related to the lowest frequency band, and uses a motion vector based on the reference motion vector for decoding related to the other frequency bands . Calculate the correlation coefficient between the decoding target pixel neighborhood signal value of the frame and the decoding target pixel neighborhood signal value consisting of the decoded signal of the signal in the current frame, and switch to three-dimensional prediction when the correlation coefficient is large Means for switching to two-dimensional prediction when the correlation coefficient is small;
Means for calculating a prediction signal by switching a plurality of two-dimensional predictors for each pixel from a decoding target pixel neighborhood signal value made up of a decoded signal of a signal in the current frame when switched to the two-dimensional prediction; ,
When switched to the three-dimensional prediction, pixels from the decoded and decoded pixel neighboring signal value and a signal, decoded pixel near the signal value of the reference frame is shifted by using the motion vector of the current frame signal Means for calculating a prediction signal by switching a plurality of three-dimensional predictors every time;
And a means for decoding the target signal by adding the prediction residual signal to the prediction signal.
JP2001308796A 2001-10-04 2001-10-04 Lossless video encoding method, decoding method thereof, and apparatus thereof Expired - Fee Related JP4113696B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001308796A JP4113696B2 (en) 2001-10-04 2001-10-04 Lossless video encoding method, decoding method thereof, and apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001308796A JP4113696B2 (en) 2001-10-04 2001-10-04 Lossless video encoding method, decoding method thereof, and apparatus thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2008059225A Division JP4511607B2 (en) 2008-03-10 2008-03-10 Lossless video encoding method, decoding method thereof, and program thereof

Publications (2)

Publication Number Publication Date
JP2003116140A JP2003116140A (en) 2003-04-18
JP4113696B2 true JP4113696B2 (en) 2008-07-09

Family

ID=19128047

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001308796A Expired - Fee Related JP4113696B2 (en) 2001-10-04 2001-10-04 Lossless video encoding method, decoding method thereof, and apparatus thereof

Country Status (1)

Country Link
JP (1) JP4113696B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4522951B2 (en) * 2006-01-16 2010-08-11 日本電信電話株式会社 Moving picture encoding method and apparatus, decoding method and apparatus, moving picture processing program, and computer-readable recording medium
JP5022400B2 (en) * 2009-03-30 2012-09-12 日本放送協会 Moving image noise removing device, moving region image noise removing device, moving image noise removing program, and moving region image noise removing program
JP2012129949A (en) * 2010-12-17 2012-07-05 Toshiba Corp Image encoding method and device, and image decoding method and device

Also Published As

Publication number Publication date
JP2003116140A (en) 2003-04-18

Similar Documents

Publication Publication Date Title
KR102051083B1 (en) Video encoding apparatus for performing intra-prediction based on directionality of neighboring block, video decoding apparatus and video decoding method for performing the same
EP1723606B1 (en) Method for encoding interlaced digital video data
JP4991699B2 (en) Scalable encoding and decoding methods for video signals
US8401079B2 (en) Image coding apparatus, image coding method, image decoding apparatus, image decoding method and communication apparatus
WO2012042719A1 (en) Dynamic image encoding device, dynamic image decoding device, dynamic image encoding method, and dynamic image decoding method
KR20060109249A (en) Method and apparatus for predicting motion vector of a macro block using motion vectors of a picture of base layer when encoding/decoding video signal
EP2555523A1 (en) Image encoding device, image decoding device, image encoding method, and image decoding method
KR20120105396A (en) Techniques for motion estimation
WO2019069602A1 (en) Video coding device, video decoding device, video coding method, video decoding method, program and video system
JP2006279917A (en) Dynamic image encoding device, dynamic image decoding device and dynamic image transmitting system
KR20150034699A (en) Method and apparatus for image interpolation having quarter pixel accuracy using intra prediction modes
WO2011070730A1 (en) Video coding device and video decoding device
JP4113696B2 (en) Lossless video encoding method, decoding method thereof, and apparatus thereof
JP5598199B2 (en) Video encoding device
JP4511607B2 (en) Lossless video encoding method, decoding method thereof, and program thereof
JPH0591498A (en) Band division moving picture encoder
JP3776735B2 (en) Image predictive decoding method, image predictive decoding device, image predictive encoding method, image predictive encoding device, and data storage medium
JP2021129148A (en) Prediction device, encoding device, decoding device, and program
JP4697802B2 (en) Video predictive coding method and apparatus
KR102111437B1 (en) Method and apparatus for image interpolation having quarter pixel accuracy using intra prediction modes
KR20060063604A (en) Method for encoding and decoding video signal
JP4153774B2 (en) Video encoding method, decoding method thereof, and apparatus thereof
JP2003116141A (en) Moving picture prediction encoding method and its decoding method, and apparatus for the same
KR101285841B1 (en) Motion vector encoder and decoder, and method for encoding and decoding thereof
JP2022070176A (en) Encoding device and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050822

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060808

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061010

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080408

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080414

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees