JP2004364333A - 画像符号化装置 - Google Patents

画像符号化装置 Download PDF

Info

Publication number
JP2004364333A
JP2004364333A JP2004231020A JP2004231020A JP2004364333A JP 2004364333 A JP2004364333 A JP 2004364333A JP 2004231020 A JP2004231020 A JP 2004231020A JP 2004231020 A JP2004231020 A JP 2004231020A JP 2004364333 A JP2004364333 A JP 2004364333A
Authority
JP
Japan
Prior art keywords
image
prediction
motion compensation
unit
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004231020A
Other languages
English (en)
Other versions
JP3734488B2 (ja
Inventor
Hiroyuki Katada
裕之 堅田
Hiroshi Kusao
寛 草尾
Tomoko Aono
友子 青野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2004231020A priority Critical patent/JP3734488B2/ja
Publication of JP2004364333A publication Critical patent/JP2004364333A/ja
Application granted granted Critical
Publication of JP3734488B2 publication Critical patent/JP3734488B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Abstract

【課題】幾何学変換によって予測画像を求めるモードと並行移動によって予測画像を求めるモードをブロック毎に適応的に切り換えて予測効率の向上を図る。
【解決手段】画像を分割して得られる格子点動き推定部2は、各ブロックに対して参照画像上の格子点が原画像上のどの位置に動いたかを推定する。並行移動ベクトル決定部16は、ブロック自体が並行移動する場合の動ベクトル(並行移動ベクトル)を求め、動き補償予測部4は、幾何学変換による動き補償予測を行い、動き補償予測部5は並行移動によって動き補償予測を行い、各々出力された予測画像は予測画像選択部6に供給される。予測画像選択部6は、予測画像をブロック毎に適応的に選択肢、予測画像と予測モード情報を出力する。並行移動を表わす動ベクトルの候補として幾何学変換を表わす複数の動ベクトルの平均ベクトルを用いる。
【選択図】図5

Description

本発明は、画像符号化装置に関し、より詳細には、予測画像作成回路において、幾可学変換によって予測画像を求めるモードと並行移動によって予測画像を求めるモードをブロック毎に適応的に切り換え、予測効率を向上させるようにした画像符号化装置に関する。例えば、ディジタル画像処理における画像データの高能率符号化に適用されるものである。
フレーム間予測の方式として、従来よりアフィン変換を用いた予測方法が検討されている。例えば、非特許文献1,2に述べられている方法では、図12に示すように格子の変形によって画像の動きを表現し、参照画像(通常、符号化装置では局所復号されフレームメモリに蓄えられている画像であり、復号装置ではすでに復号されフレームメモリに蓄えられている画像である)からの幾何学変換によって予測画像が作成される。ここで●は格子点(四角形ブロックの頂点)を表す。
図13は、従来の画像符号化装置における予測画像作成回路の構成図で、図中、32は四角形ブロックの分割部、33は格子点動き推定部、34は動き補償予測部である。
四角形ブロックへの分割部32では参照画像を四角形に分割する。分割する際には、例えば、参照画像に無関係に正方格子などの一様格子によって分割する方法がとられる。あるいは、参照画像上のエッジにあわせて変形格子によって分割する方法が用いられることもある。格子点動き推定部33では参照画像の格子点の動きを推定し、各格子点の動ベクトルを求める。この動ベクトルによって予測画像上にあらたな変形格子が定められる。
図13に示す方法は「後方動き推定」と呼ばれるものであり、最初に参照画像上の格子を決め、その後で予測対象画像上の格子が決定される。これに対して「前方動き推定」という手法がとられることもある。これは、最初に予測対象画像上で格子(通常は一様格子)を定め、その格子点の動きを推定し、格子点の動ベクトルによって参照画像上にあらたに変形格子を定める。従来例及び本発明ともにいずれの場合にも用いることができるが、以後は簡単のため「後方動き推定」を例にとって説明を進めていく。
次に、参照画像上の格子点が、原画像上のどの位置に動いたかを推定する場合(「後方動き推定」の場合)について説明する。
動き推定の方法としては、参照画像上の格子点とその近傍の画素からなる領域をとり、この領域が原画像上のどの領域と一致するかを調べる方法(「ブロックマッチング」と呼ぶ)が用いられる。具体的には参照画像上の格子点を中心としてM画素×N画素の領域を考え、原画像上で同じ大きさの領域との一致度を調べ、最も一致度の良い領域の中心を、格子点の移動先とする。このときの移動をあらわすベクトルを動ベクトルと呼ぶ。領域の一致度としては、領域内の画素値の誤差の絶対値和や誤差の絶対値加重和が用いられる。なお、格子点動き推定部33で求められた格子点の動ベクトルは、図示しない符号化部において符号化され、符号化データに組み込まれて伝送あるいは蓄積される。
動き補償予測部34では、参照画像上の格子点とその動ベクトル及び参照画像を用いて予測画像を求める。予測画像を求める方法としては、三角形ブロックを用いたアフィン変換や、四角形ブロック内での動ベクトルの補間などによるものがある。これらについては非特許文献1に詳しく述べられている。
符号化装置では、動き補償予測部34で求められた予測画像と原画像との差分データが、図示しない符号化部において符号化され、符号化データに組み込まれて伝送あるいは蓄積される。又、符号化データは図示しない復号部において復号され、予測画像と足し合わされて復号画像が得られる。復号画像はフレームメモリに蓄えられ、以後の符号化の際の参照画像として用いられる。
次に、従来の画像復号装置について説明する。
図14は、従来の画像復号装置における予測画像作成回路の構成図で、図中、41は格子点動ベクトル復号部、42は動き補償予測部、43は四角形ブロックへの分割部である。
格子点動ベクトル復号部41は、符号化データ中に組み込まれている格子点の動ベクトルの符号を復号する部分である。出力は格子点の動ベクトルであり、動き補償予測部42に供給される。四角形ブロックへの分割部43及び動き補償予測部42は、図13の符号化装置と同様の働きをするので説明を省略する。
復号装置では、符号化装置と同じ参照画像が得られており、また、格子点動ベクトル復号部41において得られる動ベクトルも、符号化装置で得られるものと同一である。従って、動き補償予測部42で得られる予測画像も、符号化装置で得られるものと同一となる。動き補償予測部33で求められた予測画像と、図示しない復号部で得られた差分データの復号値が足し合わされて、復号画像が得られる。復号画像は、ディスプレイなどに表示されると共に図示しないフレームメモリに蓄えられ、以後の復号の際の参照画像として用いられる。
「Very Low Bitrate Video Coder using Warping Prediction」(1993年画像符号化シンポジウム8-7,pp.167-168) 「A Novel Video Coding Scheme Based on Temporal Prediction Using Digital Image Warping」(IEEE International Conference on Consumer Electronics,1993)
図15(a),(b)及び図16(a)〜(c)は、従来の問題点を説明するための図である。
図15(a)は参照画像のある一部を表し、図15(b)は予測対象画像の一部を表すものとする。図15に示すように、斜めの縞模様を背景に長方形の物体が反時計周りに回転しながら左に移動している。●は格子点を表す。ここで、参照画像上の格子点a,b,c,d,e,fから形成される2つのブロック(四角形abdcと四角形befd)に注目すると、静止した背景上の四角形abdcが大きく変形し、四角形ABDCとなっている。これら2つのブロックを取り出して図16(a),(b)に示す。
図16(a)は、図15(a)の注目する2ブロックを示し、図16(b)は、図15(b)の注目する2ブロックを示したものである。このような場合に従来法によって予測画像を作成したものが、図16(c)である。左のブロックの斜めの模様が、幾何学変換によって変形し、図16(b)に示した予測対象画像(原画像)と異っていることが分かる。
一般に、動物体に接する背景画像上のブロックは、動物体の動きに伴って形が変化する。従来法によれば、背景画像は静止、あるいは並行移動しているにもかかわらず、その予測画像は変形や回転などの幾何学変換によって作成される。このため、予測効率が低下するという問題点があった。なお、ここでいう並行移動とは各画素の動きが平行であることを示す。
図17(a)〜(c)は、従来の他の問題点を説明するための図である。
図17(a)は参照画像のある一部を表し、図17(b)は予測対象画像の一部を表すものとする。図17に示すように、物体1が左下方向に、物体2が右上方向に動いている。ここで、参照画像上の格子点a,b,c,d,e,fから形成される2つのブロックに注目する。これらの格子点のうち、c,eは物体の動きによって予測対象画像上のC,Eに移動しているが、a,b,d,fは移動しない。
このような場合、従来法によれば、図17(c)のようになる。物体は並行移動しているにも関わらず、幾何学変換を受けて歪んでしまう。一般に、隣接したブロック上の複数の物体が別々の方向に並行移動するとき、前述のような幾何学的な歪みが発生することになる。
本発明は、このような実情に鑑みてなされたもので、予測画像作成回路において、幾何学変換によって予測画像を求めるモードと並行移動によって予測画像を求めるモードをブロック毎に適応的に切り換え、予測効率を向上させるようにした画像符号化装置を提供することを目的としている。
本発明は、上記課題を解決するために、画像を分割して得られる各ブロックに対して予測画像を求める動き補償予測手段を備えた画像符号化装置であって、前記動き補償予測手段は、幾何学変換を用いて予測画像を作成するモードと、並行移動を用いて予測画像を作成するモードを有し、前記並行移動を表す動ベクトルの候補として、前記幾何学変換を表す複数の動ベクトルの平均ベクトルを用いることを特徴としたものである。
画像を分割して得られる各ブロックに対して予測画像を求める動き補償予測手段を備えた画像符号化装置であって、前記動き補償予測手段は、幾何学変換を用いて予測画像を作成するモードと、並行移動を用いて予測画像を作成するモードを有し、前記並行移動を表す動ベクトルの候補として、前記幾何学変換を表す複数の動ベクトルの平均ベクトルを用いているので、予測効率を向上することができる。
実施例について、図面を参照して以下に説明する。
まず、本発明の考え方を図11によって説明する。図11は、予測画像上の注目するブロック(四角形ABDC)の予測画像(1ブロック分)を、本発明の手法によって求める様子を示したものである。従来法と同様に、参照画像上の四角形abdcは、格子の変形による幾何学変換を用いて変形され、P1のような予測画像が得られる。一方、参照画像上の四角形a′b′d′c′の並行移動によって別の予測画像P2が得られる。本発明では、これら複数の予測画像をブロック毎に適応的に選択し、いずれかを実際の予測画像として用いる。ここで、並行移動とはブロック内画素が全て平行に移動することであり、ブロックの形状は変化せず、位置のみが移動することを意味する。
図16(d)は、本発明によって作成した予測画像の例である。左側のブロックの予測方法として、図16(a)の四角形abdcを幾何学変換するものと図16(a)の点線で囲まれた部分を並行移動するものとがある。この場合は後者を適応的に選択し、図16(d)の予測画像を得ている。図から分かるように従来法の問題であった幾何学的な歪みは発生しない。
また、図17(d)は、本発明によって作成した予測画像の他の例である。左側のブロックの予測画像として図17(a)の点線で囲まれた部分を並行移動し、右側のブロックの予測画像として図17(a)の一点鎖線で囲まれた部分を並行移動することによって予測画像を得ている。図から分かるように従来法の問題であった幾何学的な歪み(図17(c)参照)は発生しない。
図1は、本発明が適用される画像符号化装置の一例を説明するための構成図で、図中、1は四角形ブロックへの分割部、2は格子点動き推定部、3は並行移動動き推定部、4は第1の動き補償予測部、5は第2の動き補償予測部、6は予測画像選択部である。
四角形ブロックへの分割部1及び格子点動き推定部2は、図13で述べたものと同様の働きによって、参照画像を四角形に分割し、格子点の動ベクトルを求める部分である。格子点の動ベクトルは第1の動き補償予測部4に供給される。なお、四角形ブロックへの分割部1は他の符号化装置の実施例でも使用するが、以後の図4〜図6では図示せず、説明を省略する。
並行移動動き推定部3は、参照画像上のブロックの移動方向をブロックマッチング等の手法によって求める部分である。前述したブロックマッチングは、格子点周りの領域が予測対象画像上の同一形状のどの領域とマッチするかを調べるものであった。しかし、ここではブロック自体を領域とみなし、この領域が予測対象画像上の同一形状のどの領域とマッチするかを調べる。これによって、ブロック自体が並行移動する場合の動ベクトル(並行移動ベクトル)が求められる。並行移動の動ベクトルは第2の動き補償予測部5に供給される。
第1の動き補償予測部4は、図13で説明した動き補償予測部33と同様の働きによって、幾何学変換による動き補償予測を行う。出力された予測画像は予測画像選択部6に供給される。第2の動き補償予測部5は並行移動によって動き補償予測を行う。出力された予測画像は予測画像選択部6に供給される。
予測画像選択部6は本発明の手法により、予測画像をブロック毎に適応的に選択し、予測画像と予測モード情報を出力する。予測モード情報は図示しない符号化部において符号化され、符号化データに組み込まれて伝送あるいは蓄積される。予測画像の選択方法としては、原画像との誤差を最小にするものや、原画像との重みつき誤差を最小にするものなどが考えられる。以下、これらについて説明する。
図2は、図1における予測画像選択部の一例を示す構成図で、図中、7は第1の誤差算出部、8は第2の誤差算出部、9は選択部である。
ここでは予測画像を2種類としているが、もちろんこれに限るものではない。第1の誤差算出部7は、原画像と予測画像 のデータを1ブロック分入力し、予測誤差を算出する部分である。予測誤差は、原画像の画素値f(n)と予測画像の画素値f(n)′とを用いて、
Figure 2004364333
によって計算される。ただし、nはブロック内での画素の番号、Nはブロック内の画素数である。ここでは2乗誤差による予測誤差を示したが、絶対値誤差を用いても良い。第2の誤差算出部8は第1の誤差算出部7と同様の働きによって、予測誤差を算出する部分である。選択部9は、各予測誤差を比較し予測誤差が最小となる予測画像及び、予測モード情報を出力する。例えば、第2の誤差算出部8の誤差が最小であれば、予測画像(2)を選択して出力する。また、予測モード情報として予測画像(2)を表す情報を出力する。予測方法が2種類ある場合、例えば、予測モード情報を固定長符号で表すと1ブロック当たり1ビット必要となる。
図3は、図1における予測画像選択部の他の例を示す構成図で、図中、10は第1の直交変換部、11は第2の直交変換部、12は第3の直交変換部で、その他、図2と同じ作用をする部分は同一の符号を付してある。
第1の直交変換部10〜第3の直交変換部12は入力された1ブロック分の画素値を2次元直交変換し、周波数成分に変換する。図3の第1の誤差算出部7、第2の誤差算出部8は、原画像の直交変換係数g(k)と予測画像の直交変換係数g(k)′との重みつき誤差(予測誤差)を以下のようにして算出する部分である。
Figure 2004364333
ただし、kは直交変換係数の番号、Nはブロック内の画素数、w(k)はあらかじめ定められた重みである。ここでは2乗誤差による予測誤差を示したが、絶対値誤差を用いても良い。例えば、重みw(k)を低周波では大きく高周波では小さく設定することによって、人間の視覚特性に合致した予測誤差が計算される。図3の選択部9は、図2の選択部9と同様の働きによって予測画像を選択し、予測画像と予測モード情報とを出力する。
以上のようにして、図1に示した符号化装置によって、複数の動き補償予測方式を切替えることができる。すなわち、幾何学変換を用いた動き予測方式と、並行移動による動き予測方式とをブロック毎に適応的に切替えることができる。この結果、予測効率を改善して符号化効率を向上させることができる。
図4は、本発明が適用される画像符号化装置の他の例を説明するための構成図で、図中、13は第3の動き補償予測部、14は第4の動き補償予測部、15は第5の動き補償予測部で、その他、図1と同じ作用をする部分は同一の符号を付してある。
格子点動き推定部2は、図13で述べたものと同様の働きによって、格子点の動ベクトルを求める部分である。格子点の動ベクトルは第1の動き補償予測部4〜第5の動き補償予測部15に供給される。第1の動き補償予測部4は、図13で説明した動き補償予測部33と同様の働きによって、幾何学変換による動き補償予測を行う。出力された予測画像は予測画像選択部6に供給される。
第2の動き補償予測部5〜第5の動き補償予測部15は、並行移動による動き補償予測を行う。予測に用いる動ベクトルは注目するブロックの4つの格子点の動ベクトルである。各格子点の動ベクトルをそれぞれV1,V2,V3,V4とすると、第2の動き補償予測部5では動ベクトルV1を、第3の動き補償予測部13では動ベクトルV2を、第4の動き補償予測部14では動ベクトルV3を、第5の動き補償予測部15では動ベクトルV4をそれぞれ用い、並行移動による動き補償予測を行う。作成された予測画像はそれぞれ予測画像選択部6に供給される。予測画像選択部6は本発明の手法により、予測画像を適応的に選択し、予測画像と予測モード情報を出力する。具体的には既に述べた手法(図2,図3)を用いる。ただし、ここでは予測画像は5種類となる。
以上のようにして、図4に示した符号化装置によって、複数の動き補償予測方式を切替えることができる。すなわち、幾何学変換を用いた動き予測方式と、並行移動による4つの動き予測方式とをブロック毎に適応的に切替えることができる。この結果、予測効率を改善し符号化効率を向上させることができる。また、ブロックの並行移動を示す動ベクトルを符号化しなくても良いので符号化データ量を小さくすることができる。
図5は、本発明による画像符号化装置の一実施例を説明するための構成図で、図中、16は並列移動ベクトル決定部で、その他、図4と同じ作用をする部分は同一の符号を付してある。図4との違いは、並行移動による動き補償予測を行う部分(並行移動ベクトル決定部16及び第2の動き補償予測部5)である。
並行移動ベクトル決定部16では、1つのブロックに属する4個の格子点の動ベクトルと参照画像(いずれも復号装置でも得られる情報である)をもとに、ブロック自体の並行移動を表す動ベクトルを決定する。ここで求められた並行移動ベクトルは第2の動き補償予測部5に供給される。例えば、4個の格子点動ベクトルの平均値を求める並行移動ベクトルとする。この場合は参照画像の情報を用いないので、並行移動ベクトル決定部16への参照画像の入力はない。
図5の実施例も図4の実施例と同様に、幾何学変換を用いた動き予測方式(動き補償予測部(1))と、並行移動による動き予測方式(動き補償予測部(2))とをブロック毎に適応的に切り替えることができる。この結果、予測効率を改善し符号化効率を向上させることができる。また、ブロックの並行移動を示す動ベクトルを符号化しなくても良いので符号化データ量を小さくすることができる。
さらに、幾何学変換に用いる4個の動ベクトルの平均値をブロック自体の並行移動を表す動ベクトルとすることで、並行移動を表す動ベクトルをより正確に予測することができ、符号量を削減することが可能となる。
また、新たにブロックマッチング処理を行うことなく並行移動を表す動ベクトルを求めるため、符号化装置の処理量を削減することも可能となる。
あるいは他の並行移動ベクトル決定方法として次のようなものが考えられる。すなわち、1フレーム前の参照画像と、2フレーム前の参照画像から注目するブロックの並行移動ベクトルを図1に示す実施例の説明で述べたようなブロックマッチングによって探索する。ここで求められた動ベクトルを求める並行移動ベクトルとする。又は、4個の格子点動ベクトル及びその平均ベクトルを、探索された動ベクトルと比較し、最も近いものを求める並行移動ベクトルとしてもよい。
この場合、実際にブロックマッチングによって探索されたベクトルに近いベクトルを並行移動ベクトルとして用いることができるため、予測効率を改善し符号化効率を向上させることができる。また、最も近いベクトルを示すための情報を付加情報として伝送する必要があるが、並行移動ベクトルそのものを直接伝送する必要はないため、符号化データ量を小さくすることができる。
図5における第2の動き補償予測部5は、入力された動ベクトルに基づき、並行移動によって動き補償予測を行う。予測画像選択部6は、2種類の予測画像の内、予測誤差の小さいものを選択し、選択された予測画像と予測モード情報を出力する。選択方法は、図2,図3に示したものと同様である。本実施例の符号化装置によれば、予測モード情報は1ブロック当たり1ビットですむので、予測モード情報にかかるデータ量が削減できる。
図6は、本発明による画像符号化装置の実施例を説明するための構成図で、図中、17は制御部、18は予測モード選択部で、その他、図5と同じ作用をする部分は同一の符号を付してある。図5との違いは、予測画像選択部6をなくし、その代わりに予測モード選択部18と制御部17とスイッチ(1)及びスイッチ(2)を設けた点にある。
予測モード選択部18では、動ベクトルや参照画像など復号装置でも得られる情報をもとに予測モードを決定する。モード0が幾何学変換による動き補償予測をあらわし、モード1が並行移動による動き補償予測をあらわすものとする。決定された予測モードは制御部17に供給される。
例えば、動ベクトルから、注目するブロックの大きさの変化を知ることができる。ブロックが大きく変化する場合は、隣接したブロックの動きが原因であることが多く、注目するブロック自体は静止あるいは並行移動していることが多いので、並行移動による動き補償予測のモードを選択する。すなわち、ブロック中に含まれる画素数の変化を調べ、この変化がしきい値より大きな場合は並行移動による動き補償予測のモードを、それ以外の場合は幾何学変換による動き補償予測のモードを選択する。
あるいは、他の予測モード選択方法として次のようなものが考えられる。
すなわち、1フレーム前の参照画像と、2フレーム前の参照画像から注目するブロックの動ベクトルをブロックマッチングによって探索する。この時のブロックマッチングの最小誤差が、しきい値より小さければ並行移動による動き補償予測のモードを、それ以外の場合は幾何学変換による動き補償予測のモードを選択する。なお、ここで述べたしきい値は理論的あるいは経験的に定められるものである。これらはあらかじめ定めておいても良いし、手動あるいは自動で適宜変化させてもよい。
制御部17では、前述のように決定された予測モードをもとにスイッチ(1)及びスイッチ(2)を制御する。すなわち、予測モードが0の場合は、スイッチ(1)及びスイッチ(2)を第1の動き補償予測部4の側にして幾何学変換による動き補償予測を行う。予測モードが1の場合は、スイッチ(1)及びスイッチ(2)を第2の動き補償予測部5の側にして並行移動による動き補償予測を行う。このように、本実施例の符号化装置によれば、復号装置でも得られる情報をもとに予測モードを決定するので、予測モード情報を符号化する必要がなく、データ量が削減できる。
図7は、画像復号装置の一例を説明するための構成図で、図中、21は制御部、22は格子点動ベクトル復号部、23は並行移動ベクトル復号部、24は四角形ブロックへの分割部、25は第1の動き補償予測部、26は第2の動き補償予測部である。本実施例は、請求項1の符号化装置で作成された符号化データを復号する復号装置である。
格子点動ベクトル復号部22は、図14で述べたものと同様の働きによって、符号化データから格子点動ベクトルを復号する部分である。並行移動ベクトル復号部23は、符号化データから並行移動ベクトルを復号する部分である。四角形ブロックへの分割部24は、図14で述べたものと同様の働きによって、参照画像を四角形に分割する部分である。なお、四角形ブロックへの分割部24は、他の復号装置の実施例でも使用するが、以後の図8〜図10では図示せず、説明を省略する。
制御部21は、符号化データ中の予測モード情報をもとに、スイッチを制御する。すなわち、予測モード情報が幾何学変換による動き補償予測を表す場合はスイッチを第1の動き補償予測部25の側にし、予測モード情報が並行移動による動き補償予測を表す場合はスイッチを第2の動き補償予測部26の側に切替える。第1の動き補償予測部25と第2の動き補償予測部26の動きは、図1に示した符号化装置のものと全く同様である。
以上のようにして、図7に示す復号装置において、符号化装置と同一の予測モードが選択され、同一の予測画像が得られる。この予測画像と図示しない復号部で得られた差分データの復号値が足し合わされて、復号画像が得られる。復号画像はディスプレイなどに表示されると共に図示しないフレームメモリに蓄えられ、以後の復号の際の参照画像として用いられる。
図8は、画像復号装置の他の例を説明するための構成図で、図中、27は第3の動き補償予測部、28は第4の動き補償予測部、29は第5の動き補償予測部で、その他、図7と同じ作用をする部分は同一の符号を付してある。本実施例は、図4に示した符号化装置で作成された符号化データを復号する復号装置である。
格子点動ベクトル復号部22は、図14で述べたものと同様の働きによって、符号化データから格子点動ベクトルを復号する部分である。制御部21は本発明の手法により、符号化データ中の予測モード情報をもとに、スイッチ(1)及びスイッチ(2)を制御する。すなわち、予測モード情報が幾何学変換による動き補償予測を表す場合は、スイッチ(1)及びスイッチ(2)を第1の動き補償予測部25の側にし、予測モード情報が動ベクトルV1を用いた並行移動による動き補償予測を表す場合は、スイッチ(1)及びスイッチ(2)を第2の動き補償予測部26の側にするという具合にスイッチを切替える。第3の動き補償予測部27〜第5の動き補償予測部29への切替えも同様にして行われる。
第1の動き補償予測部25〜第5の動き補償予測部29の働きは、図4に示した符号化装置のものと全く同様である。以上のようにして、図8に示す復号装置において、符号化装置と同一の予測モードが選択され、同一の予測画像が得られる。以後の動作は図7の例と同様である。
図9は、画像復号装置の更に他の例を説明するための構成図で、図中、30は並行移動ベクトル決定部で、その他、図8と同じ作用をする部分は同一の符号を付してある。この例は、図5に示した符号化装置で作成された符号化データを復号する復号装置である。
格子点動ベクトル復号部22は、図14で述べたものと同様の働きによって、符号化データから格子点動ベクトルを復号する部分である。制御部21は本発明の手法により、符号化データ中の予測モード情報をもとに、スイッチ(1)及びスイッチ(2)を制御する。すなわち、予測モード情報が幾何学変換による動き補償予測を表す場合は、スイッチ(1)及びスイッチ(2)を第1の動き補償予測部25の側にし、予測モード情報が並行移動による動き補償予測を表す場合は、スイッチ(1)及びスイッチ(2)を第2の動き補償予測部26の側にする。
並行移動ベクトル決定部30は、図5のものと同一の働きによって、第2の動き補償予測部26で使用する並行移動ベクトルを決定する。また、第1の動き補償予測部25と第2の動き補償予測部26の働きは、図5に示した符号化装置のものと全く同様である。
以上のようにして、図9に示す復号装置において、符号化装置と同一の予測モードが選択され、同一の予測画像が得られる。以後の動作は図7の例と同様である。
図10は、画像復号装置の更に他の例を説明するための構成図で、図中、31は予測モード選択部で、その他、図9と同じ作用をする部分は同一の符号を付してある。この例は、図6に示した符号化装置で作成された符号化データを復号する復号装置である。
格子点動ベクトル復号部22は、図14で述べたものと同様の働きによって、符号化データから格子点動ベクトルを復号する部分である。予測モード選択部31は、図6のものと同様の働きにより、動ベクトルや参照画像などの情報をもとに予測モードを決定する。決定された予測モードは、制御部21に供給される。
制御部21は、図6のものと同様の働きにより、符号化データ中の予測モード情報をもとに、スイッチ(1)及びスイッチ(2)を制御する。並行移動ベクトル決定部30は、図6のものと同一の働きによって、第2の動き補償予測部26で使用する並行移動ベクトルを決定する。また、第1の動き補償予測部25と第2の動き補償予測部26の働きは、図6に示した符号化装置のものと全く同様である。
以上のようにして、図10に示す復号装置において、符号化装置と同一の予測モードが選択され、同一の予測画像が得られる。以後の動作は図7の例と同様である。
ここで説明した符号化装置及び復号装置の例は、おもに時間的に一方向のみに動ベクトルを求め、これによって動き補償予測を行うものであるが、もちろん、時間的に双方向に(すなわち、前後の参照画像から)動ベクトルを求め動き補償予測を行うようにしてもよい。幾何学変換による予測では、双方向動き補償予測を用いても、図16(c)に示したような問題は解決されない。本発明を用いて並行移動による動き補償と幾何学変換による動き補償を適応的に切替えれば、異る動きを持った複数の物体が重なり合う場合や、回転、変形などの働きを含む場合などでも良好な予測画像を得ることができる。
画像符号化装置の一例を説明するための構成図である。 図1における予測画像選択部の一例を示す構成図である。 図1における予測画像選択部の他の例を示す構成図である。 画像符号化装置の他の例を説明するための構成図である。 本発明による画像符号化装置の一実施例を説明するための構成図である。 本発明による画像符号化装置の他の実施例を説明するための構成図である。 画像復号装置の一例を説明するための構成図である。 画像復号装置の他の例を説明するための構成図である。 画像復号装置の更に他の例を説明するための構成図である。 画像復号装置の更に他の例を説明するための構成図である。 動き補償予測を説明するための図である。 従来の幾何学変換による動き補償予測を説明するための図である。 従来の画像符号化装置における予測画像作成回路の構成図である。 従来の画像復号装置における予測画像作成回路の構成図である。 参照画像と予測対象画像の例を示す図である。 従来の本発明による予測画像の比較例を示す図である。 従来と本発明による予測画像の他の比較例を示す図である。
符号の説明
1…四角形ブロックへの分割部、2…格子点動き推定部、3…並行移動動き推定部、4…第1の動き補償予測部、5…第2の動き補償予測部、6…予測画像選択部、7…第1の誤差算出部、8…第2の誤差算出部、9…選択部、10…第1の直交変換部、11…第2の直交変換部、12…第3の直交変換部、13…第3の動き補償予測部、14…第4の動き補償予測部、15…第5の動き補償予測部、16…並列移動ベクトル決定部、17…制御部、18…予測モード選択部、21…制御部、22…格子点動ベクトル復号部、23…並行移動ベクトル復号部、24…四角形ブロックへの分割部、25…第1の動き補償予測部、26…第2の動き補償予測部、27…第3の動き補償予測部、28…第4の動き補償予測部、29…第5の動き補償予測部、30…並行移動ベクトル決定部、31…予測モード選択部。

Claims (1)

  1. 画像を分割して得られる各ブロックに対して予測画像を求める動き補償予測手段を備えた画像符号化装置であって、
    前記動き補償予測手段は、幾何学変換を用いて予測画像を作成するモードと、並行移動を用いて予測画像を作成するモードを有し、
    前記並行移動を表す動ベクトルの候補として、前記幾何学変換を表す複数の動ベクトルの平均ベクトルを用いることを特徴とする画像符号化装置。
JP2004231020A 2004-08-06 2004-08-06 画像符号化装置 Expired - Lifetime JP3734488B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004231020A JP3734488B2 (ja) 2004-08-06 2004-08-06 画像符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004231020A JP3734488B2 (ja) 2004-08-06 2004-08-06 画像符号化装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP19823094A Division JP3654664B2 (ja) 1994-08-23 1994-08-23 画像符号化装置及び画像復号装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005181790A Division JP4245587B2 (ja) 2005-06-22 2005-06-22 動き補償予測方法

Publications (2)

Publication Number Publication Date
JP2004364333A true JP2004364333A (ja) 2004-12-24
JP3734488B2 JP3734488B2 (ja) 2006-01-11

Family

ID=34056453

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004231020A Expired - Lifetime JP3734488B2 (ja) 2004-08-06 2004-08-06 画像符号化装置

Country Status (1)

Country Link
JP (1) JP3734488B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100832872B1 (ko) 2006-12-28 2008-05-28 충북대학교 산학협력단 기하학적 변환을 이용한 영상 부호화 효율 향상 방법 및장치
CN100466745C (zh) * 2005-10-11 2009-03-04 华为技术有限公司 帧内预测编解码方法及其系统
WO2017086748A1 (ko) * 2015-11-20 2017-05-26 한국전자통신연구원 기하 변환 영상을 이용하는 영상의 부호화/복호화 방법 및 장치
WO2017086747A1 (ko) * 2015-11-20 2017-05-26 한국전자통신연구원 기하 변환 픽처를 이용한 영상의 부호화/복호화 방법 및 장치
CN111418209A (zh) * 2017-10-05 2020-07-14 交互数字Vc控股公司 用于视频编码和视频解码的方法和装置

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100466745C (zh) * 2005-10-11 2009-03-04 华为技术有限公司 帧内预测编解码方法及其系统
KR100832872B1 (ko) 2006-12-28 2008-05-28 충북대학교 산학협력단 기하학적 변환을 이용한 영상 부호화 효율 향상 방법 및장치
US10944962B2 (en) 2015-11-20 2021-03-09 Electronics And Telecommunications Research Institute Method and device for encoding/decoding image by using geometrically changed image
WO2017086747A1 (ko) * 2015-11-20 2017-05-26 한국전자통신연구원 기하 변환 픽처를 이용한 영상의 부호화/복호화 방법 및 장치
CN108353165A (zh) * 2015-11-20 2018-07-31 韩国电子通信研究院 使用几何修改图片对图像进行编码/解码的方法和设备
WO2017086748A1 (ko) * 2015-11-20 2017-05-26 한국전자통신연구원 기하 변환 영상을 이용하는 영상의 부호화/복호화 방법 및 장치
CN108353165B (zh) * 2015-11-20 2022-08-09 韩国电子通信研究院 使用几何修改图片对图像进行编码/解码的方法和设备
US11412209B2 (en) 2015-11-20 2022-08-09 Electronics And Telecommunications Research Institute Method and device for encoding/decoding image using geometrically modified picture
US11425370B2 (en) 2015-11-20 2022-08-23 Electronics And Telecommunications Research Institute Method and device for encoding/decoding image using geometrically modified picture
US11516463B2 (en) 2015-11-20 2022-11-29 Electronics And Telecommunications Research Institute Method and device for encoding/decoding image by using geometrically changed image
US11758128B2 (en) 2015-11-20 2023-09-12 Electronics And Telecommunications Research Institute Method and device for encoding/decoding image using geometrically modified picture
CN111418209A (zh) * 2017-10-05 2020-07-14 交互数字Vc控股公司 用于视频编码和视频解码的方法和装置
CN111418209B (zh) * 2017-10-05 2023-10-24 交互数字Vc控股公司 用于视频编码和视频解码的方法和装置

Also Published As

Publication number Publication date
JP3734488B2 (ja) 2006-01-11

Similar Documents

Publication Publication Date Title
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
JP3277111B2 (ja) 動画像符号化装置および動画像復号化装置
JP5144545B2 (ja) 動画像コーデック装置及びその方法
JP5216710B2 (ja) 復号化処理方法
JPWO2011099463A1 (ja) 動きベクトル予測符号化方法,動きベクトル予測復号方法,動画像符号化装置,動画像復号装置およびそれらのプログラム
JP2022530172A (ja) 適応解像度ビデオ符号化のためのインター符号化
JP2000224593A (ja) フレーム補間方法および装置およびこの方法を記録した記録媒体
JP3654664B2 (ja) 画像符号化装置及び画像復号装置
JP4245587B2 (ja) 動き補償予測方法
JP3734488B2 (ja) 画像符号化装置
JP4427553B2 (ja) 動画像復号化装置
KR100490730B1 (ko) 비디오 영상 압축 시스템에서의 적응적 패턴을 이용한움직임 예측 장치 및 방법
JP2009212667A (ja) 動画像符号化装置および復号装置
JP2001224036A (ja) 動画像符号化装置
JP5880758B2 (ja) 動画像復号装置、動画像復号方法、及び動画像復号プログラム、並びに、受信装置、受信方法、及び受信プログラム
JP3513277B2 (ja) 映像符号化装置及び映像復号化装置
JP6159292B2 (ja) 動きベクトル検出装置、動きベクトル検出方法及び動きベクトル検出プログラム
WO2020059616A1 (ja) 画像符号化装置、画像復号装置、及びプログラム
JP5686019B2 (ja) 画像復号装置、画像復号方法および画像復号プログラム
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JPH09200763A (ja) 動画像符号化における動き補償方法
JP2002185970A (ja) 動画像符号化装置及び動画像復号化装置
JPH0879759A (ja) 画像符号化装置及び画像復号装置
WO2011145282A1 (ja) 画像符号化装置、画像符号化方法および画像符号化プログラム、ならびに画像復号装置、画像復号方法および画像復号プログラム
JP2004165785A (ja) 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびそのプログラムを記録した記録媒体

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20050225

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20050318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050517

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051018

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081028

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091028

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101028

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111028

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121028

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131028

Year of fee payment: 8

EXPY Cancellation because of completion of term