JP4885929B2 - 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体 - Google Patents

映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体 Download PDF

Info

Publication number
JP4885929B2
JP4885929B2 JP2008271975A JP2008271975A JP4885929B2 JP 4885929 B2 JP4885929 B2 JP 4885929B2 JP 2008271975 A JP2008271975 A JP 2008271975A JP 2008271975 A JP2008271975 A JP 2008271975A JP 4885929 B2 JP4885929 B2 JP 4885929B2
Authority
JP
Japan
Prior art keywords
vector
prediction
image
video
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008271975A
Other languages
English (en)
Other versions
JP2010103684A (ja
Inventor
隆一 谷田
淳 清水
健 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008271975A priority Critical patent/JP4885929B2/ja
Publication of JP2010103684A publication Critical patent/JP2010103684A/ja
Application granted granted Critical
Publication of JP4885929B2 publication Critical patent/JP4885929B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は,動き補償予測を用いる映像符号化における動きベクトル情報を効率よく符号化するための技術に関するものである。
映像符号化では,一般に時間方向予測による符号量の削減のため,動き補償予測が用いられている。動き補償予測では,符号化対象ブロックとよく似たブロックを,符号化および復号済みの参照画像から探索し,探索した参照画像の領域から予測信号を生成して,符号化対象ブロックの映像信号との差分を取り,その予測残差を符号化する。また,探索した領域の位置を示す情報を動きベクトルとして符号化する。
動きベクトルの符号化においても,符号量を削減するため,近隣のブロックや参照画像から動きベクトルの予測値である予測ベクトルを求め,実際の動きベクトルと予測ベクトルとの差分である予測残差ベクトルを符号化することが行われている。
このような動きベクトル情報の発生符号量を削減する方式として,従来,例えば次のような技術が知られている。
〔従来技術1〕
従来技術1は,H.264の映像符号化方式で規格化されている符号化方法であり,算出された動きベクトルを符号化する際の予測ベクトルを,隣接ブロックの動きベクトルのメディアンによって生成する方法である(非特許文献1参照)。
図7は,従来技術1の映像符号化装置の構成例を示す図である。
図7に示す映像符号化装置は,符号化した画像の復号画像を記憶する復号画像保存メモリ301,動き探索を行う参照画像を記憶する参照画像保存メモリ302,符号化対象ブロックについて動き探索を行い予測信号を生成する動き探索部303,入力した映像信号と予測信号の差分をとり予測残差信号を求める減算器304,予測残差信号を直交変換する直交変換部305,直交変換係数を量子化する量子化部306,量子化後の直交変換係数および動きベクトルの予測残差ベクトルを符号化する情報源符号化部307,量子化後の直交変換係数を逆量子化する逆量子化部308,直交変換係数に逆直交変換を施し,予測残差の復号信号を生成する逆直交変換部309,予測信号と予測残差の復号信号を加算し,復号画像を生成する加算器310,動き探索により求めた動きベクトルを記憶する動きベクトル保存メモリ311,隣接ブロックの動きベクトルのメディアンから予測ベクトルを生成する予測ベクトル生成部312,動きベクトルと予測ベクトルとの差分から予測残差ベクトルを求める減算器313を備える。
図8は,従来技術1による映像符号化処理の全体の流れを示すフローチャートである。なお,この全体の処理の流れは,後述する従来技術2も同様である。
映像符号化装置(エンコーダ)では,以下の処理を映像の各フレームに対して繰り返す。まず,前フレームの復号画像を復号画像保存メモリ301から参照画像保存メモリ302に移す(ステップS30)。次に,符号化対象フレームの各マクロブロックに対して(ステップS31),図9に示す符号化処理(ステップS32)を,全マクロブロック終了まで繰り返す(ステップS33)。
図9は,図8に示すステップS32の符号化処理の流れを示すフローチャートである。まず,動き補償を行い,予測残差信号を算出する(ステップS301)。すなわち,動き探索部303で求めた予測信号と入力された映像信号との差分を減算器304により算出して,予測残差信号を求める。次に,直交変換部305で予測残差信号に直交変換を施し(ステップS302),続いて,量子化部306で直交変換係数を量子化する(ステップS303)。さらに,逆量子化部308で量子化後の直交変換係数に対して逆量子化を施し(ステップS304),逆直交変換部309で逆直交変換を施し,予測残差の復号信号を生成する(ステップS305)。この復号信号と予測信号を加算器310により加算し,復号画像を生成して復号画像保存メモリ301に格納する(ステップS306)。
一方,動きベクトルを動きベクトル保存メモリ311に格納する(ステップS307)。予測ベクトル生成部312では,隣接ブロックの動きベクトルのメディアンから予測ベクトルを生成し(ステップS308),これと動きベクトルとの差分を減算器313により算出し,予測残差ベクトルを求める(ステップS309)。最後に,情報源符号化部307で,量子化後の直交変換係数と予測残差ベクトルを可変長符号化し(ステップS310),符号化ストリームを生成する。
図10は,従来技術1の映像復号装置の構成例を示す図である。
図10に示す映像復号装置は,符号化ストリームを復号し,量子化後の直交変換係数と予測残差ベクトルを求める情報源符号化復号部401,量子化後の直交変換係数を逆量子化する逆量子化部402,直交変換係数に逆直交変換を施し,予測残差の復号信号を生成する逆直交変換部403,予測信号と予測残差の復号信号を加算し,復号画像を生成する加算器404,復号画像を記憶する復号画像保存メモリ405,動き補償に用いる参照画像を記憶する参照画像保存メモリ406,予測残差ベクトルに予測ベクトルを加算し,動きベクトルを算出する加算器408,動きベクトルを記憶する動きベクトル保存メモリ409,隣接ブロックの動きベクトルのメディアンから予測ベクトルを生成する予測ベクトル生成部410を備える。
図11は,従来技術1による映像復号処理の全体の流れを示すフローチャートである。なお,この全体の処理の流れは,後述する従来技術2も同様である。映像復号装置(デコーダ)では,以下の処理を映像の各フレームに対して繰り返す。
まず,前フレームの復号画像を復号画像保存メモリ405から参照画像保存メモリ406に移す(ステップS40)。次に,復号対象フレームの各マクロブロックに対して(ステップS41),図12に示す復号処理(ステップS42)を,全マクロブロック終了まで繰り返す(ステップS43)。
図12は,図11に示すステップS42の復号処理の流れを示すフローチャートである。まず,情報源符号化復号部401では,符号化ストリームの可変長符号を復号し,量子化後の直交変換係数と予測残差ベクトルを求める(ステップS401)。続いて,逆量子化部402で量子化後の直交変換係数に逆量子化を施し(ステップS402),逆直交変換部403で逆直交変換を施して,予測残差の復号信号を生成する(ステップS403)。
動きベクトルに関しては,予測ベクトル生成部410で隣接ブロックの動きベクトルのメディアンから予測ベクトルを生成し(ステップS404),それと復号した予測残差ベクトルとの加算を加算器408で行い,動きベクトルを求める(ステップS405)。求めた動きベクトルを動きベクトル保存メモリ409に格納する(ステップS406)。また,動き補償部407では,この動きベクトルをもとに参照画像保存メモリ406から予測画像を取り出し,加算器404で予測残差信号と加算することで復号画像を生成する(ステップS407)。生成された復号信号(復号画像)を出力するとともに,復号画像保存メモリ405に格納する(ステップS408)。
〔従来技術2〕
従来技術2の方法は,符号化(復号)対象ブロックに隣接するブロックの復号画像と,参照画像とのマッチングにより,符号化(復号)対象ブロックの動きベクトルを求めることで,動きベクトル情報の発生符号量を削減する方法である(非特許文献2参照)。
図13は,従来技術2の映像符号化装置の構成例を示す図である。
図13に示す映像符号化装置は,符号化した画像の復号画像を記憶する復号画像保存メモリ501,動き探索を行う参照画像を記憶する参照画像保存メモリ502,符号化対象ブロックについて動き探索を行い予測信号を生成する動き探索部503,入力した映像信号と予測信号の差分をとり予測残差信号を求める減算器504,予測残差信号を直交変換する直交変換部505,直交変換係数を量子化する量子化部506,量子化後の直交変換係数および動きベクトル情報を符号化する情報源符号化部507,量子化後の直交変換係数を逆量子化する逆量子化部508,直交変換係数に逆直交変換を施し,予測残差の復号信号を生成する逆直交変換部509,予測信号と予測残差の復号信号を加算し,復号画像を生成する加算器510,隣接ブロックの復号信号と参照画像のマッチングを取る動き探索部511,動き探索部503で求めた動きベクトルと動き探索部511で求めた予測ベクトルの差分から予測残差ベクトルを求める減算器512,動き探索部503により求めた動きベクトルを記憶する動きベクトル保存メモリ513,隣接ブロックの動きベクトルのメディアンから予測ベクトルを生成する予測ベクトル生成部514,動きベクトルと予測ベクトルとの差分から予測残差ベクトルを求める減算器515,減算器512と減算器515の出力する予測残差ベクトルの一方を選択する予測ベクトル判定部516を備える。
従来技術2による映像符号化処理の全体の流れは,図8に示す従来技術1の処理と同様である。従来技術2では,図8に示すステップS32の符号化処理において,図14に示す処理を実行する。図14は,従来技術2における図8に示すステップS32の符号化処理の流れを示している。
図14におけるステップS501からステップS509までの処理は,図9に示した従来技術1と同様であるので,その説明を省略する。なお,ここで求まった予測残差ベクトルを第1の予測残差ベクトルと呼ぶ。ステップS510以降では,次の処理を行う。
まず,動き探索部511では,隣接ブロックの復号画像と参照画像の間で動き探索を行い,第2の予測ベクトルを求める(ステップS510)。次に,減算器512で動きベクトルと第2の予測ベクトルとの差分を取り,第2の予測残差ベクトルを求める(ステップS511)。予測ベクトル判定部516では,第1の予測残差ベクトルと第2の予測残差ベクトルのうち一方を選択し,選択した方の予測残差ベクトルと,どちらを選択したかを示す選択情報とを,情報源符号化部507に送る(ステップS512)。最後に,情報源符号化部507では,量子化後の直交変換係数と選択した予測残差ベクトルの動きベクトル情報を可変長符号化し(ステップS513),符号化ストリームを生成する。
図15は,従来技術2の映像復号装置の構成例を示す図である。
図15に示す映像復号装置は,符号化ストリームを復号し,量子化後の直交変換係数と動きベクトル情報を求める情報源符号化復号部601,量子化後の直交変換係数を逆量子化する逆量子化部602,直交変換係数に逆直交変換を施し,予測残差の復号信号を生成する逆直交変換部603,予測信号と予測残差の復号信号を加算し,復号画像を生成する加算器604,復号画像を記憶する復号画像保存メモリ605,動き補償に用いる参照画像を記憶する参照画像保存メモリ606,隣接ブロック復号信号と参照画像とのマッチングによって第2の予測ベクトルを求める動き探索部607,動きベクトル情報(予測残差ベクトルと選択情報)から第1または第2の予測ベクトルを用いて動きベクトルを復号する動きベクトル復号部608,動きベクトルを記憶する動きベクトル保存メモリ609,隣接ブロックの動きベクトルのメディアンから第1の予測ベクトルを生成する予測ベクトル生成部610,動きベクトルを用いて動き補償を行う動き補償部611を備える。
従来技術2による映像復号処理の全体の流れは,図11に示す従来技術1の映像復号処理と同様である。従来技術2では,図11に示すステップS42の復号処理において,図16に示す処理を実行する。図16は,従来技術2における図11に示すステップS42の復号処理の流れを示している。
図16におけるステップS601からS603までの処理およびステップS608からS611までの処理は,図12に示した従来技術1と同様であるので,その説明を省略する。
従来技術2の復号処理では,情報源符号化復号部601で,予測残差の復号信号を生成した後,動きベクトル復号部608で,動きベクトル情報を復号し,予測残差ベクトルと選択情報を取り出す(ステップS604)。さらに,動きベクトル復号部608では,選択情報が第2の予測残差ベクトルを示すか第1の予測残差ベクトルを示すかを判定する(ステップS605)。その結果,第2の予測残差ベクトルを示す場合には,動き探索部607で,隣接ブロックの復号画像と参照画像の間で動き探索を行い,予測ベクトルを求める(ステップS606)。一方,選択情報が第1の予測残差ベクトルを示す場合には,予測ベクトル生成部610で隣接ブロックの動きベクトルのメディアンを取り,予測ベクトルを生成する(ステップS607)。以降は,ステップS608へ進み,ステップS611まで従来技術1と同じ復号処理を続ける。
"Draft ITU-T Recommendation and Final draft international standard of joint video specification", ITU-T Rec. H.264 and ISO/IEC 14496-10 AVC, 2003. 鈴木芳典,ブンチュンセン,"Block-Based Inter Frame Coding with Automatic Decision of Prediction Parameters utilizing Reconstructed Data(復号信号を用いた予測パラメータ決定処理を伴うフレーム間予測符号化)",PCSJ2007, P-2.08 (2007).
従来技術では,動きベクトルを符号化するための予測ベクトルを上側か左側に隣接する領域の動き補償結果をもとに作成するため,それらと動きが似ている領域にしか適用できないという問題がある。
本発明は,動きが交差しているような領域にも適用可能な新しい予測ベクトルの生成方法を追加することにより,動きベクトル情報の符号量を従来技術よりも大幅に削減できるようにすることを目的としている。
動き補償予測を用いる映像符号化では,動き探索により求めた予測信号と入力された映像信号との差分を取り,予測残差信号を生成する。この予測残差信号の復号画像には,動いている被写体の輪郭部分が現れる傾向が非常に大きい。本発明は,この点に着目して上記課題の解決を図っている。
すなわち,本発明は,動きベクトル情報の符号化にあって予測残差ベクトルを算出するための予測ベクトルを,参照画像から求めたエッジ画像と,符号化対象ブロックの予測残差信号の復号画像から求めたエッジ画像とのマッチングによって算出する。このマッチングとは,復号画像から求めたエッジ画像が,参照画像から求めたエッジ画像の中で最も合致する座標を探索する操作となる。探索方法としては,通常の動き探索と同様に,差分電力が最小となる点を探索する方法や,2次元の相関値を計算し,最も相関性が大きくなる点を求める方法などが例として挙げられる。
このようにして算出した予測ベクトルと,従来技術と同様に隣接ブロックの動きベクトルのメディアンから求めた予測ベクトルの一方を選択し,実際の動きベクトルとの差分を予測残差ベクトルとして符号化する。また,予測ベクトルの選択情報を符号化することを特徴とする。
本発明は,エンコーダ側において以下の処理を行う。
(1)参照画像についてエッジ検出処理を行い,エッジ画像を生成する。
(2)動き補償を行い,予測残差の復号画像を求める。
(3)隣接ブロックの動きベクトルのメディアンから第1の予測ベクトルを算出する。
(4)予測残差信号の復号画像に対して,エッジ検出処理を施す。
(5)上記(1)で求めたエッジ画像と,上記(4)で求めたエッジ画像のマッチングを取り,第2の予測ベクトルを求める。
(6)第1の予測ベクトルと第2の予測ベクトルの一方を選択する。
(7)選択した予測ベクトルと動きベクトルとの差分の予測残差ベクトルを算出する。
(8)算出した予測残差ベクトルと予測ベクトルの選択情報を符号化する。
なお,上記(3)および(5)の処理で,それぞれ動きベクトルとの差分から第1の予測残差ベクトルと第2の予測残差ベクトルとを算出しておき,上記(6)において,第1の予測残差ベクトルおよび第2の予測残差ベクトルの一方を選択してもよく,第1または第2の予測ベクトルを選択してから予測残差ベクトルを求めることと,技術的思想としては実質的に同じである。
デコーダ側では,以下の処理を行う。
(1)参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成する。
(2)予測残差を復号し,予測残差画像を生成する。
(3)動きベクトル情報を復号し,予測残差ベクトルと選択情報を取り出す。
(4)選択情報が第1の予測ベクトルを示していれば,隣接ブロックの動きベクトルのメディアンから予測ベクトルを求める。
(5)選択情報が第2の予測ベクトルを示していれば,次の処理を行う。
(5−1)予測残差画像にエッジ検出処理を施し,第2のエッジ画像を生成する。
(5−2)第1のエッジ画像と第2のエッジ画像とのマッチングを取り,マッチング位置により予測ベクトルを求める。
(6)予測ベクトルと予測残差ベクトルとを加算して動きベクトルを算出し,その動きベクトルを用いた動き補償により復号画像を生成する。
本発明と従来技術との差異は,以下のとおりである。本発明では,参照画像と予測残差復号画像というデコーダで得られる2種類の画像のマッチングから動きベクトルを求める。これらは,片方は普通の画像,もう片方は残差画像のため,普通にマッチングを取ることはできない。そこで,両者にエッジ検出処理を施し,エッジ画像とすることでうまくマッチングを取る。このマッチングによって予測ベクトルを生成するのに加えて,従来技術1と同様に,隣接ブロックの動きベクトルのメディアンによっても予測ベクトルを生成する。この両方の予測ベクトルのうち符号化効率のよい可能性が大きいほうを選択して,動きベクトルとの差分を算出し,予測残差ベクトルを求め,予測残差ベクトルと予測ベクトルの選択情報とを符号化する。
2つの予測ベクトルのどちらを選択するかの選択方法については,例えば次のような方法がある。
・ベクトル符号量が少ないほうを選択する。
・ベクトル符号量が少ない可能性が高いほうを選択する。例えば,予測残差ベクトルのマンハッタン距離(|X|+|Y|)の小さいほうを選択する。
従来技術2の方法では,隣接ブロックの復号画像と参照画像とのマッチングによって予測ベクトルを求める。この方法では両者とも普通の画像であるため,マッチングが取れる。その反面,あくまで隣接ブロックのマッチングとなることから,動きが微妙に異なる領域にはうまく適用できない。
本発明によれば,動きが交差しているような領域の場合に,隣接ブロックの情報を使わないで,デコーダ側で動きベクトルの復号ができるため,動きベクトルの符号化情報を大幅に削減することができるようになる。特に,本発明では,従来の隣接ブロックの動きベクトルのメディアンから求める予測ベクトルと,エッジ画像のマッチングに着目した予測ベクトルとを切り替えて用いることができるため,予測ベクトルの候補が一つしかない場合よりも符号化効率が向上する可能性が高い。
以下,図面を用いながら本発明の実施例について詳細に説明する。
図1は,本発明の実施例に係る映像符号化装置の構成例を示す図である。図中,点線で囲った部分が,主に従来技術と異なる本発明に特有な部分である。
図1に示す映像符号化装置は,符号化した画像の復号画像を記憶する復号画像保存メモリ101,動き探索を行う参照画像を記憶する参照画像保存メモリ102,符号化対象ブロックについて動き探索を行い予測信号を生成する動き探索部103,入力した映像信号と予測信号の差分をとり予測残差信号を求める減算器104,予測残差信号を直交変換する直交変換部105,直交変換係数を量子化する量子化部106,量子化後の直交変換係数および動きベクトルの予測残差ベクトルを符号化する情報源符号化部107,量子化後の直交変換係数を逆量子化する逆量子化部108,直交変換係数に逆直交変換を施し,予測残差の復号信号を生成する逆直交変換部109,予測信号と予測残差の復号信号を加算し,復号画像を生成する加算器110,参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成するエッジ検出部B111,第1のエッジ画像を記憶するエッジ画像保存メモリ112,予測残差の復号信号についてエッジ検出処理を行い,第2のエッジ画像を生成するエッジ検出部A113,第1のエッジ画像と第2のエッジ画像のマッチングを取り,マッチングが取れた位置をもとに予測ベクトルを求めるマッチング処理部114,動きベクトルと予測ベクトルとの差分を取る減算器115,動き探索結果の動きベクトルを記憶する動きベクトル保存メモリ116,隣接ブロックの動きベクトルのメディアンから予測ベクトルを生成する予測ベクトル生成部117,動きベクトルと予測ベクトルとの差分を取る減算器118,減算器115と減算器118の出力する予測残差ベクトルの一方を選択する予測ベクトル判定部119を備える。
図2は,本発明の実施例による映像符号化処理の全体の流れを示すフローチャートである。映像符号化装置(エンコーダ)では,以下の処理を映像の各フレームに対して繰り返す。まず,前フレームの復号画像を復号画像保存メモリ101から参照画像保存メモリ102に移す(ステップS10)。次に,エッジ検出部B111において,参照画像にエッジ検出処理を施し,第1のエッジ画像を生成してエッジ画像保存メモリ112に格納する(ステップS11)。その後,符号化対象フレームの各マクロブロックに対して(ステップS12),図3に示す符号化処理(ステップS13)を,全マクロブロック終了まで繰り返す(ステップS14)。
図3は,図2に示すステップS13の符号化処理の流れを示すフローチャートである。まず,動き補償を行い,予測残差信号を算出する(ステップS101)。すなわち,動き探索部103で求めた予測信号と入力された映像信号との差分を減算器104により算出して,予測残差信号を求める。次に,直交変換部105で予測残差信号に直交変換を施し(ステップS102),続いて,量子化部106で直交変換係数を量子化する(ステップS103)。さらに,逆量子化部108で量子化後の直交変換係数に対して逆量子化を施し(ステップS104),逆直交変換部109で逆直交変換を施し,予測残差の復号信号を生成する(ステップS105)。この復号信号と予測信号を加算器110により加算し,復号画像を生成して復号画像保存メモリ101に格納する(ステップS106)。
一方,動きベクトルを動きベクトル保存メモリ116に格納する(ステップS107)。予測ベクトル生成部117では,隣接ブロックの動きベクトルのメディアンから第1の予測ベクトルを生成し(ステップS108),これと動きベクトルとの差分を減算器115により算出し,第1の予測残差ベクトルを求める(ステップS109)。
また,エッジ検出部A113において予測残差の復号信号にエッジ検出処理を施し,第2のエッジ画像を生成する(ステップS110)。次に,マッチング処理部114で第1のエッジ画像と第2のエッジ画像の間でマッチング処理を行い,マッチング位置から第2の予測ベクトルを求める(ステップS111)。求めた第2の予測ベクトルと動きベクトルとの差分を減算器115により算出し,第2の予測残差ベクトルを求める(ステップS112)。
次に,予測ベクトル判定部119では,第1の予測残差ベクトルと第2の予測残差ベクトルの一方を選択し,選択したほうの残差ベクトルと,選択情報を情報源符号化部107に送る(ステップS113)。最後に,情報源符号化部107で量子化後の直交変換係数と動きベクトル情報を可変長符号化し(ステップS114),符号化ストリームを生成する。なお,この例では,予測ベクトル判定部119において,予測残差ベクトルを選択しているが,予測ベクトルを選択して,選択した予測ベクトルと動きベクトルとの差分から予測残差ベクトルを生成してもよいことは言うまでもない。
以上の実施例において,エッジ検出処理が,エッジ検出部A113とエッジ検出部B111の2つに分けて行われている。これは,一方のエッジ検出部A113が残差画像,他方のエッジ検出部B111が普通の画像のエッジ検出処理を行うため,それぞれ異なる処理を施すケースが考えられるためである。これらが行うエッジ検出処理としては,例えばSobelフィルタの適用,絶対値算出処理,強調処理,テンプレート画像作成などが挙げられ,また,これらのいくつかを組み合わせて実施することもできる。
例えば,参照画像には,下記のSobel(4方向)フィルタを全画素に適用し,その結果の絶対値を取ったものをエッジ画像とする方法が考えられる。
〔Sobelフィルタの例〕 0 −1 −2
1 0 −1
2 1 0
一方,残差画像は,全画素の絶対値を取ったものをエッジ画像とする方法や,絶対値を取った後に,定数を掛ける方法が考えられる。
また,マッチング処理部114は,エッジ画像同士の差分絶対値和(SAD)や二乗誤差(SSD)の最小点を探索する処理以外に,正規化相関マッチングやテンプレートマッチングで対応点を求める方法も考えられる。
エッジ検出とマッチング処理に際し,フレーム毎またはマクロブロック毎に処理パラメータを変化させたほうがいい場合がある。処理パラメータとしては,例えばエッジ画像の生成では,どのようなエッジ検出を行うか,エッジ画像をそれぞれ定数倍するかしないか,エッジ強度をある閾値を境に2値化するかしないか,などの選択情報が考えられる。また,マッチング処理では,どのようなマッチング処理を行うかなどの選択情報が考えられる。この場合,映像符号化装置で使用したパラメータも,前記予測ベクトルの選択情報に含めて,または前記選択情報とは別に,情報源符号化部107で可変長符号化し,符号化ストリームに加える。後述する映像復号装置では,このパラメータも復号し,エッジ検出およびマッチング処理で利用することで,映像符号化装置と同じ探索結果が得られる。
図4は,本発明の実施例に係る映像復号装置の構成例を示す図である。図中,点線で囲った部分が,主に従来技術と異なる本発明に特有な部分である。
図4に示す映像復号装置は,符号化ストリームを復号し,量子化後の直交変換係数と予測残差ベクトルを求める情報源符号化復号部201,量子化後の直交変換係数を逆量子化する逆量子化部202,直交変換係数に逆直交変換を施し,予測残差の復号信号を生成する逆直交変換部203,予測信号と予測残差の復号信号を加算し,復号画像を生成する加算器204,復号画像を記憶する復号画像保存メモリ205,動き補償に用いる参照画像を記憶する参照画像保存メモリ206,参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成するエッジ検出部B207,第1のエッジ画像を記憶するエッジ画像保存メモリ208,予測残差の復号信号についてエッジ検出処理を行い,第2のエッジ画像を生成するエッジ検出部A209,第1のエッジ画像と第2のエッジ画像のマッチングを取り,マッチングが取れた位置をもとに第2の予測ベクトルを求めるマッチング処理部210,動きベクトルを記憶する動きベクトル保存メモリ211,隣接ブロックの動きベクトルのメディアンから第1の予測ベクトルを生成する予測ベクトル生成部212,動きベクトル情報(予測残差ベクトルと選択情報)から第1または第2の予測ベクトルを用いて動きベクトルを復号する動きベクトル復号部213,動きベクトルから動き補償により参照信号を抽出する動き補償部214を備える。
図5は,本発明の実施例による映像復号処理の全体の流れを示すフローチャートである。デコーダでは,以下の処理を映像の各フレームに対して繰り返す。まず,前フレームの復号画像を復号画像保存メモリ205から参照画像保存メモリ206に移す(ステップS20)。次に,エッジ検出部B207において参照画像にエッジ検出処理を施し,第1のエッジ画像を生成してエッジ画像保存メモリ208に格納する(ステップS21)。その後,復号対象フレームの各マクロブロックに対して(ステップS22),図6に示す復号処理(ステップS23)を,全マクロブロック終了まで繰り返す(ステップS24)。
図6は,図5に示すステップS23の復号処理の流れを示すフローチャートである。まず,情報源符号化復号部201では,符号化ストリームの可変長符号を復号し,量子化後の直交変換係数を求める。また,動きベクトル情報を取り出し,動きベクトル復号部213に渡す(ステップS201)。続いて,逆量子化部202で量子化後の直交変換係数に逆量子化を施し(ステップS202),逆直交変換部203で逆直交変換を施して,予測残差の復号信号を生成する(ステップS203)。
動きベクトルに関しては,以下の処理を行う。まず,動きベクトル復号部213で,動きベクトル情報を復号し,予測残差ベクトルと選択情報を取り出す(ステップS204)。さらに,動きベクトル復号部213では,選択情報が第2の予測残差ベクトルを示すか第1の予測残差ベクトルを示すかを判定する(ステップS205)。
その結果,選択情報が第2の予測残差ベクトルを示す場合には,まず,エッジ検出部A209で予測残差の復号信号にエッジ検出処理を施し,第2のエッジ画像を生成する(ステップS206)。そして,マッチング処理部210にて,エッジ画像保存メモリ208に記憶している第1のエッジ画像と,第2のエッジ画像との間でマッチング処理を行い,マッチング位置から第1の予測ベクトルを求める(ステップS207)。
一方,選択情報が第1の予測残差ベクトルを示す場合には,予測ベクトル生成部212で,動きベクトル保存メモリ211に格納されている隣接ブロックの動きベクトルのメディアンを取り,予測ベクトルを生成する(ステップS208)。
動きベクトル復号部213では,選択情報に従って,第1の予測ベクトルまたは第2の予測ベクトルの一方を選択し,この予測ベクトルと復号した予測残差ベクトルとの加算を行い,動きベクトルを求める(ステップS209)。求めた動きベクトルを動きベクトル保存メモリ211に格納する(ステップS210)。動き補償部214では,この動きベクトルをもとに参照画像保存メモリ206から予測画像の参照信号を取り出し,加算器204で予測残差信号と加算することで復号画像を生成する(ステップS211)。生成された復号信号(復号画像)を出力するとともに,復号画像保存メモリ205に格納する(ステップS212)。
上記処理において,入力符号化データにエッジ画像の生成方法またはエッジ画像のマッチング方法を指定する処理パラメータが含まれる場合,ステップS206またはステップS207を,処理パラメータで指定された方法によって実行する。
本発明による効果を確認するため,予測ベクトルを隣接ブロックの動きベクトルのメディアンによって生成するH.264標準の方式(以下,JMという)の従来方法によるベクトル符号量と,本発明で提案した方法によるベクトル符号量との比較実験を行った。実験に用いた映像は,720×480画素,450フレームの“Character pattern”である。結果を図17に示す。
それぞれの量子化パラメータ(QP)に応じた1フレーム当たりのベクトル符号量(ビット数)は,次のとおりであった。
(1)QP=12のとき(単位は,bits/frame。以下,同様)
1997(JMの符号量),1517(本発明の提案方法による符号量)
(2)QP=18のとき
1765(JMの符号量),1298(本発明の提案方法による符号量)
(3)QP=24のとき
1684(JMの符号量),1259(本発明の提案方法による符号量)
(4)QP=30のとき
1644(JMの符号量),1379(本発明の提案方法による符号量)
これにより,ベクトル符号量に有意な差があり,本発明を用いることによってベクトル符号量を削減することができることが確認できた。
以上の映像の符号化および復号の処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。
本発明の実施例に係る映像符号化装置の構成例を示す図である。 本発明の実施例による映像符号化処理の全体の流れを示すフローチャートである。 符号化処理(図2のS13)の流れを示すフローチャートである。 本発明の実施例に係る映像復号装置の構成例を示す図である。 本発明の実施例による映像復号処理の全体の流れを示すフローチャートである。 復号処理(図5のS23)の流れを示すフローチャートである。 従来技術1の映像符号化装置の構成例を示す図である。 従来技術1および従来技術2による映像符号化処理の全体の流れを示すフローチャートである。 従来技術1の符号化処理(図8のS32)の流れを示すフローチャートである。 従来技術1の映像復号装置の構成例を示す図である。 従来技術1および従来技術2による映像復号処理の全体の流れを示すフローチャートである。 従来技術1の復号処理(図11のS42)の流れを示すフローチャートである。 従来技術2の映像符号化装置の構成例を示す図である。 従来技術2の符号化処理(図8のS32)の流れを示すフローチャートである。 従来技術2の映像復号装置の構成例を示す図である。 従来技術2の復号処理(図11のS42)の流れを示すフローチャートである。 従来方法と本発明による方法のベクトル符号量の比較を示す図である。
符号の説明
101 復号画像保存メモリ
102 参照画像保存メモリ
103 動き探索部
104 減算器
105 直交変換部
106 量子化部
107 情報源符号化部
108 逆量子化部
109 逆直交変換部
110 加算器
111 エッジ検出部B
112 エッジ画像保存メモリ
113 エッジ検出部A
114 マッチング処理部
115 減算器
116 動きベクトル保存メモリ
117 予測ベクトル生成部
118 減算器
119 予測ベクトル判定部
201 情報源符号化復号部
202 逆量子化部
203 逆直交変換部
204 加算器
205 復号画像保存メモリ
206 参照画像保存メモリ
207 エッジ検出部B
208 エッジ画像保存メモリ
209 エッジ検出部A
210 マッチング処理部
211 動きベクトル保存メモリ
212 予測ベクトル生成部
213 動きベクトル復号部
214 動き補償部

Claims (10)

  1. 動き補償予測を用いて映像信号を符号化する映像符号化方法において,
    動き補償で用いる参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成する過程と,
    入力映像信号の符号化対象領域に対して前記参照画像を参照して動き補償を行い,予測残差信号を算出する過程と,
    前記予測残差信号の復号画像を算出する過程と,
    前記符号化対象領域に隣接する領域の動きベクトルのメディアンを取り,第1の予測ベクトルを生成する過程と,
    前記予測残差信号の復号画像に対してエッジ検出処理を施し,第2のエッジ画像を生成する過程と,
    前記第1のエッジ画像と前記第2のエッジ画像のマッチングを取り,第2の予測ベクトルを算出する過程と,
    前記第1の予測ベクトルと前記第2の予測ベクトルの一方を選択する過程と,
    選択された予測ベクトルと前記動き補償で求めた動きベクトルとの差分の予測残差ベクトルと,前記第1の予測ベクトルと前記第2の予測ベクトルのどちらを選択したかを示す選択情報とを符号化する過程とを有する
    ことを特徴とする映像符号化方法。
  2. 請求項1に記載の映像符号化方法において,
    前記第1のエッジ画像もしくは前記第2のエッジ画像を生成する過程,または前記第1のエッジ画像と前記第2のエッジ画像のマッチングを取る過程では,エッジ画像の生成方法またはエッジ画像のマッチング方法を指定する処理パラメータを,フレーム毎または符号化対象領域毎に変化させ,
    前記符号化する過程では,前記処理パラメータを,前記選択情報とは別にまたは前記選択情報に含めて符号化する
    ことを特徴とする映像符号化方法。
  3. 動き補償予測を用いて映像信号を復号する映像復号方法において,
    動き補償で用いる参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成する過程と,
    入力符号化データに含まれる予測残差信号を復号する過程と,
    入力符号化データに含まれる動きベクトル情報を復号し,予測残差ベクトルと予測ベクトルの選択情報を取り出す過程と,
    前記選択情報が第1の予測ベクトルを示すときに,復号対象領域に隣接する領域の動きベクトルのメディアンを取り,第1の予測ベクトルを生成する過程と,
    前記選択情報が第2の予測ベクトルを示すときに,前記予測残差信号の復号によって得られた予測残差画像にエッジ検出処理を施し,第2のエッジ画像を生成し,前記第1のエッジ画像と前記第2のエッジ画像とのマッチング処理により第2の予測ベクトルを算出する過程と,
    前記選択情報に応じて算出された予測ベクトルに前記予測残差ベクトルを加算し,動きベクトルを算出する過程と,
    前記動きベクトルを用いた動き補償により得られた参照信号に前記予測残差信号を加算して復号画像を生成する過程とを有する
    ことを特徴とする映像復号方法。
  4. 請求項3に記載の映像復号方法において,
    さらに,前記選択情報とは別にまたは前記選択情報として,エッジ画像の生成方法またはエッジ画像のマッチング方法を指定する処理パラメータを復号する過程を有し,
    前記第1のエッジ画像もしくは前記第2のエッジ画像を生成する過程,または前記第1のエッジ画像と前記第2のエッジ画像のマッチングを取り,予測ベクトルを算出する過程では,フレーム毎または復号対象領域毎に前記復号した処理パラメータに従ってエッジ画像の生成またはエッジ画像のマッチング処理を行う
    ことを特徴とする映像復号方法。
  5. 動き補償予測を用いて映像信号を符号化する映像符号化装置において,
    動き補償で用いる参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成する手段と,
    入力映像信号の符号化対象領域に対して前記参照画像を参照して動き補償を行い,予測残差信号を算出する手段と,
    前記予測残差信号の復号画像を算出する手段と,
    前記符号化対象領域に隣接する領域の動きベクトルのメディアンを取り,第1の予測ベクトルを生成する手段と,
    前記予測残差信号の復号画像に対してエッジ検出処理を施し,第2のエッジ画像を生成する手段と,
    前記第1のエッジ画像と前記第2のエッジ画像のマッチングを取り,第2の予測ベクトルを算出する手段と,
    前記第1の予測ベクトルと前記第2の予測ベクトルの一方を選択する手段と,
    選択された予測ベクトルと前記動き補償で求めた動きベクトルとの差分の予測残差ベクトルと,前記第1の予測ベクトルと前記第2の予測ベクトルのどちらを選択したかを示す選択情報とを符号化する手段とを備える
    ことを特徴とする映像符号化装置。
  6. 動き補償予測を用いて映像信号を復号する映像復号装置において,
    動き補償で用いる参照画像についてエッジ検出処理を行い,第1のエッジ画像を生成する手段と,
    入力符号化データに含まれる予測残差信号を復号する手段と,
    入力符号化データに含まれる動きベクトル情報を復号し,予測残差ベクトルと予測ベクトルの選択情報を取り出す手段と,
    前記選択情報が第1の予測ベクトルを示すときに,復号対象領域に隣接する領域の動きベクトルのメディアンを取り,第1の予測ベクトルを生成する手段と,
    前記選択情報が第2の予測ベクトルを示すときに,前記予測残差信号の復号によって得られた予測残差画像にエッジ検出処理を施し,第2のエッジ画像を生成し,前記第1のエッジ画像と前記第2のエッジ画像とのマッチング処理により第2の予測ベクトルを算出する手段と,
    前記選択情報に応じて算出された予測ベクトルに前記予測残差ベクトルを加算し,動きベクトルを算出する手段と,
    前記動きベクトルを用いた動き補償により得られた参照信号に前記予測残差信号を加算して復号画像を生成する手段とを備える
    ことを特徴とする映像復号装置。
  7. 請求項1または請求項2に記載の映像符号化方法を,コンピュータに実行させるための映像符号化プログラム。
  8. 請求項3または請求項4に記載の映像復号方法を,コンピュータに実行させるための映像復号プログラム。
  9. 請求項1または請求項2に記載の映像符号化方法を,コンピュータに実行させるための映像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体。
  10. 請求項3または請求項4に記載の映像復号方法を,コンピュータに実行させるための映像復号プログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008271975A 2008-10-22 2008-10-22 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体 Expired - Fee Related JP4885929B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008271975A JP4885929B2 (ja) 2008-10-22 2008-10-22 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008271975A JP4885929B2 (ja) 2008-10-22 2008-10-22 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体

Publications (2)

Publication Number Publication Date
JP2010103684A JP2010103684A (ja) 2010-05-06
JP4885929B2 true JP4885929B2 (ja) 2012-02-29

Family

ID=42293934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008271975A Expired - Fee Related JP4885929B2 (ja) 2008-10-22 2008-10-22 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体

Country Status (1)

Country Link
JP (1) JP4885929B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4878047B2 (ja) * 2008-10-22 2012-02-15 日本電信電話株式会社 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07298271A (ja) * 1994-04-28 1995-11-10 Matsushita Electric Ind Co Ltd 動画像符号化における動きベクトル検出方法及び装置
JP3233186B2 (ja) * 1995-06-05 2001-11-26 日本電信電話株式会社 動画像符号化・復号方法および装置
JP2006025033A (ja) * 2004-07-06 2006-01-26 Sony Corp 画像処理装置および画像処理方法

Also Published As

Publication number Publication date
JP2010103684A (ja) 2010-05-06

Similar Documents

Publication Publication Date Title
RU2672185C1 (ru) Устройство кодирования с предсказанием изображений, способ кодирования с предсказанием изображений, программа кодирования с предсказанием изображений, устройство декодирования с предсказанием изображений, способ декодирования с предсказанием изображений, программа декодирования с предсказанием изображений
JP7171770B2 (ja) 動きベクトル精密化および動き補償のためのメモリアクセスウィンドウおよびパディング
JP6559309B2 (ja) 画像予測復号方法
KR102527169B1 (ko) 모션 벡터 리파인먼트를 위한 제한된 메모리 액세스 윈도우
EP3139607B1 (en) Template matching-based intra-prediction coding and decoding
WO2010001916A1 (ja) 画像処理装置および方法
JP5306485B2 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
TWI738236B (zh) 視訊編碼中具有運動精化的雙向預測視訊處理方法和裝置
JP2005318497A (ja) 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム。
JP5367097B2 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
KR20140048320A (ko) 동영상 부호화 방법 및 복호방법, 그들의 장치 및 그들의 프로그램과 프로그램을 기록한 기억매체
US9088797B2 (en) Video processing method and apparatus with residue prediction
JP2011199362A (ja) 動画像符号化装置、動画像符号化方法及び動画像復号装置ならびに動画像復号方法
KR100856392B1 (ko) 현재 영상의 복원영역을 참조하는 동영상 부호화/복호화장치 및 그 방법
KR20130126698A (ko) 영상 부호화 장치, 영상 부호화 방법 및 영상 부호화 프로그램
JP2006295408A (ja) 画像符号化装置及び画像符号化プログラム
JP4885929B2 (ja) 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体
JP4878047B2 (ja) 映像符号化方法,映像復号方法,映像符号化装置,映像復号装置,映像符号化プログラム,映像復号プログラムおよびそれらの記録媒体
JP2009212667A (ja) 動画像符号化装置および復号装置
US11528485B2 (en) Encoding apparatus and program
JP7499069B2 (ja) 画像符号化装置、画像復号装置及びこれらのプログラム
JP2012054618A (ja) 動画像符号化装置及び符号化方法、動画像復号化装置及び復号化方法
JP2009017107A (ja) 動画像符号化装置及び動画像符号化方法
KR20150113715A (ko) 깊이 정보를 이용한 움직임 정보 유도방법 및 장치, 움직임 병합 후보 유도방법 및 장치

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100331

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111208

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141216

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4885929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees