JP5298060B2 - 予測ベクトル生成器、符号化装置、復号装置、及びプログラム - Google Patents

予測ベクトル生成器、符号化装置、復号装置、及びプログラム Download PDF

Info

Publication number
JP5298060B2
JP5298060B2 JP2010086567A JP2010086567A JP5298060B2 JP 5298060 B2 JP5298060 B2 JP 5298060B2 JP 2010086567 A JP2010086567 A JP 2010086567A JP 2010086567 A JP2010086567 A JP 2010086567A JP 5298060 B2 JP5298060 B2 JP 5298060B2
Authority
JP
Japan
Prior art keywords
vector
adjacent
block
motion
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010086567A
Other languages
English (en)
Other versions
JP2011223071A (ja
Inventor
奈緒 中島
慎一 境田
善明 鹿喰
和久 井口
俊枝 三須
康孝 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2010086567A priority Critical patent/JP5298060B2/ja
Publication of JP2011223071A publication Critical patent/JP2011223071A/ja
Application granted granted Critical
Publication of JP5298060B2 publication Critical patent/JP5298060B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動き補償予測を用いてブロック単位で動画像を符号化する際に、符号化対象ブロックの動きベクトルを予測する、予測ベクトル生成器、符号化装置、復号装置、及びプログラムに関する。
動画像の圧縮符号化方式には、MPEG−4 AVC/H.264方式やMPEG−2方式などが広く用いられている。これらの方式による動画像の圧縮符号化処理では、インター予測が用いられている。インター予測とは、既に符号化されたピクチャから現ピクチャへの動きを表す動きベクトルを推定し、この動きベクトルを用いて動き補償を行い、現ピクチャの予測信号を生成する技術である。この予測信号と現ピクチャの差分信号に直交変換(例えば、DCT;Discrete Cosine Transform)処理を施し、直交変換係数を量子化することで動画像は圧縮符号化される。
図11は、従来のMPEG−4 AVC/H.264方式(以下、「従来の方式」という。)における符号化装置3の構成を示すブロック図である。符号化装置3は、減算部11と、直交変換部12と、量子化部13と、逆量子化部14と、逆直交変換部15と、加算部16と、メモリ17と、イントラ予測部18と、動き補償部19と、動き予測部20と、切替えスイッチ21と、予測ベクトル生成部22と、差分ベクトル生成部23と、差分ベクトル量子化部24と、可変長符号化部25とを備える。
減算部11は、入力画像と、切替えスイッチ21を介してイントラ予測部18又は動き補償部19から入力される予測画像との差分画像を生成し、直交変換部12に出力する。
直交変換部12は、減算部11から入力される差分画像に対して小領域の画像ブロック(以下、単に「ブロック」という。)ごとに直交変換を施し、直交変換係数を量子化部13に出力する。
量子化部13は、直交変換部12から入力される直交変換係数に対して量子化テーブルを選択して量子化処理を行い、可変長符号化部25及び逆量子化部14に出力する。
逆量子化部14は、量子化部13から入力される量子化された直交変換係数に対して逆量子化処理を行い、逆直交変換部15に出力する。
逆直交変換部15は、逆量子化部14から入力される直交変換係数に対して逆直交変換(例えば、IDCT;Inverse Discrete Cosine Transform)処理を施し、加算部16に出力する。
加算部16は、逆直交変換部15から入力される逆直交変換した画像と、切替えスイッチ21を介してイントラ予測部18又は動き補償部19から入力される予測画像とを加算して復号画像を生成し、メモリ17に出力する。
イントラ予測部18は、メモリ17に記憶された符号化対象ブロック(以下、「対象ブロック」という。)に隣接する符号化済みのブロックの復号画像を参照して予測画像を生成し、切替えスイッチ21を介して減算部11及び加算部16に出力する。
動き補償部19は、メモリ17に記憶された復号画像に対し、動き予測部20から入力される動きベクトルを用いて動き補償を行って予測画像を生成し、切替えスイッチ21を介して減算部11及び加算部16に出力する。
動き予測部20は、入力画像に対して、メモリ17に記憶された複数の過去及び/又は未来のピクチャを参照して動きベクトルを生成し、動き補償部19、予測ベクトル生成部22及び差分ベクトル生成部23に出力する。
切替えスイッチ21は、イントラ予測部18から入力される予測画像と、動き補償部19から入力される予測画像とを切替えて、減算部11及び加算部16に出力する。
予測ベクトル生成部22は、動き予測部20から入力される対象ブロックに隣接する符号化済みのブロックの動きベクトルから、対象ブロックの動きベクトルを予測した予測ベクトルを生成し、差分ベクトル生成部23に出力する。
差分ベクトル生成部23は、動き予測部20から入力される対象ブロックの動きベクトルと、予測ベクトル生成部22から入力される予測ベクトルとの差分ベクトルを算出し、差分ベクトル量子化部24に出力する。
差分ベクトル量子化部24は、差分ベクトル生成部23から入力される差分ベクトルに対して量子化処理を行い、可変長符号化部25に出力する。
可変長符号化部25は、量子化部13から入力される量子化された直交変換係数についてスキャンを行って可変長符号化処理を施しビットストリームを生成するとともに、差分ベクトル量子化部24から入力される動きベクトルの情報も可変長符号化を施し、符号化データを外部に出力する。
一般にブロック単位での動き補償予測を行う場合、対象ブロックの動きベクトルは対象ブロックの周囲のブロックの動きベクトルと強い相関がある。そのため、従来の方式では、予測ベクトルとして対象ブロックに隣接するブロック(以下、「隣接ブロック」という。)の動きベクトル(以下、「隣接ベクトル」という。)の中央値を求めている。即ち、対象ブロックの左側、上側、右上側に隣接するブロックの隣接ベクトルをそれぞれmvA,mvB,mvC、予測ベクトルをPとすると、次式(1)により予測ベクトルPの水平方向成分及び垂直方向成分を求めている。
P(x)=median (mvA(x),mvB(x),mvC(x))
P(y)=median (mvA(y),mvB(y),mvC(y)) (1)
ここで、(x)はベクトルの水平方向成分を示し、(y)はベクトルの垂直方向成分を示し、medianは中央値を示す。
しかしながら、この技法では、符号量の観点から最適な予測でない場合がある。図12は、従来の方式における動きベクトルの予測を説明する図である。対象ブロックXと隣接ブロックA,B,Cとの間に絵柄の水平エッジが存在する場合など、ブロックB,Cと、ブロックA,Xとで画像の動く方向が異なる場合には、対象ブロックXの動きベクトルは隣接ベクトルmvAに類似していると推測される。しかし、隣接ベクトルが図に示す配置関係にある場合には、式(1)によりP=mvBとなり、隣接ベクトルmvBが予測ベクトルとされてしまう。
これを解決するために、それぞれの隣接ベクトルの評価基準として、それぞれが該当するブロックの差分ベクトルの符号量を評価値として用いる技法が提案されている(例えば、特許文献1参照)。この技法では、対象ブロックの上側に隣接するブロックの評価値が閾値より大きい場合にはこの隣接ベクトルは予測ベクトルの生成に適していないと判定し、左側に隣接するブロックのmvAを予測ベクトルとする。
また、それぞれの隣接ベクトルを予測ベクトルとして用いた場合の符号量の大きさを評価基準として隣接ベクトルを評価する技法が提案されている(例えば、非特許文献1参照)。この技法では、符号量が最も小さくなる隣接ベクトルを予測ベクトルとし、選択された隣接ベクトルを示す情報を付加情報として符号化している。
特開2009−212667号公報
Tomoyuki Yamamoto, "A new Scheme for motion vector predictor encoder", ITU-T SG16, VCEG-AF13, Apr.2007
しかし、特許文献1、非特許文献1のいずれの技法においても、予測ベクトル生成に関する予測情報を付加したうえで符号化を行っているため、従来の方式に比べて符号量が増大してしまうという問題があった。
本発明の目的は、上記問題を解決するため、適切な予測ベクトルを生成し、予測情報を付加することなく、符号量を低減可能な予測ベクトル生成器、符号化装置、復号装置、及びプログラムを提供することにある。
上記課題を解決するため、本発明に係る予測ベクトル生成器は、動き補償予測を用いてブロック単位で動画像を符号化する際に、符号化対象ブロックの動きベクトルを、符号化対象ブロックが参照する参照ピクチャの動きベクトルを用いて予測する予測ベクトル生成器であって、符号化対象ブロックに隣接する符号化済みのブロックのうち、少なくとも該符号化対象ブロックに水平方向に隣接するブロックを含む複数の第1隣接ブロックの複数の第1動きベクトル(隣接ベクトル)を取得するとともに、参照ピクチャにおいて前記符号化対象ブロックと同じ空間位置に位置する参照ブロック(参照対象ブロック)に隣接するブロックのうち、少なくとも該参照ブロックに水平方向に隣接するブロックを含む複数の第2隣接ブロックの複数の第2動きベクトル(参照隣接ベクトル)を取得し、前記複数の第1動きベクトルと前記複数の第2動きベクトルの配置に類似性があるか否かを判定する類似性判定部と、前記類似性判定部によって前記類似性があると判定した場合には、前記複数の第2動きベクトル、及び前記参照ブロックの第3動きベクトル(参照対象ベクトル)の配置から水平エッジが存在しているか否かを判定する水平エッジ判定部と、前記水平エッジ判定部によって前記水平エッジが存在していると判定した場合には、前記複数の第1動きベクトルのうち、符号化対象ブロックと水平方向に隣接したブロックの第1動きベクトルを予測ベクトルと決定して出力し、前記類似性判定部によって前記類似性がないと判定した場合、又は前記水平エッジ判定部によって前記水平エッジが存在していないと判定した場合には、前記複数の第1動きベクトルの中央値又は平均値を予測ベクトルと決定して出力する予測ベクトル生成部と、備えることを特徴とする。
また、本発明に係る予測ベクトル生成器において、前記類似性判定部は、2つの前記第1動きベクトルで構成されるベクトル組のうち類似度が最大となる第1ベクトル組を求めるとともに、2つの前記第2動きベクトルで構成されるベクトルの組のうち類似度が最大となる第2ベクトル組を求め、前記第1ベクトル組に対応する隣接ブロックと前記第2ベクトル組に対応する参照隣接ブロックとが同じ空間的位置に位置する場合には前記類似性があると判定し、前記第1ベクトル組に対応する隣接ブロックと前記第2ベクトル組に対応する参照隣接ブロックとが同じ空間的位置に位置しない場合には前記類似性がないと判定することを特徴とする。
また、本発明に係る予測ベクトル生成器において、前記水平エッジ判定部は、前記第2動きベクトルと前記第3動きベクトルで構成されるベクトル組のうち類似度が最大となる第3ベクトル組を求め、該第3ベクトル組の第2動きベクトルが前記参照ブロックと水平方向に隣接したブロックの動きベクトルである場合には水平エッジが存在していると判定し、該第3ベクトル組の第2動きベクトルが前記参照ブロックと水平方向に隣接したブロックの動きベクトルでない場合には水平エッジが存在していないと判定することを特徴とする。
また、本発明に係る予測ベクトル生成器において、前記複数の第1隣接ブロックは、前記符号化対象ブロックに対し、左側に隣接するブロック、上側に隣接するブロック、及び右上側に隣接するブロックの3つの隣接ブロックからなり、前記複数の第1動きベクトルは、該3つの隣接ブロックの各動きベクトルからなり、前記複数の第2隣接ブロックは、前記参照ブロックに対し、左側に隣接するブロック、上側に隣接するブロック、及び右上側に隣接するブロックの3つの参照隣接ブロックからなり、前記複数の第2動きベクトルは、該3つの参照隣接ブロックの各動きベクトルからなることを特徴とする。
また、本発明に係る予測ベクトル生成器において、前記類似度は、2つの動きベクトルの内積、又は2つの動きベクトルの水平方向成分及び垂直方向成分の各二乗誤差の和の逆数により求めることを特徴とする。
さらに、本発明に係る符号化装置は、上述した予測ベクトル生成器を備えることを特徴とする。
さらに、本発明に係る復号装置は、上述した予測ベクトル生成器を備えることを特徴とする。
さらに、上記課題を解決するために、本発明は、動き補償予測を用いてブロック単位で動画像を符号化する際に、符号化対象ブロックの動きベクトルを、符号化対象ブロックが参照する参照ピクチャの動きベクトルを用いて予測する予測ベクトル生成器として機能するコンピュータに、符号化対象ブロックに隣接する符号化済みのブロックのうち、少なくとも該符号化対象ブロックに水平方向に隣接するブロックを含む複数の第1隣接ブロックの複数の第1動きベクトルを取得するとともに、参照ピクチャにおいて前記符号化対象ブロックと同じ空間位置に位置する参照ブロックに隣接するブロックのうち、少なくとも該参照ブロックに水平方向に隣接するブロックを含む複数の第2隣接ブロックの複数の第2動きベクトルを取得し、前記複数の第1動きベクトルと前記複数の第2動きベクトルの配置に類似性があるか否かを判定するステップと、前記類似性判定部によって前記類似性があると判定した場合には、前記複数の第2動きベクトル、及び前記参照ブロックの第3動きベクトルの配置から水平エッジが存在しているか否かを判定するステップと、前記水平エッジ判定部によって前記水平エッジが存在していると判定した場合には、前記複数の第1動きベクトルのうち、符号化対象ブロックと水平方向に隣接したブロックの第1動きベクトルを予測ベクトルと決定して出力し、前記類似性判定部によって前記類似性がないと判定した場合、又は前記水平エッジ判定部によって前記水平エッジが存在していないと判定した場合には、前記複数の第1動きベクトルの中央値又は平均値を予測ベクトルと決定して出力するステップと、を実行させるためのプログラムとしても特徴付けられる。
本発明によれば、予測ベクトルを生成する際に、対象ブロックが参照する参照ピクチャの動きベクトルを用いて予測ベクトルを生成するため、従来の方式に対して新たな付加情報を添付することなく、予測ベクトルの生成により適した隣接ベクトルを選択することができ、符号量を低減することができるようになる。
本発明による一実施例の予測ベクトル生成器の構成を示すブロック図である。 本発明による一実施例の予測ベクトル生成器に入力される動きベクトルの例を示す図である。 対象ブロックのサイズと隣接するブロックのサイズが同一でない場合の例を示す図である。 本発明による一実施例の予測ベクトル生成器の動作を説明する図である。 本発明による一実施例の予測ベクトル生成器の動作を示すフローチャートである。 本発明による一実施例の予測ベクトル生成器の予測ベクトル決定部の構成を示すブロック図である。 本発明による一実施例の予測ベクトル生成器を備える符号化装置の構成を示すブロック図である。 本発明による一実施例の予測ベクトル生成器を備える復号装置の構成を示すブロック図である。 対象ブロックの左側に垂直エッジが存在する場合の動作を説明する図である。 対象ブロックの右側に垂直エッジが存在する場合の動作を説明する図である。 従来のMPEG−4 AVC/H.264方式における符号化装置の構成を示すブロック図である。 従来のMPEG−4 AVC/H.264方式における動きベクトルの予測を説明する図である。
[予測ベクトル生成器]
本発明による一実施例の予測ベクトル生成器10について、図面を参照して詳細に説明する。図1は、本発明による一実施例の予測ベクトル生成器10の構成を示すブロックである。本発明による予測ベクトル生成器10は、類似性判定部101と、水平エッジ判定部102と、予測ベクトル決定部103とを備える。
図2は、予測ベクトル生成器10に入力される動きベクトルの例を示す図である。図2(a)は、現ピクチャ(符号化対象ピクチャ)における、対象ブロックXと、隣接ブロックA,B,Cを示している。また、隣接ベクトルmvA,mvB,mvCを示している。図2(b)は、対象ブロックが参照するピクチャ(以下、「参照ピクチャ」という。)における、対象ブロックXと同じ空間位置に位置するブロック(以下、「参照対象ブロック」という。)Xrと、参照対象ブロックXrに隣接するブロック(以下、「参照隣接ブロック」という。)Ar,Br,Crを示している。また、参照隣接ブロックの動きベクトル(以下、「参照隣接ベクトル」という。)mvAr,mvBr,mvCr、及び参照対象ブロックXrの動きベクトル(以下、「参照対象ベクトル」という。)mvXrを示している。予測ベクトル生成器10には、隣接ベクトル、参照隣接ベクトル、及び参照対象ベクトルが入力される。
ここで、対象ブロックのサイズと隣接ブロックのサイズは同一でなくてもよい。MPEG−4 AVC/H.264方式では、動き補償予測をする際に、16画素×16ライン、16画素×8ライン、8画素×16ライン、8画素×8ライン、8画素×4ライン、4画素×8ライン、4画素×4ラインのブロックサイズの中から最適なものを切替えて用いることができる。このような可変ブロックサイズ動き補償を行う場合には、図3に示すように、対象ブロックの上側に複数の隣接ブロックがあるときは、その中の一番左のブロックを隣接ブロックBとする。また、対象ブロックの左側に複数の隣接ブロックがあるときは、その中の一番上のブロックを隣接ブロックAとする。これは、参照ピクチャにおいても同様である。
また、隣接ブロックは、対象ブロックに隣接した符号化済みのブロックのうち、少なくとも対象ブロックに水平方向に隣接するブロックを含む複数のブロックであればよい。以下では、一例として、従来の方式と同様に、隣接ブロックとして対象ブロックの左側、上側、右上側に隣接する3つのブロックを用いる場合について説明する。
類似性判定部101は、隣接ベクトルmvA,mvB,mvC、及び参照隣接ベクトルmvAr,mvBr,mvCrを取得し、隣接ベクトルと参照隣接ベクトルの配置を比較して類似性があるか否かを判定する。そして、ベクトルの配置に類似性があるか否かの情報を類似性フラグflag-simとして水平エッジ判定部102に出力する。隣接ベクトルと参照隣接ベクトルの配置に類似性があると判定した場合には類似性フラグflag-simを1とし、類似性がないと判定した場合には類似性フラグflag-simを0とする。
水平エッジ判定部102は、参照隣接ベクトルmvAr,mvBr,mvCr、及び参照対象ベクトルmvXrを取得し、類似性判定部101から入力される類似性フラグflag-simが1、即ち隣接ベクトルと参照隣接ベクトルの配置関係が類似していると判定された場合には、参照隣接ベクトル及び参照対象ベクトルの配置を比較し、水平エッジが存在しているか否かを判定する。そして、水平エッジが存在しているか否かの情報をエッジフラグflag-edとして予測ベクトル決定部103に出力する。水平エッジが存在していると判定した場合にはエッジフラグflag-edを1とし、水平エッジが存在していないと判定した場合にはエッジフラグflag-edを0とする。flag-simが0、即ち隣接ベクトルと参照隣接ベクトルの配置関係が類似していないと判定された場合には、水平エッジの判定は行わない。
予測ベクトル決定部103は、隣接ベクトルmvA,mvB,mvCを取得し、水平エッジ判定部102から入力されるエッジフラグflag-edに基づいて予測ベクトルPを決定し、外部に出力する。
図5は、本発明による予測ベクトル生成器10の動作を示すフローチャートである。本発明による予測ベクトル生成器10は、ステップS101にて、類似性判定部101により、類似性フラグflag-simを生成する。類似性判定部101は、隣接ベクトルmvA,mvB,mvCのうちの2つの隣接ベクトルで構成されるベクトル組の中から類似度が最大となる第1ベクトル組を求めるとともに、参照隣接ベクトルmvAr,mvBr,mvCrのうちの2つの参照隣接ベクトルで構成されるベクトルの組の中から類似度が最大となる第2ベクトル組を求める。そして、第1ベクトル組に対応する隣接ブロックと第2ベクトル組に対応する参照隣接ブロックとが同じ空間的位置に位置する場合には、隣接ベクトルと参照隣接ベクトルの配置に類似性があると判定する。一方、前記第1ベクトル組に対応する隣接ブロックと前記第2ベクトル組に対応する参照隣接ブロックとが同じ空間的位置に位置しない場合には、隣接ベクトルと参照隣接ベクトルの配置に類似性はないと判定する。
2つのベクトルの類似度は、ベクトルの差分、ベクトルの水平方向成分及び垂直方向成分の各二乗誤差の和の逆数、ベクトルの内積等により算出することができる。以下では、内積を用いて算出する場合を例に説明する。
図4に示すように、現ピクチャにおいて、隣接ブロックB及びCと、隣接ブロックA及び対象ブロックXとの間に水平エッジが存在する場合には、隣接ベクトルmvA,mvB,mvCのうちの2つの隣接ベクトルで構成されるベクトル組のうち、mvBとmvCの類似度を示すmvB・mvC(・は内積を示す)が最大となることが予想される。このときに参照ピクチャ上でも同様の傾向がある場合、即ち参照隣接ベクトルmvAr,mvBr,mvCrのうちの2つの参照隣接ベクトルで構成されるベクトル組のうち、mvBrとmvCrの類似度を示すmvBr・mvCrが最大となる場合には、現ピクチャの時間的に前後となるピクチャにおいて、対象ブロックと同じ空間位置のブロックに恒常的に水平エッジが存在している可能性がある。よって、条件式(2)により、現ピクチャのベクトル配置と参照ピクチャのベクトル配置に類似性があるか否かを判定し、類似性があると判定した場合には類似性フラグflag-simを1とし、類似性がないと判定した場合には類似性フラグflag-simを0とする。
If((mvB・mvC > mvA・mvB) && (mvB・mvC > mvA・mvC)
&& (mvBr・mvCr > mvAr・mvBr) && (mvBr・mvCr > mvAr・mVCr)){
flag-sim=1;
} (2)
else{
flag-sim=0;
式(2)では、mvB・mvC及びmvBr・mvCrが最大となる場合のみ類似性フラグflag-simを1としているが、mvA・mvB及びmvAr・mvBrが最大となる場合、mvA・mvC及びmvAr・mvCrが最大となる場合も、現ピクチャと参照ピクチャの動きベクトルの配置には類似性があるため、類似性フラグflag-simを1としてもよい。
また、可変ブロックサイズ動き補償を行う場合には、現ピクチャの対象ブロックX及び隣接ブロックA,B,Cと、参照ピクチャの参照対象ブロックXr及び参照隣接ブロックAr,Br,Crのブロックサイズをそれぞれ比較し、それぞれのブロックサイズが等しくない場合には、動きベクトルの傾向が異なり、恒常的に同位置に水平エッジが存在している可能性は低いので、類似性フラグflag-simを0としてもよい。
図5に戻り、本発明による予測ベクトル生成器10は、ステップS102にて、水平エッジ判定部102により、取得した類似性フラグflag-simが1の場合には処理をステップS103に進め、類似性フラグflag-simが0の場合には処理をステップS106に進める。
類似性フラグflag-simが1の場合には、ステップS103にて、水平エッジ判定部102により、エッジフラグflag-edを生成する。水平エッジ判定部102は、参照隣接ベクトルmvAr,mvBr,mvCrのいずれかと参照対象ベクトルmvXrとで構成されるベクトル組のうち類似度が最大となるベクトル組を求め、このベクトル組の参照隣接ベクトルが参照対象ブロックXrと水平方向に隣接したブロックの動きベクトルである(即ち、mvArである)場合には、水平エッジが存在していると判定する。一方、類似度が最大となるベクトル組の参照隣接ベクトルが参照対象ブロックXrと水平方向に隣接したブロックの動きベクトルでない(即ち、mvBr又はmvCrである)場合には、水平エッジが存在していないと判定する
つまり、条件式(3)に示すように、mvAr・mvXr、mvBr・mvXr、mvCr・mvXrのうち、mvAr・mvXrが最大となる場合には、水平エッジが恒常的に存在していると判定してエッジフラグflag-edを1とし、mvAr・mvXrが最大とならない場合には、水平エッジが恒常的に存在していないと判定してエッジフラグflag-edを0とする。
if((mvAr・mvXr>mvBr・mvXr) && (mvAr・mvXr>mvCr・mvXr)){
flag-ed=1;
} (3)
else{
flag-ed=0;
本発明による予測ベクトル生成器10は、ステップS104にて、予測ベクトル決定部103により、エッジフラグflag-edが1の場合には処理をステップS105に進め、エッジフラグflag-edが0の場合には処理をステップS106に進める。
エッジフラグflag-edが1の場合には、ステップS105にて、予測ベクトル決定部103により、予測ベクトルPを対象ブロックXと水平方向に隣接したブロックの動きベクトル(即ち、mvA)と決定し、予測ベクトルPを外部に出力する。
類似性フラグflag-simが0、又はエッジフラグflag-edが0の場合には、ステップS106にて、予測ベクトル決定部103により、従来の方式と同様に、予測ベクトルPを隣接ベクトルmvA,mvB,mvCの中央値に決定し、予測ベクトルPを外部に出力する。
図6は、予測ベクトル決定部103の構成を示すブロック図である。予測ベクトル決定部103は、評価値決定部1031と、予測ベクトル選択部1032とを備える。評価値決定部1031は、条件式(4)に示すように、水平エッジ判定部102から入力されるエッジフラグflag-edに基づいて、取得した隣接ベクトルmvA,mvB,mvCのうちのいずれを予測ベクトルPとするかを示す評価値ax,bx,cx,ay,by,cyを決定し、予測ベクトル選択部1032に出力する。なお、エッジフラグflag-edの初期値を0とし、エッジフラグflag-edが1になっても次の対象ブロックの処理を開始する前に0に戻すこととする。よって、類似性フラグflag-simが0の場合には、水平エッジの判定は行われないためエッジフラグflag-edも0となる。
if(flag-ed==1){
ax=1, bx=0, cx=0;
ay=1, by=0, cy=0;

else{
if(median(mvA(x),mvB(x),mvC(x)) = mvA(x)){
ax=1, bx=0, cx=0;
}
if(median(mvA(x),mvB(x),mvC(x)) = mvB(x)){
ax=0, bx=1, cx=0;
}
if(median(mvA(x),mvB(x),mvC(x)) = mvC(x)){
ax=0, bx=0, cx=1; (4)
}
if(median(mvA(y),mvB(y),mvC(y)) = mvA(y)){
ay=1, by=0, cy=0;
}
if(median(mvA(y),mvB(y),mvC(y)) = mvB(y)){
ay=0, by=1, cy=0;
}
if(median(mvA(y),mvB(y),mvC(y)) = mvC(y)){
ay=0, by=0, cy=1;
}
}
予測ベクトル選択部1032は、式(5)に示すように、評価値決定部1031から入力される評価値ax,bx,cx,ay,by,cyと、取得した隣接ベクトルmvA,mvB,mvCとから、予測ベクトルPを選択(決定)する。
P(x)=ax×mvA(x)+bx×mvB(x)+cx×mvC(x)
P(y)=ay×mvA(y)+by×mvB(y)+cy×mvC(y) (5)
なお、従来の方式と同様に、隣接ブロックとして対象ブロックの左側、上側、右上側に隣接する3つのブロックを用いる場合を例に説明したが、偶数個の隣接ブロックの動きベクトルを用いて上記処理を行う場合には中央値が存在しないので、例えば、中央値の代わりに平均値を求める必要がある。
[符号化装置及び復号装置]
図7は、本発明による予測ベクトル生成器10を備える符号化装置1の構成を示すブロック図である。符号化装置1は、従来のMPEG4 AVC/H.264方式の符号化装置3(図11参照)における予測ベクトル生成部22に代えて、本発明による予測ベクトル生成器10を備える。符号化装置3と同じ構成要素には同一の参照番号を付して説明を省略する。予測ベクトル生成器10は、動き予測部20から現ピクチャの隣接ベクトルmvA,mvB,mvCと、参照ピクチャの参照隣接ベクトルmvAr,mvBr,mvCr及び参照対象ベクトルmvXrを入力し、上述したように類似性判定部101と、水平エッジ判定部102と、予測ベクトル決定部103により予測ベクトルPを生成し、差分ベクトル生成部23に出力する。
図8は、本発明による予測ベクトル生成器10を備える復号装置2の構成を示すブロック図である。復号装置2は、可変長復号部31と、逆量子化部32と、逆直交変換部33と、加算部34と、メモリ35と、イントラ予測部36と、動き補償部37と、動きベクトル生成部38と、切替えスイッチ39と、予測ベクトル生成器10とを備える。復号装置2は、従来の方式の復号装置の予測ベクトル生成部に代えて、本発明による予測ベクトル生成器10を備える。
可変長復号部31は、符号化されたデータ及び符号化された差分ベクトルの情報に対して可変長復号処理を施し、逆量子化部32に出力する。
逆量子化部32は、可変長復号部31から入力される量子化された直交変換係数に対して逆量子化処理を施して、動き補償した差分画像の直交変換係数を取得し、逆直交変換部33に出力する。また、可変長復号部31から入力される量子化された差分ベクトルの情報に対して逆量子化処理を施して、差分ベクトルを動きベクトル生成部38に出力する。
逆直交変換部33は、逆量子化部32から入力される差分画像の直交変換係数に対して、逆直交変換(例えば、IDCT)を施し、得られる差分画像を加算部34に出力する。
加算部34は、逆直交変換部33から得られる差分画像と、切替えスイッチ39を介してイントラ予測部36又は動き補償部37から入力される予測画像とを加算して画像を復元し、メモリ35及び外部に出力する。
動き補償部37は、メモリ35から得られる画像と動きベクトル生成部38から得られる動きベクトルとを用いて予測画像を生成し、切替えスイッチ39を介して加算部34に出力する。
動きベクトル生成部38は、逆量子化部32から入力される差分ベクトルと予測ベクトル生成器10から入力される予測ベクトルとを加算して動きベクトルを生成し、動き補償部37に出力する。
切替えスイッチ39は、イントラ予測部36から入力される予測画像と、動き補償部37から入力される予測画像とを切替えて加算部34に出力する。
予測ベクトル生成器10は、動きベクトル生成部38から現ピクチャの隣接ベクトルmvA,mvB,mvCと、参照ピクチャの参照隣接ベクトルmvAr,mvBr,mvCr及び参照対象ベクトルmvXrを入力し、上述したように類似性判定部101と、水平エッジ判定部102と、予測ベクトル決定部103により予測ベクトルPを生成し、動きベクトル生成部38に出力する。
このように、予測ベクトル生成器10は、既に符号化済みの隣接ベクトルmvA,mvB,mvCと、参照隣接ベクトルmvAr,mvBr,mvCr及び参照対象ベクトルmvXrとを用いて予測ベクトルを決定するため、復号装置側でも同様の手順を行うことが可能である。これにより、従来の方式に対して新たな付加情報を添付することなく、符号化復号が可能であるため、余分な情報量は一切発生しない。また、既存のMPEG−4 AVC/H.264デコーダの改修は必要であるが、MPEG−4 AVC/H.264の規格を変更する必要も一切発生しない。したがって、本発明によれば、対象ブロックXの上部境界に絵柄のエッジが存在する場合に、従来の方式よりも効率の良い予測を行うことが可能となる。
従来の方式では、隣接ベクトルmvA,mvB,mvCの中央値を予測ベクトルPとしている。そのため、対象ブロックXの上部境界に絵柄のエッジが存在する場合、対象ブロックXの動きベクトルは隣接ベクトルmvAに類似しているにもかかわらず、隣接ベクトルmvB又はmvCを予測ベクトルとしてしまう。一方、本発明によれば、隣接ベクトルmvA,mvB,mvCだけでなく、参照隣接ベクトルmvAr,mvBr,mvCr及び参照対象ベクトルmvXrも参照することにより、対象ブロックの動きベクトルに類似する隣接ベクトルmvAを予測ベクトルとすることが可能となる。
本発明によれば、図9に示すように、対象ブロックXの左側境界に絵柄のエッジが存在する場合には、ブロックAと、ブロックB,C,Xとで異なる動きをするため、エッジフラグflag-edが1となる可能性は低い。よって、従来の方式と同様に、隣接ベクトルmvA,mvB,mvCの中央値を予測ベクトルPとするため、従来の方式と比較して予測効率が低下しない。また、図10に示すように、対象ブロックXの右側境界に絵柄のエッジが存在する場合には、ブロックA,B,Xと、ブロックCとで異なる動きをするため、エッジフラグflag-edが1となる可能性は低い。よって、従来の方式と同様に、隣接ベクトルmvA,mvB,mvCの中央値を予測ベクトルPとするため、従来の方式と比較して予測効率が低下しない。
ここで、予測ベクトル生成器10として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、類似性判定部101と、水平エッジ判定部102と、予測ベクトル決定部103とを機能させるための制御部を、CPU(中央演算処理装置)と、少なくとも1つのメモリで構成される記憶部とで実現できる。また、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、類似性判定部101と、水平エッジ判定部102と、予測ベクトル決定部103の有する機能を実現させることができる。
同様に、符号化装置1として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、予測ベクトル生成器10と、減算部11と、直交変換部12と、量子化部13と、逆量子化部14と、逆直交変換部15と、加算部16と、メモリ17と、イントラ予測部18と、動き補償部19と、動き予測部20と、切替えスイッチ21と、差分ベクトル生成部23と、差分ベクトル量子化部24と、可変長符号化部25とを機能させるための制御部を、CPUと、少なくとも1つのメモリで構成される記憶部とで実現できる。また、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、予測ベクトル生成器10と、減算部11と、直交変換部12と、量子化部13と、逆量子化部14と、逆直交変換部15と、加算部16と、メモリ17と、イントラ予測部18と、動き補償部19と、動き予測部20と、切替えスイッチ21と、差分ベクトル生成部23と、差分ベクトル量子化部24と、可変長符号化部25の有する機能を実現させることができる。
同様に、復号装置2として機能させるために、コンピュータを好適に用いることができ、そのようなコンピュータは、予測ベクトル生成器10と、可変長復号部31と、逆量子化部32と、逆直交変換部33と、加算部34と、メモリ35と、イントラ予測部36と、動き補償部37と、動きベクトル生成部38と、切替えスイッチ39とを機能させるための制御部をCPUと、少なくとも1つのメモリで構成される記憶部とで実現できる。また、そのようなコンピュータに、CPUによって所定のプログラムを実行させることにより、予測ベクトル生成器10と、可変長復号部31と、逆量子化部32と、逆直交変換部33と、加算部34と、メモリ35と、イントラ予測部36と、動き補償部37と、動きベクトル生成部38と、切替えスイッチ39の有する各機能を実現させることができる。
上述の実施例は、代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。従って、本発明は、上述の実施例によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。
このように、本発明によれば、従来の方式に対して新たな付加情報を添付することなく、符号量を低減することができることができるので、動き補償予測を用いて動画像を符号化する任意の用途に有用である。
1 符号化装置
10 予測ベクトル生成器
101 類似性判定部
102 水平エッジ判定部
103 予測ベクトル決定部
1031 評価値決定部
1032 予測ベクトル選択部
11 減算部
12 直交変換部
13 量子化部
14 逆量子化部
15 逆直交変換部
16,34 加算部
17,35 メモリ
18,36 イントラ予測部
19,37 動き補償部
20 動き予測部
21,39 切替えスイッチ
22 予測ベクトル生成部
23 差分ベクトル生成部
24 差分ベクトル量子化部
25 可変長符号化部
2 復号装置
31 可変長復号部
32 逆量子化部
33 逆直交変換部
38 動きベクトル生成部

Claims (8)

  1. 動き補償予測を用いてブロック単位で動画像を符号化する際に、符号化対象ブロックの動きベクトルを、符号化対象ブロックが参照する参照ピクチャの動きベクトルを用いて予測する予測ベクトル生成器であって、
    符号化対象ブロックに隣接する符号化済みのブロックのうち、少なくとも該符号化対象ブロックに水平方向に隣接するブロックを含む複数の第1隣接ブロックの複数の第1動きベクトルを取得するとともに、参照ピクチャにおいて前記符号化対象ブロックと同じ空間位置に位置する参照ブロックに隣接するブロックのうち、少なくとも該参照ブロックに水平方向に隣接するブロックを含む複数の第2隣接ブロックの複数の第2動きベクトルを取得し、前記複数の第1動きベクトルと前記複数の第2動きベクトルの配置に類似性があるか否かを判定する類似性判定部と、
    前記類似性判定部によって前記類似性があると判定した場合には、前記複数の第2動きベクトル、及び前記参照ブロックの第3動きベクトルの配置から水平エッジが存在しているか否かを判定する水平エッジ判定部と、
    前記水平エッジ判定部によって前記水平エッジが存在していると判定した場合には、前記複数の第1動きベクトルのうち、符号化対象ブロックと水平方向に隣接したブロックの第1動きベクトルを予測ベクトルと決定して出力し、前記類似性判定部によって前記類似性がないと判定した場合、又は前記水平エッジ判定部によって前記水平エッジが存在していないと判定した場合には、前記複数の第1動きベクトルの中央値又は平均値を予測ベクトルと決定して出力する予測ベクトル決定部と、
    を備えることを特徴とする予測ベクトル生成器。
  2. 前記類似性判定部は、2つの前記第1動きベクトルで構成されるベクトル組のうち類似度が最大となる第1ベクトル組を求めるとともに、2つの前記第2動きベクトルで構成されるベクトルの組のうち類似度が最大となる第2ベクトル組を求め、前記第1ベクトル組に対応する隣接ブロックと前記第2ベクトル組に対応する参照隣接ブロックとが同じ空間的位置に位置する場合には前記類似性があると判定し、前記第1ベクトル組に対応する隣接ブロックと前記第2ベクトル組に対応する参照隣接ブロックとが同じ空間的位置に位置しない場合には前記類似性がないと判定することを特徴とする、請求項1に記載の予測ベクトル生成器。
  3. 前記水平エッジ判定部は、前記第2動きベクトルと前記第3動きベクトルで構成されるベクトル組のうち類似度が最大となる第3ベクトル組を求め、該第3ベクトル組の第2動きベクトルが前記参照ブロックと水平方向に隣接したブロックの動きベクトルである場合には水平エッジが存在していると判定し、該第3ベクトル組の第2動きベクトルが前記参照ブロックと水平方向に隣接したブロックの動きベクトルでない場合には水平エッジが存在していないと判定することを特徴とする、請求項1又は2に記載の予測ベクトル生成器。
  4. 前記複数の第1隣接ブロックは、前記符号化対象ブロックに対し、左側に隣接するブロック、上側に隣接するブロック、及び右上側に隣接するブロックの3つの隣接ブロックからなり、
    前記複数の第1動きベクトルは、該3つの隣接ブロックの各動きベクトルからなり、
    前記複数の第2隣接ブロックは、前記参照ブロックに対し、左側に隣接するブロック、上側に隣接するブロック、及び右上側に隣接するブロックの3つの参照隣接ブロックからなり、
    前記複数の第2動きベクトルは、該3つの参照隣接ブロックの各動きベクトルからなることを特徴とする、請求項1から3のいずれか一項に記載の予測ベクトル生成器。
  5. 前記類似度は、2つの動きベクトルの内積、又は2つの動きベクトルの水平方向成分及び垂直方向成分の各二乗誤差の和の逆数により求めることを特徴とする、請求項1から4のいずれか一項に記載の予測ベクトル生成器。
  6. 請求項1から5のいずれか一項に記載の予測ベクトル生成器を備えることを特徴とする符号化装置。
  7. 請求項1から5のいずれか一項に記載の予測ベクトル生成器を備えることを特徴とする復号装置。
  8. 動き補償予測を用いてブロック単位で動画像を符号化する際に、符号化対象ブロックの動きベクトルを、符号化対象ブロックが参照する参照ピクチャの動きベクトルを用いて予測する予測ベクトル生成器として機能するコンピュータに、
    符号化対象ブロックに隣接する符号化済みのブロックのうち、少なくとも該符号化対象ブロックに水平方向に隣接するブロックを含む複数の第1隣接ブロックの複数の第1動きベクトルを取得するとともに、参照ピクチャにおいて前記符号化対象ブロックと同じ空間位置に位置する参照ブロックに隣接するブロックのうち、少なくとも該参照ブロックに水平方向に隣接するブロックを含む複数の第2隣接ブロックの複数の第2動きベクトルを取得し、前記複数の第1動きベクトルと前記複数の第2動きベクトルの配置に類似性があるか否かを判定するステップと、
    前記類似性判定部によって前記類似性があると判定した場合には、前記複数の第2動きベクトル、及び前記参照ブロックの第3動きベクトルの配置から水平エッジが存在しているか否かを判定するステップと、
    前記水平エッジ判定部によって前記水平エッジが存在していると判定した場合には、前記複数の第1動きベクトルのうち、符号化対象ブロックと水平方向に隣接したブロックの第1動きベクトルを予測ベクトルと決定して出力し、前記類似性判定部によって前記類似性がないと判定した場合、又は前記水平エッジ判定部によって前記水平エッジが存在していないと判定した場合には、前記複数の第1動きベクトルの中央値又は平均値を予測ベクトルと決定して出力するステップと、
    を実行させるためのプログラム。
JP2010086567A 2010-04-02 2010-04-02 予測ベクトル生成器、符号化装置、復号装置、及びプログラム Expired - Fee Related JP5298060B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010086567A JP5298060B2 (ja) 2010-04-02 2010-04-02 予測ベクトル生成器、符号化装置、復号装置、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010086567A JP5298060B2 (ja) 2010-04-02 2010-04-02 予測ベクトル生成器、符号化装置、復号装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2011223071A JP2011223071A (ja) 2011-11-04
JP5298060B2 true JP5298060B2 (ja) 2013-09-25

Family

ID=45039534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010086567A Expired - Fee Related JP5298060B2 (ja) 2010-04-02 2010-04-02 予測ベクトル生成器、符号化装置、復号装置、及びプログラム

Country Status (1)

Country Link
JP (1) JP5298060B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109495738B (zh) * 2017-09-12 2023-02-07 华为技术有限公司 一种运动信息的编解码方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006254347A (ja) * 2005-03-14 2006-09-21 Mitsubishi Electric Corp 画像符号化装置
JP2007300209A (ja) * 2006-04-27 2007-11-15 Pioneer Electronic Corp 動画像再符号化装置およびその動きベクトル判定方法
JP4760552B2 (ja) * 2006-06-06 2011-08-31 ソニー株式会社 動きベクトル復号化方法および復号化装置
JP4868539B2 (ja) * 2008-03-03 2012-02-01 Kddi株式会社 動画像符号化装置および復号装置

Also Published As

Publication number Publication date
JP2011223071A (ja) 2011-11-04

Similar Documents

Publication Publication Date Title
JP5277257B2 (ja) 動画像復号化方法および動画像符号化方法
JP2021022936A (ja) 画像予測方法および関連装置
JP2019115061A (ja) 符号化装置、符号化方法、復号装置、復号方法、及びプログラム
KR20110008653A (ko) 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법
JP2004336369A (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム
KR20090095012A (ko) 연속적인 움직임 추정을 이용한 영상 부호화, 복호화 방법및 장치
WO2011099468A1 (ja) 動きベクトル予測符号化方法,動きベクトル予測復号方法,動画像符号化装置,動画像復号装置およびそれらのプログラム
JP2009530960A (ja) 照明変化補償動き予測符号化および復号化方法とその装置
TW200952499A (en) Apparatus and method for computationally efficient intra prediction in a video coder
WO2011099428A1 (ja) 動きベクトル予測符号化方法、動きベクトル予測復号方法、動画像符号化装置、動画像復号装置およびそれらのプログラム
JP5613319B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
JP2010288098A (ja) 画像フレーム補間装置、画像フレーム補間方法及び画像フレーム補間プログラム
JP2013115583A (ja) 動画像符号化装置及びその制御方法並びにプログラム
JP2009049519A (ja) 動画像符号化装置の予測動きベクトル生成装置
JP5298060B2 (ja) 予測ベクトル生成器、符号化装置、復号装置、及びプログラム
JP2009290889A (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム
JP6390275B2 (ja) 符号化回路、符号化方法
JP5281597B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JP5281596B2 (ja) 動きベクトル予測方法,動きベクトル予測装置および動きベクトル予測プログラム
JP5442039B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
KR100859073B1 (ko) 움직임 추정 방법
JP2020053725A (ja) 予測画像補正装置、画像符号化装置、画像復号装置、及びプログラム
JP5913911B2 (ja) 画像符号化装置
JP5542636B2 (ja) イントラ予測装置、符号化器、復号器、及びプログラム
JP5705948B2 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130617

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees