JP5068265B2 - 動きベクトルの選択 - Google Patents

動きベクトルの選択 Download PDF

Info

Publication number
JP5068265B2
JP5068265B2 JP2008531167A JP2008531167A JP5068265B2 JP 5068265 B2 JP5068265 B2 JP 5068265B2 JP 2008531167 A JP2008531167 A JP 2008531167A JP 2008531167 A JP2008531167 A JP 2008531167A JP 5068265 B2 JP5068265 B2 JP 5068265B2
Authority
JP
Japan
Prior art keywords
rate
motion vector
input set
change
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008531167A
Other languages
English (en)
Other versions
JP2009509406A (ja
Inventor
ジェイムズ ジェイ キャリッグ
マルコ パニコーニ
ズーロン ミアオ
Original Assignee
ソニー エレクトロニクス インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー エレクトロニクス インク filed Critical ソニー エレクトロニクス インク
Publication of JP2009509406A publication Critical patent/JP2009509406A/ja
Application granted granted Critical
Publication of JP5068265B2 publication Critical patent/JP5068265B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/567Motion estimation based on rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、ビデオ圧縮の分野に関する。
動きベクトルは、1つ又はそれよりも多くの参照画像に対するターゲット画像(フレーム、フィールド、又はこれらの一部分とすることができる)の近似を容易にするために画像符号化において一般的に用いられる。この近似されたターゲット画像は、補償画像と呼ばれる。近似手順は、ターゲット画像を固定サイズのブロックへとタイル分割し、動きベクトルを各ブロックに割り当て、ターゲット画像内の各ブロックを参照画像上のぴったりとマッチングするブロックにマップする。次に、ターゲット画像の特定のブロック内の画素に対する値が、参照画像上のマップされたブロックから複写される。この近似処理に対する一般的な変形は、予測モードを追加すること、2つの同じサイズかつ位置のブロックの平均を取ること、及びタイルをより小さい領域に分割することを含む。
次に、所望のターゲット画像と補償画像の間の誤差を符号化する。符号器及びデコーダは、両方とも同じ参照画像へのアクセスを有すると仮定する。従って、動きベクトル及び残差誤差補償のみを用いて、変換のためのビデオ符号化を達成する。
性能の良いビデオコーダは、多くの要素の均衡を取り、限られたコンピュータリソースを用いて高品質のターゲット画像を生成する。これらの要素の全ての中でも、参照ブロックにマップする動きベクトルの集合の選択は、ビデオ品質に対して重要であり、多くのコンピュータリソースに関してコストがかかる。従来のビデオコーダは、利用可能なコンピュータリソースが限られているので、全体的に最適な動きベクトルの集合を選択することができない。
従って、限られた割込可能なコンピュータリソースを用いてターゲット画像を予測するための全体的に最適又はほぼ全体的に最適な動きベクトルの集合を選択する方法に対する必要性が存在する。
ベクトルを選択する方法は、動きベクトルの集合及び目標レートを受信する段階、及びレート−歪み基準を用いて動きベクトルの集合を修正する段階を含む。
本発明は、例示的に示しており、添付図面と共に以下の説明を参照することによってより良く理解することができる。
以下の説明では、説明の一部を形成し、本発明を実施することができる特定的な実施形態を例示的に示す添付図面を参照する。本発明の範囲から逸脱することなく、他の実施形態を利用することもでき、構造的変更を加えることができることは理解されるものとする。例えば、様々な実施形態を説明するために用いるフィールド、フレーム、又は画像という用語は、一般的にビデオデータに関して用いられるものと互換的であることを当業者は理解するであろう。
動きベクトル選択方法は、動きベクトルの既存の初期選択を修正し、指定ビットレートでのターゲット画像の改善された表現を導出する。いくつかの実施形態では、本方法は、解の近くで初期化することができ、レート制御は、いつでも修正することができ、かつ本方法は、いつでも割り込まれることができ、本方法を実時間ビデオ符号化のための構成要素として非常に適するものにする。
本方法は、限られた割込可能なリソースを用いることによってほぼ最適な選択を見出すものである。このタスクは、時空間参照画像の初期選択を用いて開始し、次に、この選択を迅速に修正して実行可能な選択を形成することによって達成される。次に、本方法は、演算が収束するか又は1つ又はそれよりも多くの他の停止基準に達するまでこの選択を改善し続ける。各修正された選択は、レート−歪みの改善をもたらし、所定レートに対して動きベクトルの選択をほぼ最適化する。
動きベクトル選択方法を実行するためのデバイスの例を図1に示す。動きベクトル選択デバイス110は、ターゲット画像115、参照プール120からの1つ又はそれよりも多くの参照画像の集合、動きベクトルの初期集合(空集合とすることができる)125、及び許容ビットレートRT又は許容効率ΔD/ΔRを示す制御信号130を受信し、ここでΔDは歪み変化である。
いくつかの実施形態で用いられる歪みの例は、補償画像上の画素とターゲット画像上の対応する画素の間の差の自乗和である。歪みの別の例は、ターゲット画像及び補償画像上の対応する画素間の差の絶対和である。
ΔRは、ビットレート変化である。いくつかの実施形態では、ビットレートは、各秒のビデオを符号化するのに要するビットの平均数である。目標レートは、アルゴリズムが達成しようとするレートである。現在のレートは、動きベクトルの現在の選択を符号化するのに要するビデオの1秒当たりのビット数である。レート差(rate variance)は、目標レートに加えられるレートであり、現在のレートに対する繰返しの許容限度を定める。
動きベクトル候補判断デバイス135は、形状定義ライブラリ140を用いて動きベクトルの出力集合を選択する。制御信号130によって設定される許容パラメータの範囲内でターゲット画像115を近似する補償画像145が形成されるように、この動きベクトルの出力集合を参照画像に適用する。次に、動きベクトルの出力集合150は、ビデオ圧縮及び伝送処理の一部として符号化することができる。
形状定義ライブラリ140内の各形状定義は、動きベクトルによって補償される画素の集合を指す。例えば、図2は、参照ブロックを構成するための2つの形状定義を示す。形状定義210は、M×N画素のターゲット画像を16画素×16画素の重なりのないブロックの集合へとタイル分割する。例えば、ブロック211は、16×16画素のブロックである。各ブロックは、動きベクトル(示していない)によって表される。固有の動きベクトルIDを用いて、形状定義内の特定のブロックを識別する。この例では、動きベクトルIDは、1から(M×N)/(16×16)までの範囲に及ぶ。別の例として、形状定義220は、ターゲット画像を4×4画素のブロックにタイル分割する。例えば、ブロック221は、4×4画素のブロックである。形状定義220における動きベクトルIDは、1から(M×N)/(4×4)までの範囲に及ぶ。同様に、固有の形状IDを用いて、各形状定義を識別する。固有の形状ID及び固有の動きベクトルIDを用いて、複数の形状定義内の特定のブロックを一意的に判断する。形状210及び220は、ビデオ符号化において一般的に用いられる形状を例示する。
図3は、形状定義ライブラリ140のいくつかの実施形態で一緒に用いられる形状定義の例を示す。これらの例では、形状定義は、16画素×16画素のブロックに基づいている。一部の形状定義は、重なりブロックのようなより複雑な相互作用を可能にするオフセットを有する。例示的形状定義310は、M×N画素のターゲット画像を16×16画素のブロックへとタイル分割し、1という形状IDを有し、1から(M×N)/(16×16)までの範囲に及ぶ動きベクトルIDを有する。形状定義320は、M×N画素のターゲット画像を16×16ブロックへとタイル分割し、画像の上及び下の境界に沿って縦に8画素のオフセット321及び322を有する。例示的形状定義320の形状IDは2であり、動きベクトルIDは、1から(M−1)×N)/(16×16)までの範囲に及ぶ。例示的形状定義330は、M×N画素のターゲット画像を16×16ブロックへとタイル分割し、画像の右及び左の境界に沿って横に8画素のオフセット331及び332を有する。形状定義330に対する形状IDは3であり、動きベクトルIDは、1から(M×(N−1)/(16×16)までの範囲に及ぶ。例示的形状定義340は、M×N画素のターゲット画像を16×16ブロックへとタイル分割し、縦に8画素のオフセット341、342、及び横に8画素のオフセット343、344を有する。形状定義340に対する形状IDは4であり、動きベクトルIDは、1から((M−1)×(N−1))/(16×16))までの範囲に及ぶ。形状IDと動きベクトルIDとの組合せを用いることによって、形状定義310、320、330、及び340から特定のブロックが一意的に識別される。
ライブラリ140(図1に示す)内の形状定義によるターゲット画像415内のターゲットブロック410は、例えば図4に示すように、動きベクトルの出力選択からの動きベクトル430を用いて参照画像425内の対応する参照ブロック420の位置にマップされる。動きベクトル430は、ターゲットブロック410に対する参照ブロック420の縦横のオフセットΔy及びΔxによって表される動きの量を示す。一実施形態では、完全に特定された動きベクトルは、形状ID、動きベクトルID、参照画像ID、及び縦横のオフセットを含む。動きベクトルを符号化システムの一部として求める時には、参照画像は、元の入力画像又はそれらの復号された対応画像のいずれでもよい。
参照ブロックを動きベクトルによって特定した後に、参照ブロックからの画素値を対応するターゲットブロックに複写する。次に、ターゲットブロックを参照ブロックにマップする動きベクトルの出力選択を用い、更に、画素値をターゲットブロックに複写することによって、補償ターゲット画像を生成する。補償画像は、ターゲット画像を近似するために一般的に用いられる。補償画像をビデオ復号システムの一部として構成する時には、参照画像は、一般的に前に復号された画像である。
いくつかの場合では、ターゲット画像内の一部の画素は、複数のターゲットブロックの一部であり、1つよりも多くの参照ブロックにマップされて、図5に示すようにターゲットブロックの重なり領域を形成する。これらの場合には、補償画像515の重なり領域510内の各補償画素の値は、それぞれ、参照画像525及び535内の参照ブロック520及び530からの画素値の平均を取ることによって求められる。代替的に、重み付き平均又はフィルタリングによる推定を用いることができる。また、いくつかの場合では、ターゲット画像内のいくつかの画素は、ターゲットブロックの一部ではなく、どの参照ブロックにもマップされない。これらの画素は、デフォルト値(0のような)、補間値、前に保持していた値、又は別の特殊な規則を用いることができる。
再度図1を参照すると、動きベクトル選択デバイス110は、次に、形状定義ライブラリ140から動きベクトルの一部を選択し、動きベクトルの一部を廃棄する。次に、動きベクトルの出力集合150内の動きベクトル、これらの動きベクトルが参照プール120から参照する画像、及び形状定義ライブラリ140からのブロック形状定義を用いて、補償ターゲット画像145を構成する。動きベクトル候補判断デバイス135は、1つ又はそれよりも多くの動きベクトルを動きベクトルの出力集合150に追加すべきか否か、又はそこから除去すべきか否かを判断する。この判断は、ほぼ最適なレート−歪み基準に従って実行される。
動きベクトル選択方法の例を図6に示す。610では、初期値(動きベクトルの初期集合のような)、目標レート、レート差、ターゲット画像、及び参照画像を受信する。レート差の例は、目標レートに加えられる、レートのオーバーシュート及びアンダーシュートの量である。レート差が大きい程、より大きな変更を集合に加えるが、目標レートに戻るのにより長い時間を消費する。620では、レート推定値R及び歪み推定値Dを計算する。630では、レート推定値Rが目標RTよりも小さい場合には、640においてレートRが目標レートRTを量RSだけ超えるまで1つ又はそれよりも多くの動きベクトルを追加する。いくつかの実施形態では、640において時間制限が満了するまで動きベクトルを追加する。Rが、630において目標レートRTよりも小さくない場合、又は640において目標レートRTを量RSだけ超える場合には、650においてRTとRSの間の差がレート推定値Rよりも大きいか又はそれに等しくなるまで1つ又はそれよりも多くの動きベクトルを除去する。いくつかの実施形態では、650において、時間制限が満了するまで動きベクトルを除去する。いくつかの実施形態では、660において、方法は、時間制限が満了したか否かを判断する。満了している場合には、方法は670で終了する。そうでない場合には、方法は640に戻る。
図6に示す動きベクトル選択方法は、図7のグラフ710で示すように、目標レート(又は、いくつかの実施形態では目標効率)に達するまで動きベクトルを追加又は除去する。このベクトル選択を達成した後に、現在の推定レートは、グラフ720に示されるようにより低い歪み度を得る動作点を探しながら、目標レートの付近で上下する。710及び720における円は、目標レートに合致した時のレート及び歪み度を示す。歪み低減率は、最終的に飽和し、本方法がパフォーマンスの著しい損失なしに終了することを可能にする。
動きベクトル候補の集合に動きベクトルを追加するか又はそこから除去する影響の例を示すグラフを図8に示す。レート推定値R及び歪み推定値Dの動作点で始まると、方法は、動きベクトルを追加又は除去するオプションを有する。レートは、動きベクトルを追加することによってレートが1単位だけ上昇し、かつ動きベクトルを除去することによってレートが1単位だけ減少するように動きベクトル数に直接比例するものとしてモデル化することができる。本方法は、最も大きな歪み低減に対応する追加又は削除アクションを選択する。図8の各矢印は、動きベクトルに対応し、レート及び歪みに対する動きベクトルの影響を示す。
例えば、矢印802、804、806、及び808は、集合150からの1つの動きベクトルを除去する影響を示している。矢印808に対応する動きベクトルを除去することによって、最大の画像歪み増加が生じる。矢印802に対応する動きベクトルを除去することによって、最小の歪み増加が生じる。4つの全ての場合に、動きベクトルを除去することによって1単位だけレートが低下し、補償画像の歪みが増加する。動きベクトルを除去することによって歪みを低減することができるが、この結果は比較的まれである。
矢印810、812、814、816、818、及び820は、集合150に動きベクトルを追加する影響を示している。各場合に、動きベクトルを追加することによってレートは1単位だけ上昇する。いくつかの場合では、動きベクトルを追加することによって歪みも増加する。例えば、矢印820は、対応する動きベクトルを集合850に追加することによって、レートが上昇するだけでなく、歪みも増加することになることを示している。他の場合には、例えば、矢印814によって示されるように、動きベクトルの追加は、歪みに対して何の影響も与えない。追加の動きベクトルが補償画像の歪み量を低減する場合には、動きベクトルを集合に追加することは効率的である。矢印810及び812は、集合に追加された場合に歪みを低減する動きベクトルに対応している。
動きベクトルの集合150に動きベクトルを追加するか又はそこから除去する影響を示す表を図9に示す。この例では、現在集合内に存在する動きベクトルを除去することができ、現在集合内に存在しない動きベクトルを追加することができる。符号化レートを低減しようとする場合には、動きベクトル選択方法は、集合から除去された時に最小の歪み増加を生じさせる動きベクトルを特定する。例えば、本方法は、図9の「除去された場合」列からの最小値を有する動きベクトルを除去する。同様に、符号化レートを上昇させようとする場合には、本方法は、最大の歪み減少を生じさせる動きベクトルを追加する。例えば、本方法は、「追加した場合」列からの最も小さな負の値を有する動きベクトルを追加する。
一般的に、本方法では、レート変更が±1に制限されない場合を考慮することができる。この状況は、より精巧なレート推定法を用いる場合又は動きベクトル選択へのいくつかの同時変更を可能にする場合に起こり得る。この一般的な場合には、様々な判断候補を適用する影響は、動作点を(R、D)から図10に示す矢印によって示されるものに移動する。複数の動きベクトルがこの基準を満たす場合には、これらの動きベクトルのうちの1つを選択する。そうでない場合には、考慮されており、かつ最小を有する動きベクトルを選択する。
例えば、矢印1010は、動きベクトルを除去することによる歪み増加を示している。矢印1020は、異なる動きベクトルを除去することによる大きな歪み増加を示している。従って、レートを低減するために動きベクトルを除去すべき場合には、歪み増加が最小限に止まるので、矢印1010に対応する動きベクトルは、より良好な選択である。同様に、矢印1030、1040、1050、及び1060は、動きベクトルを追加する影響を示している。矢印1030及び1040に対応する動きベクトルは、レートを上昇させ、かつ歪みを増加するので、これらの動きベクトルは追加しない。矢印1050及び1060に対応する動きベクトルは、歪みを低減する。これらの中では、より大きな歪み低減を生じるので、1060は、より良好な選択である。
一般的な場合における表を図11に示す。この表は、図9の表からの2つの独立した変更を示す。第1に、動きベクトルを1回よりも多く適用することができ、それによってマップ値の平均である補償値が変更される。第2に、動きベクトルを複数回適用する場合に、レートのモデル化は、単純に動きベクトルを計数するよりも複雑である。従って、「適用回数」を表に追加している。更に、歪みへの影響よりはむしろ、動きベクトルの追加又は除去のΔD/ARによって評価される効率に対する影響が考えられている。
図12は、図6の640に例示する動きベクトルを追加する方法の例を示す。1210では、最良の動きベクトル候補を動きベクトルの集合への潜在的追加物として選択する。動きベクトル候補の集合にΔR、ΔDが0よりも小さい動きベクトルが存在する場合、最良の候補はそのようなベクトルである。そうでない場合には、最良の候補は、ΔD/ΔRの最小値を有する動きベクトルである。次に、1220では、方法は、最良の動きベクトル候補を追加することによって補償画像の歪みが減少するか否かを判断する。減少しなければ、方法は終了する。減少すれば、最良の動きベクトル候補を集合150に仮に追加する。1240では、レート及び歪みの値を更新する。1260では、候補テーブルを更新する。次に、1270では、方法は、現在の推定レートRが、目標レートRTの許容範囲にあるか否かを判断する。許容範囲にある場合には、1280において最良の動きベクトル候補を集合に永続的に追加する。1290では、レートRが目標レートRTを量RSだけ上回った場合に、動きベクトルを追加する方法は、図6の動きベクトル選択方法におけるブロック650に戻ることによって終了する。そうでない場合には、動きベクトルを追加する方法は1210に戻る。
図13は、図6の650に例示する動きベクトルを除去する方法の例である。1310では、方法は、動きベクトルの集合150内に動きベクトルが存在しないかを判断する。動きベクトルが存在しない場合には、方法は終了する。そうでない場合には、1320において最良の動きベクトル候補を選択する。集合150から除去された場合に歪みを低減する動きベクトルが存在する場合には、そのようなベクトルを最良の候補として選択する。そうでない場合には、最小のΔD/ΔRを有する動きベクトルを除去のための最良の候補として選択する。1330では、最良の候補を動きベクトルの集合から仮に除去する。1340では、レートR及び歪みDの値を更新する。1360では、候補テーブルを更新する。次に、1370では、方法は、レートRが目標レートRTの許容範囲にあるかを判断する。許容範囲にある場合には、1380において動きベクトル候補を集合150から永続的に除去する。1390では、レートRが目標レートRTよりも量RSだけ小さい場合に、動きベクトルを除去する方法は、図6の動きベクトル選択方法におけるブロック660に戻ることによって終了する。そうでない場合には、動きベクトルを除去する方法は1310に戻る。
一実施形態では、動きベクトル選択方法は、図14に示すようにビデオデータの画像(又はフレーム、又はフィールド)を符号化するためのビデオ符号化で用いられる。1410では、符号器は、入力ターゲット画像を受信する。ターゲット画像に関連する復号された画像データを含む参照画像の集合は、符号化処理中に符号器に対して利用可能であり、また、復号処理中にはデコーダに対しても利用可能である。1420では、符号器は、ターゲット画像に関連する動きベクトルの不規則なサンプリング又は割当て(distribution)を生成する。1430では、サンプリングパターン情報(例えば、パターンを表すビット)をデコーダに伝送する。図6に示す方法は、適応サンプリングパターンを生成するために用いることができる。
1440では、時間予測フィルタリング処理を不規則な動きサンプリングパターンに適用する。この適応フィルタリング処理は、動きベクトル、不規則なサンプリングパターン、及び参照画像を用いてターゲット画像の予測を生成する。1450では、動きベクトル値を符号化し、デコーダに送信する。1460では、ターゲット画像の実際のターゲットデータから、適応フィルタリング処理による予測誤差を差し引いた残差を生成する。1470では、この残差を符号化し、1480においてデコーダに送信する。
別の実施形態では、動きベクトルの適応サンプリングパターンは、図15に示すようにビデオデータの画像(又はフレーム、又は画像)を復号するのに用いられる。1510では、符号化済み残差を受信する。1520では、デコーダは、受信した符号化済み残差を復号する。1530では、デコーダは、サンプリングパターン情報、参照画像、及び動きベクトル値を受信する。次に、1540において、デコーダは、適応時間フィルタリング手順を適用して時間予測を生成する。1550では、復号済み残差を時間予測に加えることによって、復号されたターゲット画像を生成する。
図16は、適応影響領域フィルタを用いるシステムの例を示す。デジタルビデオカメラ1610は、電子形式で画像を取り込み、圧縮及び符号化処理中に動きベクトル選択方法を用いる圧縮デバイス1620を用いて画像を処理する。符号化された画像は、電子伝送媒体1630を通じてデジタル再生デバイス1640に送信される。画像は、復号処理中にこのフィルタを用いる復号デバイス1650によって復号される。カメラ1610は、本発明の実施形態を含む様々な画像処理装置(例えば、他の画像取り込みデバイス、画像エディタ、画像処理プロセッサ、パーソナル及び市販のコンピュータプラットフォーム等)を示している。同様に、復号デバイス1650は、画像データを復号する様々なデバイスを示している。
本発明を特定のシステム環境における実施形態に関して説明したが、本発明は、添付の特許請求の範囲の精神及び範囲内の他の異なるハードウエア及びソフトウエア環境において修正を伴って実施することができることを当業者は認識するであろう。
動きベクトル選択方法を実行するためのデバイスの例を示す図である。 図1に示す形状定義ライブラリ140のいくつかの実施形態で用いられる形状定義の例の集合を示す図である。 図1に示す形状定義ライブラリ140のいくつかの実施形態で用いられる形状定義例の別の集合を示す図である。 動きベクトルの出力選択からの動きベクトルを用いて参照画像内の参照ブロックにマップされるターゲットブロックの例を示す図である。 複数の参照ブロックにマップされるターゲット画像内の画素の例を示す図である。 動きベクトル選択方法の例を示す図である。 図6の方法の複数の反復によりもたらされるターゲット画像の歪み低減のグラフである。 図6の方法を用いて特定の動きベクトルを追加又は除去する結果生じるレート及び歪みの相対変化を示す図である。 動きベクトルを動きベクトルの選択に追加又はそこから除去する影響を示す表である。 1つ又はそれよりも多くの動きベクトルを追加又は除去する結果生じるレート及び歪みの相対変化を示す図である。 1つ又はそれよりも多くの動きベクトルを追加又は除去する影響を示す表である。 図6の方法によって用いられる動きベクトルを追加する方法の例を示す図である。 図6の方法によって用いられる動きベクトルを除去する方法の例を示す図である。 図6の方法を用いてビデオデータの画像を符号化する方法の例を示す図である。 画像を復号する方法の例を示す図である。 動きベクトル選択方法を用いるビデオシステムの例を示す図である。

Claims (9)

  1. 電子データ処理装置によって実行される方法であって、
    ターゲット画像、当該ターゲット画像についての動きベクトルの入力集合、複数の参照画像、及び、目標レート、レート差を受信する段階と、
    前記ターゲット画像を形状定義に基づいて複数のブロックに分割する段階と、
    を含み、
    各ブロックは、前記形状定義によって特定される動きベクトルで表され、
    方法は、さらに、
    前記ターゲット画像におけるブロックに対応する前記複数の参照画像におけるブロックを、前記形状定義の前記動きベクトルを用いて識別する段階と、
    前記ターゲット画像と前記識別されたブロックから生成される補償ターゲット画像との間の画像歪みを計算する段階と、
    前記動きベクトルの入力集合を符号化するためのレートを計算する段階と、
    停止基準に到達するまでレート−歪み基準に基づいて前記動きベクトルの入力集合を修正することによって、動きベクトルの出力集合を生成する段階と、
    を含み、
    前記入力集合の修正の結果として、前記画像歪みの低減又は歪みの増加の最小化が前記レート−歪み基準によって特定され、
    前記入力集合の修正は、さらに、
    前記レートが前記目標レートより小さい場合、当該レートが、当該前記目標レートに前記レート差を加えた値より大きい又は等しくなるまで、前記形状定義の動きベクトルを前記入力集合に加える段階と、
    前記レートが前記目標レートより大きい場合、当該レートが、当該前記目標レートから前記レート差を差し引いた値より小さい又は等しくなるまで、前記入力集合から動きベクトルを除去する段階と、
    を有することを特徴とする方法。
  2. 前記動きベクトルを除去する段階は、
    前記入力集合の各動きベクトルに対して、該入力集合から該動きベクトルを除去することによって生じる画像歪みの変化を求め、該入力集合から該動きベクトルを除去することによって生じるレートの変化を求め、かつ該画像歪みの変化と該レートの変化との比を求める段階と、
    動きベクトルの除去が前記比の最小変化を生じさせる場合、動きベクトルを除去する段階と、
    を含むことを特徴とする請求項1に記載の方法。
  3. 前記動きベクトルを加える段階は、
    前記入力集合の各動きベクトルに対して、該入力集合に該動きベクトルを追加することによって生じる画像歪みの変化を求め、該入力集合に該動きベクトルを追加することによって生じるレートの変化を求め、かつ該画像歪みの変化と該レートの変化との比を求める段階と、
    動きベクトルの追加が前記比の最小変化を生じさせるよう、前記形状定義の動きベクトルを追加する段階と、
    を含むことを特徴とする請求項1に記載の方法。
  4. ターゲット画像、当該ターゲット画像についての動きベクトルの入力集合、複数の参照画像、及び、目標レート、レート差を受信する動きベクトル選択デバイスと、
    前記ターゲット画像を形状定義に基づいて複数のブロックに分割する形状定義動きベクトル判断デバイスと、
    を備え、
    各ブロックは、当該形状定義によって特定される動きベクトルで表され、
    前記形状定義動きベクトル判断デバイスは、さらに、
    前記ターゲット画像におけるブロックに対応する前記複数の参照画像におけるブロックを、前記形状定義の前記動きベクトルを用いて識別し、
    前記ターゲット画像と前記識別されたブロックから生成される補償ターゲット画像との間の画像歪みを計算し、
    前記動きベクトルの入力集合を符号化するためのレートを計算し、
    停止基準に到達するまでレート−歪み基準に基づいて前記動きベクトルの入力集合を修正することによって、動きベクトルの出力集合を生成し、
    前記入力集合の修正の結果として、前記画像歪みの低減又は歪みの増加の最小化が前記レート−歪み基準によって特定されることを特徴としており、
    前記修正によって、
    前記レートが前記目標レートより小さい場合、当該レートが、当該前記目標レートに前記レート差を加えた値より大きい又は等しくなるまで、前記形状定義の動きベクトルが、前記入力集合に加えられ、
    前記レートが前記目標レートより大きい場合、当該レートが、当該前記目標レートから前記レート差を差し引いた値より小さい又は等しくなるまで、前記入力集合から動きベクトルが除去されることを特徴とする装置。
  5. 前記動きベクトルの除去によって
    前記入力集合の各動きベクトルに対して、該入力集合から該動きベクトルを除去することによって生じる画像歪みの変化求められ、該入力集合から該動きベクトルを除去することによって生じるレートの変化求められ、かつ該画像歪みの変化と該レートの変化との比求められ
    前記動きベクトルの除去が前記比の最小変化を生じさせる場合、動きベクトルが除去されることを特徴とする請求項に記載の装置。
  6. 前記動きベクトルの追加によって
    前記入力集合の各動きベクトルに対して、該入力集合に該動きベクトルを追加することによって生じる画像歪みの変化求められ、該入力集合に該動きベクトルを追加することによって生じるレートの変化求められ、かつ該画像歪みの変化と該レートの変化との比求められ、かつ
    動きベクトルの追加が前記比の最小変化を生じさせるよう、前記形状定義の動きベクトル追加されることを特徴とする請求項に記載の装置。
  7. 処理システム実行時に、該システムに方法を実行させる命令のコンピュータプログラムを記憶するコンピュータ読み取り可能な記録媒体であって、該方法は、
    ターゲット画像、当該ターゲット画像についての動きベクトルの入力集合、複数の参照画像、及び、目標レート、レート差を受信する段階と、
    前記ターゲット画像を形状定義に基づいて複数のブロックに分割する段階と、
    を含み、
    各ブロックは、前記形状定義によって特定される動きベクトルで表され、
    方法は、さらに、
    前記ターゲット画像におけるブロックに対応する前記複数の参照画像におけるブロックを、前記形状定義の前記動きベクトルを用いて識別する段階と、
    前記ターゲット画像と前記識別されたブロックから生成される補償ターゲット画像との間の画像歪みを計算する段階と、
    前記動きベクトルの入力集合を符号化するためのレートを計算する段階と、
    停止基準に到達するまでレート−歪み基準に基づいて前記動きベクトルの入力集合を修正することによって、動きベクトルの出力集合を生成する段階と、
    を含み、
    前記入力集合の修正の結果として、前記画像歪みの低減又は歪みの増加の最小化が前記レート−歪み基準によって特定され、
    前記入力集合の修正は、さらに、
    前記レートが前記目標レートより小さい場合、当該レートが、当該前記目標レートに前記レート差を加えた値より大きい又は等しくなるまで、前記形状定義の動きベクトルを前記入力集合に加える段階と、
    前記レートが前記目標レートより大きい場合、当該レートが、当該前記目標レートから前記レート差を差し引いた値より小さい又は等しくなるまで、前記入力集合から動きベクトルを除去する段階と、
    を有する方法を前記処理システムに実行させる命令のコンピュータプログラムを記憶する記録媒体。
  8. 前記動きベクトルを除去する段階は、
    前記入力集合の各動きベクトルに対して、該入力集合から該動きベクトルを除去することによって生じる画像歪みの変化を求め、該入力集合から該動きベクトルを除去することによって生じるレートの変化を求め、かつ該画像歪みの変化と該レートの変化との比を求める段階と、
    動きベクトルの除去が前記比の最小変化を生じさせる場合、動きベクトルを除去する段階と、
    を含むことを特徴とする請求項に記載のコンピュータ読み取り可能な記録媒体。
  9. 前記動きベクトルを加える段階は、
    前記入力集合の各動きベクトルに対して、該入力集合に該動きベクトルを追加することによって生じる画像歪みの変化を求め、該入力集合に該動きベクトルを追加することによって生じるレートの変化を求め、かつ該画像歪みの変化と該レートの変化との比を求める段階と、
    動きベクトルの追加が前記比の最小変化を生じさせるよう、前記形状定義の動きベクトルを追加する段階と、
    を含むことを特徴とする請求項に記載のコンピュータ読み取り可能な記録媒体。
JP2008531167A 2005-09-16 2006-09-01 動きベクトルの選択 Expired - Fee Related JP5068265B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/228,919 2005-09-16
US11/228,919 US20070064805A1 (en) 2005-09-16 2005-09-16 Motion vector selection
PCT/US2006/034403 WO2007035238A2 (en) 2005-09-16 2006-09-01 Motion vector selection

Publications (2)

Publication Number Publication Date
JP2009509406A JP2009509406A (ja) 2009-03-05
JP5068265B2 true JP5068265B2 (ja) 2012-11-07

Family

ID=37884050

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008531167A Expired - Fee Related JP5068265B2 (ja) 2005-09-16 2006-09-01 動きベクトルの選択

Country Status (6)

Country Link
US (1) US20070064805A1 (ja)
EP (1) EP1925165B1 (ja)
JP (1) JP5068265B2 (ja)
KR (1) KR101339566B1 (ja)
CN (1) CN101627626A (ja)
WO (1) WO2007035238A2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7974193B2 (en) 2005-04-08 2011-07-05 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
US8787460B1 (en) * 2005-07-28 2014-07-22 Teradici Corporation Method and apparatus for motion vector estimation for an image sequence
US8582905B2 (en) 2006-01-31 2013-11-12 Qualcomm Incorporated Methods and systems for rate control within an encoding device
US8213509B2 (en) * 2006-10-06 2012-07-03 Calos Fund Limited Liability Company Video coding on parallel processing systems
TWI327866B (en) * 2006-12-27 2010-07-21 Realtek Semiconductor Corp Apparatus and related method for decoding video blocks in video pictures
WO2010136547A1 (en) * 2009-05-27 2010-12-02 Canon Kabushiki Kaisha Method and device for processing a digital signal
US9036692B2 (en) * 2010-01-18 2015-05-19 Mediatek Inc. Motion prediction method
MX2012012246A (es) * 2010-04-22 2012-12-17 Mediatek Inc Metodo de prediccion de movimiento.
GB2487200A (en) 2011-01-12 2012-07-18 Canon Kk Video encoding and decoding with improved error resilience
US20130301734A1 (en) * 2011-01-12 2013-11-14 Canon Kabushiki Kaisha Video encoding and decoding with low complexity
GB2493212B (en) * 2011-07-29 2015-03-11 Canon Kk Method and device for error concealment in motion estimation of video data
US9626733B2 (en) * 2014-11-24 2017-04-18 Industrial Technology Research Institute Data-processing apparatus and operation method thereof
US9704598B2 (en) * 2014-12-27 2017-07-11 Intel Corporation Use of in-field programmable fuses in the PCH dye
RU2015111633A (ru) * 2015-03-31 2016-10-20 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для обработки показателей активности, связанных с пользователем, способ и система связывания первого элемента и второго элемента
WO2017191750A1 (ja) * 2016-05-02 2017-11-09 ソニー株式会社 符号化装置及び符号化方法、並びに、復号装置及び復号方法

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3877105D1 (ja) * 1987-09-30 1993-02-11 Siemens Ag, 8000 Muenchen, De
US5690934A (en) * 1987-12-31 1997-11-25 Tanox Biosystems, Inc. Peptides relating to the extracellular membrane-bound segment of human alpha chain
US5047850A (en) * 1989-03-03 1991-09-10 Matsushita Electric Industrial Co., Ltd. Detector for detecting vector indicating motion of image
JPH06105299A (ja) * 1992-09-22 1994-04-15 Casio Comput Co Ltd 動画像圧縮装置
US5398069A (en) * 1993-03-26 1995-03-14 Scientific Atlanta Adaptive multi-stage vector quantization
US5872599A (en) * 1995-03-08 1999-02-16 Lucent Technologies Inc. Method and apparatus for selectively discarding data when required in order to achieve a desired Huffman coding rate
US5872866A (en) * 1995-04-18 1999-02-16 Advanced Micro Devices, Inc. Method and apparatus for improved video decompression by predetermination of IDCT results based on image characteristics
US5654771A (en) * 1995-05-23 1997-08-05 The University Of Rochester Video compression system using a dense motion vector field and a triangular patch mesh overlay model
GB9519923D0 (en) * 1995-09-29 1995-11-29 Philips Electronics Nv Motion estimation for predictive image coding
WO1997040628A1 (en) * 1996-04-19 1997-10-30 Nokia Mobile Phones Limited Video encoder and decoder using motion-based segmentation and merging
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
JP3967405B2 (ja) * 1996-10-09 2007-08-29 テキサス インスツルメンツ インコーポレイテツド 画像信号の符号化方法
JP4034380B2 (ja) * 1996-10-31 2008-01-16 株式会社東芝 画像符号化/復号化方法及び装置
DE19648016A1 (de) * 1996-11-20 1998-05-28 Philips Patentverwaltung Verfahren zur fraktalen Bildkodierung und Anordnung zur Durchführung des Verfahrens
EP1511325A3 (en) * 1997-02-13 2006-07-19 Mitsubishi Denki Kabushiki Kaisha Moving picture prediction system
US6178205B1 (en) * 1997-12-12 2001-01-23 Vtel Corporation Video postfiltering with motion-compensated temporal filtering and/or spatial-adaptive filtering
JPH11243551A (ja) * 1997-12-25 1999-09-07 Mitsubishi Electric Corp 動き補償装置と動画像符号化装置及び方法
US6208692B1 (en) * 1997-12-31 2001-03-27 Sarnoff Corporation Apparatus and method for performing scalable hierarchical motion estimation
US6591015B1 (en) * 1998-07-29 2003-07-08 Matsushita Electric Industrial Co., Ltd. Video coding method and apparatus with motion compensation and motion vector estimator
US6466624B1 (en) * 1998-10-28 2002-10-15 Pixonics, Llc Video decoder with bit stream based enhancements
JP2000308064A (ja) * 1999-04-22 2000-11-02 Mitsubishi Electric Corp 動きベクトル検出装置
US6480615B1 (en) * 1999-06-15 2002-11-12 University Of Washington Motion estimation within a sequence of data frames using optical flow with adaptive gradients
JP3753578B2 (ja) * 1999-12-07 2006-03-08 Necエレクトロニクス株式会社 動きベクトル探索装置および方法
US6864994B1 (en) * 2000-01-19 2005-03-08 Xerox Corporation High-speed, high-quality descreening system and method
US6782054B2 (en) * 2001-04-20 2004-08-24 Koninklijke Philips Electronics, N.V. Method and apparatus for motion vector estimation
US6909748B2 (en) * 2001-12-20 2005-06-21 Sorenson Media, Inc. Method and system for image compression using block size heuristics
AU2003246987A1 (en) * 2002-07-09 2004-01-23 Nokia Corporation Method and system for selecting interpolation filter type in video coding
US7068722B2 (en) * 2002-09-25 2006-06-27 Lsi Logic Corporation Content adaptive video processor using motion compensation
JP3997171B2 (ja) * 2003-03-27 2007-10-24 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
US7480334B2 (en) * 2003-12-23 2009-01-20 Genesis Microchip Inc. Temporal motion vector filtering

Also Published As

Publication number Publication date
WO2007035238A2 (en) 2007-03-29
JP2009509406A (ja) 2009-03-05
KR20080054400A (ko) 2008-06-17
KR101339566B1 (ko) 2013-12-10
EP1925165A2 (en) 2008-05-28
CN101627626A (zh) 2010-01-13
EP1925165B1 (en) 2018-11-07
EP1925165A4 (en) 2011-03-09
WO2007035238A3 (en) 2009-09-11
US20070064805A1 (en) 2007-03-22

Similar Documents

Publication Publication Date Title
JP5068265B2 (ja) 動きベクトルの選択
CN114363612B (zh) 用于双向光流的比特宽度控制的方法和设备
US7805016B2 (en) Decoding apparatus and decoding method
US8165205B2 (en) Natural shaped regions for motion compensation
JP7199598B2 (ja) Profの方法、コンピューティングデバイス、コンピュータ可読記憶媒体、およびプログラム
KR102162856B1 (ko) 비디오 모션 보상을 위한 장치 및 방법
JP7305883B2 (ja) Prof(prediction refinement with optical flow)の方法および装置
US10349071B2 (en) Motion vector searching apparatus, motion vector searching method, and storage medium storing motion vector searching program
JP2023159292A (ja) オプティカルフローによる予測洗練化における方法および装置
CN113994692A (zh) 用于利用光流的预测细化的方法和装置
JP2020150313A (ja) 画像復号装置、画像復号方法及びプログラム
EP3963887A1 (en) Methods and apparatus of prediction refinement with optical flow
JP2023100979A (ja) オプティカルフローによる予測洗練化、双方向オプティカルフローおよびデコーダ側の動きベクトル洗練化のための方法および装置
CN116684637B (zh) 对视频数据编码的利用光流的预测细化方法、设备和介质
JP2008066911A (ja) 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
EA043315B1 (ru) Декодирование потоков битов

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090814

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110704

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111004

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111012

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120806

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120814

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150824

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees