JP2011508536A - 適応性動き推定 - Google Patents
適応性動き推定 Download PDFInfo
- Publication number
- JP2011508536A JP2011508536A JP2010539902A JP2010539902A JP2011508536A JP 2011508536 A JP2011508536 A JP 2011508536A JP 2010539902 A JP2010539902 A JP 2010539902A JP 2010539902 A JP2010539902 A JP 2010539902A JP 2011508536 A JP2011508536 A JP 2011508536A
- Authority
- JP
- Japan
- Prior art keywords
- distance function
- error distance
- motion estimation
- error
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Systems (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】
【選択図】図1
Description
本出願は、2007年12月19日に申請された出願番号61/015148号で、発明の名称が「適応性動き推定」である米国の仮出願についての優先権の利益を請求する。当該明細書の情報は参照によって組み込まれる。
動き推定は、基準画像の1つ以上の部分が平行移動されたコピーの面から、画像をモデル化するための技術として説明される。動き推定はそれ自身、見る価値のある画質のビデオや画像データを生成する画像シーケンスのモデルに基づく。例えば、オブジェクトの画像が1つのフレームから次のフレームに変化し又は移動した場合、動き推定は平滑な画像遷移を生むために使用される。
ある動き推定技術はブロック整合技術(block matching technique)のような「整合」方法を含んでいる。これらの整合法に関しては、動き領域の平滑さの制約は、ある区域上で動き用のパラメトリックモデルを実行することで加えられる。この区域は、ブロック整合技術のブロック又は長方形区域、或いはより一般的には、画像の任意形状領域又はセグメントである。このパラメトリックモデルはより一般的に用いられるが、このモデルは最も普通には単純な変位である。このようなブロック整合技術は、しばしば一様な変位の技術と呼ばれるもので、目標画像中の固定位置ブロックと基準画像中の可変位置ブロックとの間の予測誤差関数の和は、目標画像の各ブロックに対して最小化される。
と呼ばれ、基準画像100は
と呼ばれる。ここでは、
と
の水平および鉛直成分は、整数値を有する。目標画像150の各ブロックbは、目標画像のブロックに関する全誤差Eを最小化するように、目標画像150に関係している変位ベクトル
を有する。一般に、全誤差Eは、各ピクセルで予測誤差又は動き補償誤差に適用されるある誤差距離関数F()の総和を指す。全誤差Eは以下のように表現される:
は以下のように表現される:
図2Aは、濃度又はパーピクセル動き推定技術の基準画像の具体例を示す図である。また、図2Bは、濃度又はパーピクセル動き推定技術の目標画像の具体例を示す図である。濃度動きモデルは、ブロックに基づいたモデルの空間制約を緩めることができる。これらの濃度動き推定(またはパーピクセル動き推定)は画像勾配に由来するもので、ブロックに基づいた/一様変位の技術と類似している。例えば、図2Bで示されるように、目標画像250に各ピクセルの動き推定が存在する。
は、変位領域とか、動きベクトル場と呼ぶことができる(つまり、それはベクトル場である)。そのようなピクセルごとの変位は、しばしば濃度動き推定と呼ばれる。この例において、動き予測誤差
は下記のように表現できる:
は、基準画像200のオブジェクト210’のポイント
の一般的な関数となることを可能にする。濃度動きモデルがブロックに基づいたモデルの空間の制約を緩めることができるので、濃度動きモデルによって、動き推定問題の焦点が変位場
を決定する方法に変更される。
であり、これは小さく、理想的にはゼロである)から動き
のこれら2つの構成要素を決定することである。動きの2つの構成要素の決定におけるこのアプローチは、動き微分を未決定とすると共に、信頼性を低くする。言い換えれば、単なる次の動き予測誤差関数
に拘束がない場合、変位場
に多くの可能性がある。これは、全体的な予測的な誤差、Eに対して、低い値を与える。
ある動き推定技術は、濃度動き推定の制限を克服するために、色彩情報を使用することを試みる。色彩情報には3つのチャネルが含まれ、例えば、輝度Yとクロミナンス・チャンネルのUとV、3原色である赤R、緑G、並びに青B、あるいは別の適切な表示がある。これらのカラーチャネルを各色彩成分の1個と共に使用することによって、3個の制約から動き(2個のパラメータ)を決定する試みがなされる。しかし、実際には、色彩は強度と共に空間に非常に高度に関連しているので、加えられる情報はほとんどない。更に、隣接ピクセル間の相関もまた高度である。平坦で質感がない領域のように極端な場合では、境界を除いては動きを決定する情報がない。統計的見地からは、変位
を決定するのに、
中の領域情報が単純に十分にはない。
と
がほとんど等しいので、基準画像中の
を決定するために、画像に十分な情報がないので、
に1つ以上の追加の制約を負わせることは有用である。例えば、第1の付加的な要請は、
にある空間コヒーレンス又は空間的平滑さを課す事である。ある技術では、その勾配
の項で表現されるような、変位場の平滑さ上の追加的拘束を具体化する全誤差が、その事項(term)に加えられる。それゆえ、最小化される全誤差は次のように表現できる:
と同様に総和を最小化する傾向がある。以下の明細書に記述された技術では、動き推定を行なう場合に、より正確でロバストな動き推定結果を生むためにどの誤差距離関数F()を選択すべきか、という基本で見落とされた疑問に対処する。以下に、誤差距離関数のある例とそれらの特性が最初に記述され、そして次に、適切な誤差距離関数を選択するための技術が記述される。
一般に誤差距離関数F()には、3個の主要な分類がある:
(1) F(u)=|u|、平均絶対差(MAD)、又は等価的に、絶対差の総和(SAD)として一般に知られており、圧縮の中で使用される;
(2) F(u)=u2、平均二乗誤差(MSE)、又は等価的に、2乗誤差の総和(SSE)として一般に知られている;
(3) F()はロバスト推定値である。
に内在する確率分布に由来する場合がある。実際上、この誤差の分布は一般的に未知である。この分布に由来する最適な重みづけの使用によって、生成される動き推定での不確実性を最小限にされる。そのような最適な重みづけのための式は、最尤推定法理論の統計概念から来る。最尤推定法理論は、どのように誤差距離関数を与えられた分布に関連づけるかの方法を示す。最大尤推定法理論は、与えられたデータ(例えば画像)に基づいた分布のパラメータ中(この状況では
又は
である)で、最も確率が高いか最も有望である評価を決定する正確な方法と説明できる。最大尤推定法理論は、与えられた画像
および
の
又は
に対する条件付確率を正式に最大化する。
が確率密度
と独立していると仮定することである。このとき、未知パラメータ(この場合は動き)用の最尤推定量は、総和
の関数としてこの全誤差を最小限にすることは、予測誤差の分布
が
の真の値でラプラス分布だった場合(両側の指数関数)、
に対する最尤推定量でもある動き推定値
を生成する。ラプラシアン確率分布は、次式で表現される:
が誤差距離関数に選ばれると仮定する。そのとき、全誤差は2乗された差の総和(SSD)である。予測誤差がガウス分布の場合、全誤差の最低値は最尤推定量を与える。予測誤差がガウス分布の場合、確率密度は、次式で表現される:
動き推定を行なう場合、誤差距離関数の任意選択は実際の誤差分布に合致しない。誤差自体の実際の分布がガウス分布ならば、ガウス分布では異常値がめったに生じないため非常に行儀がよいので、例えば、精度に関する問題の多くはない。例えばSSE(L2)距離が最適であり、さらにSAD(L1)距離も圧縮のために十分に旨くゆく。しかし、1つの問題は、これらの動き予測誤差は明らかに非ガウス誤差である傾向がある点である。例えば、いくつかの異なる応用例に関する研究によると、ガウスの仮定が常に予測誤差の実際の分布への最も芳しくない適合であり、両側指数関数分布(あるいはラプラス分布)はガウス分布よりよくて、時々は最良であり、また、コーシー分布は多くの場合3つの分布状態の最良の適合だったとの結論を下した。
別の実施例では、開示された技術は、アファイン変換や遠近法のモデルより複雑化されるか、より複雑な動きモデルと共に使用できる。ある実施例では、開示された技術は、高品質ビデオやデジタル映画中で使用でき、また3D映画と共に使用する。
Claims (67)
- ビデオデータの動き推定(motion estimation)用の最適誤差距離関数(optimal error metric function)を決定するための画像の動き推定用の方法であって、
初期誤差距離関数を指定し;
前記初期誤差距離関数を使用して初動推定(initial motion estimation)を行ない、ここで、前記初動推定が動き予測誤差(motion prediction errors)を生成し;
前記初期誤差距離関数が前記最適誤差距離関数でない場合、選択された最適誤差距離関数を使用して、最終動き推定を行なうこと;
を特徴とする方法。 - 請求項1の方法において、さらに、前記初動推定の前記動き予測誤差の分布と、複数の誤差距離関数の1つに関連づけた分布との比較に基づいて、前記初期誤差距離関数が最適誤差関数であるかを判断することから成ることを特徴とする方法。
- 請求項2の方法において、前記初期誤差距離関数が前記最適誤差関数でない場合、前記方法がさらに、前記動き予測誤差の分布に基づいた前記最適誤差距離関数を選択することから成ることを特徴とする方法。
- 請求項3の方法において、前記初動推定を行なう方法は、前記動き予測誤差を決定するために前記初期誤差距離関数を処理することから成ることを特徴とする方法。
- 請求項3の方法において、さらに前記初期誤差距離関数に関連した初期確率分布を指定することから成ることを特徴とする方法。
- 請求項3の方法において、前記初期誤差距離関数が前記最適誤差関数であるか判断することは、前記初期誤差距離関数用の前記動き予測誤差のヒストグラムを計算することから成ることを特徴とする方法。
- 請求項6の方法において、前記初期誤差距離関数が前記最適誤差関数であるか判断することは、前記ヒストグラムの統計的最良適合のための分布を決定することから成ることを特徴とする方法。
- 請求項7の方法において、前記統計的最良適合のための分布を決定することは、前記最適誤差距離関数の確率分布用のスケール係数を決定することから成ることを特徴とする方法。
- 請求項8の方法において、前記確率分布の候補は、ガウス分布、ラプラス分布、及びコーシー分布から成ることを特徴とする方法。
- 請求項8の方法において、前記スケール係数を決定した後に、最良適合分布のための統計試験を行なうことを、さらに含むことを特徴とする方法。
- 請求項10の方法において、前記統計試験は分布適合のためのカイ二乗検定を行なうことから成ることを特徴とする方法。
- 請求項11の方法において、前記初期誤差距離関数はフーバーの距離関数であることを特徴とする方法。
- 請求項3の方法において、前記初期誤差距離関数は複数の確率分布における中間の確率分布に関連することを特徴とする方法。
- 請求項13の方法において、前記複数の確率分布は、ガウス分布、ラプラス分布、又はコーシー分布から成ることを特徴とする方法。
- 請求項1の方法において、前記初期誤差距離関数は、絶対差の総和(SAD)、2乗された差の総和(SSD)、平均絶対誤差(MAD)、平均二乗誤差(MSE)、又はロバスト推定値の1つ以上の関数から成ることを特徴とする方法。
- 請求項1の方法において、ビデオエンコーダの動き推定ユニットで動き推定を行なうように、さらに構成されることを特徴とする方法。
- 請求項1の方法において、前記最適誤差距離関数を使用してビデオコーディングの区間予測(inter-prediction)を行なうことを、さらに有することを特徴とする方法。
- 請求項17の方法において、前記ビデオコーディング用の前記区間予測を行う方法は:
動き推定ユニットで、ピクセルのブロックとフレームを受け取り、1つ以上の動きベクトルを生成し;
動き補償ユニットで、前記フレームおよび前記1つ以上の動きベクトルを受け取り、前記ピクセルのブロックに近似する予測値を生成し;
減算器ユニットで、前記ピクセルのブロックから前記予測値を差し引き、差異画像ブロックを生成すること;
が含まれることを特徴とする方法。 - 請求項1の方法において、前記最適誤差距離関数を使用してビデオ処理のための時間的補間を行なうことを、さらに有することを特徴とする方法。
- 請求項19の方法において、前記時間的補間を行なう方法は:
動き推定ユニットで、第1のフレームと第2のフレームを受け取り、1つ以上の動きベクトルを生成し;
双方向補間ユニットで、前記第1のフレーム、前記第2のフレームおよび前記1つ以上の動きベクトルを受け取り、前記第1と第2のフレームに関連した時間の間にある画像の近似値を生成すること;
が含まれることを特徴とする方法。 - 請求項1の方法において、前記最適誤差距離関数を使用してスーパー分解能処理を行なうことを、さらに有することを特徴とする方法。
- 請求項21の方法において、前記スーパー分解能処理を行なう方法は:
動き推定ユニットで、時間Tのまわりに集められた一群のフレームを受け取り、前記時間Tでの当該群のフレームと、当該群の別のフレームとの間の1つ以上の動きベクトルを生成し;
動き補償ユニットで、前記一群のフレームと前記1つ以上の動きベクトルを受け取り、そして前記一群のフレーム中の各フレームの予測されたバージョンを構成する画像を生成し;
スーパー分解能演算処理装置で、前記画像を受け取って、前記画像を処理し、前記一群のフレームより高い空間分解能がある前記時間Tでの画像を生成すること;
が含まれることを特徴とする方法。 - 請求項1の方法において、前記動き推定は、ブロックに基づいたか、区域に基づいた動き推定から成ることを特徴とする方法。
- 請求項1の方法において、前記動き推定は、位相相関か、ピクセル再帰的な(pel-recursive)技術から成ることを特徴とする方法。
- 請求項1の方法において、前記動き推定は、平行移動モデル、アフィン変換モデル、またはパラメトリックモデルから成る、動きモデルから構成されることを特徴とする方法。
- コンピュータ読取り可能なメディア上で有形的にコード化されたコンピュータ・プログラム・プロダクトであって、データ処理装置に対して画像の動き推定用の動作を行なわせる命令を含み、前記動作は:
初期誤差距離関数を指定し;
前記初期誤差距離関数を使用して初動推定を行ない、ここで、前記初動推定は動き予測誤差を生成し;
前記初期誤差距離関数が前記最適誤差関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なうこと;
が含まれることを特徴とする方法。 - 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記動作がさらに、前記初動推定の前記動き予測誤差の分布を、複数の誤差距離関数の一つに関連づけた分布と比較することに基づいて、前記初期誤差距離関数が前記最適誤差関数であるか判断することから成ることを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項27のコンピュータ・プログラム・プロダクトにおいて、前記初期誤差距離関数が前記最適誤差関数でない場合、前記動作がさらに、前記動き予測誤差の分布に基づいた前記最適誤差距離関数を選択することから成ることを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項28のコンピュータ・プログラム・プロダクトにおいて、前記分布が前記動き予測誤差の前記分布の最良適合かどうかを判断することには:
複数の分布状態の候補に関連したスケール係数を決定し;
前記複数の分布状態の候補について統計試験を行ない;
前記統計試験で前記複数の誤差距離関数の一つに関連づけた前記分布と最良適合を見せるかどうかを判断する;
ことから成ることを特徴とするコンピュータ・プログラム・プロダクト。 - 請求項29のコンピュータ・プログラム・プロダクトにおいて、前記統計試験はカイ二乗検定から成ることを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項29のコンピュータ・プログラム・プロダクトにおいて、前記初期誤差距離関数はフーバー距離関数から成ることを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項26のコンピュータ・プログラム・プロダクトにおいて、ビデオエンコーダの動き推定ユニットで動き推定を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記最適誤差距離関数を使用してビデオコーディングの区間予測を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記最適誤差距離関数を使用してビデオ処理用の時間的補間を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
- 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記最適誤差距離関数を使用してスーパー分解能処理を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
- 画像の動き推定を行なうためのシステムであって:
画像データを表示する表示装置;
画像データ処理のために前記画像データと命令を記憶するコンピュータ読取り可能なメディア;
前記命令と前記画像データを処理するのに使用可能なデータ処理装置とを備えると共に、前記命令は前記データ処理装置に以下の事項を実行させる:
初期誤差距離関数を使用して、初動推定を行なうものであって、ここで、前記初動推定は動き予測誤差を生成し;
前記動き予測誤差の分布に基づいた複数の誤差距離関数の1つから、前記最適誤差距離関数を選択し;
もし前記初期誤差距離関数が前記最適誤差関数として選択されない場合は、前記選択された最適誤差距離関数を使用して最終動き推定を行なう;
ことを特徴とするシステム。 - 請求項36のシステムにおいて、前記表示装置は、前記データ処理装置から前記最適誤差距離関数を備えた画像データがある表示画像への画像データを受け取るように構成されることを特徴とするシステム。
- 請求項36のシステムにおいて、前記命令は、さらに前記データ処理装置に前記初動推定に基づいて前記動き予測誤差のヒストグラムを計算させることを特徴とするシステム。
- 請求項36のシステムにおいて、前記システムはデジタル映画又は3D映画用であることを特徴とするシステム。
- 請求項36のシステムにおいて、前記データ処理装置は、ビデオエンコーダ内の動き推定ユニットから成ることを特徴とするシステム。
- 動き推定のための最適誤差距離関数を決定するコンピュータに実装される方法であって:
画像の初動推定のための第1の誤差距離関数を選択し;
前記第1の誤差距離関数と共に初動推定を行なうと共に、前記初動推定は動き予測誤差を生成し;
前記第1の誤差距離関数が、前記生成された動き予測誤差の分布を備えた最良適合である分布と合致する場合か決定することによって、前記第1の誤差距離関数が最適誤差距離関数であるか定め;
前記第1の誤差距離関数が前記最適誤差距離関数でない場合、画像の後続する動き推定のための前記最適誤差距離関数の為に、第2の誤差距離関数を選択し、ここで、前記第2の誤差距離関数の前記選択では、前記初動推定から前記生成された動き予測誤差の前記分布を備えた最良適合である分布に対応する;
コンピュータに実装された方法。 - 請求項41のコンピュータに実装された方法において、前記第1の誤差距離関数又は第2の誤差距離関数は、複数の誤差距離関数から選択されることを特徴とする方法。
- 請求項42のコンピュータに実装された方法において、前記複数の誤差距離関数は、ガウス分布、ラプラス分布、コーシー分布、及び/又はフーバー分布の一以上からの分布を有する関数から成ることを特徴とする方法。
- 請求項41のコンピュータに実装された方法において、前記第1の動き推定又は前記第2の動き推定が連続的な導関数で誤差距離関数で最小化する方法を使用する場合、前記初期誤差距離関数は、フーバー距離関数と関係を有することを特徴とする方法。
- 請求項41のコンピュータに実装された方法において、さらに、前記初動推定から前記生成された動き予測誤差に基づいて前記生成された動き誤差のヒストグラムを計算することを特徴とする方法。
- 請求項45のコンピュータに実装された方法において、前記第1の誤差距離関数が前記生成された動き予測誤差の前記分布と前記最良適合である分布に対応する場合か決定する場合に:
前記生成された動き予測誤差の前記分布のためのスケール係数を決定し;
前記分布が前記生成された動き予測誤差の前記分布と前記最良適合かどうかを判断するために統計的試験をすること;
から成ることを特徴とする方法。 - 請求項41のコンピュータに実装された方法において、さらに、ビデオエンコーダの動き推定ユニットで動き推定を行なうことを特徴とする方法。
- 請求項41のコンピュータに実装された方法において、さらに、前記最適誤差距離関数を使用して、ビデオコーディングの区間予測を行なうことを特徴とする方法。
- 請求項41のコンピュータに実装された方法において、さらに、前記最適誤差距離関数を使用して、ビデオ処理用の時間的補間を行なうことを特徴とする方法。
- 請求項41のコンピュータに実装された方法において、さらに、前記最適誤差距離関数を使用して、スーパー分解能処理を行なうことを特徴とする方法。
- ビデオコーディングの区間予測を行なうためのシステムであって、前記システムは:
ピクセルのブロックとフレームを受け取り、かつ1つ以上の動きベクトルを生成する動き推定ユニット;
前記フレームと前記1つ以上の動きベクトルを受け取り、かつ前記ピクセルのブロックに近似する予測値を生成する動き補償ユニット;
前記ピクセルのブロックから前記予測値を引き、差異画像ブロックを生成する減数器ユニット;
を有し、ここで前記動き推定ユニットは、次の命令から成る処理によって動き推定の最適誤差距離関数を決定するように構成される:
初期誤差距離関数を指定し;
前記初期誤差距離関数を使用して初動推定を行ない、ここで前記初動推定は動き予測誤差を生成し;
もし前記初期誤差距離関数が前記最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して最終の動き推定を行う;
ことを特徴とするシステム。 - 請求項51のシステムにおいて、前記動き推定ユニットは、前記動き推定のための前記最適誤差距離関数を定めるために、次の命令から成る処理:
前記初動推定の前記動き予測誤差の分布と複数の誤差距離関数の1つに関係する分布との比較に基づいて、前記初期誤差距離関数が前記最適誤差距離関数であるか定めること;
前記初期誤差距離関数が前記最適誤差距離関数でない場合には、さらに、前記命令がさらに、前記動き予測誤差の分布に基づいて前記最適誤差距離関数を選択すること;
が含まれることを特徴とするシステム。 - 請求項52のシステムにおいて、前記初期誤差距離関数はフーバーの距離関数から成ることを特徴とするシステム。
- 請求項51のシステムにおいて、前記システムはビデオエンコーダから成り、ここで前記動き推定ユニットと前記動き補償ユニットは前記ビデオエンコーダの構成部分であることを特徴とするシステム。
- 請求項51のシステムにおいて、前記動き推定ユニットは誤差距離関数の形状を決定し、前記最適誤差距離関数を決定するために前記形状を使用することを特徴とするシステム。
- 請求項51のシステムにおいて、前記差異画像ブロックは残差から成ることを特徴とするシステム。
- ビデオ処理用の時間的補間用のシステムであって、前記システムは:
第1のフレームおよび第2のフレームを受け取り、かつ1つ以上の動きベクトルを生成する動き推定ユニット;
前記第1のフレーム、前記第2のフレームおよび前記1つ以上の動きベクトルを受け取り、かつ前記第1と第2のフレームに関連する時間の間にある画像の近似値を生成する双方向補間ユニット;
を備え、ここで前記動き推定ユニットは、次の命令から成る処理によって、動き推定用の最適誤差距離関数を決定するように構成される:
初期誤差距離関数を指定し;
前記初期誤差距離関数を使用して初動推定を行ない、ここで前記初動推定は動き予測誤差を生成し;
前記初期誤差距離関数が前記最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して最終動き推定を行なうこと;
を特徴とするシステム。 - 請求項57のシステムにおいて、前記動き推定ユニットは、さらに前記動き推定用の前記最適誤差距離関数を決定するために、次の命令から成る処理:
前記初動推定の動き予測誤差の分布と複数の誤差距離関数の1つと関係する分布との比較に基づいて、前記初期誤差距離関数が前記最適誤差距離関数であるか定めること;
前記初期誤差距離関数が前記最適誤差距離関数でない場合には、前記命令には、さらに前記動き予測誤差の分布に基づいて前記最適誤差距離関数を選択することが含まれること;
を特徴とするシステム。 - 請求項58のシステムにおいて、前記初期誤差距離関数はフーバーの距離関数から成ることを特徴とするシステム。
- 請求項57のシステムにおいて、前記動き推定ユニットは、誤差距離関数の形状を決定し、前記最適誤差距離関数を決定するために前記形状が使用されるように構成されることを特徴とするシステム。
- 請求項57のシステムにおいて、等しい部分区間で複数の中間画像が前記システムで計算される場合、システムはスロービデオ効果を生むことを特徴とするシステム。
- 請求項57のシステムにおいて、前記システムはフレーム速度変換用に構成され、前記システムは、第1の周波数での第1のビデオストリームを、第2の周波数での第2のビデオストリームに変換する、双方向補間ユニットに関連した時間を使用するように構成されることを特徴とするシステム。
- ビデオ処理用のスーパー分解能処理を行なうためのシステムであって、前記システムは:
時間Tのまわりに集められた一群のフレームを受け取り、かつ時間Tの前記群のフレームと前記群の別のフレームとの間で、1つ以上の動きベクトルを生成するように構成された動き推定ユニット;
前記一群のフレームと前記1つ以上の動きベクトルを受け取り、かつ前記一群のフレームでの各フレームの予測されたバージョンから成る画像を生成するための動き補償ユニット;
前記画像を受け取り、前記画像を処理し、前記一群のフレームより高い空間分解能がある前記時間Tでの画像を生成するためのスーパー分解能演算処理装置;
を備え、前記動き推定ユニットは、動き推定のための最適誤差距離関数を決定するように、次の命令から成る処理によって、構成される:
初期誤差距離関数を指定し;
前記初期誤差距離関数を使用して初動推定を行ない、ここで前記初動推定は動き予測誤差を生成し;
前記初期誤差距離関数が前記最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なうこと;
を特徴とするシステム。 - 請求項63のシステムにおいて、前記動き推定ユニットは、さらに、前記動き推定のための最適誤差距離関数を決定するために、次の命令から成る処理:
前記初動推定の前記動き予測誤差の分布と複数の誤差距離関数の1つと関係する分布との比較に基づいて、前記初期誤差距離関数が前記最適誤差距離関数であるか定めること;
前記初期誤差距離関数が前記最適誤差距離関数でない場合には、前記命令には、さらに前記動き予測誤差の分布に基づいて前記最適誤差距離関数を選択することが含まれること;
を特徴とするシステム。 - 請求項63のシステムにおいて、前記初期誤差距離関数又は前記最適誤差距離関数はフーバーの距離関数から成ることを特徴とするシステム。
- 請求項63のシステムにおいて、前記動き推定ユニットは、誤差距離関数の形状を決定し、前記最適誤差距離関数を決定するために前記形状を使用できるように構成されたことを特徴とするシステム。
- 請求項63のシステムにおいて、前記スーパー分解能演算処理装置は、ナイキスト周波数を調整し、前記画像に関連した分解能を増加させることにより、前記画像からより高分解能画像を抽出するように構成されたことを特徴とするシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US1514807P | 2007-12-19 | 2007-12-19 | |
US61/015,148 | 2007-12-19 | ||
PCT/US2008/087805 WO2009086181A1 (en) | 2007-12-19 | 2008-12-19 | Adaptive motion estimation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011508536A true JP2011508536A (ja) | 2011-03-10 |
JP5138048B2 JP5138048B2 (ja) | 2013-02-06 |
Family
ID=40599623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010539902A Expired - Fee Related JP5138048B2 (ja) | 2007-12-19 | 2008-12-19 | 適応性動き推定 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8457208B2 (ja) |
EP (1) | EP2232873B1 (ja) |
JP (1) | JP5138048B2 (ja) |
CN (1) | CN102742267B (ja) |
AT (1) | ATE550879T1 (ja) |
WO (1) | WO2009086181A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102742267B (zh) | 2007-12-19 | 2015-05-27 | 杜比实验室特许公司 | 自适应运动估计 |
US8718142B2 (en) * | 2009-03-04 | 2014-05-06 | Entropic Communications, Inc. | System and method for frame rate conversion that utilizes motion estimation and motion compensated temporal interpolation employing embedded video compression |
TWI452909B (zh) * | 2009-06-29 | 2014-09-11 | Silicon Integrated Sys Corp | 移動向量校正電路、影像產生裝置及相關方法 |
US20110026596A1 (en) * | 2009-07-28 | 2011-02-03 | Wei Hong | Method and System for Block-Based Motion Estimation for Motion-Compensated Frame Rate Conversion |
US8508659B2 (en) * | 2009-08-26 | 2013-08-13 | Nxp B.V. | System and method for frame rate conversion using multi-resolution temporal interpolation |
CA2783836C (en) * | 2009-11-11 | 2018-03-13 | Cinnafilm, Inc. | Single frame artifact filtration and motion estimation |
JP5372721B2 (ja) * | 2009-12-11 | 2013-12-18 | ルネサスエレクトロニクス株式会社 | 映像信号処理装置、方法及びプログラム |
KR101674078B1 (ko) * | 2009-12-16 | 2016-11-08 | 삼성전자 주식회사 | 블록 기반의 영상 잡음 제거 방법 및 장치 |
US8494225B2 (en) * | 2010-02-19 | 2013-07-23 | Julian L. Center | Navigation method and aparatus |
KR101082903B1 (ko) * | 2010-05-06 | 2011-11-11 | 성균관대학교산학협력단 | 직교 주파수 분할 다중화 시스템에서의 주파수 옵셋 추정 장치 |
US9185437B2 (en) | 2012-11-01 | 2015-11-10 | Microsoft Technology Licensing, Llc | Video data |
KR102136848B1 (ko) | 2013-07-15 | 2020-07-22 | 삼성전자 주식회사 | 영상 처리 장치, 영상 처리 시스템 및 영상 처리 방법 |
CN104933064B (zh) * | 2014-03-19 | 2018-02-23 | 株式会社理光 | 预测目标对象的运动参数的方法和装置 |
US10445862B1 (en) * | 2016-01-25 | 2019-10-15 | National Technology & Engineering Solutions Of Sandia, Llc | Efficient track-before detect algorithm with minimal prior knowledge |
CN108605113B (zh) * | 2016-05-02 | 2020-09-15 | 赫尔实验室有限公司 | 用于自运动补偿的方法、系统和非暂时性计算机可读介质 |
CN109328382B (zh) * | 2016-06-22 | 2023-06-16 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07162811A (ja) * | 1993-10-11 | 1995-06-23 | Thomson Consumer Electron Sa | 中間フィールドまたは中間フレームの動き補償内挿方法および装置 |
JP2003501902A (ja) * | 1999-05-27 | 2003-01-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオ信号の符号化 |
US6532265B1 (en) * | 1999-03-25 | 2003-03-11 | Imec Vzw | Method and system for video compression |
JP2004056242A (ja) * | 2002-07-17 | 2004-02-19 | Ikegami Tsushinki Co Ltd | 予測符号化における符号量制御方法 |
JP2005073291A (ja) * | 1997-12-25 | 2005-03-17 | Mitsubishi Electric Corp | 動き補償装置 |
JP2005204158A (ja) * | 2004-01-16 | 2005-07-28 | Mitsubishi Electric Corp | 画像符号化装置 |
JP2007525078A (ja) * | 2003-06-23 | 2007-08-30 | ヴィチップ・コーポレーション | 適応型多次元信号シーケンス符号化/復号化方法とそのための装置 |
JP2008503918A (ja) * | 2004-06-18 | 2008-02-07 | トムソン ライセンシング | ビデオ・コーデック量子化のための方法および装置 |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4496972A (en) * | 1980-05-10 | 1985-01-29 | Deutsche Forschungs-Und Versuchsanstalt Fur Luft-Und Raumfahrt E.V. | Method for the representation of video images or scenes, in particular aerial images transmitted at reduced frame rate |
US4433207A (en) | 1981-09-10 | 1984-02-21 | Best Robert M | Cryptographic decoder for computer programs |
US4969041A (en) | 1988-09-23 | 1990-11-06 | Dubner Computer Systems, Inc. | Embedment of data in a video signal |
NL8901032A (nl) | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
US5327237A (en) | 1991-06-14 | 1994-07-05 | Wavephore, Inc. | Transmitting data with video |
US5319735A (en) | 1991-12-17 | 1994-06-07 | Bolt Beranek And Newman Inc. | Embedded signalling |
FR2699780B1 (fr) * | 1992-12-22 | 1995-03-17 | Philips Electronique Lab | Dispositif de traitement récursif de signal vidéo comprenant une pluralité de branches. |
US5748763A (en) | 1993-11-18 | 1998-05-05 | Digimarc Corporation | Image steganography system featuring perceptually adaptive and globally scalable signal embedding |
US6424725B1 (en) | 1996-05-16 | 2002-07-23 | Digimarc Corporation | Determining transformations of media signals with embedded code signals |
US5530751A (en) | 1994-06-30 | 1996-06-25 | Hewlett-Packard Company | Embedded hidden identification codes in digital objects |
US5646997A (en) | 1994-12-14 | 1997-07-08 | Barton; James M. | Method and apparatus for embedding authentication information within digital data |
US5689587A (en) | 1996-02-09 | 1997-11-18 | Massachusetts Institute Of Technology | Method and apparatus for data hiding in images |
US7930546B2 (en) | 1996-05-16 | 2011-04-19 | Digimarc Corporation | Methods, systems, and sub-combinations useful in media identification |
US6031914A (en) | 1996-08-30 | 2000-02-29 | Regents Of The University Of Minnesota | Method and apparatus for embedding data, including watermarks, in human perceptible images |
US6850567B1 (en) | 1997-01-13 | 2005-02-01 | Koninklijke Philips Electronics N.V. | Embedding supplemental data in a digital video signal |
US6192138B1 (en) | 1997-05-08 | 2001-02-20 | Kabushiki Kaisha Toshiba | Apparatus and method for embedding/unembedding supplemental information |
JP3794646B2 (ja) | 1997-08-26 | 2006-07-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 内容情報とそれに関する補足情報とを転送するシステム |
US6701062B1 (en) | 1998-06-06 | 2004-03-02 | Macrovision Corporation | Generational copy control of a video signal |
US6272207B1 (en) * | 1999-02-18 | 2001-08-07 | Creatv Microtech, Inc. | Method and apparatus for obtaining high-resolution digital X-ray and gamma ray images |
US6567469B1 (en) * | 2000-03-23 | 2003-05-20 | Koninklijke Philips Electronics N.V. | Motion estimation algorithm suitable for H.261 videoconferencing applications |
US7421729B2 (en) | 2000-08-25 | 2008-09-02 | Intellocity Usa Inc. | Generation and insertion of indicators using an address signal applied to a database |
US7039113B2 (en) | 2001-10-16 | 2006-05-02 | Koninklijke Philips Electronics N.V. | Selective decoding of enhanced video stream |
JP2005506815A (ja) * | 2001-10-26 | 2005-03-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 空間拡張可能圧縮のための方法及び装置 |
EP1491038A2 (en) * | 2001-12-26 | 2004-12-29 | YEDA RESEARCH AND DEVELOPMENT CO., Ltd. | A system and method for increasing space or time resolution in video |
US20050226462A1 (en) * | 2002-05-30 | 2005-10-13 | Wittebrood Rimmert B | Unit for and method of estimating a motion vector |
TWI227641B (en) | 2003-11-11 | 2005-02-01 | Mediatek Inc | Method and related apparatus for motion estimation |
WO2006035777A1 (ja) | 2004-09-29 | 2006-04-06 | Sharp Kabushiki Kaisha | 記録装置及び方法 |
JP5025645B2 (ja) | 2005-06-23 | 2012-09-12 | トライデント マイクロシステムズ インコーポレイテッド | 動き推定方法 |
US20070268406A1 (en) | 2006-05-22 | 2007-11-22 | Broadcom Corporation, A California Corporation | Video processing system that generates sub-frame metadata |
US7893999B2 (en) | 2006-05-22 | 2011-02-22 | Broadcom Corporation | Simultaneous video and sub-frame metadata capture system |
US7953315B2 (en) | 2006-05-22 | 2011-05-31 | Broadcom Corporation | Adaptive video processing circuitry and player using sub-frame metadata |
US20080007649A1 (en) | 2006-06-23 | 2008-01-10 | Broadcom Corporation, A California Corporation | Adaptive video processing using sub-frame metadata |
US20080007651A1 (en) | 2006-06-23 | 2008-01-10 | Broadcom Corporation, A California Corporation | Sub-frame metadata distribution server |
US20080007650A1 (en) | 2006-06-23 | 2008-01-10 | Broadcom Corporation, A California Corporation | Processing of removable media that stores full frame video & sub-frame metadata |
CN102742267B (zh) | 2007-12-19 | 2015-05-27 | 杜比实验室特许公司 | 自适应运动估计 |
-
2008
- 2008-12-19 CN CN200880121684.3A patent/CN102742267B/zh not_active Expired - Fee Related
- 2008-12-19 JP JP2010539902A patent/JP5138048B2/ja not_active Expired - Fee Related
- 2008-12-19 WO PCT/US2008/087805 patent/WO2009086181A1/en active Application Filing
- 2008-12-19 US US12/746,834 patent/US8457208B2/en not_active Expired - Fee Related
- 2008-12-19 EP EP08869094A patent/EP2232873B1/en not_active Not-in-force
- 2008-12-19 AT AT08869094T patent/ATE550879T1/de active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07162811A (ja) * | 1993-10-11 | 1995-06-23 | Thomson Consumer Electron Sa | 中間フィールドまたは中間フレームの動き補償内挿方法および装置 |
JP2005073291A (ja) * | 1997-12-25 | 2005-03-17 | Mitsubishi Electric Corp | 動き補償装置 |
US6532265B1 (en) * | 1999-03-25 | 2003-03-11 | Imec Vzw | Method and system for video compression |
JP2003501902A (ja) * | 1999-05-27 | 2003-01-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオ信号の符号化 |
JP2004056242A (ja) * | 2002-07-17 | 2004-02-19 | Ikegami Tsushinki Co Ltd | 予測符号化における符号量制御方法 |
JP2007525078A (ja) * | 2003-06-23 | 2007-08-30 | ヴィチップ・コーポレーション | 適応型多次元信号シーケンス符号化/復号化方法とそのための装置 |
JP2005204158A (ja) * | 2004-01-16 | 2005-07-28 | Mitsubishi Electric Corp | 画像符号化装置 |
JP2008503918A (ja) * | 2004-06-18 | 2008-02-07 | トムソン ライセンシング | ビデオ・コーデック量子化のための方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
US20100266041A1 (en) | 2010-10-21 |
CN102742267B (zh) | 2015-05-27 |
ATE550879T1 (de) | 2012-04-15 |
EP2232873A1 (en) | 2010-09-29 |
CN102742267A (zh) | 2012-10-17 |
US8457208B2 (en) | 2013-06-04 |
EP2232873B1 (en) | 2012-03-21 |
JP5138048B2 (ja) | 2013-02-06 |
WO2009086181A1 (en) | 2009-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5138048B2 (ja) | 適応性動き推定 | |
CN110741640B (zh) | 用于视频代码化中的运动补偿预测的光流估计 | |
WO2019191890A1 (zh) | 用于图像处理的方法和图像处理装置 | |
US11070834B2 (en) | Low-complexity method for generating synthetic reference frames in video coding | |
WO2017005146A1 (zh) | 视频编码和解码方法、视频编码和解码装置 | |
WO2016131229A1 (zh) | 用于视频图像编码和解码的方法、编码设备和解码设备 | |
US10506249B2 (en) | Segmentation-based parameterized motion models | |
US11115678B2 (en) | Diversified motion using multiple global motion models | |
CN102075760A (zh) | 快速运动估计方法及装置 | |
US11350102B2 (en) | Block-based optical flow estimation for motion compensated prediction in video coding | |
CN110741641A (zh) | 用于视频压缩的翘曲参考运动矢量 | |
Dai et al. | A novel fast two step sub-pixel motion estimation algorithm in HEVC | |
KR102245740B1 (ko) | 깊이 영상에서 신축을 이용한 움직임 추정 방법 및 장치 | |
Ringis et al. | Using modern motion estimation algorithms in existing video codecs | |
WO2023205371A1 (en) | Motion refinement for a co-located reference frame | |
CN115550652A (zh) | 基于上下文的图像编解码 | |
JP5637010B2 (ja) | 動きベクトル検出装置、動きベクトル検出方法及び動きベクトル検出プログラム | |
JP2002521944A (ja) | デジタル画像が被る動きを求める方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111011 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120521 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120914 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121113 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151122 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |