JP2011508536A - 適応性動き推定 - Google Patents

適応性動き推定 Download PDF

Info

Publication number
JP2011508536A
JP2011508536A JP2010539902A JP2010539902A JP2011508536A JP 2011508536 A JP2011508536 A JP 2011508536A JP 2010539902 A JP2010539902 A JP 2010539902A JP 2010539902 A JP2010539902 A JP 2010539902A JP 2011508536 A JP2011508536 A JP 2011508536A
Authority
JP
Japan
Prior art keywords
distance function
error distance
motion estimation
error
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010539902A
Other languages
English (en)
Other versions
JP5138048B2 (ja
Inventor
ギッシュ、ウォルター
ボット、クリストファー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2011508536A publication Critical patent/JP2011508536A/ja
Application granted granted Critical
Publication of JP5138048B2 publication Critical patent/JP5138048B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)

Abstract

【課題】動き推定用の最適誤差距離関数が、画像のビデオコーディング及び/又はビデオ処理のために決定され、使用される。そうするために、初期誤差距離関数を使用する初動推定が行なわれる。これは動き予測誤差を生成する。初期誤差距離関数が最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なう。ある実施例では、誤差分布の形は最適誤差距離関数を決定するために使用できる。この動き推定のための若干の具体例システムや装置は、圧縮、時間的補間及び/又はスーパー分解能処理用のシステムやデバイスに含まれる。
【解決手段】
【選択図】図1

Description

[関連する出願への相互参照]
本出願は、2007年12月19日に申請された出願番号61/015148号で、発明の名称が「適応性動き推定」である米国の仮出願についての優先権の利益を請求する。当該明細書の情報は参照によって組み込まれる。
本明細書の情報は、画像やビデオデータの動き推定(motion estimation)に関し、特に画像圧縮、記憶、処理、表示、及び/又は伝送システムについての動き推定用等のために関する。
[背景]
動き推定は、基準画像の1つ以上の部分が平行移動されたコピーの面から、画像をモデル化するための技術として説明される。動き推定はそれ自身、見る価値のある画質のビデオや画像データを生成する画像シーケンスのモデルに基づく。例えば、オブジェクトの画像が1つのフレームから次のフレームに変化し又は移動した場合、動き推定は平滑な画像遷移を生むために使用される。
具体的な実施例の概要
以下の段落は、現在開示される技術の実施例のある基本的理解が得られるようにするために、簡潔で単純化された概要を提示する。この概要は実施例の広範囲な全体像を示す概要でないことに注意されるべきである。さらに、この概要はいかなる特に顕著な態様や要素を特定するものとして了解されるものではなく、また技術一般や、特定の実施例の適用範囲を詳しく説明しているものではないことに注意するべきである。以下の概要は、要約して単純化された様式で実施例に関係のある若干の概念を単に提示する。この概要は、単に下に続く一実施例の詳細な説明の概念的な序幕として、了解されるべきものである。
一般に、この明細書の開示に記述された主題の実施例は、動き推定用の最適誤差距離関数(optimal error metric function)を決定する画像の動き推定用の方法について述べる。本方法は初期誤差距離関数を指定し、初期誤差距離関数を使用して、初動推定(initial motion estimation)を行なうことを含んでいる。ここで、初動推定では、動き補償誤差として知られている動き推定誤差(motion prediction errors)を生成する。もし初期誤差距離関数が最適誤差距離関数でない場合、本方法は選択された最適誤差距離関数を使用して、最終動き推定を行なうことを含んでいる。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。本方法は、初動推定の動き予測誤差の分布と複数の誤差距離関数の1つに関連づけた分布との比較に基づいて、初期誤差距離関数が最適誤差関数であるかを定めることを含む。初期誤差距離関数が最適誤差関数でない場合、本方法が動き予測誤差の分布に基づいた最適誤差距離関数を選択することを含む。初動推定を行なう方法には、動き予測誤差を決定するために初期誤差距離関数を処理することを含む。本方法は初期誤差距離関数に関連した初期確率分布を指定することを含む。
本方法は初期誤差距離関数が最適誤差関数であるか判断することを含む場合、本方法が初期誤差距離関数用の動き予測誤差のヒストグラムを計算することを含む。本方法は初期誤差距離関数が最適誤差関数であるか判断することを含む場合、本方法がまたヒストグラムの統計的最良適合用の分布を決定することを含む。本方法が統計的最良適合用の分布を決定することを含んでいる場合、本方法はまた最適誤差距離関数の確率分布用のスケール係数を決定することを含む。
確率分布の候補には、ガウス分布、ラプラス分布、及び/又はコーシー分布を含む。本方法はまた、スケール係数を決定した後に、最良適合分布用の統計試験を行なうことを含む。統計試験は、分布適合用のカイ二乗検定を行なうこと含む。初期誤差距離関数はフーバーの距離関数であり、及び/又は複数の確率分布における中間の確率分布に関連する。確率分布には、ガウス分布、ラプラスの分布、及び/又はコーシー分布を含む。初期誤差距離関数は、また絶対差の総和(SAD)、2乗された差の総和(SSD)、平均絶対誤差(MAD)、平均二乗誤差(MSE)、及び/又はロバスト推定値の1つ以上の関数を含む。
本方法は、ビデオエンコーダの動き推定ユニットで動き推定を行なうこと、最適誤差距離関数を使用してビデオコーディングの区間予測を行なうこと、最適誤差距離関数を使用してビデオ処理用の時間的補間を行なうこと、及び/又は最適誤差距離関数を使用してスーパー分解能処理を行なうこと、が含まれる。ビデオコーディングの区間予測用の本方法は:動き推定ユニットで、ピクセルのブロックとフレームを受け取り、1つ以上の動きベクトルを生成し;動き補償ユニットで、フレームおよび1つ以上の動きベクトルを受け取り、ピクセルのブロックに近似する予測値を生成し;そして、減算器ユニットで、ピクセルのブロックから予測値を差し引き、差異画像ブロックを生成すること;が含まれる。時間的補間を行なう本方法は:動き推定ユニットで、第1のフレームと第2のフレームを受け取り、1つ以上の動きベクトルを生成し;双方向補間ユニットで、第1のフレーム、第2のフレームおよび1つ以上の動きベクトルを受け取り、第1と第2のフレームに関連した時間の間にある画像の近似を生成すること;が含まれる。スーパー分解能処理を行なう本方法は:動き推定ユニットで、時間Tのまわりに集められた一群のフレームを受け取り、時間Tでの当該群のフレームと、別の当該群のフレームとの間の1つ以上の動きベクトルを生成し;動き補償ユニットで、一群のフレームと1つ以上の動きベクトルを受け取り、そして一群のフレーム中の各フレームの予測されたバージョンを構成する画像を生成し;そして、スーパー分解能演算処理装置で、画像を受け取って、画像を処理し、一群のフレームより高い空間分解能がある時間Tでの画像を生成すること;が含まれる。動き推定には、ブロックに基づくか、区域に基づく動き推定を含む。動き推定には、位相相関か、ピクセル再帰的な技術を含んでいる。また、動き推定には、平行移動モデル、アフィン変換モデル、またはパラメトリックモデルのような、動きモデルを含む。
一般に、この明細書に記述された主題の別の態様は、コンピュータ読取り可能なメディア上で有形的に(tangibly)コード化されたコンピュータ・プログラム・プロダクト用の実施例を含み、このプログラムはデータ処理装置に対して画像の動き推定用の動作を行なわせる命令を含む。動作には、初期誤差距離関数を指定し、初期誤差距離関数を使用して、初動推定を行なうことを含む。ここで、初動推定は動き予測誤差を生成する。動作には、また、初期誤差距離関数が最適誤差関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なうことが含まれる。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。初動推定の動き予測誤差の分布を複数の誤差距離関数の一つに関連づけた分布と比較することに基づいて、初期誤差距離関数が最適誤差関数であるか判断することを含む動作がある。初期誤差距離関数が最適誤差関数でない場合、動き予測誤差の分布に基づいた最適誤差距離関数を選択するための動作がある。この分布が動き予測誤差の分布の最良適合かどうかを判断するための動作には、複数の分布状態の候補に関連したスケール係数を決定し;複数の分布状態の候補の統計試験を行ない;統計試験で複数の誤差距離関数の一つに関連づけた分布と最良適合を見せるかどうかを判断する命令を含む。統計試験はカイ二乗検定を含む。初期誤差距離関数はフーバー距離関数である。コンピュータ・プログラム・プロダクトは、データ処理装置に、ビデオエンコーダの動き推定ユニットで動き推定を行なうための命令;最適誤差距離関数を使用してビデオコーディングの区間予測を行なうための命令;最適誤差距離関数を使用してビデオ処理用の時間的補間を行なうための命令;及び/又は最適誤差距離関数を使用してスーパー分解能処理を行なうための命令を含む。
一般に、この明細書に記述された主題の別の態様は、画像の動き推定を行なうためのシステムの実施例を含んでいる。本システムは、画像データを表示する表示装置、画像データ処理のために画像データと命令を記憶するコンピュータ読取り可能なメディア、および命令と画像データを処理するのに使用可能なデータ処理装置を含んでいる。その命令によって、データ処理装置は、初期誤差距離関数を使用して、初動推定を行なう。ここで、初動推定は動き予測誤差を生成する。当該命令によって、さらにデータ処理装置は、動き予測誤差の分布に基づいた複数の誤差距離関数の1つから、最適誤差距離関数を選択し、もし初期誤差距離関数が最適誤差関数として選択されない場合は、選択された最適誤差距離関数を使用して最終動き推定を行なう。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。表示装置は、データ処理装置から最適誤差距離関数を備えた画像データがある表示画像への画像データを受け取るように構成できる。その命令は、さらにデータ処理装置に初動推定に基づいて動き予測誤差のヒストグラムを計算させることができる。本システムは高分解能ビデオ、高品質ビデオ、デジタル映画及び/又は3D映画のために構成できる。データ処理装置は、ビデオエンコーダ内の動き推定ユニットであるか、又はこれを含む。
一般に、この明細書に記述された主題の別の態様は、動き推定用の最適誤差距離関数を決定するコンピュータに実装された方法用の実施例を含んでいる。コンピュータに実装された本方法は、画像の初動推定用の第1の誤差距離関数を選択することと、第1の誤差距離関数と共に初動推定を行なうことを含んでいる。初動推定は動き予測誤差を生成する。本方法には、第1の誤差距離関数が、生成された動き予測誤差の分布と最良適合である分布と対応する場合か決定することによって、第1の誤差距離関数が最適誤差距離関数であるか定めることを含んでいる。第1の誤差距離関数が最適誤差距離関数でない場合、画像の後続する動き推定用の最適誤差距離関数の為に、本方法は第2の誤差距離関数を選択することを含む。ここで、第2の誤差距離関数の選択では、初動推定から生成された動き予測誤差の分布と最良適合である分布と対応する。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。第1の誤差距離関数又は第2の誤差距離関数は、複数の誤差距離関数から選択される。誤差距離関数は、ガウス分布、ラプラス分布、コーシー分布、及び/又はフーバー分布の一以上からの分布を有する関数を含む。第1の動き推定又は第2の動き推定が連続的な導関数で誤差距離関数で最小化する方法を使用する場合、初期誤差距離関数はフーバー距離関数と関係を有する。
本方法は、初動推定から生成された動き予測誤差に基づいて生成された動き誤差のヒストグラムを計算することを含む。本方法が、第1の誤差距離関数が、生成された動き予測誤差の分布と最良適合である分布と対応する場合か決定することを含んでいる場合に、さらに本方法は、さらに生成された動き予測誤差の分布用のスケール係数を決定すること、並びに分布が生成された動き予測誤差の分布と最良適合かどうかを判断するために統計的試験をすることを含む。本方法には、ビデオエンコーダの動き推定ユニットで動き推定を行なうこと、最適誤差距離関数を使用して、ビデオコーディングの区間予測を行なうこと、最適誤差距離関数を使用して、ビデオ処理用の時間的補間を行なうこと、最適誤差距離関数を使用して、スーパー分解能処理を行なうこと、を含み得る。
一般に、別の態様はビデオコーディングの区間予測を行なうためのシステムを含む。本システムは、ピクセルのブロックとフレームを受け取り、かつ1つ以上の動きベクトルを生成するための動き推定ユニットを含む。本システムは、フレームおよび1つ以上の動きベクトルを受け取り、かつピクセルのブロックに近似する予測値を生成するための動き補償ユニットを有する。本システムは、ピクセルのブロックから予測値を引き、差異画像ブロックを生成するために減数器ユニットを有する。動き推定ユニットは、初期誤差距離関数を指定する命令;初期誤差距離関数を使用して初動推定を行なう命令;もし初期誤差距離関数が最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して最終の動き予測を行う命令を含む処理によって動き推定の最適誤差距離関数を決定するように構成される。初動推定は動き予測誤差を生成する。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。即ち、動き推定ユニットは、初動推定の動き予測誤差の分布と複数の誤差距離関数の1つに関する分布との比較に基づいて、初期誤差距離関数が最適誤差距離関数であるか定めるための命令を含む処理によって動き推定用の最適誤差距離関数を決定する。そして、初期誤差距離関数が最適誤差距離関数でない場合には、さらに、命令には、動き予測誤差の分布に基づいて最適誤差距離関数を選択する命令が含まれる。命令及び/又は処理結果は、記憶ユニットや記憶装置に記憶される。初期誤差距離関数は、フーバーの距離関数であるか、これを含む。本システムはビデオエンコーダを含むが、ここで動き推定ユニットおよび動き補償ユニットはビデオエンコーダの構成部分である。動き推定ユニットは、誤差距離関数の形状を決定し、最適誤差距離関数を決定するために当該形状を使用できる。差異画像ブロックは残差でもよい。
一般に、別の態様は、ビデオ処理用の時間的補間用のシステムを含む。本システムは、第1のフレームおよび第2のフレームを受け取り、かつ1つ以上の動きベクトルを生成するための動き推定ユニットを有する。本システムは、また第1のフレーム、第2のフレームおよび1つ以上の動きベクトルを受け取り、かつ第1と第2のフレームに関連する時間の間にある画像の近似値を生成するための双方向補間ユニットを有する。動き推定ユニットは、初期誤差距離関数を指定する命令;初期誤差距離関数を使用して、初動推定を行なう命令;及び初期誤差距離関数が最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なう命令を含む処理によって、動き推定用の最適誤差距離関数を決定するように構成される。初動推定は動き予測誤差を生成する。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。即ち、動き推定ユニットは、初動推定の動き予測誤差の分布と複数の誤差距離関数の1つと関係する分布との比較に基づいて、初期誤差距離関数が最適誤差距離関数であるか定める命令を含む処理によって、動き推定用の最適誤差距離関数を決定する。そして、初期誤差距離関数が最適誤差距離関数でない場合には、命令には、動き予測誤差の分布に基づいて最適誤差距離関数を選択する命令が含まれる。初期誤差距離関数又は最適誤差距離関数は、フーバーの距離関数であるか、これを含む。動き推定ユニットは、誤差距離関数の形状を決定し、最適誤差距離関数を決定するために当該形状を使用できる。等しい部分区間で複数の中間画像がシステムで計算される場合、システムはスロービデオ効果を生む。システムはフレーム速度変換のために構成される。システムは、第1の周波数での第1のビデオストリームを、第2の周波数での第2のビデオストリームに変換する、双方向補間ユニットに関連した時間を使用するように構成される。
一般に、ある態様はビデオ処理用のスーパー分解能処理を行なうためにシステムを含んでいる。システムは、時間Tのまわりに集められた一群のフレームを受け取り、かつ時間Tの群のフレームと当該群の別のフレームとの間で、1つ以上の動きベクトルを生成するように構成された動き推定ユニットを有する。システムは、一群のフレームと1つ以上の動きベクトルを受け取り、かつ一群のフレームでの各フレームの予測されたバージョンを含む画像を生成するための動き補償ユニットを含んでいる。システムは、また画像を受け取り、画像を処理し、一群のフレームより高い空間分解能がある時間Tでの画像を生成するためのスーパー分解能演算処理装置を含んでいる。動き推定ユニットは、初期誤差距離関数を指定する命令;初期誤差距離関数を使用して、初動推定を行なう命令;初期誤差距離関数が最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なう命令を含む処理によって、動き推定用の最適誤差距離関数を決定するように構成される。初動推定は動き予測誤差を生成する。
これらの実施例や別の実施例には、任意に以下の特徴の1つ以上を含み得る。動き推定ユニットは、初動推定の動き予測誤差の分布と複数の誤差距離関数の1つと関係する分布との比較に基づいて、初期誤差距離関数が最適誤差距離関数であるか定める命令を含む処理によって、動き推定用の最適な誤差メトリック関数を決定できる。そして、初期誤差距離関数が最適誤差距離関数でない場合には、命令には、動き予測誤差の分布に基づいて最適誤差距離関数を選択する命令が含まれる。初期誤差距離関数又は最適誤差距離関数は、フーバーの距離関数であるか、これを含む。動き推定ユニットは、誤差距離関数の形状を決定し、最適誤差距離関数を決定するために当該形状を使用できる。スーパー分解能演算処理装置は、ナイキスト周波数を調整し、画像に関連した分解能を増加させることにより、画像からより高分解能画像を抽出するように構成され得る。
開示された技術は、画像とビデオの正確な動き推定を生成する、正確な誤差分布と誤差距離関数を決定できる。ある実例では、開示された技術は、動き推定に対する最適誤差関数(つまりF())を選ぶ統計的に最適アルゴリズムを生成するために、動き予測誤差の実際の分布を考慮する。生成された動き推定は最適でロバストになりえる。開示された技術は、100の係数を超える程度にまで、動き推定自体における誤差を低減できる。その結果、正確に画像シーケンスをモデル化できるので、画像シーケンスの動き予測誤差が本質的にゼロまで縮小される。ある実施例では、開示された技術は、3D表現された画像やビデオを含む、高品質ビデオおよびデジタル映画の中で使用できる。動き推定用の開示された技術は、導関数をとることにより誤差関数を最小限にして、複雑な動きモデルおよび複雑な技術に最適なアルゴリズムを適格に供給する。
ここに記述された方法と技術の任意のものが、1つ以上の構成部分を備えたシステム、装置又はデバイス、マシン、コンピュータ・プログラム・プロダクト、ソフトウェアで、ハードウェアで、あるいはそれの任意の組合せの中で実施することができる。例えば、コンピュータ・プログラム・プロダクトは、有形的にコンピュータ読取り可能なメディア上でコード化することができ、データ処理装置マシン(例えばデータ処理装置)にここに記述された方法の任意の1つ以上の動作を行なわせる命令を含み得る。
添付の図面と本明細書中において、1つ以上の実施例の詳細が説明される。他の特徴、態様および結果は、発明の詳細な説明、図面および請求項から明らかである。
図1Aはブロック整合技術の基準画像の具体例を示す図である。 図1Bはブロック整合技術の目標画像の具体例を示す図である。 図2Aは濃度(dense)又はパーピクセル(per-pixel)の動き推定技術の基準画像の具体例を示す図である。 図2Bは濃度又はパーピクセルの動き推定技術の目標画像の具体例を示す図である。 図3は確率密度の具体例を示す図である。 図4は誤差距離関数の具体例を示す図である。 図5Aと図5Bは動き推定を行なう具体例を示す流れ図である。 図6はフーバー距離関数の具体例を示す図である。 図7Aはビデオコーディングの区間予測の実施例を示す模式図である。 図7Bはビデオ処理用の時間的補間の実施例を示す模式図である。 図7Cはビデオ処理用のスーパー分解能処理の実施例を示す模式図である。 図8はシステム・モデルの具体例を示す図である。 様々な図面において、同一の参考番号と表示は同一の要素であることを表す。
一般的な目標を遂行するための様々な方法を行うために用いる一般的な構造や技術ならびにその実施態様を以下に記述する。
動き推定技術は、動き領域のコヒーレンスを最大化することと、動き補償誤差または動き予測誤差を最小化することとの間のバランスによって特徴づけられる。動き領域のコヒーレンスは、動き領域の平滑さの面から表現できる。コヒーレントなオブジェクトの動きは各オブジェクトで平滑であり、動き領域はオブジェクト境界だけで不連続である。これらのオブジェクト境界は輪郭縁あるいはシルエットエッジと呼ばれる。
動き推定問題に対処するいくつかの技術がある。しかし、ある動き推定技術は、動き予測誤差(つまり予測画像における誤差)の実際の統計を考慮せずに、単一の誤差距離関数に基づいて全誤差を最小化する。別の動き推定技術は、最小化が行なわれる前に最適誤差距離関数は何であるべきか決めずに、全誤差を最小化することを試みる。これらの動き推定技術のいくつかは、画像の特別のシーケンス用の動き推定のモデル化を考慮することなく、任意に選択された誤差距離関数を使用する強引な方法を使用する。最適誤差距離関数が定められていない場合には、動き或いは画像間のオプティカルフローは、動き補償誤差または動き予測誤差だけを最小化することで完全に決定されるのが難しい。
動き予測誤差の実際の統計に基づいて、統計的に最適誤差距離関数を選択するための技術を以下に述べる。これらの技術についての理解を助けるために、下記の議論では、最初にブロックに基づいた動き推定および濃度(dense)又はパーピクセル(per-pixel)動き推定のための動き推定技術について記述する。次に、その議論では、ブロックに基づいた動き推定アプローチあるいは濃度/パーピクセル動き推定アプローチからさらによく動き推定を決定するように、ある動き推定技術上の制約を加える試みについて記述する。その後、議論は、誤差距離関数の具体例とその特質について記述する。最後に、誤差の実際の統計に基づく統計的に最適誤差距離関数を選択するための技術が記述されると共に、若干の実施例が提示される。
ブロックに基づいた動き推定(Block-Based Motion Estimation)
ある動き推定技術はブロック整合技術(block matching technique)のような「整合」方法を含んでいる。これらの整合法に関しては、動き領域の平滑さの制約は、ある区域上で動き用のパラメトリックモデルを実行することで加えられる。この区域は、ブロック整合技術のブロック又は長方形区域、或いはより一般的には、画像の任意形状領域又はセグメントである。このパラメトリックモデルはより一般的に用いられるが、このモデルは最も普通には単純な変位である。このようなブロック整合技術は、しばしば一様な変位の技術と呼ばれるもので、目標画像中の固定位置ブロックと基準画像中の可変位置ブロックとの間の予測誤差関数の和は、目標画像の各ブロックに対して最小化される。
図1Aは、ブロック整合技術の基準画像100の具体例を示す図である。また、図1Bは、ブロック整合技術の目標画像150の具体例を示す図である。図1Aと図1Bで示されるように、目標画像150中のブロック位置105は基準画像100中の別のブロック位置110に移される。この例において、基準画像100は任意のブロック位置を有している。また、目標画像150は固定のブロック位置を有している。このブロック整合の例において、目標画像150は
Figure 2011508536
と呼ばれ、基準画像100は
Figure 2011508536
と呼ばれる。ここでは、
Figure 2011508536

Figure 2011508536
の水平および鉛直成分は、整数値を有する。目標画像150の各ブロックbは、目標画像のブロックに関する全誤差Eを最小化するように、目標画像150に関係している変位ベクトル
Figure 2011508536
を有する。一般に、全誤差Eは、各ピクセルで予測誤差又は動き補償誤差に適用されるある誤差距離関数F()の総和を指す。全誤差Eは以下のように表現される:
Figure 2011508536
予測誤差
Figure 2011508536
は以下のように表現される:
Figure 2011508536
方程式が表現される通常の方法により、慣例によれば、
Figure 2011508536
が前向き動き推定に対して実際には反対方向である。基準画像は目標画像よりも時間的に早い。
濃度又はパーピクセル動き推定(Dense or Per-pixel Motion Estimation)
図2Aは、濃度又はパーピクセル動き推定技術の基準画像の具体例を示す図である。また、図2Bは、濃度又はパーピクセル動き推定技術の目標画像の具体例を示す図である。濃度動きモデルは、ブロックに基づいたモデルの空間制約を緩めることができる。これらの濃度動き推定(またはパーピクセル動き推定)は画像勾配に由来するもので、ブロックに基づいた/一様変位の技術と類似している。例えば、図2Bで示されるように、目標画像250に各ピクセルの動き推定が存在する。
関数
Figure 2011508536
は、変位領域とか、動きベクトル場と呼ぶことができる(つまり、それはベクトル場である)。そのようなピクセルごとの変位は、しばしば濃度動き推定と呼ばれる。この例において、動き予測誤差
Figure 2011508536
は下記のように表現できる:
Figure 2011508536
すなわち、目標画像250のオブジェクト210での点
Figure 2011508536
は、基準画像200のオブジェクト210’のポイント
Figure 2011508536
に相当する。このモデルは、制限された大きさと位置の矩形ブロックに関して、変位が一定であるという制約を除去できると共に、変位が
Figure 2011508536
の一般的な関数となることを可能にする。濃度動きモデルがブロックに基づいたモデルの空間の制約を緩めることができるので、濃度動きモデルによって、動き推定問題の焦点が変位場
Figure 2011508536
を決定する方法に変更される。
濃度動き推定技術のある具体例はオプティカルフロー方法である。ピクセルごとの変位は、動きのより一般的なモデルを提供するが、ピクセルごとの変位は決定するのがより難しい。ピクセルごとの変位では、一般的な動き推定問題の本質が適切に対処できないおそれがある。濃度動き推定では、一つの目標は、各ピクセルの変位ベクトルの水平および鉛直成分を決定することである。動きが強度画像に由来する場合、その問題は、画像強度中の単一の制約(つまり
Figure 2011508536
であり、これは小さく、理想的にはゼロである)から動き
Figure 2011508536
のこれら2つの構成要素を決定することである。動きの2つの構成要素の決定におけるこのアプローチは、動き微分を未決定とすると共に、信頼性を低くする。言い換えれば、単なる次の動き予測誤差関数
Figure 2011508536
の最小化では、動きを推定する希望の結果に結びつかない。
Figure 2011508536
に拘束がない場合、変位場
Figure 2011508536
に多くの可能性がある。これは、全体的な予測的な誤差、Eに対して、低い値を与える。
動き推定用の情報を加えるために制約を加えること(Adding Constraints to Add Information for Motion Estimation)
ある動き推定技術は、濃度動き推定の制限を克服するために、色彩情報を使用することを試みる。色彩情報には3つのチャネルが含まれ、例えば、輝度Yとクロミナンス・チャンネルのUとV、3原色である赤R、緑G、並びに青B、あるいは別の適切な表示がある。これらのカラーチャネルを各色彩成分の1個と共に使用することによって、3個の制約から動き(2個のパラメータ)を決定する試みがなされる。しかし、実際には、色彩は強度と共に空間に非常に高度に関連しているので、加えられる情報はほとんどない。更に、隣接ピクセル間の相関もまた高度である。平坦で質感がない領域のように極端な場合では、境界を除いては動きを決定する情報がない。統計的見地からは、変位
Figure 2011508536
を決定するのに、
Figure 2011508536
中の領域情報が単純に十分にはない。
Figure 2011508536

Figure 2011508536
がほとんど等しいので、基準画像中の
Figure 2011508536
に十分な情報が存在しないと、等価的にこれは表現できる。この結果は、単に動き推定問題の未確定で不良設定の本質を言い換えたに過ぎない。
予測誤差自体を最小化することだけでは、
Figure 2011508536
を決定するために、画像に十分な情報がないので、
Figure 2011508536
に1つ以上の追加の制約を負わせることは有用である。例えば、第1の付加的な要請は、
Figure 2011508536
にある空間コヒーレンス又は空間的平滑さを課す事である。ある技術では、その勾配
Figure 2011508536
の項で表現されるような、変位場の平滑さ上の追加的拘束を具体化する全誤差が、その事項(term)に加えられる。それゆえ、最小化される全誤差は次のように表現できる:
Figure 2011508536
そして、より合理的な解に達する。関数G()は、F()と類似しているロバストな推定値である。F()とG()のためのロバストな形式によって、オプティカルフロー技術からの改善された推定が得られる。
図1Aから図2Bに関して記述された動き推定技術は、ある場合での追加の制約と共に、
Figure 2011508536
と同様に総和を最小化する傾向がある。以下の明細書に記述された技術では、動き推定を行なう場合に、より正確でロバストな動き推定結果を生むためにどの誤差距離関数F()を選択すべきか、という基本で見落とされた疑問に対処する。以下に、誤差距離関数のある例とそれらの特性が最初に記述され、そして次に、適切な誤差距離関数を選択するための技術が記述される。
誤差距離関数の例(Example Error Metric Functions)
一般に誤差距離関数F()には、3個の主要な分類がある:
(1) F(u)=|u|、平均絶対差(MAD)、又は等価的に、絶対差の総和(SAD)として一般に知られており、圧縮の中で使用される;
(2) F(u)=u、平均二乗誤差(MSE)、又は等価的に、2乗誤差の総和(SSE)として一般に知られている;
(3) F()はロバスト推定値である。
絶対値距離(1)は、しばしば絶対差の総和(SAD)として行われるものであるが、一般に圧縮のために好まれる。圧縮効率のために、あるいは単にこれが計算するのに最も容易な距離であるという理由で、この距離が選ばれる。2乗誤差の総和(SSE)(2)は、最小二乗の問題や解決の根拠になる。ロバスト推定値(3)は、内在するモデルの妨害や(2)の2乗の法則を単純に回避するための、いくぶん洗練されてない試みである。ロバスト推定値を使用する基礎的な論理的根拠は、誤差が2つのクラス、即ち想定するモデルに適合する誤差と、想定するモデルに適合しない誤差(又は「異常値」と呼ばれる)、に分類される点である。しばしば、これらの異常値はSSE計算で優勢をふるい、その有効性を下げる。
誤差距離関数の3つの主要な分類は、最尤推定法理論に照らして次に記述される。その後、動き予測誤差自体の解析に基づいて最適誤差距離関数を選択する技術が記述される。最適誤差距離関数は、動き予測誤差自体の最良モデルである誤差距離関数を参照すると共に、別の種類の誤差距離関数を使用する場合に得られる動き推定と比較した時に、相応して、動き予測自体の最小誤差を有する。
実際上、異なるサイズの誤差と重要度の誤差がある。ここで、あるピクセルは小さな誤差を有し、別のピクセルは大きな誤差を有する。誤差距離関数F()の目的は、総合誤差が最小化される処理の間に、比例して適切に大小の誤差を比較考量する。
統計的感覚では、大小の誤差間の最適な重みづけは、動き予測誤差
Figure 2011508536
に内在する確率分布に由来する場合がある。実際上、この誤差の分布は一般的に未知である。この分布に由来する最適な重みづけの使用によって、生成される動き推定での不確実性を最小限にされる。そのような最適な重みづけのための式は、最尤推定法理論の統計概念から来る。最尤推定法理論は、どのように誤差距離関数を与えられた分布に関連づけるかの方法を示す。最大尤推定法理論は、与えられたデータ(例えば画像)に基づいた分布のパラメータ中(この状況では
Figure 2011508536
又は
Figure 2011508536
である)で、最も確率が高いか最も有望である評価を決定する正確な方法と説明できる。最大尤推定法理論は、与えられた画像
Figure 2011508536
および
Figure 2011508536

Figure 2011508536
又は
Figure 2011508536
に対する条件付確率を正式に最大化する。
単純な実施では、最大尤推定法理論は、初めに予測誤差の統計のために既知の形式を仮定できる。最も単純な仮定は、各ピクセルの誤差
Figure 2011508536
が確率密度
Figure 2011508536
と独立していると仮定することである。このとき、未知パラメータ(この場合は動き)用の最尤推定量は、総和
Figure 2011508536
を最小化することで見つかる。
ある態様では、動きベクトル用の最尤推定量は、生成された動き推定が実際得ることができる最良値である確率を最大化する予測値に属する。共同の事象(これらの誤差)に対する確率が、すべての個々の事象(各ピクセルの動き予測誤差)の確率の積であるので、この確率又は可能性は個々のピクセルに対する可能性の積を指す。この可能性の乗算は、素早く非常に小さな数値を生成する。また、実際に、非常に小さくなるので、それらは浮動小数点数の演算で表わすのが難しい。関数の最大値が、関数の対数の最大値と同じ値で生じるので、可能性の対数値が最大化される。これは積を和に変える。数学上、ある数の対数の最大化は、そのある数の負数を最小化することである。最適な動き推定の推定値が最尤推定法的センスで得られる場合、そのとき、例えば
Figure 2011508536
は最小化される。
したがって、誤差距離関数F()に対するすべての選択は、特別の分布に対してだけ最適である。全誤差が最小化されるような任意の特別の誤差距離関数に関しては、結果が最尤推定法的センスにおいて最適であるか不明瞭になる。
例として、F(z)= |z|が誤差距離関数として選ばれると仮定する。ブロック整合の場合には、例えば、全誤差Eが次の式であるとする。
Figure 2011508536
この全誤差は、絶対差の総和(またはSAD)を表わす。
Figure 2011508536
の関数としてこの全誤差を最小限にすることは、予測誤差の分布
Figure 2011508536

Figure 2011508536
の真の値でラプラス分布だった場合(両側の指数関数)、
Figure 2011508536
に対する最尤推定量でもある動き推定値
Figure 2011508536
を生成する。ラプラシアン確率分布は、次式で表現される:
Figure 2011508536
ここで、bは尺度母数である。対応する確率分布は、次式で表現される:
Figure 2011508536
数学上、それが1の累乗の絶対値を含むので、「L1」距離関数として、この誤差距離関数が表現される。
その代わりに、
Figure 2011508536
が誤差距離関数に選ばれると仮定する。そのとき、全誤差は2乗された差の総和(SSD)である。予測誤差がガウス分布の場合、全誤差の最低値は最尤推定量を与える。予測誤差がガウス分布の場合、確率密度は、次式で表現される:
Figure 2011508536
ここで、σはしばしば標準偏差と呼ばれる尺度母数である。対応する確率分布は誤差関数の項、erf () から書かれる。確率分布関数は、次式で表現される:
Figure 2011508536
数学上、この種類の誤差距離関数は、「L2」距離関数として表現される。L2距離関数の総和がブロック中の点の数によって正規化される場合、SADは平均絶対値誤差(MAD)になり、また、SSDは平均二乗誤差(MSE)になる。
ブロック整合は圧縮の中で使用される傾向があるので、誤差距離関数F()の選択は重要ではない。ここで、圧縮は動き推定と動き補償における誤差に期せずしてロバストである。典型的には、絶対値、すなわちL1距離関数は、二乗、すなわちL2距離関数と同じ程度或いはよりよく作動でき、加えて、また圧縮のために (例えば、乗算がないため) 計算がより簡単になる。それゆえ、SADは、圧縮において大抵普遍的である。しかし、圧縮は真実の動きを求めないし、また、真実の動きが目標である場合、最適誤差距離関数を実際に見つけることは、無視されるべきでない。
L1とL2距離関数以外に、使用できる別の種類の誤差距離関数がある。例えば、そのようなアプローチのひとつは、一般化されたガウス分布を使用することである。その場合には、誤差の絶対値は、1または2のような整数のべき乗値、あるいは0.9または1.3のような任意の非整数のべき乗値でべき乗できる。これは、L1とL2の距離を統一し一般化するための、アプローチを表わす。
また、「異常値」と呼べるような、大きな誤差に対して感受性が低いF(z)に対する選択が存在する。1例は2乗誤差距離関数に基づくもので、値Tに対するあるしきい値Tより大きな二乗誤差を切り捨てることである。この例の誤差距離関数は、「先を切られたガウス分布の誤差距離関数」と呼ばれる。その上の様々な同様の関数は、ロバスト統計学の分野で開発されている。この種類の距離関数の一例はコーシー分布と関係があり、「Lc」距離と呼ばれる。コーシー分布は、また「コーシー=ローレンツ」分布、又は「ローレンツ」の分布として知られるもので、ガウス分布やラプラス分布よりも長い尾部を有しており、したがって、よりロバストになる。コーシー分布に関しては、確率密度は、次式で表現される:
Figure 2011508536
ここで、αは尺度母数である。ある場合には、αが振幅の半分で半値幅を表わす。対応する確率分布は、次式で表現される:
Figure 2011508536
図3は、確率密度の具体例を備えた線図300を示す図である。図3に示されるように、下記に述べられた3つの分布状態(ガウス分布330、ラプラス分布320およびコーシー分布310)に対する確率密度は、質的に類似している。
ガウス分布330が最もよく振る舞う分布と考えられる場合、コーシー分布310は最悪に振る舞うと考えられる。例えば、コーシー分布310の尾部は、一次と二次モーメントの積分値が不確定になるほどに、十分に長い。それゆえ、平均と分散はコーシー分布310では不確定である。
これらの3つの分布状態に対する確率密度は質的に類似するように見えるが、対応する誤差メトリック関数は大いに異なる。各分布の誤差距離関数は、次式で表現される:
Figure 2011508536
図4は、誤差距離関数410、420、430の具体例を備えた線図400を示す図である。図4では、3つの誤差距離関数が(単一の縮尺係数で)図示される。ここで、L1 420、L2 430およびLc410の誤差距離関数が、線図400に示される。特に、L1 420はラプラス分布の誤差距離関数である。L2 430はガウス分布の誤差距離関数である。また、L3 410はコーシー分布の誤差距離関数である。図3の線図300内での個々の分布状態中の差の評価と比較された時、個々の誤差距離関数中の差は、図4の線図400でより明白に示される。誤差距離関数と対応する分布状態との間における線図300、400の差のこの比較は、任意に誤差距離関数を選択することに関する問題の難解な箇所を見せる。即ち、誤差分布は類似するように見えるが、誤差距離関数は相当異なる。それは動き推定の精度に無視できない効果がある。
最適誤差距離関数を決定する技術
動き推定を行なう場合、誤差距離関数の任意選択は実際の誤差分布に合致しない。誤差自体の実際の分布がガウス分布ならば、ガウス分布では異常値がめったに生じないため非常に行儀がよいので、例えば、精度に関する問題の多くはない。例えばSSE(L2)距離が最適であり、さらにSAD(L1)距離も圧縮のために十分に旨くゆく。しかし、1つの問題は、これらの動き予測誤差は明らかに非ガウス誤差である傾向がある点である。例えば、いくつかの異なる応用例に関する研究によると、ガウスの仮定が常に予測誤差の実際の分布への最も芳しくない適合であり、両側指数関数分布(あるいはラプラス分布)はガウス分布よりよくて、時々は最良であり、また、コーシー分布は多くの場合3つの分布状態の最良の適合だったとの結論を下した。
予測誤差の実際の分布は、動き推定のための最適アルゴリズムを統計的に生成するために使用できる。例えばある実施例中で、予想誤差の分布は、動き推定に対する最適の誤差距離関数、つまりF()、を選ぶために使用される。ここで、最適の誤差距離関数は、動き推定からの実際の動き予測誤差を正確にモデル化し、別の種類の誤差距離関数で生成された同じ動き推定と比較される時、最小の誤差を備えた動き推定を生成する。
図5Aから図5Bは、動き推定を決定する具体例を備えた、流れ図500および505を示す図である。ある誤差距離関数を盲目的に適用するから尚更、予測誤差の分布は分析され、誤差距離関数を選択するために使用される。例えば、最適誤差距離関数が選択され、次に動き推定はこの最適誤差距離関数を使用して行なえる。最適誤差距離関数の選択には、この解析のある点で、最適誤差距離関数が動き予測誤差自体の分布の解析に基づくべきものが何であるかを、実際に決定することを取り込む。
図5Aは、動き推定のための例を備えた流れ図500を示す図である。初動推定は、予測誤差の分布を明らかにするために、統計的最適アルゴリズムに後続させて行なわれる(505)。初動推定からの動き予測誤差の実際の分布に基づいて(505)、最終動き推定用の最適誤差距離関数F()が選択される(580)。(例えば図3と図4の間で図示されたように) 特定の誤差距離関数に対応する分布状態が知られているので、一旦予想誤差の実際の分布が初動推定から決定されたならば、最適誤差距離関数が選択できる。そのとき、最終動き推定は最適誤差距離関数を備えて行なわれる(590)。
図5Bは、図5A中で示される作用(505)に対してより詳細を提供する例を示す流れ図である。図5Bでは、初動推定が行なわれる(510)。また、誤差ヒストグラムが最適誤差関数の決定を支援するために計算される。初動推定には、例えば第1のフレーム、第1の場面あるいはフレームのシーケンスに関連した動き推定を含む。
図5Aから図5Bの動き推定技術の1つの具体例では、以前に記述された3つの分布状態(ガウス分布、ラプラス分布およびコーシー分布)が分布の可能性である。また、観測された誤差データに対して最良適合するのは、どの候補の分布であるかの決定がある。ある実施例では、この例からの分布状態の種類や数を加えるか、交代するか、変更できるが、これらの3つの分布状態の具体例は、ここに提示された概念に対するある態様を実証する役目をする。
記述されるように、処理は初動推定(510)から始まる場合がある。初動推定は初めに最適誤差距離関数を使用しなくてもよい。追加情報がない状態では、3つの分布状態の「中間の」分布がスタートする分布として使用できる。この例において、ラプラス分布は、ガウス分布とコーシー分布との間の中間分布である(例えば、ラプラス分布に関連する誤差距離関数420は、図4中の中間あるいは間の誤差距離関数である)。したがって、初動推定は、L1距離関数用の関数で行なえる。
この初動推定が行なわれた後、予想誤差のヒストグラムが計算できる(530)。また、処理は次に、どの分布が観測された動き予測誤差データへの最良適合か決めるように、誤差分布をモデル化し始める(560)。たいていの画像が約100万の桁のピクセルであるので、ヒストグラムは正確に図で描かれる傾向がある。
ヒストグラムを計算した後に(530)、何れの分布が観測された誤差データへの最良適合であるかの決定が、2段階で生じる。第1段階では、スケール係数の決定があり(550)、それは各誤差距離関数に関連した候補分布状態に適切である。すなわち、その処理では、計算された誤差ヒストグラム(530)への最良適合であるガウス分布用のσ、計算された誤差ヒストグラム(530)への最良適合であるラプラスの分布用のb、そして、計算された誤差ヒストグラム(530)への最良適合であるコーシー分布用のαを決定できる。これらのスケール係数を与えられて、観測されたヒストグラムを備えた各分布のために、分布適合用のカイ二乗検定のような、統計的検定が行なわれる(570)。そのとき、計算された誤差ヒストグラム(530)への最良適合を備えた分布は、対応する誤差距離関数が何であるべきかを示している。したがって、最適誤差距離関数はヒストグラムへの最良適合を備えた分布に基づいて、選択される(580)。そして、この最適な距離関数は、最終の動き推定を行なうために使用される(590)。
ある場合には、初動推定のために初めに選ばれた誤差距離関数が、実際にも最適誤差距離関数になりえる(例えば図5B中の初動推定(510))。この場合、図5B中で示される処理は、この最適誤差距離関数が事実、最適誤差距離関数であるかどうかを単純に判断することである(例えばステップ530、550、570)。初めに選択された誤差距離関数が最適誤差距離関数である場合、最適の誤差関数の選択を行なうか(580)あるいは最終の動き推定を行なう(590)必要はない。
他の実施例中で、初動推定が連続的微分可能な誤差距離関数を必要とする最小化方法を使用する場合、フーバーの距離関数用の誤差距離関数が、L1距離関数用の誤差距離関数の代わりに初めに使用することができる。L1距離関数に関連した誤差距離関数が零点で不連続であるので、L1距離関数用の誤差距離関数には零点で不確定の導関数がある。他方では、フーバーの距離関数は大きな誤差用のL1と小さな誤差用のL2を有すると解釈できる。フーバーの距離関数は零で連続的で、導関数を使用する最適化技法で使用できる。その結果、フーバーの距離関数は、アファイン変換のモデルや遠近法のモデルと同様に、より複雑な動きモデルに使用されるのによく適している。これらの最適化モデルの一部は、導関数をとることにより誤差距離関数を最小化する関数を有する。しかし、これはL1距離関数と関係する誤差距離関数に適合しない。
図6は、フーバーの距離関数の具体例を備えた線図600を示す図である。フーバーの距離関数は、次式で定義され:
Figure 2011508536
そして、図6でプロットされた610である。ここでεは1と等しい。図6に図示されるように、フーバーの距離関数は零で連続的である。
従って、ある実施例では、フーバーの距離関数と関係する誤差距離関数は、初動評価で使用される。フーバーの距離関数と関係する誤差距離関数は、初動推定(510)用の第1の場面や第1のシーケンスでの第1のフレームのために特に処理される。最良適合のための統計試験が行なわれて(570)、最適誤差距離関数が選択された(580)後で、その第1の場面又は第1のシーケンスの次のフレームは、フーバーの距離関数と関係する誤差距離関数の代わりに生成された最適誤差距離関数を使用できる。後続の場面の第1のフレーム又は後続のフレームのシーケンスが始まる場合(つまり、第1の場面の第1のフレームの後に現われるある場面の第1のフレーム、又は第1のフレームのシーケンスの後に現われる後続のフレームのシーケンス)、フーバーの距離関数と関係する誤差距離関数は、後続の場面の第1のフレームか後続のシーケンスの初動推定中の誤差距離関数として再び選択でき、そして一旦その最適な距離関数が最終動き推定のために決定されれば、後者は次に選択された最適誤差距離関数と取り替えられる。
実施形態
別の実施例では、開示された技術は、アファイン変換や遠近法のモデルより複雑化されるか、より複雑な動きモデルと共に使用できる。ある実施例では、開示された技術は、高品質ビデオやデジタル映画中で使用でき、また3D映画と共に使用する。
少数の実施例だけが上記に詳細に開示されたが、別の実施例も可能である。また、発明者は別の実施例がこの明細書内に包含されることを意図する。本明細書は、別の方法で遂行されてもよいより一般的な目標を達成するために特定の例について記述する。この明細書の記載は、具体例として意図される。また、請求項は、いかなる修正や代替策もカバーするように意図される。
例えば図5A、図5B、図6において、ここに記述された動き推定技術は、任意の装置及び/又は動き推定を使用するシステムに適用される。動き補償及び/又は動き推定に使用する装置及び/又はシステムのある具体例には、圧縮、時間的補間(例えばスローモーションとフレーム速度変換)およびスーパー分解能処理に関する装置又はシステムを含む。例えば、一般的な感覚では、そのような装置及び/又はシステムは、異なる時点で画像に近似するために動き推定を使用する。近似(例えば予測)は動き推定に使用でき、動き補償を含む。
図7Aは、ビデオコーディングの区間予測の実施例710を備えた構成図を示す。図7Aは動き推定ユニット716、動き補償ユニット720および減算器724を示す。これらの構成部分(例えばユニット716、720、724)はビデオコーディング用のビデオエンコーダである。
ビデオコーディングでの2つの種の符号化方法は、区間(intra)(フレーム内)と中間(inter)(フレーム間)符号化タイプである。具体的な実施例710は、ビデオコーディングの区間予測の具体例を示す。この例で、ピクセル712のブロック(典型的には8x8)と、フレーム714は両方とも動き推定ユニット716に送られる。ここで、ピクセル712のブロックはコード化されている。また、フレーム714は先にエンコードされてデコードされた。動き推定ユニット716は、このブロック用の動きベクトル718を生成する。この動ベクトル718および先にデコードされたフレーム714は動き補償ユニット720の入力に送られる。動き補償ユニット720は、コード化されているピクセル712のブロックに近似する予測値722を生成する。単一の動きベクトル718がピクセル712のブロック中ですべてのピクセルの真実の動きを常に表わすとは限らないので、予測722はピクセル712の入力ブロックと正確には同じではない。予測値722およびピクセル712の入力ブロックは、差異画像ブロック726(例えば残差)を生成するために、減数器724で控除される。そして、この差異画像ブロック726は変形され、量子化され、そしてエントロピー符号化される。図5Aから図6で詳述されるような先進の動き推定技術の使用によって、動きベクトル718は改善される。予測値722はより正確になり、差異画像ブロック726(例えば残差)はより小さくなり、残差をより容易にエンコードできる。
図7Bは、ビデオ処理用の時間的補間の実施例730を備えた構成図を示す。動き推定と動き補償は、動き補償された時間的補間の高品質システム中で使用でき、それは730に示される。ここで、フレーム732とフレーム734の2つのフレームは、時間的に隣接するものであるが、動き推定ユニット736に供給される。また、複数の動きベクトル738が計算される。そのとき、2つのフレーム732、734および動きベクトル738は、双方向補間ユニット740に供給される。双方向補間ユニット740は、入力フレームの時間の間にある中間時刻での画像742の近似値を生成する。等しい部分区間の期間で複数の中間画像が計算される場合、結果として高品質のスローモーションの効果を生む。フレーム速度変換アプリケーションでは、例えば、双方向補間ユニット740に選ばれた時間は、第1のビデオストリーム(例えばアメリカ合衆国で使用されるような60Hz(59.97Hz)のビデオストリーム)を第2のビデオストリーム(例えばヨーロッパの中で使用されるような50Hzのビデオストリーム)に変換するために使用できる。
図7Cは、ビデオ処理のためのスーパー分解能処理の実施例を備えた構成図を示す。図7Aと図7Bの各々の実施例710と730で図示されるように、動き推定のあるアプリケーションでは、1組のみではなくそれ以上の画像を含んでいる。時間的補間およびスーパー分解能のある実施例では、不正確な動き推定によって引き起こされた誤差用の補正がなされないので、(例えば図5Aから図6で)開示された先端の動き推定技術を使用する場合、時間的補間とスーパー分解能は増強された結果を提供できる。
「スーパー分解能処理」は、一般には、より下位の分解能画像のシーケンスから解像度の高い像を抽出するための技術を指す。スーパー分解能処理のある応用例は、監視(例えば、映像監視カメラ中のより下位の分解能画像から解像度の高い像を生成すること)、および天文学(例えば、離れた天体のより下位の分解能画像から解像度の高い像を生成すること)の領域にある。スーパー分解能処理の具体例で、2つの画像の動きベクトルが全体のピクセルでない場合、そのとき動き補償後の2つの画像は、ナイキスト周波数より下位では基本的に同じであるが、しかしナイキスト周波数の上位では異なる。複数の画像が、オリジナル画像のナイキスト周波数を越えた情報を明確にするために使用される。この処理によって、ナイキスト周波数を増加することが可能になり、したがって分解能が増加する。
図7C中で、実施例770は、スーパー分解能処理用の全体的な構成図を示す。この例において、時間T付近の一群のフレーム772は動き推定ユニット774への入力である。一群のフレーム772は、時間Tのフレームとそのフレーム付近の別のフレームを含んでいる。動き推定ユニット774で、動きベクトル776は、時間Tのフレームとそのフレーム付近の別の各々のフレームとの間で算出される。これらの動きベクトル776およびフレーム772の入力群は、動き補償ユニット778への入力である。動き補償ユニット778は、すべてのフレーム入力772に対して時間Tのフレーム(例えば画像780)の予測されたバージョンを生成する。この例のある実施例では、画像780はすべて単一の時間Tに関連する。画像780はスーパー分解能演算処理装置782への入力である。スーパー分解能演算処理装置782は、入力画像(例えば一群のフレーム772)より高度の空間分解能を有する時間Tでの単一画像を生成するために画像780を処理する。
図8は、システム・モデルの具体例を示す図である。開示された技術は、1つ以上のコンピュータ805A、805B上で使用する。ここでの1つ以上の方法、及び/又はアルゴリズム、及び/又は処理は、コンピュータ、及び/又は映像ディスプレイ820、伝達装置、処理装置および再生装置中に実装されて、或いは採用されて使用される。ここに記述されたコンピュータは、任意の種類のコンピュータであり、例えば汎用コンピュータや、ワークステーションのような特定の目的コンピュータのいずれでもよい。コンピュータ805Bは、例えばインテルかAMDベースのコンピュータで、ウィンドウズXP(登録商標)、Vista(登録商標)、リナックスが走る機器、またはマッキントッシュ・コンピュータである。ある実施例では、コンピュータが、例えばPDA815、携帯電話815あるいはラップトップ805Aのようなハンドヘルド・コンピューターである。コンピュータは、画像記録または画像認識マシン825、830、835、処理マシン、記憶装置840および特にビデオデータのデータ配布機器や機器の部品を指す。
コンピュータ及び/又はグラフィックのプログラムはC、パイソン(Python)、又はジャバ(Java)、ブリュー(Brew)または別のプログラミング言語で書かれてもよい。プログラムは記憶メディア上で駐在する。記憶メディアは、例えば、磁気的や光学的であり、例えばコンピュータ・ハードドライブ、リムーバブル・ディスク、メモリステック(登録商標)又はSDメディアのようなリムーバブルメディア、有線又は無線ネットワークあるいはブルートゥース(登録商標)ベースのネットワーク装着記憶装置(NAS)、あるいは別の取外し可能なメディアである。プログラムも、例えば、ローカルマシンに通信を送るサーバーあるいは別のマシンと共に、ネットワーク850上で実行される。ネットワーク850は、ローカルマシンがここに記述された動作を実行することを可能にする。
この明細書に記述された主題および機能的な動作の実施例は、デジタル電子回路部品、コンピュータ・ソフトウェア、ファームウェアあるいはハードウェア中で実施することができ、これらには、この明細書で開示された構造体、およびそれらの構造体の等価物、あるいはそれらの1つ以上の組合せを含んでいる。この明細書に記述された主題の実施例は、1つ以上のコンピュータ・プログラム生成物、つまり、データ処理装置によって実行され、あるいは動作を制御するためのコンピュータ読取り可能な媒体上で有体的にエンコードされたコンピュータ・プログラム命令の1以上のモジュールとして、実施される。コンピュータ読取り可能なメディアは、マシン可読の記憶装置840、マシン可読の記憶基板、メモリ素子、マシン可読の命令を達成する組成物あるいはそれらの1つ以上の組合せになりえる。用語「データ処理装置」は、処理データ用の機器、装置およびマシンをすべて包含するもので、例としてプログラム可能なプロセッサ、コンピュータあるいはマルチプロセッサ、コンピュータを含む。装置は、ハードウェアに加えて、問題になっているコンピュータ・プログラム用の実行環境を生成するコードを含む。このコードは、例えばプロセッサ・ファームウェア、プロトコールスタック、グラフィカルなシステム、データベース管理システム、オペレーティング・システムあるいはこれらの組合せを構成する。
コンピュータ・プログラムは、またプログラム、ソフトウェア、ソフトウェア・アプリケーション、スクリプトあるいはコードとして知られているもので、コンパイル型言語やインタープリタ型言語を含む、任意の種類のプログラミング言語の形式で書くことができる。コンピュータ・プログラムは、スタンドアロンやモジュール、コンポーネント、サブルーチンあるいは計算機環境で使用するにふさわしい別のユニット等の任意の形式で配置される。コンピュータ・プログラムは、必ずしもファイル・システムでのファイルに相当しない。プログラムは、別のプログラムあるいはデータ(例えば、マークアップ言語のドキュメントに蓄積された1つ以上のスクリプト)を保持するファイルの一部、問題のプログラムに専念している単一のファイル、あるいは多数の統合化ファイル(例えば1以上のモジュール、サブ・プログラム、又はコードの一部を蓄積するファイル)に蓄積できる。コンピュータ・プログラムは、1台のコンピュータ、あるいは1つのサイトに位置するか、多数のサイトにわたって分布する多数のコンピュータ上で実行され、かつ通信網によって相互に連結するために配置されることができる。
この明細書に記述され示された処理と論理の流れおよび図面は、入力データ上で作動し出力を生成することにより機能するように、1つ以上のコンピュータ・プログラムを実行する、1つ以上のプログラム可能なプロセッサによって行なう。例えばFPGA(フィールドプログラマブルゲートアレイ)やASIC(特定用途向け集積回路)のような特別目的の論理回路類によって、処理と論理の流れが実施され、また装置も実装できる。
コンピュータ・プログラムの実行にふさわしいプロセッサは、例として、汎用のマイクロプロセッサーと特別目的マイクロプロセッサーの両方と、任意の種類のデジタル計算機の1つ以上のいかなるプロセッサが含まれる。通常、プロセッサは、読み取り専用メモリまたはランダムアクセス記憶装置あるいは両方から、命令及びデータを受ける。コンピュータに不可欠の要素は、命令を行なうためのプロセッサおよび命令とデータを蓄積するための1つ以上のメモリ素子である。通常、コンピュータは、データを受信し又はデータを伝送し、あるいは両方をするように効果的につながれた、データを蓄積するための1台以上の大量貯蔵装置、例えば、磁気、光磁気ディスク、または光ディスクを含む。しかしながら、あるコンピュータにはそのような装置がある必要がない。さらに、コンピュータは別の装置に埋め込むことができ、2〜3例を挙げると、例えば移動電話、携帯情報端末(PDA)、モバイルのオーディオ・プレイヤー、全地球測位システム(GPS)受信機がある。コンピュータ・プログラム命令およびデータを蓄積するのにふさわしいコンピュータ読取り可能な媒体は、不揮発性メモリ、媒体およびメモリ素子の形式をすべて含んでおり、例えば、半導体記憶装置(例えばEPROM、EEPROM、フラッシュメモリ装置)、磁気ディスク(例えば内部ハードディスク、リムーバブル・ディスク)、光磁気ディスク、CDROM、DVD−ROMディスクである。プロセッサとメモリは、特別目的論理回路類によって追加されるか、あるいは組み込まれる。
使用者との相互作用を提供するために、この明細書に記述された主題のある実施例は、使用者への情報の表示用の表示装置(例えばCRT(陰極線管)、LCD(液晶ディスプレイ)、プラズマディスプレイモニタ820)、並びに使用者がコンピュータに入力を送れるように、キーボードとセレクター(例えばポインティングデバイス装置、マウス、トラックボール) を有するコンピュータに実装される。別の種類の装置が、同様に使用者との相互作用を提供するために使用できる。例えば、使用者に提供されるフィードバックは、感覚フィードバックの任意の種類になりえるもので、例えば視覚フィードバック、聴覚フィードバック、触覚フィードバックがある。また、使用者からの入力は、例えば音響、スピーチ、あるいは触覚の入力を含む任意の種類で受け取ることができる。
この明細書に記述された主題のある実施例は、バックエンド構成部分(例えばデータサーバ)、ミドルウェア構成部分(例えばアプリケーション・サーバー)、フロントエンド構成部分(例えば図式ユーザーインターフェースがあるクライアントコンピュータや、使用者がこの明細書で記述された主題の実施例と互いに影響し合うことができるウエブブラウザー)、またはバックエンド、ミドルウェア、あるいはフロントエンド構成部分の1つ以上の任意の組合せを含んでいるコンピューティング・システム中で実施できる。システムの構成部分は、ディジタル・データ通信(例えば通信網)の媒体や任意の種類によって相互に連結することができる。通信網の具体例はローカル・エリア・ネットワーク(「LAN」)や例えばインターネットのような広域ネットワーク(「WAN」)を含む。
コンピューティング・システムはクライアントとサーバーを含む。クライアントとサーバーは、一般に互いから遠くにあり、典型的には通信網を通して相互に作用する。クライアントとサーバーの関係は、それぞれのコンピュータ上で作動し、互いにクライアントサーバー関係を持っているコンピュータ・プログラムによって発生する。
この明細書には多くの詳細が含まれているが、これらは、発明の範囲や特許請求される範囲に対する制限としてではなく、発明の特別の実施例に特有の機能の記述として解釈されるべきである。別々の実施例のコンテキスト中でこの明細書に記述される一定の機能も、単一の実施例中で組合せて実施できる。反対に、単一の実施例のコンテキストに記述される様々な機能も、多数の実施例中で別々に、あるいは任意の適切なサブ組合せ中で実施できる。さらに、ある機能は一定の組合せの中で作用すると上に記述され、また初めからそのように請求されている場合でも、ある場合には1つ以上の機能が請求された組合せから削除することができ、また、請求された組合せは、サブ組合せあるいはサブ組合せの変型に向けられてもよい。
同様に、動作が特別の順序で図面中に描写されているが、これは、望ましい結果を達成するためには示された特別の順序、あるいは連続する順序で動作が行なわれるか、図示された動作がすべて行なわれることを要求するとは了解すべきでない。一定の状況では、マルチタスキングと並行処理は有利である。さらに、上に記述された実施例中の様々なシステム構成部品の分離は、すべての実施例中でそのような分離を必要とするものとは了解されない。また、記述されたプログラム構成部品とシステムは、通常はともに単一のソフトウェアかハードウェア生成物に統合されるか、或いは多数のソフトウェアかハードウェア生成物へパッケージ化されることが理解される。
用語「アルゴリズム」はステップ、方法、処理、スキーム、処理手順、動作、プログラム、ガイドライン、技術、シーケンス、1組の原則あるいは命令を指す。例えば、アルゴリズムは、ハードウェア及び/又はソフトウェア・ビデオプロセッサのための1組のビデオ処理命令でありえる。アルゴリズムは、1台以上の計算装置及び/又はマシン(例えば、ある場合に、人間の対話なしで行なわれる)によって蓄積され、生成され、処理される。開示されたアルゴリズムは、ビデオ関連のシステムと関係があり、ビデオ関連のシステム及び/又は任意の装置、マシン、ハードウェア、及び/又は処理、圧縮、記憶、伝達、受信、試験、較正、表示及び/又はビデオデータ用の任意の組合せにおける任意の改良に対する製品で実施され、生成され、関連され、及び/又は使用される。これらのアルゴリズムと技術は特定のコーディング標準に制限されておらず、コーディング標準に加えて、又はコーディング標準の外側で使用される。また、コード化する性能を改善するために、ビデオコーディング装置中のコード体系の間でコード化の依存性が調査される。
動き推定は、上述された手法で動き推定を改善する最適の誤差関数を選択するために任意のアルゴリズムを利用できる。これには、ブロックベースと領域ベースの動き推定を改善すること、位相相関、ピクセル再帰的な技術および同種のものを含む。そして、平行移動、アファイン変換、パラメータ、並びに他のものを含む様々な動きモデルが使用される。明細書の特定の実施例では、動き推定自体における誤差を最小限にするために動き予測誤差の分布を使用する実施例が記述された。ある実施例は、予測誤差の分布の解析及び/又は異なる分布状態用の異なる誤差距離の解析に関する技術を含む。ある実施例は、演繹的な情報(例えば、距離Xは最適である) 及び/又は予想誤差の実際の分布の解析を使用して、最適誤差距離を選択するための技術を含む。ある実施例では、誤差分布の形は最適誤差距離を決定するために使用される。ある実施例中で、最適誤差距離が使用される場合、誤差分布はゼロ付近で強化される(即ち、誤差は最適誤差距離でより小さい)。また、ある実施例では、誤差分布の全体的な形は同じである。別の実施例は以下の請求項の範囲内である。

Claims (67)

  1. ビデオデータの動き推定(motion estimation)用の最適誤差距離関数(optimal error metric function)を決定するための画像の動き推定用の方法であって、
    初期誤差距離関数を指定し;
    前記初期誤差距離関数を使用して初動推定(initial motion estimation)を行ない、ここで、前記初動推定が動き予測誤差(motion prediction errors)を生成し;
    前記初期誤差距離関数が前記最適誤差距離関数でない場合、選択された最適誤差距離関数を使用して、最終動き推定を行なうこと;
    を特徴とする方法。
  2. 請求項1の方法において、さらに、前記初動推定の前記動き予測誤差の分布と、複数の誤差距離関数の1つに関連づけた分布との比較に基づいて、前記初期誤差距離関数が最適誤差関数であるかを判断することから成ることを特徴とする方法。
  3. 請求項2の方法において、前記初期誤差距離関数が前記最適誤差関数でない場合、前記方法がさらに、前記動き予測誤差の分布に基づいた前記最適誤差距離関数を選択することから成ることを特徴とする方法。
  4. 請求項3の方法において、前記初動推定を行なう方法は、前記動き予測誤差を決定するために前記初期誤差距離関数を処理することから成ることを特徴とする方法。
  5. 請求項3の方法において、さらに前記初期誤差距離関数に関連した初期確率分布を指定することから成ることを特徴とする方法。
  6. 請求項3の方法において、前記初期誤差距離関数が前記最適誤差関数であるか判断することは、前記初期誤差距離関数用の前記動き予測誤差のヒストグラムを計算することから成ることを特徴とする方法。
  7. 請求項6の方法において、前記初期誤差距離関数が前記最適誤差関数であるか判断することは、前記ヒストグラムの統計的最良適合のための分布を決定することから成ることを特徴とする方法。
  8. 請求項7の方法において、前記統計的最良適合のための分布を決定することは、前記最適誤差距離関数の確率分布用のスケール係数を決定することから成ることを特徴とする方法。
  9. 請求項8の方法において、前記確率分布の候補は、ガウス分布、ラプラス分布、及びコーシー分布から成ることを特徴とする方法。
  10. 請求項8の方法において、前記スケール係数を決定した後に、最良適合分布のための統計試験を行なうことを、さらに含むことを特徴とする方法。
  11. 請求項10の方法において、前記統計試験は分布適合のためのカイ二乗検定を行なうことから成ることを特徴とする方法。
  12. 請求項11の方法において、前記初期誤差距離関数はフーバーの距離関数であることを特徴とする方法。
  13. 請求項3の方法において、前記初期誤差距離関数は複数の確率分布における中間の確率分布に関連することを特徴とする方法。
  14. 請求項13の方法において、前記複数の確率分布は、ガウス分布、ラプラス分布、又はコーシー分布から成ることを特徴とする方法。
  15. 請求項1の方法において、前記初期誤差距離関数は、絶対差の総和(SAD)、2乗された差の総和(SSD)、平均絶対誤差(MAD)、平均二乗誤差(MSE)、又はロバスト推定値の1つ以上の関数から成ることを特徴とする方法。
  16. 請求項1の方法において、ビデオエンコーダの動き推定ユニットで動き推定を行なうように、さらに構成されることを特徴とする方法。
  17. 請求項1の方法において、前記最適誤差距離関数を使用してビデオコーディングの区間予測(inter-prediction)を行なうことを、さらに有することを特徴とする方法。
  18. 請求項17の方法において、前記ビデオコーディング用の前記区間予測を行う方法は:
    動き推定ユニットで、ピクセルのブロックとフレームを受け取り、1つ以上の動きベクトルを生成し;
    動き補償ユニットで、前記フレームおよび前記1つ以上の動きベクトルを受け取り、前記ピクセルのブロックに近似する予測値を生成し;
    減算器ユニットで、前記ピクセルのブロックから前記予測値を差し引き、差異画像ブロックを生成すること;
    が含まれることを特徴とする方法。
  19. 請求項1の方法において、前記最適誤差距離関数を使用してビデオ処理のための時間的補間を行なうことを、さらに有することを特徴とする方法。
  20. 請求項19の方法において、前記時間的補間を行なう方法は:
    動き推定ユニットで、第1のフレームと第2のフレームを受け取り、1つ以上の動きベクトルを生成し;
    双方向補間ユニットで、前記第1のフレーム、前記第2のフレームおよび前記1つ以上の動きベクトルを受け取り、前記第1と第2のフレームに関連した時間の間にある画像の近似値を生成すること;
    が含まれることを特徴とする方法。
  21. 請求項1の方法において、前記最適誤差距離関数を使用してスーパー分解能処理を行なうことを、さらに有することを特徴とする方法。
  22. 請求項21の方法において、前記スーパー分解能処理を行なう方法は:
    動き推定ユニットで、時間Tのまわりに集められた一群のフレームを受け取り、前記時間Tでの当該群のフレームと、当該群の別のフレームとの間の1つ以上の動きベクトルを生成し;
    動き補償ユニットで、前記一群のフレームと前記1つ以上の動きベクトルを受け取り、そして前記一群のフレーム中の各フレームの予測されたバージョンを構成する画像を生成し;
    スーパー分解能演算処理装置で、前記画像を受け取って、前記画像を処理し、前記一群のフレームより高い空間分解能がある前記時間Tでの画像を生成すること;
    が含まれることを特徴とする方法。
  23. 請求項1の方法において、前記動き推定は、ブロックに基づいたか、区域に基づいた動き推定から成ることを特徴とする方法。
  24. 請求項1の方法において、前記動き推定は、位相相関か、ピクセル再帰的な(pel-recursive)技術から成ることを特徴とする方法。
  25. 請求項1の方法において、前記動き推定は、平行移動モデル、アフィン変換モデル、またはパラメトリックモデルから成る、動きモデルから構成されることを特徴とする方法。
  26. コンピュータ読取り可能なメディア上で有形的にコード化されたコンピュータ・プログラム・プロダクトであって、データ処理装置に対して画像の動き推定用の動作を行なわせる命令を含み、前記動作は:
    初期誤差距離関数を指定し;
    前記初期誤差距離関数を使用して初動推定を行ない、ここで、前記初動推定は動き予測誤差を生成し;
    前記初期誤差距離関数が前記最適誤差関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なうこと;
    が含まれることを特徴とする方法。
  27. 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記動作がさらに、前記初動推定の前記動き予測誤差の分布を、複数の誤差距離関数の一つに関連づけた分布と比較することに基づいて、前記初期誤差距離関数が前記最適誤差関数であるか判断することから成ることを特徴とするコンピュータ・プログラム・プロダクト。
  28. 請求項27のコンピュータ・プログラム・プロダクトにおいて、前記初期誤差距離関数が前記最適誤差関数でない場合、前記動作がさらに、前記動き予測誤差の分布に基づいた前記最適誤差距離関数を選択することから成ることを特徴とするコンピュータ・プログラム・プロダクト。
  29. 請求項28のコンピュータ・プログラム・プロダクトにおいて、前記分布が前記動き予測誤差の前記分布の最良適合かどうかを判断することには:
    複数の分布状態の候補に関連したスケール係数を決定し;
    前記複数の分布状態の候補について統計試験を行ない;
    前記統計試験で前記複数の誤差距離関数の一つに関連づけた前記分布と最良適合を見せるかどうかを判断する;
    ことから成ることを特徴とするコンピュータ・プログラム・プロダクト。
  30. 請求項29のコンピュータ・プログラム・プロダクトにおいて、前記統計試験はカイ二乗検定から成ることを特徴とするコンピュータ・プログラム・プロダクト。
  31. 請求項29のコンピュータ・プログラム・プロダクトにおいて、前記初期誤差距離関数はフーバー距離関数から成ることを特徴とするコンピュータ・プログラム・プロダクト。
  32. 請求項26のコンピュータ・プログラム・プロダクトにおいて、ビデオエンコーダの動き推定ユニットで動き推定を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
  33. 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記最適誤差距離関数を使用してビデオコーディングの区間予測を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
  34. 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記最適誤差距離関数を使用してビデオ処理用の時間的補間を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
  35. 請求項26のコンピュータ・プログラム・プロダクトにおいて、前記最適誤差距離関数を使用してスーパー分解能処理を行なうための命令をさらに含むことを特徴とするコンピュータ・プログラム・プロダクト。
  36. 画像の動き推定を行なうためのシステムであって:
    画像データを表示する表示装置;
    画像データ処理のために前記画像データと命令を記憶するコンピュータ読取り可能なメディア;
    前記命令と前記画像データを処理するのに使用可能なデータ処理装置とを備えると共に、前記命令は前記データ処理装置に以下の事項を実行させる:
    初期誤差距離関数を使用して、初動推定を行なうものであって、ここで、前記初動推定は動き予測誤差を生成し;
    前記動き予測誤差の分布に基づいた複数の誤差距離関数の1つから、前記最適誤差距離関数を選択し;
    もし前記初期誤差距離関数が前記最適誤差関数として選択されない場合は、前記選択された最適誤差距離関数を使用して最終動き推定を行なう;
    ことを特徴とするシステム。
  37. 請求項36のシステムにおいて、前記表示装置は、前記データ処理装置から前記最適誤差距離関数を備えた画像データがある表示画像への画像データを受け取るように構成されることを特徴とするシステム。
  38. 請求項36のシステムにおいて、前記命令は、さらに前記データ処理装置に前記初動推定に基づいて前記動き予測誤差のヒストグラムを計算させることを特徴とするシステム。
  39. 請求項36のシステムにおいて、前記システムはデジタル映画又は3D映画用であることを特徴とするシステム。
  40. 請求項36のシステムにおいて、前記データ処理装置は、ビデオエンコーダ内の動き推定ユニットから成ることを特徴とするシステム。
  41. 動き推定のための最適誤差距離関数を決定するコンピュータに実装される方法であって:
    画像の初動推定のための第1の誤差距離関数を選択し;
    前記第1の誤差距離関数と共に初動推定を行なうと共に、前記初動推定は動き予測誤差を生成し;
    前記第1の誤差距離関数が、前記生成された動き予測誤差の分布を備えた最良適合である分布と合致する場合か決定することによって、前記第1の誤差距離関数が最適誤差距離関数であるか定め;
    前記第1の誤差距離関数が前記最適誤差距離関数でない場合、画像の後続する動き推定のための前記最適誤差距離関数の為に、第2の誤差距離関数を選択し、ここで、前記第2の誤差距離関数の前記選択では、前記初動推定から前記生成された動き予測誤差の前記分布を備えた最良適合である分布に対応する;
    コンピュータに実装された方法。
  42. 請求項41のコンピュータに実装された方法において、前記第1の誤差距離関数又は第2の誤差距離関数は、複数の誤差距離関数から選択されることを特徴とする方法。
  43. 請求項42のコンピュータに実装された方法において、前記複数の誤差距離関数は、ガウス分布、ラプラス分布、コーシー分布、及び/又はフーバー分布の一以上からの分布を有する関数から成ることを特徴とする方法。
  44. 請求項41のコンピュータに実装された方法において、前記第1の動き推定又は前記第2の動き推定が連続的な導関数で誤差距離関数で最小化する方法を使用する場合、前記初期誤差距離関数は、フーバー距離関数と関係を有することを特徴とする方法。
  45. 請求項41のコンピュータに実装された方法において、さらに、前記初動推定から前記生成された動き予測誤差に基づいて前記生成された動き誤差のヒストグラムを計算することを特徴とする方法。
  46. 請求項45のコンピュータに実装された方法において、前記第1の誤差距離関数が前記生成された動き予測誤差の前記分布と前記最良適合である分布に対応する場合か決定する場合に:
    前記生成された動き予測誤差の前記分布のためのスケール係数を決定し;
    前記分布が前記生成された動き予測誤差の前記分布と前記最良適合かどうかを判断するために統計的試験をすること;
    から成ることを特徴とする方法。
  47. 請求項41のコンピュータに実装された方法において、さらに、ビデオエンコーダの動き推定ユニットで動き推定を行なうことを特徴とする方法。
  48. 請求項41のコンピュータに実装された方法において、さらに、前記最適誤差距離関数を使用して、ビデオコーディングの区間予測を行なうことを特徴とする方法。
  49. 請求項41のコンピュータに実装された方法において、さらに、前記最適誤差距離関数を使用して、ビデオ処理用の時間的補間を行なうことを特徴とする方法。
  50. 請求項41のコンピュータに実装された方法において、さらに、前記最適誤差距離関数を使用して、スーパー分解能処理を行なうことを特徴とする方法。
  51. ビデオコーディングの区間予測を行なうためのシステムであって、前記システムは:
    ピクセルのブロックとフレームを受け取り、かつ1つ以上の動きベクトルを生成する動き推定ユニット;
    前記フレームと前記1つ以上の動きベクトルを受け取り、かつ前記ピクセルのブロックに近似する予測値を生成する動き補償ユニット;
    前記ピクセルのブロックから前記予測値を引き、差異画像ブロックを生成する減数器ユニット;
    を有し、ここで前記動き推定ユニットは、次の命令から成る処理によって動き推定の最適誤差距離関数を決定するように構成される:
    初期誤差距離関数を指定し;
    前記初期誤差距離関数を使用して初動推定を行ない、ここで前記初動推定は動き予測誤差を生成し;
    もし前記初期誤差距離関数が前記最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して最終の動き推定を行う;
    ことを特徴とするシステム。
  52. 請求項51のシステムにおいて、前記動き推定ユニットは、前記動き推定のための前記最適誤差距離関数を定めるために、次の命令から成る処理:
    前記初動推定の前記動き予測誤差の分布と複数の誤差距離関数の1つに関係する分布との比較に基づいて、前記初期誤差距離関数が前記最適誤差距離関数であるか定めること;
    前記初期誤差距離関数が前記最適誤差距離関数でない場合には、さらに、前記命令がさらに、前記動き予測誤差の分布に基づいて前記最適誤差距離関数を選択すること;
    が含まれることを特徴とするシステム。
  53. 請求項52のシステムにおいて、前記初期誤差距離関数はフーバーの距離関数から成ることを特徴とするシステム。
  54. 請求項51のシステムにおいて、前記システムはビデオエンコーダから成り、ここで前記動き推定ユニットと前記動き補償ユニットは前記ビデオエンコーダの構成部分であることを特徴とするシステム。
  55. 請求項51のシステムにおいて、前記動き推定ユニットは誤差距離関数の形状を決定し、前記最適誤差距離関数を決定するために前記形状を使用することを特徴とするシステム。
  56. 請求項51のシステムにおいて、前記差異画像ブロックは残差から成ることを特徴とするシステム。
  57. ビデオ処理用の時間的補間用のシステムであって、前記システムは:
    第1のフレームおよび第2のフレームを受け取り、かつ1つ以上の動きベクトルを生成する動き推定ユニット;
    前記第1のフレーム、前記第2のフレームおよび前記1つ以上の動きベクトルを受け取り、かつ前記第1と第2のフレームに関連する時間の間にある画像の近似値を生成する双方向補間ユニット;
    を備え、ここで前記動き推定ユニットは、次の命令から成る処理によって、動き推定用の最適誤差距離関数を決定するように構成される:
    初期誤差距離関数を指定し;
    前記初期誤差距離関数を使用して初動推定を行ない、ここで前記初動推定は動き予測誤差を生成し;
    前記初期誤差距離関数が前記最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して最終動き推定を行なうこと;
    を特徴とするシステム。
  58. 請求項57のシステムにおいて、前記動き推定ユニットは、さらに前記動き推定用の前記最適誤差距離関数を決定するために、次の命令から成る処理:
    前記初動推定の動き予測誤差の分布と複数の誤差距離関数の1つと関係する分布との比較に基づいて、前記初期誤差距離関数が前記最適誤差距離関数であるか定めること;
    前記初期誤差距離関数が前記最適誤差距離関数でない場合には、前記命令には、さらに前記動き予測誤差の分布に基づいて前記最適誤差距離関数を選択することが含まれること;
    を特徴とするシステム。
  59. 請求項58のシステムにおいて、前記初期誤差距離関数はフーバーの距離関数から成ることを特徴とするシステム。
  60. 請求項57のシステムにおいて、前記動き推定ユニットは、誤差距離関数の形状を決定し、前記最適誤差距離関数を決定するために前記形状が使用されるように構成されることを特徴とするシステム。
  61. 請求項57のシステムにおいて、等しい部分区間で複数の中間画像が前記システムで計算される場合、システムはスロービデオ効果を生むことを特徴とするシステム。
  62. 請求項57のシステムにおいて、前記システムはフレーム速度変換用に構成され、前記システムは、第1の周波数での第1のビデオストリームを、第2の周波数での第2のビデオストリームに変換する、双方向補間ユニットに関連した時間を使用するように構成されることを特徴とするシステム。
  63. ビデオ処理用のスーパー分解能処理を行なうためのシステムであって、前記システムは:
    時間Tのまわりに集められた一群のフレームを受け取り、かつ時間Tの前記群のフレームと前記群の別のフレームとの間で、1つ以上の動きベクトルを生成するように構成された動き推定ユニット;
    前記一群のフレームと前記1つ以上の動きベクトルを受け取り、かつ前記一群のフレームでの各フレームの予測されたバージョンから成る画像を生成するための動き補償ユニット;
    前記画像を受け取り、前記画像を処理し、前記一群のフレームより高い空間分解能がある前記時間Tでの画像を生成するためのスーパー分解能演算処理装置;
    を備え、前記動き推定ユニットは、動き推定のための最適誤差距離関数を決定するように、次の命令から成る処理によって、構成される:
    初期誤差距離関数を指定し;
    前記初期誤差距離関数を使用して初動推定を行ない、ここで前記初動推定は動き予測誤差を生成し;
    前記初期誤差距離関数が前記最適誤差距離関数でない場合に、選択された最適誤差距離関数を使用して、最終動き推定を行なうこと;
    を特徴とするシステム。
  64. 請求項63のシステムにおいて、前記動き推定ユニットは、さらに、前記動き推定のための最適誤差距離関数を決定するために、次の命令から成る処理:
    前記初動推定の前記動き予測誤差の分布と複数の誤差距離関数の1つと関係する分布との比較に基づいて、前記初期誤差距離関数が前記最適誤差距離関数であるか定めること;
    前記初期誤差距離関数が前記最適誤差距離関数でない場合には、前記命令には、さらに前記動き予測誤差の分布に基づいて前記最適誤差距離関数を選択することが含まれること;
    を特徴とするシステム。
  65. 請求項63のシステムにおいて、前記初期誤差距離関数又は前記最適誤差距離関数はフーバーの距離関数から成ることを特徴とするシステム。
  66. 請求項63のシステムにおいて、前記動き推定ユニットは、誤差距離関数の形状を決定し、前記最適誤差距離関数を決定するために前記形状を使用できるように構成されたことを特徴とするシステム。
  67. 請求項63のシステムにおいて、前記スーパー分解能演算処理装置は、ナイキスト周波数を調整し、前記画像に関連した分解能を増加させることにより、前記画像からより高分解能画像を抽出するように構成されたことを特徴とするシステム。
JP2010539902A 2007-12-19 2008-12-19 適応性動き推定 Expired - Fee Related JP5138048B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US1514807P 2007-12-19 2007-12-19
US61/015,148 2007-12-19
PCT/US2008/087805 WO2009086181A1 (en) 2007-12-19 2008-12-19 Adaptive motion estimation

Publications (2)

Publication Number Publication Date
JP2011508536A true JP2011508536A (ja) 2011-03-10
JP5138048B2 JP5138048B2 (ja) 2013-02-06

Family

ID=40599623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010539902A Expired - Fee Related JP5138048B2 (ja) 2007-12-19 2008-12-19 適応性動き推定

Country Status (6)

Country Link
US (1) US8457208B2 (ja)
EP (1) EP2232873B1 (ja)
JP (1) JP5138048B2 (ja)
CN (1) CN102742267B (ja)
AT (1) ATE550879T1 (ja)
WO (1) WO2009086181A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102742267B (zh) 2007-12-19 2015-05-27 杜比实验室特许公司 自适应运动估计
US8718142B2 (en) * 2009-03-04 2014-05-06 Entropic Communications, Inc. System and method for frame rate conversion that utilizes motion estimation and motion compensated temporal interpolation employing embedded video compression
TWI452909B (zh) * 2009-06-29 2014-09-11 Silicon Integrated Sys Corp 移動向量校正電路、影像產生裝置及相關方法
US20110026596A1 (en) * 2009-07-28 2011-02-03 Wei Hong Method and System for Block-Based Motion Estimation for Motion-Compensated Frame Rate Conversion
US8508659B2 (en) * 2009-08-26 2013-08-13 Nxp B.V. System and method for frame rate conversion using multi-resolution temporal interpolation
CA2783836C (en) * 2009-11-11 2018-03-13 Cinnafilm, Inc. Single frame artifact filtration and motion estimation
JP5372721B2 (ja) * 2009-12-11 2013-12-18 ルネサスエレクトロニクス株式会社 映像信号処理装置、方法及びプログラム
KR101674078B1 (ko) * 2009-12-16 2016-11-08 삼성전자 주식회사 블록 기반의 영상 잡음 제거 방법 및 장치
US8494225B2 (en) * 2010-02-19 2013-07-23 Julian L. Center Navigation method and aparatus
KR101082903B1 (ko) * 2010-05-06 2011-11-11 성균관대학교산학협력단 직교 주파수 분할 다중화 시스템에서의 주파수 옵셋 추정 장치
US9185437B2 (en) 2012-11-01 2015-11-10 Microsoft Technology Licensing, Llc Video data
KR102136848B1 (ko) 2013-07-15 2020-07-22 삼성전자 주식회사 영상 처리 장치, 영상 처리 시스템 및 영상 처리 방법
CN104933064B (zh) * 2014-03-19 2018-02-23 株式会社理光 预测目标对象的运动参数的方法和装置
US10445862B1 (en) * 2016-01-25 2019-10-15 National Technology & Engineering Solutions Of Sandia, Llc Efficient track-before detect algorithm with minimal prior knowledge
CN108605113B (zh) * 2016-05-02 2020-09-15 赫尔实验室有限公司 用于自运动补偿的方法、系统和非暂时性计算机可读介质
CN109328382B (zh) * 2016-06-22 2023-06-16 杜比国际公司 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07162811A (ja) * 1993-10-11 1995-06-23 Thomson Consumer Electron Sa 中間フィールドまたは中間フレームの動き補償内挿方法および装置
JP2003501902A (ja) * 1999-05-27 2003-01-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号の符号化
US6532265B1 (en) * 1999-03-25 2003-03-11 Imec Vzw Method and system for video compression
JP2004056242A (ja) * 2002-07-17 2004-02-19 Ikegami Tsushinki Co Ltd 予測符号化における符号量制御方法
JP2005073291A (ja) * 1997-12-25 2005-03-17 Mitsubishi Electric Corp 動き補償装置
JP2005204158A (ja) * 2004-01-16 2005-07-28 Mitsubishi Electric Corp 画像符号化装置
JP2007525078A (ja) * 2003-06-23 2007-08-30 ヴィチップ・コーポレーション 適応型多次元信号シーケンス符号化/復号化方法とそのための装置
JP2008503918A (ja) * 2004-06-18 2008-02-07 トムソン ライセンシング ビデオ・コーデック量子化のための方法および装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4496972A (en) * 1980-05-10 1985-01-29 Deutsche Forschungs-Und Versuchsanstalt Fur Luft-Und Raumfahrt E.V. Method for the representation of video images or scenes, in particular aerial images transmitted at reduced frame rate
US4433207A (en) 1981-09-10 1984-02-21 Best Robert M Cryptographic decoder for computer programs
US4969041A (en) 1988-09-23 1990-11-06 Dubner Computer Systems, Inc. Embedment of data in a video signal
NL8901032A (nl) 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
US5327237A (en) 1991-06-14 1994-07-05 Wavephore, Inc. Transmitting data with video
US5319735A (en) 1991-12-17 1994-06-07 Bolt Beranek And Newman Inc. Embedded signalling
FR2699780B1 (fr) * 1992-12-22 1995-03-17 Philips Electronique Lab Dispositif de traitement récursif de signal vidéo comprenant une pluralité de branches.
US5748763A (en) 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US6424725B1 (en) 1996-05-16 2002-07-23 Digimarc Corporation Determining transformations of media signals with embedded code signals
US5530751A (en) 1994-06-30 1996-06-25 Hewlett-Packard Company Embedded hidden identification codes in digital objects
US5646997A (en) 1994-12-14 1997-07-08 Barton; James M. Method and apparatus for embedding authentication information within digital data
US5689587A (en) 1996-02-09 1997-11-18 Massachusetts Institute Of Technology Method and apparatus for data hiding in images
US7930546B2 (en) 1996-05-16 2011-04-19 Digimarc Corporation Methods, systems, and sub-combinations useful in media identification
US6031914A (en) 1996-08-30 2000-02-29 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible images
US6850567B1 (en) 1997-01-13 2005-02-01 Koninklijke Philips Electronics N.V. Embedding supplemental data in a digital video signal
US6192138B1 (en) 1997-05-08 2001-02-20 Kabushiki Kaisha Toshiba Apparatus and method for embedding/unembedding supplemental information
JP3794646B2 (ja) 1997-08-26 2006-07-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 内容情報とそれに関する補足情報とを転送するシステム
US6701062B1 (en) 1998-06-06 2004-03-02 Macrovision Corporation Generational copy control of a video signal
US6272207B1 (en) * 1999-02-18 2001-08-07 Creatv Microtech, Inc. Method and apparatus for obtaining high-resolution digital X-ray and gamma ray images
US6567469B1 (en) * 2000-03-23 2003-05-20 Koninklijke Philips Electronics N.V. Motion estimation algorithm suitable for H.261 videoconferencing applications
US7421729B2 (en) 2000-08-25 2008-09-02 Intellocity Usa Inc. Generation and insertion of indicators using an address signal applied to a database
US7039113B2 (en) 2001-10-16 2006-05-02 Koninklijke Philips Electronics N.V. Selective decoding of enhanced video stream
JP2005506815A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間拡張可能圧縮のための方法及び装置
EP1491038A2 (en) * 2001-12-26 2004-12-29 YEDA RESEARCH AND DEVELOPMENT CO., Ltd. A system and method for increasing space or time resolution in video
US20050226462A1 (en) * 2002-05-30 2005-10-13 Wittebrood Rimmert B Unit for and method of estimating a motion vector
TWI227641B (en) 2003-11-11 2005-02-01 Mediatek Inc Method and related apparatus for motion estimation
WO2006035777A1 (ja) 2004-09-29 2006-04-06 Sharp Kabushiki Kaisha 記録装置及び方法
JP5025645B2 (ja) 2005-06-23 2012-09-12 トライデント マイクロシステムズ インコーポレイテッド 動き推定方法
US20070268406A1 (en) 2006-05-22 2007-11-22 Broadcom Corporation, A California Corporation Video processing system that generates sub-frame metadata
US7893999B2 (en) 2006-05-22 2011-02-22 Broadcom Corporation Simultaneous video and sub-frame metadata capture system
US7953315B2 (en) 2006-05-22 2011-05-31 Broadcom Corporation Adaptive video processing circuitry and player using sub-frame metadata
US20080007649A1 (en) 2006-06-23 2008-01-10 Broadcom Corporation, A California Corporation Adaptive video processing using sub-frame metadata
US20080007651A1 (en) 2006-06-23 2008-01-10 Broadcom Corporation, A California Corporation Sub-frame metadata distribution server
US20080007650A1 (en) 2006-06-23 2008-01-10 Broadcom Corporation, A California Corporation Processing of removable media that stores full frame video & sub-frame metadata
CN102742267B (zh) 2007-12-19 2015-05-27 杜比实验室特许公司 自适应运动估计

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07162811A (ja) * 1993-10-11 1995-06-23 Thomson Consumer Electron Sa 中間フィールドまたは中間フレームの動き補償内挿方法および装置
JP2005073291A (ja) * 1997-12-25 2005-03-17 Mitsubishi Electric Corp 動き補償装置
US6532265B1 (en) * 1999-03-25 2003-03-11 Imec Vzw Method and system for video compression
JP2003501902A (ja) * 1999-05-27 2003-01-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ信号の符号化
JP2004056242A (ja) * 2002-07-17 2004-02-19 Ikegami Tsushinki Co Ltd 予測符号化における符号量制御方法
JP2007525078A (ja) * 2003-06-23 2007-08-30 ヴィチップ・コーポレーション 適応型多次元信号シーケンス符号化/復号化方法とそのための装置
JP2005204158A (ja) * 2004-01-16 2005-07-28 Mitsubishi Electric Corp 画像符号化装置
JP2008503918A (ja) * 2004-06-18 2008-02-07 トムソン ライセンシング ビデオ・コーデック量子化のための方法および装置

Also Published As

Publication number Publication date
US20100266041A1 (en) 2010-10-21
CN102742267B (zh) 2015-05-27
ATE550879T1 (de) 2012-04-15
EP2232873A1 (en) 2010-09-29
CN102742267A (zh) 2012-10-17
US8457208B2 (en) 2013-06-04
EP2232873B1 (en) 2012-03-21
JP5138048B2 (ja) 2013-02-06
WO2009086181A1 (en) 2009-07-09

Similar Documents

Publication Publication Date Title
JP5138048B2 (ja) 適応性動き推定
CN110741640B (zh) 用于视频代码化中的运动补偿预测的光流估计
WO2019191890A1 (zh) 用于图像处理的方法和图像处理装置
US11070834B2 (en) Low-complexity method for generating synthetic reference frames in video coding
WO2017005146A1 (zh) 视频编码和解码方法、视频编码和解码装置
WO2016131229A1 (zh) 用于视频图像编码和解码的方法、编码设备和解码设备
US10506249B2 (en) Segmentation-based parameterized motion models
US11115678B2 (en) Diversified motion using multiple global motion models
CN102075760A (zh) 快速运动估计方法及装置
US11350102B2 (en) Block-based optical flow estimation for motion compensated prediction in video coding
CN110741641A (zh) 用于视频压缩的翘曲参考运动矢量
Dai et al. A novel fast two step sub-pixel motion estimation algorithm in HEVC
KR102245740B1 (ko) 깊이 영상에서 신축을 이용한 움직임 추정 방법 및 장치
Ringis et al. Using modern motion estimation algorithms in existing video codecs
WO2023205371A1 (en) Motion refinement for a co-located reference frame
CN115550652A (zh) 基于上下文的图像编解码
JP5637010B2 (ja) 動きベクトル検出装置、動きベクトル検出方法及び動きベクトル検出プログラム
JP2002521944A (ja) デジタル画像が被る動きを求める方法および装置

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120521

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120619

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120914

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121113

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151122

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees