JP4567733B2

JP4567733B2 - 動きベクトル処理のための方法及び装置

Info

Publication number: JP4567733B2
Application number: JP2007522716A
Authority: JP
Inventors: シ、ファン; ラビーンドラン、ビジャヤラクシュミ・アール．
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2004-07-20
Filing date: 2005-07-20
Publication date: 2010-10-20
Anticipated expiration: 2025-07-20
Also published as: CN101023662A; CN101023662B; TW200618610A; JP2008507909A; US7852938B2; KR100943591B1; EP1774780A1; US20060018382A1; US20110080955A1; US8514941B2; WO2006012375A1; CA2574556A1; KR20070040399A

Description

米国特許法第１１９条における優先権主張
本特許出願は２００４年７月２０日に出願され、この譲受人に譲渡され、且つここに引例として繰込まれている仮特許出願第６０／５８９，９００号に対する優先権を主張する。

ここに示された実施例は一般に動きベクトル（motion vector）処理に関し、特に固定及び可変ブロック・サイズ動きベクトル処理、内容適応動きベクトル平滑化、動きベクトル・スケーリング、動きベクトル・ラベリング、動きベクトル分類、及びビデオ処理に関係する。

低ビット・レートのビデオ圧縮は限られた帯域幅資源及び利用可能な帯域幅の可変性による無線ビデオ配信（wireless video streaming）及びビデオ電話通信といった多くのマルチメディア・アプリケーションにおいて非常に重要である。低ビット・レートのビデオ符号化の帯域幅適応は時間分解能を低減させることによって達成することができる。換言すれば、１秒当たり３０フレーム（３０ｆｐｓ）のビット・ストリームを圧縮して送る代りに、時間分解能は伝送ビット・レートを低減させるために１５ｆｐｓに半減される。しかしながら、時間分解能を減少させる結果はぎくしゃくとした動きといった時間領域作為の導入であり、それは復号化ビデオの視覚品質を著しく劣化させる。

受信機側で十分なフレーム・レートを表示するために、フレーム・レート上位変換（frame rate up conversion：ＦＲＵＣ）と呼ばれる復元機構は省略されたフレームを再生させ、そして時間作為効果を減少させるのに必要とされる。一般に、ＦＲＵＣ処理は（復元される）ビデオの知覚フレーム・レートを増加させるためにビデオ復号器において追加フレームを造るビデオ内挿の処理である。一般的に、各フレームは個々のピクセル、または「マクロ・ブロック」と呼ばれるピクセル・ブロックといった特定の画像要素に分割される。一つの参照フレームから次の参照フレームへこれらの要素の動きを記述する動きベクトルは二つの参照フレームの間で内挿フレーム上の各要素の位置を予測するために使用される。動きベクトル・フィールドまたは動きフィールドと呼ばれる特定のフレームに関する動きベクトル群の生成及び処理は、特定の処理境界の中で所望の品質を持つ復元ビデオ・ストリームを得る重要な部分である。しかしながら、異常動きベクトル（outlier motion vectors）−即ち、画像要素の動きを正確に記述しない動きベクトルの除去を含む、動きフィールドの適切な処理なしでは復元ビデオの品質は著しく低減されるであろう。

発明が解決しようする課題

ここに述べられる実施例はここでは「Ｆ-フレーム」と呼ばれる、フレーム・レート上位変換（ＦＲＵＣ）において高品質の内挿フレームの生成を行う動きベクトル処理システムを提供する。

発明を解決するための手段

一実施例では、ビデオ・フレームに関して複数の動きベクトルを処理する方法が述べられる。その方法はビデオ・フレームにおいていくつかの異なるブロック・サイズを決定すること、そして異なるブロック・サイズの数が１以上であれば可変ブロック・サイズ動きベクトル処理を実行することを含む。さらに、可変ブロック・サイズ動きベクトル処理は複数の動きベクトルのピラミッドを構築することを含み、ピラミッドは少なくとも第一層及び第二層の動きベクトルを有し、各層は特定のブロック・サイズに基づく一組の動きベクトルを有する。

別の実施例では、そこに記憶された命令を持つコンピュータ可読媒体が、ビデオ・フレームに関する複数の動きベクトルを処理する方法をコンピュータに実行させるために提供される。動きベクトル処理はビデオ・フレームにおいていくつかの異なるブロック・サイズを決定することを含む。さらに、ビデオ・フレームにおける異なるブロック・サイズの数が１以上であればその処理は可変ブロック・サイズ動きベクトル処理を実行することを含み、そこでは可変ブロック・サイズ動きベクトル処理は複数の動きベクトルから動きベクトルのピラミッドを構築することを含み、ピラミッドは少なくとも第一層及び第二層の動きベクトルを有し、第一及び第二層の各々は特定のブロック・サイズに基づく一組の動きベクトルを有する。

さらに別の実施例では、ビデオ・フレームに関して複数の動きベクトルを処理する装置が述べられる。その装置はビデオ・フレームにおいていくつかの異なるブロック・サイズを決定するように構成されたプログラム可能な回路を含む；そしてビデオ・フレームにおける異なるブロック・サイズの数が１以上であればプログラム可能な回路は可変ブロック・サイズ動きベクトル処理を実行するように構成される。可変ブロック・サイズ動きベクトル処理は複数の動きベクトルから動きベクトルのピラミッドを構築するように構成されたプログラム可能な回路を含み、ピラミッドは少なくとも第一層及び第二層の動きベクトルを有し、第一及び第二層の各々は特定のブロック・サイズに基づく一組の動きベクトルを有する。

さらに別の実施例では、ビデオ・フレームに関して複数の動きベクトルを処理する動きベクトル・プロセッサが述べられる。動きベクトル・プロセッサはビデオ・フレームにおいていくつかの異なるブロック・サイズを決定する手段、及びビデオ・フレームにおける異なるブロック・サイズの数が１以上であれば可変ブロック・サイズ動きベクトル処理を実行する手段を含む。可変ブロック・サイズ動きベクトル処理を実行する手段は複数の動きベクトルから動きベクトルのピラミッドを構築する手段を含み、ピラミッドは少なくとも第一層及び第二層の動きベクトルを有し、第一及び第二層の各々は特定のブロック・サイズに基づく一組の動きベクトルを有する。

他の目的、特徴、及び利点は次の詳細な記述から当業者にとって明白になるであろう。しかしながら、詳細な記述及び特定の例は、典型的実施例を示しているが、例示を目的とし、限定するものではないことは理解すべきである。次の記述の範囲内の多くの変更及び修正はその精神から逸脱することなく行われ、そしてその記述は全てのそのような変形を含むことは理解されるべきである。

ここに記述される実施例は付随の図によってさらに容易に理解される。同じ数字はいくつかの図面を通して同じ部品（部分）を参照する。

ここに述べられる実施例は「Ｆ-フレーム」と呼ばれる、フレーム・レート上位変換（ＦＲＵＣ）において高品質の内挿フレームの生成を行う動きベクトル処理のための方法及び装置を提供する。その方法及び装置はまた固定ブロック・サイズに関する動きベクトル平滑化（motion vector smoothing）の機能性を可変ブロック・サイズに適用するために拡張する。いろいろな動きブロック・サイズ及び層状動きベクトル（layered motion vector）平滑化技術に基づいて階層動きベクトル・ピラミッドを形成する方法がまた提供される。さらに、復号ビデオ・データに含まれる補足情報は動きベクトル・プロセッサへの入力として利用される。例えば、補足情報は「内容マップ（content maps）」と呼ばれる各フレームを構成する画像要素の形式の記述を含み、同様に「複雑度マップ（complexity maps）」及び「稼働性マップ（activity maps）」とそれぞれ呼ばれる画像要素の複雑度及び稼働性を含む。

図１は、図２に詳述されるシステム３００において使用される入力を持つ、図３に示されるような動きベクトル処理システム３００の動作の典型的処理１００を例示する。ここに示された機能ブロックは一以上のソフトウェア・アルゴリズムを用いて実施される特定のモジュールに対応することは注目すべきである。アルゴリズムの動作は当業者がコンピュータ・ハードウェア及びソフトウェア方法の組合せを使用してそれらを実施するのに十分な内容をもって高レベルで記述される。例えば、ここに述べたコンポーネントは汎用コンピュータ・プロセッサ上で実行されるソフトウェア、特定用途向け集積回路（ＡＳＩＣ）における「ハード・ワイヤド」回路、あるいはそのあらゆる組合せとして実施される。ここに述べたモジュールの実装への他の様々な方法が使用され、且つ画像及びビデオ処理の広大な分野において実践する当業者の領域内にあることは注目すべきである。

さらに、ここに述べた発明概念は国際電気通信連合、電気通信標準化部門（ＩＴＵ-Ｔ）によって公表されたＨ．２６ｘ規格、或いは国際標準化機構／国際電気技術委員会、合同技術委員会１（ＩＳＯ／ＩＥＣＪＴＣ１）の作業グループ、動画像専門家グループによって公表されたＭＰＥＧ-ｘ規格に準拠する復号器／符号器システムにおいて使用される。ＩＴＵ-Ｔビデオ符号化規格は提案と呼ばれ、それらはＨ．２６ｘ（例えば、Ｈ．２６１、Ｈ．２６２、Ｈ．２６３及びＨ．２６４）で表される。ＩＳＯ／ＩＥＣ規格はＭＰＥＧ-ｘ（例えば、ＭＰＥＧ-１、ＭＰＥＧ-２及びＭＰＥＧ-４）で表される。例えば、多数の参照フレーム及び可変ブロック・サイズはＨ．２６４規格に必要とされる特別な特徴である。他の実施例において、発明概念が実施される復号器／符号器システムは専売特許である。

一実施例において、処理１００は異なる複雑さ要求に基づいて異なって動作する。例えば、高い複雑構成は多数の参照フレーム、可変ブロック・サイズ、動き加速度による前の参照フレーム動きベクトル外挿、ピラミッド層状平滑化、及び動き推定援用動きフィールド平滑化を含む。一方、低い複雑モードの動作は一つの参照フレーム及び固定ブロック・サイズを利用するだけである。他の構成もまたいろいろなアプリケーションに有効である。

システム３００は処理に使用されるビデオ・フレームに関する情報を記憶し、且つ抽出するために使用されるデータ・サブシステム２００における複数のデータ記憶ユニットから入力を受取る。図２に例示したように、これらの記憶ユニットは複数前フレーム（multiple previous frames）の内容マップ記憶ユニット（複数前フレーム内容マップ）２０２、複数前フレームの外挿動きフィールド記憶ユニット（複数前フレーム外挿動きフィールド）２０４、単一前フレーム（single previous frame）内容マップ記憶ユニット（前フレーム内容マップ）２０６、単一前フレーム外挿動きフィールド記憶ユニット（外挿前フレーム動きフィールド）２０８を含む。複数参照フレーム・モード制御モジュール２１４は、複数参照フレームを利用するモードにおいてシステム３００が動作しているかどうかに応じて、適切な記憶ユニットを次の入力段に連結する。特に、システム３００が複数前参照フレームを利用するとき、入力は複数前フレームの内容マップ記憶ユニット２０２及び複数前フレーム外挿動きフィールド記憶ユニット２０４から取られる。単一前参照フレーム・モードの動作に関して、入力は単一前フレーム内容マップ記憶ユニット２０６及び単一前フレーム外挿動きフィールド記憶ユニット２０８から取られる。

図は内容マップ及び動きフィールドを記憶するための二つの異なる記憶ユニットの組−複数参照フレームが使用される一組（即ち、複数前フレームの内容マップ記憶ユニット２０２及び複数前フレームの外挿動きフィールド記憶ユニット２０４）、及び単一参照フレームが使用される別の組（即ち、単一前フレーム内容マップ記憶ユニット２０６及び単一前フレーム外挿動きフィールド記憶ユニット２０８）の使用を例示しているが、他の構成も可能であることを注目すべきである。例えば、二つの異なる内容マップ記憶ユニットの機能性は、一つの記憶ユニットが複数フレームの内容マップまたは単一フレームの単一内容マップを記憶するのに使用されるように組み合わせられる。さらに、記憶ユニットはまた現フレームに関するデータも同様に記憶する。

複数参照フレーム・モード制御モジュール２１４からの出力は、現フレーム動きフィールド記憶ユニット（現フレーム動きフィールド）２１０、及び現フレーム内容マップ記憶ユニット（現フレーム内容マップ）２１２と同様に動きベクトル外挿ユニット２１６に供給される。動きベクトル外挿ユニット２１６は、ここに述べたように、システム３００における動きベクトル処理のために使用される補足情報と同様に動きベクトルを抽出する。このように、システム３００において利用された入力動きベクトルは現フレームからのものか、或いは現フレームと以前に復号された一以上のフレームの両方からのものである。その上、システム３００への他の入力は復号されたフレーム・データからの側波帯情報であり、それは関心の領域、テクスチャー情報における変化、及び背景輝度値における変化を含むが、それに限定されない。さらに下記で論じられるように、この情報は動きベクトル分類及び適応平滑化アルゴリズムに関する指針を提供する。

一実施例において、システム３００は内挿されるフレーム（即ち、Ｆ-フレーム）のマクロ・ブロックが、固定サイズである動作モード（固定ブロック・サイズ動きベクトル処理と云われる）で動きベクトル処理を行い、同様に可変であるブロック・サイズに関する動きベクトル処理（可変ブロック・サイズ動きベクトル処理と云われる）を行うことができる。これらの各動作モードは固定ブロック・サイズ動きベクトル処理で始まり、下記で述べられる。図１に例示されたように、いずれの可変ブロック・サイズが使用されるかはブロック１１８で決定される。

固定ブロック・サイズ動きベクトル処理
システム３００において、固定ブロック・サイズ動きベクトル処理は動きベクトル・スケーリング段階１２０、動きベクトル・ラベリング段階１２２、内容適応動きベクトル分類段階１２４，及び内容適応フィルタリング段階１２６を包含し、各段階は図１に示されたそれぞれのモジュールによって実行される。

動きベクトル・スケーリング
一実施例において、動きベクトル・スケーリング・ユニット３０２は、それが挿入されるであろう二つの受信参照フレームに関してＦ-フレーム（即ち、内挿されるフレーム）の場所に基づいて動きベクトルをスケーリング（拡大／縮小）する。例えば、図４に示されるように、内挿Ｆ-フレーム４０２は前参照フレーム４０６と現参照フレーム４０４との間に挿入されるであろう。一実施例において、スケーリングされた動きベクトルを生成するために使用される公式は：
ＭＶ_ｆ_ｘ＝ＭＶ_ｘ＊ｎ／Ｍ；及び
ＭＶ_ｆ_ｙ＝ＭＶ_ｙ＊ｎ／Ｍである。
但し、ＭＶ_ｘ及びＭＶ_ｙは前参照フレームから現参照フレームまで測定された動きベクトルのｘ-軸及びｙ-軸成分である；ｎは選択挿入点における前参照フレームからＦ-フレームの時間における距離である；Ｍは前参照フレームと現参照フレームとの間の時間における全体距離である；そしてＭＶ_ｆ_ｘ及びＭＶ_ｆ_ｙはそれぞれスケーリングされた動きベクトルの計算されたｘ-軸及びｙ-軸成分である。

図４の説明を続けると、線形マクロ・ブロック動きモデル（ここではマクロ・ブロックが一定の速度で動いている）に関して、スケーリングされた動きベクトルの大きさ（magnitude）は、（１）前参照フレームに対する内挿されたフレーム（距離４１０によって示される）と、（２）前参照フレームに対する現参照フレームの間の距離比率に関して現動きベクトルの規模に比例し、一方、その方向は現フレームの動きベクトルの方向と同じである。非線形動き（即ち、動き加速度）モデルに関して、スケーリングされた動きベクトルの方向及び規模は、（１）現参照フレームと前参照フレームとの間に内挿されたフレームの距離、及び（２）計算された動き加速度の双方によって決まる。

使用される複数前参照フレームがある場合には、前参照フレームは現動きベクトルが指示する参照フレーム・リストにおける参照フレームである。特に、参照フレーム・リストにおける参照フレームは、現ビデオ・フレームの動きベクトルが参照し得る全ての参照フレームを含む。えば、Ｈ．２６４規格によって提供される一つの形式（profile）では、参照フレーム・リストは５個の参照フレームを含む。参照フレーム・リストにおける参照フレームは必ずしも全てが現ビデオ・フレームの動きベクトルによって参照されるとは限らない。「参照フレーム集合」または「動きベクトル参照フレーム」として引用されるデータ構造は現ビデオ・フレームにおける各動きベクトルによって指示される参照フレームを同定する。例えば、現ビデオ・フレームが三つ（３）の動きベクトルを含み、且つ記号（ｖ,ｆ）が各動きベクトル（ｖ）によって指示された参照フレーム（ｆ）を同定すれば、参照フレーム集合例は：
［(１,４), (２,５), (３, ２)］
である。但し、動きベクトル１は参照フレーム４を指示し、動きベクトル２は参照フレーム５を指示し、そして動きベクトル３は参照フレーム２を指示する（参照フレーム１は現ビデオ・フレームに時間的に最も近い）。

ここに述べた概念はＰ-フレーム及びＢ-フレームといった実際のビデオ・フレームに関する動きベクトルの処理に適用される。この実施例において、使用される参照フレームは参照フレーム・リストにおいて時間的に最も近い参照フレーム、及び動きベクトルが指示する参照フレームであろう。例えば、図５に例示されたように、スケーリングされた動きベクトルの規模は、（１）第一参照フレーム５０２に対する実際のビデオ・フレーム５０４（距離５１０によって示される）、及び（２）第二参照フレーム５０６に対する実際のビデオ・フレーム５０４（距離５２０によって示される）の間の距離比に関して現動きベクトルの大きさに比例する。

動きベクトル・ラベリング
一旦、動きベクトルがスケーリングされると、動作は動きベクトル・ラベリング段階に続き、ここでは動きベクトル・ラベリング・モジュール３０４は、スケーリングされた入力動きベクトルにラベル付けするために、動きベクトル・スケーリング・ユニット３０２からスケーリングされた入力動きベクトルを受取り、そして処理する。一実施例では、動きベクトルの内容、規模、方向、及び、複数の参照フレームが使用される場合には、動きベクトルが指示する参照フレームに応じて、入力動きベクトルは特定の動きベクトル形式として分類される。このように、動きベクトル・ラベリング・モジュール３０４はそれらの特性に基づいて動きベクトルにラベル付するために使用され、その結果、下記で論じられるように、特定の動作がある基準に合った動きベクトルに適用される。一実施例において、動きベクトル・ラベリング・モジュール３０４への入力は動きベクトル、動きベクトル参照フレーム指数（複数の参照フレームが使用される場合）、内容マップ、及び稼働性／複雑性マップを含む。これらの入力が行われると、動きベクトル・ラベリング・モジュール３０４は次の四つの領域：ａ）方向；ｂ）規模；ｃ）内容；ｄ）参照フレームのうち一以上の属性によって各動きベクトルを分類するであろう。

方向ラベル
各動きベクトルについて方向ラベルを決定することに関して、一実施例では、全ての入力動きベクトルはＮ＋１方向クラスの一つを指示するものとして認識され、ここでＮは３６０度平面を網羅する領域の均等に分配された数である。一実施例では、Ｎの数は４であり、各ラベルは９０度（即ち、３６０度／４）離れている。従って、この場合には、全ての入力動きベクトルは方向クラスにおいて水平_右（horizontal_right）、垂直_上（vertical_up）、水平_左（horizontal_left）、または垂直_下（vertical_down）、或いは動き_ゼロ（zero_motion）として分類される。他のラベルがベクトルの方向を示すために使用されることを注意すべきである。例えば、方向ラベルは時計面のマーカーに基づいており、１２時は上、６時は下、３時は右、９時は左、そして０は動きゼロである。別の例では、動きベクトルが北を指示する動きベクトルであるならば、動きベクトルは北動きベクトルとして分類される。一実施例では、クラスは北、南、西、及び東（及び、それの組合せ）、及び無方向（ゼロ・サイズ動きベクトル）を含む。他の実施例では、他の適当なラベルが使用される。

規模ラベル
入力フレームの複雑度及び稼働性マップに基づいて、全ての入力動きベクトルはその動きベクトル規模（magnitude）に基づいて分類することができ、次のラベル：小さな動き（small motion）、中間の動き（medium motion）または大きな動き（large motion）のうちの一つが付けられる。一実施例において、規模ラベルの限界は入力フレームの複雑度及び稼働性マップに基づいて適応的に決定される。例えば、小さな動き内容に関する閾値は４-ｐｅｌ、中間の動き内容については８-ｐｅｌ、そして大きな動き内容には１６-ｐｅｌが設定される。別の実施例では、１〜１０といった数値が動きベクトルの規模を表すために割当てられる（１０は最も大きな規模の動きベクトルに割当てられ、そして１は最も小さな規模の動きベクトルに割当てられる）。他の適切なクラスがまた使用される。

内容ラベル
動きベクトルは現フレーム及び参照フレームの内容マップに基づいて内容ラベルを割当てられる。一実施例において、各内容マップは次の５形式の内容を含む：
１．静止背景（static background：ＳＢ）
２．動き対象（moving object：ＭＯ）
３．出現対象（appearing object：ＡＯ）
４．消失対象（disappearing object：ＤＯ）；及び
５．エッジ（edges：ＥＤＧＥ）
従って、現動きベクトルが指示しているフレームの領域の形式は分析され、内挿されるフレームの処理に影響を及ぼすであろう。ここに述べたように、内容ラベルへのＥＤＧＥラベルの導入は内容識別のための追加ラベルを付加し、他の処理において改善を行う。

図６は特定フレームにおける様々な領域への上掲の領域形式の割当の例示図で、それはフレーム毎の領域の状態変化の分析に基づくものである。図は動き対象（ＭＯ）６０８、出現対象（ＡＯ）６０４、消失対象（ＤＯ）６１０、静止背景（ＳＢ）６０２及びエッジ６０６を例示し、ここで矢印６１２の集合は三つの例示フレーム：Ｆ(ｔ−１)、Ｆ(ｔ)及びＦ(ｔ＋１)におけるピクセルの動き軌道を表す。特に、各ビデオ・フレーム内部の各ピクセルまたは領域は上掲の５形式のうちの一つに置くことができ、関連する動きベクトルは形式割当の変化（もしあれば）の比較に基づいて特定の方式で処理される。例えば、下記で論じるように、動きベクトルが前参照フレームにおいては静止背景であるが現フレームにおいては動き対象に変化する領域において指示されれば、動きベクトルは異常動きベクトルとして印される。その上、ＳＢ、ＡＯ及びＤＯクラスの間の差異が小さいとき、上記の５内容形式はあまり制限のない三つの形式に分類することができる：
１．ＳＢ６０２、ＡＯ６０４、ＤＯ６１０；
２．ＭＯ６０８；及び
３．ＥＤＧＥ６０６。

一実施例では、二つの異なる方法がＤＯ、ＳＢ、ＡＯ及びＭＯ内容の決定を行うために各々異なる計算複雑度に基づいて使用される。例えば、低複雑度方法においては、次の公式が内容形式を決定するために使用される：
Ｑｃ＝ａｂｓ（Ｆｃ[ｙｎ] [ｘｎ]−Ｆｐ[ｙｎ] [ｘｎ]）；
Ｑｐ＝ａｂｓ（Ｆｐ[ｙｎ] [ｘｎ]−Ｆｐｐ[ｙｎ] [ｘｎ]）；
Ｑｃ＝（Ｑｃ＞閾値）；及び
Ｑｐ＝（Ｑｐ＞閾値）；
但し、
ｙｎ及びｘｎはピクセルのｙ及びｘ座標位置である；
Ｆｃは現フレーム・ピクセル値である；
Ｆｐは前フレーム・ピクセル値である；
Ｆｐｐは前々フレーム・ピクセル値である；
Ｑｃは現フレーム及び前フレームにおいて（[ｙｎ] [ｘｎ]に位置する）配列ピクセル間の絶対ピクセル値差分である；
Ｑｐは前フレーム及び前々フレームにおいて（[ｙｎ] [ｘｎ]に位置する）配列ピクセル間の絶対ピクセル値差分である；そして
（Ｑｃ＆＆Ｑｐ）ならば動き対象としての形式を割当てる；
さもなければ、（！Ｑｃ＆＆！Ｑｐ）ならば静止背景としての形式を割当てる；
さもなければ、（Ｑｃ＆＆！Ｑｐ）ならば消失対象としての形式を割当てる；
さもなければ、（！Ｑｃ＆＆Ｑｐ）ならば出現対象としての形式を割当てる。

高複雑度方法において、一実施例では、その決定は分割対象の動きを追跡することによって行われる内容形式決定による対象分割及び形態論的操作に基づいている。従って：
１．動きフィールドに対象分割を行う；
２．分割対象の動きを（例えば、形態論的操作によって）追跡する；そして
３．ＳＢ、ＡＯ、ＤＯ、及びＭＯとして対象にそれぞれ印する。

エッジは境界の特徴付けを行い、従って特に動き対象のエッジは画像処理において基本的に重要であることを注意すべきである。画像におけるエッジは強い強度コントラスト（即ち、一つのピクセルから次のピクセルへの強度の大きな変化）を持つ領域である。エッジ検知を行う多くの方法がある。しかしながら、いろいろな方法の大多数は二つのカテゴリー：勾配（gradient）及びラプラシアン（Laplacian）に分類される。勾配方法は画像の一次導関数における最大と最小を見付けることによってエッジを検出する。ラプラシアン方法はエッジを発見するために画像の二次導関数におけるゼロ交差を探す。勾配またはラプラシアン方法（それらは一次元であるが）の技術はソベル（Sobel）方法によって二次元に適用される。

様々なマクロ・ブロックにＭＯ、ＳＢ、ＡＯ、ＤＯ及びＥＤＧＥクラスを割当てることによって、全ての入力動きベクトルは、動きベクトルの開始点及び終了点により影響を受ける内容形式に基づいて、ＭＯ動きベクトル（ＭＶ）、ＳＢＭＶ、ＡＯＭＶ、ＤＯＭＶまたはＥＤＧＥＭＶとしてラベル付けすることができる。その上、一実施例では、「不審（suspicious）ＭＶ」の追加ラベルがＭＯ、ＳＢ、ＡＯ、ＤＯ及びＥＤＧＥＭＶラベルに付加され、そして動きベクトルの開始点及び終了点が異なる内容クラスに属するならば、動きベクトルは「不審ＭＶ」として分類される。

参照フレーム指数ラベル
複数参照フレームが使用される場合には、各動きベクトルは参照フレーム・リストにおける異なる参照フレームを指示する。上で論じたように、各動きベクトルが指示するどちらかの参照フレームが動きベクトル参照フレーム指数において追跡される。一実施例では、時間的に最も近い参照フレームを参照しない各動きベクトルは「不審」動きベクトルとして分類される。別の実施例では、その隣接動きベクトルと異なる参照フレームを指示する各動きベクトルは「不審」動きベクトルとして分類される。全てではないが、いくつかの隣接動きベクトルが一致している場合、同じ参照フレームを指示する多数の動きベクトルがあれば、多数とは一致しないあらゆる動きベクトル−即ち、同じ参照フレームを指示しないあらゆる動きベクトルは「不審」動きベクトルとして分類されるであろう。他の実施例では、「多数票決（most votes）」といった票決システム（そこではそれを指示する大多数の隣接動きベクトルを持つ参照フレームは、隣接動きベクトルが「不審」としてラベル付けされない動きベクトルを指示しなければならない参照フレームと考えられる）または他の票決形式機構が使用される。下記で述べるように、一実施例では、「不審」参照フレーム指数ラベルを持つあらゆる動きベクトルは異常動きベクトルとして分類されるであろう。他の実施例では、「不審」と分類される代りに、動きベクトルは異常動きベクトルとして直接分類される。

一旦、動きベクトルが一以上の前述ラベルを使用して分類されると、動作は動きベクトル分類モジュール３０６によって行われる動きベクトル分類段階１２４に続く。

動きベクトル分類
動きベクトル・ラベリング・モジュール３０４が各動きベクトルにラベル付した後、動きベクトル分類モジュール３０６は、それが異常動きベクトルであるかどうかを判定することによって動きベクトルの分類を行うであろう。一実施例では、動きベクトル分類モジュール３０６は、上に述べたように復号データ記憶ユニット２２２からの内容情報を含めて、（動きベクトル・ラベリング・モジュール３０４によって割当てられた）そのラベル情報に基づいて入力動きベクトルが異常動きベクトルであるかどうかを判定する。特に、その分類は動きベクトルの方向、規模、内容、及び／または参照フレーム指数（そこでは複数の参照フレームが使用される）ラベルに基づいて閾値操作によって行われる。一実施例では、現動きベクトルの規模及び方向は、現動きベクトルを取り囲む他の動きベクトルの規模及び方向と比較される。例えば、現動きベクトルが小さな垂直_下（vertical_down）動きベクトル（即ち、下を指示する小規模動きベクトル）と分類され、一方、その隣接動きベクトルが大きな垂直_上（vertical_up）動きベクトル（即ち、上を指示する大規模動きベクトル）と分類されるならば、現動きベクトルは異常動きベクトルとして印される。

一実施例では、動きベクトルが異常動きベクトルであるかどうかを判定するために多数票決機構が使用される。例えば、３規模のクラス（例えば、低、中間、及び高）、及び４方向のクラス（例えば、南、東、西、及び北）があれば、合計１２（４方向×３規模）の可能な動きベクトル・クラスの変形がある。さらに、３×３サイズを持つ平滑化窓が与えられると、大多数の動きベクトルがあるクラスの組合せ（例えば、５個の動きベクトルは高規模であり、南を指示する）であり、且つ現動きベクトルのクラス組合せがこの大多数のクラス組合せと異なっていれば、現動きベクトルは異常動きベクトルとして分類される。異常動きベクトルであるかどうかを判定するために多くの方法が使用される。例えば、簡単なソート・アルゴリズムが３×３サイズの窓における九（９）動きベクトルを分類するために使用される。

別の実施例では、現動きベクトルは異常動きベクトルかどうかを判定するために一つの属性だけが使用される。例えば、動きベクトルの内容属性（即ち、ラベル）は動きベクトルが「不審ＭＶ」であることを示し、一方、その隣接動きベクトルの内容ラベルが別の一つの形式であるならば、その内容属性はその隣接動きベクトルの内容属性と異なるために、その動きベクトルは異常動きベクトルとして分類することができる。別の例では、動きベクトルが時間的に最も近い参照フレームではない参照フレームを指示する（即ち、上記の参照フレーム指数ラベルの節における最初の実施例）ので、或いはその大多数の隣接動きベクトルによって指示される参照フレームとは異なる参照フレームを指示する（即ち、上記の参照フレーム指数ラベルの節における第二の実施例）ので、「不審」と分類されたならば、動きベクトルは異常動きベクトルとして分類される。

一旦、動きベクトルがその一以上のラベルに基づいて分類されると、動作は内容適応フィルタ（平滑化）モジュール３０８によって行われる内容適応フィルタリング段階１２６に続く。

内容適応フィルタリング
復号データ及び動きベクトルのラベル付けからの内容情報は、内容適応フィルタリング・モジュール３０８における適応窓サイズ選択アルゴリズムのために必要な入力に提供する。前処理からの異常動きベクトルの除去は選択された処理窓に基づいて行われる。内容適応フィルタリング・モジュール３０８は一実施例では三段階で動きベクトルを処理する：
１．内容適応フィルタ窓サイズを選択する：内容またはブロック・サイズに基づいて、３×３または５×５サイズの操作窓（それはフレームの関心の部分を参照する）が選択される。一実施例では、ブロック・サイズが１６×１６の所では３×３窓サイズが選択され、ブロック・サイズが８×８の所では５×５窓サイズが選択される。選択の合理性は最も一般的なビデオ内容からの動き対象、及び動き対象をまさに包含するであろう窓サイズの統計的分析に基づいている。一実施例では、窓サイズは動き対象を完全に包含するのに十分に大きくなければならない。従って、窓サイズが小さなブロック・サイズについてあまりにも小さければ、それは動く対象の一部をただ包含するにすぎず、そして同じ論理は大きなブロック・サイズの場合についても成り立つ。窓サイズがビデオ内容に基づいて選択される所では、詳細な内容がある３×３窓サイズが選択され、一方５×５窓サイズは平滑（あまり詳細でない）領域について使用される。従って、一般に、より詳細な領域に関してより小さな窓サイズを使用することがさらに望ましい。

２．異常動きベクトルを置換する：操作窓内で動きベクトルの中位値操作を行う。

３．動きベクトル・フィールドを平滑化する：操作窓内で低域通過（low-pass）フィルタリング操作が行われる。一実施例では、適当な低域通過フィルタは平均化フィルタ［１／Ｎ、１／Ｎ、・・・、１／Ｎ］である（Ｎは窓サイズである）。

一実施例では、内容適応平滑化フィルタ３０８において実施される平滑化方法は中位値操作である。他の実施例では、中位値操作は中位値（平均化）またはガウス形式フィルタリング操作と置換えることができる。さらに、他形式の線形／非線形フィルタが使用される。

可変ブロック・サイズ動きベクトル処理
固定ブロック・サイズ・システムでは、フレームは一つの固定サイズのブロックに分割されなければならない。しかしながら、可変ブロック・サイズに対応するシステムでは、フレームは異なるサイズ及び形状を持つブロックに分割される。可変ブロックに対応するビデオ・コーデックに関して、システム３００はまたこれらのブロックに関連する動きベクトルについて動きベクトル処理を行うことができる。上で述べたように、そのような一つの規格はＨ．２６４規格で、それは１６×１６、１６×８、８×１６、８×８、８×４、及び４×８のブロック・サイズに対応する。

一実施例では、可変ブロック・サイズ・モードにおける動きベクトル処理に使用される方法は固定ブロック・サイズ・モードに類似する。従って、再び図１を参照すると、可変ブロック・サイズ動きベクトルの処理は固定ブロック・サイズ・モードについて述べた図３の対応するモジュールを使用して実施される動きベクトル・スケーリング段階１２０、動きベクトル・ラベリング段階１２２、内容適応動きベクトル分類段階１２４及び内容適応フィルタリング段階１２６を含む。しかしながら、固定ブロック・サイズ動きベクトル処理に関する処理とは異なる可変ブロック・サイズ動きベクトル処理に関する処理の形態がある。例えば、一つの際立った特徴はいろいろなブロック・サイズの動きベクトルの「ピラミッド」の構築であり、そして現在の層より高いピラミッドの中で層に関する動きベクトル平滑化操作を行うことである。下記で述べるように、別の際立った特徴は各層の動きベクトルを処理することができる内容適応フィルタ・モジュール３０８の動作の修正である。

内容適応方法を使用するピラミッドの構築は動きベクトル・ピラミッド構築モジュール３１０によって行われ、そして現在の層の異常動きベクトルを置換えるために、ピラミッドの上位層から平滑化動きベクトルを使用するためのフィルタの修正は、修正のために異常動きベクトル置換モジュール３１２の使用によって行われる。

ピラミッド構築
各ピラミッドの構築を実施するための一つの可能な方法は次の通りである：１．入力動きベクトル（即ち、可変ブロック・サイズ動きベクトル）はレベル１のピラミッドを生成するために最初に特定の粒度（granularity）（例えば、４×４）にオーバーサンプリングされた（over-sampled）される。オーバーサンプリングはピラミッドの第一層が使用ブロック・サイズの最小ブロック・サイズから構成されることを保証する。

２．レベル２のピラミッドはレベル１における対応４×４動きベクトルを結合（merging）することによって構築される。例えば、レベル２における動きベクトル粒度が８×８であれば、レベル２における一つの８×８動きベクトルはレベル１における四つの４×４動きベクトルと対応する。一実施例では、結合操作はさらに中位値（median）操作を持つ平均化（averaging）または中位値（median）操作のいずれかである。

３．レベル２からレベル３のピラミッドを構築するために、レベル２及びレベル３のより大きなサイズについて適切に修正されたステップ１及びステップ２の方法を繰り返す。

例えば、Ｈ．２６４規格では、ブロック・サイズは７形状のうちの一つであり、従って、最大九つの３-レベル・ピラミッドが構築され、各レベルは異なる粒度のブロック・サイズに関する動きベクトルから構成される。特に、各フレームにおけるマクロ・ブロックは上述の７ブロック・サイズを使用するより小さなブロックに細分化され、それは各フレーム内のブロック・サイズの可変性をもたらす。一実施例では、Ｈ．２６４規格に適用されると、レベル１のピラミッドは常に４×４ブロックの動きベクトルから構築され、レベル２のピラミッドは次の３形式：８×８、８×４、または４×８ブロックの一つの動きベクトルから構築され、そしてレベル３のピラミッドは次の３形式：１６×１６、１６×８、または８×１６ブロックの一つの動きベクトルから構築される。従って、様々なサイズの九つの可能な結合がある。

内容適応ピラミッド
各フレームに関するピラミッドはまたフレームの内容に基づいて生成される。一実施例では、内容適応ピラミッドは二段階で構築される：
１．内容分類もしくは複雑度マップもしくはそれらの組合せに基づいて、最低レベルのピラミッドに関して使用されるブロックのサイズ／形状を適応的に決定する。例えば、非常に高い複雑度を持つフレームはより小さなブロック・サイズを使用する。

２．ステップ１からのピラミッドのレベルが利用可能な最大ブロック・サイズ（例えば、１６×１６または８×８ブロック）から構成されてなければ、追加レベルがステップ１からのレベル上に構築される。動きベクトルに関するブロックの形状はデフォルト形状である。例えば、レベル３に使用されるデフォルト形状はレベル２の１６×１６及び８×８である。

高レベルのピラミッドからの動きベクトルを使用する異常動きベクトル置換
異常動きベクトル置換段階１３６では、異常動きベクトル置換モジュール３１２は可変ブロック・サイズに関する動きベクトルを有する層を持つピラミッド・モデルの対応を可能にする。一実施例では、この方法を使用する異常ベクトルの置換は次のとおりである：
１．（内容マップによって決定される）現レベルのピラミッドの動きベクトルに関する動きベクトル・スケーリング及び動きベクトル・ラベリング、及び動きベクトル分類を行う；
２．より高レベルのピラミッドが利用可能であれば、このより高レベルの動きベクトルに対する動きベクトル処理（平滑化）操作一式（例えば、動きベクトル・スケーリング、動きベクトル・ラベリング、動きベクトル分類、及び動きベクトル・フィルタリング）を行う；そして
３．より高レベルの対応動きベクトルによって異常動きベクトルを置換する。

このようにして、異常動きベクトルが識別されるとき、及び上位レベルのピラミッドが利用可能であれば、異常動きベクトルは上位層における対応する配列動きベクトルと置換される。他の場合には、中位値操作が操作窓内の動きベクトルに関して行われる。

動きベクトルがいくつかの源（sources）から来ることを注意すべきである。一つには、入力動きベクトルは現復号フレームの動きベクトルから来る。別の実施例では、入力動きベクトルは現フレーム及び一以上の前復号フレームの双方から来る。例えば、現フレームの動きベクトル及び前フレームの動きベクトルを結合することによって、一定動きモデルは動き加速を含めるように拡張することができ、それはＦ-フレームに関してさらに正確な動き軌道生成を行う。前フレームの動きベクトルが反転される（いわゆる外挿動きベクトルである）とき、反転動きベクトルは前フレームから現フレームまで指示し、そしてそれは後方（backward）動きベクトルとして使用されるであろう。動きが一定であれば、後方動きベクトル及び前方動きベクトル（現フレームの動きベクトル）はお互いに整列され、反対方向を指示する。前方及び後方動きベクトルが整列されてなければ、差分は動き加速によって引起こされると仮定される。

上で論じたように、動きベクトル・スケーリング・モジュール３０２は現フレームと前フレームとの間に内挿されるフレームの距離、及び計算された動き加速モデルに基づいて入力動きベクトルのスケーリングを行う。スケーリング機能に加えて、別の実施例では、動きベクトル・スケーリング・モジュール３０２は、いくつかの小さなブロック・サイズの動きベクトルをより大きなブロック・サイズの動きベクトルに結合する結合機能（merging function）を含む。結合機能の後で到達される形状サイズは内容に依存するけれども、一実施例では、８×８ブロック・サイズが結合機能に関して使用される。一実施例では、結合機能は平均化機能（average function）として実施される。別の実施例では、結合機能は中位値機能（median function）として実施される。さらに別の実施例では、結合機能は加重和機能として実施される。なおまた他の実施例では、いろいろな機能が結合機能を実施するために組合わされる。

ここに述べた発明概念はまた符号器援用ＦＲＵＣ（ＥＡ-ＦＲＵＣ）に適用可能であり、そこでは符号器がクライアント上で復号ＦＲＵＣモジュールを援用するために余分の情報を送るように構成される。例えば、符号器は動きベクトル、係数残余、または（ＦＲＵＣ操作が）「難しい」マクロ・ブロックに関するＦＲＵＣ命令を復号ＦＲＵＣモジュールへ送ることができる。

図７は無線システムにおけるアクセス端末７０２ｘ及びアクセス点７０４ｘのブロック図を示す。ここに論じられる「アクセス端末」は音声及び／またはデータ接続性をユーザーに提供するデバイスを云う。アクセス端末はラップトップ・コンピュータまたはデスクトップ・コンピュータといった計算デバイスと接続され、或いはそれは携帯情報機器といった内蔵型デバイスである。アクセス端末はまた加入者ユニット、移動局、自動車、遠隔局、遠隔端末、ユーザー端末、ユーザー・エージェント、またはユーザー設備と呼ぶことができる。アクセス端末は加入者局、無線デバイス、セルラー電話、ＰＣＳ電話、コードレス電話、セッション加入プロトコル（ＳＩＰ）電話、無線ローカル・ループ（ＷＬＬ）局、携帯情報機器（ＰＤＡ）、無線接続機能を持つ携帯用デバイス、または無線モデムと接続された他の処理デバイスである。ここで論じられる「アクセス点」は一以上のセクタを通して空中インタフェース上でアクセス端末と通信するアクセス網におけるデバイスを云う。アクセス点は受信空中インタフェース・フレームをＩＰパケットに変換することによって、アクセス端末と残りのアクセス網（それはＩＰ網を含む）との間のルータの働きをする。アクセス点はまた空中インタフェースに関する属性の管理を調整する。

逆方向回線に関して、アクセス端末７０２ｘでは、送信（ＴＸ）データ・プロセッサ７１４はデータ・バッファ７１２からトラヒック・データを受取り、選択された符号化及び変調手法に基づいて各データ・パケットを処理（例えば、符号化、インタリーブ、シンボル写像）を行い、そしてデータ・シンボルを提供する。データ・シンボルはデータの変調シンボルであり、パイロット・シンボルは（先験的に既知の）パイロットの変調シンボルである。変調器７１６はデータ・シンボル、パイロット・シンボル、及び恐らくは逆方向回線に関する信号通信を受取り、（例えば、ＯＦＤＭ）変調及び／またはシステムによって指定された他の処理を行い、そして出力チップ・ストリームを提供する。送信ユニット（ＴＭＴＲ）７１８は出力チップ・ストリームを処理（例えば、アナログ変換、フィルタリング、増幅、及び上位周波数変換）し、そして変調信号を生成し、それはアンテナ７２０から送信される。

アクセス点７０４ｘにおいて、アクセス端末７０２ｘ及びアクセス点７０４ｘと通信している他の端末によって送信された変調信号は、アンテナ７５２によって受信される。受信ユニット（ＲＣＶＲ）７５４はアンテナ７５２からの受信信号を処理（例えば、調整及びディジタル化）し、そして受信標本を提供する。復調器（Ｄｅｍｏｄ）７５６は受信標本を処理（例えば、復調及び検出）し、そして端末によってアクセス点７０４ｘに伝送されたデータ・シンボルの雑音推定である検出データ・シンボルを提供する。受信（ＲＸ）データ・プロセッサ７５８は各端末に関する検出データ・シンボルを処理（例えば、シンボル逆写像、逆インタリーブ、及び復号）し、そして端末のために復号データを提供する。

順方向回線に関して、アクセス点７０４ｘでは、データ・シンボルを生成するためにトラヒック・データがＴＸデータ・プロセッサ７６０によって処理される。変調器７６２は順方向回線に関するデータ・シンボル、パイロット・シンボル、及び信号通信を受取り、（例えば、ＯＦＤＭ）変調及び／または他の関連処理を行い、そして出力チップ・ストリームを提供し、それはさらに送信ユニット７６４によって調整され、そしてアンテナ７５２から送信される。順方向回線信号通信は逆方向回線上でアクセス点７０４ｘに伝送する全ての端末のために制御器７７０によって生成された電力制御命令を含む。アクセス端末７０２ｘでは、アクセス点７０４ｘによって伝送された変調信号がアンテナ７２０によって受信され、受信ユニット７２２によって調整され、且つディジタル化され、そして検出データ・シンボルを得るために復調器７２４によって処理される。ＲＸデータ・プロセッサ７２６は検出データ・シンボルを処理し、そして端末及び順方向回線信号通信のために復号データを提供する。制御器７３０は電力制御命令を受取り、そしてアクセス点７０４ｘに対する逆方向回線上のデータ伝送及び伝送電力を制御する。制御器７３０はアクセス端末７０２ｘ及びアクセス点７０４ｘの動作をそれぞれ指令する。メモリ・ユニット７３２及び７７２は制御器７３０及び７７０によって使用されるプログラム・コード及びデータを記憶する。

開示された実施例は次の技術：符号分割多元接続（ＣＤＭＡ）システム、複数キャリアＣＤＭＡ（ＭＣ-ＣＤＭＡ）、広帯域ＣＤＭＡ（Ｗ-ＣＤＭＡ）、高速下り回線パケット接続（ＨＳＰＤＡ）、時分割多元接続（ＴＤＭＡ）、周波数時分割多元接続（ＦＤＭＡ）システム、及び直交周波数時分割多元接続（ＯＦＤＭＡ）システムのいずれにも、または組合せて適用される。

ここに述べた方法は当業者に既知の様々な通信ハードウェア、プロセッサ及びシステム上で実施されることは注目すべきである。例えば、ここに述べたようにクライアントが操作する一般的な要求は、そのクライアントが内容及び情報を表示するディスプレイ、クライアントの操作を制御するプロセッサ、及びクライアントの操作に関係するデータ及びプログラムを記憶するメモリを持っていることである。一実施例では、クライアントはセルラー電話である。別の実施例では、クライアントは通信機能を持つ携帯用コンピュータである。さらに別の実施例では、クライアントは通信機能を持つパソコンである。その上、ＧＰＳ受信器のようなハードウェアは様々な実施例を実施するためにクライアントにおいて必要に応じて組込まれる。

ここに開示された実施例に関連して記述された実例となる様々な論理ブロック、モジュール、及び回路はここに述べられた機能を実行するために設計された一般用途プロセッサ、ディジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールド・プログラマブル・ゲートアレイ（ＦＰＧＡ）または他のプログラマブル論理デバイス、個別ゲートまたはトランジスタ論理、個別ハードウェア部品、またはその組合せによって実施または実行される。一般用途プロセッサはマイクロプロセッサであるが、これに代るもので、そのプロセッサはあらゆる従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械でもよい。プロセッサはまた計算デバイスの組合せ、例えば、ＤＳＰとマイクロプロセッサの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと連動する一以上のマイクロプロセッサ、または他のそのような構成として実施される。

ここに開示された実施例に関連して記述された方法またはアルゴリズムのステップは直接ハードウェアにおいて、プロセッサによって実行されるソフトウェア・モジュールにおいて、またはその二つの組合せにおいて具体化される。ソフトウェア・モジュールはＲＡＭメモリ、フラッシュ・メモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、リムーバブル・ディスク、ＣＤ-ＲＯＭ、または他の形の当技術分野において知られている記憶媒体に常駐される。典型的な記憶媒体はそのようなプロセッサが記憶媒体から情報を読取り、記憶媒体へ情報を書込むことができるようにプロセッサと接続される。これに代るものでは、記憶媒体はプロセッサに一体化してもよい。プロセッサ及び記憶媒体はＡＳＩＣに常駐してもよい。ＡＳＩＣはユーザー端末に常駐してもよい。これに代るものでは、プロセッサ及び記憶媒体はユーザー端末に個別部品として常駐してもよい。

上で述べた実施例は典型的な実施例である。当業者はここに開示された発明概念から逸脱することなく上述の実施例の多くの使用を行い、且つそこから出発することができる。これらの実施例への様々な修正は当業者には明白であり、ここに定義された一般的な原理は本発明の精神または範囲から逸脱することなく他の実施例、即時通信サービス或いはあらゆる一般的な無線データ通信アプリケーションに適用される。このように、本発明はここに示された実施例に限定されることを意図するものではないが、ここに開示された原理及び新規な特徴と合致する最も広い範囲を与えられるべきである。用語「典型的な（exemplary）」は「例（example）、事例（instance）、または例示（illustration）として役立つ」ことを意味するものとして専らここでは使用される。「典型的な」としてここに述べた実施例は他の実施例に対して好ましい、或いは有利であると必ずしも解釈されない。従って、ここに開示された実施例の新規な形態はただ次の請求項の範囲によって定義されるべきである。

動きベクトル処理システムの動作のフローチャートである。動きベクトル処理システムの動きベクトル抽出サブシステムのブロック図である。動きベクトル処理システムにおける動きベクトル・プロセッサのブロック図である。Ｆ-フレームに関する動きベクトル・スケーリングを説明するために使用される図である。Ｐ-フレームに関する動きベクトル・スケーリングを説明するために使用される図である。ビデオ・フレーム中のピクセルに割当てられた様々なクラスを例示する図である。無線システムのアクセス端末及びアクセス点のブロック図である。

Claims

ビデオフレームに対する複数の動きベクトルを処理する方法をコンピュータに実行させるための命令を記憶したコンピュータ読取り可能媒体であって、
前記ビデオフレームにいくつかの異なるブロックサイズを決定すること、
前記ビデオフレーム内の異なるブロックサイズの数が１より大きければ、特定のブロックサイズに基づく一組の動きベクトルを各々が有する少なくとも第一層及び第二層の動きベクトルを有する動きベクトルのピラミッドを前記複数の動きベクトルから構築する可変ブロックサイズ動きベクトル処理を行うこと、
前記ビデオフレーム内に１つだけのブロックサイズがあれば、固定ブロックサイズ動きベクトル処理を行うこと、
を含み、
前記固定ブロックサイズ動きベクトル処理は
前記複数の動きベクトルをスケーリングすること、
前記複数の動きベクトルの各動きベクトルにラベルを付けること、
各動きベクトルの分類を決定すること、
各動きベクトルの前記分類に基づいて前記複数の動きベクトルにフィルタをかけること、
を含む、コンピュータ読取り可能媒体。
前記複数の動きベクトルから前記動きベクトルのピラミッドを構築することは、
前記第一層の動きベクトルを第一の所定ブロックサイズ粒度で生成するために複数の動きベクトルをオーバーサンプリングすることを含む、請求項１記載のコンピュータ読取り可能媒体。
前記複数の動きベクトルから動きベクトルのピラミッドを構築することは、
第二層の動きベクトルを第二の所定ブロックサイズ粒度で生成するために、前記第一層の動きベクトルにおける一組の動きベクトルからの少なくとも二つの動きベクトルを結合することを含み、前記第二の所定ブロックサイズ粒度は前記第一の所定ブロックサイズ粒度より大きい、請求項２記載のコンピュータ読取り可能媒体。
前記第一層の動きベクトルにおける一組の動きベクトルからの少なくとも二つの動きベクトルを結合することは、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに平均化演算を行うことを含む、請求項３記載のコンピュータ読取り可能媒体。
前記第一層の動きベクトルにおける一組の動きベクトルからの少なくとも二つの動きベクトルを結合することは、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに中位値演算を行うことを含む、請求項３記載のコンピュータ読取り可能媒体。
前記複数の動きベクトルにおける各動きベクトルが大きさを持ち、そして前記複数の動きベクトルをスケーリングすることは、
（ｉ）第一参照フレームに対するビデオフレーム間の第一の距離と（ｉｉ）第二参照フレームに対する前記参照フレーム間の第二の距離との比率を計算すること、及び
前記第一の距離及び前記第二の距離の比率に基づいて前記動きベクトルの大きさを調整することによって各動きベクトルをスケーリングすることを含む、請求項１記載のコンピュータ読取り可能媒体。
前記ビデオフレームは内挿されるフレームであり、前記第一参照フレームは現フレームであり、そして前記第二参照フレームは前記動きベクトルが指し示す参照フレームである、請求項６記載のコンピュータ読取り可能媒体。
前記ビデオフレームは実際のビデオフレームであり、前記第一参照フレームは時間的に最も近いフレームであり、そして前記第二参照フレームは前記動きベクトルが指し示す参照フレームである、請求項６記載のコンピュータ読取り可能媒体。
前記複数の動きベクトルにおける各動きベクトルにラベルを付けることは、
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向及び参照フレーム指数特性の少なくとも一つを決定すること、及び
決定した一以上の特性に基づいて各動きベクトルにラベルを割当てることを含む、請求項１記載のコンピュータ読取り可能媒体。
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向及び参照フレーム指数特性の少なくとも一つを決定することは、
動きベクトル毎に、前記動きベクトルの開始点に関する開始内容形式、及び前記動きベクトルの終了点に関する終了内容形式を決定することを含む、請求項９記載のコンピュータ読取り可能媒体。
前記決定した一以上の特性に基づいて各動きベクトルにラベルを割当てることは、
前記動きベクトルの開始内容形式が前記動きベクトルの終了内容形式と同じでなければ、不審な動きベクトルとして前記動きベクトルにラベル付けすることを含む、請求項１０記載のコンピュータ読取り可能媒体。
各動きベクトルは隣接動きベクトルのグループと関連し、そして各動きベクトルの分類を決定することは、
各動きベクトルの少なくとも一つの特性を調べること、
前記少なくとも一つの特性を前記隣接動きベクトルのグループの総合特性と比較すること、及び
前記少なくとも一つの特性と前記隣接動きベクトルのグループの総合特性との差分が所定の閾値以上であれば、各動きベクトルを異常動きベクトルとして分類することを含む、請求項１記載のコンピュータ読取り可能媒体。
各動きベクトルの分類に基づいて前記複数の動きベクトルをフィルタリングすることは、
内容形式及びブロックサイズの選択された一つに基づくサイズを持つ演算窓を選択すること、
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換すること、及び
前記演算窓内で平滑化演算を行うことを含む、請求項１記載のコンピュータ読取り可能媒体。
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換することは、
前記演算窓において中位値演算、平均値演算、及びガウス形式フィルタ演算の一つを行うことを含む、請求項１３記載のコンピュータ読取り可能媒体。
操作窓内で平滑化演算を行うことは、
操作窓において低域通過フィルタ演算を行うことを含む、請求項１３記載のコンピュータ読取り可能媒体。
ビデオフレームに対する複数の動きベクトルを処理する方法であって、
前記ビデオフレームにいくつかの異なるブロックサイズを決定すること、
前記ビデオフレーム内の異なるブロックサイズの数が１より大きければ、特定のブロックサイズに基づく一組の動きベクトルを各々が有する少なくとも第一層及び第二層の動きベクトルを有する動きベクトルのピラミッドを前記複数の動きベクトルから構築する可変ブロックサイズ動きベクトル処理を行うこと、
前記ビデオフレーム内に１つだけのブロックサイズがあれば、固定ブロックサイズ動きベクトル処理を行うこと、
を含み、
前記固定ブロックサイズ動きベクトル処理は
前記複数の動きベクトルをスケーリングすること、
前記複数の動きベクトルの各動きベクトルにラベルを付けること、
各動きベクトルの分類を決定すること、
各動きベクトルの前記分類に基づいて前記複数の動きベクトルにフィルタをかけること、
を含む、方法。
前記複数の動きベクトルから前記動きベクトルのピラミッドを構築することは、
前記第一層の動きベクトルを第一の所定ブロックサイズ粒度に生成するために、複数の動きベクトルをオーバーサンプリングすることを含む、請求項１６記載の方法。
前記複数の動きベクトルから動きベクトルのピラミッドを構築することは、
第二層の動きベクトルを第二の所定ブロックサイズ粒度に生成するために、前記第一層の動きベクトルにおける一組の動きベクトルからの少なくとも二つの動きベクトルを結合することを含み、前記第二の所定ブロックサイズ粒度は第一の所定ブロックサイズ粒度より大きい、請求項１７記載の方法。
前記第一層の動きベクトルにおける一組の動きベクトルからの少なくとも二つの動きベクトルを結合することは、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに平均化演算を行うことを含む、請求項１８記載の方法。
前記第一層の動きベクトルにおける一組の動きベクトルからの少なくとも二つの動きベクトルを結合することは、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに中位値演算を行うことを含む、請求項１８記載の方法。
前記複数の動きベクトルにおける各動きベクトルが大きさを持ち、そして前記複数の動きベクトをスケーリングすることは、
（ｉ）第一参照フレームに対するビデオフレーム間の第一の距離と（ｉｉ）第二参照フレームに対する前記参照フレーム間の第二の距離との比率を計算すること、及び
前記第一の距離及び前記第二の距離の比率に基づいて前記動きベクトルの大きさを調整することによって各動きベクトルをスケーリングすることを含む、請求項１６記載の方法。
前記ビデオフレームは内挿されるフレームであり、前記第一参照フレームは現フレームであり、そして前記第二参照フレームは前記動きベクトルが指し示す参照フレームである、請求項２１記載の方法。
前記ビデオフレームは実際のビデオフレームであり、前記第一参照フレームは時間的に最も近いフレームであり、そして前記第二参照フレームは前記動きベクトルが指し示す参照フレームである、請求項２１記載の方法。
前記複数の動きベクトルにおける各動きベクトルにラベルを付けることは、
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向及び参照フレーム指数特性の少なくとも一つを決定すること、及び
決定した一以上の特性に基づいて各動きベクトルにラベルを割当てることを含む、請求項１６記載の方法。
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向及び参照フレームインデックス特性の少なくとも一つを決定することは、
動きベクトル毎に、前記動きベクトルの開始点に関する開始内容形式、及び前記動きベクトルの終了点に関する終了内容形式を決定することを含む、請求項２４記載の方法。
前記決定した一以上の特性に基づいて各動きベクトルにラベルを割当てることは、
動きベクトルの開始内容形式が動きベクトルの終了内容形式と同じでなければ、不審な動きベクトルとして動きベクトルにラベル付けすることを含む、請求項２５記載の方法。
各動きベクトルは隣接動きベクトルのグループと関連し、そして各動きベクトルの分類を決定することは、
各動きベクトルの少なくとも一つの特性を調べること、
前記少なくとも一つの特性を前記隣接動きベクトルのグループの総合特性と比較すること、及び
前記少なくとも一つの特性と前記隣接動きベクトルのグループの総合特性との差分が所定の閾値以上であれば、各動きベクトルを異常動きベクトルとして分類することを含む、請求項１６記載の方法。
各動きベクトルの分類に基づいて前記複数の動きベクトルをフィルタリングすることは、
内容形式及びブロックサイズの選択された一つに基づくサイズを持つ演算窓を選択すること、
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換すること、及び
前記演算窓内で平滑化演算を行うことを含む、請求項１６記載の方法。
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換することは、
前記演算窓において中位値演算、平均値演算、及びガウス形式フィルタ演算の一つを行うことを含む、請求項２８記載の方法。
前記演算窓内で平滑化演算を行うことは、
前記演算窓において低域通過フィルタ演算を行うことを含む、請求項２８記載の方法。
ビデオフレームに対する複数の動きベクトルを処理するための装置であって、
前記ビデオフレームにいくつかの異なるブロックサイズを決定するように構成されたプログラム可能回路と、
前記ビデオフレーム内の異なるブロックサイズの数が１より大きければ、特定のブロックサイズに基づく一組の動きベクトルを各々が有する少なくとも第一層及び第二層の動きベクトルを有する動きベクトルのピラミッドを前記複数の動きベクトルから構築する可変ブロックサイズ動きベクトル処理を行うように構成されたプログラム可能回路と、
前記ビデオフレーム内に１つだけのブロックサイズがあれば、固定ブロックサイズ動きベクトル処理を行うよう構成されるプログラム可能回路と、を具備し、前記固定ブロックサイズ動きベクトル処理を行うよう構成される前記プログラム可能回路は、
前記複数の動きベクトルをスケーリングするよう構成されるプログラム可能回路と、
前記複数の動きベクトルの各動きベクトルにラベルを付けるよう構成されるプログラム可能回路と、
各動きベクトルの分類を決定するよう構成されるプログラム可能回路と、
各動きベクトルの前記分類に基づいて前記複数の動きベクトルにフィルタをかけるよう構成されるプログラム可能回路と、
を具備する、装置。
前記複数の動きベクトルから前記動きベクトルのピラミッドを構築するように構成されたプログラム可能回路は、
前記第一層の動きベクトルを第一の所定ブロックサイズ粒度で生成するために、複数の動きベクトルをオーバーサンプリングするように構成されたプログラム可能回路を具備する、請求項３１記載の装置。
前記複数の動きベクトルから動きベクトルのピラミッドを構築するように構成されたプログラム可能回路は、
第二層の動きベクトルを第二の所定ブロックサイズ粒度に生成するために、前記第一層の動きベクトルにおける前記一組の動きベクトルからの少なくとも二つの動きベクトルを結合するように構成されたプログラム可能回路を具備し、前記第二の所定ブロックサイズ粒度は前記第一の所定ブロックサイズ粒度より大きい、請求項３２記載の装置。
前記複数の動きベクトルから動きベクトルの前記ピラミッドを構築するように構成された前記プログラム可能回路は、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つを平均化するように構成されたプログラム可能回路を具備する、請求項３３記載の装置。
前記複数の動きベクトルから前記動きベクトルの前記ピラミッドを構築するように構成された前記プログラム可能回路は、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに中位値演算を行うように構成されたプログラム可能回路を具備する、請求項３３記載の装置。
前記複数の動きベクトルにおける各動きベクトルが大きさを持ち、そして前記複数の動きベクトをスケーリングするように構成されたプログラム可能回路は、
（ｉ）第一参照フレームに対する前記ビデオフレーム間の第一の距離と（ｉｉ）第二参照フレームに対する前記参照フレーム間の第二の距離との比率を計算するように構成されたプログラム可能回路と、
前記第一の距離と前記第二の距離との比率に基づいて前記動きベクトルの大きさを調整することによって各動きベクトルをスケーリングするように構成されたプログラム可能回路を具備する、請求項３１記載の装置。
前記複数の動きベクトルにおいて各動きベクトルにラベルを付けるように構成された前記プログラム可能回路は、
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向、及び参照フレーム指数特性の少なくとも一つを決定するように構成されたプログラム可能回路と、
決定した一以上の特性に基づいて各動きベクトルにラベルを割当てるように構成されたプログラム可能回路を具備する、請求項３１記載の装置。
前記複数の動きベクトルにおいて各動きベクトルの内容、大きさ、方向、及び参照フレーム指数特性の少なくとも一つを決定するように構成された前記プログラム可能回路は、
動きベクトル毎に、前記動きベクトルの開始点に関する開始内容形式及び前記動きベクトルの終了点に関する終了内容形式を決定するように構成されたプログラム可能回路を具備する、請求項３７記載の装置。
決定した一以上の特性に基づいて各動きベクトルにラベルを割当てるように構成された前記プログラム可能回路は、
前記動きベクトルの前記開始内容形式が前記動きベクトルの前記終了内容形式と同じでなければ、不審な動きベクトルとして前記動きベクトルにラベル付けするように構成されたプログラム可能回路を具備する、請求項３８記載の装置。
各動きベクトルは隣接動きベクトルのグループと関連し、そして各動きベクトルの分類を決定するように構成された前記プログラム可能回路は、
各動きベクトルの少なくとも一つの特性を調べるように構成されたプログラム可能回路と、
少なくとも一つの特性を前記隣接動きベクトルのグループの総合特性と比較するように構成されたプログラム可能回路と、
前記少なくとも一つの特性と前記隣接動きベクトルのグループの前記総合特性との差分が所定の閾値を超えていれば、各動きベクトルを異常動きベクトルとして分類するように構成されたプログラム可能回路と、を具備する、請求項３１記載の装置。
各動きベクトルの分類に基づいて前記複数の動きベクトルをフィルタリングするように構成されたプログラム可能回路は、
内容形式及びブロックサイズの選択された一つに基づくサイズを持つ演算窓を選択するように構成されたプログラム可能回路と、
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換するように構成されたプログラム可能回路と、
前記演算窓内で平滑化演算を行うように構成されたプログラム可能回路と、を具備する、請求項３１記載の装置。
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換するように構成されたプログラム可能回路は、
前記窓において中位値演算、平均値演算、及びガウス形式フィルタ演算の一つを行うように構成されたプログラム可能回路を具備する、請求項４１記載の装置。
前記演算窓内で平滑化演算を行うように構成されたプログラム可能回路は、
前記窓において低域通過フィルタ演算を行うように構成されたプログラム可能回路を具備する、請求項４１記載の装置。
ビデオフレームに対する複数の動きベクトルを処理する動きベクトルプロセッサであって、
前記ビデオフレームにいくつかの異なるブロックサイズを決定する手段と、
前記ビデオフレームにおける異なるブロックサイズの数が１より大きければ、特定のブロックサイズに基づく一組の動きベクトルを各々が有する少なくとも第一層及び第二層の動きベクトルを有する動きベクトルのピラミッドを前記複数の動きベクトルから構築する可変ブロックサイズ動きベクトル処理を行う手段と、
前記ビデオフレーム内に１つだけのブロックサイズがあれば、固定ブロックサイズ動きベクトル処理を行う手段と、
を具備し、
前記固定ブロックサイズ動きベクトル処理を行う手段は、
前記複数の動きベクトルをスケーリングする手段と、
前記複数の動きベクトルの各動きベクトルにラベルを付ける手段と、
各動きベクトルの分類を決定する手段と、
各動きベクトルの前記分類に基づいて前記複数の動きベクトルにフィルタをかける手段と、
を具備する、動きベクトルプロセッサ。
前記複数の動きベクトルから動きベクトルのピラミッドを構築する手段は、
前記第一層の動きベクトルを第一の所定ブロックサイズ粒度で生成するために、前記複数の動きベクトルをオーバーサンプリングする手段を具備する、請求項４４記載の動きベクトルプロセッサ。
前記複数の動きベクトルから動きベクトルのピラミッドを構築する手段は、
第二層の動きベクトルを第二の所定ブロックサイズ粒度に生成するために、前記第一層における前記一組の動きベクトルからの少なくとも二つの動きベクトルを結合する手段を具備し、前記第二の所定ブロックサイズ粒度は前記第一の所定ブロックサイズ粒度より大きい、請求項４５記載の動きベクトルプロセッサ。
前記第一層の動きベクトルにおける前記一組の動きベクトルからの少なくとも二つの動きベクトルを結合する手段は、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに平均化演算を行う手段を具備する、請求項４６記載の動きベクトルプロセッサ。
前記第一層の動きベクトルにおける前記一組の動きベクトルからの少なくとも二つの動きベクトルを結合する手段は、
前記第一層の動きベクトルにおける前記一組の動きベクトルからの前記動きベクトルの少なくとも二つに中位値演算を行う手段を具備する、請求項４６記載の動きベクトルプロセッサ。
前記複数の動きベクトルにおける各動きベクトルが大きさを持ち、そして前記複数の動きベクトをスケーリングする手段は、
（ｉ）第一参照フレームに対するビデオフレーム間の第一の距離と（ｉｉ）第二参照フレームに対する参照フレーム間の第二の距離との比率を計算する手段と、
前記第一の距離と前記第二の距離との比率に基づいて前記動きベクトルの大きさを調整することによって各動きベクトルをスケーリングする手段を具備する、請求項４４記載の動きベクトルプロセッサ。
前記複数の動きベクトルにおいて各動きベクトルにラベルを付ける手段は、
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向及び参照フレーム指数特性の少なくとも一つを決定する手段と、
決定した一以上の特性に基づいて各動きベクトルにラベルを割当てる手段と、を具備する、請求項４４記載の動きベクトルプロセッサ。
前記複数の動きベクトルにおける各動きベクトルの内容、大きさ、方向及び参照フレーム指数特性の少なくとも一つを決定する手段は、
各動きベクトルに関して、前記動きベクトルの開始点に関する開始内容形式、及び前記動きベクトルの終了点に関する終了内容形式を決定する手段を具備する、請求項５０記載の動きベクトルプロセッサ。
前記決定した一以上の特性に基づいて各動きベクトルにラベルを割当てる手段は、
前記動きベクトルの開始内容形式が前記動きベクトルの終了内容形式と同じでなければ、不審な動きベクトルとして動きベクトルにラベル付けする手段を具備する、請求項５１記載の動きベクトルプロセッサ。
各動きベクトルは隣接動きベクトルのグループと関連し、そして各動きベクトルの分類を決定する手段は、
各動きベクトルの少なくとも一つの特性を調べる手段、
少なくとも一つの特性を前記隣接動きベクトルのグループの総合特性と比較する手段と、
少なくとも一つの特性と前記隣接動きベクトルの総合特性との差分が所定の閾値を超えれば、各動きベクトルを異常動きベクトルとして分類する手段を具備する、請求項４４記載の動きベクトルプロセッサ。
各動きベクトルの分類に基づいて前記複数の動きベクトルをフィルタリングする手段は、
内容形式及びブロックサイズの選択された一つに基づくサイズを持つ演算窓を選択する手段と、
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換する手段と、
前記演算窓内で平滑化演算を行う手段を具備する、請求項４４記載の動きベクトルプロセッサ。
前記演算窓において異常動きベクトルとして分類された各動きベクトルを置換する手段は、
前記演算窓において中位値演算、平均値演算、及びガウス形式フィルタ演算の一つを行う手段を具備する、請求項５４記載の動きベクトルプロセッサ。
前記演算窓内で平滑化演算を行う手段は、
前記演算窓において低域通過フィルタ演算を行う手段を具備する、請求項５４記載の動きベクトルプロセッサ。