JP2022076346A

JP2022076346A - 画像処理装置、画像処理方法、およびプログラム

Info

Publication number: JP2022076346A
Application number: JP2020186713A
Authority: JP
Inventors: 正明小林; Masaaki Kobayashi
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2020-11-09
Filing date: 2020-11-09
Publication date: 2022-05-19
Also published as: US11908144B2; US20220148198A1

Abstract

【課題】精度と正確度が高い、動きベクトルの信頼度を、取得可能にする。【解決手段】画像処理装置は、時間的に連続した画像を基に動きベクトルを取得するベクトル取得手段と、取得された複数の動きベクトルから、着目する動きベクトルとその周辺の複数の動きベクトルとを選択する選択手段と、二つの動きベクトルの間で動きの類似度を取得する類似度取得手段と、着目する動きベクトルに対して類似度が閾値以内である高い類似度の周辺の動きベクトルの数の総和に関連する値を、信頼度として取得する信頼度取得手段と、を有する。【選択図】図１

Description

本発明は、画像から動きベクトルを取得する画像処理技術に関する。

コンピュータの計算性能の向上に伴い、画像の領域分割、画像の位置合わせなど、コンピュータビジョンと呼ばれる分野の画像処理技術の実用性が高まっている。
画像の位置合わせでは、時間的に連続する画像から動きベクトルを複数算出し、それら動きベクトルを基に画像間の位置ズレを表す動きパラメータを算出する処理が行われる。動きベクトルの算出手法には、着目画像の画像領域（特徴点）に対し、参照画像から類似度が最も高い画像領域を探索して、それら画像領域の相対位置を動きベクトルとする手法がある。類似度に基づく探索手法には、例えば、ＳＡＤ（ＳｕｍｏｆＡｂｓｏｌｕｔｅＤｉｆｆｅｒｅｎｃｅ）やＳＳＤ（ＳｕｍｏｆＳｑｕａｒｅｄＤｉｆｆｅｒｅｎｃｅ）を画像の類似度として用いたブロックマッチングによる探索手法がある。そして、画像の類似度が高い（ＳＡＤの場合はその値が小さい）ほど、その類似度に基づく動きベクトルの信頼度は高いと判定することができる。また、特許文献１には、特徴点とその特徴量を算出し、着目画像の特徴量の類似度が最も高い特徴量をペアリングして、その特徴点の位置関係を動きベクトルとする方法が開示されている。

特開２００７－３３４６２５号公報

ところで、動きベクトルの算出に用いられた類似度は、例えば、画像の特徴が少ない平坦部では、画像の特徴が多い領域と比べて、高く算出されがちである。このため、類似度が高いほど動きベクトルの信頼度が高いと判定する手法の場合、画像の特徴が少ない平坦部では動きベクトルの信頼度が高いと判定される可能性が高くなる。しかしながら、その信頼度は、精度と正確度が高い信頼度であるとは必ずしも言えない。

そこで、本発明は、精度と正確度が高い、動きベクトルの信頼度を、取得可能にすることを目的とする。

本発明の画像処理装置は、時間的に連続した画像を基に動きベクトルを取得するベクトル取得手段と、前記取得された複数の動きベクトルから、着目する動きベクトルとその周辺の複数の動きベクトルとを選択する選択手段と、二つの動きベクトルの間で動きの類似度を取得する類似度取得手段と、前記着目する動きベクトルに対して前記類似度が閾値以内である高い類似度の前記周辺の動きベクトルの数の総和に関連する値を、信頼度として取得する信頼度取得手段と、を有することを特徴とする。

本発明によれば、精度と正確度が高い、動きベクトルの信頼度を、取得可能となる。

画像処理装置の構成例と適用例を示す図である。動き検出を基にした電子防振処理のフローチャートである。第一の実施形態における変換行列推定処理のフローチャートである。画像分割例と動きベクトルの説明図である。第一の実施形態における信頼度算出処理のフローチャートである。ＲＡＮＳＡＣ処理のフローチャートである。第二の実施形態における変換行列推定処理のフローチャートである。第二の実施形態における信頼度算出処理のフローチャートである。第三の実施形態における変換行列推定処理のフローチャートである。オブジェクト単位の領域分割と領域番号の例を示す図である。

以下、本発明の実施形態を、添付の図面に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例にすぎず、本発明は図示された構成に限定されるものではない。また実施形態において同一の構成または処理については、同じ参照符号を付して説明する。
＜第一の実施形態＞
本実施形態では、画像の位置合わせを行うために、時間的に連続する画像から複数の動きベクトルを取得してそれらの信頼度を算出し、信頼度が高い動きベクトルを基に画像の位置ズレを表す動きパラメータを取得する画像処理を例に挙げて説明する。また本実施形態では、動きパラメータ取得処理において、回転行列（下記の参考文献１参照）を求めることとし、時間的に連続する画像から行列を推定して、画像に対していわゆる電子防振処理を行う例を挙げて説明する。

ここで、動きベクトル取得処理としては、例えば、画像から特徴点を抽出し、その特徴点の特徴量を算出して、着目画像の特徴量の類似度が最も高い特徴量をペアリングし、それらの特徴点の位置関係を基に動きベクトルを取得する処理等を挙げることができる。ただし特徴点は、画像の特定の領域に集中することもあるため、画像を例えば同サイズの領域に分割し、それら分割領域ごとに検出する特徴点数を設定して、画像全体から均等に特徴点を検出する手法（特開２０１４－２２９０３０号公報参照）を用いるとする。また、画像の動きを表現する動きパラメータは、回転行列の他、例えば二次元ベクトルやホモグラフィ行列を用いても表現できる。行列の形式に限定はなく、アフィン変換行列やホモグラフィ行列などの他の行列であってもよい。また画像の動きを表す動きパラメータは、二次元ベクトルやホモグラフィ行列を用いても表現可能である。
参考文献１：姿勢推定と回転行列、玉木徹、"ＩＥＩＣＥＴｅｃｈｎｉｃａｌＲｅｐｏｒｔＳＩＰ２００９－４８，ＳＩＳ２００９－２３（２００９－０９）"

なお検出した動きベクトルは、全てが正しいとは限らず、誤った動きベクトルが含まれることがあるため、誤りを含んだデータからモデルを推定するロバスト推定処理が必要となる。ロバスト推定の代表的なアルゴリズムには、ＲＡＮＳＡＣ（下記の参考文献２参照）がある。
参考文献２："Ｒａｎｄｏｍｓａｍｐｌｅｃｏｎｓｅｎｓｕｓ：Ａｐａｒａｄｉｇｍｆｏｒｍｏｄｅｌｆｉｔｔｉｎｇｗｉｔｈａｐｐｌｉｃａｔｉｏｎｓｔｏｉｍａｇｅａｎａｌｙｓｉｓａｎｄａｕｔｏｍａｔｅｄｃａｒｔｏｇｒａｐｈｙ"、Ｍ．Ａ．ＦｉｓｃｈｌｅｒａｎｄＲ．Ｃ．Ｂｏｌｌｅｓ、 "ＣｏｍｍｕｎｉｃａｔｉｏｎｓｏｆｔｈｅＡＣＭ，２４（６）：３８１－３９５，１９８１"
ＲＡＮＳＡＣは、計算を繰り返しながら最適なモデルを推定する技術である。ただし、ＲＡＮＳＡＣは、モデルに対しデータの外れ値（アウトライア）が多いほど、または、推定するモデルのパラメータの要素数が多いほど、多くの繰り返し（イタレーション）を必要とする。そこで、信頼度が低い（精度や正確度が低いと推定される）動きベクトルを除去してからロバスト推定を行うことで、アウトライアの比率を減らし、イタレーション回数を削減できる。

また電子防振のような映像ブレ補正では、時間的に連続する複数の画像に対し、画像間の動きを表現する行列の逆行列をそれぞれ作り、複数の逆行列を使って平滑化した行列を用いて、それら画像を幾何変換することで動きブレの補正が行われる。行列の平滑化は、行列の移動相乗平均を用いて計算することができ、相乗平均の算出に必要な行列のべき乗根は、下記の参考文献３に記載の手法を使って計算することができる。
参考文献３："Ａｌｇｏｒｉｔｈｍｓｆｏｒｔｈｅｍａｔｒｉｘｐｔｈｒｏｏｔ"、 "ＤａｒｉｏＡ．Ｂｉｎｉａ、ＮｉｃｈｏｌａｓＪ．Ｈｉｇｈａｍｂ、ａｎｄＢｅａｔｒｉｃｅＭｅｉｎｉａ"、ＮｕｍｅｒｉｃａｌＡｌｇｏｒｉｔｈｍｓ（２００５）３９：３４９－３７８
なお、画像の位置合わせ技術は、本実施形態で挙げた電子防振のような映像ブレ補正技術の他、自由視点生成技術、画像合成など様々な技術に応用可能である。映像ブレ補正技術は特開２０１０－１０９８７６号公報にも開示されており、自由視点生成技術は特開２００４－２４６６６７号公報にも開示されている。

本実施形態の画像処理装置は、時間的に連続した画像から複数の動きベクトルを取得する動きベクトル取得処理を行い、それら取得した複数の動きベクトルから、着目する動きベクトルとその周辺の複数の動きベクトルとを取得する選択処理を行う。以下、着目する動きベクトルを着目ベクトルと呼び、周辺の動きベクトルを周辺ベクトルと呼ぶことにする。そして画像処理装置は、二つの動きベクトルの間で動きの類似度を取得する類似度取得処理を行い、着目ベクトルに対して類似度が高い、例えばＳＡＤの値が閾値以内である周辺ベクトルの数の総和に関連する値を、動きベクトルの信頼度として取得する。本実施形態の画像処理装置では、この信頼度取得処理によって、精度と正確度が高い、動きベクトルの信頼度を取得する。これにより、本実施形態の画像処理装置では、精度と正確度が高い信頼度の動きベクトルを確実に取得すること、言い換えると、精度や正確度が低い動きベクトルを確実に除外することを可能にする。

図１（ａ）は、本実施形態に係るプログラムを実行することによって、本実施形態の画像処理装置における機能および処理を実現可能とする、情報処理装置の内部構成例を示した図である。図１（ａ）では、情報処理装置として、例えば、パーソナルコンピュータ（ＰＣ）を例に挙げている。本実施形態の画像処理装置として機能するＰＣは、ＣＰＵ１０５、グラフィックプロセッサ１０３、ＲＡＭ１０２、外部ストレージ１０７、ネットワークＩ／Ｆ１０８、バス１０１、ディスプレイ１０４、及びユーザーＩ／Ｆ１０６を有する。またＰＣには、撮像装置である外部撮像部１０９が接続されているとする。なお、外部撮像部１０９はＰＣに内蔵されていてもよいし、ディスプレイ１０４は外部表示装置としてＰＣに接続されていてもよい。
本実施形態の画像処理装置（ＰＣ）は、外部撮像部１０９によって撮像された動画像の画像を解析して特徴点を検出し、特徴点の類似度に基づいて取得した動きベクトルの信頼度を算出するような画像処理を行う。以下、ＰＣの構成と各モジュールの動作について、図１（ａ）を参照して説明する。

図１（ａ）において、バス１０１は、ＰＣ内においてデータの流れを司る。
ＲＡＭ１０２は、書込み可能メモリであり、ＣＰＵ１０５のワークエリア等として機能する。
外部ストレージ１０７は、不揮発性の外部記憶媒体を有し、大容量メモリとして機能する。本実施形態の場合、外部ストレージ１０７は、ハードディスク装置（ＨＤＤ）により実現されるが、ＳＳＤ（フラッシュメモリを使用したソリッドステートドライブ）等の他の記憶装置が用いてもよい。
外部撮像部１０９は、カメラなどの撮像装置であり、被写体等の動画像を取得することができる。

グラフィックプロセッサ１０３は、ディスプレイ１０４に画像を表示する際に必要となる各種の計算処理を行うプロセッサである。グラフィックプロセッサ１０３は、行列演算が可能であり、行列に従って、回転などの画像の幾何変換を行うことができる。
ディスプレイ１０４は、ユーザＩ／Ｆ１０６から入力されたコマンドや、それに対するＰＣの応答出力等を表示する表示装置である。

ＣＰＵ１０５は、中央演算処理装置であり、オペレーティングシステム（ＯＳ）やアプリケーションプログラム等のコンピュータプログラムに基づいて他の構成要素と協働し、ＰＣ全体の動作を制御する。詳細は後述するが、本実施形態の場合、ＣＰＵ１０５が、画像解析により特徴点を抽出し、その特徴点の類似度に基づいて動きベクトルを取得し、さらにその動きベクトルの信頼度を算出するための各種処理を行うとする。なお本実施形態では、ＣＰＵ１０５が一つであるとして説明するがこれに限定されず複数のＣＰＵが存在する構成であってもよい。その場合の各処理はマルチスレッド処理による並列動作が可能である。また本実施形態では、画像解析による特徴点抽出や動きベクトルの取得、その動きベクトルの信頼度の算出等をＣＰＵ１０５が行うとしているが、これらの画像処理はグラフィックプロセッサ１０３が行ってもよい。

ユーザーＩ／Ｆ１０６は、ユーザーからの指示やコマンドの入力を受け付ける。ユーザーＩ／Ｆ１０６から入力された指示やコマンドの情報は、バス１０１を介してＣＰＵ１０５に送られる。ＣＰＵ１０５は、入力された指示やコマンドのなどを基に、プログラムの起動やＰＣの動作制御等を行う。ユーザＩ／Ｆ１０６は、タッチパネル、ポインティングデバイス、キーボードなどであるが、特定のデバイスに限定されるものではない。なお、ユーザＩ／Ｆ１０６は、タッチパネル、ポインティングデバイスである場合には、ディスプレイ１０４上の任意の座標位置でユーザーのタッチがなされたか否かの情報を取得することができる。
ネットワークＩ／Ｆ１０８は、外部装置とのデータのやり取りを中継する。

本実施形態において実行されるプラグラムおよびデータ、外部撮像部１０９にて取得された動画のデータ等は、外部ストレージ１０７に記録され、これらがＲＡＭ１０２へ入力され、ＣＰＵ１０５が実行および処理する構成をとる。プログラムおよびデータは、バス１０１を介して入出力が行われる。画像データは、特に説明しない限り、外部ストレージ１０７から入力され、その入力時に内部画像フォーマットに変換されるものとする。画像の入力は、外部撮像部１０９やネットワークＩ／Ｆ１０８から行うことも可能である。本実施形態における内部画像フォーマットは、ＲＧＢ画像とするが、これに限定されずＹＵＶ画像、モノクロの輝度画像でもよい。また、後述する動き検出は８ｂｉｔの輝度画像で行うものとし、内部画像フォーマットがＲＧＢ画像、またはＹＵＶ画像である場合には、変換して動き検出がなされるものとして説明する。本実施形態において、時間的に連続する各画像は、動画を構成している各フレームの画像であるとする。また、画像サイズは１９２０×１０８８画素、フレームレートは６０ｆｐｓとする。ＵＩ（ユーザインターフェース）画面や処理画像結果は、グラフィックプロセッサ１０３を介して、ディスプレイ１０４上に表示することができる。グラフィックプロセッサ１０３は、入力した画像の幾何変換を行うことが可能で、変換した画像をＲＡＭ１０２に記憶したり、ディスプレイ１０４に直接出力したりすることも可能である。処理データは、外部ストレージ１０７に記録したりＲＡＭ１０２に記憶したりして、他のプログラムと共有可能であるとする。

なお本実施形態では、電子防振処理を行う画像処理装置をＰＣにより実現する例を説明するが、これに限られない。本実施形態に係る電子防振処理は、カメラ装置、組込みシステム、タブレット端末、スマートフォン等の情報機器を用いて実施することができる。また、電子防振処理は、全体または部分的にハードウェアが実行する構成をとってもよい。
また図１（ｂ）は、本実施形態の画像処理装置がカメラ装置に適用された場合の構成例を示している。図１（ｂ）に示したカメラ装置は、撮像部１１０と動き検出部１１１とを備えている。撮像部１１０は、画像を撮像し、その画像をバス１０１へ送る。動き検出部１１１は、画像から動きベクトルの検出を行う。なお、図１（ｂ）のバス１０１～ネットワークＩ／Ｆ１０８までの他のモジュールは、図１（ａ）に示したＰＣの対応した各モジュールと同等のものである。このように、本実施形態で説明する各処理は、カメラ装置でも実行可能である。

図２は、時間的に連続する画像からホモグラフィ行列を推定して電子防振処理を行う処理の流れを示すフローチャートである。これ以降の各フローチャートの説明に関しては、特に説明しない限り、それぞれ「Ｓ」の符号を付したステップの処理が実行され、各ステップの処理は矢印の順に行われるものとして説明する。また、互いに依存関係のない独立した処理については記載のステップ順に処理を実行する必要はなく、順序を入れ替えて実行したり、複数ＣＰＵが存在する場合には処理を並列に実行したりすることも可能である。同様に、ステップが存在するサブルーチンの位置も限定はなく、処理結果が同じであれば、異なるサブルーチンで処理を実行する構成であってもよく、サブルーチンの構成にも限定はない。以降の説明では、図１（ａ）の構成およびモジュールを例に挙げて、本実施形態の画像処理装置に係る処理を説明する。

Ｓ２０１において、例えば外部撮像部１０９にて撮像されて外部ストレージ１０７に記録された、時間的に連続する各画像（動画の各フレームの画像）が、フレーム順に入力され、ＣＰＵ１０５は、それら各フレームの画像を基に動き検出を行う。例えば、第ｃ－１番フレーム、第ｃ番フレームの輝度画像が入力される場合、ＣＰＵ１０５は、第ｃ－１番フレームから第ｃ番フレームの画像への変化に応じた動きベクトルを検出する。なお、時間的に連続する各入力画像のフレーム番号は０から始まるとし、処理対象のフレーム番号は１から開始され、Ｓ２０１の処理が実行されるごとに、ｃの値がインクリメントされるものとして説明する。

ここで、動き検出は、画像から特徴点を検出し、その特徴点の特徴量を画像間でマッチングし、その対応位置関係を動きベクトルとすることによって行われる。特徴点検出では、画像を同サイズの領域に分割し、分割領域ごとに検出する特徴点数を設定する手法を用いることが望ましい。本実施形態の場合、例えば画像を縦８分割、横１０分割した、８０個の分割領域に対し、分割領域ごとに１００点の特徴点が検出されるとする。だだし、動き検出のアルゴリズムはこれに限定されず、例えば、輝度画像を縦１６×横１６画素単位のブロックで分けた計８１６０ブロックに対し、ブロック単位で、ＳＡＤを使った動き探索によって行うといった構成をとってもよい。

また本実施形態では、一つの動きベクトルは始点の座標と終点の座標とから構成される有向線分であり、一つの動きベクトルをｖ＝｛Ａ，Ｂ｝＝｛（ｘ′，ｙ′），（ｘ，ｙ）｝と表現する。ただし、Ａは動きベクトルの始点を表し、Ｂは動きベクトルの終点を表すとする。
また本実施形態では、動きベクトルｖの純粋なベクトル成分をＣｖ＝Ｃ_AB＝（ｘ－ｘ′，ｙ－ｙ′）と表現する。さらに、複数の動きベクトルの集合をＸとし、集合Ｘ内の個別の動きベクトルを識別するインデックス番号をｉとすると、各動きベクトルはｖ_i＝｛Ａ_i，Ｂ_i｝＝｛（ｘ_i′，ｙ_i′），（ｘ_i，ｙ_i）｝と表現されるとする。またこのとき、集合Ｘは、Ｘ＝｛ｖ₁，ｖ₂，ｖ₃，・・・｝と表現されるものとする。以降、特別な記述がない場合、添え字ｉが共通のｖ、Ａ、Ｂ、ｘ′、ｙ′、ｘ、ｙ、Ｃｖ，Ｃ_ABは、同一の動きベクトル、および、その要素を表すものとして説明する。
また本実施形態では、各数値は浮動小数点として扱うものとして説明するが、固定小数点として計算する方法をとってもよい。また、画像の画素を参照する場合、特別な記述がなければ小数部を切り捨てた数値を座標値として画素を参照するものとする。また、本実施形態において、集合は配列として実装されるものとし、集合Ｘの要素を動きベクトルのｖ_i＝Ｘ[ｉ]、あるいはベクトル成分のＣｖ_i＝Ｃ_X［ｉ］と表現し、集合の要素である動きベクトルやそのベクトル成分を参照できるものとして説明する。また、集合の要素数は、集合を｜｜で挟む形式で表現する。つまり集合Ｘの要素数は｜Ｘ｜と表現される。なお、集合は配列として実装することに限定されず、例えばリストとして実装してもよい。

次にＳ２０２において、ＣＰＵ１０５は、前述のようにして取得した動き検出結果から変換行列を推定する。変換行列の推定方法の詳細は、図３を用いて後述する。本実施形態では、第ｃ－１番フレームから第ｃ番フレームの変化を表す変換行列をＨ_cと表現する。本実施形態では、変換行列Ｈ_cは３×３の行列である回転行列（前述の参考文献１参照）として説明する。なお、行列は、アフィン変換行列やホモグラフィ行列など他の行列でもよい。

次にＳ２０３において、ＣＰＵ１０５は、防振行列を生成するために必要な、防振フレーム周期の数以上の変換行列が推定できたかを判定する。ここで、防振フレーム周期をｐとすると、ＣＰＵ１０５は、ｃ≧ｐが真の場合にはＳ２０４へ遷移し、偽の場合にはＳ２０１へ遷移する。ｐの値は例えば１６であるとするが、ｐの値に限定はなく、長周期のブレを抑制する場合にはｐを大きく設定し、短周期のブレのみ抑制する場合はｐを小さく設定する。

次にＳ２０４において、ＣＰＵ１０５は、推定した複数の変換行列から防振行列を生成する。防振は、高周波のブレを抑制することが目的であり、変換行列を複数フレームにわたって平滑化したものが防振行列となる。本実施形態の場合、ＣＰＵ１０５は、過去のフレームの変換行列と直前の防振行列とを基に計算を行う。例えば、第ｃ番フレームの防振行列をＳ_cとすると、防振行列Ｓ_cは下記の式（１）により計算することができる。

なお、行列のべき乗根の計算は近似計算でよく、例えば前述した参考文献２に開示された方法で計算できる。ただし、行列のべき乗根は複数存在する場合があるため、一意の行列が定まる制約を設ける。本実施形態では、行列は回転行列であるため、回転量が最も小さい行列を選択することになる。また、行列のべき乗根が計算できない場合、防振行列Ｓ_cは単位行列であるものとして処理が進められる。なお、行列の平滑の方法はこれに限定されない。

次にＳ２０５において、グラフィックプロセッサ１０３は、前述のようにして求められた防振行列を使って画像を幾何変換する。本実施形態の場合、グラフィックプロセッサ１０３には、第ｃ－ｐ＋１番フレームのＲＧＢ画像が入力され、ＲＧＢそれぞれのチャネルごとに処理がなされる。
ここで、幾何変換後の画像である出力画像の画素位置を（ｘ_out，ｙ_out）とし、入力画像の画素位置を（ｘ_in，ｙ_in）、出力画像から入力画像への変換行列を下記の式（２）で表されるＭとする。

このとき、出力画像の画素位置（ｘ_out，ｙ_out）から入力画像の画素位置（ｘ_in，ｙ_in）を計算するｐｒｏｊ関数は、下記の式（３）のように表せる。

またＳ２０５において、グラフィックプロセッサ１０３は、出力画像の画素を一画素ずつ走査しながら、Ｍ＝Ｓ^-1としたｐｒｏｊ関数を用いて、出力画像の走査対象画素に対応する入力画像の対応画素の位置を計算する。そして、グラフィックプロセッサ１０３は、この対応画素の画素値を走査対象画素の画素値として、出力画像の全ての画素値を決定する。なお、入力画像の画素位置（ｘ_in，ｙ_in）は小数値をもつため、バイリニアやバイキュービックなどの方法を使って補間し、より精度の高い画素値を計算する方法がとられてもよい。このようにして変換された画像は、ディスプレイ１０４に表示されたり、さらに符号化されて外部ストレージ１０７に記録したりされる。

次にＳ２０６において、ＣＰＵ１０５は、全ての入力画像が処理されたかを判定し、処理されたと判定した場合には図２のフローチャートの処理を終了し、一方、未処理の画像がある場合にはＳ２０１に遷移し、以後、Ｓ２０１からＳ２０６の処理を繰り返す。なお、本実施形態では、処理の終了条件として全ての入力画像が処理されたか否かを判定したが、これに限定されず、ＣＰＵ１０５は、ユーザーから処理終了を指示するＵＩ操作が行われたか否か判定し、終了指示の操作が行われた場合に処理を終了してもよい。

図３は、本実施形態に係る変換行列推定処理の流れを示すフローチャートである。
Ｓ３０１において、ＣＰＵ１０５は、前述のようにして複数分割した分割領域のうち、処理の対象分割領域を走査し、分割領域内ごとに当該分割領域内の動きベクトルの集合を取得する。

以下、分割領域の走査方法について図４（ａ）と図４（ｂ）を参照して詳細に説明する。
図４（ａ）は、画像の分割方法と分割領域番号を例示した図である。
本実施形態の場合、ＣＰＵ１０５は、分割した領域を、図４（ａ）中の各番号順のようなラスター順にしたがって走査する。つまり、ＣＰＵ１０５は、一回目のＳ３０１の処理が実行される場合には、番号１の分割領域が対象となり、以下、２回、３回と実行されるごとに分割領域番号２、３の分割領域が対象となって処理される。
そして、Ｓ３０１において、ＣＰＵ１０５は、対象分割領域内にベクトルの終点（矢印のついた点）が含まれる動きベクトルを入力する。本実施形態では、この分割領域の番号をｄとし、以下、分割領域ｄのように表現して説明する。また、最大分割数をｄ_maxと表現する。本実施形態では、ｄ_max＝２０である。分割領域ｄの番号は１から始まり、Ｓ３０１が実行されるごとにｄの番号がインクリメントされることになる。なお動き検出の方法においても画像を分割しているが、その際の区切り位置とＳ３０１における分割の区切り位置とは同一にせずとも、処理は可能であるが、分割領域内の動きベクトルの本数を完全に一致させるためには区切り位置を一致させることが望ましい。

図４（ｂ）は、動きベクトルの状態を例示する図であり、図中の各矢印が動きベクトルを表している。図４（ｂ）に例示したように、動きベクトルは、分割領域をまたぐ場合があるため、本実施形態では、動きベクトルｖの終点が含まれる分割領域を、その動きベクトルに対応した分割領域として扱う。動きベクトルｖの終点Ｂが、分割領域ｄに含まれるか否かを判定する関数をｉｎ（ｄ，Ｂ）とすると、分割領域ｄに含まれるベクトルの集合Ｙ_dは、下記の式（４）により表される。

Ｙ_d＝｛ｖ∈Ｘ｜ｉｎ（ｄ，Ｂ）＝true｝式（４）
ただしｖ＝｛Ａ，Ｂ｝

この式（４）の記法は、集合Ｘの要素を走査して、「｜」以降で表現された条件を満足する要素を抽出し、抽出された要素の部分集合であるＹ_dを生成することを示している。以下、部分集合の生成は、同様の記法を用いて説明する。なお、部分集合として新しい配列やリストを生成せず、各要素に部分集合であるか否かを示すフラグを設け、要素の抽出時にフラグを設定する構成をとってもよい。その構成の場合、処理ごとに上位集合の要素を走査して走査対象の要素のフラグを参照することによって、部分集合である要素のみを取得できる。なお、集合Ｙ_dは、事前に作成しておき、Ｓ３０１で入力のみする構成をとってもよい。また本実施形態では、図４のように画像を２０分割したものとして説明したが、分割方法はこれに限定されない。また本実施形態では、終点が分割領域に含まれる動きベクトルを入力するとして説明したが、始点が分割領域に含まれる動きベクトルを入力する構成をとってもよい。また分割領域の走査順も、ラスター順に限定されない。さらには、動きベクトルｖの終点Ｂが、自身の分割領域とその近傍の８個の分割領域のいずれに含まれるか否かを判定する関数をneighbour（ｄ，Ｂ）と表した場合、下記の式（５）を用いて、ベクトルの集合Ｙ′_dが生成されてもよい。

Ｙ′_d＝｛ｖ∈Ｘ｜neighbour（ｄ，Ｂ）＝true｝式（５）
ただしｖ＝｛Ａ，Ｂ｝

例えば番号９の分割領域の場合、当該番号９の分割領域とその近傍の８個の分割領域とは、図４（ａ）中で太線で囲まれた９個の分割領域になる。ただし、近傍の分割領域が画面外に存在する場合には、画面内の分割領域から、ベクトルの集合Ｙ′_dが作られるものとする。

次にＳ３０２において、ＣＰＵ１０５は、着目ベクトルに対して類似度が高い（ＳＡＤの値が閾値以内）周辺ベクトルの数の総和に関連する値を、動きベクトルの信頼度として算出する。信頼度は、着目ベクトルに対する周辺ベクトルの相違の少なさを表す指標である。例えば、信頼度ｒ_iは、以下の式（６）、式（７）で計算される。信頼度ｒ_iのｉは、分割領域内の動きベクトルのインデックス値を示す。そして、ＣＰＵ１０５は、分割領域内のベクトル全てに対し信頼度を算出する。

ここで、Ｙ″_dは、Ｙ″_d＝Ｙ_dもしくはＹ″_d＝Ｙ′_dとなる。前者は対象分割領域内の動きベクトルのみ参照するため演算量が少なくて、後者は対象分割領域に加えて近傍８個の分割領域の動きベクトルを参照するため、数が多く精度が増すことになる。以下、Ｙ″_d＝Ｙ_dとして説明する。なお本実施形態では、式（６）のｅはｅ＝１とする。この処理の詳細は図５を用いて後述する。

次にＳ３０３において、ＣＰＵ１０５は、動きベクトルの信頼度に対して所定の閾値を用いた判定処理を行うことで、信頼度が高い動きベクトルを抽出する。本実施形態では、動きベクトルの信頼度は、着目ベクトルに対する周辺ベクトルの相違の少なさを表す指標であるため、所定の閾値は、相違の少なさを判定するための値として設定される。そして、ＣＰＵ１０５は、動きベクトルの信頼度が閾値以内となる動きベクトルを、信頼度が高い動きベクトルとして抽出する。
信頼度に対する閾値を用いた判定処理で抽出された動きベクトルの集合、例えば、第ｃ番フレームの分割領域ｄで抽出された動きベクトルの集合Ｖ_dは、以下の式（８）で表現される。

Ｖ_d＝｛ｖ_i∈Ｘ／ｒ_i＞ｔｈ｝式（８）

ここで、式（８）の閾値ｔｈは動きベクトルの密度に依存する。本実施形態では、ｔｈ＝|Ｙ″_d|×０．１とする。なお、Ｓ３０２でｒ_iを|Ｙ″_d|で割ることで正規化しておき、ｔｈ＝０．１としてもよい。

次にＳ３０４において、ＣＰＵ１０５は、全ての分割領域の処理が終了したか否かを判定する。ＣＰＵ１０５は、全ての分割領域の処理が終了したと判定した場合にはＳ３０５に遷移し、処理が終了していない場合はＳ３０１に遷移し、以後、Ｓ３０１からＳ３０４のステップが繰り返される。

Ｓ３０５に進むと、ＣＰＵ１０５は、全分割領域から抽出した動きベクトルを入力して回転行列を推定する。本実施形態では、許容誤差ｅ_hを３として、ＲＡＮＳＡＣを実行するサブルーチンが呼び出されるものとする。回転行列推定処理のサブルーチンの詳細については、図６を用いて後述する。

以下、信頼度算出処理の流れについて図５のフローチャートを用いて説明する。なお、以降の説明において、変数ｉ，ｊ，ｃ_iはゼロに初期化しておくものとする。
まずＳ５０１において、ＣＰＵ１０５は、着目ブロックから、着目ベクトルｖ_iを取得する。これは、動きベクトルの集合Ｙ_dからｉ番目の動きベクトルを取得する処理に当たる。
次にＳ５０２において、ＣＰＵ１０５は、着目ブロックの周辺ブロックに含まれる動きベクトルを周辺ベクトルとして取得し、着目ブロックと周辺ブロックに含まれる動きベクトルから、参照ベクトルを取得する。これは、動きベクトルの集合Ｙ″_dからｊ番目の動きベクトルを参照ベクトルとして取得する処理に当たる。

次にＳ５０３において、ＣＰＵ１０５は、着目ベクトルと参照ベクトルとの差を算出する。着目ベクトルと参照ベクトルとの差のノルム値は、二つの動きベクトルの間における動きの類似度を表す。
そしてＳ５０４において、ＣＰＵ１０５は、Ｓ５０３で算出した差のノルム値に対して閾値を用いた判定処理を行い、差（ノルム値）が閾値以内であるならば、変数ｃ_iに１を加算する。本実施形態では、閾値は１とする。すなわち着目ベクトルとのノルム値が閾値以内である場合、周辺ベクトルは類似度が高いとなされて、動きベクトルの数の総和に関連する値を信頼度として算出する処理に用いられることになる。

次にＳ５０５において、ＣＰＵ１０５は、全ての参照ベクトルを参照したかを判定する。つまり、Ｓ５０５において、ＣＰＵ１０５は、集合Ｙ″_dの要素全てを参照したかを判定する。そして、ＣＰＵ１０５は、全て判定した場合にはＳ５０６の処理を実行し、残りがある場合にはＳ５０７の処理を実行する。
Ｓ５０６に進むと、ＣＰＵ１０５は、全ての着目ベクトルを参照したかを判定する。つまり、ＣＰＵ１０５は、Ｙ_dの要素全てを参照したかを判定する。そして、ＣＰＵ１０５は、全て判定したと判定した場合には図５の処理を終了し、まだ残りがある場合にはＳ５０８の処理を実行する。
Ｓ５０７に進むと、ＣＰＵ１０５は、ｊをインクリメントした後、Ｓ５０１の処理に戻る。
またＳ５０８に進むと、ＣＰＵ１０５は、ｉをインクリメントした後、Ｓ５０１の処理に戻る。
この図５のフローチャートの終了次点で、変数ｃ_iには信頼度が格納されていることになる。

図６は、回転行列推定処理のサブルーチンを示すフローチャートである。本実施形態では、ＲＡＮＳＡＣ法を例に挙げて説明する。
Ｓ６００において、ＣＰＵ１０５は、イタレーション数をインクリメントする。
次にＳ６０１において、ＣＰＵ１０５は、入力サンプル全体から動きベクトルを四つ取得する。本実施形態において、入力サンプル全体とは、図３のフローチャートで抽出された動きベクトルの全分割領域に対する集合である。つまり、入力サンプル全体Ｚは、下記の式（９）で表される。

Ｚ＝｛ｖ∈Ｖ_d｜１≦ｄ≦ｄ_max｝式（９）

次にＳ６０２において、ＣＰＵ１０５は、四つの動きベクトルから行列を算出する。このとき、取得した動きベクトルをｖ_j（ただしｊは１から４）と表現する。算出する行列はＳ２０２の処理による変換行列Ｈ_cである。変換行列Ｈ_cは下記の式（１０）で表される。

そしてＳ６０２において、ＣＰＵ１０５は、方程式を解いて下記の式（１１）を満足する回転行列のそれぞれの要素を算出する。

なお、行列の算出は様々な方法があり、回転行列の算出は前述した参考文献１に記載されている方法で算出できるため、詳細な説明は省略する。ただし、行列の計算方法によっては、サンプルの選び方によって行列が算出できない場合がある。このため、ＣＰＵ１０５は、行列算出の失敗を判定して、失敗と判定した場合にはＳ６００の処理に遷移し、再度、処理が行われるものとする。

次にＳ６０３において、ＣＰＵ１０５は、サンプル全体に対し、動きベクトルの始点を、算出した行列で射影した点と終点との距離を算出し、距離が許容誤差内のデータをインライア数としてカウントする。この許容誤差は前述のｅ_hである。回転行列推定のおけるインライア数ｃ_Hinlierは、下記の式（１２）により計算できる。

ｃ_Hinlier＝｜｛ｖ∈Ｚ｜dist（(proj(Ｈ_c,(x′,ｙ′)^t))^t－(x,ｙ)）≦ｅ_h｝｜
ただしｖ＝｛(x′,ｙ′)，(x,ｙ)｝式（１２）

次にＳ６０４において、ＣＰＵ１０５は、現在までのイタレーションでインライア数が最大であるか否か判定する。そして、ＣＰＵ１０５は、判定が真である場合にはＳ６０５へ遷移し、偽である場合にはＳ６０６へ遷移する。なお、例外として、一回目のＳ６０４の処理の実行では、必ずＳ６０５へ遷移するものとする。

Ｓ６０５に進むと、ＣＰＵ１０５は、取得した動きベクトルをベストパラメータとして保存する。
次にＳ６０６において、ＣＰＵ１０５は、イタレーション数が上限数に達したか否かを判定する。本実施形態では、上限を５０回とする。だたし、この回数に限定はない。例えば、入力される動画のフレームレートが６０ｆｐｓの場合、図２のフローチャートの処理は１６ｍｓ以内で完了する必要がある。そのため、ＣＰＵ１０５のスペックや数によって、最適な値が決定される。ＣＰＵ１０５は、イタレーション数が上限数に達したと判定した場合にはＳ６０８に遷移し、達していない場合にはＳ６０７に遷移する。

６０７に進むと、ＣＰＵ１０５は、イタレーション数が十分か否かを判定する。そして、ＣＰＵ１０５は、イタレーション数が十分と判定した場合にはＳ６０８に遷移し、不十分と判定した場合にはＳ６００へ遷移する。また、この判定は、イタレーション数が次の式（１３）によって算出されるＮ値を超える場合に十分と判定される。

Ｎ＝log（１－ｐ）／log（１－（ｒ_inlier）^m）式（１３）

ここで、ｐは、正しいサンプルが最低一つ存在する確率である。本実施形態では、サンプルが９９％の確率で存在すると仮定し、ｐ＝０．９９とする。ｍは、パラメータの自由度である。本実施形態では、二次元のベクトルを求めるため、ｍ＝２である。ｒ_inlierは、下記の式（１４）により求められる。

ｒ_inlier＝ｃ_inlier／｜Ｖ_d｜式（１４）

なお、ｃ_inlierは、Ｓ６０３で算出したインライア数である。｜Ｖ_d｜は、Ｓ３０３で抽出した動きベクトルの要素数である。

次にＳ６０８において、ＣＰＵ１０５は、ベストパラメータとして戻り値を返す。本実施形態では、ベストパラメータは二次元ベクトルであり、これが分割領域の代表ベクトルにあたる。

以上説明したように、本実施形態では、着目ベクトルに対し、周辺の類似した動きベクトルの数をカウントし、その総和に関連する値を信頼度とすることで、動きベクトルの信頼度を算出している。動きベクトルを誤検出した場合でも、周辺ベクトルが着目ベクトルと同じベクトルとして誤検出される可能性は低いため、本信頼度は有効である。ここで、アウトライアの割合（以下、アウトライア率とする）が高い動きベクトルを入力とし、ＲＡＮＳＡＣを用いて回転行列を推定すると、イタレーション数が多くなるという問題がある。また、ロバスト推定技術の一つで比較的処理が軽いとされ、処理時間が短いＭ推定は、アウトライア率が高い場合には十分な推定性能が発揮できない。本実施形態では、動きベクトルの信頼度で閾値判定を行い、信頼度の低い動きベクトルを除外している。これにより、回転行列推定の入力となる動きベクトルのアウトライアを除去し、ＲＡＮＳＡＣのイタレーション数を減少させる、あるいは、Ｍ推定の推定性能を向上させることができる。信頼度を算出する処理は、複雑な行列演算がないため処理量が非常に少ない。そのため、例えばＲＡＮＳＡＣに適用する場合、その前処理としての信頼度算出のオーバーヘッドを考慮してもトータルの処理時間の大幅な短縮が可能となる。また例えば、６０ｆｐｓの動画では一つのフレームの処理を１６ｍｓ以内に完了する必要がある。そのためイタレーション数に上限を設ける必要があるが、この場合でも本実施形態に係る処理を行えば、イタレーション数が上限に達し難く、安定的に行列を推定できる。これにより、行列を使って画像の防振を行う場合、行列推定の失敗の確率が減り、より安定的で自然な防振が可能となる。本実施形態では、画像の防振を行うことを例に、代表ベクトルの決定と類似ベクトルの抽出を説明したが、アプリケーションはこれに限定されず、画像合成などのアプリケーションにも適用できる。

また本実施形態では、Ｓ５０５で全ての要素について、処理したか否かを判定したが、それに限定されず、Ｓ５０７で２或いは３ずつインクリメントし、着目ブロックと周辺ブロックの動きベクトルの集合の要素が、最終まで到達して処理したかを判定してもよい。
またＳ３０２において、閾値ｅ＝１としたが、この値はフレームレートなど撮像対象、条件によって設定される値である。また、本実施形態では防振を目的としているため、背景の動きをとることが目的であり、背景の剛体とみなせるため、比較的小さな値を設定したが、人や動物などの軟体の動きを検出する場合は、ｅの値を３といった大きめの値に設定することが望ましい。

＜第二の実施形態＞
以下、時間的に連続する画像から回転行列を推定して電子防振処理を行う第二の実施形態について説明する。
第二の実施形態の画像処理装置は、第一の実施形態の図３に示したフローチャートのＳ３０２、Ｓ３０３の処理を実行する代わりに、図７のフローチャートに示すように、それぞれＳ７０２、Ｓ７０３の処理を実行する。また第二の実施形態の場合、Ｓ７０１の処理が追加されている。他のステップの処理は、第一の実施形態と同様であるためそれらの説明は省略する。

第二の実施形態では、輝度画像を縦１６×横１６画素のブロック単位で画像の類似度を表すＳＡＤを算出し、動き探索に行うものとして説明する。動き探索はＳＡＤが最小となる動きベクトルを探すアルゴリズムであるが、最小のＳＡＤに加えて、次に小さいＳＡＤの値も、検出した動きベクトルごとに記憶しておくものとする。

図７は、第二の実施形態における類似ベクトル抽出処理を行うフローチャートである。第二の実施形態の場合、Ｓ３０１の処理後、ＣＰＵ１０５は、Ｓ７０１の処理に遷移する。
Ｓ７０１に進むと、ＣＰＵ１０５は、対象分割領域とその近傍分割領域の各動きベクトルにおける画像類似度情報を取得するような情報取得処理を行う。これは、第一の実施形態のＳ３０２で説明したＹ″_d＝Ｙ′_dとなる処理である。
本実施形態では、画像類似度にはＳＡＤを使うものとする。なお、ＳＡＤは値が低いほど画像類似度が低くなる指標であるが、本実施形態では動きベクトルの画像類似度情報として用いる。本実施形態では、動き探索において、画像類似度が最も高いとして選ばれた動きベクトルの当該画像類似度、つまり最小のＳＡＤをｄｉｓｔ_i,1とする。また本実施形態では、探索の結果、画像類似度が次に高い動きベクトルの画像類似度、つまり次点となった動きベクトルのＳＡＤをｄｉｓｔ_i,2と表現する。本実施形態では、これら二つのＳＡＤであるｄｉｓｔ_i,1とｄｉｓｔ_i,2とを動きベクトルにおける画像類似度情報として取得するものとする。

そして本実施形態では、信頼度取得処理において、動きの類似度が高い動きベクトルの数と、画像類似度情報とを基に動きベクトルの信頼度を算出する。本実施形態では、動きベクトルのための探索において類似度が最も高かった動きベクトルの画像類似度と、類似度が次に高い動きベクトルの画像類似度との比ｃｏｅｆｆを基に、動きベクトルの信頼度を求める。

すなわちＳ７０２において、ＣＰＵ１０５は、画像類似度情報と周辺ベクトルとから、下記の式（１５）と式（１６）により、対象分割領域内の各動きベクトルの信頼度情報を算出する。

ここで、ｃｏｅｆｆについて説明する。ｃｏｅｆｆの式では、第一候補が分母、第二候補が分子にあるため、第一候補のＳＡＤが第二候補のＳＡＤに比べ小さいほど、ｃｏｅｆｆが大きくなり信頼度が大きくなる。ｏｆｆｓｅｔは、ＳＡＤが０を取り得ることがあるため、０除算を防止するために設定されている。本実施形態では、ｏｆｆｓｅｔ＝３とする。仮に、ｄｉｓｔ_i,1＝１０，ｄｉｓｔ_i,2＝２０であれば、ｃｏｅｆｆ（ｉ）は、２３／１３＝１．７７となる。ｄｉｓｔ_i,1＝０，ｄｉｓｔ_i,2＝１であれば、ｃｏｅｆｆ（ｉ）＝１．３となる。

次にＳ７０３において、ＣＰＵ１０５は、対象分割領域ごとに信頼度を降順でソートし、信頼度が高い上位の動きベクトルを一定数抽出する。本実施形態では、１９２０×１０８８画素の画像に対し、１６×１６画素ごとのブロックで動き探索を行っている。また、画像の分割領域あたり２０であるので、一分割領域あたり４０８本の動きベクトルが検出されていることになる。本実施形態では、このうち上位２５％、つまり１０１本の動きベクトルが抽出されるものとする。Ｓ７０３の後、ＣＰＵ１０５は、Ｓ３０４に遷移する。

図８は、第二の実施形態における信頼度算出処理の流れを示すフローチャートである。
フローを説明する図である。
図８のフローチャートにおいて、ＣＰＵ１０５は、Ｓ５０３の次にＳ８０１の処理を実行し、図５のＳ５０４の代わりにＳ８０２の処理が実行される以外は、図５で説明したフローと同様の処理がなされるものとする。
Ｓ８０１において、ＣＰＵ１０５は、前述した類似度の比ｃｏｅｆｆ（ｊ）を取得する。
またＳ８０２において、ＣＰＵ１０５は、Ｓ５０３で取得された差に対する閾値判定を行い、差が閾値以内ならば、変数ｃ_iに類似度の比ｃｏｅｆｆ（ｊ）を加算する。

ここで、ＳＡＤは画像の類似性が高いほど０に近い値になるが、画像に特徴が少ない領域では、探索しても各ポイントでＳＡＤが０に近くなってしまう。このとき、首位と次点との類似度の比（ｃｏｅｆｆ（ｉ））が１に近いほど信頼度が低く、１より大きいほど信頼度が高くなる。そこで、ＣＰＵ１０５は、類似度の比を重みとして式（１４）に適用し、重み付き総和を使うことで、より精度の高い信頼度としている。特に、周辺に類似のベクトルが少ない場合でも、類似度の比が大きい場合には、信頼度が大きくなり、孤立した動きが除外され難くなる。

本実施形態では、ＳＡＤを使ったブロックマッチングよる動き探索として説明したが、これに限定されず、ＳＳＤが使われてもよい。また本実施形態では、特徴点の特徴量を算出し、特徴量をマッチングさせる方法が用いられてもよい。その場合、ｄｉｓｔ_i,1、およびｄｉｓｔ_i,2は、特徴量空間における距離となる。
また、本実施形態では、ｃｏｅｆｆ（ｉ）の算出に比を用いたが、それには限定されず、例えば下記の式（１７）のように差が使われてもよい。すなわち、動きの類似度が最も高い動きベクトルの画像類似度と、動きの類似度が次に高い動きベクトルの画像類似度との差が、ｃｏｅｆｆ（ｉ）として求められてもよい。

ｃｏｅｆｆ（ｉ）＝ｋ（ｄｉｓｔ_i,2－ｄｉｓｔ_i,1）＋ｏｆｆｓｅｔ式（１７）

ここでは、ＳＡＤ算出のブロックサイズが１６×１６であるためｋ＝１／２５６とする。また、ｏｆｆｓｅｔは１０とする。
第二の実施形態では、第一の実施形態のＳ３０２で説明したＹ″_d＝Ｙ′_dとなる方法を挙げたが、これに限定されず、Ｙ″_d＝Ｙ_dとして処理してもよい。

＜第三の実施形態＞
以下、インテリジェントな領域分割を用いて回転行列を推定して電子防振処理を行う第三の実施形態について説明する。
図９は、オブジェクト単位の領域分割を用いた変換行列の推定処理の流れを示すフローチャートである。図９のフローチャートでは、図３のフローチャートに対し、Ｓ９００の処理が追加されている。
Ｓ９００において、ＣＰＵ１０５は、入力画像を被写体等に応じたオブジェクト単位で領域分割する。領域分割方法にはさまざまな方法が存在するが本実施形態では、ｋ－ｍｅａｎ法を用いて分割するものとする。また本実施形態の例では、分割数は８となっており、各分割領域には番号が付けられる。オブジェクト単位の各分割領域の番号の順序は任意である。なお、分割アルゴリズムや分割数はこれに限定されず、他の方式、分割数であってもよい。このようにして画像を分割すると、例えば図１０のような分割結果が得られる。図１０の例は、画像が被写体等のオブジェクト単位で分割された状態と、オブジェクト単位の分割領域に番号が付与された例を示した図である。分割領域の番号の振り方に任意である。

Ｓ９００の後、ＣＰＵ１０５は、Ｓ３０１の処理に遷移する。Ｓ３０１以降は、第一の実施形態で例示した格子状に区切られた分割領域の代わりに、任意の形状を持つオブジェクト単位の分割領域を対象にする以外は第一の実施形態と同様の処理が実行される。
なお、第三の実施形態の場合、前述した閾値ｔｈは、動きベクトルの密度（本／画素）と分割領域の面積（画素）とによって決定される。例えば、動きベクトルの密度を縦１６画素×横１６画素あたり一本、分割領域の面積を１００００画素、係数ｋを０．１とすると、ｔｈ＝ｋ×１／２５６×１００００≒４となる。
また、第三の実施形態の場合、ｅは対象の被写体が動物や人などの軟体の場合は３、車や建物、地面などの剛体の場合は１とする。
また、同一オブジェクトに含まれる動きベクトルのベクトル成分は同一になる可能性が高いため、同一オブジェクト内に含まれる動きベクトルから信頼度を算出し、信頼度が低いベクトルを除外することで、インライア率が高まる。このため、回転行列推定においては、同一の動きを持つオブジェクトの集合の面積が最も大きい集合に含まれる動きベクトルが、画像全体の動きの主要成分となる傾向が強まる。これは、推定した回転行列を使って防振を行う場合、広い面積が安定して防振されることになり、防振の安定性が高まる。
本実施形態では、被写体と動きベクトルが対応付けされているため、信頼度を判定することで抽出したベクトルは、防振を目的とした回転行列推定だけでなく被写体を追尾する用途にも使える。

本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける一つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。
上述の実施形態は、何れも本発明を実施するにあたっての具体化の例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明は、その技術思想、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。

１０１：バス、１０２：ＲＡＭ、１０３：グラフィックプロセッサ、１０４：ディスプレイ、１０５：ＣＰＵ、１０６：ユーザーＩ／Ｆ、１０７：外部ストレージ、１０８：ネットワークＩ／Ｆ、１０９：外部撮像部、１１０：撮像部、１１１：動き検出部

Claims

時間的に連続した画像を基に動きベクトルを取得するベクトル取得手段と、
前記取得した複数の動きベクトルから、着目する動きベクトルとその周辺の複数の動きベクトルとを選択する選択手段と、
二つの動きベクトルの間で動きの類似度を取得する類似度取得手段と、
前記着目する動きベクトルに対して前記類似度が閾値以内である高い類似度の前記周辺の動きベクトルの数の総和に関連する値を、信頼度として取得する信頼度取得手段と、
を有することを特徴とする画像処理装置。
前記選択手段は、前記画像を分割した分割領域ごとに、少なくとも前記着目する動きベクトルを含む分割領域に含まれる、他の動きベクトルを前記周辺の動きベクトルとして選択することを特徴とする請求項１に記載の画像処理装置。
前記取得する動きベクトルに対応する画像類似度情報を取得する情報取得手段をさらに有し、
前記信頼度取得手段は、前記動きの類似度が閾値以内である高い類似度の動きベクトルの数と、前記画像類似度情報とを基に、前記信頼度を算出することを特徴とする請求項１または請求項２に記載の画像処理装置。
前記画像類似度情報は、前記動きの類似度が最も高い動きベクトルの画像類似度と、前記動きの類似度が次に高い動きベクトルの画像類似度との比であることを特徴とする請求項３に記載の画像処理装置。
前記画像類似度情報は、前記動きの類似度が最も高い動きベクトルの画像類似度と、前記動きの類似度が次に高い動きベクトルの画像類似度との差であることを特徴とする請求項３に記載の画像処理装置。
前記類似度取得手段は、二つの動きベクトルの差のノルム値を、前記動きの類似度として算出することを特徴とする請求項１から請求項５のいずれか１項に記載の画像処理装置。
前記信頼度取得手段は、前記周辺の動きベクトルと前記着目する動きベクトルとの前記ノルム値が閾値以内である場合、前記周辺の動きベクトルの数の総和に関連する値を前記信頼度として取得することを特徴とする請求項６に記載の画像処理装置。
前記ノルム値に対する閾値は、動きを検出する対象の被写体に応じて変わることを特徴とする請求項７に記載の画像処理装置。
前記取得した信頼度の動きベクトルを基に、前記画像の動きを表す動きパラメータを取得するパラメータ取得手段を有することを特徴とする請求項１から請求項８のいずれか１項に記載の画像処理装置。
前記動きパラメータを基に、映像のブレ補正と自由視点の生成と画像合成との少なくともいずれかの処理を行う手段をさらに有することを特徴とする請求項１から請求項９のいずれか１項に記載の画像処理装置。
時間的に連続した画像を基に動きベクトルを取得するベクトル取得工程と、
前記取得した複数の動きベクトルから、着目する動きベクトルとその周辺の複数の動きベクトルとを選択する選択工程と、
二つの動きベクトルの間で動きの類似度を取得する類似度取得工程と、
前記着目する動きベクトルに対して前記類似度が閾値以内である高い類似度の前記周辺の動きベクトルの数の総和に関連する値を、信頼度として取得する信頼度取得工程と、
を有することを特徴とする画像処理方法。
コンピュータを、請求項１から請求項１０のいずれか１項に記載の画像処理装置の各手段として機能させるためのプログラム。