JP2021086183A - 画像処理装置、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2021086183A JP2021086183A JP2019212286A JP2019212286A JP2021086183A JP 2021086183 A JP2021086183 A JP 2021086183A JP 2019212286 A JP2019212286 A JP 2019212286A JP 2019212286 A JP2019212286 A JP 2019212286A JP 2021086183 A JP2021086183 A JP 2021086183A
- Authority
- JP
- Japan
- Prior art keywords
- motion vector
- motion
- image processing
- vector
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【課題】画像の動き情報の算出に係る処理速度を向上させる。【解決手段】一実施形態における画像処理装置は、複数の画像のそれぞれにおける局所画像領域の主たる動きを示す代表動きベクトルを決定し、局所画像領域から、代表動きベクトルに類似する類似動きベクトルを抽出し、抽出した類似動きベクトルを用いて、画像全体の動き情報を推定する。画像処理装置は、局所画像領域の複数の動きベクトルの特徴を算出し、特徴に基づいて選択された動きベクトルから代表動きベクトルを決定する。【選択図】図4
Description
本発明は、画像の動き情報を算出する画像処理技術に関する。
近年、コンピュータの計算性能の向上に伴い、画像の領域分割や位置合わせなど、コンピュータビジョンと呼ばれる分野の画像処理技術の実用性が高まっている。
画像の位置合わせでは、時間的に連続する画像から複数の動きベクトルを算出し、これらの動きベクトルから画像の位置ズレを表現する動きパラメータを算出する。動きベクトルの算出方法は、ブロックマッチングによる動き探索や、特徴点を検出してその対応を求め対応点ペアの座標を動きベクトルとするなどの方法がある(特許文献1参照)。また、動きパラメータは、二次元ベクトルやホモグラフィ行列、回転行列(非特許文献1参照)などを用いて表現できる。しかし、検出した動きベクトルは、全てが正しいとは限らず、誤った動きベクトルが含まれることがあるため、誤りを含んだデータからモデルを推定するロバスト推定技術が必要となる。
ロバスト推定の代表的なアルゴリズムにはRANSACがある(非特許文献2参照)。RANSACは、計算を繰り返しながら最適なモデルを推定する技術である。しかし、RANSACはデータに誤りの量が多いほど、または、推定するパラメータの要素数が多いほど多くの繰り返し(以下、イテレーションという)を必要とする。以下、誤ったデータをアウトライア(outlier)、正しいデータをインライア(inlier)と表現する。
これに対し、位置合わせ処理全体のイテレーション回数を削減するために、前処理として要素数の少ないパラメータにおいてインライアを抽出する手法も提案されている。特許文献2では、画像の分割領域単位で分割領域を代表するベクトルを選出し、代表するベクトルに類似する動きベクトルを抽出することでインライアを抽出する前処理を行う。そして、抽出された動きベクトルから画像全体の動きパラメータを算出する後処理を行う手法が提案している。これにより、位置合わせ処理全体の処理速度や精度を向上させている。このとき、前処理において高い精度でインライアを抽出する場合、アウトライアを除去するためにイテレーション処理によるロバスト推定が必要となる。
上述したように、画像の分割領域内の複数の動きベクトルから高い精度でインライアを抽出する場合、アウトライアの影響を削減するためにイテレーション処理によるロバスト推定が必要になる。しかし、対象となるデータ数が多い場合、多くの演算回数を必要とし、処理に時間がかかってしまっていた。
本発明は上記課題を解決するためになされたものであり、画像の動き情報の算出に係る処理速度を向上させることができる画像処理技術を提供することを目的とする。
上記目的を達成するために、本発明の一実施形態に係る画像処理装置は、複数の画像のそれぞれにおける局所画像領域の主たる動きを示す代表動きベクトルを決定する決定手段と、前記局所画像領域から、前記代表動きベクトルに類似する類似動きベクトルを抽出する抽出手段と、前記抽出した類似動きベクトルを用いて、画像全体の動き情報を推定する推定手段とを有し、前記決定手段は、前記局所画像領域の複数の動きベクトルの特徴を算出し、前記特徴に基づいて選択された動きベクトルから前記代表動きベクトルを決定することを特徴とする。
本発明によれば、画像の動き情報の算出に係る処理速度を向上させることができる。
以下、本発明の実施形態について、図面を参照して詳細に説明する。なお、以下の実施形態は、本発明を限定するものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明に必須のものとは限らない。本発明には、本発明の要旨を逸脱しない範囲の様々な変形形態も含まれる。また、本発明は、以下の実施形態の一部を組み合わせるようにして構成してもよい。
(第1の実施形態)
本実施形態では、画像の位置合わせを行うために、時間的に連続する画像から複数の動きベクトルを算出し、これらの動きベクトルから画像の位置ズレを表現する動きパラメータを算出する方法を説明する。
本実施形態では、画像の位置合わせを行うために、時間的に連続する画像から複数の動きベクトルを算出し、これらの動きベクトルから画像の位置ズレを表現する動きパラメータを算出する方法を説明する。
図1は、本実施形態における画像処理装置の構成を示す。本実施形態における画像処理装置は、例えば、PC(パーソナルコンピュータ)などの情報処理装置、または撮像装置とすることができる。
図1(a)は、本実施形態におけるPCの内部構成を説明する図である。以下、図1(a)を参照して、PCの構成と各モジュールの動作について説明する。
バス101は、各構成要素を相互に通信可能に接続し、PC内でのデータの流れを司る。RAM(書込み可能メモリ)102は、CPU105のワークエリア等として機能する。グラフィックプロセッサ103は、ディスプレイ104に画像を表示する際に必要となる計算処理を行う。グラフィックプロセッサ103は、設定された行列に従って、回転などの画像の幾何変換を行うことができる。ディスプレイ104は、ユーザーI/F106から入力されたコマンドや、それに対するPCの応答出力等を表示する表示装置である。CPU105は、オペレーティングシステム(OS)やアプリケーションプログラム等のコンピュータプログラムに基づいて他の構成要素と協働し、PC全体の動作を制御する。また、行列演算など各種の数値演算も行う。本実施形態では、CPU105が一つであるとして説明するがこれに限定されず、複数のCPUが存在する構成をとってもよい。その場合の各処理は、マルチスレッド処理による並列動作も可能である。ユーザーI/F106は、ユーザーからの指示やコマンドの入力などを受け付け。ユーザーI/F106は、タッチパネル、ポインティングデバイス、キーボードなどであるが、特定のデバイスに限定されない。また、ユーザーI/F106が、タッチパネル、またはポインティングデバイスの場合は、ディスプレイ104上の任意の座標位置でタッチされたか否かの情報を入力することができる。
不揮発性の外部ストレージ107は、データをファイルとして記録する。本実施形態では、ハードディスクドライブ(以下、HDDと呼ぶ)により実現されるが、SSD(フラッシュメモリを使用したソリッドステートドライブ)等の他の記憶装置を用いてもよい。ネットワークI/F108は、外部装置とのデータのやり取りを中継する。外部撮像部109は、例えばレンズ、センサー、レンズ制御部などを含むカメラである。レンズ制御部がレンズのズーム、フォーカスを制御して、レンズから取り込んだ光をセンサーが受光し、光信号をRGB画像データに変換する。その後RGB画像データは外部撮像部109からバス101を介して転送され、RAM102に記憶されたり、外部ストレージ107に記録されたりする。
本実施形態では、実行されるプログラムおよびデータは、外部ストレージ107に記録されており、これらをRAM102へ入力し、CPU105が実行および処理する構成をとる。プログラムおよびデータは、バス101を介して入出力が行われる。画像データは、特に説明しない限り、外部ストレージ107から入力され、入力時に内部画像フォーマットに変換される。ただし、画像の入力は、外部撮像部109やネットワークI/F108から直接行うことも可能である。本実施形態における内部フォーマットは、RGB画像とするが、これに限定されずYUV画像、モノクロの輝度画像でもよい。また、後述の動き検出は輝度画像で行うものとし、内部フォーマットがRGB画像、または、YUV画像の場合には、自動的に輝度画像に変換されて動き検出がなされるものとして説明する。本実施形態では、画像サイズは1920×1088、30fpsの映像を扱うものとして説明するが、画像サイズやフレームレートに限定はない。
UI(ユーザインターフェース)画面や処理画像は、グラフィックプロセッサ103を介して、ディスプレイ104上に表示することができる。また、処理画像や処理データは、外部ストレージ107に記録したりRAM102に記憶したりして、他のプログラムと共有することができる。
なお、本実施形態では、電子防振処理を行う情報処理装置をPCにより実現する例を説明するが、これに限られない。本実施形態に係る電子防振処理は、カメラ装置、組込みシステム、タブレット端末、スマートフォン等の情報機器を用いて実施することができる。また、全体、または、部分的にハードウェアが実行する構成をとってもよい。例えば、図1(b)は、本実施形態におけるカメラ装置(すなわち、撮像装置)の構成を表している。撮像部110は、レンズ、センサー、レンズ制御部などを備える。レンズ制御部がレンズのズーム、フォーカスを制御して、レンズから取り込んだ光をセンサーが受光し、光信号をRGBの画像信号に変換してRAM102に記憶する。また、撮像部110はバス101を介して、絞りやズーム量などのレンズの制御状態をCPU105へ通知することができる。動き検出部111は、撮像部110から入力された画像に対して、動きベクトルの検出を行う。他のモジュールは、図1(a)に示したPCのモジュールと同様である。このように、本実施形態で説明する処理はカメラ装置でも実行可能である。以下、専用回路が存在しない場合はCPU105が演算を行い、専用回路が存在する場合にはそれぞれの回路が各演算を行うものとして説明する。
図2は、本実施形態における画像処理のフローチャートを示す。ここでは、画像の位置合わせを行うために、時間的に連続する画像から複数の動きベクトルを算出し、これらの動きベクトルから画像の位置ズレを表現する動きパラメータを算出する方法について説明する。以下、特に説明しない限り、ステップ番号順に、それぞれのステップが実行されるものとして説明する。また、互いに依存関係のない独立した処理については記載のステップ順に処理を実行する必要はなく、順序を入れ替えて実行したり、複数のCPUや専用処理回路が存在する場合には処理を並列に実行したりすることも可能である。同様に、ステップが存在するサブルーチンの位置も限定はなく、処理結果が同じであれば、異なるサブルーチンで処理を実行することができ、サブルーチンの構成にも限定はない。
フローチャートで示される一連の処理は、画像処理装置のCPU105が外部ストレージ107に格納されている制御プログラムをRAM102に展開して実行することにより行われる。あるいはまた、フローチャートにおけるステップの一部または全部の機能をASICや電子回路等のハードウェアで実現してもよい。すなわち、画像処理装置は、各ステップで表現される機能を実現する手段を有することができる。フローチャートの説明における記号「S」は、当該フローチャートにおける「ステップ」を意味する。その他のフローチャートについても同様である。
S2010では、画像処理装置は、複数の画像を順に取得して、動き検出を行う。具体的には、画像処理装置は、各画像の特徴点を検出し、特徴点の特徴量を画像間でマッチングし、その対応位置関係を動きベクトルとする。なお、動き検出のアルゴリズムはこれに限定されない。
S2020では、画像処理装置は、注目画像を走査して、注目画像の分割領域ごとに動きベクトルの集合を取得する。分割領域のことを、局所画像領域ともいう。
以下、注目画像の走査方法について図3を参照して詳細に説明する。図3は、本実施形態における画像の分割領域の例を示す。図3(a)は、画像の分割方法と分割領域番号を例示する。
本実施形態では、画像処理装置は、注目画像の分割された領域を、図3(a)に示した数値のようにラスター順にしたがって走査する。つまり、一回目のS2020が実行される場合には、番号1の分割領域が処理対象となり、以下、2回、3回と実行されるごとに分割領域番号2、3の分割領域が順に処理される。
図3(b)は、画像内の特徴点の動きベクトルを例示する。図3(b)のように、動きベクトルは分割領域をまたぐ場合があるため、本実施形態では、動きベクトルの終点が同じ分割領域内に含まれる動きベクトルを、当該分割領域の動きベクトルとして扱う。本実施形態では、図3のように画像を20分割するが、これに限定されない。また、本実施形態では、始点と終点が同じ分割領域に含まれる動きベクトルを当該分割領域の動きベクトルとして取得すると説明したが、始点だけを基準として、分割領域に含まれる動きベクトルを取得する構成をとってもよい。また、分割領域の走査順も、ラスター順に限定されない。
S2030では、画像処理装置は、取得した動きベクトルの集合を使って、対象分割領域の代表動きベクトルを決定する。以下、代表動きベクトルを単に代表ベクトルとも称する。本実施形態では、画像処理装置は、対象分割領域の代表ベクトルを算出するサブルーチンを実行する。このサブルーチンについては、図4を参照して後述する。
S2040では、画像処理装置は、取得した動きベクトルの集合から対象分割領域の代表ベクトルに類似する類似動きベクトルを抽出する。以下、類似動きベクトルを類似ベクトルとも称する。本実施形態では、第一の許容誤差を設定し、対象分割領域の代表ベクトルと取得した動きベクトルとのベクトル成分の差分の絶対値が第一の許容誤差以内の動きベクトルを類似ベクトルとして抽出する。
S2050では、画像処理装置は、注目画像の全分割領域の処理が終了したかどうか判定する。全ての分割領域の処理が終了している場合にはS2060に遷移し、終了していない場合はS2020に遷移し、以後、S2020からS2050のステップが繰り返される。
S2060では、画像処理装置は、全分割領域から抽出した動きベクトルを用いて、画像全体の動きパラメータ(すなわち、動き情報)を推定する。本実施形態では、動きパラメータとして回転行列を、RANSACを用いて推定する。なお、行列の算出方法には様々な方法があり、回転行列の算出は、非特許文献1に記載されている方法で算出できるため、詳細な説明は省略する。なお、動きパラメータは回転行列だけではなく、並進、あおりまたそれらの組み合わせなどの様々な動きを表すものとすることができる。
以下、図4を参照して、上述した対象分割領域の代表ベクトルを選出するサブルーチン(S2030)の動作について説明する。図4は、本実施形態における対象分割領域の代表ベクトルの決定方法を示すフローチャートである。本実施形態では、代表ベクトルは、分割領域内で類似ベクトルとの差分が第二の許容誤差以内となる数が最も多いベクトルである。なお、第一の許容誤差と第二の許容誤差は同じ値であってもよい。
S4010では、画像処理装置は、分割領域内のそれぞれの動きベクトルの特徴を算出する。本実施形態では、動きベクトルの始点を座標平面の原点に合わせた場合に、当該動きベクトルの終点が位置する座標平面上の領域を当該動きベクトルの特徴とする。本実施形態における動きベクトルの特徴については、図5を参照して後述する。
S4020では、画像処理装置は、対象分割領域に含まれる全ての動きベクトルから、一つの動きベクトルを取得する。これを候補ベクトルと呼ぶ。
S4030では、画像処理装置は、対象分割領域に含まれる全ての動きベクトルから、候補ベクトルとは異なる一つの動きベクトルを取得する。これを比較ベクトルと呼ぶ。
S4040では、画像処理装置は、候補ベクトルと比較ベクトルが同じ特徴を持つかどうか判定する。ここでいう特徴とは、S4010で算出した特徴である。ここでは、候補ベクトルと比較する比較ベクトルが選択される。判定が真の場合はS4050へと遷移する。一方、偽の場合にはS4080に遷移する。本実施形態での判定手法の詳細は図5を参照して後述する。
S4050では、画像処理装置は、候補ベクトルと比較ベクトルの差を算出する。本実施形態では、候補ベクトルと比較ベクトルの差分ベクトルの大きさを、候補ベクトルと比較ベクトルの差とする。
S4060では、画像処理装置は、S4050で算出した差が第二の許容誤差以内であるかどうか判定する。すなわち、第二の許容誤差を、所定の閾値として利用する。第二の許容誤差以内であった場合、S4070で画像処理装置は、当該比較ベクトルをインライアとしてカウントする。S4080では、画像処理装置は、候補ベクトルを対象分割領域に含まれる全ての動きベクトルと比較したかどうか判定する。比較が終了した場合は、S4090に遷移する。一方、比較が終了していない場合はS4030に遷移して比較処理を繰り返す。本実施形態では、対象分割領域に含まれる全ての動きベクトルと比較しているが、比較数に上限を設けてもよい。
S4090では、画像処理装置は、S4070でカウントしたインライアの数が、現在までの候補ベクトルの中で最大であるかどうか判定する。最大である場合はS4100へ遷移し、候補ベクトルを暫定代表ベクトルとして保存する。なお、一回目のS4090の実行では、必ず、S4100へ遷移する。
S4110では、画像処理装置は、イテレーション数が十分か否か判定する。イテレーション数が十分と判定される場合にはS4120に遷移する。一方、十分でないと判定される場合には、S4020へ遷移する。イテレーション数は非特許文献2のように、パラメータから算出してもよいし、固定の値でもよい。
S4120では、画像処理相違は、暫定代表ベクトルを対象分割領域の代表ベクトルとし、サブルーチンを終了する。
以下、図5を参照して、本実施形態における動きベクトルの特徴について説明する。本実施形態では、動きベクトルの始点を座標平面の原点に合わせた場合に終点が位置する座標平面上の領域を動きベクトルの特徴とする。この領域は、座標平面の象限の主軸を中心に一定量だけ平行移動した境界で分割されるものとする。一定量は、例えば、第二の許容誤差の半分とする。
図5(a)は、本実施形態において特徴として用いる座標平面上の領域を例示する図である。また、図5(b)は分割領域内のそれぞれの動きベクトルの始点を座標平面の原点に合わせたものである。
本実施形態では、図5(a)のように座標平面上の領域にコードが割り振られる。
第二の許容誤差の半分をehとすると、
x≧−ehかつy≧−ehとなる領域には0b0001(重複領域0b0011、0b1111、0b1001を含み、図5(b)の領域502に対応する。)が、
x≦ehかつy≧−ehとなる領域には0b0010(重複領域0b0011、0b1111、0b0110を含む)が、
x≦ehかつy≦ehとなる領域には0b0100(重複領域0b0110、0b1111、0b1100を含む)が、
x≧−ehかつy≦ehとなる領域には0b1000(重複領域0b1100、0b1111、0b1001を含む)が、割り振られる。
x≧−ehかつy≧−ehとなる領域には0b0001(重複領域0b0011、0b1111、0b1001を含み、図5(b)の領域502に対応する。)が、
x≦ehかつy≧−ehとなる領域には0b0010(重複領域0b0011、0b1111、0b0110を含む)が、
x≦ehかつy≦ehとなる領域には0b0100(重複領域0b0110、0b1111、0b1100を含む)が、
x≧−ehかつy≦ehとなる領域には0b1000(重複領域0b1100、0b1111、0b1001を含む)が、割り振られる。
また、上記定義の複数に属する領域は、該当するコードの論理和が割り振られる。図5(a)では、上記定義の複数に属する領域にはそれぞれ、0b0011、0b1001、0b1111、0b1100、0b0110が割り振られている。なお、0bは2進数を表す。
このように、S4010では、動きベクトルの始点を座標平面の原点に合わせた場合の終点が位置する領域に割り振られたコードが特徴として算出される。例えば、図5(b)のベクトル501の特徴は、0b0001である。
また、S4040において、本実施形態では、候補ベクトルと比較ベクトルの論理積が0b0000でなければ、同じ特徴を持つと判定される。例えば、図5(b)の候補ベクトルがベクトル501である場合、領域502に終点を持つベクトルは同じ特徴を持つといえる。ベクトル501の終点が属する領域502には、コード0b0001、0b0011、0b1111、0b1001が割り振られており、終点が同じ領域502に属するベクトルとの論理積は0b0000とならない。したがって、そのようなベクトルは同じ特徴を持つと判定される。
本実施形態により、候補ベクトルに対して明らかにアウトライアとなる比較ベクトルに対する演算を省略することができる。分割領域内の動きベクトルが多いほどイテレーション回数は増えるが、動きベクトルが多いほどインライアと異なる象限に属するアウトライアの数も多いと考えられるため、本実施形態によると処理時間を短縮することができる。
また、単純に象限の主軸によって分割された領域を特徴とした場合、象限の主軸付近に終点が位置するベクトルを候補ベクトルとして考えると、異なる特徴を持つが第二の許容誤差以内となる比較ベクトルが存在することになる。例えば、図5(b)のベクトル503とベクトル504は第二の許容誤差以内であるが、ベクトル503は第2象限に位置し、ベクトル504は第1象限に位置するため、異なる特徴を持つことになる。この場合、本来ならインライアとみなしたいベクトルをアウトライアとみなしてしまうので、想定する結果が得られないことになる。しかし、本実施形態では、第二の許容誤差を考慮した領域を特徴としているため、インライアをアウトライアとみなすことなく想定した結果を得ることができ、かつ、演算の省略をすることができる。
本実施形態では、象限の主軸を中心に第二の許容誤差の半分だけ平行移動した境界で分割された領域を用いたが、任意の境界で領域を分割してもよい。例えば、図5(c)に示すように、y=x、y=−xのように象限の主軸を45度回転させた直線を中心に第二の許容誤差の半分だけ平行移動した境界で分割された領域であってもよい。また、図5(d)に示すように、象限の主軸を中心に第二の許容誤差の半分だけ平行移動した境界と、象限の主軸を45度回転させた直線を中心に第二の許容誤差の半分だけ平行移動した境界とで分割された領域であってもよい。この場合、分割される領域数が増えるので図5(d)に示すようにベクトルの特徴は8ビットで示される。図5(d)における0xは16進数を意味している。
以上説明したように、本実施形態によると、分割領域内の動きベクトルの特徴を算出し、当該特徴に基づいて選択された動きベクトルを用いることで、イテレーション回数を削減することができる。本実施形態では、動きベクトルの始点を座標平面の原点に合わせた場合の終点が位置する領域に応じて、正しいデータであるインライアを選択し、アウトライアに関する計算をスキップする。したがって、画像の動き情報の算出に係る処理速度を向上させることができる。
(第2の実施形態)
第1の実施形態では、分割領域の代表ベクトルを算出するサブルーチン(S2030)を、図4を参照して説明した。本実施形態では、図6を参照して、分割領域の代表ベクトルを算出する異なるサブルーチンを説明する。本実施形態では、分割領域内のそれぞれの動きベクトルが他のベクトルと一致するかどうかを動きベクトルの特徴とする。なお、他の処理は、第1の実施形態に準ずる。フローチャート中で第1の実施形態と同じ番号で示すステップは、第1の実施形態と同じ動作をするため説明を省略する。
第1の実施形態では、分割領域の代表ベクトルを算出するサブルーチン(S2030)を、図4を参照して説明した。本実施形態では、図6を参照して、分割領域の代表ベクトルを算出する異なるサブルーチンを説明する。本実施形態では、分割領域内のそれぞれの動きベクトルが他のベクトルと一致するかどうかを動きベクトルの特徴とする。なお、他の処理は、第1の実施形態に準ずる。フローチャート中で第1の実施形態と同じ番号で示すステップは、第1の実施形態と同じ動作をするため説明を省略する。
S6010では、画像処理装置は、分割領域内のそれぞれの動きベクトルのうち一致するものをマージする。このとき、一致したベクトル数分の重みをつける。なお、マージ前のそれぞれの動きベクトルの重みは1とする。
S6010の処理について、図7を用いて具体的に説明する。図7は分割領域内のそれぞれの動きベクトルの始点を座標平面の原点に合わせたものである。図7(a)はS6010の処理を行う前の状態を示し、図7(a)はS6010の処理を行った後の状態を示す。例えば、図7(a)において、ベクトル701はベクトル706と一致しているためマージが行われる。図7(b)において、マージ後のベクトルをベクトル701´とすると、ベクトル701´の重みは2となる。同様に、ベクトル703はベクトル707およびベクトル708と一致するため、重みが3のベクトル703´としてマージされる。
S6020では、S4070と同様に、差分ベクトルの大きさが第二の許容誤差以内にある比較ベクトルをインライアとしてカウントするが、本実施形態ではS6010で求めた重みの分だけカウントをする。
以上説明したように、本実施形態では、分割領域内で一致する動きベクトルがマージされるため、イテレーション回数を削減することができる。一般的に、カメラワークや振動により発生する動きベクトルは一定の方向であるため、分割領域内の動きベクトルをマージすることによる計算量の削減効果が期待できる。
(第3の実施形態)
本実施形態では、第1の実施形態における動きベクトルの特徴算出処理(S4010)を、分割領域内のそれぞれの動きベクトルの大きさに基づいて行う。以下、図8を参照して、動きベクトルの大きさに基づく特徴算出処理に関して説明する。なお、他の処理は、第1の実施形態に準ずる。
本実施形態では、第1の実施形態における動きベクトルの特徴算出処理(S4010)を、分割領域内のそれぞれの動きベクトルの大きさに基づいて行う。以下、図8を参照して、動きベクトルの大きさに基づく特徴算出処理に関して説明する。なお、他の処理は、第1の実施形態に準ずる。
図8(a)は、分割領域内の動きベクトルの大きさをそれぞれ示したものである。本実施形態では、動きベクトルの大きさとして動きベクトルの長さを採用している。この値を用いて、S4040において候補ベクトルと比較ベクトルが同じ特徴を持つかどうか判定する。本実施形態では、同じ特徴かどうかを判定する閾値を2とする。即ち、比較ベクトルの長さが候補ベクトルの長さの±2以下であれば同じ特徴を持つと判断する。
図8(b)は、動きベクトル803が候補ベクトルとなった場合を表している。候補ベクトル803は、太い矢印で示されている。図4のS4040では、候補ベクトルと比較ベクトルが同じ特徴を持つかどうかを判定するが、図8(b)の場合では、動きベクトル803との差が±2以下である動きベクトル802、804、809が同じ特徴を持つと判定される。したがって、動きベクトル802、804、809が、S4050で比較ベクトルとして採用される。
また、動きベクトル803との差が±2より大きい動きベクトル801、805、806、807、808は、同じ特徴を持たないと判定され、当該動きベクトルに関する計算がスキップされる。
図8(c)は、動きベクトル808が候補ベクトルとなった場合を示している。図8(b)と同様に、S4040において動きベクトル808との差が±2以下である動きベクトル801、805、807が同じ特徴を持つと判定され、S4050以降の処理が行われる。動きベクトル808との差が±2より大きい動きベクトル802、803、804、806、809は同じ特徴を持たないと判定され、当該動きベクトルに関する計算がスキップされる。
以上説明したように、本実施形態により、動きベクトルの大きさに基づいて処理対象の動きベクトルを減らすことができるため、イテレーション回数を削減することができる。一般的に、カメラワークや振動により発生する動きベクトルは一定の大きさを持つため、分割領域内の動きベクトルを大きさによって特徴別に処理することにより、計算量の削減効果が期待できる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101 バス
102 RAM
103 グラフィックプロセッサ
104 ディスプレイ
105 CPU
106 ユーザーI/F
107 外部ストレージ
108 ネットワークI/F
109 外部撮像部
110 撮像部
111 動き検出部
102 RAM
103 グラフィックプロセッサ
104 ディスプレイ
105 CPU
106 ユーザーI/F
107 外部ストレージ
108 ネットワークI/F
109 外部撮像部
110 撮像部
111 動き検出部
Claims (10)
- 複数の画像のそれぞれにおける局所画像領域の主たる動きを示す代表動きベクトルを決定する決定手段と、
前記局所画像領域から、前記代表動きベクトルに類似する類似動きベクトルを抽出する抽出手段と、
前記抽出した類似動きベクトルを用いて、画像全体の動き情報を推定する推定手段と
を有し、
前記決定手段は、前記局所画像領域の複数の動きベクトルの特徴を算出し、前記特徴に基づいて選択された動きベクトルから前記代表動きベクトルを決定することを特徴とする画像処理装置。 - 前記決定手段は、前記特徴に基づいて選択された動きベクトルの差分を比較し、前記差分が所定の閾値より小さい動きベクトルの数に応じて、前記代表動きベクトルを決定することを特徴とする請求項1記載の画像処理装置。
- 前記動きベクトルの特徴は、前記動きベクトルの始点を座標平面の原点に合わせた場合に終点が位置する前記座標平面上の領域であることを特徴とする請求項1または2記載の画像処理装置。
- 前記座標平面上の領域は、象限の主軸を一定量だけ平行移動した複数の境界によって分割されることを特徴とする請求項3記載の画像処理装置。
- 前記一定量は、許容誤差に対応した量であることを特徴とする請求項4記載の画像処理装置。
- 前記座標平面上の領域は、1または複数の任意の境界によって分割されることを特徴とする請求項3記載の画像処理装置。
- 前記動きベクトルの特徴は、前記動きベクトルの大きさであることを特徴とする請求項1または2記載の画像処理装置。
- 前記動きベクトルの特徴は、前記局所画像領域のそれぞれの動きベクトルが互いに一致するかどうかであり、一致した動きベクトルには、一致した動きベクトル数分の重みをつけることを特徴とする請求項1または2記載の画像処理装置。
- コンピュータを請求項1乃至8のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
- 複数の画像のそれぞれにおける局所画像領域の主たる動きを示す代表動きベクトルを決定する決定ステップと、
前記局所画像領域から、前記代表動きベクトルに類似する類似動きベクトルを抽出する抽出ステップと、
前記抽出した類似動きベクトルを用いて、画像全体の動き情報を推定する推定ステップと
を含み、
前記決定ステップは、前記局所画像領域の複数の動きベクトルの特徴を算出し、前記特徴に基づいて選択された動きベクトルから前記代表動きベクトルを決定するステップを含むことを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019212286A JP2021086183A (ja) | 2019-11-25 | 2019-11-25 | 画像処理装置、画像処理方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019212286A JP2021086183A (ja) | 2019-11-25 | 2019-11-25 | 画像処理装置、画像処理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021086183A true JP2021086183A (ja) | 2021-06-03 |
Family
ID=76087676
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019212286A Pending JP2021086183A (ja) | 2019-11-25 | 2019-11-25 | 画像処理装置、画像処理方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021086183A (ja) |
-
2019
- 2019-11-25 JP JP2019212286A patent/JP2021086183A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7227145B2 (ja) | マッチムーブ用のハイブリッド追跡器のシステム及び方法 | |
US10769496B2 (en) | Logo detection | |
JP6737776B2 (ja) | センサ素子アレイにおける特徴計算 | |
CN110852254B (zh) | 人脸关键点跟踪方法、介质、装置和计算设备 | |
EP2591460A1 (en) | Method, apparatus and computer program product for providing object tracking using template switching and feature adaptation | |
US9195872B2 (en) | Object tracking method and apparatus | |
CN110297545B (zh) | 手势控制方法、手势控制装置和系统、以及存储介质 | |
CN110956131B (zh) | 单目标追踪方法、装置及系统 | |
TWI547887B (zh) | 用以利用積分梯度投影作臉部追蹤之方法、裝置與電腦程式 | |
JP2017130042A (ja) | 映像処理装置、映像処理方法、及びプログラム | |
CN109871249B (zh) | 一种远程桌面操作方法、装置、可读存储介质及终端设备 | |
JP5441151B2 (ja) | 顔画像追跡装置及び顔画像追跡方法並びにプログラム | |
JP7003617B2 (ja) | 推定装置、推定方法、及び推定プログラム | |
JP6235860B2 (ja) | 情報処理装置及びその制御方法、プログラム | |
JP2021086183A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
KR101943097B1 (ko) | 가상 특징점을 이용한 이미지 정합 방법 및 그 시스템 | |
KR20200064221A (ko) | 가중치 특징점을 이용한 이미지 정합 방법 및 그 시스템 | |
US20140231523A1 (en) | Electronic device capable of recognizing object | |
JP2022076346A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
WO2021179905A1 (en) | Motion blur robust image feature descriptor | |
WO2021164615A1 (en) | Motion blur robust image feature matching | |
US11202000B2 (en) | Learning apparatus, image generation apparatus, learning method, image generation method, and program | |
JP6273686B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
JP2022185872A (ja) | 画像処理装置、画像処理方法、撮像装置 | |
JP2017120455A (ja) | 情報処理装置、プログラム及び制御方法 |