JP7125562B2

JP7125562B2 - 目標追跡方法、コンピュータプログラム、及び電子機器

Info

Publication number: JP7125562B2
Application number: JP2021536748A
Authority: JP
Inventors: スン，チョォン; スン，ユィシュアン; ルゥ，フゥチョアン; シェン，シアオヨン; タイ，ユィウィン; ジィア，ジィアヤ
Original assignee: テンセント・テクノロジー・（シェンジェン）・カンパニー・リミテッド
Priority date: 2019-05-10
Filing date: 2020-04-26
Publication date: 2022-08-24
Anticipated expiration: 2040-04-26
Also published as: WO2020228522A1; CN110148157A; JP2022516055A; US20210327076A1; US11610321B2; CN110148157B; EP3968280A4; EP3968280A1

Description

［関連出願］
本願は、２０１９年０５月１０日に提出された、出願番号が２０１９１０３９１４９７．７であり、発明の名称が「画面における目標の追跡方法、装置、記憶媒体及び電子機器」である中国特許出願の優先権を主張し、その全ての内容を引用により本願に組み込む。

［技術分野］
本願は、画像データ処理の分野に関し、特に目標追跡方法、装置、記憶媒体及び電子機器に関する。

目標追跡は、ビデオの連続したフレームにおいて、手動で指定された目標対象に対して位置決め操作を行うものである。ここ数十年、目標追跡は、自動運転、マンマシンインタラクション及び行動認識の分野で幅広く応用されているが、トレーニングデータが限られているため、目標追跡は、依然として非常に困難な作業である。

相関フィルタに基づく目標追跡アルゴリズムは、現在の目標追跡方法の一つである。巡回畳み込みによるサンプルの高速取得は、相関フィルタ（ＣｏｒｒｅｌａｔｉｏｎＦｉｌｔｅｒｓ）の特徴である。２０１５年、Ｄａｎｅｌｌｊａｎらは、フィルタに正則化項を加えてエッジ情報を抑制し、目標の中心エリアを学習するようにフィルタを促し、境界効果を効果的に解決することを提案した。２０１７年、ＢＡＣＦ（ＬｅａｒｎｉｎｇＢａｃｋｇｒｏｕｎｄ－ＡｗａｒｅＣｏｒｒｅｌａｔｉｏｎＦｉｌｔｅｒｓｆｏｒＶｉｓｕａｌＴｒａｃｋｉｎｇ）アルゴリズムは、境界効果を解決するためのもう一つの実行可能な方法を提供し、実際のトレーニングサンプルを生成し、学習フィルタの認識能力を大幅に向上させた。

しかしながら、関連技術において相関フィルタに基づく目標追跡アルゴリズムにおける複雑な公式には、多数のパラメータを導入する必要があり、限られたサンプル数では、マッチング操作を実行できず、パラメータの過剰適合が発生する可能性がある。通常のプーリング操作によりパラメータ削減操作を実行する場合、サンプル数も同様に削減され、依然としてパラメータとサンプル数の不均衡という技術課題を効果的に解決することができない。

本願は、パラメータの過剰適合が発生しないだけでなく、対応する相関フィルタモデルのロバスト性を高めることができる目標追跡方法及び目標追跡装置を提供することにより、目標追跡の精度及び有効性を向上させる。

本願の実施例は、
目標ビデオの複数の連続した画面フレームを取得し、前記複数の連続した画面フレームのうちのｎ番目の画面フレームに対応するｎ番目の追跡目標エリアを設定するステップであって、ｎは正の整数である、ステップと、
前記ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、前記ｎ番目の追跡目標エリアに対応する、ｎ番目のエリア入力特徴図（特徴マップ、Feature mapとも呼ぶ）を取得するステップであって、前記ｎ番目のエリア入力特徴図は複数の特徴チャネルを含むものであるステップと、
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応する、ｎ番目の重みフィルタを計算するステップであって、前記ｎ番目の重みフィルタは、前記ｎ番目のエリア入力特徴図における各特徴チャネルに対応するフィルタ重みを含むものであるステップと、
前記ｎ番目の重みフィルタ、及び前記複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図であるｎ＋１番目の画面フレーム入力特徴図を用いてｎ＋１番目の出力応答を計算し、前記ｎ＋１番目の出力応答に従って前記ｎ＋１番目の画面フレームに対応するｎ＋１番目の追跡目標エリアを特定するステップと、
全ての連続した画面フレームの追跡目標エリアを取得するまで、前記ｎ＋１番目の追跡目標エリアに対して特徴抽出を行い、前記ｎ＋１番目の追跡目標エリアに対応するｎ＋１番目のエリア入力特徴図を取得し、前記ｎ＋１番目のエリア入力特徴図に対応するｎ＋１番目の重みフィルタを計算するステップと、を含む目標追跡方法を提供する。

本願の実施例は、さらに、
目標ビデオの複数の連続した画面フレームを取得し、前記複数の連続した画面フレームのうちのｎ番目の画面フレームに対応するｎ番目の追跡目標エリアを設定するための追跡目標エリア設定モジュールであって、ｎは正の整数である、追跡目標エリア設定モジュールと、
前記ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、前記ｎ番目の追跡目標エリアに対応する、ｎ番目のエリア入力特徴図を取得するための特徴抽出モジュールであって、前記ｎ番目のエリア入力特徴図は複数の特徴チャネルを含むものである特徴抽出モジュールと、
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応する、ｎ番目の重みフィルタを計算するための重みフィルタ計算モジュールであって、前記ｎ番目の重みフィルタは、前記ｎ番目のエリア入力特徴図における各特徴チャネルに対応するフィルタ重みを含むものである重みフィルタ計算モジュールと、
前記ｎ番目の重みフィルタ、及び前記複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図であるｎ＋１番目の画面フレーム入力特徴図を利用し、ｎ＋１番目の出力応答を計算し、前記ｎ＋１番目の出力応答に従って前記ｎ＋１番目の画面フレームに対応するｎ＋１番目の追跡目標エリアを特定するための追跡目標エリア特定モジュールと、
特徴抽出操作をカウントするためのカウントモジュールと、を含む目標追跡装置を提供する。

本願に記載の目標追跡装置では、相関フィルタモデル作成ユニットは、
前記ｎ番目の重みフィルタに対して二値化マスクを設定することによって、前記ｎ番目の追跡目標エリア以外に対応する重みフィルタのフィルタ重みを小さくするための二値化マスク設定サブユニットを含む。

本願に記載の目標追跡装置では、相関フィルタモデル作成ユニットは、
前記ｎ番目の重みフィルタに対して正則化重みを設定することによって、前記ｎ番目の重みフィルタの前記ｎ番目の追跡目標エリアの中心部分におけるフィルタ重みを大きくするための正則化重み設定サブユニットを含む。

本願の実施例は、プロセッサ実行可能な指令が記憶されており、前記指令を、１つ又は複数のプロセッサによりローディングすることで上記の目標追跡方法を実行する記憶媒体をさらに提供する。

本願の実施例は、プロセッサ及びメモリを備え、前記メモリにコンピュータプログラムが記憶されており、前記プロセッサが前記コンピュータプログラムを呼び出すことで上記の目標追跡方法を実行する電子機器をさらに提供する。

関連技術に比べて、本願の目標追跡方法、装置、記憶媒体及び電子機器は、入力特徴図の異なる特徴チャネルに対応するフィルタ重みに対して平均プーリング操作を行うことにより、アルゴリズムパラメータを削減する。また、追跡目標エリアを減らす必要がないため、入力特徴図のトレーニングサンプルの特徴の数を確保し、パラメータの過剰適合の発生を回避し、目標追跡の精度及び有効性を向上させた。さらに、目標追跡方法及び目標追跡装置においてパラメータの過剰適合や追跡精度の低下を引き起こしやすいという技術課題を効果的に解決した。

本願に係る目標追跡方法の一実施例のフローチャートである。本願に係る目標追跡方法の一実施例のステップＳ１０３のフローチャートである。制約条件を有する相関フィルタモデルによる画面フレームの追跡目標エリアの処理プロセスの模式図である。本願に係る目標追跡方法の一実施例の画面フレームの特徴変化の模式図である。本願に係る目標追跡装置の一実施例の構造模式図である。本願に係る目標追跡装置の一実施例の重みフィルタ計算モジュールの構造模式図である。本願に係る目標追跡装置の一実施例の重みフィルタ計算モジュールの相関フィルタモデル作成ユニットの構造模式図である。本願に係る目標追跡方法及び目標追跡装置の目標追跡模式図である。本願に係る目標追跡方法及び目標追跡装置の目標追跡フローチャートである。本願に係る目標追跡装置の位置する電子機器の作業環境の構造模式図である。

図面を参照しながら説明する。図面では、同じ符号で同じ構成要素を表す。本願の原理は、適切な演算環境での実行を例として説明される。以下の説明は、例示された本願の任意の実施例に基づくものであり、本願の明細書で詳細に説明されていない他の任意の実施例を限定するものとして解釈されるべきではない。

以下の説明では、本願の任意の実施例は、特に明記しない限り、１つまたは複数のコンピュータによって実行される作業のステップ及び符号を参照して説明される。したがって、これらのステップ及び操作は、コンピュータによって実行されると何回も表現するが、構造化された形式でデータの電子信号を表すコンピュータ処理ユニットによって処理されることを含むと理解できる。このような処理は、当該データを変換するか、または、当該コンピュータのメモリシステム内の位置にテータを維持することにより、当該コンピュータの動作を再構成するか、または、本分野の技術者が熟知した方法で当該コンピュータの動作を変更することができる。当該データによって維持されたデータ構造は、当該メモリの実体位置であり、当該データのフォーマットによって定義された特定の特性を有する。しかし、本願の原理を、上記の内容で説明するが、限定する意図はない。本分野の技術者は、下記の様々なステップ及び操作がハードウェアでも実施できることを理解できる。

本願の目標追跡方法及び目標追跡装置は、任意の電子機器に配置可能であり、ビデオ画面における所定又は特定のオブジェクトに対する追跡操作を行うためのものである。当該電子機器は、ウェアラブルデバイス、ヘッドマウントデバイス、医療および健康プラットフォーム、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイス又はラップトップデバイス、モバイルデバイス（例えば、携帯電話、パーソナルデジタルアシスタント（ＰＤＡ）、メディアプレイヤーなど）、マルチプロセッサシステム、消費者向け電子機器、小型コンピュータ、大型コンピュータ、上記の任意のシステム又はデバイスを備える分散コンピューティング環境などを含むが、これらに限定されない。当該電子機器は、画面処理端末又は画面処理サーバであってもよい。ユーザは、当該電子機器を介してビデオの連続した画面フレームにおける所定又は特定のオブジェクトを正確に特定し、ビデオにおける所定又は特定のオブジェクトに対する高精度の有効的な追跡を実行することができる。

図１を参照されたい。図１は、本願に係る目標追跡方法の一実施例のフローチャートである。本実施例の目標追跡方法は、上記の電子機器により実施できる。本実施例の目標追跡方法は、以下のステップを含む。

ステップＳ１０１：目標ビデオの複数の連続した画面フレームを取得し、複数の連続した画面フレームのうちのｎ番目の画面フレームの追跡目標エリアを設定する。ただし、ｎは、正の整数である。

当該追跡目標エリアは、ｎ番目の画面フレームに対応する追跡目標エリアであるため、当該追跡目標エリアは、ｎ番目の追跡目標エリアとすることができる。

ステップＳ１０２：ｎ番目の画面フレームの追跡目標エリアに対して特徴抽出操作を行い、複数の特徴チャネルを含む追跡目標エリアの入力特徴図を取得する。

当該追跡目標エリアは、ｎ番目の追跡目標エリアであり、当該入力特徴図は当該ｎ番目の追跡目標エリアに対応する入力特徴図であり、当該入力特徴図は、追跡目標エリアの特徴を示すため、当該入力特徴図は、ｎ番目のエリア入力特徴図とすることができる。

ステップＳ１０３：相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの入力特徴図に対応し、入力特徴図における各特徴チャネルに対応するフィルタ重みを含む重みフィルタを計算する。

当該入力特徴図は、ｎ番目のエリア入力特徴図であり、当該重みフィルタは、当該ｎ番目のエリア入力特徴図に対応する重みフィルタであるため、当該重みフィルタは、ｎ番目の重みフィルタとすることができる。

ステップＳ１０４：重みフィルタ及び複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図を用いてｎ＋１番目の画面フレームの出力応答を計算し、ｎ＋１番目の画面フレームの出力応答に従って、ｎ＋１番目の画面フレームの追跡目標エリアを特定する。

当該入力特徴図は、ｎ＋１番目の画面フレームに対応する入力特徴図であり、当該入力特徴図は、画面フレームの特徴を示すため、当該入力特徴図は、ｎ＋１番目の画面フレーム入力特徴図とすることができる。当該出力応答は、ｎ＋１番目の画面フレームに対応する出力応答であるため、当該出力応答は、ｎ＋１番目の出力応答とすることができる。

ステップＳ１０５：ｎ＋１番目の画面フレームの追跡目標エリアに対して特徴抽出を行い、ｎ＋１番目の画面フレームの追跡目標エリアの入力特徴図を取得し、全ての連続した画面フレームの追跡目標エリアを取得するまでｎ＋１番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタを計算する。

当該追跡目標エリアは、ｎ＋１番目の画面フレームに対応する追跡目標エリアであるため、当該追跡目標エリアは、ｎ＋１番目の追跡目標エリアとすることができる。当該入力特徴図は、ｎ＋１番目の追跡目標エリアに対応する入力特徴図であり、当該入力特徴図は、追跡目標エリアの特徴を示すため、当該入力特徴図は、ｎ＋１番目のエリア入力特徴図とすることができる。当該重みフィルタは、ｎ＋１番目のエリア入力特徴図に対応する重みフィルタであるため、当該重みフィルタは、ｎ＋１番目の重みフィルタとすることができる。

以下では、複数の連続した画面フレームのうちの１番目の画面フレームから処理を行う場合を例として、本実施例の目標追跡方法の各ステップの流れを詳しく説明する。

ステップＳ１０１では、電子機器（例えば、画面処理サーバ）は、目標ビデオの複数の連続した画面フレームを取得する。目標ビデオにおける特定又は所定のオブジェクトに対する追跡操作を容易に行うために、ここでは、複数の連続した画面フレームのうちの１番目の画面フレームに対応する１番目の追跡目標エリアを設定する。当該１番目の追跡目標エリアは、複数の連続した画面フレームのうちの１番目の画面フレームの追跡目標エリアである。

ここで言う１番目の追跡目標エリアとは、特定又は所定のオブジェクトの画面フレームにおける画面エリアであり、ここで言う特定又は所定のオブジェクトとは、予め設定された人、動物、乗り物又は任意の移動オブジェクトであってもよい。これによって、１番目の画面フレームにおける追跡目標エリアの特徴に従って、後続の他の画面フレーム内で対応する追跡目標エリアを見つけることができる。

ステップＳ１０２では、電子機器は、ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、ｎ番目の追跡目標エリアに対応するｎ番目のエリア入力特徴図を取得する。たたし、ｎ＝１である。当該ｎ番目の追跡目標エリアは、ｎ番目の画面フレームの追跡目標エリアであり、ｎ番目のエリア入力特徴図は、ｎ番目の画面フレームの追跡目標エリアの入力特徴図である。

任意には、ここでは、ｎ番目の追跡目標エリアをａ＊ａサイズのグリッドエリアに分割し、その後、ｄ種類の異なるサイズの畳み込みカーネルによって、上記のａ＊ａサイズのグリッドエリアに対して畳み込み及びサンプリング操作を行うことで、ｄ個の特徴チャネルを有するｎ番目のエリア入力特徴図を取得することができる。畳み込みカーネルのサイズは、グリッドエリアのサイズよりも小さい。

ステップＳ１０３では、電子機器は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、１番目のエリア入力特徴図に対応し、入力特徴図における各特徴チャネルに対応するフィルタ重みを含む１番目の重みフィルタを計算する。当該１番目の重みフィルタは、１番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。

図２を参照されたい。図２は、本願に係る目標追跡方法の上記の実施例のステップＳ１０３のフローチャートである。当該ステップＳ１０３は、以下のステップを含む。

ステップＳ２０１：電子機器は、リッジ回帰判別関数に基づいて、１番目のエリア入力特徴図に対応する１番目の重みフィルタの相関フィルタモデルを作成し、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件とする。

任意には、電子機器は、リッジ回帰判別関数に基づいて、１番目のエリア入力特徴図に対応する１番目の重みフィルタの相関フィルタモデルを以下のように作成する。

ただし、ｙは追跡目標エリアの予期出力応答であり、ｘ_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図であり、ω_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応するフィルタ重みであり、Ｄは特徴チャネルの数であり、ｐ_ｄは追跡目標エリアの特徴チャネルｄに対応する重みフィルタの二値化マスクであり、ｇ_ｄは追跡目標エリアの特徴チャネルｄに対応する重みフィルタの正則化重みである。

出力応答は、対応する重みフィルタの作用での画面フレームにおける追跡目標エリアと背景エリアのディープネットワークによって抽出された畳み込み特徴の目標応答であり、予期出力応答は、画面フレームの追跡目標エリアと背景エリアを区別できる予め設定した出力応答であり、当該予期出力応答は、ガウス分布を満たすべきであり、即ち、追跡目標エリアに近いほど、そのエリア特徴に対応する目標応答が大きくなる。

二値化マスクは、追跡目標エリア以外に対応する重みフィルタのフィルタ重みを効果的に小さくし、後続の背景エリアの追跡目標エリアの判定への影響を減らすことができる。入力特徴図に対応するエリアが追跡目標エリア以外の背景エリアであると判断される場合、二値化マスクにより相関重みフィルタのフィルタ重みを小さくする。ユーザは、自分のニーズに応じて上記の二値化マスクを使用するか否かを選択することできる。

正則化重みは、追跡目標エリアに対応する重みフィルタの追跡目標エリアの中心部分におけるフィルタ重みを効果的に大きくすることができ、即ち、追跡目標エリアの中心部分のフィルタ重みを直接増加させることができる。追跡目標エリアの中心部分の画面特徴は最も重要であるため、追跡目標エリアの中心部分のフィルタ重みを増加させることで、追跡目標エリアの認識の精度をさらに高めることができる。ユーザは、自分のニーズに応じて、上記の正則化重みを使用するか否かを選択することができる。

続いて、電子機器は、プーリングエリアにおける同じ特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件として設定する。

ただし、Ｐは、対応するプーリングエリアであり、Ｋは、重みが等しい等式の制約の数であり、プーリングエリアにおける入力特徴図の特徴の数がｋである場合、Ｋ＝Ｃ_ｋ ^２であり、ｉ、ｊはプーリングエリアにおける入力特徴図に対応する位置である。

ここでのプーリングエリアは、追跡目標エリアにおける範囲のサイズの設定（例えば、２＊２又は３＊３のピクセルサイズの設定）であり、また、隣接プーリングエリアは、境界を共有してもよいが、隣接プーリングエリアの範囲が重ならない。これによって、プーリングエリアを迅速に設定することができ、また、相関フィルタモデルにおけるアルゴリズムパラメータを効果的に削減し、パラメータの過剰適合の発生を回避し、目標追跡の精度を向上させることができる。

上記の制約条件を有する相関フィルタモデルによる画面フレームの追跡目標エリアの処理プロセスは、図３に示される。つまり、１番目の追跡目標エリアに対して畳み込み及びサンプリングにより切り抜き操作を行い、その後、切り抜かれた特徴図における隣接エリアに対してプーリング操作を行う。即ち、プーリングエリアにおけるフィルタ重みを設定することにより、切り抜かれた隣接エリアのプーリング操作が完成し、その後、対応する１番目のエリア入力特徴図が取得される。

元の画面フレームに対してプーリング操作を直接行わない（即ち、元の画面フレームのサイズを縮小しない）ことにより、切り抜かれたサンプル数が多く、また、それぞれの切り抜かれた画面エリアの隣接エリアに対してプーリング操作を行うことで、相関フィルタモデルにおけるアルゴリズムパラメータも削減されるため、パラメータの過剰適合の発生を効果的に回避することができる。

ステップＳ２０２：電子機器は、拡張ラグランジュ乗数法により、ステップＳ２０１で取得された制約条件を有する相関フィルタモデルを変換し、エリアプーリング相関フィルタモデルを生成する。

まず、パーセバルの定理に基づいて、上記の相関フィルタモデル及び対応する制約条件をフーリエ変換し、変換後の相関フィルタモデルは、以下のとおりである。

ただし、Ｆ_ｄはフーリエ変換行列であり、Ｆ_ｄ ^－１はフーリエ逆変化行列であり、ｙ＾は追跡目標エリアの出力応答のフーリエ係数であり、Ｐ＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応する二値化マスクのフーリエ係数構造のテプリッツ行列であり、ω＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応するフィルタ重みのフーリエ係数であり、ｘ＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図のフーリエ係数であり、Ｇ＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応する正則化重みのフーリエ係数構造のテプリッツ行列である。

ここで、Ｖ^１ _ｄ及びＶ^２ _ｄは、１又は０をエントリとするインデックス行列であり、ただし、

上記の変換後の相関フィルタモデルは、次のように簡略化することができる。

その後、電子機器は、拡張ラグランジュ乗数法により、簡略化された相関フィルタモデル及び制約条件を変換し、エリアプーリング相関フィルタモデルを生成する。エリアプーリング相関フィルタモデルは、次のとおりである。

ステップＳ２０３：電子機器は、共役勾配降下法により、ステップＳ２０２で取得されたエリアプーリング相関フィルタモデルを最適化することによって、１番目のエリア入力特徴図に対応する１番目の重みフィルタを取得する。

ここで、交互方向乗数法により、エリアプーリング相関フィルタモデルにおける最適化されたラグランジュ乗数及びフィルタ重みを交互に取得する。ラグランジュ乗数が一定である場合、共役勾配降下法により、対応するフィルタ重みを計算し、即ち、上記のエリアプーリング相関フィルタモデルにおけるフィルタ重みω＾_ｄに関する目標関数の勾配を計算し、勾配をゼロベクトルに設定するとき、次の線型方程式系を得ることができる。

ｉは、反復回数を示す。

上記の反復最適化演算により、最終的に追跡目標エリアの入力特徴図に対応する以下の重みフィルタを取得することができる。

このように、１番目のエリア入力特徴図及び追跡目標エリアの予期出力応答により、１番目の重みフィルタを計算するプロセスが完成する。

任意には、１番目のエリア入力特徴図及び予期出力応答を設定する（画面フレームにおける特定のオブジェクトを追跡目標エリアの中心として設定する）場合、電子機器は、直接、上記の相関フィルタアルゴリズム及び平均プーリング制約条件により、１番目のエリア入力特徴図及び予期出力応答を用いて１番目の重みフィルタを計算する。

なお、本実施例において、ｎ＝１である場合を例として、１番目のエリア入力特徴図及び追跡目標エリアの予期出力応答により、１番目の重みフィルタを計算するプロセスを詳細に説明した。その後、１番目の画面フレームに対応する１番目の重みフィルタにより、引き続き１番目の画面フレーム以降の複数の画面フレームを処理することができるため、ｎ＝１ではなくなり、１ずつ増加させ、例えば、ｎ＝２、３、４…とし、つまり、ｎは、２以上であってもよい。

そのため、その後、ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを取得し、また、ｎは２以上である場合、電子機器は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを用いてｎ番目の出力応答を計算することができる。ｎ番目の画面フレーム入力特徴図は、ｎ番目の画面フレームの入力特徴図であり、ｎ－１番目の重みフィルタは、ｎ－１番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタであり、ｎ番目の出力応答は、ｎ番目の画面フレームの出力応答である。

その後、電子機器は、ｎ番目の出力応答により、ｎ番目の追跡目標エリアの位置、及びｎ番目のエリア入力特徴図を取得する。即ち、電子機器は、出力応答が最大になる点をｎ番目の追跡目標エリアの中心とし、ｎ番目のエリア入力特徴図を決定する。ｎ番目の追跡目標エリアは、ｎ番目の画面フレームの追跡目標エリアであり、ｎ番目のエリア入力特徴図は、ｎ番目の画面フレームの追跡目標エリアの入力特徴図である。

そして、電子機器は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、及びｎ番目のエリア入力特徴図を用いてｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算することができる。当該ｎ番目の重みフィルタは、ｎ番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。本ステップと上記の１番目の重みフィルタの計算プロセスとは同様である。

算出されたｎ番目の重みフィルタの精度をさらに高めるために、電子機器は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いてｎ番目の重みフィルタを計算することができる。

任意には、電子機器は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いて各画面フレームに関連するフィルタ損失関数の線形加重融合を行うことで、マルチフレームに基づく相関フィルタモデルを得る。

即ち、下記のマルチフレームに基づく相関フィルタモデルを取得する。

ｎ番目の画面フレームの前の画面フレームの数が５０フレーム以下である場合、全てのｎ番目の画面フレームの前の画面フレームの入力特徴図を取ってｎ番目の画面フレームの重みフィルタの計算を行うことができる。ｎ番目の画面フレームの前の画面フレームの数が５０フレームを超える場合、ｎ番目の画面フレームの前の画面フレームを融合し、融合された５０個の画面フレームを生成し、融合された５０個の画面フレームの入力特徴図により、ｎ番目の画面フレームに対応するｎ番目の重みフィルタの計算を行うことができる。

ｎ番目の画面フレームに近いほど、画面フレームに対応する重みが大きくなる。

ステップＳ１０４では、電子機器は、複数の連続した画面フレームのうちのｎ＋１番目の画面フレームに対して特徴抽出を行うことで、ｎ＋１番目の画面フレーム入力特徴図を得る。ここでは、ｎ＋１＝２である。当該ｎ＋１番目の画面フレーム入力特徴図は、ｎ＋１番目の画面フレームの入力特徴図である。

その後、電子機器は、ステップＳ１０３で取得された１番目の重みフィルタを用いて２番目の出力応答を計算し、当該２番目の出力応答は、２番目の画面フレームの入力特徴図に対応する出力応答である。また、２番目の出力応答とステップＳ１０２における出力応答とを比較し、ステップＳ１０２における出力応答（最大の出力応答）に最も近いものに対応する画面フレームエリアを２番目の追跡目標エリアとして特定し、当該２番目の追跡目標エリアは、２番目の画面フレームの追跡目標エリアである。

ステップＳ１０５では、特徴抽出操作をカウントする。ステップＳ１０２を改めて実行し、特徴抽出操作の実行回数が１回増加したため、この際に特徴抽出操作をカウントした結果、特徴抽出操作の実行回数は２回である。ステップＳ１０４において目標ビデオのすべての連続した画面フレームの追跡目標エリアを取得するまで、２番目のエリア入力特徴図に対応する２番目の重みフィルタを計算する。当該２番目のエリア入力特徴図は、２番目の画面フレームの追跡目標エリアの入力特徴図であり、当該２番目の重みフィルタは、２番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。

こうすることで、電子機器は、すべての連続した画面フレームの追跡目標エリアにより、目標ビデオにおける所定又は特定のオブジェクトを効果的に追跡できる。

このように、本実施例の目標追跡方法による目標ビデオにおける所定又は特定のオブジェクトの追跡プロセスが完成する。

図４は、本願に係る目標追跡方法の上記の実施例の画面フレームの特徴変化の模式図である。曲線２ｃ１は、関連技術に係る目標追跡方法の第１フレームと他の各フレームにおける同じエリアの特徴の差のＬ２ノルム距離の変化曲線であり、曲線２ｃ２は、本実施例に係る目標追跡方法の第１フレームと他の各フレームにおける同じエリアの特徴の差のＬ２ノルム距離の変化曲線である。図４から分かるように、本実施例の目標追跡方法におけるＬ２ノルム距離の変化幅が小さく、即ち、同じ特徴エリアの異なる画面フレームにおける特徴の差異が小さく、これにより、目標ビデオにおける所定又は特定のオブジェクトの効果的な追跡操作をより良好に実現することができる。

本実施例の目標追跡方法は、入力特徴図の異なる特徴チャネルに対応するフィルタ重みに対して平均プーリング操作を行うことにより、アルゴリズムパラメータが削減される。また、追跡目標エリアを減らす必要がないため、入力特徴図のトレーニングサンプルの特徴の数を確保し、パラメータの過剰適合の発生を回避し、目標追跡の精度及び有効性を向上させた。

本願は、目標追跡装置をさらに提供する。図５を参照されたい。図５は、本願に係る目標追跡装置の一実施例の構造模式図である。本実施例の目標追跡装置は、上記の目標追跡方法の実施例によって実施できる。本実施例の目標追跡装置３０は、追跡目標エリア設定モジュール３１、特徴抽出モジュール３２、重みフィルタ計算モジュール３３、追跡目標エリア特定モジュール３４、カウントモジュール３５及びモデル設定モジュール３６を含む。

追跡目標エリア設定モジュール３１は、目標ビデオの複数の連続した画面フレームを取得し、複数の連続した画面フレームのうちのｎ番目の画面フレームの追跡目標エリアを設定するためのものであり、ただし、ｎは、正の整数である。特徴抽出モジュール３２は、ｎ番目の画面フレームの追跡目標エリアに対して特徴抽出操作を行い、追跡目標エリアの入力特徴図を取得するためのものである。重みフィルタ計算モジュール３３は、関連するフィルタアルゴリズム及び平均プーリング制約条件に従って、ｎ番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタを計算するためのものである。追跡目標エリア特定モジュール３４は、重みフィルタ及び複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図を用いてｎ＋１番目の画面フレームの出力応答を計算し、ｎ＋１番目の画面フレームの出力応答によりｎ＋１番目の画面フレームの追跡目標エリアを特定するためのものである。カウントモジュール３５は、特徴抽出操作をカウントするためのものである。モデル設定モジュール３６は、追跡目標エリアのプーリングエリアの範囲を設定するためのものである。

ここで、上記の方法の実施例と同じ理由により、複数の連続した画面フレームのうちのｎ番目の画面フレームの追跡目標エリアは、ｎ番目の追跡目標エリアとすることができ、ｎ番目の画面フレームの追跡目標エリアの入力特徴図は、ｎ番目のエリア入力特徴図とすることができ、ｎ番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタは、ｎ番目の重みフィルタとすることができる。複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図は、ｎ＋１番目の画面フレームの入力特徴図とすることができ、ｎ＋１番目の画面フレームの出力応答は、ｎ＋１番目の出力応答とすることができる。ｎ＋１番目の画面フレームの追跡目標エリアは、ｎ＋１番目の追跡目標エリアとすることができる。

図６を参照されたい。図６は、本願に係る目標追跡装置の一実施例の重みフィルタ計算モジュールの構造模式図である。当該重みフィルタ計算モジュール３３は、相関フィルタモデル作成ユニット４１、エリアプーリング相関フィルタモデル生成ユニット４２及びモデル最適化ユニット４３を含む。

相関フィルタモデル作成ユニット４１は、リッジ回帰判別関数に基づいて、ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタの相関フィルタモデルを作成し、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件とするためのものである。エリアプーリング相関フィルタモデル生成ユニット４２は、拡張ラグランジュ乗数法により制約条件を変換し、エリアプーリング相関フィルタモデルを生成するためのものである。モデル最適化ユニット４３は、共役勾配降下法により、エリアプーリング相関フィルタモデルを最適化することによって、ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを取得するためのものである。

図７を参照されたい。図７は、本願に係る目標追跡装置の一実施例の重みフィルタ計算モジュールの相関フィルタモデル作成ユニットの構造模式図である。当該相関フィルタモデル作成ユニット４１は、二値化マスク設定サブユニット５１及び正則化重み設定サブユニット５２を含む。

二値化マスク設定サブユニット５１は、ｎ番目の重みフィルタに対して二値化マスクを設定し、ｎ番目の追跡目標エリア以外に対応する重みフィルタのフィルタ重みを小さくするためのものである。正則化重み設定サブユニット５２は、ｎ番目の重みフィルタに対して正則化重みを設定し、ｎ番目の重みフィルタのｎ番目の追跡目標エリアの中心部分におけるフィルタ重みを大きくするためのものである。

本実施例の目標追跡装置３０は、使用時に、まず、追跡目標エリア設定モジュール３１によって目標ビデオの複数の連続した画面フレームを取得する。目標ビデオにおける特定又は所定のオブジェクトを追跡するためように、ここでは、複数の連続した画面フレームのうちの１番目の画面フレームに対応する１番目の追跡目標エリアを設定する。当該１番目の追跡目標エリアは、複数の連続した画面フレームのうちの１番目の画面フレームの追跡目標エリアである。

ここで言う１番目の追跡目標エリアとは、特定又は所定のオブジェクトの画面フレームにおける画面エリアであり、ここで言う特定又は所定のオブジェクトは、予め設定された人、動物、乗り物又は任意の移動オブジェクトであってもよい。これによって、１番目の画面フレームにおける追跡目標エリアの特徴に従って、後続の他の画面フレーム内で対応する追跡目標エリアを見つけることができる。

その後、特徴抽出モジュール３２は、ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、ｎ番目の追跡目標エリアに対応するｎ番目のエリア入力特徴図を取得する。ここでは、ｎ＝１である。当該ｎ番目の追跡目標エリアは、ｎ番目の画面フレームの追跡目標エリアであり、当該ｎ番目のエリア入力特徴図は、複数の連続した画面フレームのうちのｎ番目の画面フレームの追跡目標エリアの入力特徴図である。

任意には、特徴抽出モジュール３２は、ｎ番目の追跡目標エリアをａ＊ａサイズのグリッドエリアに分割し、その後、ｄ種類の異なるサイズの畳み込みカーネルを用いて上記のａ＊ａサイズのグリッドエリアに対して畳み込み及びサンプリング操作を行うことで、ｄ個の特徴チャネルを有するｎ番目のエリア入力特徴図を取得することができる。畳み込みカーネルのサイズは、グリッドエリアのサイズよりも小さい。

そして、重みフィルタ計算モジュール３３は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、１番目のエリア入力特徴図に対応する１番目の重みフィルタを計算する。当該１番目の重みフィルタは、入力特徴図における各特徴チャネルに対応するフィルタ重みを含む。当該１番目の重みフィルタは、１番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。

重みフィルタ計算モジュール３３の相関フィルタモデル作成ユニット４１は、リッジ回帰判別関数に基づいて、１番目のエリアに対応する１番目の重みフィルタの相関フィルタモデルを作成し、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件とするステップを含むことができる。

任意には、相関フィルタモデル作成ユニット４１は、リッジ回帰判別関数に基づいて、１番目のエリア入力特徴図に対応する１番目の重みフィルタの相関フィルタモデルを以下のように作成する。

ただし、ｙは追跡目標エリアの予期出力応答であり、ｘ_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図であり、ω_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応するフィルタ重みであり、Ｄは特徴チャネルの数であり、ｐ_ｄは相関フィルタモデル作成ユニット４１の二値化マスク設定サブユニット５１によって設定される追跡目標エリアの特徴チャネルｄの入力特徴図に対応する二値化マスクであり、ｇ_ｄは相関フィルタモデル作成ユニット４１の正則化重み設定サブユニット５２によって設定される追跡目標エリアの特徴チャネルｄの入力特徴図に対応する正則化重みである。

二値化マスクは、追跡目標エリア以外に対応する重みフィルタのフィルタ重みを効果的に小さくし、後続の背景エリアの追跡目標エリアの判定への影響を減らすことができる。入力特徴図に対応するエリアが追跡目標エリア以外の背景エリアであると判断される場合、二値化マスクにより相関重みフィルタのフィルタ重みを小さくする。ユーザは、自分のニーズに応じて上記の二値化マスクを使用するか否かを選択することができる。

続いて、相関フィルタモデル作成ユニット４１は、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件として設定する。

ただし、Ｐは、対応するプーリングエリアであり、Ｋは、プーリングエリアにおける入力特徴図の特徴の数であり、ｉ、ｊはプーリングエリアにおける入力特徴図に対応する位置である。

ここでのプーリングエリアは、モデル設定モジュール３６による追跡目標エリアにおける範囲のサイズの設定（例えば、２＊２又は３＊３のピクセルサイズの設定）であり、また、隣接プーリングエリアは、境界を共有してもよいが、隣接プーリングエリアの範囲が重ならない。これによって、プーリングエリアを迅速に設定することができ、また、相関フィルタモデルにおけるアルゴリズムパラメータを効果的に削減し、パラメータの過剰適合の発生を回避し、目標追跡の精度を向上させることができる。

重みフィルタ計算モジュール３３のエリアプーリング相関フィルタモデル生成ユニット４２は、拡張ラグランジュ乗数法により、取得された制約条件を有する相関フィルタモデルを変換し、エリアプーリング相関フィルタモデルを生成する。

まず、エリアプーリング相関フィルタモデル生成ユニット４２は、パーセバルの式に基づいて、上記の相関フィルタモデル及び対応する制約条件をフーリエ変換し、変換後の相関フィルタモデルは、以下のとおりである。

ただし、Ｆ_ｄはフーリエ変換行列であり、Ｆ^－１ _ｄはフーリエ逆変化行列であり、ｙ＾は追跡目標エリアの出力応答のフーリエ係数であり、Ｐ＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応する二値化マスクのフーリエ係数構造のテプリッツ行列であり、ω＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応するフィルタ重みのフーリエ係数であり、ｘ＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図のフーリエ係数であり、Ｇ＾_ｄは追跡目標エリアの特徴チャネルｄの入力特徴図に対応する正則化重みのフーリエ係数構造のテプリッツ行列である。

従って、上記の変換後の相関フィルタモデルは、次のように簡略化することができる。

その後、エリアプーリング相関フィルタモデル生成ユニット４２は、拡張ラグランジュ乗数法により、簡略化された相関フィルタモデル及び制約条件を変換し、エリアプーリング相関フィルタモデルを生成する。エリアプーリング相関フィルタモデルは、次のとおりである。

重みフィルタ計算モジュール３３のモデル最適化ユニット４３は、共役勾配降下法により、取得されたエリアプーリング相関フィルタモデルを最適化することによって、１番目のエリア入力特徴図に対応する１番目の重みフィルタを取得する。

ここで、交互方向乗数法により、エリアプーリング相関フィルタモデルにおける最適化されたラグランジュ乗数及びフィルタ重みを交互に取得する。ラグランジュ乗数が一定である場合、共役勾配降下法により、対応するフィルタ重みを計算し、即ち、上記のエリアプーリング相関フィルタモデルにおけるフィルタ重みに関する目標関数の勾配を計算し、勾配をゼロベクトルに設定するとき、次の線型方程式系を得ることができる。

ただし、ｉは反復回数を示す。

任意には、１番目のエリア入力特徴図及び予期出力応答を設定する（画面フレームにおける特定のオブジェクトを追跡目標エリアの中心として設定する）場合、重みフィルタ計算モジュール３３は、直接、上記の相関フィルタアルゴリズム及び平均プーリング制約条件により、１番目のエリア入力特徴図及び予期出力応答を用いて１番目の重みフィルタを計算する。

なお、本実施例において、ｎ＝１である場合を例として、１番目のエリア入力特徴図及び追跡目標エリアの予期出力応答により、１番目の重みフィルタを計算するプロセスを詳細に説明した。その後、１番目の画面フレームに対応する１番目の重みフィルタにより、引き続き１番目の画面フレーム以降の複数の画面フレームを処理することができるため、ｎ＝１ではなくなり、１ずつ増加させ、例えば、ｎ＝２、３、４…であり、つまり、ｎは、２以上であってもよい。

そのため、その後、ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを取得し、また、ｎは２以上である場合、重みフィルタ計算モジュール３３は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを用いてｎ番目の出力応答を計算することができる。ｎ番目の画面フレーム入力特徴図は、ｎ番目の画面フレームの入力特徴図であり、ｎ－１番目の重みフィルタは、ｎ－１番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタであり、ｎ番目の出力応答は、ｎ番目の画面フレームの出力応答である。

その後、重みフィルタ計算モジュール３３は、ｎ番目の出力応答により、ｎ番目の追跡目標エリアの位置、及びｎ番目のエリア入力特徴図を取得する。即ち、重みフィルタ計算モジュール３３は、出力応答が最大になる点をｎ番目の画面フレームの追跡目標エリアの中心とし、ｎ番目のエリア入力特徴図を決定する。ｎ番目の追跡目標エリアは、ｎ番目の画面フレームの追跡目標エリアであり、ｎ番目のエリア入力特徴図は、ｎ番目の画面フレームの追跡目標エリアの入力特徴図である。

そして、重みフィルタ計算モジュール３３は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、及びｎ番目のエリア入力特徴図を用いてｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算することができる。当該ｎ番目の重みフィルタは、ｎ番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。本ステップと上記の１番目の重みフィルタの計算プロセスとは同様である。

計算されたｎ番目の重みフィルタの精度をさらに高めるために、重みフィルタ計算モジュール３３は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いてｎ番目の重みフィルタを計算することができる。

任意には、重みフィルタ計算モジュール３３は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いて各画面フレーム相関フィルタ損失関数の線形加重融合を行うことで、マルチフレームに基づく相関フィルタモデルを得る。

μ_ｔは各サンプルｔの重みであり、即ち、ｔ番目の画面フレームの重みである。

ここで、ｎ番目の画面フレームに近いほど、画面フレームに対応する重みが大きくなる。

その後、追跡目標エリア特定モジュール３４は、複数の連続した画面フレームのうちのｎ＋１番目の画面フレームに対して特徴抽出を行うことで、ｎ＋１番目の画面フレーム入力特徴図を得る。ここでは、ｎ＋１＝２である。当該ｎ＋１番目の画面フレーム入力特徴図は、ｎ＋１番目の画面フレームの入力特徴図である。

その後、追跡目標エリア特定モジュール３４は、取得された１番目の重みフィルタを用いて２番目の出力応答を計算し、当該２番目の出力応答は、２番目の画面フレームの入力特徴図に対応する出力応答である。また、２番目の出力応答と特徴抽出モジュールの出力応答とを比較し、特徴抽出モジュールの出力応答（最大の出力応答）に最も近いものに対応する画面フレームエリアを２番目の追跡目標エリアとして特定し、当該２番目の追跡目標エリアは、２番目の画面フレームの追跡目標エリアである。

最後に、カウントモジュール３５は、特徴抽出操作をカウントする。ステップＳ１０２を改めて実行し、特徴抽出操作の実行回数が１回増加したため、この際に特徴抽出操作をカウントした結果、特徴抽出操作の実行回数は２回である。重みフィルタ計算モジュール３３は、追跡目標エリア特定モジュール３４が目標ビデオのすべての連続した画面フレームの追跡目標エリアを取得するまで、２番目のエリア入力特徴図に対応する２番目の重みフィルタを計算する。当該２番目のエリア入力特徴図は、２番目の画面フレームの追跡目標エリアの入力特徴図であり、当該２番目の重みフィルタは、２番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。

こうすることで、目標追跡装置３０は、すべての連続した画面フレームの追跡目標エリアにより、目標ビデオにおける所定又は特定のオブジェクトを効果的に追跡できる。

このように、本実施例の目標追跡装置３０による目標ビデオにおける所定又は特定のオブジェクトの追跡プロセスが完成する。

本実施例の目標追跡装置は、入力特徴図の異なる特徴チャネルに対応するフィルタ重みに対して平均プーリング操作を行うことにより、アルゴリズムパラメータが削減される。また、追跡目標エリアを減らす必要がないため、入力特徴図のトレーニングサンプルの特徴の数を確保し、パラメータの過剰適合の発生を回避し、目標追跡の精度及び有効性を向上させた。

以下では、任意の一実施例により本願に係る目標追跡方法及び目標追跡装置の具体的な動作原理を説明する。図８及び図９を参照されたい。図８は、本願に係る目標追跡方法及び目標追跡装置の目標追跡模式図であり、図９は、本願に係る目標追跡方法及び目標追跡装置の目標追跡フローチャートである。

本実施例では、カメラ６１によって特定のオブジェクトの動的ビデオを取得し、そして、画面処理サーバ６２によって、当該動的ビデオにおける特定のオブジェクトに対して目標追跡操作を行うことで、特定のオブジェクトの動的ビデオにおける運動軌跡を取得する。本実施例の目標追跡プロセスは、以下のステップを含む。

ステップＳ６０１：カメラ６１は、特定のオブジェクトの動的ビデオを取得し、当該動的ビデオを画面処理サーバ６２に送信する。

ステップＳ６０２：画面処理サーバ６２は、動的ビデオを複数の連続した画面フレームに変換し、複数の連続した画面フレームのうちの１番目の画面フレームを取得する。

ステップＳ６０３：１番目の画面フレームに対応する１番目の追跡目標エリア、即ち、図８における自動車エリア６０１を設定する。当該１番目の追跡目標エリアは、１番目の画面フレームの追跡目標エリアである。

ステップＳ６０４：画面処理サーバ６２は、１番目の追跡目標エリアに対して特徴抽出操作を行い、即ち、設定されたサイズの畳み込みカーネルにより追跡目標エリアに対して畳み込み特徴抽出操作を行い、１番目の追跡目標エリアに対応する１番目のエリア入力特徴図を取得する。当該１番目のエリア入力特徴図は、１番目の画面フレームの追跡目標エリアの入力特徴図である。

ステップＳ６０５：画面処理サーバ６２は、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、ステップＳ６０４で取得された１番目のエリア入力特徴図及び予期出力応答に基づいて、当該１番目のエリア入力特徴図に対応する１番目の重みフィルタを取得する。当該１番目の重みフィルタは、１番目の画面フレームの追跡目標エリアの入力特徴図に対応する重みフィルタである。

ステップＳ６０６：画面処理サーバ６２は、ステップＳ６０５で取得された１番目の重みフィルタ及び後続の画面フレームの入力特徴図を用いて後続の画面フレームの出力応答を１つずつ順次に計算し、出力応答に基づいて後続の画面フレームの追跡目標エリアの入力特徴図を継続的に補正する。

その後、修正された後続の画面フレームの追跡目標エリアの入力特徴図及び予期出力応答を用いて後続の画面フレームの重みフィルタを継続的に補正する。これにより、後続の画面フレームの出力応答により、後続の画面フレームの追跡目標エリア、即ち、図８における自動車エリア６０２、自動車エリア６０３及び自動車エリア６０４を特定することができる。

ステップＳ６０７：画面処理サーバ６２は、動的ビデオにおける全ての画面フレームの追跡目標エリアにより、対応する特定のオブジェクトの動的ビデオにおける運動軌跡を取得し、カメラ６１によって特定のオブジェクトの運動軌跡を引き続き捕捉できるように、特定のオブジェクトの運動軌跡に基づいてカメラ６１の後続の撮影方向を制御する。

このように、本実施例に係る目標追跡方法及び目標追跡装置の目標追跡プロセスが完成する。

本願に係る目標追跡方法及び目標追跡装置は、入力特徴図の異なる特徴チャネルに対応するフィルタ重みに対して平均プーリング操作を行うことにより、アルゴリズムパラメータを削減する。また、追跡目標エリアを減らす必要がないため、相関フィルタアルゴリズムの固有の欠陥を解消し、入力特徴図のトレーニングサンプルの特徴の数を確保し、パラメータの過剰適合の発生を回避し、関連するアルゴリズムのロバスト性を高め、さらに、目標追跡の精度及び有効性を向上させ、関連技術に係る目標追跡方法及び目標追跡装置においてパラメータの過剰適合や追跡精度の低下を引き起こしやすいという技術課題を効果的に解決した。

本願で使用される「構成要素」、「モジュール」、「システム」、「インタフェース」、「プロセス」などの用語は、一般的に、コンピュータに関連する実体、例えば、ハードウェア、ハードウェアとソフトウェアとの組合せ、ソフトウェア、又は実行中のソフトウェアを指すことを意図している。例えば、構成要素は、プロセッサ上で実行されるプロセス、プロセッサ、対象、実行可能なアプリケーション、実行されるスレッド、プログラム及び／又はコンピュータであってもよいが、これらに限定されない。図示したとおり、コントローラで実行されるアプリケーションと当該コントローラの両方とも構成要素にしてもよい。１つ又は複数の構成要素は、実行されるプロセス及び／又はスレッド内に存在してもよく、また、構成要素は、１つのコンピュータに配置され、及び／又は２つ以上のコンピュータの間に分散してもよい。

図１０及び以下の内容では、本願を実現するためのビデオ画面レンダリング装置の位置する電子機器の動作環境を簡潔で概略的に説明する。図１０の動作環境は、単なる適切な動作環境の一例であり、動作環境に関する用途又は機能の範囲への如何なる制限を示唆することを意図するものではない。

必須ではないが、「コンピュータ読み取り可能な指令」が１つ又は複数の電子機器によって実行されるという通常の状況で実施例を説明する。コンピュータ読み取り可能な指令は、コンピュータ読み取り可能な媒体を介して分散することができる（以下で説明する）。コンピュータ読み取り可能な指令は、プログラムモジュールとして実現でき、例えば、特定のタスクを実行し、又は特定の抽象データタイプを実現する機能、対象、アプリケーションプログラミングインタフェース（ＡＰＩ）、データ構造などが挙げられる。典型的には、当該コンピュータ読み取り可能な指令の機能は、様々な環境で任意に組み合わせたり、分散したりすることができる。

図１０には、本願に係る目標追跡装置における１つ又は複数の実施例の電子機器７１２を含む例が示されている。一構成では、電子機器７１２は、少なくとも１つの処理ユニット７１６及びメモリ７１８を含む。電子機器の具体的な配置及びタイプによっては、メモリ７１８は、揮発性のもの（例えば、ＲＡＭ）でもよいし、不揮発性のもの（例えば、ＲＯＭ、フラッシュメモリなど）でもよいし、又はその両者の何らかの組合せでもよい。当該配置は、図１０において破線７１４によって示される。

別の実施例では、電子機器７１２は、追加の特徴及び／又は機能を含むことができる。例えば、電子機器７１２は、（例えば、取り外し可能及び／又は取り外し不可能な）追加の記憶装置をさらに含むことができる。当該追加の記憶装置は、磁気記憶装置、光学記憶装置などを含むが、これらに限定されない。このような追加の記憶装置は、図１０において記憶装置７２０によって示される。一実施例では、本明細書で提供される１つ又は複数の実施例を実現するためのコンピュータ読み取り可能な指令は、記憶装置７２０に記憶されてもよい。記憶装置７２０には、オペレーティングシステム、アプリケーションプログラム等を実現するための他のコンピュータ読み取り可能な指令がさらに記憶されてもよい。コンピュータ読み取り可能な指令は、メモリ７１８内にロードされ、例えば処理ユニット７１６によって実行されることができる。

本明細書で使用される「コンピュータ読み取り可能な媒体」という用語は、コンピュータ記憶媒体を含む。コンピュータ記憶媒体は、コンピュータ読み取り可能な指令又は他のデータなどのような情報を記憶するための任意の方法又は技術によって実現される揮発性および不揮発性の媒体、取り外し可能及び取り外し不能な媒体を含む。メモリ７１８及び記憶装置７２０は、コンピュータ記憶媒体の例である。コンピュータ記憶媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ又は他のメモリ技術、ＣＤ－ＲＯＭ、デジタル多用途ディスク（ＤＶＤ）又は他の光学記憶装置、カセットテープ、磁気テープ、磁気ディスク記憶装置又は他の磁気記憶装置、或いは予期情報を記憶するために用いられ、電子機器７１２によってアクセスできる他の任意の媒体を含むが、これらに限定されない。任意のこのようなコンピュータ記憶媒体は、電子機器７１２の一部であり得る。

電子機器７１２は、電子機器７１２が他のデバイスと通信することを可能にする通信接続７２６をさらに含み得る。通信接続７２６は、モデム、ネットワークインタフェースカード（ＮＩＣ）、統合ネットワークインタフェース、無線周波数送信器／受信器、赤外線ポート、ＵＳＢ接続又は電子機器７１２を他の電子機器に接続するための他のインタフェースを含むが、これらに限定されない。通信接続７２６は、有線接続又は無線接続を含み得る。通信接続７２６は、通信媒体を送信および／または受信することができる。

「コンピュータ読み取り可能な媒体」という用語は、通信媒体を含み得る。通信媒体は、典型的には、コンピュータ読み取り可能な指令、又は搬送波や他の伝送手段などのような「変調されたデータ信号」における他のデータを含み、また、任意の情報配信媒体を含む。「変調されたデータ信号」という用語は、情報を信号に符号化するように当該信号の１つ又は複数の特性が設定又は変更される信号を含むことができる。

電子機器７１２は、入力デバイス７２４、例えば、キーボード、マウス、ペン、音声入力デバイス、タッチ入力デバイス、赤外線カメラ、ビデオ入力デバイス及び／又は他の任意の入力デバイスを含み得る。電子機器７１２は、出力デバイス７２２、例えば、１つ又は複数のディスプレイ、スピーカー、プリンタ及び／又は他の任意の出力デバイスをさらに含み得る。入力デバイス７２４及び出力デバイス７２２は、有線接続、無線接続又はそれらの任意の組合せを介して電子機器７１２に接続することができる。一実施例では、別の電子機器に配置された入力デバイス又は出力デバイスは、電子機器７１２の入力デバイス７２４又は出力デバイス７２２として使用することができる。

電子機器７１２の構成要素は、様々な相互接続（例えば、バス）を介して接続することができる。このような相互接続は、ペリフェラルコンポーネントインターコネクト（ＰＣＩ）（例えば、ＰＣＩエクスプレス）、ユニバーサルシリアルバス（ＵＳＢ）、ファイヤーワイヤー（ＩＥＥＥ１３９４）、光学バス構造などを含むことができる。別の実施例では、電子機器７１２の構成要素は、ネットワークを介して相互接続することができる。例えば、メモリ７１８は、異なる物理的位置に配置され、ネットワークを介して相互接続される複数の物理的メモリユニットで構成され得る。

本分野の技術者は、コンピュータ読み取り可能な指令を記憶するための記憶装置がネットワークにわたって分散してもよいことを理解するであろう。例えば、ネットワーク７２８を介してアクセス可能なバックエンドサーバ７３０は、本願で提供される１つ又は複数の実施例を実現するためのコンピュータ読み取り可能な指令を記憶することができる。電子機器７１２は、バックエンドサーバ７３０にアクセスし、実行のためにコンピュータ読み取り可能な指令の一部又は全部をダウンロードすることができる。あるいは、電子機器７１２は、必要に応じて複数のコンピュータ読み取り可能な指令をダウンロードすることができ、又は、一部の指令を電子機器７１２で実行し、一部の指令をバックエンドサーバ７３０で実行するようにすることができる。

本願の実施例では、プロセッサ及びメモリを備え、メモリにコンピュータプログラムが記憶されており、プロセッサが当該コンピュータプログラムを呼び出すことで以下の操作を実行する電子機器を提供する。

目標ビデオの複数の連続した画面フレームを取得し、複数の連続した画面フレームのうちのｎ番目の画面フレームに対応するｎ番目の追跡目標エリアを設定する（ただし、ｎは、正の整数である）。

ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、ｎ番目の追跡目標エリアに対応する、ｎ番目のエリア入力特徴図を取得し、前記ｎ番目のエリア入力特徴図は複数の特徴チャネルを含む。

相関フィルタアルゴリズム及び平均プーリング制約条件に従って、ｎ番目のエリア入力特徴図に対応し、ｎ番目のエリア入力特徴図における各特徴チャネルに対応するフィルタ重みを含むｎ番目の重みフィルタを計算する。

ｎ番目の重みフィルタ、及び複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図であるｎ＋１番目の画面フレーム入力特徴図を利用し、ｎ＋１番目の出力応答を計算し、ｎ＋１番目の出力応答に従ってｎ＋１番目の画面フレームに対応するｎ＋１番目の追跡目標エリアを特定する。

ｎ＋１番目の追跡目標エリアに対して特徴抽出を行い、ｎ＋１番目の追跡目標エリアに対応するｎ＋１番目のエリア入力特徴図を取得し、全ての連続した画面フレームの追跡目標エリアを取得するまでｎ＋１番目のエリア入力特徴図に対応するｎ＋１番目の重みフィルタを計算する。

任意には、当該プロセッサは、当該コンピュータプログラムを呼び出すことで以下の操作を実行するためのものである。

リッジ回帰判別関数に基づいて、ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタの相関フィルタモデルを作成し、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件とする。

拡張ラグランジュ乗数法により、制約条件を有する相関フィルタモデルを変換し、エリアプーリング相関フィルタモデルを生成する。

共役勾配降下法により、エリアプーリング相関フィルタモデルを最適化することによって、ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを取得する。

隣接プーリングエリアの範囲が重ならないように、追跡目標エリアの複数のプーリングエリアの範囲を設定する。

１番目のエリア入力特徴図を取得する場合、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、１番目の画面フレームに対応する１番目の追跡目標エリアの入力特徴図である１番目のエリア入力特徴図、及び追跡目標エリアの予期出力応答を用いて１番目のエリア入力特徴図に対応する１番目の重みフィルタを計算する。

ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを取得し、また、ｎが２以上である場合、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、ｎ番目の画面フレームの入力特徴図であるｎ番目の画面フレーム入力特徴図、及びｎ－１番目の画面フレームに対応する重みフィルタであるｎ－１番目の重みフィルタを用いてｎ番目の出力応答を計算する。ｎ番目の出力応答により、ｎ番目の画面フレームの追跡目標エリアの位置、及びｎ番目のエリア入力特徴図を取得する。

相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、及びｎ番目のエリア入力特徴図を用いてｎ番目の重みフィルタを計算する。

ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを取得し、また、ｎが２以上である場合、相関フィルタアルゴリズム及び平均プーリング制約条件に従って、ｎ番目の画面フレームの入力特徴図であるｎ番目の画面フレーム入力特徴図、及びｎ－１番目の画面フレームに対応する重みフィルタであるｎ－１番目の重みフィルタを用いてｎ番目の出力応答を計算する。

ｎ番目の出力応答により、ｎ番目の画面フレームの追跡目標エリアの位置、及びｎ番目のエリア入力特徴図を取得する。

相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いてｎ番目の重みフィルタを計算する。

相関フィルタアルゴリズム及び平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いて各画面フレームの相関フィルタ損失関数の線形加重融合を行うことで、マルチフレームに基づく相関フィルタモデルを得る。

マルチフレームに基づく相関フィルタモデルを計算し、ｎ番目の重みフィルタを得る。

ｎ番目の重みフィルタに対して二値化マスクを設定することによって、ｎ番目の追跡目標エリア以外に対応する重みフィルタのフィルタ重みを小さくする。

ｎ番目の重みフィルタに対して正則化重みを設定することによって、ｎ番目の重みフィルタのｎ番目の追跡目標エリアの中心部分におけるフィルタ重みを大きくする。

本明細書は、実施例の様々な操作を提供する。一実施例では、１つ又は複数の操作により、１つ又は複数のコンピュータ読み取り可能な媒体に記憶されたコンピュータ読み取り可能な指令を構成でき、当該コンピュータ読み取り可能な指令は、電子機器によって実行される際に、コンピューティングデバイスを動作させる。一部又は全ての操作を説明する順序は、これらの操作が必ずこの順で関連していることを示唆していると解釈すべきではない。本分野の技術者は、本明細書の利点を有する代替可能な順序でもよいと理解できる。さらに、全ての操作が必ずしも本明細書で提供される各実施例に含まれるわけではないと理解できる。

また、１つ又は複数の実施形態について本開示を示し、説明したが、本分野の技術者であれば、本明細書及び図面の読解に基づいて同等の変形および修正に想到することができる。本開示は、このような修正及び変形の全てを含み、添付の特許請求の範囲のみによって制限される。特に、上記の構成要素（例えば素子、リソース等）によって実行される様々な機能に関して、このような構成要素を説明するための用語は、本明細書に示す本開示の例示的な実施形態における機能を実行する本開示の構造と構造上に同等ではない場合でも、構成要素の所定の機能（例えば機能上に同等である）を実行する任意の構成要素に対応することを意図している（特に断らない限り）。なお、本開示の特定の特徴は幾つかの実施形態のうちの１つのみにおいて開示されたが、このような特徴は、所与又は特定の応用にとって望ましくかつ有利である可能性がある他の実施形態の１つ又は複数の他の特徴と組み合わせることができる。さらに、「含む」、「有する」、「含有」という用語又はそれらの変形が具体的な実施形態又は特許請求の範囲で使用される場合、このような用語は、「含む」という用語と同様に含まれることを意図している。

本願の実施例における各機能ユニットが１つの処理モジュールに組み込まれてもよく、各ユニットが別体で物理的に存在してもよく、２つ又は２つ以上のユニットが１つのモジュールに組み込まれてもよい。上記の組み込まれたモジュールは、ハードウェアとして実現してもよく、ソフトウェア機能モジュールとして実現してもよい。組み込まれたモジュールがソフトウェア機能モジュールとして実現され、単独の製品として販売または使用される場合、１つのコンピュータ読み取り可能な記憶媒体に記憶されてもよい。上記の記憶媒体は、リードオンリメモリ、磁気ディスク又は光学ディスクなどであってもよい。上記の各装置又はシステムは、相応する方法の実施例における方法を実行することができる。

本願の実施例では、プロセッサ実行可能な指令が記憶されており、当該指令を１つ又は複数のプロセッサによりローディングすることで以下の操作を実行する記憶媒体を提供する。

ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、ｎ番目の追跡目標エリアに対応し、ｎ番目のエリア入力特徴図を取得し、前記ｎ番目のエリア入力特徴図は複数の特徴チャネルを含む。

ｎ番目の重みフィルタ、及び複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図であるｎ＋１番目の画面フレーム入力特徴図を用いてｎ＋１番目の出力応答を計算し、ｎ＋１番目の出力応答により、ｎ＋１番目の画面フレームに対応するｎ＋１番目の追跡目標エリアを特定する。

任意には、当該指令を１つ又は１つ以上のプロセッサによりローディングすることで以下の操作を実行する。

リッジ回帰判別関数に基づいて、ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタの相関フィルタモデルを作成し、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを相関フィルタモデルの制約条件をする。

以上をまとめると、本願は、実施例にて上記のように開示されたが、実施例の前の番号は、説明の便宜のために使用されるものに過ぎず、本願の各実施例の順序を制限しない。また、上記の実施例は、本願を制限するためのものではなく、本分野の通常の技術者は、本願の精神及び範囲から逸脱することなく、様々な変更および修正を行うことができるため、本願の保護範囲は、特許請求の範囲によって限定された範囲を基準とする。

Claims

電子機器が実行する目標追跡方法であって、
目標ビデオの複数の連続した画面フレームを取得し、前記複数の連続した画面フレームのうちのｎ番目の画面フレームに対応するｎ番目の追跡目標エリアを設定するステップであって、ｎは正の整数である、ステップと、
前記ｎ番目の追跡目標エリアに対して特徴抽出操作を行い、前記ｎ番目の追跡目標エリアに対応するｎ番目のエリア入力特徴図を取得するステップであって、前記ｎ番目のエリア入力特徴図は、複数の特徴チャネルを含むものである、ステップと、
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算するステップであって、前記ｎ番目の重みフィルタは、前記ｎ番目のエリア入力特徴図における各特徴チャネルに対応するフィルタ重みを含むものである、ステップと、
前記ｎ番目の重みフィルタ、及び前記複数の連続した画面フレームのうちのｎ＋１番目の画面フレームの入力特徴図であるｎ＋１番目の画面フレーム入力特徴図を用いてｎ＋１番目の出力応答を計算し、前記ｎ＋１番目の出力応答に従って前記ｎ＋１番目の画面フレームに対応するｎ＋１番目の追跡目標エリアを特定するステップと、
全ての連続した画面フレームの追跡目標エリアを取得するまで、前記ｎ＋１番目の追跡目標エリアに対して特徴抽出を行い、前記ｎ＋１番目の追跡目標エリアに対応するｎ＋１番目のエリア入力特徴図を取得し、前記ｎ＋１番目のエリア入力特徴図に対応するｎ＋１番目の重みフィルタを計算するステップと、
を含むことを特徴とする目標追跡方法。
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算する前記ステップは、
リッジ回帰判別関数に基づいて、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタの相関フィルタモデルを作成し、プーリングエリアにおける特徴チャネルに対応するフィルタ重みが等しいことを前記相関フィルタモデルの制約条件とするステップと、
拡張ラグランジュ乗数法により、制約条件を有する相関フィルタモデルを変換し、エリアプーリング相関フィルタモデルを生成するステップと、
共役勾配降下法により、前記エリアプーリング相関フィルタモデルを最適化することによって、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを取得するステップと、を含むことを特徴とする請求項１に記載の目標追跡方法。
前記目標追跡方法は、
隣接プーリングエリアの範囲が重ならないように、前記追跡目標エリアの複数のプーリングエリアの範囲を設定するステップをさらに含むことを特徴とする請求項１又は２に記載の目標追跡方法。
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算する前記ステップは、
１番目のエリア入力特徴図を取得する場合、前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、１番目の画面フレームに対応する１番目の追跡目標エリアの入力特徴図である前記１番目のエリア入力特徴図、及び追跡目標エリアの予期出力応答を用いて前記１番目のエリア入力特徴図に対応する１番目の重みフィルタを計算するステップと、
ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを取得し、ｎが２以上である場合、前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、前記ｎ番目の画面フレームの入力特徴図である前記ｎ番目の画面フレーム入力特徴図、及び前記ｎ－１番目の画面フレームに対応する重みフィルタである前記ｎ－１番目の重みフィルタを用いてｎ番目の出力応答を計算するステップと、
前記ｎ番目の出力応答により、前記ｎ番目の画面フレームの追跡目標エリアの位置、及び前記ｎ番目のエリア入力特徴図を取得するステップと、
前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、前記追跡目標エリアの予期出力応答、及び前記ｎ番目のエリア入力特徴図を用いて前記ｎ番目の重みフィルタを計算するステップと、を含むことを特徴とする請求項１～３のいずれか一項に記載の目標追跡方法。
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算する前記ステップは、
前記ｎ番目の画面フレーム入力特徴図及びｎ－１番目の重みフィルタを取得し、ｎが２以上である場合、前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、前記ｎ番目の画面フレームの入力特徴図である前記ｎ番目の画面フレーム入力特徴図、及びｎ－１番目の画面フレームに対応する重みフィルタである前記ｎ－１番目の重みフィルタを用いてｎ番目の出力応答を計算するステップと、
前記ｎ番目の出力応答により、前記ｎ番目の画面フレームの追跡目標エリアの位置、及び前記ｎ番目のエリア入力特徴図を取得するステップと、
前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、前記ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いて前記ｎ番目の重みフィルタを計算するステップと、を含むことを特徴とする請求項１～３のいずれか一項に記載の目標追跡方法。
前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、前記ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いて前記ｎ番目の重みフィルタを計算する前記ステップは、
前記相関フィルタアルゴリズム及び前記平均プーリング制約条件に従って、追跡目標エリアの予期出力応答、前記ｎ番目のエリア入力特徴図及びｎ番目の画面フレームの前の複数の画面フレームの追跡目標エリアの入力特徴図を用いて各画面フレームの相関フィルタ損失関数の線形加重融合を行うことで、マルチフレームに基づく相関フィルタモデルを得るステップと、
前記マルチフレームに基づく相関フィルタモデルを計算し、前記ｎ番目の重みフィルタを得るステップと、を含むことを特徴とする請求項５に記載の目標追跡方法。
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算する前記ステップは、
前記ｎ番目の重みフィルタに対して二値化マスクを設定することによって、前記ｎ番目の追跡目標エリア以外に対応する重みフィルタのフィルタ重みを小さくするステップを含むことを特徴とする請求項１～３のいずれか一項に記載の目標追跡方法。
相関フィルタアルゴリズム及び平均プーリング制約条件に従って、前記ｎ番目のエリア入力特徴図に対応するｎ番目の重みフィルタを計算する前記ステップは、
前記ｎ番目の重みフィルタに対して正則化重みを設定することによって、前記ｎ番目の重みフィルタの前記ｎ番目の追跡目標エリアの中心部分におけるフィルタ重みを大きくするステップを含むことを特徴とする請求項１～３のいずれか一項に記載の目標追跡方法。
請求項１～８のいずれか一項に記載の目標追跡方法をコンピュータに実行させるコンピュータプログラム。
プロセッサ及びメモリを備え、前記メモリにコンピュータプログラムが記憶されており、前記プロセッサが前記コンピュータプログラムを実行することにより請求項１～８のいずれか一項に記載の目標追跡方法を実行する、電子機器。