WO2023042337A1

WO2023042337A1 - 画像処理システム

Info

Publication number: WO2023042337A1
Application number: PCT/JP2021/034106
Authority: WO
Inventors: 海斗笹尾
Original assignee: 株式会社日立国際電気
Priority date: 2021-09-16
Filing date: 2021-09-16
Publication date: 2023-03-23
Also published as: JPWO2023042337A1

Abstract

本発明は画像処理による追跡精度向上を目的とする。本発明の画像処理システムは、画像データに対して学習モデルにより物体を検出する物体検出部と、物体追跡部を備え、前記物体追跡部は、所定フレーム目の画像データから検出物体をリサイズした切り出し画像と中心座標をセットとした基準テンプレートを作成し、次のフレームの画像データから検出物体をリサイズした切り出し画像と中心座標をセットとした一時テンプレートを作成し、かつ所定条件でマッチングが成立するペアテンプレートを抽出し、かつペア基準テンプレートの切り出し画像の画素値とペア一時テンプレートの切り出し画像の画素値を所定量加味した画素値を有する切り出し画像と前記ペア一時テンプレートの中心座標をセットとしたテンプレートを作成して基準テンプレートを更新し、余った基準テンプレートと一時テンプレートを保持して基準テンプレートとして更新する、ことを特徴とする。

Description

画像処理システム

　本発明は、画像処理システム、画像処理装置および画像処理方法に関する。

　従来の画像処理システムの機能の１つに物体追跡が含まれる。この機能は例えば、不審人物を自動で検出し、見逃さないように追跡することができる技術である。従来の技術では、差分法などの比較的に単純なアルゴリズムで実装されていることが多い。また、最新の研究では、Ｄｅｅｐ　Ｌｅａｒｎｉｎｇを用いた高度な計算を行う手法が開発されている。

　例えば特許文献１には、画像信号から差分法によって複数の物体を検出したときに、入力画像信号と基準背景画像信号の画素ごとの除算を行って得られる除算画像のヒストグラムの平均比率を各検出物体について算出して、監視対象とすべき侵入物体か否かの判定を行う技術が開示されている。

　また特許文献２には、入力画像と基準背景画像との画素ごとの差分値を計算し、差分値と二値化閾値を比較して物体検出を行う際に、ノイズを除去し侵入物体を検出する適切な二値化閾値を決定するプロセスに関する技術が開示されている。

特開２００１-１７５９５９号公報特開２００２-２１８４４３号公報

　しかしながら差分法では、基本的に動きのあるものは全て検出することから、目的とする検出物体（例えば人物）以外の物体（車や木の葉など）も検出し誤報が発生しやすい問題がある。

　Ｄｅｅｐ　Ｌｅａｒｎｉｎｇを用いた物体追跡方法は、検出精度が高くなることは期待できるが、計算量の多さによるリアルタイム性の難しさやそれを補うためのハード構成によって消費電力が高くなる問題がある。

　また、画像で人物追跡を行う場合、最新の人物画像に更新した基準テンプレートを用いて追跡すると、追跡人物の一時的な動作で違う見え方となった画像を基準にして追跡が行われ、結局人物を見失ってしまい、追跡精度が低下することがある。また一時的に車が人物の前を通過するような場合（オクルージョン）、人物と車が重なった最新の画像を基準に次の追跡が行われ、結局人物を見失ってしまい、追跡精度が低下することがある。

　上述のような、追跡対象となる人物または物体の類似性が変化する問題について、特許文献１または特許文献２では認識されていない。

　そこで、本発明では、消費電力を抑えたハード構成で、従来よりも検出精度がよい物体追跡機能を有した画像処理の技術を提供することを目的とする。

　前記の課題を解決するために、代表的な本発明の画像処理システムの一つは、画像データに対して学習モデルにより物体を検出する物体検出部と、物体追跡部を備え、前記物体追跡部は、所定フレーム目の画像データから、検出物体をリサイズした切り出し画像と中心座標をセットとした基準テンプレートを作成し、次のフレームの画像データから、検出物体をリサイズした切り出し画像と中心座標をセットとした一時テンプレートを作成し、かつ所定条件でマッチングが成立するペアテンプレートを抽出し、かつペア基準テンプレートの切り出し画像の画素値とペア一時テンプレートの切り出し画像の画素値を所定量加味した画素値を有する切り出し画像と前記ペア一時テンプレートの中心座標をセットとしたテンプレートを作成して基準テンプレートを更新し、余った基準テンプレートと一時テンプレートを保持して基準テンプレートとして更新するものである。

　本発明によれば、従来よりも検出精度がよい物体追跡機能を有した画像処理の技術を提供することができる。
　前記した以外の課題、構成および効果は、以下の実施をするための形態における説明により明らかにされる。

図１は、本実施形態に係る画像処理システムの構成を示すブロック図である。図２は、本実施形態に係る画像処理部１０３の構成を示すブロック図である。図３は、本実施形態に係る画像処理部１０３のフローチャートである。図４は、本実施形態において画像データから追跡人物のテンプレートを作成する処理を示す図である。図５は、本実施形態において基準テンプレートと一時テンプレートとのマッチング処理を示す図である。図６は、本実施形態においてペアテンプレートを用いて基準テンプレートを更新する処理を示す図である。。図７は、本実施形態においてマッチングが成立せず余ったテンプレートの処理を示す図である。

　以下、図面を参照して、本発明の実施形態について説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。

　本開示において、「画像データ」というときは特に断りのない限り、撮像装置の撮像視野（「フレーム」ということもある。）内で撮影された画像のデータを意味する。

　本開示において、ＸＹ座標を用いて検出物体の位置などを座標（ｘ、ｙ）で表すことがある。その際原点の位置は特に限定されないが、例えばフレームの一番左上を原点（０、０）とし、右の向きがＸ軸の正方向、下の向きがＹ軸の正方向として画素の位置（単位はピクセル）を定めることが可能である。

　まず本実施形態に係る画像処理システムの構成について説明する。図１は、本実施形態に係る画像処理システムの構成を示すブロック図である。

　画像処理システムのハードウェアは、汎用のＣＰＵを備えた電子計算機システムにより構成され、それぞれの機能が実行されるようになっている。前記ＣＰＵは、Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ（ＤＳＰ）、Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ（ＦＰＧＡ）、またはＧｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ（ＧＰＵ）などで代替してもよい。

　撮像装置１０１は、固定または可動に設置され画像を撮影する１台以上のＩＰカメラなどの装置である。

　映像取得部１０２は、撮像装置１０１からのリアルタイムの映像信号または記録装置１０９に記録されている映像信号などを、１次元配列、２次元配列、または３次元配列の画像データとして取得する機能を有する。

　画像データにおいては、ノイズやフリッカなどの影響を低減するために、前処理として平滑化フィルタや輪郭強調フィルタ、濃度変換などの処理を施してもよい。また、用途に応じてＲＧＢカラーやＹＵＶ、モノクロなどのデータ形式を選択してもよい。さらには、処理コスト低減のために、所定の大きさで画像データに縮小処理を施してもよい。

　画像処理部１０３は、映像取得部１０２より得られた画像データを入力として画像処理により特定物体を検出し追跡する機能を有する。

　データ通信部１０４は、画像処理部１０３で検出し処理した信号やネットワーク上の監視センターの信号などを送受信する機能を有する。

　記録制御部１０５は、画像処理部１０３で検出し処理した画像データの記録制御や、記録画像の圧縮率や記録間隔を制御する機能を有する。

　表示制御部１０６は、映像取得部１０２で取得した映像および画像処理部１０３で検出した結果や、記録装置１０９に保存された情報の表示を制御する機能を有する。

　発報装置１０７は、画像処理部１０３で検出処理した結果を音声や光などでユーザに知らせる、例えば警報やパトライトなどの装置である。

　表示出力装置１０８は、映像取得部１０２で取得した映像および画像処理部１０３で検出し処理した結果や、記録装置１０９に保存された情報を表示する装置である。

　記録装置１０９は、映像取得部１０２より得られた映像および画像処理部１０３で検出し処理した結果を記録制御部１０５の命令により記録保存する装置である。

　次に画像処理部１０３について詳細に説明する。
　図２は、本実施形態に係る画像処理部１０３の構成を示すブロック図である。画像処理部１０３は、物体検出部２０１、学習モデル２０２、および物体追跡部２０３を備える。

　図３は、本実施形態に係る画像処理部１０３での処理を示すフローチャートである。画像入力ステップ３０１は、映像取得部１０２で取得した画像データを入力するステップである。物体検出ステップ３０２は、追跡対象の物体を検出するステップである。テンプレート作成ステップ３０３は、検出した物体情報をテンプレート化するステップである。マッチング処理ステップ３０４は、各フレーム間のテンプレートを結びつけるためのマッチング処理を行うステップである。テンプレート更新ステップ３０５は、テンプレートの更新を行うステップである。その後画像入力ステップ３０１に戻り繰り返し処理を行う。

＜物体検出＞
　次に、物体検出部２０１とそこでの処理である物体検出ステップ３０２における物体検出について説明する。
　物体検出部２０１と物体検出ステップ３０２では、映像取得部１０２で取得した画像データに対して、事前に機械学習により作成した学習モデル２０２を用いて追跡対象の物体を検出し、画像中の位置を出力する。

　機械学習には周知のＤｅｅｐ　Ｌｅａｒｎｉｎｇをはじめとした物体検出手法を適用してもよく、Ｆａｓｔ　Ｒ－ＣＮＮ、Ｆａｓｔｅｒ　Ｒ－ＣＮＮ、ＹＯＬＯ、またはＳＳＤなどが用いられてもよい。

＜物体追跡＞
　次に物体追跡部２０３と、そこでの処理であるテンプレート作成ステップ３０３、マッチング処理ステップ３０４、およびテンプレート更新ステップ３０５について、人物追跡を例に、図４～図７を用いて物体追跡について説明する。なお、本開示の技術による追跡対象は人物に限られるものでないことは言うまでもない。

[テンプレート作成]
　図４は、本実施形態において画像データから追跡人物のテンプレートを作成する処理を示す図である。

　映像取得部１０２から得られるｔフレーム目の画像データ４０１から、物体検出部２０１において、事前に機械学習により作成した学習モデル２０２を用いた手法でバウンディングボックスに囲まれた人物が検出される（物体検出ステップ３０２）。バウンディングボックスのサイズは検出される人物の動作や大きさなどにより区々のサイズをとる。

　本開示において、「ｔフレーム」とは、ある時点で撮像したフレームから順次カウントしてｔ番目に撮像されたフレームを意味する。ただし、カウントの始点となるフレームは特に限定されるものではない。

　次に、区々のサイズのバウンディングボックスをＷピクセル×Ｈピクセルの一定のサイズにリサイズした切り出し画像４０７を作成し、当該切り出し画像４０７とその中心座標（ｘ^t、ｙ^t）を１つのセットとした基準テンプレート４０２が検出した人物の数だけ作成される（テンプレート作成ステップ３０３）。

　例えば、画像データが横６４０ピクセル×高さ４８０ピクセル（１ピクセル当たり２４ビット）の場合、７０ピクセル（Ｗ）×７０ピクセル（Ｈ）の一定のサイズにリサイズすることが想定されるがこれに限られるものではない。

　画像データ４０１において、区々の大きさのバウンディングボックスサイズで検出される人物を一律Ｗ×ＨのサイズにリサイズすることでＳＳＤ（後述する）などの演算処理をすることが可能になる。またリサイズして画素数を軽減することでコンピュータの処理にかかる負担を軽減することも可能になる。

　同様に、次のｔ＋１フレーム目の画像データ４０１から、自動的にＷピクセル×Ｈピクセルにリサイズした人物の切り出し画像４０８とその中心座標（ｘ^t+1、ｙ^t+1）を１つのセットとした一時テンプレート４０３を検出した人物の数だけ作成する（テンプレート作成ステップ３０３）。

[マッチング処理]
　次に、図５を参照して、物体追跡部２０３において、所定条件を満たす基準テンプレートと一時テンプレートの組み合わせを選択する（以下、「マッチング」ということもある。）処理について説明する（マッチング処理ステップ３０４）。
　図５は、本実施形態において基準テンプレートと一時テンプレートとのマッチング処理を示す図である。

　前記所定条件の例として、基準テンプレート４０２と一時テンプレート４０３との中心座標間の距離Ｌピクセルが閾値Ｒピクセル以下、かつ基準テンプレート４０２の切り出し画像４０７と一時テンプレートの切り出し画像４０８との類似度ＳＳＤ（Ｓｕｍ　ｏｆ　Ｓｑｕａｒｅｄ　Ｄｉｆｆｅｒｅｎｃｅ）が閾値Ｄ以下になる基準テンプレート４０２と一時テンプレート４０３を組み合わせたテンプレート４０４（以下、「ペアテンプレート」という。）を抽出する。以下、ペアテンプレートを構成する基準テンプレートを「ペア基準テンプレート」といい、一時テンプレートを「ペア一時テンプレート」ともいう。

距離Ｌピクセルを式１、類似度ＳＳＤを式２に示す。

　ここで、基準テンプレート４０２の中心座標を（ｘ_１、ｙ_１）、一時テンプレート４０３の中心座標を（ｘ_２、ｙ_２）、基準テンプレート４０２の位置（ｉ、ｊ）の画素値をｆ（ｉ、ｊ）、一時テンプレート４０３の位置（ｉ、ｊ）の画素値をｇ（ｉ、ｊ）とする。

　なお、類似度にＳＳＤを使用しているが、ＳＡＤ（Ｓｕｍ　ｏｆ　Ａｂｓｏｌｕｔｅ　Ｄｉｆｆｅｒｅｎｃｅ）やＮＣＣ（Ｎｏｒｍａｌｉｚｅｄ　Ｃｒｏｓｓ－Ｃｏｒｒｅｌａｔｉｏｎ）、ＺＮＣＣ（Ｚｅｒｏ－ｍｅａｎｓ　Ｎｏｒｍａｌｉｚｅｄ　Ｃｒｏｓｓ－Ｃｏｒｒｅｌａｔｉｏｎ）を用いてもよい。

　このとき１つの基準テンプレート４０２が複数の一時テンプレート４０３と組み合わせの条件を満たす場合があり得る。同様に１つの一時テンプレート４０３が複数の基準テンプレート４０２と組み合わせの条件を満たす場合があり得る。そのような場合は類似度ＳＳＤが最小となる組み合わせを選択する。よって、基準テンプレート４０２と一時テンプレート４０３は必ず１対１で組み合わさる。

　一方組み合わせが成立しない場合もある。その時は、余った基準テンプレート４０５と、余った一時テンプレート４０６も抽出する。

　例えば、人物が近方に映りオクルージョンが発生しやすい環境では、Ｗ＝Ｈ＝７０ピクセル、距離Ｌの閾値Ｒ＝２００ピクセル、類似度ＳＳＤの閾値Ｄ＝０．６(ただし、ＳＳＤの値を０～１に正規化)のように設定し、画像上で人物が比較的大きく動いても基準テンプレート４０２と一時テンプレート４０３が組み合わさりやすくしてもよい。ここでオクルージョンとは、対象人物とは別の人物や自動車、バス、バイク、自転車、電車、飛行機、ヘリコプターなどの移動体、動物、草木などの自然物、その他人工物などによる対象人物の一部もしくは全体の隠れのことである。

[テンプレート更新]
　次に物体追跡部２０３において、テンプレートを更新する処理について説明する（テンプレート更新ステップ３０５）。
（ペアテンプレートを用いた更新）
　図６は、本実施形態においてペアテンプレートを用いて基準テンプレートを更新する処理を示す図である。

　マッチングの成立したペアテンプレート４０４のうち、ペア基準テンプレート４０２の切り出し画像４０７の画素値と、ペア一時テンプレート４０３の切り出し画像４０８の画素値を所定量加味した画素値を有する切り出し画像４０９と、前記ペア一時テンプレート４０３の中心座標（ｘ_１ ^t+1、ｙ_１ ^t+1）のセットで基準テンプレートを置き換え更新し、当該基準テンプレート４１０を以後の追跡対象として取り扱う。

　前記所定量として式３に示すように、前記ペア基準テンプレート４０２の切り出し画像４０７の画素値に所定割合αを積算した値と、前記ペア一時テンプレート４０３の切り出し画像４０８の画素値に所定割合β（＝１－α）を積算した値を合算した画素値を、更新した基準テンプレート４１０の切り出し画像４０９の画素値とすることができる。

　ｆ’（ｉ、ｊ）は、更新した基準テンプレート４１０の位置（ｉ、ｊ）の画素値である。α＋β＝１とする。

　αとβは撮影する環境や追跡人物の挙動などに応じて設定すればよい。例えば、人物が近方に映りオクルージョンが発生しやすい環境では、α＝０．９、β＝０．１のように設定し、元の基準テンプレート４０２における人物の画素値情報を多めに残してオクルージョンが消滅した後も継続して追跡できるようにすることが考えられる。逆に、人物が遠方に映りオクルージョンが発生しづらいシーンでは、αの比率を下げてβの比率を上げてもよい。この他、追跡中の人物が上着やジャケットを一時的に着脱するようなシーンにおいては、αとβの比率がほぼ同程度に設定することも考えられる。ただし、以上は単なる例示でしかない。

　実際は各環境やシーンに合わせて各種パラメータ（基準テンプレート４０２と一時テンプレート４０３のサイズＷピクセル×Ｈピクセル、距離Ｌの閾値Ｒピクセル、類似度ＳＳＤの閾値Ｄ、基準テンプレート４０２を更新する際のαとβなど)を設定し、実際の挙動を確認したあとに、各パラメータを再調整することを繰り返すことで、物体追跡の性能を向上することが期待できる。パラメータの設定は人による設定の他コンピュータにより自動で設定してもよい。

＜作用・効果＞
　ペアテンプレートを用いて基準テンプレートを更新することで、最新の画像データによる基準テンプレート（α＝０、β＝１）に基づき対象人物を追跡する手法に比べ、過去の基準テンプレートにおける人物の画素値情報を加味することができ、オクルージョンや人物の一時的な動き、検出漏れなどで追跡人物の類似性が変化した場合でも、見失うことなく追跡精度を向上することが可能となる。

（余ったテンプレートを用いた更新）
　さらに物体追跡部２０３において、マッチング処理ステップ３０４でマッチングが成立せずに余ったテンプレートを用いて基準テンプレートを更新する処理について説明する（テンプレート更新処理ステップ３０５）。図７は、本実施形態においてマッチングが成立せず余ったテンプレートの処理を示す図である。

　図５で説明した余った基準テンプレート４０５はその後の組み合わせ抽出のステップに用いるために継続保持して基準テンプレートとして更新する。ただし、Ｔフレーム連続して余った場合は削除する。また、余った一時テンプレート４０６は、切り出し画像４０８と中心座標は保持されたままで新規の基準テンプレート４１１として置き換えて更新する。

＜作用・効果＞
　余ったテンプレートを用いて基準テンプレートを更新することで、ある追跡人物が１回目の撮像で検出され切り出し画像が基準テンプレートとなったものの、２回目に検出漏れまたはオクルージョンなどにより適切な切り出し画像が得られずマッチングもとれずに余ってしまった場合、そこで消去せず継続保持することで、仮に３回目の撮影で障害がなくなり再び適切な切り出し画像が得られたときにマッチングがとれて同一人物として追跡できるという効果がある。ただし、長期にわたり余る場合は、保持する意義も経時的に減少することから、Ｔフレーム連続して余った場合は削除する。
　例えば、人物が近方に映りオクルージョンが発生しやすい環境では、Ｔ＝１０フレームのように設定し、オクルージョンによって対象人物を途中で瞬間的に見失うことがあっても、継続してトラッキングすることができる。

　以上、本発明の実施の形態について説明したが、本発明は、上述した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本実施形態に係る画像処理システムの機能を発揮べくプログラミングされたＣＰＵとメモリを有するコンピュータにより動作する物体検出装置や物体追跡装置を備えた画像処理装置として把握することができる。

　また、例えば本実施形態に係る画像処理システムの機能をコンピュータにより実行させるためのプログラムとして把握することもできる。その場合は以下のような内容の発明になる。
「１．映像取得部と、データ通信部と、記録制御部との間でデータの送受信を行うコンピュータに、
　映像取得部から画像データを入力する画像入力処理と、
　前記画像データに対して、事前に機械学習により作成した学習モデルを用いて追跡対象の物体を検出し、画像中の位置を出力する物体検出処理と、
　前記画像データから、検出物体をある一定サイズ（Ｗ×Ｈ）にリサイズした切り出し画像と中心座標をセットとした基準テンプレートまたは一時テンプレートを作成するテンプレート作成処理と、
　所定条件でマッチングが成立する１対１のペア基準テンプレートとペア一時テンプレートからなるペアテンプレートを抽出するマッチング処理と、
　前記ペア基準テンプレートの切り出し画像の画素値と前記ペア一時テンプレートの切り出し画像の画素値を所定量加味した画素値を有する切り出し画像と前記ペア一時テンプレートの中心座標をセットとしたテンプレートを作成して基準テンプレートを更新し、さらに前記マチングが成立せずに余った基準テンプレートと一時テンプレートを保持して基準テンプレートとして更新するテンプレート更新ステップ処理と、
　を実行させるためのプログラム。」
「２．前記所定条件が、
　マッチングをとる基準テンプレートと一時テンプレートの中心座標間の距離Ｌピクセルが所定閾値以下であり、かつ切り出し画像間のＳＳＤが閾値以下の最小値である、
　ことを特徴とする、１に記載のプログラム。」
「３．前記所定量が、
　前記ペア基準テンプレートの切り出し画像の画素値に所定割合α積算した値と、前記ペア一時テンプレートの切り出し画像の画素値に所定割合β（＝１－α）を積算した値を合算した画素値であること、
　を特徴とする、２に記載のプログラム。」
「４．前記マチングが成立せずに余った基準テンプレートにおいて、所定のフレーム連続して余った場合は削除すること、
　を特徴とする１～３のいずれか一つに記載のプログラム。」

１０１…撮像装置、１０２…映像取得部、１０３…画像処理部、１０４…データ通信部、１０５…記録制御部、１０６…表示制御部、１０７…発報装置、１０８…表示出力装置、１０９…記録装置、２０１…物体検出部、２０２…学習モデル、２０３…物体追跡部、３０１…画像入力ステップ、３０２…物体検出ステップ、３０３…テンプレート作成ステップ、３０４…マッチングステップ、３０５…テンプレート更新ステップ、４０１…画像データ、４０２・４０５・４１０・４１１…基準テンプレート、４０３・４０６…一時テンプレート、４０４…ペアテンプレート、４０７・４０８・４０９…切り出し画像

Claims

　画像処理システムであって、
　映像取得部で取得した画像データに対して、事前に機械学習により作成した学習モデルを用いて追跡対象の物体を検出し、画像中の位置を出力する物体検出部と、
　検出物体を複数フレーム間に渡って追跡を行う物体追跡部を備え、
　前記物体追跡部は、
　所定フレーム目の画像データから、検出物体をある一定サイズ（Ｗ×Ｈ）にリサイズした切り出し画像と中心座標をセットとした基準テンプレートを作成するとともに、次のフレームの画像データから、検出物体をある一定サイズ（Ｗ×Ｈ）にリサイズした切り出し画像と中心座標をセットとした一時テンプレートを作成し、かつ
　所定条件でマッチングが成立する１対１のペア基準テンプレートとペア一時テンプレートからなるペアテンプレートを抽出し、かつ
　前記ペア基準テンプレートの切り出し画像の画素値と前記ペア一時テンプレートの切り出し画像の画素値を所定量加味した画素値を有する切り出し画像と前記ペア一時テンプレートの中心座標をセットとしたテンプレートを作成して基準テンプレートを更新し、さらに前記マッチングが成立せずに余った基準テンプレートと一時テンプレートを保持して基準テンプレートとして更新する、
　ことを特徴とする画像処理システム。
　前記所定条件が、
　マッチングをとる基準テンプレートと一時テンプレートの中心座標間の距離Ｌピクセルが所定閾値以下であり、かつ切り出し画像間のＳＳＤが閾値以下の最小値である、
　ことを特徴とする、請求項１に記載の画像処理システム。
　前記所定量が、
　前記ペア基準テンプレートの切り出し画像の画素値に所定割合α積算した値と、前記ペア一時テンプレートの切り出し画像の画素値に所定割合β（＝１－α）を積算した値を合算した画素値であること、
　を特徴とする、請求項２に記載の画像処理システム。
　前記マッチングが成立せずに余った基準テンプレートにおいて、所定のフレーム連続して余った場合は削除すること、
　を特徴とする、請求項１～３のいずれか一つに記載の画像処理システム。
　　コンピュータにより動作する画像処理装置であって、
　映像取得部で取得した画像データに対して、事前に機械学習により作成した学習モデルを用いて検出物体を特定する物体検出装置と、
　検出物体を複数フレーム間に渡って追跡を行う物体追跡装置を備え、
　前記物体追跡装置は、
　所定フレーム目の画像データから、検出物体をある一定サイズ（Ｗ×Ｈ）にリサイズした切り出し画像と中心座標をセットとした基準テンプレートを作成するとともに、次のフレームの画像データから、検出物体をある一定サイズ（Ｗ×Ｈ）にリサイズした切り出し画像と中心座標をセットとした一時テンプレートを作成し、かつ
　所定条件でマッチングが成立する１対１のペア基準テンプレートとペア一時テンプレートからなるペアテンプレートを抽出し、かつ
　前記ペア基準テンプレートの切り出し画像の画素値と前記ペア一時テンプレートの切り出し画像の画素値を所定量加味した画素値を有する切り出し画像と前記ペア一時テンプレートの中心座標をセットとしたテンプレートを作成して基準テンプレートを更新し、さらに前記マチングが成立せずに余った基準テンプレートと一時テンプレートを保持して基準テンプレートとして更新する、
　ことを特徴とする画像処理装置。
　前記所定条件が、
　マッチングをとる基準テンプレートと一時テンプレートの中心座標間の距離Ｌピクセルが所定閾値以下であり、かつ切り出し画像間のＳＳＤが閾値以下の最小値である、
　ことを特徴とする、請求項５に記載の画像処理装置。
　前記所定量が、
　前記ペア基準テンプレートの切り出し画像の画素値に所定割合α積算した値と、前記ペア一時テンプレートの切り出し画像の画素値に所定割合β（＝１－α）を積算した値を合算した画素値であること、
　を特徴とする、請求項６に記載の画像処理装置。
　前記マッチングが成立せずに余った基準テンプレートにおいて、所定のフレーム連続して余った場合は削除すること、
　を特徴とする、請求項５～７のいずれか一つに記載の画像処理装置。
　画像処理方法であって、
　映像取得部から画像データを入力する画像入力ステップと、
　前記画像データに対して、事前に機械学習により作成した学習モデルを用いて追跡対象の物体を検出し、画像中の位置を出力する物体検出ステップと、
　前記画像データから、検出物体をある一定サイズ（Ｗ×Ｈ）にリサイズした切り出し画像と中心座標をセットとした基準テンプレートまたは一時テンプレートを作成するテンプレート作成ステップと、
　所定条件でマッチングが成立する１対１のペア基準テンプレートとペア一時テンプレートからなるペアテンプレートを抽出するマッチング処理ステップと、
　前記ペア基準テンプレートの切り出し画像の画素値と前記ペア一時テンプレートの切り出し画像の画素値を所定量加味した画素値を有する切り出し画像と前記ペア一時テンプレートの中心座標をセットとしたテンプレートを作成して基準テンプレートを更新し、さらに前記マッチングが成立せずに余った基準テンプレートと一時テンプレートを保持して基準テンプレートとして更新するテンプレート更新ステップと、
　を有することを特徴とする画像処理方法。
　前記所定条件が、
　マッチングをとる基準テンプレートと一時テンプレートの中心座標間の距離Ｌピクセルが所定閾値以下であり、かつ切り出し画像間のＳＳＤが閾値以下の最小値である、
　ことを特徴とする、請求項９に記載の画像処理方法。
　前記所定量が、
　前記ペア基準テンプレートの切り出し画像の画素値に所定割合α積算した値と、前記ペア一時テンプレートの切り出し画像の画素値に所定割合β（＝１－α）を積算した値を合算した画素値であること、
　を特徴とする、請求項１０に記載の画像処理方法。
　前記マッチングが成立せずに余った基準テンプレートにおいて、所定のフレーム連続して余った場合は削除すること、
　を特徴とする、請求項９～１１のいずれか一つに記載の画像処理方法。