JPWO2018128138A1 - 画像処理装置、映像監視システム、画像処理方法およびプログラム - Google Patents

画像処理装置、映像監視システム、画像処理方法およびプログラム Download PDF

Info

Publication number
JPWO2018128138A1
JPWO2018128138A1 JP2018560382A JP2018560382A JPWO2018128138A1 JP WO2018128138 A1 JPWO2018128138 A1 JP WO2018128138A1 JP 2018560382 A JP2018560382 A JP 2018560382A JP 2018560382 A JP2018560382 A JP 2018560382A JP WO2018128138 A1 JPWO2018128138 A1 JP WO2018128138A1
Authority
JP
Japan
Prior art keywords
subject
data
appearance
disappearance
validity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018560382A
Other languages
English (en)
Inventor
洋介 岩松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2018128138A1 publication Critical patent/JPWO2018128138A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/97Determining parameters from multiple pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)

Abstract

処理負荷を低減しながら、追跡の分断によって生じるデータ量の増加を抑制できる技術を提供する。画像処理装置は、入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出部と、検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、被写体出現データの出現妥当性と被写体消失データの消失妥当性とを算出する算出部と、算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、検出された被写体出現データと被写体消失データとの組合せを取得する取得部と、を備える。

Description

本開示は、画像処理装置、映像監視システム、画像処理方法等に関する。
近年、情報処理技術の発達に伴い、映像データや画像データの解析を行う解析エンジンの開発が行われている。例えば、映像データや画像データから人物の顔を検出する顔検出エンジン、顔の特徴データを抽出する顔特徴抽出エンジン、顔の特徴データを照合し人物を特定する顔照合エンジンが開発されている。
そして、複数の解析エンジンを組合せて、映像データから様々な解析結果を得ることができる解析システムが開発されている。例えば、カメラから入力した映像データに対して、顔検出エンジン、顔特徴抽出エンジン、顔照合エンジンを用いて直列に処理することで、映像データ中の人物の顔のID(IDentifier)を識別し表示する、といった解析処理を行う解析システムが開発されている。
このような解析システムの構成として、カメラなどの映像入力装置の近くに配置した処理装置で一次処理を行い、中間の解析結果データをクラウド上などの遠隔の処理装置に転送し、遠隔の処理装置で続く処理を行った上で結果を表示するなど、分散型の構成がしばしば用いられる。例えば、カメラの近くに配置した処理装置で人物の顔を検出し、クラウド上の処理装置で顔の特徴データの抽出、照合を行い、特定した人物の情報を表示する、といった解析システムの構成が考えられている。
このような構成においては、処理装置間のネットワークの負荷を低減するため、中間の解析結果データの転送量が、一定の水準以下であることが望まれる。そのため、中間の解析結果データから、重複あるいは類似するデータを削除し、撮影条件などが良いと判定されたデータのみを抽出した上で、解析に有効なデータを転送する処理(以降、有効データ抽出処理と呼ぶ)が行われている。
有効データ抽出処理の方法として、映像データ中の人物などの被写体を追跡することで、フレーム間で同一の被写体を識別し、同一の被写体の中から撮影条件などのよいものを抽出する方法が考えられる。このような被写体の追跡を行う技術の一例が、特許文献1および特許文献2に記載されている。
特許文献1は、映像データ中の被写体を追跡する方法の一例を開示する。特許文献1に記載の技術では、物体を含む取得された画像を用いて物体についての学習を行う第1の識別器によって、物体識別対象の各画像における物体の領域を識別して物体を追跡し、識別された物体の領域に隠蔽の発生を判定する。ここで、隠蔽とは、認識対象とする被写体が、他の被写体や障害物等により隠された状態をいう。そして、隠蔽が発生したと判定された場合、物体の領域における隠蔽されていない領域を用いて物体についての学習を行う第2の識別器によって物体識別対象の各画像における当該物体に係る部分を識別して物体を追跡する。
また、特許文献2は、映像データ中の被写体を追跡する方法の一例を開示する。特許文献2に記載の方法では、画像中の物体を検出し、検出した物体をテンプレート画像として登録する。そして、現在の入力画像と、夫々異なる時刻の過去の入力画像に基づいて登録された同一物体に対する複数のテンプレート画像とのマッチング処理を行い、入力画像のうち、一致度が最も高い位置、あるいは、一致度が所定の値以上となる位置を現在の物体位置とする。特許文献2に記載の方法では、更に、当該位置の画像を新たなテンプレート画像とすることにより、被写体を追跡する。
特開2016−126624号公報 特許第3768073号公報
上述の特許文献1に記載の追跡方法では、被写体の一部領域が隠蔽されていないことが必要である。しかし、現実の映像データにおいては被写体が全て隠蔽される場合もしばしば発生し、そのような場合においては、追跡を継続できない。そのため、特許文献1に記載の追跡方法を用いて有効データ抽出処理を行う場合、同一の被写体が複数の異なる被写体であると認識されることから、抽出する被写体のデータが増加してしまう。
一方、上述の特許文献2に記載の追跡方法では、被写体が一時的に隠蔽された場合でも、追跡を継続することができるが、複数の照合処理を実行することになる。つまり、隠蔽により、追跡が途切れた物体に対して、追跡が途切れる前と途切れた後で、全ての組合せをマッチングすることになる。したがって、特許文献2に記載の技術では、処理負荷が大きくなる。そのため、カメラからの映像データを即座に処理し解析結果を表示するといった、リアルタイム処理が困難である。従って、特許文献2に記載の追跡方法を用いて有効データ抽出処理を行う場合、処理負荷が大きくなってしまう。
すなわち、上述した特許文献1および2に記載の技術では、処理負荷を低減しながら、隠蔽などによる追跡の分断によって生じるデータ量の増加を抑制することが難しい。
本開示は上記課題に鑑みてなされたものであり、その目的は、処理負荷を低減しながら、追跡の分断によって生じるデータ量の増加を抑制できる技術を提供することにある。
本開示の一態様に係る画像処理装置は、入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出手段と、前記検出手段により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出手段と、前記算出手段により算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得手段と、を備える。
また、本開示の一態様に係る映像監視システムは、複数の被写体を撮影した映像データから前記被写体を検出する被写体検出手段と、前記検出された被写体を追跡し、該被写体の位置を含む追跡結果を被写体データとして出力する被写体追跡手段と、前記被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出手段と、前記検出手段により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出手段と、前記算出手段により算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得手段と、前記取得手段が取得した組合せに含まれる被写体同士を照合する照合手段と、前記照合手段による照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する被写体選択手段と、を備える。
また、本開示の一態様に係る画像処理方法は、入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出し、前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出し、前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、前記検出された被写体出現データと被写体消失データとの組合せを取得する。
なお、上記各装置または方法を、コンピュータによって実現するコンピュータプログラム、およびそのコンピュータプログラムが格納されている、コンピュータ読み取り可能な非一時的記録媒体も、本発明の範疇に含まれる。
本開示によれば、処理負荷を低減しながら、追跡の分断によって生じるデータ量の増加を抑制できる。
第1の実施の形態に係る画像処理装置の機能構成の一例を示す機能ブロック図である。 第1の実施の形態に係る画像処理装置の処理の流れの一例を示すフローチャートである。 第2の実施の形態に係る映像監視システムの構成の一例を示すブロック図である。 被写体検出結果の一例を示す図である。 被写体追跡結果の一例を示す図である。 第2の実施の形態における被写体再追跡部の構成の一例を示すブロック図である。 被写体検出データの一例を示す図である。 出現位置分布の一例を示す図である。 消失位置分布の一例を示す図である。 妥当性算出結果の一例を示す図である。 組合せ結果の一例を示す図である。 負荷条件情報の一例を示す図である。 被写体再追跡結果の一例を示す図である。 第2の実施の形態に係る映像監視システムの処理の流れの一例を示すフローチャートである。 第2の実施の形態における被写体再追跡処理の流れの一例を示すフローチャートである。 検出処理の流れの一例を示すフローチャートである。 算出処理の流れの一例を示すフローチャートである。 取得処理の流れの一例を示すフローチャートである。 被写体データ選択処理の流れの一例を示すフローチャートである。 第2の実施の形態に係る映像監視システムの具体的な適用例の構成の一例を示す図である。 被写体再追跡プログラムの構成を示すブロック図である。 映像監視システムの構成の他の一例を示す図である。 被写体検出結果の一例を示す図である。 被写体検出データの一例を示す図である。 第3の実施の形態における出現位置分布の一例を示す図である。 第3の実施の形態における消失位置分布の一例を示す図である。 妥当性算出結果の一例を示す図である。 本開示の各実施の形態を実現可能なコンピュータ(情報処理装置)のハードウェア構成を例示的に説明する図である。
<第1の実施の形態>
本開示の第1の実施の形態について、図面を参照して説明する。図1は、本実施の形態に係る画像処理装置10の機能構成の一例を示す機能ブロック図である。図1に示す通り、本実施の形態に係る画像処理装置10は、検出部11と、算出部12と、取得部13とを備える。
検出部11は、画像処理装置10に入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する。画像処理装置10に入力される被写体データは、例えば、撮像装置等によって撮像された複数のフレームを含む映像データから特定された、各フレームにおける被写体ごとの位置を表す情報を含む。あるフレーム(第1フレームと呼ぶ)に2つの被写体が含まれる場合、被写体データは、2つの被写体の夫々の、第1フレームにおける位置を表す情報を含む。第1フレームの次のフレームである第2フレームに、第1フレームに含まれる2つの被写体と同じ被写体が含まれる場合、被写体データは、第1フレームの被写体と同じ被写体であることを示す情報と、この被写体の第2フレームにおける位置を示す情報とを含む。
映像データを取得する撮像装置の画角内にある被写体が入ると、映像データにこの被写体が含まれる(出現する)。検出部11は、この映像データから特定された被写体の位置を含む被写体データから、この被写体が時間軸上において最初に含まれる(出現する)フレームにおける位置を表す情報を含む被写体出現データを検出する。また、映像データを取得する撮像装置の画角内に居るある被写体が、画角外に移動すると、映像データにこの被写体が含まれなくなる(被写体が映像データから消失する)。検出部11は、この映像データから特定された被写体の位置を含む被写体データから、この被写体が消失する直前のフレームにおける該被写体の位置を表す情報を含む被写体消失データを検出する。つまり、検出部11は、この被写体が時間軸上において最後に含まれるフレームにおける位置を表す情報を含む被写体消失データを検出する。
算出部12は、検出部11によって検出された被写体出現データおよび被写体消失データと、予め学習された被写体の出現位置分布および消失位置分布とに基づき、被写体出現データの出現妥当性と被写体消失データの消失妥当性とを算出する。出現位置分布は、出現した被写体の人数の総数を、フレーム上の位置毎に算出したデータであり、過去の被写体データを用いた学習によって得られたデータである。同様に、消失位置分布は、消失した被写体が消失する直前に存在した位置における人数の総数を、フレーム上の位置毎に算出したデータであり、過去の被写体データを用いた学習によって得られたデータである。算出部12は、このような被写体の出現位置分布および消失位置分布と、被写体出現データおよび被写体消失データとに基づいて、被写体出現データの出現妥当性および被写体消失データの消失妥当性を算出する。
出現妥当性は、被写体が映像中に初めて出現したときのフレーム上の位置が、過去の分布から離れている度合いを表す。出現妥当性および消失妥当性は、例えば、0から1までの数値で表現される。出現妥当性の値が1に近い場合、被写体出現データに含まれる位置において関連する被写体が出現した被写体である妥当性が低いことを示す。出現妥当性の値が1に近い場合、出現する被写体と検出された被写体が、出現する被写体ではなく、隠蔽などにより追跡が分断された被写体である可能性が高いことを示す。
消失妥当性は、被写体が映像から消失する直前のフレーム上の位置が、過去の分布から離れている度合いを表す。消失妥当性の値が1に近い場合、関連する位置において関連する被写体が最後に含まれた妥当性、つまり、被写体消失データに含まれる位置を最後に、被写体が消失した妥当性が低いことを示す。消失妥当性の値が1に近い場合、消失する被写体と検出された被写体が、消失する被写体ではなく追跡が分断された被写体である可能性が高いことを示す。算出部12は、算出した出現妥当性および消失妥当性を夫々関連する被写体出現データおよび被写体消失データと共に、取得部13に出力する。
取得部13は、算出部12より算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、検出部11により検出された被写体出現データと被写体消失データとの組合せを取得する。所定の条件とは、例えば、組合せの個数が所定の閾値以下の組合せである。これにより、取得部13は、被写体出現データと被写体消失データとの夫々に含まれる被写体が、同じ被写体である可能性があるデータを、追跡対象として照合を行うデータとして、取得することができる。 図2は、本実施の形態に係る画像処理装置10の処理の流れの一例を示すフローチャートである。図2に示す通り、検出部11が被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する(ステップS21)。
そして、算出部12が検出部11により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、被写体出現データの出現妥当性と被写体消失データの消失妥当性とを算出する(ステップS22)。
その後、取得部13が、算出部12より算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす検出部11により検出された被写体出現データと被写体消失データとの組合せを取得する(ステップS23)。
以上のように、本実施の形態に係る画像処理装置10は、学習によって得られた被写体の過去の出現位置分布および消失位置分布と、検出部11が検出した被写体出現データおよび被写体消失データとを用いて、被写体出現データの出現妥当性および被写体消失データの消失妥当性を算出する。被写体出現データの出現妥当性は、被写体出現データに含まれる被写体が出現する被写体であることの妥当性を示すものであり、被写体消失データに含まれる被写体が消失する被写体であることの妥当性を示すものである。取得部13はこれらの出現妥当性および消失妥当性に基づいて、所定の条件を満たす被写体出現データと被写体消失データとの組合せを取得する。
これにより、画像処理装置10は、追跡の分断が生じたことにより、消失する被写体および出現する被写体と判定された被写体同士を、再び同一の被写体である可能性が高い被写体として扱うことができる。これにより、画像処理装置10は、追跡の分断によって生じるデータ量の増加を抑制することができる。
また、画像処理装置10は、被写体出現データと被写体消失データとの組合せのうち、所定の条件を満たす組合せを取得する。所定の条件は、例えば、組合せの数が、所定の閾値以下であることである。これにより、画像処理装置10は、追跡を行う際に、取得された組合せの被写体消失データに含まれる被写体と、該組合せの被写体出現データに含まれる被写体との間で行う照合処理を、所定の閾値以下に制御することができる。これにより、画像処理装置10は、照合処理にかかる負荷を制限することができる。
したがって、本実施の形態に係る画像処理装置10によれば、映像データのうち、例えば、映像の解析に有効なデータを抽出する処理の処理負荷を低減しながら、追跡の分断によって生じる有効なデータのデータ量の増加を抑制することができる。
<第2の実施の形態>
次に、上述した第1の実施の形態を基本とする、本開示の第2の実施の形態について、図面を参照して説明する。図3は、本実施の形態に係る映像監視システム100の構成の一例を示すブロック図である。映像監視システム100は、図3に示す通り、映像配信装置101と、有効データ抽出装置201と、表示装置301とを含む。
映像配信装置101は、映像データを有効データ抽出装置201に配信する。映像配信装置101は、被写体を撮影する、例えば、ビデオカメラや監視カメラ、ネットワークカメラ、インテリジェントカメラ等の撮影装置(撮影部)で実現される。映像配信装置101は、撮影した映像データを、有効データ抽出装置201に配信する。なお、映像配信装置101は、映像データと共に、映像データの撮影時の条件(明るさなど)を表す情報や、カメラの向きや設定などを示すカメラパラメータを有効データ抽出装置201に供給してもよい。
有効データ抽出装置201は、映像配信装置101から受信した映像データに対する解析処理および有効データ抽出処理を行う。また、表示装置301は、有効データ抽出装置201における解析結果を表示部に表示する。表示装置301は、例えば、液晶ディスプレイ等によって実現される。
有効データ抽出装置201は、解析部210と、有効データ抽出部220とを備える。解析部210は、映像配信装置101からの映像データを用いて解析処理を行う。解析部210は、図3に示す通り、被写体検出部211と、被写体追跡部212とを備える。また、有効データ抽出部220は、解析部210から出力された解析結果を用いて有効データ抽出処理を行う。有効データ抽出部220は、被写体再追跡部213と、被写体選択部214とを備える。
被写体検出部211は、映像データに含まれる被写体を検出する。被写体検出部211は、映像配信装置101から配信された映像データを受信する。被写体検出部211は、受信した映像データをフレームに分割し、フレーム毎に、1つまたは複数の被写体を検出する。被写体検出部211は、フレームに被写体が含まれる場合、検出した被写体の該フレーム上における領域を被写体領域として該フレームから抽出する。本実施の形態では、被写体検出部211は、被写体領域の中心座標を、被写体領域を表す情報とするが、中心座標ではなく、例えば、被写体領域の左上の座標であってもよいし、その他の位置を表す座標であってもよい。なお、被写体領域は、フレームにおける被写体の位置を表しているため、被写体の位置とも呼ぶ。
被写体検出部211は、検出した被写体の夫々に対し、該被写体を一意に識別する被写体番号を付与する。そして、被写体検出部211は、被写体番号および被写体領域を表す情報を含む被写体検出結果を出力する。
被写体検出部211が出力する被写体検出結果の一例を図4に示す。図4は、被写体検出結果40の一例を示す図である。図4に示す通り、被写体検出結果40は、フレーム番号41と、フレーム時刻42と、被写体番号43と、被写体領域44と、被写体品質スコア45とを含む。なお、被写体検出結果40は、図4に示す情報以外の情報を含んでもよい。
フレーム番号41は、被写体が検出されたフレームを識別する識別子である。フレーム時刻42は、フレームが撮影された時刻を示す。被写体番号43は、上述した通り、被写体を識別する番号である。被写体領域44は、検出された被写体のフレーム上における領域を表すものであり、上述した通り、図4では中心座標で表現される。
被写体品質スコア45は、フレームにおける被写体の画質などの品質を表す。被写体検出部211は、映像配信装置101から受け取った映像データの撮影時の条件を表す情報や、カメラパラメータに基づいて、被写体毎に被写体品質スコア45を算出する。被写体品質スコア45は、例えば、撮影時の条件を表現する値であってもよいし、撮影時の条件から算出された値であってもよい。撮影時の条件とは、例えば、撮影時の明るさ、被写体との距離、時刻等、品質に関連する条件であればどのような条件であってもよい。また、被写体品質スコア45の算出方法は特に限定されず、どのような方法を採用してもよい。
図4に示す通り、フレーム番号が「101」のフレームは、被写体番号が「101−1」の被写体と「101−2」の被写体とが含まれる。被写体番号が「101−1」の被写体のフレーム上の領域は、中心座標が(450、40)の被写体領域である。被写体番号が「101−2」の被写体のフレーム上の被写体領域は、中心座標が(520、40)の領域である。これらの被写体の被写体品質スコアは、共に「0.5」である。
このように、被写体検出部211は、映像データの各フレームから被写体を検出し、検出した被写体に関連する、映像データから抽出した情報を、被写体検出結果40として出力する。
被写体追跡部212は、各フレームに含まれる被写体同士が、同一の被写体か否かを判定することにより、被写体を追跡する。被写体追跡部212は、被写体検出部211から被写体検出結果40を受信する。被写体追跡部212は、被写体検出結果40に含まれる被写体領域44等を参照し、フレームに含まれる被写体が、フレーム間で同一であるか否かを判定する。被写体追跡部212は、例えば、図4に示す被写体検出結果40に含まれるフレーム番号が「101」のフレームに含まれる被写体番号が「101−1」の被写体が、フレーム番号が「102」のフレームに含まれる被写体番号が「102−1」の被写体と同一か否かを判定する。ここで、フレーム間において被写体が同一か否かを判定する方法は、どのような方法を採用してもよい。例えば、中心座標の差が所定の閾値より小さいか否かを判定することにより、フレーム間において被写体が同一か否かを判定してもよい。被写体追跡部212は、フレーム間において同一の被写体であると判定した被写体に対して同じ被写体であることを示す識別子(追跡番号と呼ぶ)を割り当てる。そして、被写体追跡部212は、割り当てた追跡番号を、被写体検出結果40の各レコードに関連付ける。被写体検出結果40の各レコードには、被写体番号43が含まれる。被写体追跡部212は、追跡番号を関連付けた被写体検出結果40を、被写体追跡結果50として出力する。
被写体追跡部212が出力する被写体追跡結果50の一例を図5に示す。図5は、被写体追跡結果50の一例を示す図である。図5に示す通り、被写体追跡結果50は、フレーム番号41と、フレーム時刻42と、被写体番号43と、被写体領域44と、被写体品質スコア45と、追跡番号56とを含む。なお、被写体追跡結果50は、図5に示す情報以外の情報を含んでもよい。
被写体追跡部212によって、被写体番号が「101−1」の被写体と、被写体番号が「102−1」の被写体とが同一の被写体であると判定されると、被写体番号が「101−1」のレコードと被写体番号が「102−1」のレコードとに同じ追跡番号が関連付けられる。図5に示す通り、追跡番号「1」が、被写体番号が「101−1」のレコードと被写体番号が「102−1」のレコードとに関連付けられる。これにより、フレーム番号が「101」のフレームに含まれる被写体が、フレーム番号が「102」のフレームにも含まれることがわかるため、該被写体を追跡することができる。
被写体追跡部212は、被写体追跡結果50を被写体再追跡部213に出力する。なお、本実施の形態では、被写体追跡結果50の各レコードを被写体データとも呼ぶ。被写体データは、被写体追跡結果50の各レコードそのものであってもよい。被写体データは、複数の被写体の夫々の位置を含めばよく、被写体追跡結果50の各レコードのうち被写体領域44と追跡番号56とを含んでいればよい。本実施の形態では、被写体データが被写体追跡結果50に含まれる各レコードであるとして説明を行う。
被写体再追跡部213は、上述した第1の実施の形態に係る画像処理装置10の一例である。言い換えれば、有効データ抽出装置201は、上述した画像処理装置10を被写体再追跡部213として含む。被写体再追跡部213は、被写体追跡部212からの被写体追跡結果を受信し、追跡が分断された可能性の度合いを算出する。そして、被写体再追跡部213は、追跡が分断された可能性が高い被写体同士を照合し、同一の被写体であるか否かを再び判定する。そして、被写体再追跡部213は、照合を行った結果である被写体再追跡結果を出力する。
図6は、本実施の形態における被写体再追跡部213の構成の一例を示すブロック図である。図6に示す通り、被写体再追跡部213は、検出部2131と、算出部2132と、取得部2133と、記憶部2134と、照合部2138とを含む。なお、記憶部2134は、被写体再追跡部213の外部に含まれてもよい。
検出部2131は、上述した検出部11の一例である。検出部2131は、被写体再追跡部213に入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する。
映像データを取得する映像配信装置101の画角内にある被写体が入ると、映像データにこの被写体が含まれる(出現する)。検出部2131は、被写体追跡結果50を参照して、被写体追跡結果50に含まれるレコード(被写体データ)の夫々に対し、フレームに含まれる被写体が、新たに映像データに出現する被写体か否かを判定する。検出部2131は、例えば、過去に処理したフレームの追跡番号56を記憶しておき、被写体追跡結果50の判定対象のレコードに含まれる追跡番号56が過去の追跡番号56の何れかと一致するか否かを確認する。判定対象のレコードに含まれる追跡番号56が過去の追跡番号56と一致しない場合、検出部2131は、この判定対象のレコードに関連する被写体が、映像データに新たに出現する被写体であると判定する。一方、判定対象のレコードに含まれる追跡番号56が過去の追跡番号56と一致する場合、検出部2131は、この判定対象のレコードに関連する被写体が、映像データに新たに出現する被写体ではないと判定する。
検出部2131は、このようにして、複数の被写体データから被写体が時間軸上において最初に含まれる(出現する)フレームにおける位置を表す情報を含む被写体出現データを検出する。例えば、検出部2131は、被写体追跡結果50の各レコードのうち、被写体出現データと検出したデータを表すフラグ(出現フラグ)を付してもよい。これにより、値が「1」の出現フラグが付与されたレコードは、被写体出現データであること、つまり、このレコードに関連する被写体が出現する被写体であることを示す。一方、値が「0」の出現フラグが付与された、または、出現フラグが付与されていないレコードは、被写体出現データではないこと、つまり、このレコードに関連する被写体が新たに出現する被写体ではないことを示す。以降、新たに映像データに出現する被写体を、単に「出現する被写体」と呼ぶ。
また、映像データを取得する映像配信装置101の画角内に居る、ある被写体が、画角外に移動すると、映像データにこの被写体が含まれなくなる(被写体が映像データから消失する)。検出部2131は、被写体追跡結果50を参照して、被写体追跡結果50に含まれるレコードの夫々に対し、判定対象のレコードに含まれる追跡番号56が、該レコードに関連するフレームより時間軸上において後のフレームに関連するレコードに含まれる追跡番号56の何れかと一致するか否かを確認する。判定対象のレコードに含まれる追跡番号56が該レコードに関連するフレームより時間軸上において後のフレームに関連するレコードに含まれる追跡番号56の何れかと一致する場合、検出部2131は、この判定対象のレコードに関連する被写体は消失していないと判定する。一方、判定対象のレコードに含まれる追跡番号56が該レコードに関連するフレームより時間軸上において後のフレームに関連するレコードに含まれる追跡番号56の何れとも一致しない場合、検出部2131は、この判定対象のレコードに関連する被写体は消失すると判定する。
検出部2131は、このようにして、複数の被写体データから、被写体が時間軸上において最後に含まれる(以降のフレームにおいて被写体が消失する)フレームにおける位置を表す情報を含む被写体消失データを検出する。例えば、検出部2131は、被写体追跡結果50の各レコードのうち、被写体消失データと検出したデータを表すフラグ(消失フラグ)を付してもよい。これにより、値が「1」の消失フラグが付与されたレコードは、被写体消失データであること、つまり、このレコードに関連する被写体が以降のフレームにおいて消失する被写体であることを示す。一方、値が「0」の消失フラグが付与された、または、消失フラグが付与されていないレコードは、被写体消失データではないこと、つまり、このレコードに関連する被写体が消失する被写体ではないことを示す。以降、あるレコードに関連する被写体が該レコード以降のフレームにおいて消失する場合、このあるフレームに含まれる被写体を「消失する被写体」と呼ぶ。
検出部2131は、検出した被写体出現データおよび被写体消失データを含む被写体検出データ70を出力する。図7は、被写体検出データ70の一例を示す図である。被写体検出データ70は、被写体追跡結果50の各レコードに対し、関連する被写体が出現する被写体か否かを表す出現フラグ71と、関連する被写体が以降のフレームにおいて消失する被写体か否かを表す消失フラグ72とが関連付けられている。
図7に示す通り、例えば、被写体番号が「101−1」の被写体は、出現フラグが「1」であるため、出現する被写体である。また、被写体番号が「102−1」の被写体は、被写体番号が「101−1」の被写体と同じ追跡番号を有しているため、被写体番号が「101−1」の被写体と同じ被写体である。そして、この被写体番号が「102−1」の被写体は、消失フラグが「1」であるため、フレーム番号が「102」より時間的に後のフレームにおいて消失する被写体である。
検出部2131は、このような被写体検出データ70を算出部2132に出力する。なお、出現フラグ71および消失フラグ72は、「0」および「1」以外で表現してもよい。出現フラグ71は、関連する被写体が出現する被写体であるか否かを表すものであればよい。また、消失フラグ72は、関連する被写体が消失する被写体か否かを表すものであればよい。
なお、図7に示す被写体検出データ70の各レコードは、出現フラグ71および消失フラグ72の何れか一方のみが「1」となっているが、両方が「0」であってもよいし、両方が「1」であってもよい。出現フラグ71および消失フラグ72の両方が「0」の被写体は、該被写体を含むフレームより時間的に前のフレームと、後のフレームとの両方に含まれる被写体である。また、出現フラグ71および消失フラグ72の両方が「1」の被写体は、出現する被写体であり、且つ、消失する被写体であることを表す。
算出部2132は、上述した算出部12の一例である。算出部2132は、検出部2131によって検出された被写体出現データおよび被写体消失データと、予め学習された被写体の出現位置分布2135および消失位置分布2136とに基づき、被写体出現データの出現妥当性と被写体消失データの消失妥当性とを算出する。
予め学習された被写体の出現位置分布2135および消失位置分布2136は、図6に示す通り、記憶部2134に格納されている。なお、出現位置分布2135および消失位置分布2136は夫々異なる記憶部2134に格納されてもよい。
ここで、出現位置分布2135および消失位置分布2136について夫々図8および図9を参照して説明する。出現位置分布2135は、被写体が映像データに新たに出現するフレームにおける、被写体の位置の分布を表す。出現位置分布2135は、出現する被写体の人数の総数を、フレーム上の位置毎に算出したデータであり、過去の被写体データを用いた学習によって得られたデータである。図8に示す通り、出現位置分布2135は、領域番号81と、x座標範囲82と、y座標範囲83と、出現回数84と、総出現回数85とを含む。なお、図8は、出現位置分布2135の一例であり、出現位置分布2135が図8に示す情報以外の情報を含んでもよい。
図8の例では、1フレームの画像が640×480ピクセルであるとする。この画像の左上の点を原点、横方向をx軸、縦方向をy軸とする。出現位置分布2135は、80×80ピクセルのメッシュでこの画像の領域を分割した場合における、領域毎の出現回数および総出現回数を、過去の被写体データを用いた学習を行うことによって、記録したものである。
領域番号81は、分割された領域を識別するものである。図8の例では、領域番号81は、分割された領域の左上から右方向に、1から順に割り振られた番号であるとするが、領域番号81は、分割された領域の夫々を識別できるものであればよい。x座標範囲82およびy座標範囲83は、夫々、領域番号81で識別される領域のx座標の範囲およびy座標の範囲を示す。出現回数84は、被写体が関連する領域において出現した回数である。総出現回数85は、出現回数84の合計数である。図8に示す通り、本実施の形態では、領域番号が「6」の領域で被写体が出現した回数が40回であり、領域番号が「7」の領域で被写体が出現した回数が50回であることを示している。また、領域番号が「21」の領域で被写体が出現した回数が4回であり、領域番号が「22」の領域で被写体が出現した回数が6回であることを示している。また、そのほかの領域では、被写体が出現していないとする。したがって、総出現回数85は、各出現回数84の合計である「100」となる。
出現位置分布2135は、所定枚数のフレームを用いて、学習を行った結果であってもよいし、総出現回数85が所定の閾値を超えるまで学習を行った結果であってもよい。
消失位置分布2136は、被写体が映像データから消失する前の該被写体が最後に含まれるフレームにおける、被写体の位置の分布を表す。消失位置分布2136は、消失する被写体の人数の総数を、フレーム上の位置毎に算出したデータであり、過去の被写体データを用いた学習によって得られたデータである。図9に示す通り、出現位置分布2135は、領域番号91と、x座標範囲92と、y座標範囲93と、消失回数94と、総消失回数95とを含む。なお、図9は、消失位置分布2136の一例であり、消失位置分布2136が図9に示す情報以外の情報を含んでもよい。
図9では、図8と同様に、640×480ピクセルである画像の左上の点を原点、横方向をx軸、縦方向をy軸とし、80×80ピクセルのメッシュでこの画像の領域を分割した場合の消失位置分布2136を示す。消失位置分布2136は、この場合における、領域毎の消失回数および総消失回数を、過去の被写体データを用いた学習を行うことによって、記録したものである。
領域番号91、x座標範囲92、y座標範囲93は、夫々、領域番号81、x座標範囲82、y座標範囲83と同様である。消失回数94は、被写体が関連するフレームの次のフレームで消失する場合における、該関連するフレームに領域を被写体が関連する領域において最後に含まれる回数である。総消失回数95は、消失回数94の合計数である。図9の消失位置分布2136は、領域番号が「22」の領域に含まれた後に被写体が消失した回数が5回であり、領域番号が「25」の領域に含まれた後に被写体が消失した回数が50回であり、領域番号が「46」の領域に含まれた後に被写体が消失した回数が45回であることを示している。また、そのほかの領域では、被写体が消失していないとする。したがって、総消失回数95は、各消失回数94の合計である「100」となる。
消失位置分布2136は、所定枚数のフレームを用いて、学習を行った結果であってもよいし、総消失回数95が所定の閾値を超えるまで学習を行った結果であってもよい。
本実施の形態では、出現位置分布2135および消失位置分布2136は、算出部2132によって出現妥当性および消失妥当性が算出された後に更新されるとする。
算出部2132は、図8に示すような出現位置分布2135および図9に示すような消失位置分布2136と、被写体検出データ70とに基づいて、被写体出現データの出現妥当性および被写体消失データの消失妥当性を算出する。
出現妥当性は、被写体が映像中に初めて出現したときのフレーム上の位置が、過去の分布から離れている度合いを数値化したものである。出現妥当性は、例えば、0から1までの値である。出現妥当性の値が1に近い場合、被写体出現データに含まれる位置において関連する被写体が、映像データに初めて含まれる(出現する)妥当性が低いことを示す。つまり、出現妥当性の値が1に近い場合、出現フラグが付与された被写体が、関連するフレームにおいて、出現する被写体ではなく、過去に既に含まれた被写体である可能性が高いことを示す。出現妥当性の値が1に近い場合、出現フラグが付与された被写体が、追跡が分断された被写体である可能性が高いことを示す。
ここで、出現妥当性の算出方法の一例について、図7および図8を参照して説明する。図7に示す被写体番号が「101−1」の被写体は、追跡番号が「1」であり、出現フラグが「1」である。上述した通り、出現フラグが「1」を示す被写体は出現する被写体である。算出部2132は、出現位置分布2135を参照し、被写体が出現する位置に対する出現回数84を取得する。被写体番号が「101−1」の被写体の被写体領域44は、中心座標が(450、40)である領域である。この中心座標が含まれる領域番号81は、x座標範囲82が「400≦x<480」であり、y座標範囲83が「0≦y<80」である、領域番号が「6」の領域である。領域番号が「6」の領域の出現回数84は、図8に示す通り「40」であるため、算出部2132は、出現位置分布2135から出現回数「40」を取得する。また、算出部2132は、出現位置分布2135から総出現回数85を取得する。図8に示す通り、総出現回数85は、「100」であるため、算出部2132は、出現位置分布2135から総出現回数「100」を取得する。
そして、算出部2132は、以下の式(1)を用いて出現妥当性を算出する。
出現妥当性=1−(出現回数/総出現回数)・・・(1)
取得した出現回数「40」と総出現回数「100」を上記式(1)に当てはめると、以下のようになる。
出現妥当性=1−(40/100)=0.6
これにより、被写体番号が「101−1」の被写体の出現妥当性「0.6」が算出される。
同様にして、算出部2132は、出現フラグ71が「1」のレコードに対し、出現妥当性を算出する。出現フラグ71が「0」のレコードに対しては、算出部2132は、出現妥当性を算出しない、または、「0」の値として算出する。
なお、出現妥当性の算出方法はこれに限定されず、過去の出現回数84が少ない場合に出現妥当性が高くなるようなその他の式あるいは表を用いてもよい。
消失妥当性は、被写体が映像から消失する直前のフレーム上の位置が、過去の分布から離れている度合いを数値化したものである。消失妥当性は、例えば、0から1までの値である。消失妥当性の値が1に近い場合、被写体消失データに含まれる位置において関連する被写体が、映像データに最後に含まれる(このフレームを最後に消失する)妥当性が低いことを示す。つまり、消失妥当性の値が1に近い場合、消失フラグが付与された被写体が、関連するフレームにおいて、消失する被写体ではなく、関連するフレーム以降のフレームにも含まれる被写体である可能性が高いことを示す。消失妥当性の値が1に近い場合、消失フラグが付与された被写体が、追跡が分断された被写体である可能性が高いことを示す。
ここで、消失妥当性の算出方法の一例について、図7および図9を参照して説明する。図7に示す被写体番号が「102−1」の被写体は、追跡番号が「1」であり、消失フラグが「1」である。上述した通り、消失フラグが「1」を示す被写体は消失する被写体である。算出部2132は、消失位置分布2136を参照し、被写体が消失する位置に対する消失回数94を取得する。被写体番号が「102−1」の被写体の被写体領域44は、中心座標が(450、200)である領域である。この中心座標が含まれる領域番号91は、x座標範囲92が「400≦x<480」であり、y座標範囲93が「160≦y<240」である、領域番号が「22」の領域である。領域番号が「22」の領域の消失回数94は、図9に示す通り「5」であるため、算出部2132は、消失位置分布2136から消失回数「5」を取得する。また、算出部2132は、消失位置分布2136から総消失回数95を取得する。図9に示す通り、総消失回数95は、「100」であるため、算出部2132は、消失位置分布2136から総消失回数「100」を取得する。
そして、算出部2132は、以下の式(2)を用いて出現妥当性を算出する。
消失妥当性=1−(消失回数/総消失回数)・・・(2)
取得した消失回数「5」と総消失回数「100」を上記式(2)に当てはめると、以下のようになる。
消失妥当性=1−(5/100)=0.95
これにより、被写体番号が「102−1」の被写体の消失妥当性「0.95」が算出される。
同様にして、算出部2132は、消失フラグ72が「1」のレコードに対し、消失妥当性を算出する。消失フラグ72が「0」のレコードに対しては、算出部2132は、消失妥当性を算出しない、または、「0」の値として算出する。
なお、消失妥当性の算出方法はこれに限定されず、過去の消失回数94が少ない場合に消失妥当性が高くなるようなその他の式あるいは表を用いてもよい。
算出部2132は、被写体検出データ70の各レコードに対し、算出した出現妥当性および消失妥当性を各レコードに関連付け、妥当性算出結果73として出力する。
図10に妥当性算出結果73の一例を示す。図10に示す通り、妥当性算出結果73は、被写体検出データ70の各列に加え、出現妥当性74と消失妥当性75とを含む。出現妥当性74の欄における「なし」は、算出部2132が出現妥当性を算出していない、つまり、出現妥当性の算出対象ではないことを示す。同様に、消失妥当性75の欄における「なし」は、算出部2132が消失妥当性を算出していない、つまり、消失妥当性の算出対象ではないことを示す。
この出現妥当性74および消失妥当性75は、追跡が分断された被写体の可能性の度合いを表すため、出現妥当性74および消失妥当性75をまとめて追跡分断スコアとも呼ぶ。
算出部2132は、更に、出現位置分布2135を更新する。算出部2132は、出現フラグ71が「1」の被写体の被写体領域44に対応する、出現位置分布2135の領域の出現回数84と総出現回数85とを1つ増やす。例えば、被写体番号が「101−1」の被写体の場合、算出部2132、領域番号が「6」の領域の出現回数84を1つ増やし、総出現回数85を1つ増やす。
また、算出部2132は、消失位置分布2136を更新する。算出部2132は、消失フラグ72が「1」の被写体の被写体領域44に対応する、消失位置分布2136の領域の消失回数94と総消失回数95とを1つ増やす。例えば、被写体番号が「102−1」の被写体の場合、算出部2132、領域番号が「22」の領域の消失回数94を1つ増やし、総消失回数95を1つ増やす。
算出部2132が出現位置分布2135および消失位置分布2136を更新することにより、算出部2132は、その後に処理を行うフレームに含まれる被写体の出現妥当性74および消失妥当性75をより精度よく算出することができる。
取得部2133は、取得部13の一例である。取得部2133は、算出部2132より算出された出現妥当性74および消失妥当性75に基づき、所定の条件を満たす、検出部2131により検出された被写体出現データと被写体消失データとの、閾値以下の組合せを取得する。取得部2133は、取得結果を照合部2138に出力する。
具体的には、取得部2133は、算出部2132から妥当性算出結果73を受け取る。取得部2133は、妥当性算出結果73に含まれる、出現フラグ71が「1」の被写体出現データと、消失フラグ72が「1」の被写体消失データとの組合せを列挙する。
この組合せについて、組合せ結果111の例を参照しながら説明する。図11は、組合せ結果111の一例を示す図である。組合せ結果111は、図11に示す通り、組合せ番号112と、消失被写体番号113と、出現被写体番号114と、時刻整合性115と、同一性スコア116と、照合対象情報117とを含む。
消失被写体番号113は、消失フラグ72が「1」の被写体番号43である。また、出現被写体番号114は、出現フラグ71が「1」の被写体番号43である。図10に示す通り、出現フラグ71が「1」の被写体は、被写体番号43が「101−1」、「101−2」、「103−1」、「103−2」、「104−3」の5つである。また、消失フラグ72が「1」の被写体は、被写体番号43が「102−1」、「102−2」、「104−1」、「104−2」の4つである。そのため、消失した被写体の被写体消失データと出現した被写体の被写体出現データとの組合せは4×5=20通りとなり、それを列挙すると、図11に示す20個の組合せが得られる。このように、取得部2133は、消失被写体番号113と出現被写体番号114との組合せを列挙し、各組を識別する組合せ番号112を付与する。これにより、組合せ結果111の組合せ番号112、消失被写体番号113および出現被写体番号114が得られる。
取得部2133は、被写体の組合せの各々について、消失する時刻および出現する時刻に整合性があるか否かを判定する。ここで、隠蔽によって同一の被写体の追跡が分断され、異なる二つの被写体として認識された場合を考えると、これら二つの被写体は同じフレームに同時には存在せず、一方の被写体が消失した後、他方の被写体が出現する。すなわち、出現する時刻が消失した時刻より後である場合のみ、二つの被写体が同一である可能性がある。取得部2133は、列挙した組合せに対し、出現する時刻が消失する時刻より後である場合に、時刻に整合性があると判定する。
図10および図11を参照すると、組合せ番号112が「1」の組合せは、消失被写体番号113が「102−1」であり、出現被写体番号114が「101−1」である。消失被写体番号113が「102−1」の被写体に関連するフレーム時刻42は「10時15分21秒」である。一方、出現被写体番号114が「101−1」である被写体に関連するフレーム時刻42は、「10時15分20秒」である。即ち、出現した時刻が消失した時刻より先であるため、二つの被写体が同一である可能性はなく、時刻に整合性がない。このようにして、取得部2133は、各組合せに対して、時刻の整合性の判定を行う。
そして、取得部2133は、整合性の判定結果を図11の時刻整合性115として、組合せ番号112に関連付ける。時刻整合性115の欄のうち「整合しない」は、被写体が出現する時刻が消失した時刻より後ではないことを表し、「整合する」は、被写体が出現する時刻が消失した時刻よりも後であることを表している。つまり、図11に示す時刻整合性115は、消失した時刻と出現した時刻とに矛盾が無いことを表す。
更に、取得部2133は、時刻に整合性がある組合せの夫々に対して、被写体同士が同一である可能性の度合いを表す同一性スコアを算出する。取得部2133は、時刻整合性115が「整合する」である組合せの夫々に対して、同一性スコアを算出する。取得部2133は、以下の式(3)を用いて、同一性スコアを算出する。
同一性スコア=消失する被写体の消失妥当性×出現する被写体の出現妥当性・・・(3)
図11を参照すると、時刻整合性115が「整合する」である組合せは、例えば、組合せ番号112が「3」の組合せである。組合せ番号112が「3」の組合せは、消失被写体番号113が「102−1」であり、出現被写体番号114が「103−1」である。消失被写体番号113が「102−1」の被写体に関連する消失妥当性75は、図10を参照すると、「0.95」である。出現被写体番号114が「103−1」である被写体に関連する出現妥当性74は、「0.94」である。このとき、同一性スコアは、式(3)を用いて、以下のように算出される。
同一性スコア=0.95×0.94=0.893
取得部2133は、時刻整合性115が「整合する」である他の組合せに対しても、同様に、同一性スコアを算出する。そして、取得部2133は、各組合せに対し、算出した同一性スコアを関連付ける。図11の同一性スコア116は、このようにして算出された同一性スコア116が格納される。図11に示す通り、時刻整合性115が「整合する」である組合せは6つであるため、取得部2133は、この6つの組合せの夫々に対して、同一性スコア116を算出する。
なお、同一性スコア116が算出されていない、つまり、時刻整合性115が「整合しない」である組合せに対しては、同一性スコア116として「なし」が関連付けられているが、「なし」ではなく同一性スコア116が算出されていないことを表す情報であればよい。
このように、同一性スコア116は、出現妥当性74と消失妥当性75とを用いて算出される値であり、その値が高いほど、消失する被写体と出現する被写体とが同一である可能性が高いことを示す。
なお、同一性スコア116の算出には、上記の式(3)に限らず、消失する被写体の消失妥当性75と、出現する被写体の出現妥当性74が高い場合に同一性スコア116が高くなるような、その他の式あるいは表を用いてもよい。
そして、取得部2133は、算出した同一性スコア116に基づいて、妥当性算出結果73に含まれる組合せのうち、所定の条件を満たす組合せを照合対象として取得する。取得部2133は、記憶部2134に格納された負荷条件情報2137を参照し、負荷条件情報2137が表す条件を満たす組合せを取得する。所定の条件とは、例えば、照合処理の回数が所定の回数以下となること、同一性スコアが所定の値以上になること等である。ここで、照合処理とは、組合せに含まれる被写体消失データの被写体と被写体出現データの被写体との間で行われる処理である。一つの組合せの中で行われる照合の処理を1回とカウントする。よって、例えば、照合処理が4回とは、4つの組合せの夫々で照合処理が行われることを示す。
図12に負荷条件情報2137の一例を示す。本実施の形態では、所定の条件は、照合処理の回数であるとする。負荷条件情報2137には、所定の条件として、最大照合回数の値である「4」が格納されている。なお、この最大照合回数は、所定の時間幅における回数であってもよい。この場合、所定の時間幅は、予め定められてもよいし、映像データの種類によって変化するものであってもよい。
なお、負荷条件情報2137は、出現位置分布2135および消失位置分布2136とは別の記憶部に格納されてもよい。また、負荷条件情報2137は、有効データ抽出装置201のある時点における負荷に応じて適宜変更されるものであってもよい。
取得部2133は、負荷条件情報2137を参照し、最大照合回数が4回となるように、妥当性算出結果73に含まれる組合せを取得する。このとき、取得部2133は、同一性スコア116を参照して、組合せを取得する。まず、取得部2133は、同一性スコア116が「なし」ではない組合せを照合対象の候補として取得する。つまり、取得部2133は、同一性スコア116が「なし」の組合せは照合対象の候補としない。同一性スコア116が「なし」の組合せは、上述した通り、時刻の整合性が無い組合せである。したがって、取得部2133は、時刻の整合性が無い組合せを照合対象の候補から外す。これにより、取得部2133は、図11に示す20個の組合せのうち、6個の組合せを照合対象の候補とすることができる。
図11の照合対象情報117は、各組合せが照合対象か否かを表す情報である。取得部2133は、同一性スコア116が「なし」の組合せに対し、照合対象情報117として、照合対象でないことを示す「対象でない」を関連付ける。
図11を参照すると、同一性スコア116が「なし」ではない組合せは6つあるため、取得部2133は、この6つの照合対象の候補から4つを、照合対象として取得する。
ここで、比較のために、取得部2133が照合対象の数を制限することなく、照合をする被写体の組合せを全て選択する場合を考える。図11を参照すると、消失した時刻と出現した時刻が整合する被写体の組合せは、組合せ番号112が「3」、「4」、「5」、「8」、「9」、「10」の組合せである。したがって、これらの夫々に対して照合処理を行うと、照合回数は6となる。この場合照合対象の数を制限する場合と比較すると、照合にかかる負荷は6/4=1.5倍となる。
すなわち、取得部2133のように、負荷条件情報2137で表される条件を満たすように、照合する被写体同士の組合せの数を制限することで、被写体の追跡を用いて有効データを抽出する処理にかかる処理負荷を低減することができる。
なお、取得部2133は、同一性スコア116が高いものから順に取得することが好ましい。取得部2133は、組合せ結果111に含まれる組合せのうち、同一性スコア116の高い順に、順位付けをし、順位順に、負荷条件情報2137が表す条件を満たす組合せに関連する被写体消失データと被写体出現データとを照合対象として取得する。
図11の例では、同一性スコア116の高い順に各組合せを並べ替えると、その順序は、組合せ番号112が「4」、「9」、「3」、「8」、「5」、「10」となる。なお、同一性スコア116が同じ場合は、組合せ番号112が小さい方が先になるように並び替えたが、組合せ番号112が大きい方が先になるように並び替えてもよい。負荷条件情報2137には、最大照合回数が4回であることが示されているため、取得部2133は、同一性スコア116の高い順から4つの組合せを選択する。つまり、取得部2133は、組合せ番号112が「4」、「9」、「3」、「8」の組合せを選択する。
このように、取得部2133は、同一性スコア116が高い、つまり、被写体消失データに含まれる被写体と、被写体出現データに含まれる被写体とが同一の被写体である可能性が高い組合せから順に、取得することが好ましい。
例えば、取得部2133が同一性スコア116の高い順からではなく、単に、組合せ番号112の小さい順に4つの組合せを取得した場合、取得部2133は、組合せ番号112が「3」、「4」、「5」、「8」の組合せを取得することになる。この場合、組合せの数が同じであるため、移行の照合処理にかかる負荷は同じである。しかし、この場合、被写体消失データに含まれる被写体と、被写体出現データに含まれる被写体とが同一の被写体である可能性が高い組合せである組合せ番号112が「9」の組合せが選択されない。よって、これらの被写体データを用いて再追跡処理を行ったとしても、追跡処理が失敗する可能性が高くなる。
しかしながら、取得部2133が、同一性スコア116が高い組合せから順に、組合せを取得することにより、被写体の再追跡が成功する可能性を高めることができる。したがって、有効データ抽出装置201が出力するデータ量をより削減することができる。
取得部2133は、選択した組み合わせに対し、照合対象情報117として、照合対象であることを示す「対象」を関連付ける。また、照合対象の候補のうち、照合対象として選択しなかった組合せに対し、照合対象情報117として、照合対象でないことを示す「対象でない」を関連付ける。
よって、取得部2133は、図11に示すような組合せ結果111を得ることができる。取得部2133は、組合せ結果111のうち、照合対象情報117が「対象」である組合せの被写体消失データおよび被写体出現データを、照合部2138に取得結果として供給する。
照合部2138は、取得部2133から供給された被写体消失データに含まれる被写体と、被写体出現データに含まれる被写体とを照合する。これにより、照合部2138は、被写体同士が同一であるか否かを判定する。照合部2138が行う照合の方法は、特に限定されず、任意の方法を採用して照合すればよい。照合部2138は、同一である被写体同士の再追跡番号が同一となるように、被写体再追跡結果131を生成し出力する。
図13は、被写体再追跡結果131の一例を示す図である。被写体再追跡結果131は、被写体追跡結果50に更に再追跡番号132を含む。照合の結果、組合せ番号112が「4」の組合せに含まれる、消失被写体番号113が「102−1」の被写体と、出現被写体番号114が「103−2」の被写体とが、同一の被写体であると判定されたとする。また、組合せ番号112が「9」の組合せに含まれる、消失被写体番号113が「102−2」の被写体と、出現被写体番号114が「103−2」の被写体とが、同一の被写体であると判定されたとする。
照合部2138は、被写体追跡結果50の被写体番号43が「102−1」の追跡番号56である「1」を、被写体番号43が「103−1」の再追跡番号132として関連付ける。また、被写体番号43が「103−1」の追跡番号56と同じ追跡番号56を有する被写体番号43が「104−1」の再追跡番号132にも「1」が関連付けられる。同様に、照合部2138は、被写体追跡結果50の被写体番号43が「102−2」の追跡番号56である「2」を、被写体番号43が「103−2」と「104−2」の再追跡番号132として関連付ける。
このように、照合部2138は、図13に示す被写体再追跡結果131を生成し、被写体選択部214に出力する。
図3に戻り、被写体選択部214について説明する。有効データ抽出装置201の被写体選択部214は、被写体再追跡部213から被写体再追跡結果131を受信し、所定の時間幅において検出された被写体の中から、再追跡番号132毎に被写体品質スコア45が所定の閾値より高い被写体、または、被写体品質スコア45が高いものから順に所定の数の被写体を選択する。そして、被写体選択部214は、選択した被写体の被写体データを被写体選択結果として出力する。被写体選択結果の構成要素は、上述した被写体再追跡結果131の構成要素と同様である。
例えば、図13に示す、再追跡番号が「1」の被写体の被写体データは、被写体番号43が「101−1」、「102−1」、「103−1」および「104−1」のレコードである。被写体選択部214が選択する映像データが、被写体品質スコア45から順に所定の数(例えば、3つ)である場合、被写体選択部214は、被写体品質スコア45が高い、被写体番号43が「102−1」、「103−1」および「104−1」のレコードを被写体選択結果として出力する。
これにより、被写体選択部214は、映像データのうち、解析に有効なデータを出力することができる。更に、被写体選択部214が、被写体品質スコア45に基づいて、被写体データを選択することにより、解析に、より適したデータを出力することができる。
なお、図13では、被写体データが、被写体出現データまたは被写体消失データの何れかであるが、上述した通り、被写体データは出現フラグ71および消失フラグ72の両方が「0」であるレコードであってもよい。この場合であっても、被写体選択部214は、被写体品質スコア45に基づいて、被写体品質スコア45が高いレコードを出力することができる。
次に、図14から図19を参照して、本実施の形態に係る映像監視システム100の処理の流れについて説明する。
図14は、本実施の形態に係る映像監視システム100の動作の流れの一例を示すフローチャートである。図14に示す通り、映像配信装置101が映像データを撮影する(ステップS141)。撮影された映像データは、有効データ抽出装置201に出力される。
被写体検出部211は、映像配信装置101から出力された映像データに含まれる被写体を検出する。具体的には、被写体検出部211は映像配信装置101から映像データを受信し、受信した映像データをフレームに分割し、フレーム毎に1つまたは複数の被写体を検出する。(ステップS142)。被写体検出部211は、被写体の検出結果である、例えば図4に示すような被写体検出結果40を被写体追跡部212に出力する。
次に、被写体追跡部212は、各フレームに含まれる被写体同士が、同一の被写体か否かを判定することにより、被写体を追跡する。具体的には、被写体追跡部212は、被写体検出結果40の被写体領域44などを参照し、フレーム間において被写体が同一であるかを判定する。そして、被写体追跡部212は、判定結果に基づいて被写体検出結果40に関連付けた追跡番号を含む被写体追跡結果50を被写体再追跡部213に出力する(ステップS143)。
次に、被写体再追跡部213は、被写体再追跡処理を行う(ステップS144)。具体的には、被写体再追跡部213は、被写体追跡部212からの被写体追跡結果を受信し、追跡が分断された可能性の度合いを算出する。そして、被写体再追跡部213は、追跡が分断された可能性が高い被写体同士を照合し、同一の被写体であるか否かを再び判定する。この被写体再追跡処理については、図面を変えて更に詳細に説明する。被写体再追跡部213は、被写体再追跡結果131を、被写体選択部214に出力する。
次に、被写体選択部214は、被写体再追跡結果131に基づいて、被写体品質スコアが高い被写体の被写体データを優先して選択する被写体データ選択処理を行う(ステップS145)。被写体選択部214は、被写体選択結果を表示装置301に出力する。
表示装置301は、被写体選択部214が選択した被写体の情報を画面などに表示する。ここで、表示装置301は、被写体の特徴抽出および照合を行い、特定した被写体の識別子を表示するなど、被写体選択部214によって選択された被写体データを解析した結果を表示してもよい。また、表示装置301は、解析された被写体データに対し、二次解析を行った上でその結果を表示してもよい(ステップS146)。表示装置301が表示する情報は特に限定されず、被写体データから得られるどのような情報を表示してもよい。
次に、上述したS144の被写体再追跡処理の流れについて、図15を参照して説明する。図15は、被写体再追跡処理の流れの一例を示すフローチャートである。
図15に示す通り、検出部2131が被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出処理を行う(ステップS151)。検出部2131は、検出した被写体出現データと被写体消失データとを含む被写体検出データ70を算出部2132に出力する。
そして、算出部2132が検出部2131により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布2135および消失位置分布2136とに基づき、被写体出現データの出現妥当性と被写体消失データの消失妥当性とを算出する算出処理を行う(ステップS152)。算出部2132は、算出した被写体出現データの出現妥当性と被写体消失データの消失妥当性とを含む妥当性算出結果73を取得部2133に出力する。
その後、取得部2133が、ステップS152で算出部2132より算出された出現妥当性および消失妥当性に基づき、ステップS151で検出部2131により検出された被写体出現データと被写体消失データとの、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得処理を行う(ステップS153)。取得部2133は、取得された被写体出現データと被写体消失データとの組合せである取得結果を、照合部2138に出力する。
そして、照合部2138が、被写体出現データの被写体と、被写体消失データの被写体との照合を行う(ステップS154)。これにより、被写体再追跡部213は、照合によって得られた結果を、被写体再追跡結果131として、被写体選択部214に出力する。
図16は、図15に示したステップS151の検出処理の流れの一例を示すフローチャートである。図16に示す通り、検出部2131は、被写体追跡部212から被写体追跡結果50を受信し、バッファリングする(ステップS161)。そして、検出部2131は、所定の時間幅における被写体追跡結果50をバッファから取り出す(ステップS162)。この所定の時間幅は、特に限定されず、映像データの種類や場所によって適宜変更可能である。
検出部2131は、取り出した被写体追跡結果50に含まれる各レコードについて、被写体が映像データに新たに出現する被写体か否かを判定する(出現判定を行う)(ステップS163)。また、検出部2131は、ステップS162にて取り出した被写体追跡結果50の各レコードについて、被写体が映像データから消失したか否かを判定する(消失判定を行う)(ステップS164)。
検出部2131は、出現判定の結果である出現フラグ71および消失判定の結果である消失フラグ72を、被写体追跡結果50の各レコードに関連付け、被写体検出データ70として出力する(ステップS165)。
以上により、検出部2131の検出処理を終了する。なお、ステップS163とステップS164とは同時に行われてもよいし、逆順で行われてもよい。
図17は、図15に示したステップS152の算出処理の流れの一例を示すフローチャートである。図17に示す通り、算出部2132は、例えば、図7に示す被写体検出データ70に含まれる各レコードに対し、出現フラグ71が「1」であるか否かを判定する(ステップS171)。出現フラグ71が「1」ではない(「0」である)場合(ステップS171にてNO)、処理はステップS174に進む。
出現フラグ71が「1」の場合(ステップS171にてYES)、算出部2132は、出現妥当性74を算出する(ステップS172)。そして、算出部2132は、出現位置分布2135を更新する(ステップS173)。
次に、算出部2132は、例えば、図7に示す被写体検出データ70に含まれる各レコードに対し、消失フラグ72が「1」であるか否かを判定する(ステップS174)。消失フラグ72が「1」ではない(「0」である)場合(ステップS174にてNO)、処理を終了する。
消失フラグ72が「1」の場合(ステップS174にてYES)、算出部2132は、消失妥当性75を算出する(ステップS175)。そして、算出部2132は、消失位置分布2136を更新する(ステップS176)。なお、ステップS174からステップS176の処理は、ステップS171より前に行われてもよいし、ステップS171からステップS173の何れかと同時に行われてもよい。
これにより、算出部2132は、出現妥当性74および消失妥当性75を含む妥当性算出結果73を出力する。
図18は、図15に示したステップS153の取得処理の流れの一例を示すフローチャートである。図18に示す通り、取得部2133は、算出部2132から妥当性算出結果73を受信し、バッファリングする(ステップS181)。そして、取得部2133は、所定の時間幅における妥当性算出結果73をバッファから取り出す(ステップS182)。この所定の時間幅は、特に限定されず、映像データの種類や場所によって適宜変更可能である。
次に、取得部2133は妥当性算出結果73の中から、消失する被写体と出現する被写体の組合せを列挙する(ステップS183)。取得部2133は、被写体の組合せの各々について、消失する時刻および出現する時刻に整合性があるか否かを判定する(時刻整合性判定を行う)(ステップS184)。
そして、時刻に整合性がある組合せの夫々に対して、取得部2133は、被写体同士が同一である可能性の度合いを表す同一性スコア116を算出する(ステップS185)。取得部2133は、算出された同一性スコア116に基づいて、組合せに対し順位付けを行う(ステップS186)。そして、取得部2133は、負荷条件情報2137を参照し、組合せのうち順位が高いものから順に負荷条件情報2137に設定された数を満たすまで選択する(ステップS187)。
これにより、取得部2133は、選択した組み合わせの被写体消失データおよび被写体出現データを取得結果として出力する。そして、照合部2138は、出力された取得結果に基づいて、照合処理を行うことができる。
図19は、図14に示したステップS145の被写体データ選択処理の動作の一例を示すフローチャートである。被写体選択部214は、被写体再追跡部213からの被写体再追跡結果131を受信し、バッファリングする(ステップS191)。次に、被写体選択部214は、所定の時間幅における被写体再追跡結果131をバッファから取り出す(ステップS192)。
被写体選択部214は、再追跡番号132が同一の被写体毎に、被写体品質スコア45の高い順に順位づけする(ステップS193)。そして、被写体選択部214は、再追跡番号132が同一の被写体毎に、被写体品質スコア45が所定の閾値より高い、または、所定の順位以上の被写体の被写体データを出力する(ステップS194)。
以上のように、本実施の形態では、検出部2131が被写体データから被写体出現データおよび被写体消失データを検出する。そして、算出部2132が学習によって得られた被写体の過去の出現位置分布および消失位置分布と、被写体出現データおよび被写体消失データを用いて、被写体出現データの出現妥当性および被写体消失データの消失妥当性を算出する。被写体出現データの出現妥当性は、被写体出現データに含まれる被写体が出現する被写体であることの妥当性を示すものであり、被写体消失データに含まれる被写体が消失する被写体であることの妥当性を示すものである。取得部2133はこれらの出現妥当性および消失妥当性に基づいて、所定の条件を満たす被写体出現データと被写体消失データとの組合せを取得する。
これにより、被写体再追跡部213を含む映像監視システム100は、追跡の分断が生じたことにより、消失する被写体および出現する被写体と判定された被写体同士を、再び同一の被写体である可能性が高い被写体として扱うことができる。これにより、映像監視システム100は、追跡の分断によって生じるデータ量の増加を抑制することができる。
また、映像監視システム100は、被写体出現データと被写体消失データとの組合せのうち、所定の条件を満たす組合せを取得する。所定の条件は、例えば、組合せの数が、所定の閾値以下であることである。これにより、映像監視システム100は、追跡を行う際に、取得された組合せの被写体消失データに含まれる被写体と、該組合せの被写体出現データに含まれる被写体との間で行う照合処理を、所定の閾値以下に制御することができる。これにより、映像監視システム100は、照合部2138による照合処理にかかる負荷を制限することができる。
したがって、本実施の形態に係る映像監視システム100によれば、映像データのうち、例えば、映像の解析に有効なデータを抽出する処理の処理負荷を低減しながら、追跡の分断によって生じる有効なデータのデータ量の増加を抑制することができる。
また、上述した被写体選択部214は、被写体再追跡部213に含まれてもよい。
また、取得部2133は、図11に示した各組合せのうち、消失妥当性75が高い被写体消失データに含まれる被写体領域44で示される位置から所定の範囲内の位置を被写体領域44として含む被写体出現データを照合対象の候補としてもよい。つまり、取得部2133は、消失妥当性75が高い被写体であっても、被写体出現データに含まれる位置が離れている場合、この消失妥当性75が高い被写体の被写体消失データと該被写体出現データとは、夫々異なる被写体である可能性が高い。したがって、取得部2133はこのような異なる被写体である可能性が高い組合せを照合対象の候補から除外する。これにより、取得部2133は、照合により適したデータのみを取得することができる。
(具体例)
本実施の形態に係る映像監視システム100の具体的な適用例について、図20に示す。図20は、映像監視システム100の具体的な適用例の構成の一例を示す図である。
図20に示す通り、映像監視システム100は、カメラ1101と、有効データ抽出サーバ1201と、表示サーバ1301とを含む。カメラ1101は、ネットワークを介して有効データ抽出サーバ1201に接続している。カメラ1101は、上述した映像配信装置101の一例である。
有効データ抽出サーバ1201は、有効データ抽出装置201の一例である。有効データ抽出サーバ1201は、プログラム制御によって動作するコンピュータである。有効データ抽出サーバ1201は、ネットワークを介して接続されたカメラ1101から映像データを受信する。有効データ抽出サーバ1201は、図20に示す通り、解析サービスを提供する解析サービスプログラム1210と、有効データ抽出サービスを提供する有効データ抽出サービスプログラム1220とを含む。解析サービスプログラム1210は、解析部210の一例である。有効データ抽出サービスプログラム1220は、有効データ抽出部220の一例である。解析サービスプログラム1210および有効データ抽出サービスプログラム1220は、夫々、コンピュータ上で動作するプログラム群のまとまりである。
顔検出プログラム1211は、被写体検出部211の一例である。顔検出プログラム1211は、コンピュータ上で動作し、映像データから人物の顔の領域を検出するプログラムである。顔追跡プログラム1212は、被写体追跡部212の一例である。顔追跡プログラム1212は、コンピュータ上で動作し、人物の顔の領域を追跡するプログラムである。
被写体再追跡プログラム1213は、被写体再追跡部213の一例である。被写体再追跡プログラム1213は、コンピュータ上で動作し、被写体の再追跡を行うプログラムである。被写体選択プログラム1214は、被写体選択部214の一例である。被写体選択プログラム1214は、コンピュータ上で動作し、被写体データの選択を行うプログラムである。
表示サーバ1301は、表示装置301の一例である。表示サーバ1301は、プログラム制御によって動作するコンピュータである。
図21は、被写体再追跡プログラム1213の構成を示すブロック図である。被写体再追跡プログラム1213は、図21に示す通り、検出モジュール2101と、算出モジュール2102と、取得モジュール2103と、記憶モジュール2104と、照合モジュール2108と、を含む。
検出モジュール2101、算出モジュール2102、取得モジュール2103および照合モジュール2108は、夫々、検出部2131、算出部2132、取得部2133および照合部2138の一例である。検出モジュール2101、算出モジュール2102、取得モジュール2103、記憶モジュール2104および照合モジュール2108は、夫々、被写体再追跡プログラム1213の中で動作するソフトウェアの部品である。また、記憶モジュール2104は、記憶部2134の一例である。記憶モジュール2104は、コンピュータのメモリ上に配置された出現位置分布テーブル2105、消失位置分布テーブル2106および負荷条件情報テーブル2107を含む。出現位置分布テーブル2105、消失位置分布テーブル2106および負荷条件情報テーブル2107は夫々、出現位置分布2135、消失位置分布2136および負荷条件情報2137の一例である。出現位置分布テーブル2105、消失位置分布テーブル2106および負荷条件情報テーブル2107は夫々、例えば、データベース管理システムによって管理される。
なお、本具体例では、被写体検出部211が、被写体の顔の領域を検出することにより被写体を検出する顔検出プログラム1211であることを例に挙げた。また、被写体追跡部212が、被写体の顔を追跡することにより被写体を追跡する顔追跡プログラム1212であることを例に挙げた。しかしながら、これらは一例であり、被写体の検出および追跡において、顔以外の部分を用いてもよい。被写体の検出および追跡は、どのような方法を採用してもよい。
なお、本具体例では、有効データ抽出装置201が1つの有効データ抽出サーバ1201で実現されることを例に説明を行ったが、有効データ抽出装置201の解析部210および有効データ抽出部220は別々の装置で実現されてもよい。更に、解析部210の被写体検出部211および被写体追跡部212が別々の装置で実現されてもよいし、有効データ抽出部220の被写体再追跡部213および被写体選択部214が別々の装置で実現されてもよい。
なお、本具体例では、映像配信装置101、有効データ抽出装置201および表示装置301が夫々異なるサーバで実現されることを例に説明を行ったが、適宜組合せてもよい。例えば、映像配信装置101と有効データ抽出装置201とが一体となった構成であってもよい。図22に映像配信装置101と有効データ抽出装置201とが一体となった場合の映像監視システム200の構成の一例を示す。
映像監視システム200は、図22に示す通り、撮像装置221と表示装置301とを含む。撮像装置221は、例えば、インテリジェントカメラやネットワークカメラと呼ばれる撮像装置である。撮像装置221は、映像配信装置101と、有効データ抽出装置201の機能を有する。映像配信装置101および有効データ抽出装置201の機能については、第2の実施の形態において説明した機能と同様である。
撮像装置221の映像配信装置101は、例えば、CCD(Charge Coupled Device)センサ、CMOS(Complementary Metal Oxide Semiconductor)センサを用いて、撮像処理を行い、複数のフレームを含む映像データを生成する撮影部である。そして、映像配信装置101は、生成した映像データを有効データ抽出装置201に供給する。これにより、有効データ抽出装置201は、映像データから有効データを抽出することができる。このように、映像配信装置101と有効データ抽出装置201とは一体となって実装されてもよい。これにより、撮影した映像データを、該映像データに対する処理を撮影した撮像装置221自身で行うことができる。このような構成であっても、映像監視システム200は、上述した映像監視システム100と同様の効果を得ることができる。
<第3の実施の形態>
次に、本開示の第3の実施の形態について説明する。本実施の形態における映像監視システム100の構成は、第2の実施の形態に係る映像監視システム100と同様の構成である。第2の実施の形態では被写体領域44として、中心座標を用いたが、被写体領域44として用いる情報はこれに限定されない。被写体領域44として用いる情報は、中心座標に加え、被写体のフレーム上の大きさおよび向きを含んでいてもよい。
本実施の形態では、被写体領域44が、中心座標、被写体の大きさおよび向きを含む構成について説明する。
図23は、本実施の形態における被写体検出結果230の一例を示す図である。被写体検出結果230は、被写体検出結果40の被写体領域44として、中心座標、被写体の幅、高さ、向きが含まれる構成である。被写体検出結果230は、図23に示す通り、フレーム番号231と、フレーム時刻232と、被写体番号233と、被写体領域234と、被写体品質スコア235とを含む。被写体領域234は、中心座標2341と、幅2342と、高さ2343と、向き2344とを含む。被写体の向き2344は、被写体が映像を撮影する映像配信装置に正対している場合を基準としたときの、被写体の、水平方向の回転の度合いを表す。例えば、被写体を人物の顔とした場合、人物の顔がカメラに正対している場合を0度とし、人物の顔の垂直方向を軸にしたときの、人物の顔の左回りの回転角を、被写体の向きとする。人物の顔の左半分を捉える角度が−90度、人物の顔の右半分を捉える角度が90度となる。なお、向き2344は、被写体が映像を撮影する映像配信装置に正対している場合を基準としたときの、被写体の、垂直方向の回転の度合い、撮影装置の光軸に対する回転方向の回転の度合い、あるいはそれらの回転の度合いの組合せであってもよい。
図24は、被写体検出データ240の一例を示す図である。検出部2131は、上述した第2の実施の形態と同様に、被写体検出結果230に対して被写体追跡部212が付与した追跡番号241を含むデータに、出現フラグ242と、消失フラグ243とを関連付けて被写体検出データ240として出力する。
図25は、本実施の形態における出現位置分布2135の一例を示す図である。本実施の形態における出現位置分布2135は、領域番号251と、大きさ252と、向き253と、x座標範囲254と、y座標範囲255と、出現回数256と、総出現回数257とを含む。本実施の形態における出現位置分布2135は、図8の出現位置分布2135に、大きさ252と、向き253とが含まれる構成である。
図26は、本実施の形態における消失位置分布2136の一例を示す図である。本実施の形態における消失位置分布2136も出現位置分布2135と同様に、図9の消失位置分布2136に、大きさ262と、向き263とが含まれる構成である。
図25および図26の例では、第2の実施の形態と同様に、1フレームの画像が640×480ピクセルであるとする。この画像の左上の点を原点、横方向をx軸、縦方向をy軸とする。そして、出現位置分布2135は、80×80ピクセルのメッシュで画像上の位置を48の領域に分割し、被写体の画像上の大きさ(面積)を4つの領域に分割し、さらに向きを3つの領域に分割し、それらを組合せた計576の領域毎の出現回数256および総出現回数257を、記録したものである。同様に、消失位置分布2136は、上記576の領域毎の消失回数266および総消失回数267を記録したものである。
算出部2132は、図24に示す出現フラグ242が「1」の被写体の出現妥当性を算出する。算出部2132は、図25に示す出現位置分布2135を参照し、被写体が出現する位置に対する、過去の出現回数256を取得する。また、総出現回数257を取得する。そして、算出部2132は、式(1)を参照し、出現妥当性を算出する。図24を参照すると、被写体番号が「201−1」の被写体の中心座標2341は「(40、40)」であり、幅2342は「30」であり、高さ2343は「60」であり、向き2344は「−10」である。図25を参照すると、被写体番号が「201−1」の被写体は領域番号251が「5」の領域に含まれ、その過去の出現回数256は「40」である。また、総出現回数257は「100」である。このとき、出現妥当性は以下のように算出される。
出現妥当性=1−(40/100)=0.6
また、算出部2132は、図24に示す消失フラグ243が「1」の被写体の消失妥当性を算出する。算出部2132は、図26に示す消失位置分布2136を参照し、被写体が消失する位置に対する、過去の消失回数266を取得する。また、総消失回数267を取得する。そして、算出部2132は、式(2)を参照し、消失妥当性を算出する。図24を参照すると、被写体番号が「202−1」の被写体の中心座標2341は「(570、410)」であり、幅2342は「100」であり、高さ2343は「150」であり、向き2344は「40」である。図26を参照すると、被写体番号が「202−1」の被写体は領域番号261が「575」の領域に含まれ、その過去の消失回数266は「70」である。また、総消失回数267は「100」である。このとき、消失妥当性は以下のように算出される。
消失妥当性=1−(70/100)=0.3
このようにして、算出部2132は、出現妥当性および消失妥当性を算出する。そのほかの被写体に対しても、算出部2132が出現妥当性および消失妥当性を算出した結果である、妥当性算出結果270を図27に示す。算出部2132は、図27に示すような妥当性算出結果270を出力する。そして、取得部2133は、この妥当性算出結果270を用いて、被写体出現データと被写体消失データとの組合せを取得する。
ここで、比較のために、算出部2132が、被写体のフレーム上の大きさを用いずに、出現妥当性を算出する場合を考える。図24を参照すると、被写体番号233が「201−1」の被写体の中心座標2341は「(40、40)」であり、向き2344は、「−10」である。被写体のフレーム上の大きさを用いない場合、図25を参照すると、被写体番号233が「201−1」の被写体は、領域番号251が「5」、「6」、「7」、「8」の領域に含まれる。この領域の出現回数256は、40+60=100である。また、総出現回数257は「100」である。このとき、出現妥当性は以下のように算出される。
出現妥当性=1−(100/100)=0.0
同様にして、被写体番号233が「201−2」の被写体の出現妥当性も、0.0と算出される。
被写体のフレーム上の大きさを用いる場合、被写体番号233が「201−1」の被写体および被写体番号233が「202−1」の出現妥当性は、夫々、「0.6」および「0.4」であるのに対し、被写体のフレーム上の大きさを用いない場合、双方ともに「0.0」となる。すなわち、出現妥当性および消失妥当性の算出に被写体のフレーム上の大きさを用いることで、フレーム上の同じ位置に出現あるいは消失した場合でも、算出部2132は、出現妥当性および消失妥当性を区別して算出することができる。これは、人物が画面の奥から手前に移動する映像シーンにおいて、隠蔽により突然、人物が手前に出現した場合を識別する場合などに特に有効である。
同様に、被写体のフレーム上の向きを用いることで、フレーム上の同じ位置に同じ大きさで出現あるいは消失した場合でも、算出部2132は出現妥当性または消失妥当性を区別して算出することが可能である。これは、人物が正面を向いて出現し横向きで消失する映像シーンにおいて、隠蔽により突然、正面を向いて退場した場合を識別する場合などに特に有効である。
(ハードウェア構成について)
本発明の各実施形態において、各装置の各構成要素は、機能単位のブロックを示している。各装置の各構成要素の一部又は全部は、例えば図28に示すような情報処理装置900とプログラムとの任意の組み合わせにより実現される。図28は、各装置の各構成要素を実現する情報処理装置900のハードウェア構成の一例を示すブロック図である。情報処理装置900は、一例として、以下のような構成を含む。
・CPU(Central Processing Unit)901
・ROM(Read Only Memory)902
・RAM(Random Access Memory)903
・RAM903にロードされるプログラム904
・プログラム904を格納する記憶装置905
・記録媒体906の読み書きを行うドライブ装置907
・通信ネットワーク909と接続する通信インタフェース908
・データの入出力を行う入出力インタフェース910
・各構成要素を接続するバス911
各実施形態における各装置の各構成要素は、これらの機能を実現するプログラム904をCPU901が取得して実行することで実現される。各装置の各構成要素の機能を実現するプログラム904は、例えば、予め記憶装置905やRAM903に格納されており、必要に応じてCPU901が読み出す。なお、プログラム904は、通信ネットワーク909を介してCPU901に供給されてもよいし、予め記録媒体906に格納されており、ドライブ装置907が当該プログラムを読み出してCPU901に供給してもよい。
各装置の実現方法には、様々な変形例がある。例えば、各装置は、構成要素毎にそれぞれ別個の情報処理装置900とプログラムとの任意の組み合わせにより実現されてもよい。また、各装置が備える複数の構成要素が、一つの情報処理装置900とプログラムとの任意の組み合わせにより実現されてもよい。
また、各装置の各構成要素の一部又は全部は、その他の汎用または専用の回路、プロセッサ等やこれらの組み合わせによって実現される。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。
各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
各装置の各構成要素の一部又は全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は、集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
なお、上述した各実施の形態は、本発明の好適な実施の形態であり、上記各実施の形態にのみ本発明の範囲を限定するものではなく、本発明の要旨を逸脱しない範囲において当業者が上記各実施の形態の修正や代用を行い、種々の変更を施した形態を構築することが可能である。
本開示によれば、カメラの映像から被写体を解析し表示する解析システムや、解析システムをコンピュータ上で実現するためのプログラムといった用途に適用できる。
上記の実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出手段と、
前記検出手段により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出手段と、
前記算出手段により算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得手段と、
を備える画像処理装置。
(付記2)
前記取得手段は、前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
付記1に記載の画像処理装置。
(付記3)
前記出現位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものであり、
前記出現する被写体の位置が前記出現する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる出現する被写体が、追跡が分断された被写体と判定されるように前記出現妥当性を算出する、
付記1または2に記載の画像処理装置。
(付記4)
前記出現位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものである、
付記3に記載の画像処理装置。
(付記5)
前記出現位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データに出現するときの位置、大きさおよび向きの少なくとも1つを含み、
前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記出現妥当性を算出する、
付記4に記載の画像処理装置。
(付記6)
前記消失位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものであり、
前記消失する被写体の位置が前記消失する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる消失する被写体が、追跡が分断された被写体と判定されるように前記消失妥当性を算出する、
付記1から5の何れか1つに記載の画像処理装置。
(付記7)
前記消失位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものである、
付記6に記載の画像処理装置。
(付記8)
前記消失位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データから消失するときの位置、大きさおよび向きの少なくとも1つを含み、
前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記消失妥当性を算出する、
付記7に記載の画像処理装置。
(付記9)
前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体が撮影された時刻が、前記被写体出現データに含まれる、前記出現する被写体が撮影された時刻よりも前である、前記被写体出現データと前記被写体消失データとの組合せを取得する、
付記1から8の何れか1つに記載の画像処理装置。
(付記10)
前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体の位置と、前記被写体出現データに含まれる、前記出現する被写体の位置とが所定の範囲内である、前記被写体消失データと前記被写体出現データとの組合せを取得する、
付記1から9の何れか1つに記載の画像処理装置。
(付記11)
前記取得手段が取得した組合せに含まれる被写体同士を照合する照合手段を更に備える、
付記1から10の何れか1つに記載の画像処理装置。
(付記12)
前記照合手段による照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する被写体選択手段を更に備える、
付記11に記載の画像処理装置。
(付記13)
複数の被写体を撮影した映像データから前記被写体を検出する被写体検出手段と、
前記検出された被写体を追跡し、該被写体の位置を含む追跡結果を被写体データとして出力する被写体追跡手段と、
前記被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出手段と、
前記検出手段により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出手段と、
前記算出手段により算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得手段と、
前記取得手段が取得した組合せに含まれる被写体同士を照合する照合手段と、
前記照合手段による照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する被写体選択手段と、
を備える映像監視システム。
(付記14)
前記取得手段は、前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
付記13に記載の映像監視システム。
(付記15)
前記出現位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものであり、
前記出現する被写体の位置が前記出現する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる出現する被写体が、追跡が分断された被写体と判定されるように前記出現妥当性を算出する、
付記13または14に記載の映像監視システム。
(付記16)
前記出現位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものである、
付記15に記載の映像監視システム。
(付記17)
前記出現位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データに出現するときの位置、大きさおよび向きの少なくとも1つを含み、
前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記出現妥当性を算出する、
付記16に記載の映像監視システム。
(付記18)
前記消失位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものであり、
前記消失する被写体の位置が前記消失する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる消失する被写体が、追跡が分断された被写体と判定されるように前記消失妥当性を算出する、
付記13から17の何れか1つに記載の映像監視システム。
(付記19)
前記消失位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものである、
付記18に記載の映像監視システム。
(付記20)
前記消失位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データから消失するときの位置、大きさおよび向きの少なくとも1つを含み、
前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記消失妥当性を算出する、
付記19に記載の映像監視システム。
(付記21)
前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体が撮影された時刻が、前記被写体出現データに含まれる、前記出現する被写体が撮影された時刻よりも前である、前記被写体出現データと前記被写体消失データとの組合せを取得する、
付記13から20の何れか1つに記載の映像監視システム。
(付記22)
前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体の位置と、前記被写体出現データに含まれる、前記出現する被写体の位置とが所定の範囲内である、前記被写体消失データと前記被写体出現データとの組合せを取得する、
付記13から21の何れか1つに記載の映像監視システム。
(付記23)
前記被写体を撮影する撮影手段を更に備える、
付記13から22の何れか1つに記載の映像監視システム。
(付記24)
前記映像監視システムは、インテリジェントカメラである、
付記23に記載の映像監視システム。
(付記25)
入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出し、
前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出し、
前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、前記検出された被写体出現データと被写体消失データとの組合せを取得する、
画像処理方法。
(付記26)
前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
付記25に記載の画像処理装置。
(付記27)
複数の被写体を撮影した映像データから前記被写体を検出し、
前記検出された被写体を追跡し、該被写体の位置を含む追跡結果を被写体データとして出力し、
前記被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出し、
前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出し、
前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得し、
前記取得された組合せに含まれる被写体同士を照合し、
照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する、映像監視方法。
(付記28)
前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
付記27に記載の映像監視方法。
(付記29)
入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出処理と、
前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出処理と、
前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、前記検出された被写体出現データと被写体消失データとの組合せを取得する取得処理と、
をコンピュータに実行させるプログラム。
(付記30)
前記取得処理は、前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
付記29に記載のプログラム。
この出願は、2017年1月5日に出願された日本出願特願2017−000653を基礎とする優先権を主張し、その開示の全てをここに取り込む。
10 画像処理装置
11 検出部
12 算出部
13 取得部
100 映像監視システム
101 映像配信装置
201 有効データ抽出装置
210 解析部
211 被写体検出部
212 被写体追跡部
213 被写体再追跡部
2131 検出部
2132 算出部
2133 取得部
2134 記憶部
2135 出現位置分布
2136 消失位置分布
2137 負荷条件情報
2138 照合部
214 被写体選択部
220 有効データ抽出部
301 表示装置
40 被写体検出結果
50 被写体追跡結果
70 被写体検出データ
73 妥当性算出結果
111 組合せ結果
131 被写体再追跡結果
200 映像監視システム
221 撮像装置
230 被写体検出結果
240 被写体検出データ
270 妥当性算出結果
以上のように、本実施の形態に係る画像処理装置10は、学習によって得られた被写体の過去の出現位置分布および消失位置分布と、検出部11が検出した被写体出現データおよび被写体消失データとを用いて、被写体出現データの出現妥当性および被写体消失データの消失妥当性を算出する。被写体出現データの出現妥当性は、被写体出現データに含まれる被写体が出現する被写体であることの妥当性を示すものであり、被写体消失データの消失妥当性は、被写体消失データに含まれる被写体が消失する被写体であることの妥当性を示すものである。取得部13はこれらの出現妥当性および消失妥当性に基づいて、所定の条件を満たす被写体出現データと被写体消失データとの組合せを取得する。
以上のように、本実施の形態では、検出部2131が被写体データから被写体出現データおよび被写体消失データを検出する。そして、算出部2132が学習によって得られた被写体の過去の出現位置分布および消失位置分布と、被写体出現データおよび被写体消失データを用いて、被写体出現データの出現妥当性および被写体消失データの消失妥当性を算出する。被写体出現データの出現妥当性は、被写体出現データに含まれる被写体が出現する被写体であることの妥当性を示すものであり、被写体消失データの消失妥当性は、被写体消失データに含まれる被写体が消失する被写体であることの妥当性を示すものである。取得部2133はこれらの出現妥当性および消失妥当性に基づいて、所定の条件を満たす被写体出現データと被写体消失データとの組合せを取得する。
消失位置分布2136は、被写体が映像データから消失する前の該被写体が最後に含まれるフレームにおける、被写体の位置の分布を表す。消失位置分布2136は、消失する被写体の人数の総数を、フレーム上の位置毎に算出したデータであり、過去の被写体データを用いた学習によって得られたデータである。図9に示す通り、消失位置分布2136は、領域番号91と、x座標範囲92と、y座標範囲93と、消失回数94と、総消失回数95とを含む。なお、図9は、消失位置分布2136の一例であり、消失位置分布2136が図9に示す情報以外の情報を含んでもよい。
そして、算出部2132は、以下の式(2)を用いて消失妥当性を算出する。
例えば、図13に示す、再追跡番号が「1」の被写体の被写体データは、被写体番号43が「101−1」、「102−1」、「103−1」および「104−1」のレコードである。被写体選択部214が選択する映像データが、被写体品質スコア45から順に所定の数(例えば、3つ)である場合、被写体選択部214は、被写体品質スコア45が高い、被写体番号43が「102−1」、「103−1」および「104−1」のレコードを被写体選択結果として出力する。
その後、取得部2133が、ステップS152で算出部2132より算出された出現妥当性および消失妥当性に基づき、ステップS151で検出部2131により検出された被写体出現データと被写体消失データとの、所定の条件を満た組合せを取得する取得処理を行う(ステップS153)。取得部2133は、取得された被写体出現データと被写体消失データとの組合せである取得結果を、照合部2138に出力する。
(付記6)
前記消失位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものであり、
前記消失する被写体の位置が前記消失する頻度がより低い領域の場合、前記算出手段は、前記被写体消失データに含まれる消失する被写体が、追跡が分断された被写体と判定されるように前記消失妥当性を算出する、
付記1から5の何れか1つに記載の画像処理装置。
(付記18)
前記消失位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものであり、
前記消失する被写体の位置が前記消失する頻度がより低い領域の場合、前記算出手段は、前記被写体消失データに含まれる消失する被写体が、追跡が分断された被写体と判定されるように前記消失妥当性を算出する、
付記13から17の何れか1つに記載の映像監視システム。
(付記26)
前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
付記25に記載の画像処理方法
(付記27)
複数の被写体を撮影した映像データから前記被写体を検出し、
前記検出された被写体を追跡し、該被写体の位置を含む追跡結果を被写体データとして出力し、
前記被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出し、
前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出し、
前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす検出された被写体出現データと被写体消失データとの組合せを取得し、
前記取得された組合せに含まれる被写体同士を照合し、
照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する、映像監視方法。

Claims (30)

  1. 入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出手段と、
    前記検出手段により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出手段と、
    前記算出手段により算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得手段と、
    を備える画像処理装置。
  2. 前記取得手段は、前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
    請求項1に記載の画像処理装置。
  3. 前記出現位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものであり、
    前記出現する被写体の位置が前記出現する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる出現する被写体が、追跡が分断された被写体と判定されるように前記出現妥当性を算出する、
    請求項1または2に記載の画像処理装置。
  4. 前記出現位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものである、
    請求項3に記載の画像処理装置。
  5. 前記出現位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データに出現するときの位置、大きさおよび向きの少なくとも1つを含み、
    前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記出現妥当性を算出する、
    請求項4に記載の画像処理装置。
  6. 前記消失位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものであり、
    前記消失する被写体の位置が前記消失する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる消失する被写体が、追跡が分断された被写体と判定されるように前記消失妥当性を算出する、
    請求項1から5の何れか1つに記載の画像処理装置。
  7. 前記消失位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものである、
    請求項6に記載の画像処理装置。
  8. 前記消失位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データから消失するときの位置、大きさおよび向きの少なくとも1つを含み、
    前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記消失妥当性を算出する、
    請求項7に記載の画像処理装置。
  9. 前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体が撮影された時刻が、前記被写体出現データに含まれる、前記出現する被写体が撮影された時刻よりも前である、前記被写体出現データと前記被写体消失データとの組合せを取得する、
    請求項1から8の何れか1つに記載の画像処理装置。
  10. 前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体の位置と、前記被写体出現データに含まれる、前記出現する被写体の位置とが所定の範囲内である、前記被写体消失データと前記被写体出現データとの組合せを取得する、
    請求項1から9の何れか1つに記載の画像処理装置。
  11. 前記取得手段が取得した組合せに含まれる被写体同士を照合する照合手段を更に備える、
    請求項1から10の何れか1つに記載の画像処理装置。
  12. 前記照合手段による照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する被写体選択手段を更に備える、
    請求項11に記載の画像処理装置。
  13. 複数の被写体を撮影した映像データから前記被写体を検出する被写体検出手段と、
    前記検出された被写体を追跡し、該被写体の位置を含む追跡結果を被写体データとして出力する被写体追跡手段と、
    前記被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出手段と、
    前記検出手段により検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出手段と、
    前記算出手段により算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得する取得手段と、
    前記取得手段が取得した組合せに含まれる被写体同士を照合する照合手段と、
    前記照合手段による照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する被写体選択手段と、
    を備える映像監視システム。
  14. 前記取得手段は、前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
    請求項13に記載の映像監視システム。
  15. 前記出現位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものであり、
    前記出現する被写体の位置が前記出現する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる出現する被写体が、追跡が分断された被写体と判定されるように前記出現妥当性を算出する、
    請求項13または14に記載の映像監視システム。
  16. 前記出現位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が最初に前記被写体データに出現する頻度を記録したものである、
    請求項15に記載の映像監視システム。
  17. 前記出現位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データに出現するときの位置、大きさおよび向きの少なくとも1つを含み、
    前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記出現妥当性を算出する、
    請求項16に記載の映像監視システム。
  18. 前記消失位置分布は、画面を縦方向および横方向に分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものであり、
    前記消失する被写体の位置が前記消失する頻度がより低い領域の場合、前記算出手段は、前記被写体出現データに含まれる消失する被写体が、追跡が分断された被写体と判定されるように前記消失妥当性を算出する、
    請求項13から17の何れか1つに記載の映像監視システム。
  19. 前記消失位置分布は、前記領域をさらに前記被写体のフレーム上の大きさおよび前記被写体のフレーム上の向きに応じて分割して生成した領域の各々に対し、前記被写体が前記被写体データから消失する頻度を記録したものである、
    請求項18に記載の映像監視システム。
  20. 前記消失位置分布は、被写体が、前記被写体データに関連するフレームを含む映像データから消失するときの位置、大きさおよび向きの少なくとも1つを含み、
    前記算出手段は、前記位置、前記大きさおよび前記向きの少なくとも1つに基づいて、前記消失妥当性を算出する、
    請求項19に記載の映像監視システム。
  21. 前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体が撮影された時刻が、前記被写体出現データに含まれる、前記出現する被写体が撮影された時刻よりも前である、前記被写体出現データと前記被写体消失データとの組合せを取得する、
    請求項13から20の何れか1つに記載の映像監視システム。
  22. 前記取得手段は、前記被写体消失データに含まれる、前記消失する被写体の位置と、前記被写体出現データに含まれる、前記出現する被写体の位置とが所定の範囲内である、前記被写体消失データと前記被写体出現データとの組合せを取得する、
    請求項13から21の何れか1つに記載の映像監視システム。
  23. 前記被写体を撮影する撮影手段を更に備える、
    請求項13から22の何れか1つに記載の映像監視システム。
  24. 前記映像監視システムは、インテリジェントカメラである、
    請求項23に記載の映像監視システム。
  25. 入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出し、
    前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出し、
    前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、前記検出された被写体出現データと被写体消失データとの組合せを取得する、
    画像処理方法。
  26. 前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
    請求項25に記載の画像処理装置。
  27. 複数の被写体を撮影した映像データから前記被写体を検出し、
    前記検出された被写体を追跡し、該被写体の位置を含む追跡結果を被写体データとして出力し、
    前記被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出し、
    前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出し、
    前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす前記検出手段により検出された被写体出現データと被写体消失データとの組合せを取得し、
    前記取得された組合せに含まれる被写体同士を照合し、
    照合の結果に基づいて、前記被写体データから、前記被写体の撮影条件によって算出された被写体の品質を表す被写体品質スコアを用いて、他の所定の条件を満たす被写体データを選択する、映像監視方法。
  28. 前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
    請求項27に記載の映像監視方法。
  29. 入力される複数の被写体の位置を含む被写体データから、出現する被写体を含む被写体出現データと、消失する被写体を含む被写体消失データとを検出する検出処理と、
    前記検出された被写体出現データおよび被写体消失データと予め学習された被写体の出現位置分布および消失位置分布とに基づき、前記被写体出現データの出現妥当性と前記被写体消失データの消失妥当性とを算出する算出処理と、
    前記算出された出現妥当性および消失妥当性に基づき、所定の条件を満たす、前記検出された被写体出現データと被写体消失データとの組合せを取得する取得処理と、
    をコンピュータに実行させるプログラムを格納した記録媒体。
  30. 前記取得処理は、前記被写体出現データと前記被写体消失データとの組合せの数が所定の閾値以下の組合せを取得する、
    請求項29に記載のプログラムを格納した記録媒体。
JP2018560382A 2017-01-05 2017-12-27 画像処理装置、映像監視システム、画像処理方法およびプログラム Pending JPWO2018128138A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017000653 2017-01-05
JP2017000653 2017-01-05
PCT/JP2017/046826 WO2018128138A1 (ja) 2017-01-05 2017-12-27 画像処理装置、映像監視システム、画像処理方法およびプログラムを格納した記録媒体

Publications (1)

Publication Number Publication Date
JPWO2018128138A1 true JPWO2018128138A1 (ja) 2019-11-07

Family

ID=62789334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018560382A Pending JPWO2018128138A1 (ja) 2017-01-05 2017-12-27 画像処理装置、映像監視システム、画像処理方法およびプログラム

Country Status (3)

Country Link
US (2) US11074695B2 (ja)
JP (1) JPWO2018128138A1 (ja)
WO (1) WO2018128138A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6943333B2 (ja) * 2018-03-23 2021-09-29 日本電気株式会社 オブジェクト追跡装置、オブジェクト追跡方法、及びオブジェクト追跡プログラム
KR102114687B1 (ko) * 2019-05-10 2020-05-25 정원주 오브젝트 트랙킹 방법 및 장치

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6687386B1 (en) * 1999-06-15 2004-02-03 Hitachi Denshi Kabushiki Kaisha Object tracking method and object tracking apparatus
JP3768073B2 (ja) * 1999-06-15 2006-04-19 株式会社日立国際電気 物体追跡方法及び物体追跡装置
TWI416068B (zh) * 2009-12-10 2013-11-21 Ind Tech Res Inst 跨感測器間之物體追蹤方法與系統
JP5803763B2 (ja) 2012-03-15 2015-11-04 富士通株式会社 移動物体の動線補間装置、方法、及びプログラム
JP6377533B2 (ja) 2015-01-06 2018-08-22 Kddi株式会社 オクルージョン発生時に専用の識別器を用いて物体を追跡する装置、プログラム及び方法

Also Published As

Publication number Publication date
US20200043175A1 (en) 2020-02-06
WO2018128138A1 (ja) 2018-07-12
US11074695B2 (en) 2021-07-27
US20190355130A1 (en) 2019-11-21
US11074696B2 (en) 2021-07-27

Similar Documents

Publication Publication Date Title
US10769480B2 (en) Object detection method and system
JP5991224B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
RU2607774C2 (ru) Способ управления в системе захвата изображения, устройство управления и машиночитаемый носитель данных
US11527000B2 (en) System and method for re-identifying target object based on location information of CCTV and movement information of object
JP6172551B1 (ja) 画像検索装置、画像検索システム及び画像検索方法
CN109426785B (zh) 一种人体目标身份识别方法及装置
CN109299658B (zh) 脸部检测方法、脸部图像渲染方法、装置及存储介质
WO2021051547A1 (zh) 暴力行为检测方法及系统
US10496874B2 (en) Facial detection device, facial detection system provided with same, and facial detection method
CN110675426B (zh) 人体跟踪方法、装置、设备及存储介质
KR20220098030A (ko) 타깃 운동 궤적 구축 방법, 기기 및 컴퓨터 저장 매체
WO2018128138A1 (ja) 画像処理装置、映像監視システム、画像処理方法およびプログラムを格納した記録媒体
US20160110909A1 (en) Method and apparatus for creating texture map and method of creating database
US11544926B2 (en) Image processing apparatus, method of processing image, and storage medium
JP6798609B2 (ja) 映像解析装置、映像解析方法およびプログラム
JP5954212B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
US10248853B2 (en) Image output device, image output method, and computer program product
JP7312026B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2018190132A (ja) 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法
CN114332981A (zh) 人脸活体检测方法、装置、电子设备及存储介质
JP6132996B1 (ja) 画像処理装置,画像処理方法,画像処理プログラム
WO2020217369A1 (ja) オブジェクト特徴量抽出装置、オブジェクト特徴量抽出方法及び非一時的なコンピュータ可読媒体
JP6789676B2 (ja) 画像処理装置、画像処理方法およびプログラム
CN112434671B (zh) 一种行人快照优选方法、装置、计算机设备及存储介质
US20230237778A1 (en) Real time face swapping system and methods thereof

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190621