JP2023102120A - 画像処理装置、画像処理方法、及びプログラム - Google Patents
画像処理装置、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP2023102120A JP2023102120A JP2022002499A JP2022002499A JP2023102120A JP 2023102120 A JP2023102120 A JP 2023102120A JP 2022002499 A JP2022002499 A JP 2022002499A JP 2022002499 A JP2022002499 A JP 2022002499A JP 2023102120 A JP2023102120 A JP 2023102120A
- Authority
- JP
- Japan
- Prior art keywords
- tracking
- person
- image
- time
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/62—Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/167—Detection; Localisation; Normalisation using comparisons between temporally consecutive images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30232—Surveillance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Image Analysis (AREA)
Abstract
【課題】画像内の人物の追尾結果を用いて人物の行動を検知する際の検知精度を向上させる。【解決手段】人物を撮像した画像を取得する取得手段と、前記画像内の人物を検出して追尾する追尾手段と、前記追尾手段の追尾結果に基づく人物の行動検知のための処理を制御する制御手段と、を有し、前記追尾結果は、検出された人物に対する追尾の状態を表す状態情報を含み、前記制御手段は、前記処理の種別及び前記状態情報に基づいて、前記追尾結果を使用するかを制御することを特徴とする。【選択図】図7
Description
本発明は、画像内の物体を解析するための技術に関する。
人物の行動や属性を解析する方法として、監視カメラの画像から人物を検出・追尾し、追尾した人物毎に行動や属性の解析を行う方法がある。人物同士が画像上で重なっている場合、人物特徴の抽出が正確に行えない可能性があるため、人物同士の重なりを考慮して解析を行う。特許文献1では、人物検索において、他の被写体と交錯している場合には、人物の特徴量を更新しないことが開示されている。特許文献2では、人物の年齢・性別等の属性推定において、他の人物と重なっている間は推定スコアを低くすることが開示されている。
人物が重なっている場合には、覆い隠されている人物の画像での特徴が減ることから、人物の検出・追尾精度が低下するのが一般的である。しかし、行動検知では撮影範囲内にいるそれぞれの人物の行動パターンを連続的に追跡したいため、人物が重なったことで検出・追尾精度が低下した追尾結果を一律無視すると、行動検知において使用する情報量が低下し、誤検知・未検知の発生確率が高まる。一方、人物が重なったことで検出・追尾精度が低下した追尾結果を一律採用すると、行動検知において使用する情報の精度が低下し、追尾人物の入れ替わり等による誤検知の発生確率が高まる。
本発明は上述した問題を解決するためになされたものであり、画像内の人物の追尾結果を用いて人物の行動を検知する際の検知精度を向上させることを目的とする。
本発明に係る画像処理装置は、人物を撮像した画像を取得する取得手段と、前記画像内の人物を検出して追尾する追尾手段と、前記追尾手段の追尾結果に基づく人物の行動検知のための処理を制御する制御手段と、を有し、前記追尾結果は、検出された人物に対する追尾の状態を表す状態情報を含み、前記制御手段は、前記処理の種別及び前記状態情報に基づいて、前記追尾結果を使用するかを制御することを特徴とする。
本発明によれば、画像内の人物の追尾結果を用いて人物の行動を検知する際の検知精度を向上させることができる。
以下、添付の図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
<実施形態1>
本実施形態では、画像処理システムの一例として、コンビニエンスストア等の小売店舗に設置されたカメラから出力され画像を解析して、画像内の人物の不審行動を検知した時に検知イベントを別のシステムに送信する監視システムについて説明する。本実施形態では、人物の不審行動として単独行動を検知する場合について説明する。
本実施形態では、画像処理システムの一例として、コンビニエンスストア等の小売店舗に設置されたカメラから出力され画像を解析して、画像内の人物の不審行動を検知した時に検知イベントを別のシステムに送信する監視システムについて説明する。本実施形態では、人物の不審行動として単独行動を検知する場合について説明する。
図1は、実施形態1に係る画像処理システムの構成を示す図である。画像処理システムは、撮像装置100と、画像処理装置200から構成される。撮像装置100は、カメラであり、店舗内に複数設置されており、従業員や客を撮影する。撮像装置100と、画像処理装置200は、通信ネットワークを介して接続する。具体的には、有線LAN(Local Area Network)、無線LAN等のコンピュータネットワークで接続する。
撮像装置100は、撮像部101と、画像送信部102から構成される。撮像部101は、撮像レンズ、及びCCDやCMOS等の撮像センサと、信号処理部等から構成される。撮像された画像は、所定の時間間隔で画像送信部102に送られる。画像送信部102は、撮像部101から取得した画像に、撮像装置情報及び時刻等の付加情報を付与して、通信ネットワークで送信可能なデータに変換する。そして、画像送信部102は、変換後のデータを、画像処理装置200へ送信する。
次に、画像処理装置200の有する機能構成について説明する。画像処理装置200は、画像受信部202、人物追尾部203、検知制御部204、追尾結果記憶部205、パラメーター算出部206、パラメーター記憶部207、単独行動判定部208、及び検知結果送信部209の機能を有する。
画像受信部202は、撮像装置100からデータを受信し、受信したデータから画像を取得して人物追尾部203へ順次提供する。
人物追尾部203は、画像内の人物を検出し、検出した人物を画像間で対応付ける追尾処理を行う。人物追尾部203は、まず、機械学習を用いて人物の画像上の位置を検出する。人物の画像上の位置は、画像の左上を原点として、人物を囲む矩形の中心座標、矩形のサイズ(幅、高さ)で表現する。次に、検出した人物を連続する画像間で対応付ける。具体的には、連続するフレーム間で、矩形の中心座標を結ぶ線分の長さ、矩形のサイズの変化量、過去の追尾処理により得られた人物の予測位置を用いて、各フレームから検出した各人物に対して対応付けを行う。人物追尾部203は、連続する画像内の同一人物を識別出来るように、検出した人物に対して追尾IDを付与する。追尾IDは、過去に検出された人物との同一性を表す識別子である。過去フレームで検出済みの人物には、過去フレームと同一の追尾IDが付与される。一方、新規に検出した人物には新規の追尾IDが付与される。また、人物追尾部203は、検出した人物に対して、追尾IDと共に、追尾の状態を表す状態情報としての追尾保留情報を付与する。本実施形態において、追尾保留情報には、保留状態と通常状態がある。人物が重なって写っている場合等、追尾IDが入れ替わっている確率が所定値以上である場合、追尾保留情報は保留状態となる。一方で、追尾IDが入れ替わっている確率が所定値未満である場合、追尾保留情報は通常状態となる。保留状態は、検出した人物に対して、付与する追尾IDの候補が複数ある場合、つまり追尾尤度が所定値以上である追尾IDが複数ある場合に発生する。追尾尤度は、追尾の信頼度を表すスカラ値であり、値域は0.0から1.0である。また、人物同士の重なり度合が所定値以上である場合に、追尾保留情報を保留状態としてもよい。
人物追尾部203は、画像内の人物を検出し、検出した人物を画像間で対応付ける追尾処理を行う。人物追尾部203は、まず、機械学習を用いて人物の画像上の位置を検出する。人物の画像上の位置は、画像の左上を原点として、人物を囲む矩形の中心座標、矩形のサイズ(幅、高さ)で表現する。次に、検出した人物を連続する画像間で対応付ける。具体的には、連続するフレーム間で、矩形の中心座標を結ぶ線分の長さ、矩形のサイズの変化量、過去の追尾処理により得られた人物の予測位置を用いて、各フレームから検出した各人物に対して対応付けを行う。人物追尾部203は、連続する画像内の同一人物を識別出来るように、検出した人物に対して追尾IDを付与する。追尾IDは、過去に検出された人物との同一性を表す識別子である。過去フレームで検出済みの人物には、過去フレームと同一の追尾IDが付与される。一方、新規に検出した人物には新規の追尾IDが付与される。また、人物追尾部203は、検出した人物に対して、追尾IDと共に、追尾の状態を表す状態情報としての追尾保留情報を付与する。本実施形態において、追尾保留情報には、保留状態と通常状態がある。人物が重なって写っている場合等、追尾IDが入れ替わっている確率が所定値以上である場合、追尾保留情報は保留状態となる。一方で、追尾IDが入れ替わっている確率が所定値未満である場合、追尾保留情報は通常状態となる。保留状態は、検出した人物に対して、付与する追尾IDの候補が複数ある場合、つまり追尾尤度が所定値以上である追尾IDが複数ある場合に発生する。追尾尤度は、追尾の信頼度を表すスカラ値であり、値域は0.0から1.0である。また、人物同士の重なり度合が所定値以上である場合に、追尾保留情報を保留状態としてもよい。
図2を用いて、追尾処理について具体的に説明する。
図2(a)は、ある時点での画像における追尾結果を示すイメージ図である。図2(a)では、3人の人物401~403が検出され、各人物に対して追尾処理が行われている。人物401には追尾ID「1」が付与され、人物402には追尾ID「2」が付与され、人物403には追尾ID「3」が付与されている。また、3人の人物401~403には、追尾保留情報として、通常状態が付与されている。
図2(b)、図2(c)、図2(d)は、図2(a)の時点から、ある時間経過後の画像における追尾結果を示すイメージ図である。図2(b)、図2(c)、図2(d)に示す画像は、人物402が画像の右方向に移動して、人物403と重なっている状態を写す。図2(b)、図2(c)、図2(d)を用いて、人物同士が重なった場合に起こり得る追尾結果のパターンについて説明する。
図2(a)は、ある時点での画像における追尾結果を示すイメージ図である。図2(a)では、3人の人物401~403が検出され、各人物に対して追尾処理が行われている。人物401には追尾ID「1」が付与され、人物402には追尾ID「2」が付与され、人物403には追尾ID「3」が付与されている。また、3人の人物401~403には、追尾保留情報として、通常状態が付与されている。
図2(b)、図2(c)、図2(d)は、図2(a)の時点から、ある時間経過後の画像における追尾結果を示すイメージ図である。図2(b)、図2(c)、図2(d)に示す画像は、人物402が画像の右方向に移動して、人物403と重なっている状態を写す。図2(b)、図2(c)、図2(d)を用いて、人物同士が重なった場合に起こり得る追尾結果のパターンについて説明する。
図2(b)では、3人の人物401~403が検出され、人物401には追尾ID「1」が付与され、人物402には追尾ID「2」が付与され、人物403には追尾ID「3」が付与された場合を示す。この場合では、検出された人物の画像間の対応付けが正しく出来ている。但し、人物402,403には、追尾保留情報として、保留状態が付与されている。これは、人物402に対する追尾IDの候補として、「2」と「3」の追尾尤度がそれぞれ所定値以上であるためである。同様に、人物403に対する追尾IDの候補として、「3」と「2」の追尾尤度がそれぞれ所定値以上であるためである。以下、追尾IDが付与された人物を囲む矩形を追尾矩形と呼ぶ。
図2(c)では、3人の人物401~403が検出され、人物401には追尾ID「1」が付与され、人物402には追尾ID「3」が付与され、人物403には追尾ID「2」が付与された場合を示す。この場合では、人物402と人物403の追尾IDが、入れ替わってしまっている。このように、追尾IDが入れ替わった状態の追尾矩形をそのまま用いて、人物の行動を検知すると、正規の情報に別人の情報が混合し、ノイズとなってしまう。例えば、追尾IDが「2」についての一連の追尾矩形に関する追尾情報では、図2(a)の時点で人物402に紐づき、図2(c)時点で人物402とは別の人物である人物403に紐づいている。
以下、これについて更に詳しく説明する。実際には、人物402は画像の右方向へ移動している。ここで、図2(c)の追尾結果を含む追尾情報の時系列変化を用いると、図2(a)の人物402から図2(c)の人物403に向かう方向、つまり画像の右上方向に移動していることになってしまう。また、人物402と人物403の位置の違い・体格の違い・服装の違い等により、追尾矩形のサイズが、同一の人物を追尾した場合とは異なる変化をしてしまう。そのため、行動検知処理にて誤検知や未検知が発生する可能性がある。但し、図2(c)では、人物402,403に対する各追尾結果に対して、保留状態を示す追尾保留情報が付与されている。そこで、本実施形態では、行動検知処理において、追尾保留状態であること、即ち追尾IDが入れ替わっている可能性が高いことを加味して処理を行う。これにより、誤検知や未検知を抑制することが可能となる。
図2(d)では、人物同士の重なりの影響で、手前の人物402については検出されたが、奥の人物403については未検出の場合を示す。この場合でも、人物402に対する追尾IDの候補としての「2」と「3」の追尾尤度がそれぞれ所定値以上であるため、人物402には、保留状態を示す追尾保留情報が付与されている。
人物追尾部203は、追尾処理が完了すると、処理対象とした画像、及び当該画像に対する追尾結果を、検知制御部204へ提供する。図3は、追尾結果の例を示す。図3の例では、画像から検出された各人物に対する追尾結果を示す。図3に示すように、追尾結果は、追尾ID、追尾矩形中心座標(x、y)、追尾矩形サイズ(幅、高さ)、及び追尾保留情報を含む情報である。人物追尾部203は、画像受信部202から受信した画像に対して順次追尾処理を行って、得られた追尾結果を検知制御部204へ順次提供する。
検知制御部204は、人物追尾部203から追尾結果を受け取り、行動検知に関する複数の処理を制御する。検知制御部204は、実行対象の処理の種別に応じて、追尾保留情報が通常状態と保留状態の両方の追尾結果を含む追尾結果リストを使用するか、追尾保留情報が通常状態の追尾結果のみを含む追尾結果リストを作成して使用するかを制御する。具体的には、追尾矩形の時系列変化を基にしない処理については、保留状態も含む追尾結果リストを使用し、追尾矩形の時系列変化を基にする処理については、保留状態を除外した追尾結果リストを使用する。
本実施形態では、行動検知に関する処理として、パラメーター算出部206で実行する、単独行動判定用のパラメーター算出処理と、単独行動判定部208で実行する、単独行動判定処理の2種類がある。検知制御部204は、追尾矩形の時系列変化を基にする処理であるパラメーター算出処理については、保留状態を除外した追尾結果リストを作成して使用するよう制御する。また、検知制御部204は、追尾矩形の時系列変化を基にしない処理である、単独行動判定処理については、保留状態も含む追尾結果リストを使用するよう制御する。
パラメーター算出部206は、位置推定用パラメーターを算出するためのパラメーター算出処理を行う。位置推定用パラメーターは、画像座標を三次元位置情報に変換するためのパラメーターであり、単独行動判定処理で用いられる。まず、パラメーター算出部206は、保留状態を除外した追尾結果リストを作成する。具体的には、検知制御部204から取得した追尾結果のうち、追尾保留情報が保留状態であるものを除外して、追尾結果記憶部205へ順次格納する。これにより、追尾結果記憶部205には追尾保留情報が通常状態である追尾結果のみを含む時系列データが、追尾結果リストとして作成される。次に、パラメーター算出部206は、追尾結果記憶部205に格納される追尾結果リストから過去の追尾結果を読み出し、読み出した追尾結果と今回取得した追尾結果を用いて、位置推定用パラメーターを算出する。そして、算出した位置推定用パラメーターをパラメーター記憶部207へ格納する。
以下、位置推定用パラメーターの算出方法について説明する。画像上の物体サイズに関して、検出平面(検出対象の物体の中心座標が移動する仮想平面)上の位置情報と物体サイズの関係式は、以下の式(1)で定義できる。
W1=a(x-xm)+b(y-ym)+wm・・・(1)
但し、各符号は以下を表す。
W1:人体サイズ
x,y:追尾矩形中心座標
xm,ym:読み出した追尾結果の追尾矩形中心座標の平均値
wm:読み出した追尾結果の追尾矩形サイズ(幅)の平均値
a,b:推定パラメーター
W1=a(x-xm)+b(y-ym)+wm・・・(1)
但し、各符号は以下を表す。
W1:人体サイズ
x,y:追尾矩形中心座標
xm,ym:読み出した追尾結果の追尾矩形中心座標の平均値
wm:読み出した追尾結果の追尾矩形サイズ(幅)の平均値
a,b:推定パラメーター
W1としては、追尾矩形サイズ(幅)を使用する。また、追尾矩形サイズ(高さ)を用いることも可能であるが、安定して計算するには追尾矩形サイズ(幅)を用いる方が適している。画像の縦(y)方向は、座標が1ピクセル動くだけでも、横(x)方向よりも奥行位置への影響が大きいため、追尾矩形のずれの影響を受けやすくなるためである。a,bの推定パラメーターは、最小二乗法を利用して、取得した追尾矩形から算出することができる。ここで、パラメーター算出部206は、すべての追尾矩形を使用せずに、所定時間に所定距離以上移動した追尾矩形を用いて、a,bの推定パラメーターを算出する。ポスター等へ誤追尾した追尾矩形の除去や、追尾矩形の座標偏りの防止のためである。ここで、追尾IDが入れ替わっている場合、所定時間に所定距離以上移動したかどうか判定する際に、誤判定の可能性がある。本実施形態では、追尾保留状態の追尾矩形が除外されているため、誤判定の可能性が軽減される。そのため、推定パラメーターの算出精度の向上を図ることができる。パラメーター算出部206は、上記の式(1)を用いて算出したa,b、及びxm,ym,wmを、位置推定用パラメーターとしてパラメーター記憶部207に格納する。
単独行動判定部208は、検知制御部204から受け取った追尾結果と、パラメーター記憶部207から読み出した位置推定用パラメーターと、に基づいて、追尾中の各人物に対して、単独行動判定処理を行う。単独行動判定部208は、検知対象人物が他のすべての人物から所定の閾値以上離れている場合、または近接している人物がいても、すべての近接人物から検知対象人物への視界を遮る位置に遮蔽物が存在している場合、検知対象人物の行動を単独行動と判定する。
まず、単独行動判定部208は、追尾矩形の中心座標x,yと、読み出した位置推定用パラメーターを用いて、各人物の追尾矩形の画像座標を三次元位置情報に変換する。具体的には、単独行動判定部208は、追尾矩形の中心座標x,yと、読み出したa,b,xm,ym,wm、を、上記式(1)に代入して推定人体サイズとしてのW2を求める。即ち、W2は、a(x-xm)+b(y-ym)+wmで表される。
次に、単独行動判定部208は、追尾矩形の中心座標x,yと、推定物体サイズW2と、以下の式(2)~(4)を用いて、三次元位置情報X,Y,Zを求める。
Z=focal×B/W2 ・・・(2)
X=Z×(x-cx)/focal ・・・(3)
Y=Z×(y-cy)/focal ・・・(4)
但し、各符号は以下を表す。
X,Y,Z:三次元位置情報
W2:推定人体サイズ
x,y:追尾矩形の中心座標
B:人体サイズの平均値
focal:カメラ焦点距離
cx,cy:画像中心座標
上記のBは、追尾矩形サイズ(幅)として肩幅を想定している場合、平均的な0.43m等の値を利用することができる。上記のfocalは、画像の拡張領域に記載されている値を使用してもよく、撮像部101から撮像装置情報として取得される値を使用してもよい。上記のcx,cyは、表示部415(図5)の画面サイズから得られる画面中央の座標を使用してもよい。
Z=focal×B/W2 ・・・(2)
X=Z×(x-cx)/focal ・・・(3)
Y=Z×(y-cy)/focal ・・・(4)
但し、各符号は以下を表す。
X,Y,Z:三次元位置情報
W2:推定人体サイズ
x,y:追尾矩形の中心座標
B:人体サイズの平均値
focal:カメラ焦点距離
cx,cy:画像中心座標
上記のBは、追尾矩形サイズ(幅)として肩幅を想定している場合、平均的な0.43m等の値を利用することができる。上記のfocalは、画像の拡張領域に記載されている値を使用してもよく、撮像部101から撮像装置情報として取得される値を使用してもよい。上記のcx,cyは、表示部415(図5)の画面サイズから得られる画面中央の座標を使用してもよい。
続いて、単独行動判定部208は、追尾中の各人物の三次元位置を推定した後、全人物から2人物毎のペアを作成する。そして、以下の式(5)を用いて、作成したペア毎に人物間距離を計算する。
但し、各符号は以下を表す。
d:人物間距離
Xi,Yi,Zi:人物iについて推定した三次元位置
Xj,Yj,Zj:人物jについて推定した三次元位置
上記のdは、推定した各人物の三次元位置間のユークリッド距離である。
d:人物間距離
Xi,Yi,Zi:人物iについて推定した三次元位置
Xj,Yj,Zj:人物jについて推定した三次元位置
上記のdは、推定した各人物の三次元位置間のユークリッド距離である。
単独行動判定部208は、追尾中の人物を一人ずつ検知対象として順に処理し、検知対象人物と他のすべての人物との人物間距離を算出し、人物間距離が所定の閾値未満であるかを判定する。そして、所定の閾値未満である他の人物が存在しない場合、近接人物がいないので、検知対象人物は単独行動していると判定する。
また、単独行動判定部208は、カメラ画像上の遮蔽物位置を事前に推定しておく。そして、検知対象人物について、近接人物がいても、近接人物すべてから検知対象人物への視界を遮るように遮蔽物が存在している場合には、検知対象人物は単独行動していると判定する。単独行動判定部208は、追尾中のすべての人物を検知対象として単独行動判定処理を行い、単独行動判定結果を検知結果送信部209へ提供する。
また、単独行動判定部208は、カメラ画像上の遮蔽物位置を事前に推定しておく。そして、検知対象人物について、近接人物がいても、近接人物すべてから検知対象人物への視界を遮るように遮蔽物が存在している場合には、検知対象人物は単独行動していると判定する。単独行動判定部208は、追尾中のすべての人物を検知対象として単独行動判定処理を行い、単独行動判定結果を検知結果送信部209へ提供する。
検知結果送信部209は、単独行動判定部208で実行された単独行動判定結果を受け取り、予め登録された送信先に対して、単独行動判定結果を送信する。
前述のとおり、パラメーター算出処理と単独行動判定処理では、追尾保留状態の追尾結果の使用有無が異なる。パラメーター算出処理では、追尾保留状態の追尾矩形を使用せずに、位置推定用パラメーターの計算を行う。一方で、単独行動判定処理では、追尾保留状態の追尾矩形も使用する。以下、単独行動判定処理では、追尾保留状態の追尾矩形も使用する理由について、図4の例を用いて説明する。
図4(a)は、ある時点での画像内の人物に対して追尾ID及び追尾保留情報を付記したイメージ図である。人物601には追尾ID「1」が付与され、人物602には追尾ID「2」が付与され、人物603には追尾ID「3」が付与されている。また、人物601は、追尾保留情報が通常状態となっているが、人物602及び人物603は、重なって写っている影響で追尾保留状態となっている。人物601と人物602は近接しており、人物602と人物603は近接している。そのため、3名とも単独行動を行っていない。このような状態で、図4(b)に示すように、追尾保留状態の追尾矩形を、単独行動判定処理に使用しないとする。この場合、人物601の追尾ID「1」の追尾矩形のみが残り、他の人物の追尾矩形が追尾ID「1」の単独行動判定処理に使用されない。そのため、単独行動判定部208は、追尾ID「1」に近接人物が存在しないと判定し、人物601を単独行動していると誤判定してしまう。本実施形態では、単独行動判定処理では、追尾保留状態の追尾矩形も使用するため、上記のような誤判定を回避することが可能となる。なお、追尾ID「1」から見た時に近接人物がいるか判定するには、近接人物が追尾ID「2」か「3」かは重要ではない。追尾ID「2」と「3」が入れ替わっていてもいなくても、近接位置に人物を検出しているという点が重要である。
次に、画像処理装置200のハードウェア構成について、図5を参照しながら説明する。画像処理装置200は、CPU411と、ROM412と、RAM413と、ストレージ414と、表示部415と、入力I/F416と、通信部417とを有している。CPU411は、ROM412に記憶された制御プログラムを読み出して、各種処理を実行する。RAM413は、CPU411の主メモリ、ワークエリア等の一時記憶領域として用いられる。ストレージ414は、各種データや各種プログラム等を記憶する。表示部415は、CPU411の制御下で、各種情報を表示する。なお、表示部415はタッチパネルと一体型の表示装置であってもよい。入力I/F416は、操作情報を入力するためのインターフェースである。通信部417は、CPU411の制御下で、有線または無線の通信ネットワークを介して撮像装置100等の外部装置との通信処理を行う。
なお、画像処理装置200の機能やフローチャートに示す各処理は、CPU411がROM412又はストレージ414に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。また、他の例としては、CPU411は、ROM412等に替えて、SDカード等の記録媒体に格納されているプログラムを読み出してもよい。また、ROM412又はストレージ414が、図1に示す追尾結果記憶部205及びパラメーター記憶部207が保持するデータを格納する記憶領域を提供してもよい。
なお、本実施形態では、画像処理装置200は、1つのプロセッサ(CPU411)が1つのメモリ(ROM412)を用いて後述するフローチャートに示す各処理を実行するものとするが、他の様態であっても構わない。例えば複数のプロセッサーや複数のRAM、ROM及びストレージを協働させて後述するフローチャートに示す各処理を実行することもできる。また、ハードウェア回路を用いて一部の処理を実行するようにしてもよい。また、CPU以外のプロセッサーを用いて後述する画像処理装置200の機能や処理を実現することとしてもよい(例えば、CPUに替えてGPU(Graphics Processing Unit)を用いることとしてもよい)。
次に、本実施形態の撮像装置100の処理について、図6のフローチャートを用いて説明する。以下のフローチャートの説明では、各工程(ステップ)について先頭にSを付けて表記することで、工程(ステップ)の表記を省略する。本フローチャートの処理は、撮像装置100のCPUが撮像装置100の記憶装置に記憶されるプログラムを実行することにより実現される。以下、図6のフローチャートでは、各ステップの処理の実行主体を撮像装置100として記載するが、具体的には撮像装置100のCPUが各ステップの処理の実行主体である。
S101において、撮像装置100が、撮像部101を用いて画像を取得する。
S102において、撮像装置100が、画像送信部102を用いてS101で取得した画像を画像処理装置200へ送信する。
S103において、画像送信の停止要求がない限り、撮像装置100が、画像の取得(S101)と、画像の送信(S102)を所定の時間間隔で繰り返し実行する。画像送信の停止要求があった場合、図6に示す一連のフローチャートが終了する。
S101において、撮像装置100が、撮像部101を用いて画像を取得する。
S102において、撮像装置100が、画像送信部102を用いてS101で取得した画像を画像処理装置200へ送信する。
S103において、画像送信の停止要求がない限り、撮像装置100が、画像の取得(S101)と、画像の送信(S102)を所定の時間間隔で繰り返し実行する。画像送信の停止要求があった場合、図6に示す一連のフローチャートが終了する。
図7は、本実施形態に係る画像処理装置200が実行する処理を示すフローチャートである。本フローチャートは、撮像装置100から画像の受信を開始した場合に開始される。
まず、S201において、画像受信部202は、撮像装置100から画像を受信する。
S202において、人物追尾部203は、S201で受信した画像に対して、人物検出と追尾処理を行い、追尾処理の結果を表す追尾結果を生成する。本フローチャートは繰り返し実行されるため、本ステップにより追尾結果が連続的に生成される。
S203において、検知制御部204は、パラメーター算出モードが設定中であるどうかの判定を行う。検知制御部204がパラメーター算出モードが設定中であると判定した場合、処理はS204へ進み、パラメーター算出モードが設定中でないと判定した場合、処理はS210へ進む。
S204において、パラメーター算出部206は、S202で得られた追尾結果のうち、追尾保留状態が保留状態のものを除外する。
S205において、パラメーター算出部206は、S204で除外されずに残った追尾結果を、追尾結果記憶部205に保存する。本フローチャートは繰り返し実行されるため、本ステップにより追尾結果が時系列で蓄積される。
S206において、パラメーター算出部206は、前回のパラメーター算出時刻から所定時間経過したか否かを判定する。パラメーター算出部206が前回のパラメーター算出時刻からの経過時間が所定時間以上と判定した場合、処理はS207へ進み、所定時間未満と判定した場合、処理はS210へ進む。
S202において、人物追尾部203は、S201で受信した画像に対して、人物検出と追尾処理を行い、追尾処理の結果を表す追尾結果を生成する。本フローチャートは繰り返し実行されるため、本ステップにより追尾結果が連続的に生成される。
S203において、検知制御部204は、パラメーター算出モードが設定中であるどうかの判定を行う。検知制御部204がパラメーター算出モードが設定中であると判定した場合、処理はS204へ進み、パラメーター算出モードが設定中でないと判定した場合、処理はS210へ進む。
S204において、パラメーター算出部206は、S202で得られた追尾結果のうち、追尾保留状態が保留状態のものを除外する。
S205において、パラメーター算出部206は、S204で除外されずに残った追尾結果を、追尾結果記憶部205に保存する。本フローチャートは繰り返し実行されるため、本ステップにより追尾結果が時系列で蓄積される。
S206において、パラメーター算出部206は、前回のパラメーター算出時刻から所定時間経過したか否かを判定する。パラメーター算出部206が前回のパラメーター算出時刻からの経過時間が所定時間以上と判定した場合、処理はS207へ進み、所定時間未満と判定した場合、処理はS210へ進む。
S207において、パラメーター算出部206は、今回のS202で得られた追尾結果を含む過去の追尾結果を追尾結果記憶部205から読み出す。
S208において、パラメーター算出部206は、S207で読み出した追尾結果を用いて位置推定用パラメーターを算出する。位置推定用パラメーターを算出する際に、読み出した追尾結果のうち、所定時間に所定距離以上移動した追尾矩形を用いるが、本ステップでは、追尾保留状態の追尾結果が除外された追尾結果リストを用いる。そのため、別人の追尾矩形の混在が妨げられ、ノイズの発生を抑制できる。
S209において、パラメーター算出部206は、S208で算出した位置推定用パラメーターとパラメーター算出時刻(現在時刻)を、パラメーター記憶部207に保存する。
S208において、パラメーター算出部206は、S207で読み出した追尾結果を用いて位置推定用パラメーターを算出する。位置推定用パラメーターを算出する際に、読み出した追尾結果のうち、所定時間に所定距離以上移動した追尾矩形を用いるが、本ステップでは、追尾保留状態の追尾結果が除外された追尾結果リストを用いる。そのため、別人の追尾矩形の混在が妨げられ、ノイズの発生を抑制できる。
S209において、パラメーター算出部206は、S208で算出した位置推定用パラメーターとパラメーター算出時刻(現在時刻)を、パラメーター記憶部207に保存する。
S210において、単独行動判定部208は、パラメーター記憶部207から位置推定用パラメーターを読み出す。
S211において、単独行動判定部208は、読み出した位置推定用パラメーターと、今回のS202で得られた追尾結果を用いて、当該追尾結果の各人物について単独行動判定処理を行う。具体的には、各人物について人物間距離を推定し、人物間距離が所定の閾値未満である他の人物が存在しない場合、単独行動をしていると判定する。本ステップでは、追尾保留情報が保留状態の追尾結果を除外していない追尾結果リストを用いるため、人物の近接位置に他の人物がいるかいないかの情報を使用できる。そのため、近接人物がいるのに単独判定であると誤判定されるリスクを軽減できる。
S212において、検知結果送信部209は、S211による単独行動判定結果を所定の送信先に送信する。
S213において、画像受信の停止要求がない限り、画像処理装置200が、S201~S212の処理を繰り返し実行する。画像受信の停止要求があった場合、図7に示す一連のフローチャートが終了する。
S211において、単独行動判定部208は、読み出した位置推定用パラメーターと、今回のS202で得られた追尾結果を用いて、当該追尾結果の各人物について単独行動判定処理を行う。具体的には、各人物について人物間距離を推定し、人物間距離が所定の閾値未満である他の人物が存在しない場合、単独行動をしていると判定する。本ステップでは、追尾保留情報が保留状態の追尾結果を除外していない追尾結果リストを用いるため、人物の近接位置に他の人物がいるかいないかの情報を使用できる。そのため、近接人物がいるのに単独判定であると誤判定されるリスクを軽減できる。
S212において、検知結果送信部209は、S211による単独行動判定結果を所定の送信先に送信する。
S213において、画像受信の停止要求がない限り、画像処理装置200が、S201~S212の処理を繰り返し実行する。画像受信の停止要求があった場合、図7に示す一連のフローチャートが終了する。
以上のような図7に示すフローチャートによれば、単独行動判定処理では、追尾中の複数の人物位置から人物間距離を推定する際に、追尾保留状態の追尾結果を使用せずに算出された位置推定用パラメーターが用いられる。そのため、単独行動判定の判定精度が高まる。
以上のように、本実施形態によれば、人物同士の重なり等の影響で、追尾している人物が入れ替わっている可能性がある追尾結果を、行動検知に使用するかを切り替えることが可能になる。これにより、追尾情報の時系列変化を基にする場合は、追尾保留状態を除外した追尾結果を使用し、追尾情報の時系列変化を基にしない場合は、追尾保留状態も含めた追尾結果を使用することができる。従って、追尾結果を過不足なく行動検知に使用できるため、行動検知の誤検知・未検知の発生確率を抑制できる。
<実施形態2>
実施形態1では、画像処理装置200が単独行動を検知する場合について説明した。本実施形態では、単独行動以外の不審行動を検知する場合について説明する。以下では、実施形態1とは異なる部分を中心に説明する。
実施形態1では、画像処理装置200が単独行動を検知する場合について説明した。本実施形態では、単独行動以外の不審行動を検知する場合について説明する。以下では、実施形態1とは異なる部分を中心に説明する。
図8は、本実施形態に係る画像処理システムの構成を示す図である。図8は、図1と比べると、主に2つの相違点がある。1点目は、人物追尾部203と検知制御部204との間に、人物姿勢推定部1205が追加された点である。2点目は、検知制御部204が制御対象とする処理が、実施形態1とは異なることに応じて、追尾結果記憶部205、パラメーター算出部206、パラメーター記憶部207、単独行動判定部208を有さない点である。これらに代えて、本実施形態に係る画像処理装置200は、滞留時間検知部1206、顔向き推定部1207、顔振検知部1208、及び挙動検知部1209の機能を有する。これらの各構成部1206~1209は、それぞれ別々の行動を検知する行動検知部である。なお、本実施形態では、追尾結果記憶部205の機能を、顔振検知部1208及び挙動検知部1209が具備している。
まず、人物姿勢推定部1205について説明する。人物姿勢推定部1205は、人物追尾部203の追尾結果を基に、追尾中の人物の全身画像から、機械学習を用いて人物のキーポイントの画像上の位置を検出し、検出した座標と検出尤度を、姿勢推定結果して出力する。人物のキーポイントとは、人物の主要な器官点、関節等の構成要素であり、例えば両目・両耳・鼻・両肩・両腰・両肘・両手首・両膝・両足首を含む。人物姿勢推定部1205は、処理が完了すると、追尾結果及び姿勢推定結果を、検知制御部204へ提供する。図9は、姿勢推定結果の例を示す。図9に示すように、姿勢推定結果は、追尾ID、各器官点・関節の座標、及び検出尤度を含む情報である。
次に、滞留時間検知部1206、顔向き推定部1207、顔振検知部1208、及び挙動検知部1209について説明する。検知制御部204は、各行動検知部1206~1209に対して、追尾結果リスト及び姿勢推定結果リストを提供し、各行動検知部1206~1209で実行される行動検知処理を制御する。この場合、検知制御部204は、時系列変化を基にしない検知処理については、追尾保留情報が通常状態と保留状態の両方の追尾結果を含む追尾結果リストを使用するよう制御する。つまり、人物姿勢推定部1205から受け取った追尾結果リストを、そのまま使用するよう制御する。また、検知制御部204は、時系列変化を基にする検知処理については、追尾保留情報が通常状態の追尾結果のみを含む追尾結果リストを作成して使用するよう制御する。
滞留時間検知部1206は、滞留時間検知処理を行う。滞留時間検知処理は、撮像部101の撮像範囲内に追尾中の人物が滞留している時間を計測する処理である。滞留時間検知処理は、時系列変化を基にしない処理である。滞留時間検知部1206は、検知制御部204から受け取った追尾結果リスト及び内部に保存している前回までの滞留時間リストを使用して、今回の滞留時間を計算する。
図10を用いて、滞留時間検知処理について具体的に説明する。
図10(a)は、ある時点での画像内の人物に対して追尾ID、追尾保留情報及び滞留時間を付記したイメージ図である。図10(a)の時点では、人物701に追尾ID「2」が付与され、滞留時間は50秒とカウントされている。また、人物702に追尾ID「3」が付与され、滞留時間は80秒とカウントされている。
図10(b)及び図10(c)に示す画像は、図10(a)の時点から10秒経過後の画像である。図10(b)では、図10(a)と同様の追尾IDが付与され、人物が重なって写っている影響で追尾保留状態となっており、滞留時間は10秒プラスされている。一方、図10(c)では、人物701と人物702に付与される追尾IDが入れ替わっている。しかし、追尾ID「2」が滞留時間60秒、追尾ID「3」が滞留時間90秒とカウントされている点については、図10(b)と同様である。従って、図10(c)のように追尾IDが入れ替わったとしても、後に人物の重なりが解消して追尾IDが入れ替わり前の状態へ戻れば、追尾IDが入れ替わらなかった図10(b)の場合と同様に滞留時間がカウントアップできる。このような理由で、滞留時間検知処理においては、追尾保留状態である追尾結果も使用する。滞留時間検知部1206は、追尾中の各人物について検知された滞留時間を検知結果送信部209へ提供する。
図10(a)は、ある時点での画像内の人物に対して追尾ID、追尾保留情報及び滞留時間を付記したイメージ図である。図10(a)の時点では、人物701に追尾ID「2」が付与され、滞留時間は50秒とカウントされている。また、人物702に追尾ID「3」が付与され、滞留時間は80秒とカウントされている。
図10(b)及び図10(c)に示す画像は、図10(a)の時点から10秒経過後の画像である。図10(b)では、図10(a)と同様の追尾IDが付与され、人物が重なって写っている影響で追尾保留状態となっており、滞留時間は10秒プラスされている。一方、図10(c)では、人物701と人物702に付与される追尾IDが入れ替わっている。しかし、追尾ID「2」が滞留時間60秒、追尾ID「3」が滞留時間90秒とカウントされている点については、図10(b)と同様である。従って、図10(c)のように追尾IDが入れ替わったとしても、後に人物の重なりが解消して追尾IDが入れ替わり前の状態へ戻れば、追尾IDが入れ替わらなかった図10(b)の場合と同様に滞留時間がカウントアップできる。このような理由で、滞留時間検知処理においては、追尾保留状態である追尾結果も使用する。滞留時間検知部1206は、追尾中の各人物について検知された滞留時間を検知結果送信部209へ提供する。
顔向き推定部1207は、画像内の各人物の顔向きを推定する処理を行う。顔向き推定処理は、時系列変化を基にしない処理である。顔向き推定部1207は、検知制御部204から受け取った追尾結果リスト及び姿勢推定結果を使用して、人物の顔向きを推定する。具体的には、姿勢推定結果に含まれるキーポイント座標のうちの顔器官の位置関係から、人物の顔向きを、上下・左右・画面内回転の3軸についてそれぞれ何度の方向を向いているか推定する。顔向き推定部1207は、追尾中の各人物の顔向き推定結果を顔振検知部1208及び検知結果送信部209へ提供する。
顔振検知部1208は、画像内の各人物の周囲確認行動を検知する処理を行う。顔振検知処理は、時系列変化を基にする処理である。顔振検知部1208は、保留状態を除外した追尾結果リストを作成する。作成する方法は、実施形態1と同様である。次に顔振検知部1208は、作成した追尾結果リスト、顔向き推定部1207から受け取った顔向き推定結果、及び内部に保存している前回までの処理結果を基に、人物の周囲確認行動を検知する。具体的には、顔向き推定部1207から受け取った顔向き推定結果のうち、作成した追尾結果リストに対応しているデータのみを用いる。検知対象の周囲確認行動は、検知対象人物が周囲の人物の有無や、周囲の人物の位置を確認するために、顔を振る行動である。周囲確認行動有無の判定方法は、まず、人物の顔向きの変化から顔向きを予測し、この予測値と顔向き推定結果に含まれる顔向きとの差分を算出する。そして、所定時間での差分の和が所定量以上であった場合に、顔向きの変化が大きいとみなし、周囲確認行動有り、と判定する。一方、所定量未満であった場合に、周囲確認行動無し、と判定する。顔振検知部1208は、各人物について顔向き推定結果に含まれる顔向きと予測値との差分を算出し、周囲確認行動の有無を判定する。顔振検知部1208は、追尾中の各人物の周囲確認行動判定結果を検知結果送信部209へ提供する。
挙動検知部1209は、画像内の各人物の挙動を検知する処理を行う。挙動検知処理は、時系列変化を基にする処理である。挙動検知部1209は、保留状態を除外した追尾結果リストを作成する。作成する方法は、実施形態1と同様である。次に挙動検知部1209は、作成した追尾結果リスト及び姿勢推定結果、更に内部に保存している前回までの処理結果を基に、人物の挙動を検知する。具体的には、検知制御部204から受け取った姿勢推定結果のうち、作成した追尾結果リストに対応しているデータのみを用いる。検知対象の挙動は、人物が手を伸ばしたこと、しゃがんだこと、等である。挙動検知部1209は、前回までの姿勢推定結果及び今回の姿勢推定結果から各人物のキーポイント座標を取得し、機械学習を用いて取得したキーポイント座標の時系列変化から各人物の挙動を検知する。挙動検知部1209は、追尾中の各人物の挙動検知結果を検知結果送信部209へ提供する。
図11は、本実施形態に係る画像処理装置200が実行する処理を示すフローチャートである。
S301及びS302は、図7のS201及びS202と同様であるため説明を省略する。S302が実行されると、S303において、人物姿勢推定部1205は、S301で受信した画像、及びS302で得られた追尾結果を用いて、人物姿勢推定を行う。
S304において、検知制御部204は、すべての行動検知処理を実行済みであるか否かを判定する。検知制御部204が実行済みであると判定した場合には、処理はS310へ進み、未実行の行動検知処理があると判定した場合、処理はS305へ進む。
S305において、検知制御部204は、次の行動検知処理を実行対象に選択する。
S306において、検知制御部204は、S305で選択された行動検知処理が、時系列変化を基にする処理であるか否かを判定する。検知制御部204が時系列変化を基にする処理と判定した場合、処理はS307へ進み、検知制御部204が時系列変化を基にしない処理と判定した場合、処理はS308へ進む。本実施形態では、顔振検知部1208及び挙動検知部1209のうちの何れかが実行する処理が選択された場合には、S307へ進み、滞留時間検知部1206及び顔向き推定部1207のうちの何れかが実行する処理が選択された場合には、S308へ進む。
S304において、検知制御部204は、すべての行動検知処理を実行済みであるか否かを判定する。検知制御部204が実行済みであると判定した場合には、処理はS310へ進み、未実行の行動検知処理があると判定した場合、処理はS305へ進む。
S305において、検知制御部204は、次の行動検知処理を実行対象に選択する。
S306において、検知制御部204は、S305で選択された行動検知処理が、時系列変化を基にする処理であるか否かを判定する。検知制御部204が時系列変化を基にする処理と判定した場合、処理はS307へ進み、検知制御部204が時系列変化を基にしない処理と判定した場合、処理はS308へ進む。本実施形態では、顔振検知部1208及び挙動検知部1209のうちの何れかが実行する処理が選択された場合には、S307へ進み、滞留時間検知部1206及び顔向き推定部1207のうちの何れかが実行する処理が選択された場合には、S308へ進む。
S307において、選択された行動検知処理に対応する行動検知部(顔振検知部1208及び挙動検知部1209のうちの何れか)は、追尾保留状態を除く追尾結果リストを作成する。
S308において、選択された行動検知処理に対応する行動検知部(滞留時間検知部1206、顔向き推定部1207、顔振検知部1208、及び挙動検知部1209のうちの何れか)は、行動検知処理を実行する。
S309において、検知結果送信部209は、行動検知結果を所定の送信先に送信する。その後、処理はS304へ進む。
S310において、画像受信の停止要求がない限り、画像処理装置200が、S301~S309の処理を繰り返し実行する。画像受信の停止要求があった場合、図11に示す一連のフローチャートを終了する。
S308において、選択された行動検知処理に対応する行動検知部(滞留時間検知部1206、顔向き推定部1207、顔振検知部1208、及び挙動検知部1209のうちの何れか)は、行動検知処理を実行する。
S309において、検知結果送信部209は、行動検知結果を所定の送信先に送信する。その後、処理はS304へ進む。
S310において、画像受信の停止要求がない限り、画像処理装置200が、S301~S309の処理を繰り返し実行する。画像受信の停止要求があった場合、図11に示す一連のフローチャートを終了する。
以上のように、本実施形態によれば、人物同士の重なり等の影響で、追尾している人物が入れ替わっている可能性がある追尾結果を、行動検知に使用するかを切り替えることが可能になる。これにより、時系列変化を基にする行動検知では、追尾保留状態を除外した追尾矩形や姿勢推定の情報を使用し、時系列変化を基にしない行動検知では、追尾保留状態も含めた追尾矩形や姿勢推定の情報を使用することができる。従って、追尾結果を過不足なく行動検知に使用できるため、行動検知の誤検知・未検知の発生確率を抑制できる。
(その他の実施形態)
以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インターフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
以上、実施形態例を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インターフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコード(コンピュータプログラム)を記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。係る記憶媒体は言うまでもなく、コンピュータ読み取り可能な記憶媒体である。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
100:撮像装置、200:画像処理装置
Claims (15)
- 人物を撮像した画像を取得する取得手段と、
前記画像内の人物を検出して追尾する追尾手段と、
前記追尾手段の追尾結果に基づく人物の行動検知のための処理を制御する制御手段と、
を有し、
前記追尾結果は、検出された人物に対する追尾の状態を表す状態情報を含み、
前記制御手段は、前記処理の種別及び前記状態情報に基づいて、前記追尾結果を使用するかを制御する
ことを特徴とする画像処理装置。 - 前記追尾手段は、過去に検出された人物との対応付けを保留する場合に、前記状態情報を保留状態にすることを特徴とする請求項1に記載の画像処理装置。
- 前記追尾手段は、人物の重なり度合が所定値以上である場合に、前記状態情報を保留状態にすることを特徴とする請求項1又は2に記載の画像処理装置。
- 前記追尾手段は、過去に検出された人物との同一性を表す識別子を人物に対して付与し、前記識別子が別の人物に対して付与されている確率が所定値以上である場合に、前記状態情報を保留状態にすることを特徴とする請求項1乃至3の何れか1項に記載の画像処理装置。
- 前記追尾手段は、前記対応付けの候補が複数ある場合に、前記状態情報を保留状態にすることを特徴とする請求項2に記載の画像処理装置。
- 前記制御手段は、
前記処理の種別が時系列変化を基にしない種別である場合、前記処理を実行する際に、前記保留状態の前記追尾結果を使用するよう制御し、
前記処理の種別が時系列変化を基にする種別である場合、前記処理を実行する際に、前記保留状態の前記追尾結果を使用しないよう制御する
ことを特徴とする請求項2乃至5の何れか1項に記載の画像処理装置。 - 前記取得手段は、前記画像を時系列で取得し、
前記追尾手段は、前記追尾結果を時系列で生成し、
前記制御手段は、前記処理の種別が前記時系列変化を基にする種別である場合、前記保留状態の前記追尾結果を除外した時系列データを作成するよう制御する
ことを特徴とする請求項6に記載の画像処理装置。 - 前記時系列変化を基にする種別の前記処理は、人物を囲む矩形の位置及びサイズに基づいて、人物の位置情報を推定するためのパラメーターを算出する処理であることを特徴とする請求項6に記載の画像処理装置。
- 前記時系列変化を基にしない種別の前記処理は、前記パラメーターと人物を囲む矩形の位置及びサイズとに基づいて推定される人物の位置情報に基づいて、複数の人物間の距離を算出する処理であることを特徴とする請求項8に記載の画像処理装置。
- 前記時系列変化を基にしない種別の前記処理は、人物が撮像範囲内に滞留している時間を計測する処理であることを特徴とする請求項6に記載の画像処理装置。
- 前記時系列変化を基にしない種別の前記処理は、人物の顔向きを推定する処理であることを特徴とする請求項6に記載の画像処理装置。
- 前記画像内の人物の構成要素の位置情報を推定する推定手段を更に有し、
前記時系列変化を基にする種別の前記処理は、前記構成要素の位置情報の時系列変化に基づいて、人物の挙動を検知する処理である
ことを特徴とする請求項6に記載の画像処理装置。 - 前記時系列変化を基にする種別の前記処理は、人物の顔向きと当該顔向きから予測される予測値との差分に基づいて、人物の周囲確認行動を検知する処理であることを特徴とする請求項6に記載の画像処理装置。
- 人物を撮像した画像を取得する取得工程と、
前記画像内の人物を検出して追尾する追尾工程と、
前記追尾工程による追尾結果に基づく人物の行動検知のための処理を制御する制御工程と、
を含み、
前記追尾結果は、検出された人物に対する追尾の状態を表す状態情報を含み、
前記制御工程では、前記処理の種別及び前記状態情報に基づいて、前記追尾結果を使用するかを制御する
ことを特徴とする画像処理方法。 - 請求項1乃至13の何れか1項に記載の画像処理装置の各手段としてコンピュータを機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022002499A JP2023102120A (ja) | 2022-01-11 | 2022-01-11 | 画像処理装置、画像処理方法、及びプログラム |
US18/064,632 US20230222833A1 (en) | 2022-01-11 | 2022-12-12 | Image processing apparatus, image processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022002499A JP2023102120A (ja) | 2022-01-11 | 2022-01-11 | 画像処理装置、画像処理方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023102120A true JP2023102120A (ja) | 2023-07-24 |
Family
ID=87069882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022002499A Pending JP2023102120A (ja) | 2022-01-11 | 2022-01-11 | 画像処理装置、画像処理方法、及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230222833A1 (ja) |
JP (1) | JP2023102120A (ja) |
-
2022
- 2022-01-11 JP JP2022002499A patent/JP2023102120A/ja active Pending
- 2022-12-12 US US18/064,632 patent/US20230222833A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230222833A1 (en) | 2023-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10228763B2 (en) | Gaze direction mapping | |
US10893207B2 (en) | Object tracking apparatus, object tracking method, and non-transitory computer-readable storage medium for storing program | |
WO2017164479A1 (en) | A device and method for determining a pose of a camera | |
KR101606628B1 (ko) | 포인팅 방향 검출 장치 및 그 방법과, 프로그램 및 컴퓨터 판독가능한 매체 | |
JP5613741B2 (ja) | 画像処理装置、方法、及びプログラム | |
US10496874B2 (en) | Facial detection device, facial detection system provided with same, and facial detection method | |
JP2017017431A (ja) | 画像処理装置、情報処理方法及びプログラム | |
JP6280020B2 (ja) | 移動物体追跡装置 | |
JPWO2009142098A1 (ja) | 画像処理装置、カメラ、画像処理方法およびプログラム | |
JP2009237993A (ja) | 画像監視装置 | |
US20240104769A1 (en) | Information processing apparatus, control method, and non-transitory storage medium | |
JP6798609B2 (ja) | 映像解析装置、映像解析方法およびプログラム | |
US20220084244A1 (en) | Information processing apparatus, information processing method, and program | |
JP7214437B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2021196741A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2023102120A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2011002292A (ja) | 三次元指先位置検出方法、三次元指先位置検出装置、およびプログラム | |
JP5448952B2 (ja) | 同一人判定装置、同一人判定方法および同一人判定プログラム | |
JP5876121B2 (ja) | 画像処理装置、方法、及びプログラム | |
WO2020022362A1 (ja) | 動き検出装置、特性検出装置、流体検出装置、動き検出システム、動き検出方法、プログラム、および、記録媒体 | |
US20240005699A1 (en) | Image processing apparatus, image processing method, program storage medium, and image processing system | |
CN116109828B (zh) | 图像处理方法和电子设备 | |
US20240112496A1 (en) | Image processing apparatus, authentication system, method, and non-transitory computer-readable storage medium | |
KR20220156873A (ko) | 다수의 포즈 추정 엔진을 사용한 손의 마커리스 모션 캡쳐 | |
JP2023132846A (ja) | 監視システム、監視ソフトウエア及び監視方法 |