JP6767788B2 - 情報処理装置、情報処理装置の制御方法およびプログラム - Google Patents

情報処理装置、情報処理装置の制御方法およびプログラム Download PDF

Info

Publication number
JP6767788B2
JP6767788B2 JP2016129129A JP2016129129A JP6767788B2 JP 6767788 B2 JP6767788 B2 JP 6767788B2 JP 2016129129 A JP2016129129 A JP 2016129129A JP 2016129129 A JP2016129129 A JP 2016129129A JP 6767788 B2 JP6767788 B2 JP 6767788B2
Authority
JP
Japan
Prior art keywords
subject
image pickup
feature amount
pickup device
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016129129A
Other languages
English (en)
Other versions
JP2018006910A5 (ja
JP2018006910A (ja
Inventor
智也 本條
智也 本條
山本 真司
真司 山本
東條 洋
洋 東條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2016129129A priority Critical patent/JP6767788B2/ja
Publication of JP2018006910A publication Critical patent/JP2018006910A/ja
Publication of JP2018006910A5 publication Critical patent/JP2018006910A5/ja
Application granted granted Critical
Publication of JP6767788B2 publication Critical patent/JP6767788B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Exposure Control For Cameras (AREA)
  • Studio Devices (AREA)

Description

本発明は、情報処理装置、情報処理装置の制御方法およびプログラムに関する。
空港やショッピングモールなどに複数台の撮像装置を設置し、それぞれの撮像装置映像を解析することにより、人物を撮像装置間で同定して追跡する撮像装置間被写体同定(Re−identification)技術が知られている。
特許文献1では、監視対象を検知している監視装置が、次に連携して監視対象を検知するであろう他の監視装置へ画像の色情報を送信し、当該色情報を送信された他の監視装置が当該色情報に基づいて動作条件を決定する技術が開示されている。
特開2006−295604号公報 米国特許出願公開第2007/0237387号明細書
しかしながら、特許文献1に記載の技術では、撮像装置が抽出した監視対象の特徴量を連携先の他の撮像装置でも抽出できるように、他の撮像装置のパラメータを調整している。そのため、例えば、他の撮像装置で被写体同定を行う際に、抽出が難しい特徴量を抽出するような指示が撮像装置から送信された場合、撮像装置と他の撮像装置との間の被写体同定の精度が低下する可能性があるという課題がある。
本発明は、上記の課題に鑑みてなされたものであり、撮像装置間の被写体同定を高精度に行う技術を提供することを目的とする。
上記の目的を達成する本発明に係る情報処理装置は、
他の情報処理装置と連携する情報処理装置であって、
撮像画像に基づいて撮像状況として混雑を検出する検出手段と、
前記撮像状況として混雑が検出された場合に被写体の抽出に使用する特徴量の種類を顔特徴に決定する決定手段と、
前記決定された前記特徴量の種類を示す情報を前記他の情報処理装置へ送信する送信手段と、
を備えることを特徴とする。
本発明によれば、ある撮像装置で状況に応じて変更された特徴量の種類を他の撮像装置が把握でき、他の撮像装置でも同じ種類の特徴量の抽出を行うように変更できることから、撮像装置間の被写体同定を高精度に行うことが可能となる。
本発明の一実施形態に係る被写体同定システムの構成例及び撮像装置の構成例を示す図である。 本発明の一実施形態に係る撮像装置が実施する処理の手順を示すフローチャートである。 本発明の一実施形態に係るイベント・ステータス・抽出される特徴量の種類の関係を示す表である。 本発明の一実施形態に係る撮像画像の一例である。 (a)本発明の一実施形態に係る撮像装置の配置構成例を示す図であり、(b)本発明の一実施形態に係る撮像装置のグループ例を示す図である。 本発明の一実施形態に係る、被写体の移動方向と周囲の撮像装置で被写体が捉えられる確率との関係を示す表である。
以下、図面を参照しながら実施形態を説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
(実施形態1)
本実施形態では、撮像装置間の被写体同定システムの処理について説明する。本実施形態では、他の撮像装置と連携して被写体を撮像する撮像装置が、撮像画像に基づいてシーンの撮像状況(例えば、混雑イベントの発生)を検出する。そして、撮像状況に基づいて被写体の抽出に使用する特徴量の種類を変更し、変更された特徴量の種類を示す情報を他の撮像装置へ送信する。これにより、連携先の他の撮像装置でも適切な特徴量の種類を使用して被写体領域の抽出を行うことが可能となる。
本実施形態では、被写体は人物とし、2台の撮像装置を用いる。各撮像装置の撮像範囲は重なっていないものとする。すなわち、2台の撮像装置には同一の被写体が同時に写ることはないものとする。
本実施形態では、撮像状況(イベント)とは、撮像および特徴量の抽出に影響を及ぼす可能性のある事象を指す。例えば、混雑の発生、照明条件の変化や、霧の発生等が挙げられる。本実施形態では、画像中にしきい値以上の多数の人物が出現する際に発生する混雑イベントを例に説明を行う。混雑時には、一般的に色特徴よりも高次の特徴である顔特徴を用いた方が被写体の同定精度が向上する。
本実施形態では、混雑イベントに応じて撮像装置のステータス情報が変化する。図3に示すように、撮像装置のステータス情報として、「定常状態」又は「混雑状態」の2つが定義されている。撮像装置のステータス情報は、混雑イベントが発生していない時は「定常状態」となり、混雑イベントが発生している時は「混雑状態」となる。そして、撮像装置は、「定常状態」では色特徴を抽出し、「混雑状態」では顔特徴を抽出することによって人物を検出するように構成する。なお、初期状態では「定常状態」とする。よって、初期状態では、抽出する特徴量の種類は色特徴となる。
連携して被写体を撮像する2台の撮像装置のうち、第2の撮像装置で混雑イベントが発生した場合、被写体同士の重なりにより色特徴を用いた被写体領域の抽出処理の信頼性が低下する可能性がある。そこで、第2の撮像装置で混雑イベントの発生を検出した場合、第2の撮像装置では人物の同定に使用する特徴量の種類を色特徴から顔特徴へ変更する。第2の撮像装置は顔特徴への変更を第1の撮像装置へ通知する。この通知に応じて、第1の撮像装置でも、使用する特徴量の種類として顔特徴へ変更する。これにより、連携している撮像装置間で適切な特徴量を使用することができるので、撮像装置間での被写体同定の精度を向上させることができる。
<被写体検出処理の概要>
本実施形態に係る被写体の検出処理では、予め背景が撮像された映像から背景モデルを生成しておき、背景モデルと入力映像との差分により動体領域を検出する背景差分法を用いる。次に、検出された動体領域に対して、所定の大きさの検出ウィンドウを入力画像上で走査させ、検出ウィンドウ内の画像を切り出したパターン画像に対し人物であるか否かの判別を行う方法を用いる(特許文献2参照)。
人物の同定を行うための本実施形態に係る1台の撮像装置内の被写体追尾処理では、前フレームに含まれる被写体領域の中心位置と、現フレームに含まれる被写体領域の中心位置とに基づいて対応付けを行う。ここでは、被写体領域の中心位置は、被写体領域を囲む矩形の中心点として定義する。そして、被写体追尾処理の結果として、同じ人物であることを示す被写体IDを付与する。
本実施形態では、さらに撮像装置間での被写体の同定は、被写体の特徴量を辞書から読み出し、特徴量の差異を表す被写体間距離を算出することにより行う。被写体間距離として、ここでは特徴空間上でのユークリッド距離を用いる。同一被写体は、被写体間距離を所定の閾値と比較することによって推定できる。被写体間距離が閾値以下であれば、同一被写体と判定する。同一被写体と判定された場合、特徴量とともに辞書に登録されているIDが割り当てられる。
本実施形態では、被写体の特徴量は、検出された被写体の色特徴および被写体の顔特徴を用いるものとし、通常は処理量が小さい色特徴のみを用いる。色特徴は、各画素のRGB値からヒストグラムを取得することによって得られる。一方、顔特徴としては、顔器官(目・鼻・口等)の位置とその周囲の色の勾配情報を表すHOG(Histograms of Oriented Gradients)特徴量を利用する。各特徴は、画像上でのサイズに依存しないよう、それぞれの値が0から1の間に収まるように正規化処理も行う。
<撮像装置の構成>
次に、図1を参照しながら、本実施形態に係る撮像装置の構成例を説明する。複数の撮像装置101(本実施形態では、撮像装置101aおよび撮像装置101b)と辞書102とがネットワーク103を介して接続されている。撮像装置101は、後述の各種機能を備えたネットワークカメラである。辞書102は、被写体の同定に必要な特徴量を記憶している。
撮像装置101は、記憶部104、撮像部105、被写体検出部106、被写体特徴抽出部107、被写体追尾部108、被写体同定部109、イベント検出部110、制御部111、情報送信部112、及び情報受信部113を備えている。
記憶部104は、抽出する特徴量の種類を示す情報や、撮像装置101のステータス情報を記憶している。撮像部105は、撮像レンズおよびCCD、CMOSなどの撮像センサを含み映像を撮像する。被写体検出部106は、撮像部105により撮像された映像から被写体を検出する。
被写体特徴抽出部107は、被写体検出部106により検出された被写体領域から被写体の特徴量を抽出する。抽出する特徴量の種類は、記憶部104に記憶されている情報に基づいて決定される。
被写体追尾部108は、被写体の追尾を行う。追尾状態である(すなわち、IDが割り当てられている)被写体領域については、ネットワーク103を介して当該被写体領域の特徴量をIDとともに辞書102に記憶する。辞書102に特徴量が記憶される際は、特徴量の種類ごとに記憶される。辞書102にまだ特徴量が記憶されていない場合は今回抽出された特徴量を記憶し、辞書102にすでに特徴量が記憶されている場合は、以下の式に従って値の更新が行われるものとする。
fnew=(1−p)×fold+p×f ...(1)
ここで、fnewはこれから辞書に記憶される特徴量、foldは辞書に記憶されていた特徴量、fは今回抽出された特徴量、pは更新割合である。ここでは、p=0.2とする。
被写体同定部109は、辞書102に記憶されている被写体の特徴量と、被写体検出部106により検出された被写体領域から抽出された被写体の特徴量とに基づいて、被写体を照合し、同定する。すなわち、同定された場合は辞書102に記憶された被写体のIDを割り当てる。
イベント検出部110は、撮像部105により撮像された映像に基づいてイベントを検出する。例えば、画像中の人物数をカウントして、人物数が閾値値以上である場合に混雑イベントが発生していると判定する。ここで、例えば閾値は4(人)とする。そして、検出されたイベントに基づいて撮像装置101のステータス情報を更新する。ステータス情報は、記憶部104に記憶される。
制御部111は、撮像装置101全体の制御を行う。例えば、情報受信部113から取得した情報に基づいて、被写体特徴抽出部107により抽出する特徴量の種類を選択する。選択された特徴量の種類を示す情報は、記憶部104に記憶される。また、撮像装置101のパン・チルト・ズームに関する制御を行う。
情報送信部112は、ネットワーク103を介して接続されている他の撮像装置に対して撮像装置101(送信元)が使用している特徴量の種類を示す情報を送信する。情報受信部113は、ネットワーク103を介して接続されている他の撮像装置から送信される情報を受信する。
なお、本実施形態に係る撮像装置101の構成及び撮像装置101を含むシステム構成は、図示の構成に限定されるものではない。例えば、図1の例では、記憶部104が抽出する特徴量の種類を示す情報及び撮像装置101のステータス情報を記憶するが、それぞれの情報が別の記憶部に記憶されてもよい。また、図1の例では、制御部111が被写体特徴抽出部107により抽出される特徴量の種類を選択するが、特徴量変更部を別途設けて、当該特徴量変更部により特徴量の種類を選択する処理を行ってもよい。
また、図1の例では、撮像装置101が、被写体検出部106、被写体特徴抽出部107、被写体追尾部108、被写体同定部109、及びイベント検出部110を備えている。しかし、これらの処理の少なくとも一部がネットワーク103を介して外部のサーバ等により実施されてもよい。例えば、撮像装置101は撮像処理のみを行い、その他の処理は中央サーバで集中的に処理を行うように構成してもよい。
後述の本実施形態に係る処理は、撮像装置101に搭載されたCPU(不図示)がメモリ(不図示)に格納されているプログラムを読み出して実行することにより実現される。なお、記憶部104が当該プログラムを記憶してもよい。
<撮像装置が実施する処理>
続いて、図2のフローチャートを参照して、本実施形態に係る撮像装置が実施する処理の手順を説明する。S201において、撮像部105は、撮像画像を取得する。S202において、被写体検出部106は、撮像部105により取得された撮像画像から1以上の被写体領域を検出する。S203において、被写体特徴抽出部107は、記憶部104に記憶された特徴量の種類を示す情報に基づいて、被写体検出部106により検出された1以上の被写体領域から被写体の特徴量をそれぞれ抽出する。
S204において、被写体追尾部108は、被写体の追尾を行う。S205において、被写体同定部109は、被写体特徴抽出部107により抽出された被写体の特徴量と、辞書102から読み出した被写体の特徴量とに基づいて、被写体の同定処理を実行する。S206において、イベント検出部110は、撮像部105により取得された撮像画像に基づいてイベントを検出する。
S207において、制御部111は、イベント検出部110により検出されたイベントに応じて撮像装置101のステータス情報を設定する。そして、前フレームのステータス情報と現フレームのステータス情報とを比較して、従前のステータスと比較してステータスに変化があったか否かを判定する。ステータスに変化があった場合(S207;YES)、S208へ進む。一方、ステータスに変化がないと判定された場合(S207;NO)、S210へ進む。
S208において、制御部111は、イベント検出部110により検出されたイベントに応じて記憶部104に記憶されている特徴量の種類を変更する。S209において、情報送信部112は、他の撮像装置に情報(例えば、特徴量の種類を示す情報)を送信する。S210において、情報受信部113は、他の撮像装置から情報(例えば、特徴量の種類を示す情報)を受信したか否かを判定する。情報を受信したと判定された場合(S210;YES)、S211へ進む。一方、情報を受信していないと判定された場合(S210;NO)、S212へ進む。
S211において、制御部111は、情報受信部113により受信した情報に基づいて、記憶部104に記憶された特徴量の種類を変更する。S212において、制御部111は、被写体の同定処理を終了するか否かを判定する。ユーザ操作により処理の終了が指示された場合、又は、所定時間が経過した場合等に、処理を終了すると判定する。処理を終了すると判定された場合(S212;YES)、一連の処理を終了する。一方、処理を終了しないと判定された場合(S212;NO)、S201に戻って一連の処理を継続する。以上で図2のフローチャートの各処理が終了する。
以下では、具体例として、「(1)初期状態において、撮像装置101bで混雑イベントが発生した時の処理」、「(2)撮像装置101bで混雑イベントが発生した後の処理」の2つに分けて、図2の処理の詳細を説明する。
[(1)初期状態において、撮像装置101bで混雑イベントが発生したときの処理]
S201において、撮像部105は、撮像画像を取得する。S202において、被写体検出部106は、撮像部105により取得された撮像画像から1以上の被写体領域を検出する。ここで、撮像装置101a及び撮像装置101bで検出された被写体領域を図4(a)及び図4(b)にそれぞれ示す。黒い領域が被写体領域を示している。ここでは撮像装置101aでは1つの被写体領域が検出されて、撮像装置101bでは4つの被写体領域が検出されたものとする。
S203において、被写体特徴抽出部107は、記憶部104に記憶された特徴量の種類を示す情報に基づいて、被写体検出部106により検出された1以上の被写体領域から被写体の特徴量をそれぞれ抽出する。初期状態では記憶部104に特徴量の種類として色特徴が記憶されているので、色特徴が抽出される。
S204において、被写体追尾部108は、被写体の追尾を行う。ここで、図4(c)は、撮像装置101aの前フレームの画像での被写体領域の中心点及び被写体ID、及び、撮像装置101aの現フレームの画像での被写体領域の中心点を示している。撮像装置101aでは、前フレームの被写体領域aと現フレームの被写体領域aとの距離がしきい値以内の場合に同一被写体として対応付けられる。その後、前フレームと同じ被写体ID(ここでは、ID=60)が付与される。撮像装置101bでも同様の処理が行われている。そして、被写体特徴抽出部107により抽出された、撮像装置101aでID=60が付与された被写体領域の色特徴が、ID=60に対応する特徴量として辞書102に記憶される。この処理は撮像装置101bにおいても同様に実行される。
S205において、被写体同定部109は被写体の同定処理を実行する。例えば、図4(b)に示す被写体dが撮像装置101bにより未だに同定されていない場合、撮像装置101bでは同定処理が行われる。辞書102に記憶された各IDの色特徴と、撮像装置101bにおける被写体IDの色特徴とをユークリッド距離を用いて比較し、閾値以下で最も距離が短いIDを付与する。一度被写体の同定が完了すれば、S204の追尾処理で追尾されている間は、当該同定処理はスキップしてもよい。
S206において、イベント検出部110は、撮像部105により取得された撮像画像に基づいてイベントを検出する。図4(b)の例では撮像装置101bの画像中の人物数は4人とカウントされるため閾値(4人)以上となることから、撮像装置101bでは混雑イベントの発生が検出される。
S207において、制御部111は、イベント検出部110により検出されたイベントに応じて撮像装置101のステータス情報を設定する。混雑イベントの発生が検出された撮像装置101bでは、撮像装置101bのステータス情報は当初の「定常状態」から「混雑状態」へと変更される。撮像装置101bではステータス情報が変更されたため、S208へ進むことになる。なお、撮像装置101aではステータス情報が変更されていないため、S210へ進むことになる。
S208において、制御部111は、イベント検出部110により検出されたイベントに応じて人物の同定に用いる特徴量の種類を変更する。ここでは、撮像装置101bのステータス情報が「混雑状態」となっているため、図3の対応表に従って、撮像装置101bは特徴量の種類を顔特徴に変更する。この時、撮像装置101bは複数の人物を追尾しており、ズーム等で画角を変更してしまうと複数の人物を追尾できなくなる可能性もあるため、画角を変更せずに顔特徴を抽出してもよい。
S209において、情報送信部112は、他の撮像装置に情報(例えば、人物の同定に用いる特徴量の種類を示す情報)を送信する。ここでは、撮像装置101bから撮像装置101aに対して、特徴量の種類を示す情報として顔特徴が送信される。S210において、情報受信部113は、他の撮像装置から情報(例えば、特徴量の種類を示す情報)を受信したか否かを判定する。ここでは、撮像装置101bから撮像装置101aへ情報が送信されているため、撮像装置101aでは、S211へ進む。一方、撮像装置101aから撮像装置101bへは情報が送信されていないため、撮像装置101bでは、S212へ進む。
S211において、制御部111は、情報受信部113により受信した情報に基づいて、記憶部104に記憶された特徴量の種類を変更する。撮像装置101aでは、特徴量の種類として「顔特徴」を撮像装置101bから受信しているため、特徴量の種類を示す情報として、撮像装置101aの記憶部104に顔特徴が上書きされて特徴量の種類が変更される。この時、撮像装置101aの制御部111は、より精度よく顔特徴を抽出するために被写体領域を拡大して(視野を制御して)撮像するようにパン、チルト、ズームの制御を実行する。例えば、被写体を囲む矩形の幅及び高さの何れか短い方の長さが画像上で100ピクセルとなるようにズーム倍率を設定し、被写体の顔が画像の中心に位置するようにパン・チルトの制御を行う。その後、S212の終了判定処理を経て、一連の処理を繰り返すか、あるいは処理を終了することになる。
[(2)撮像装置101bで混雑イベントが発生した後の処理]
続いて、「(2)撮像装置101bで混雑イベントが発生した後の処理」を説明する。「(1)初期状態において、撮像装置101bで混雑イベントが発生した時の処理」と同様の処理については説明を省略する。
S201の画像取得処理において、撮像装置101aでは、(1)の処理のS211で設定された各パラメータ(パン・チルト・ズーム等)に従って、図4(d)に示すようなズームされた撮像画像が取得される。S202の検出処理は(1)の処理と同様である。S203の特徴量抽出処理において、撮像装置101aでは、ズームされて取得された撮像画像から顔特徴の特徴量が抽出される。撮像装置101bでは、画角を変更せずに取得された撮像画像から顔特徴の特徴量が抽出される。
S204の被写体の追尾処理において、撮像装置101a及び撮像装置101bでは、抽出する特徴量の種類が色特徴から顔特徴に変更されているので、辞書102には各IDに対応付けて色特徴の特徴量ではなく顔特徴の特徴量が記憶される。例えば、撮像装置101aでID=60が割り当てられている被写体領域aの顔特徴の特徴量が、辞書102のID=60の格納場所に記憶される。
S205の被写体の同定処理では、使用する特徴量の種類は顔特徴となる。例えば、撮像装置101bの映像に新たに被写体が現れた場合、同定処理は顔特徴を用いて行われる。S206のイベント検出処理及びS207のステータス変化判定処理では、例えば撮像装置101bで混雑が解消されて混雑イベントが無くなった場合、撮像装置101bのステータス情報は「定常状態」へ変化する。その後、S208へ進む。一方、撮像装置101bで引き続き混雑が継続し、撮像装置101bのステータス情報が「混雑状態」のまま変化が無ければ、S210へ進む。S208−S212の各処理は(1)の処理と同様である。
以上説明したように、実施形態1では、他の撮像装置と連携して被写体を撮像する撮像装置が、撮像画像に基づいてシーンの撮像状況(例えば、混雑)を検出する。そして、撮像状況に基づいて被写体の抽出に使用する特徴量の種類を(例えば、色特徴から顔特徴へ)変更し、変更された特徴量の種類を示す情報を他の撮像装置へ送信する。
これにより、ある撮像装置で状況に応じて変更された特徴量の種類を他の撮像装置が把握できるため、他の撮像装置でも同じ種類の特徴量の抽出を行うように変更できることから、撮像装置間の被写体同定を高精度に行うことが可能となる。
(実施形態2)
本実施形態では、連携先の他の撮像装置が複数台存在する場合について説明する。なお、以降の説明では、実施形態1で説明した処理と同様の処理については説明を省略し、実施形態1で説明した処理とは異なる箇所を主に説明する。
本実施形態では撮像装置を5台使用する。それぞれ、撮像装置A、撮像装置B、撮像装置C、撮像装置D、撮像装置Eとする。各撮像装置は、図5(a)の通りに配置されており、実施形態1と同様、撮像範囲は重なっていないものとする。そして、各撮像装置は、可視光下における映像を取得可能であるとともに、赤外光を利用して非可視光下における映像も取得可能であるものとする。可視光下では、色ヒストグラムを被写体領域の特徴量として抽出する(可視特徴と称する)。非可視光下(暗闇)では、赤外光による非可視光映像における輝度ヒストグラムを被写体領域の特徴量として抽出する(非可視特徴と称する)。
本実施形態では、被写体が撮像装置Aで捉えられている状況について考える。この被写体は撮像装置B、撮像装置C、撮像装置D、撮像装置Eのいずれにも出現可能であるとする。状況を簡単にするため、部屋の構造上撮像装置Aから撮像装置Bを通らずに撮像装置Eに出現することはないとする。
そして、撮像装置Aにおける被写体の移動方向ごとに、被写体が撮像装置B、撮像装置C、又は撮像装置Dの方向へ移動する確率が事前の学習によって予め統計的に求められているものとする(これを移動確率データと称する)。この移動確率データの例を図6に示す。図6の例では、例えば被写体の移動方向が0°の方向である場合、その後被写体が撮像装置Bの方向へ移動する確率が0.9、撮像装置Cの方向へ移動する確率が0.1、撮像装置Dの方向へ移動する確率が0であることを示している。詳細は後述する。
また、本実施形態では、撮像装置Bで暗闇イベントが発生し、他の撮像装置では暗闇イベントが発生していない場合を考える。すなわち、撮像装置Bで使用されうる特徴量と、他の撮像装置で使用されうる特徴量とが異なるものとする。なお、暗闇イベントは、例えば、可視光下における画像の輝度値がしきい値以下のときに非可視光下と判定され、この暗闇イベントを発生させるものとする。
本実施形態では、このような場合に、撮像装置Aで捉えられている被写体が撮像装置B、撮像装置C又は撮像装置Dの何れに出現しても、効率良く追尾処理が行えるよう、被写体の移動方向ベクトルを用いて、抽出・記憶する特徴量を最適化する方法を説明する。
撮像装置Bで暗闇イベントが発生した場合、撮像装置Bでは非可視特徴が使用される。一方、撮像装置C及び撮像装置Dでは暗闇イベントが発生していないため、撮像装置C及び撮像装置Dでは可視特徴が使用される。撮像装置Aは、撮像装置Bで発生した暗闇イベントに応じた特徴量の変更通知を受信することにより撮像装置Bで使用する特徴量の種類を把握することができる。
ここで、撮像装置Aが捉えている被写体の移動方向が0°の方向である場合、図6によれば被写体が撮像装置Bの方向へ移動する確率が0.9、撮像装置Cの方向へ移動する確率が0.1である。すなわち、被写体は非可視特徴を使用する撮像装置Bの方向へ移動することもあれば、可視特徴を使用する撮像装置Cの方向へ移動することもあるが、各移動確率は異なっている。
撮像装置Aでは、例えば移動確率を特徴量選択確率としてそのまま適用し、撮像装置Bで使用されている非可視特徴については特徴量選択確率0.9、撮像装置Cで使用されている可視特徴(色特徴)については特徴量選択確率0.1とする。よって、撮像装置Aでは非可視特徴、可視特徴の各特徴量が特徴量選択確率に応じた配分で取得されることになる。
このように、撮像装置Aで捉えている被写体の今後の移動確率を特徴量選択確率として、各撮像装置で使用される特徴量の種類を特徴量選択確率に応じて比例配分して抽出する。これにより、被写体の移動確率に応じて適切な種類の特徴量を取得できるため、撮像装置間の被写体同定の精度を向上させることができる。
なお、本実施形態では事前に各撮像装置をグループ化しておく。これは、ある撮像装置でイベント(例えば、暗闇イベント)が発生して特徴量の変更を示す情報が送信される際、どの範囲にある撮像装置がその影響を受けるのかを、撮像装置の位置的な制約に基づき決定するためである。ここでは、ある撮像装置で被写体を捉えていた場合に、当該被写体が次に現れるであろう撮像装置の候補を1つのグループとして登録する。
例えば、図5(b)に示すように、撮像装置Aで被写体を捉えていた場合、撮像装置B、撮像装置C、又は撮像装置Dに当該被写体が次に出現する可能性があるため、(A|B,C,D)を1つのグループ1として登録する。この時、撮像装置Aはグループの親として登録される。同様に、撮像装置Bで被写体を捉えていた場合、撮像装置A、撮像装置Eに当該被写体が次に出現する可能性があるため、(B|A,E)が1つのグループ2として登録される。この時、撮像装置Bはグループの親として登録される。
撮像装置Cで被写体を捉えていた場合、撮像装置Aに当該被写体が次に出現する可能性があるため、(C|A)が1つのグループ3として登録される。この時、撮像装置Cはグループの親として登録される。撮像装置Dで被写体を捉えていた場合、撮像装置Aに当該被写体が次に出現する可能性があるため、(D|A)が1つのグループ4として登録される。この時、撮像装置Dはグループの親として登録される。撮像装置Eで被写体を捉えていた場合、撮像装置Bに当該被写体が次に出現する可能性があるため、(E|B)が1つのグループ5として登録される。この時、撮像装置Eはグループの親として登録される。
<撮像装置の構成>
本実施形態に係る撮像装置A−撮像装置Eの構成は実施形態1で説明した撮像装置101の図1(a)の構成と同様である。以下、各処理部のうち主に実施形態1とは機能が異なる処理部について説明を行う。
記憶部104は、被写体領域の抽出に使用する特徴量の種類を示す情報、当該特徴量を使用する撮像装置の情報、撮像装置のステータス情報等を記憶する。例えば、特徴量の種類を示す情報として、顔特徴の特徴量を使用するという情報が撮像装置Bから撮像装置Aへ送信された場合、顔特徴と撮像装置Bとが関連付けられる。
さらに、記憶部104は、抽出に使用する特徴量の種類が複数設定されている場合は、各フレームでどの特徴量を抽出するかを表す確率(特徴量選択確率と称する)も記憶する。例えば、ある撮像装置の記憶部104に記憶されている特徴量の種類及び特徴量選択確率の組み合わせが、色特徴:0.7、顔特徴:0.3である場合、10フレーム中7回は色特徴を抽出し、3回は顔特徴を抽出することを意味するものとする。
撮像部105は、可視光用の撮像レンズおよびCCD、CMOSなどの撮像センサで構成されたデバイス、非可視光用の撮像レンズおよび撮像センサ、被写体へ赤外線を当てる照明から構成されたデバイスを備えており、映像を撮像する。イベント検出部110により暗闇イベントが検出された場合、あるいは、抽出する特徴量の種類として非可視特徴が選択されている場合は、非可視光用のデバイスを撮像に使用する。
被写体特徴抽出部107は、被写体検出部106により検出された被写体領域から被写体の特徴量を抽出する。抽出する特徴量の種類は、記憶部104に記憶されている特徴量の種類とするが、特徴量の種類が複数設定されている場合は、特徴量選択確率に基づいて選択される。この時、各フレームで抽出する特徴量の種類は、乱数を利用して決定する。例えば、特徴量の種類および特徴量選択確率の組み合わせが、色特徴:0.7、顔特徴:0.3である場合、1から10までの乱数を発生させ、1から7の場合は色特徴を選択し、8から10の場合は顔特徴を選択する。
被写体追尾部108は、被写体の追尾を行う。追尾状態である(すなわち、IDが割り当てられている)被写体領域については、被写体特徴抽出部107は当該被写体領域の特徴量を、ネットワーク103を介して辞書102に記憶する。さらに、被写体の移動方向ベクトルを算出し、当該移動方向ベクトルと移動確率データとに基づいて特徴量選択確率を算出する。そして、算出した特徴量選択確率を記憶部104に記憶する。
情報送信部112は、ネットワーク103を介して接続されている、自身が親のグループに属する他の撮像装置へ、自身(送信元)が使用している特徴量の種類を送信する。例えば、グループ1の親である撮像装置Aは、撮像装置Aが使用している特徴量の種類を、グループ1に属する他の撮像装置(撮像装置B、撮像装置D、撮像装置E)へ送信する。
情報受信部113は、ネットワーク103を介して接続されている、自身が属するグループの他の撮像装置の情報送信部112から送信される情報を受信する。
<撮像装置が実施する処理>
続いて、図2のフローチャートを参照して、本実施形態に係る撮像装置が実施する処理の手順を説明する。実施形態1と同様の処理については説明を省略する。S201の画像取得処理及びS202の検出処理は、実施形態1と同様である。S203において、被写体特徴抽出部107は、被写体検出部106により検出された1以上の被写体領域から被写体の特徴量をそれぞれ抽出する。ここでは、撮像装置Aの記憶部104に記憶されている、特徴量の種類及び当該特徴量を使用する撮像装置、特徴量選択確率が、色特徴(撮像装置C、撮像装置Dで使用):0.7、非可視特徴(撮像装置Bで使用):0.3であるものとする。この場合、撮像装置Aは、10フレーム中、7回は色特徴を抽出し、3回は非可視特徴を抽出する。
S204の被写体の追尾処理は実施形態1と同様であるが、ここでは更に、被写体の移動方向ベクトルを算出して取得し(方向取得)、移動方向ベクトルと移動確率データとに基づいて特徴量選択確率を取得する(確率取得)。そして、算出した特徴量選択確率を記憶部104に記憶する。
被写体の移動方向ベクトルは、フレーム間での被写体領域の中心点位置の差分に基づいて算出する。例えば、撮像装置Aで図4(c)のような状況である場合、移動方向ベクトルは(20,2)となる。そして、被写体領域の中心点を原点としたxy平面上で、移動方向ベクトルの角度θを求める。この場合は、θ≒5.7°となる。そして、図6の移動確率データの対応表に従って特徴量選択確率を決定する。
図6の例では移動確率データは45°ごとに定義されているため、最も近い角度のデータを用いるものとする。この場合は、0°のデータを参照する。その場合、撮像装置Bの方向へ被写体が移動する確率が0.9、撮像装置Cの方向へ被写体が移動する確率が0.1となっている。撮像装置Bと撮像装置Cとで被写体領域の抽出に使用する特徴量が異なっている場合は、確率を考慮して、撮像装置Bで使用する特徴量を予め抽出しておいた方がよいと考えられる。そこで、特徴量選択確率は、例えば、移動確率データをそのまま適用して、撮像装置Cで使用されている可視特徴(色特徴)を0.1、撮像装置Bで使用されている非可視特徴を0.9とする。当該情報が撮像装置Aの記憶部104に記憶される。
S205−S208の各処理は実施形態1と同様であるが、本実施形態で検出されるイベントは暗闇イベントである。S209において、情報送信部112は、自身が親のグループに属する他の撮像装置に情報(例えば、送信元が使用している特徴量の種類を示す情報)を送信する。図5(b)に示すように、暗闇イベントが発生した撮像装置Bに関して、撮像装置Bが親であるグループ2は(B|A,E)であるので、撮像装置Bから撮像装置A、撮像装置Eに対して、特徴量の種類として非可視特徴が送信される。
情報受信ステップS209において、情報受信部113は、自身が属するグループの他の撮像装置の情報送信部112から情報を受信したか否かを判定する。ここでは、撮像装置Bが撮像装置A、撮像装置Eに情報を送信しているため、撮像装置A、撮像装置EではS211へ進むことになる。S210−S212の各処理は実施形態1と同様である。
以上説明したように、実施形態2では、第1の他の撮像装置(撮像装置B)及び第2の他の撮像装置(撮像装置C)を含む複数の他の撮像装置と連携して被写体を撮像する撮像装置(撮像装置A)が、撮像画像に基づいて被写体の移動方向情報を取得する。そして、移動方向情報に基づいて被写体の移動確率を取得する。さらに、移動確率に基づいた選択確率で、第1の他の撮像装置(撮像装置B)で被写体の抽出に使用される第1の種類の特徴量(非可視特徴)と、第2の他の撮像装置(撮像装置C)で被写体の抽出に使用される第2の種類の特徴量(可視特徴)とを抽出する。
このように、被写体の移動方向に応じて抽出する特徴量を制御するようにしたので、連携先の撮像装置が複数存在する場合でも、被写体同定の精度を向上させることができる。
[変形例]
上述の各実施形態では、被写体の特徴量は、被写体領域内から抽出された色ヒストグラムや輝度ヒストグラム、顔器官位置とHOG特徴量などを挙げたが、それら以外にも、輝度やエッジなどを用いた様々な特徴量を用いてもよい。また、鞄、サングラス、髭などの存在確率を示すような、人間にとって意味をなす特徴を抽出しても良い。抽出方法は、例えば形状特徴であるLBP特徴量やHOG特徴量等を用い、サポートベクタマシン(SVM)等を用いて識別するなどが挙げられる。
上述の各実施形態では、抽出する特徴量をイベント検知時に変更するとしたが、特徴量の変更に猶予期間を設けてもよい。例えば、混雑イベントの発生と同時に顔特徴に変更するのではなく、色特徴と顔特徴とを同時に抽出するようにし、一定フレームの間連続して混雑イベントが発生した場合に、色特徴の抽出をやめて、顔特徴のみを抽出するようにしてもよい。これにより、より安定的に被写体の追尾・同定を行うことができる。
上述の各実施形態では、被写体の追尾は、フレーム間の被写体同士を対応付けることができればどのような手法を用いてもよい。例えば、前フレームの被写体領域を照合パターンとしたパターンマッチングによる手法などでもよい。
上述の各実施形態では、被写体の同定は、被写体の特徴量を辞書から読み出し、被写体間のユークリッド距離を算出することにより行う例を説明したが、それ以外の公知の技術を用いてもよい。例えば、ユークリッド距離の代わりにマハラノビス距離を用いてもよいし、撮像装置間の距離と被写体の速度から、連携先の撮像装置の映像に被写体が写るまでの時間を推定し、その推定時間を考慮に入れて被写体の同定を行ってもよい。
上述の各実施形態では、被写体は人物としたが、人物以外の被写体についても適用可能である。被写体として車両を扱いたい場合、例えば、特許文献2に記載の判別器を車両について適用すればよい。
上述の各実施形態では、被写体検出からイベント検出までの各処理を各撮像装置内で行う例を説明した。しかし、ネットワークにサーバを接続し、当該サーバが各撮像装置から取得した映像を使用して、これらの処理の少なくとも一部を行ってもよい。
上述の各実施形態では、撮像装置の台数は実施形態1では2台、実施形態2では5台であったが、任意の台数に拡張・変更可能である。
上述の各実施形態では、イベントとして混雑や暗闇を挙げたが、同一の特徴量を使い続けると被写体の同定精度が低下するようなイベントには様々なものが考えられる。例えば、霧や煙の発生による視界不良や、連携先の撮像装置における一部センサの故障等も考えられる。視界不良の場合にはサーマルカメラ等の可視光以外の情報を用いた特徴量を用いることができる。また、センサの故障の場合には、そのセンサ以外のセンサで取得可能な特徴量を用いることができる。なお、視界不良のイベントの発生に関しては、例えば、画像のコントラストが予め定められたしきい値以下の場合に発生させてもよい。
また、画像の領域毎にイベントを検出し、それを利用することも可能である。例えば、画像を上下左右に4分割し、それぞれで混雑イベントを検知する。例えば撮像装置Aに写った人物が撮像装置Bの方に移動してきた際は必ず画面の左側に出現するという制約があった場合を考える。撮像装置Bの左側の領域で混雑が発生している場合に、撮像装置Bが混雑領域で使用している特徴量の種類を撮像装置Aに送信するように構成してもよい。
上述の各実施形態では、特徴量抽出のための制御の例として、パン、チルト、ズーム操作やデバイスの切り替えを挙げたが、それ以外にも感度や照明の切り替えなども含むことができる。例えば、非可視光から可視光までを撮像可能な撮像装置を用いた場合、イベントに応じて非可視光及び可視光の感度をフィルタなどを用いて変更したり、非可視特徴の特徴量を抽出するために被写体に向けて非可視光の照明を投射したりすることができる。
また実施形態2では、撮像装置のグループ化を行う際、各撮像装置の位置的な制約に基づいてグループを決定したが、他の方法で行ってもよい。例えば、被写体がどの撮像装置からどの撮像装置へと移行したかを記録しておき、その情報に基づいてグループ化を行ってもよい。また、移動確率データを被写体の属性(性別や年齢など)別に分けておき、被写体の属性を識別した上でグループ化を行っても良い。撮像装置の位置的な制約と移動確率データとを両方使用してグループ化を行っても構わない。
実施形態2では、特徴量選択確率を被写体の移動方向と、被写体の移動と撮像装置の位置的情報に関する統計的情報である移動確率データとに基づいて決定する例を説明した。しかし、撮像装置の位置的な情報のみを使用して特徴量選択確率を決定してもよい。例えば、ある撮像装置で捉えられた被写体が別の撮像装置で捉えられる確率を、被写体の移動方向に関係なく統計的に求めておき、その統計情報に基づいて特徴量選択確率を決定してもよい。
また、実施形態2では、特徴量選択確率を被写体の移動方向と、被写体の移動と撮像装置の位置的情報に関する統計的情報である移動確率データとに基づいて決定する例を説明した。しかし、被写体の移動に関する統計的情報を用いる代わりに撮像装置の位置的情報を用いてもよい。例えば、2次元平面上に撮像装置の位置座標と被写体の位置座標とをマッピングし、被写体から各撮像装置に向かうベクトルと、被写体の移動方向ベクトルのなす角θをそれぞれ計算し、θに応じて特徴量選択確率を決定するようにしてもよい。
以上、本発明の好ましい形態について詳述したが、本実施形態は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
101:撮像装置、102:辞書、103:ネットワーク、104:記憶部、105:撮像部、106:被写体検出部、107:被写体特徴抽出部、108:被写体追尾部、109:被写体同定部、110:イベント検出部、111:撮像装置制御部、112:情報送信部、113:情報受信部

Claims (6)

  1. 他の情報処理装置と連携する情報処理装置であって、
    撮像画像に基づいて撮像状況として混雑を検出する検出手段と、
    前記撮像状況として混雑が検出された場合に被写体の抽出に使用する特徴量の種類を顔特徴に決定する決定手段と、
    前記決定された前記特徴量の種類を示す情報を前記他の情報処理装置へ送信する送信手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記決定された前記特徴量の種類に応じて撮像部の視野を制御する制御手段をさらに備えることを特徴とする請求項1に記載の情報処理装置。
  3. 前記制御手段は、パン、チルト、ズームのうち少なくとも1つを制御することにより前記撮像部の視野を制御することを特徴とする請求項に記載の情報処理装置。
  4. 前記検出手段により前記撮像状況として混雑が検出されていない場合、前記被写体の抽出に使用する特徴量の種類は色特徴であることを特徴とする請求項に記載の情報処理装置。
  5. 他の情報処理装置と連携する情報処理装置の制御方法であって、
    撮像画像に基づいて撮像状況として混雑を検出するステップと、
    前記撮像状況として混雑が検出された場合に被写体の抽出に使用する特徴量の種類を顔特徴に決定するステップと、
    前記決定された前記特徴量の種類を示す情報を前記他の情報処理装置へ送信するステップと、
    を有することを特徴とする情報処理装置の制御方法。
  6. コンピュータを、請求項1乃至の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2016129129A 2016-06-29 2016-06-29 情報処理装置、情報処理装置の制御方法およびプログラム Active JP6767788B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016129129A JP6767788B2 (ja) 2016-06-29 2016-06-29 情報処理装置、情報処理装置の制御方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016129129A JP6767788B2 (ja) 2016-06-29 2016-06-29 情報処理装置、情報処理装置の制御方法およびプログラム

Publications (3)

Publication Number Publication Date
JP2018006910A JP2018006910A (ja) 2018-01-11
JP2018006910A5 JP2018006910A5 (ja) 2019-07-25
JP6767788B2 true JP6767788B2 (ja) 2020-10-14

Family

ID=60949573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016129129A Active JP6767788B2 (ja) 2016-06-29 2016-06-29 情報処理装置、情報処理装置の制御方法およびプログラム

Country Status (1)

Country Link
JP (1) JP6767788B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7555472B2 (ja) 2021-02-26 2024-09-24 三菱電機株式会社 監視カメラの情報送信装置、監視カメラの情報受信装置、及び監視カメラシステム、並びに監視カメラの情報受信方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003088672A1 (fr) * 2002-04-17 2003-10-23 Fujitsu Limited Systeme de surveillance
JP4597746B2 (ja) * 2005-04-12 2010-12-15 パナソニック株式会社 監視カメラ及び監視システムの制御方法
JP2007049278A (ja) * 2005-08-08 2007-02-22 Canon Inc システム用カメラ及び連携カメラシステム
JP4686663B2 (ja) * 2006-07-10 2011-05-25 国立大学法人京都大学 歩行者トラッキング方法及び歩行者トラッキング装置
JP2009181556A (ja) * 2008-02-01 2009-08-13 Sony Corp 混雑判定装置、混雑判定方法
JP5085621B2 (ja) * 2009-09-10 2012-11-28 株式会社東芝 画像認識処理に適用する特徴情報選択装置、画像認識処理装置、監視システム、方法、及びプログラム
JP6270433B2 (ja) * 2013-11-26 2018-01-31 キヤノン株式会社 情報処理装置、情報処理方法、情報処理システム

Also Published As

Publication number Publication date
JP2018006910A (ja) 2018-01-11

Similar Documents

Publication Publication Date Title
US8432445B2 (en) Air conditioning control based on a human body activity amount
EP3024227B1 (en) Image processing apparatus and image processing method
JP6555906B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6654789B2 (ja) 変化点で複数候補を考慮して物体を追跡する装置、プログラム及び方法
JP7272024B2 (ja) 物体追跡装置、監視システムおよび物体追跡方法
KR20150032630A (ko) 촬상 시스템에 있어서의 제어방법, 제어장치 및 컴퓨터 판독 가능한 기억매체
JP6584123B2 (ja) 画像処理装置、画像処理方法、及びプログラム
US10127424B2 (en) Image processing apparatus, image processing method, and image processing system
JP2016134803A (ja) 画像処理装置及び画像処理方法
JPWO2015133159A1 (ja) 画像処理装置、画像処理方法、および、画像処理プログラム
JP2019029935A (ja) 画像処理装置およびその制御方法
JP7099809B2 (ja) 画像監視システム
JP7074174B2 (ja) 識別器学習装置、識別器学習方法およびコンピュータプログラム
JP6798609B2 (ja) 映像解析装置、映像解析方法およびプログラム
JP6767788B2 (ja) 情報処理装置、情報処理装置の制御方法およびプログラム
KR101290517B1 (ko) 촬영장치 및 이의 대상 추적방법
JP6939065B2 (ja) 画像認識用コンピュータプログラム、画像認識装置及び画像認識方法
JP2019067377A (ja) 画像処理装置及び方法及び監視システム
KR20200010691A (ko) 이종 카메라를 활용한 인물인식 및 교통통제시스템
JP7566586B2 (ja) 推定装置、推定システム、推定方法及びプログラム
KR20180111150A (ko) 영상에서 전경을 추출하는 장치 및 그 방법
JP2017073071A (ja) 同一判定プログラム、同一判定装置、および同一判定方法
CN116600194B (zh) 一种用于多镜头的切换控制方法及系统
JP2017005582A (ja) 画像処理装置、画像処理方法、及びプログラム
EP4276770B1 (en) Object re-identification in video streams

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190618

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200717

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200918

R151 Written notification of patent or utility model registration

Ref document number: 6767788

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151