JP2021064871A - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JP2021064871A JP2021064871A JP2019188341A JP2019188341A JP2021064871A JP 2021064871 A JP2021064871 A JP 2021064871A JP 2019188341 A JP2019188341 A JP 2019188341A JP 2019188341 A JP2019188341 A JP 2019188341A JP 2021064871 A JP2021064871 A JP 2021064871A
- Authority
- JP
- Japan
- Prior art keywords
- imaging
- video
- information processing
- image
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Closed-Circuit Television Systems (AREA)
- Studio Devices (AREA)
Abstract
【課題】要約映像を効率良く生成することができる情報処理装置を提供すること。【解決手段】映像の中で検知された対象物の出現順序を変更することにより、要約映像を生成する情報処理装置であって、複数の撮像アングルで撮像部が撮像した映像を取得する第1の取得手段と、前記第1の取得手段が取得した映像のうち、背景画像が類似する撮像区間の映像を複数抽出する抽出手段と、前記抽出手段が抽出した複数の撮像区間の映像を用いて1つの要約映像を生成する生成手段と、を備える。【選択図】図5
Description
本発明は、情報処理装置および情報処理方法に関する。
近年、街頭、店舗、ビル、工場内などの監視を目的として、ネットワークカメラが利用されている。ネットワークカメラの例として、レンズおよび鏡筒部がカメラ本体と一体化され、レンズおよび鏡筒部がパン、チルトおよびズーム動作可能な機構を有するものがある。
監視カメラが撮像した映像に要約処理を実施し、数時間に及ぶ映像を数分から数十分に凝縮する技術が特許文献1に記載されている。特許文献1の要約処理では、まず、対象となる映像から背景画像を認識する。次に、背景画像に対して、映像内を動く物体をオブジェクトとして認識する。要約映像では、背景画像に対してオブジェクトを敷き詰めて再生する。要約処理された映像を確認することで、利用者は短時間でネットワークカメラが撮像した映像を目視で確認することができる。特許文献1の監視カメラは撮像範囲(撮像アングル)を固定している状態で撮像した映像を要約するものである。
しかしながら、特許文献1では撮像範囲(撮像アングル)を固定している状態で撮像した映像を要約するので、撮像範囲が変化したならば、当該変化後の撮像範囲で撮像を行って、映像を要約することになる。そして、撮像範囲が元の撮像範囲に戻ってきた場合には、新たな要約映像を生成することになる。従って、同じ撮像範囲の映像について、複数の要約映像を生成することになる。
本発明は、上記した問題点に鑑みてなされたものであり、要約映像を効率良く生成することができる情報処理装置を提供することを目的とする。
上記目的を達成するための本発明の1つの態様に係る情報処理装置は、映像の中で検知された対象物の出現順序を変更することにより、要約映像を生成する情報処理装置であって、複数の撮像アングルで撮像部が撮像した映像を取得する第1の取得手段と、前記第1の取得手段が取得した映像のうち、背景画像が類似する撮像区間の映像を複数抽出する抽出手段と、前記抽出手段が抽出した複数の撮像区間の映像を用いて1つの要約映像を生成する生成手段と、を備える。
本発明によれば、要約映像を効率良く生成することができる。
以下、本発明の実施形態を、図面を参照して詳細に説明する。なお、以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。実施形態の構成は、本発明が適用される装置の仕様や各種条件(使用条件、使用環境等)によって適宜修正又は変更され得る。本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されない。
図1は、本発明の実施形態に係る撮像システム10の構成の一例を示す図である。図1に示すように、撮像システム10は、撮像装置20、サーバ30、クライアント装置40および表示装置50を有している。撮像装置20はサーバ30にネットワーク60aを介して接続されている。サーバ30はクライアント装置40にネットワーク60bを介して接続されている。クライアント装置40は表示装置50にネットワーク60cを介して接続されている。各ネットワーク60a、60b、60cは、有線でも無線でもよい。
撮像装置20は、例えば、パン動作、チルト動作およびズーム動作ができるネットワークカメラである。パン動作、チルト動作およびズーム動作は、まとめて「パン・チルト・ズーム」と称する場合がある。クライアント装置40は、例えば、パーソナルコンピュータ、タブレット端末、スマートフォンである。表示装置50は、例えば、液晶ディスプレイである。
なお、図1の撮像システム10において、1台の撮像装置20がサーバ30に接続されているが、複数の撮像装置がサーバ30に接続されてもよい。
なお、図1の撮像システム10において、1台の撮像装置20がサーバ30に接続されているが、複数の撮像装置がサーバ30に接続されてもよい。
図2(a)は撮像装置20の構成の一例を示し、図2(b)はクライアント装置40の構成の一例を示している。
図2(a)に示すように、撮像装置20は、被写体(オブジェクト)を撮像する撮像部21と、撮像部21に対する合焦制御、ズーム制御、露出制御、パン制御およびチルト制御が可能な撮像系制御部22とを有する。また、撮像装置20は、撮像部21が生成した映像(動画)に対して所定の画像処理を行い、その後、例えばJPEGやH.264、H.265といった映像ファイルを生成する画像処理部23を有する。更に、撮像装置20は、ネットワーク60aおよび60bを介して、クライアント装置40との通信を司る通信部24を有する。クライアント装置40のユーザは、クライアント装置40を操作することにより、撮像装置20にデータ、信号(制御信号を含む)等を送ることができる。撮像装置20は、クライアント装置40から撮像装置20に送信される制御信号に基づいて操作される。
図2(a)に示すように、撮像装置20は、被写体(オブジェクト)を撮像する撮像部21と、撮像部21に対する合焦制御、ズーム制御、露出制御、パン制御およびチルト制御が可能な撮像系制御部22とを有する。また、撮像装置20は、撮像部21が生成した映像(動画)に対して所定の画像処理を行い、その後、例えばJPEGやH.264、H.265といった映像ファイルを生成する画像処理部23を有する。更に、撮像装置20は、ネットワーク60aおよび60bを介して、クライアント装置40との通信を司る通信部24を有する。クライアント装置40のユーザは、クライアント装置40を操作することにより、撮像装置20にデータ、信号(制御信号を含む)等を送ることができる。撮像装置20は、クライアント装置40から撮像装置20に送信される制御信号に基づいて操作される。
また、撮像装置20は、制御部25、メタデータ生成部26および記憶部27を有する。制御部25は、例えば、1つまたは複数のプロセッサ(例えば、CPUやMPU)により構成される。制御部25は、撮像装置20全体の動作を制御する。また、制御部25は、所定の解析処理を行うことや、通知情報を生成することもできる。メタデータ生成部26は、撮像部21が生成した映像のメタデータを生成する。CPUはCentral Processing Unitの略である。MPUはMircoprosessor Unitの略である。
記憶部27は、撮像部21が撮像した映像を記憶する。記憶部27は、例えば、ROM、RAM、HDD、フラッシュメモリまたは着脱可能なSDカードなどの記憶媒体により構成される。記憶部27は、制御部25が実行するプログラムの格納領域、プログラム実行中のワーク領域等として使用され得る。記憶部27は、撮像装置20の撮像方向を制御するための制御パラメータ等を記憶することもできる。ROMはRead Only Memoryの略である。RAMはRandom Access Memoryの略である。HDDはHard Disk Driveの略である。
撮像装置20は、撮像装置20の撮像方向に関する情報、撮像装置20の設定情報、撮像装置20が行った解析結果(解析情報)、撮像装置20が生成した通知情報を、映像ファイルと共に生成し、通信部を介してメタデータとして送信してもよい。
サーバ30は、撮像装置20と、ネットワーク60aを介して接続され、撮像装置20が出力する映像および付随するメタデータを受信して保存する。また、サーバ30は、ネットワーク60aおよび60bを介して、クライアント装置40からの制御信号を撮像装置20に送信する。
サーバ30は、撮像装置20と、ネットワーク60aを介して接続され、撮像装置20が出力する映像および付随するメタデータを受信して保存する。また、サーバ30は、ネットワーク60aおよび60bを介して、クライアント装置40からの制御信号を撮像装置20に送信する。
図2(b)に示すように、クライアント装置40は、制御部41と通信部42と記憶部43と操作部44と出力部45を有する。クライアント装置40の通信部42は、サーバ30とネットワーク60bを介して接続され、制御部41の制御の下、サーバ30内の映像と、必要に応じて付随するメタデータとを読み出す。クライアント装置40は、撮像装置20から取得した映像(情報)を処理する装置であるので、情報処理装置と称してもよい。
制御部41は、例えば、1つまたは複数のプロセッサ(例えば、CPUやMPU)により構成される。制御部41は、サーバ30から読み出した映像を表示装置50に表示させることができる。また、制御部41は、サーバ30から読み出した映像の記憶部43に記憶する。制御部41は、記憶部43から映像を適宜読み出して、要約処理を行い、その結果(要約映像)を表示装置50に表示させることもできる。制御部41は、記憶部43に記憶されているプログラムに基づいて、要約処理等の処理を行う。
制御部41は、例えば、1つまたは複数のプロセッサ(例えば、CPUやMPU)により構成される。制御部41は、サーバ30から読み出した映像を表示装置50に表示させることができる。また、制御部41は、サーバ30から読み出した映像の記憶部43に記憶する。制御部41は、記憶部43から映像を適宜読み出して、要約処理を行い、その結果(要約映像)を表示装置50に表示させることもできる。制御部41は、記憶部43に記憶されているプログラムに基づいて、要約処理等の処理を行う。
記憶部43は、例えば、ROM、RAM、HDD、フラッシュメモリまたは着脱可能なSDカードなどの記憶媒体により構成される。記憶部43は、各処理を実行する際に一時的に若しくは恒久的に情報を格納しておくために使用される。例えば、撮像装置20から送信されてくる映像を記憶することが可能である。また、記憶部43は、各種パラメータや、制御部41が実行するプログラムの格納領域等として使用され得る。
操作部44は、キーボードやマウスなどにより構成されている。クライアント装置40のユーザは、操作部44を操作することにより、データ、信号等を入力し、通信部42を介して撮像装置20に向けて送信する。また、クライアント装置40のユーザは、操作部44を操作することにより、クライアント装置40が要約処理する対象となる映像を指定することができる。操作部44は入力部と称してもよい。出力部45は、例えば、音声等を出力する。
図3は、クライアント装置40が実行する要約処理を説明するための図であり、クライアント装置40の機能構成の一例を示している。
クライアント装置40は、映像取得部200、アングル情報取得部201,映像情報保持部202,背景画像抽出部203、背景画像保持部204、背景画像認識部205、映像結合部206および要約映像生成部207を有している。
クライアント装置40は、映像取得部200、アングル情報取得部201,映像情報保持部202,背景画像抽出部203、背景画像保持部204、背景画像認識部205、映像結合部206および要約映像生成部207を有している。
映像取得部200は、ユーザが指定した要約対象となる映像をサーバ30から読み出すことにより、要約対象となる映像を取得する。また、映像取得部200は、要約対象となる映像をサーバ30から読み出す際に、付随するメタデータが存在する場合は、当該メタデータも読み出す。
アングル情報取得部201は、映像取得部200が取得した映像に付随するメタデータから、映像内で撮像アングルの切り替えが発生しているか否かを判定する。例えば、アングル情報取得部201は、要約対象となる映像に付随するメタデータから撮像アングルに係るパン、チルトおよびズームの情報を取得し、当該情報に基づいて撮像アングルの切り替えが発生しているかを判定する。
アングル情報取得部201は、映像取得部200が取得した映像に付随するメタデータから、映像内で撮像アングルの切り替えが発生しているか否かを判定する。例えば、アングル情報取得部201は、要約対象となる映像に付随するメタデータから撮像アングルに係るパン、チルトおよびズームの情報を取得し、当該情報に基づいて撮像アングルの切り替えが発生しているかを判定する。
映像情報保持部202は、アングル情報取得部201が取得したメタデータに、撮像アングルに係るパン、チルトおよびズームの情報が含まれていた場合に、要約対象となる映像に対して同一撮像アングルとなる期間(撮像区間)の情報を保持する。
背景画像抽出部203は、映像情報保持部202が同一撮像アングル期間の情報を保持している場合は、同一撮像アングル期間内に対して背景画像を抽出する。映像情報保持部202に同一撮像アングル期間の情報がない撮像区間については、背景画像抽出部203は、要約対象となる映像から同一撮像アングル期間を抽出し、背景画像を抽出する。背景画像や同一撮像アングル期間の抽出は、背景差分やフレーム間差分などの既存の手法を用いて行う。
背景画像保持部204は、背景画像抽出部203が抽出した背景画像と、背景画像が固定されている期間とを保持する。
背景画像認識部205は、背景画像保持部204が保持する各背景画像の比較を行い、背景画像間の類似性(ここで「類似」は同一の場合を含む)を判断する。背景画像間の比較方法に関しては、テンプレートマッチング、特徴点のマッチング、色ヒストグラムなどの既存のマッチング手法を用いる。
映像結合部206は、背景画像認識部205により背景画像の類似性が認められた撮像区間の映像を、要約処理の為に結合する。
背景画像認識部205は、背景画像保持部204が保持する各背景画像の比較を行い、背景画像間の類似性(ここで「類似」は同一の場合を含む)を判断する。背景画像間の比較方法に関しては、テンプレートマッチング、特徴点のマッチング、色ヒストグラムなどの既存のマッチング手法を用いる。
映像結合部206は、背景画像認識部205により背景画像の類似性が認められた撮像区間の映像を、要約処理の為に結合する。
要約映像生成部207は、映像結合部206により結合された(集結された)要約用の映像に要約処理を実施する(要約映像を生成する)。映像結合部206により結合された要約用の映像が複数ある場合は、要約用の映像毎に要約処理を実施する。要約処理は既存の要約処理手法を用いる。また、要約映像生成部207は、オブジェクト同士の外観特徴や動作特徴の類似性(「類似」は同一の場合を含む)を判定する機能も備えている。要約映像生成部207は、例えば、人物再同定(Person Re−Identification)や個人認証といった手法により、オブジェクト同士の類似性を判定する。要約映像生成部207は、要約映像を生成する際に、要約対象の映像から、背景画像を抽出し、前景をオブジェクトとして抽出し、背景画像に対してオブジェクトを背景画像に敷き詰める。その際、オブジェクトが重ならないようにする。また、同一時刻に複数個所に同一のオブジェクトを表示しないようにする。
要約映像生成部207は、すべての動作軌跡の間で最も衝突が少なく、再生時間が短くなるように、要約映像における各動作軌跡の開始時刻を求める。
要約映像生成部207は、すべての動作軌跡の間で最も衝突が少なく、再生時間が短くなるように、要約映像における各動作軌跡の開始時刻を求める。
ここで、対象物の動作軌跡間の衝突について説明する。要約映像生成部207は、以下の式(1)を用いて、対象物i,j間の衝突コストColij(k)を算出する。ただし、kは対象物i,jの開始時刻(要約映像中に出現する時刻)の時間差であり、xt i,yt iはそれぞれ時刻tにおける対象物iの中心のx座標及びy座標であり、rt iは時刻tにおける対象物iの半径である。また、Tij(k)は、開始時刻の時間差がkであるとしたときに、対象物i,jの両方の動作軌跡が映像中に現れる期間を表している。さらに、式(1)の右辺の絶対値記号内側の数式は、対象物i,jの中心間の距離が半径の合計よりも小さいときに衝突ありを示す相対的に大きな値となり、それ以外のときに衝突なしを示す相対的に小さな値となる数式を表している。したがって、衝突コストColij(k)は、値が大きいほど、対象物i,jが衝突するフレームの数が多いことを表す。
要約映像生成部207は、対象物の全ての組み合わせにおいて衝突コストColij(k)が最小になる開始時刻を求めるために、シミュレーテッドアニーリング法を用いる。シミュレーテッドアニーリング法によれば、範囲制約のある非線形問題を効率的に計算することができる。
したがって、要約映像生成部207は、シミュレーテッドアニーリング法を用いて各対象物の開始時刻を求めることにより、要約映像における最適な各対象物の開始時刻を求めることができる。要約映像生成部207は、このようにして元映像に対して対象物の空間的な位置を維持しつつ、出現開始順序を変更することで要約映像を生成する。具体的には、背景画像の上に元映像から画素マスクを用いて切り出した対象物の画像を、算出した開始時刻に基づいて張り付けていくことによって、要約映像が生成される。本実施形態では、以下に説明するように、各アングルについてこの要約映像がそれぞれ生成されることになる。
したがって、要約映像生成部207は、シミュレーテッドアニーリング法を用いて各対象物の開始時刻を求めることにより、要約映像における最適な各対象物の開始時刻を求めることができる。要約映像生成部207は、このようにして元映像に対して対象物の空間的な位置を維持しつつ、出現開始順序を変更することで要約映像を生成する。具体的には、背景画像の上に元映像から画素マスクを用いて切り出した対象物の画像を、算出した開始時刻に基づいて張り付けていくことによって、要約映像が生成される。本実施形態では、以下に説明するように、各アングルについてこの要約映像がそれぞれ生成されることになる。
図4は、本実施形態に係る要約処理の処理手順の一例を示すフローチャートである。図4のフローチャートの説明においては、図1、図3および図5を適宜参照する。SはStepの略である。
本実施形態では、撮像装置20は所定時間(所定期間)毎に撮像アングルを変えるようにプリセット巡回設定されているとする。プリセット巡回とは、予め決められた撮像アングルで予め決められた時間だけ撮像することを、予め決められた順番で巡回する(周期的に変化する)ように行うことを意味する。例えば、撮像装置20は、撮像アングルAで固定されて第1の所定時間だけ撮像し、その後、撮像アングルを変えて撮像アングルBで固定されて第2の所定時間だけ撮像し、その後、撮像アングルを変えて撮像アングルCで固定されて第3の所定時間だけ撮像する。撮像アングルCでの撮像時間(第3の所定時間)が終わると、撮像アングルAに戻る。撮像アングルAに戻ったら、再び、撮像アングルA→B→Cの順で、撮像アングルを順次変えて行く。以下の説明において、撮像アングルA、B、Cは、撮像アングルの種類と称する場合がある。なお、撮像装置20は、プリセット巡回設定が設定されていても、途中で(例えば、ユーザからの指示により)、別の撮像アングルで撮像することもできるとする。
本実施形態では、撮像装置20は所定時間(所定期間)毎に撮像アングルを変えるようにプリセット巡回設定されているとする。プリセット巡回とは、予め決められた撮像アングルで予め決められた時間だけ撮像することを、予め決められた順番で巡回する(周期的に変化する)ように行うことを意味する。例えば、撮像装置20は、撮像アングルAで固定されて第1の所定時間だけ撮像し、その後、撮像アングルを変えて撮像アングルBで固定されて第2の所定時間だけ撮像し、その後、撮像アングルを変えて撮像アングルCで固定されて第3の所定時間だけ撮像する。撮像アングルCでの撮像時間(第3の所定時間)が終わると、撮像アングルAに戻る。撮像アングルAに戻ったら、再び、撮像アングルA→B→Cの順で、撮像アングルを順次変えて行く。以下の説明において、撮像アングルA、B、Cは、撮像アングルの種類と称する場合がある。なお、撮像装置20は、プリセット巡回設定が設定されていても、途中で(例えば、ユーザからの指示により)、別の撮像アングルで撮像することもできるとする。
S300において、映像取得部200は、サーバ30に格納されている映像および付随するメタデータを読み出す(取得する)。図5(A)は、取得した映像を表している。図5(A)に示すように、S300の時点では、取得した映像が、どのような撮像アングルで撮像された映像なのかは分からない。
S301において、アングル情報取得部201は、S300で読み出したメタデータから、プリセット巡回設定に関する情報があるかを判定する。S301の判定結果がYesの場合、S302に進む。
S301において、アングル情報取得部201は、S300で読み出したメタデータから、プリセット巡回設定に関する情報があるかを判定する。S301の判定結果がYesの場合、S302に進む。
S302において、アングル情報取得部201は、メタデータ内のプリセット巡回設定に関する情報に基づいて、撮像アングルの種類と、当該撮像アングルが固定される期間を取得する。本実施形態では、図5(B)に示すように、アングル情報取得部201は、メタデータを取得することにより、3種類の撮像アングルA、BおよびCを取得する。アングル情報取得部201は、取得した撮像アングルの種類と撮像アングルが固定される期間に関する情報を映像情報保持部202に格納する。本実施形態では、図5(B)に示すように、撮像アングルAで第1所定時間T1だけ固定されて撮像を行い、撮像アングルBで第2所定時間T2だけ固定されて撮像を行い、撮像アングルCで第3所定時間T3だけ固定されて撮像を行う。T1とT2の間のQ1は、撮像アングルAから撮像アングルBに移行するための時間である。T2とT3の間のQ2は、撮像アングルBから撮像アングルCに移行するための時間である。T3とT1の間のQ3は、撮像アングルCから撮像アングルAに移行するための時間である。
背景画像抽出部203は、映像情報保持部202に格納された撮像アングルの種類と、撮像アングルが固定されている期間に関する情報に基づいて、背景画像を抽出する。背景画像抽出部203は抽出した背景画像を、撮像アングルの種類毎に背景画像保持部204に格納する。この格納の際、背景画像抽出部203は、背景画像を、当該背景画像が固定されている期間に紐づけて格納する。図5(B)から分かるように、背景画像抽出部203は、撮像アングルA、B、Cについて、背景画像が類似する撮像区間の映像を複数抽出している。また、背景画像抽出部203は、撮像アングルAと時間T1を紐づけて格納し、撮像アングルBと時間T2を紐づけて格納し、撮像アングルCと時間T3を紐づけて格納する。
一方、S301の判定結果がNoの場合、つまり、メタデータがない場合、または、メタデータ内にプリセット巡回設定に関する情報がない場合は、S303に進む。
S303において、アングル情報取得部201は、S300で取得したメタデータに基づいて、プリセット巡回設定で設定された撮像アングルA〜C以外で撮像装置20がパン、チルト、ズームを行ったかを判定する。本実施形態では、図5(C)に示すように、アングル情報取得部201は、メタデータに基づいて、新たな撮像アングルA’とDで撮像が行われていたと判定したとする。つまり、クライアント装置のユーザ40が、2回目の撮像アングルBの後に撮像アングルA’での撮像を指示し、2回目の撮像アングルCの後に撮像アングルDでの撮像を指示したとする。撮像アングルA’での撮像を指示は、2回目の撮像アングルBとCの間に撮像アングルA’での撮像を割り込ませる指示であると考えてもよい。撮像アングルA’は撮像アングルAとほぼ同一の撮像アングルであるとする。S303の判定結果がYesの場合、S304に進む。S303の判定結果がNoの場合、S305に進む。
S303において、アングル情報取得部201は、S300で取得したメタデータに基づいて、プリセット巡回設定で設定された撮像アングルA〜C以外で撮像装置20がパン、チルト、ズームを行ったかを判定する。本実施形態では、図5(C)に示すように、アングル情報取得部201は、メタデータに基づいて、新たな撮像アングルA’とDで撮像が行われていたと判定したとする。つまり、クライアント装置のユーザ40が、2回目の撮像アングルBの後に撮像アングルA’での撮像を指示し、2回目の撮像アングルCの後に撮像アングルDでの撮像を指示したとする。撮像アングルA’での撮像を指示は、2回目の撮像アングルBとCの間に撮像アングルA’での撮像を割り込ませる指示であると考えてもよい。撮像アングルA’は撮像アングルAとほぼ同一の撮像アングルであるとする。S303の判定結果がYesの場合、S304に進む。S303の判定結果がNoの場合、S305に進む。
S304において、アングル情報取得部201は、メタデータ内のパン、チルト、ズームに関する情報に基づいて、撮像アングルの種類(撮像アングルA’、D)と、撮像アングルA’、Dが固定される期間T4、T5を取得する。アングル情報取得部201は、取得した撮像アングルA’、Dと当該撮像アングルが固定される期間T4、T5に関する情報を映像情報保持部202に格納する。T2とT4の間のQ4は、撮像アングルBから撮像アングルA’に移行するための時間である。T4とT3の間のQ5は、撮像アングルA’から撮像アングルCに移行するための時間である。T3とT5の間のQ6は、撮像アングルCが撮像アングルDに移行するための時間である。
背景画像抽出部203は、映像情報保持部202に格納された撮像アングルの種類(撮像アングルA’、D)と、撮像アングルが固定されている期間(T4、T5)に関する情報をもとに、背景画像を抽出する。背景画像抽出部203は抽出した背景画像を、撮像アングルの種類ごとに背景画像保持部204に格納する。この格納の際、背景画像と、当該背景画像が固定されている期間(T4、T5)と紐づけて格納する。
S305において、背景画像抽出部203は、要約対象となる映像内でS302、S304で処理がされていない撮像区間において、パン、チルト、ズームしている映像以外の、撮像アングルが固定されている撮像区間(期間)がないかを確認する。これは、例えば、ユーザが、図5(C)の1回目のCの後に、撮像アングルAで撮像するように撮像装置20に指示を出した場合である。この場合、背景画像抽出部203は、撮像アングルが固定されている撮像区間の背景画像を抽出し、背景画像保持部204に当該背景画像が固定されている期間と紐づけて格納する。
S306において、背景画像認識部205は、背景画像保持部204に格納されている背景画像が二つ以上あるかを判定する。S306の判定結果がYesの場合、S307に進む。S306の判定結果がNoの場合、つまり、背景画像保持部204に格納されている背景画像が一つの場合、S308に進む。
S307において、背景画像認識部205は、背景画像保持部204に格納されている複数の背景画像を比較する。具体的には、背景画像認識部205は、まず、S302、S304で背景画像保持部204に格納された背景画像のアングル情報を比較し、類似撮像アングルがあるかを確認する。背景画像認識部205は、類似撮像アングル(同一撮像アングルを含む)があるかを確認することで、プリセット巡回の撮像アングルとパン、チルト、ズームを任意に操作した撮像アングルと間で類似した撮像アングルがないかを調べる(判断する)。
類似撮像アングルがあると判断した場合、背景画像認識部205は、類似撮像アングルごとに撮像アングルが固定されている期間に関する情報をまとめる。本実施形態の背景画像認識部205は、パンやチルトの位置再現性を考慮して、例えば各撮像アングルのパン、チルトの位置の差が一度以内であれば同一撮像アングル(類似撮像アングル)であると認識する。つまり、所定の角度範囲内ならば、撮像アングルからずれていても、同一の撮像アングルとして取り扱い、これを「類似撮像アングル」としている。
類似撮像アングルがあると判断した場合、背景画像認識部205は、類似撮像アングルごとに撮像アングルが固定されている期間に関する情報をまとめる。本実施形態の背景画像認識部205は、パンやチルトの位置再現性を考慮して、例えば各撮像アングルのパン、チルトの位置の差が一度以内であれば同一撮像アングル(類似撮像アングル)であると認識する。つまり、所定の角度範囲内ならば、撮像アングルからずれていても、同一の撮像アングルとして取り扱い、これを「類似撮像アングル」としている。
図5(D)に示すように、背景画像認識部205は、背景画像のアングル情報を比較した結果、4つの類似撮像アングルのグループを作る。第1のグループは、撮像アングルAを2区間含み、且つ、撮像アングルA’を1区間含む。第2のグループは、撮像アングルBを2区間含む。第3のグループは、撮像アングルCを2区間含む。第4のグループは、撮像アングルDを1区間含む。各グループは、類似撮像アングルのグループである。
背景画像認識部205は、次に、アングル情報がない背景画像を含めて、類似した背景画像があるかを判断する。背景画像認識部205は、類似した背景画像があると判断した場合、類似した背景画像ごとに撮像アングルが固定されている期間に関する情報をまとめる。
S307において、映像結合部206は、背景画像認識部205がまとめた類似した背景の撮像アングルの固定期間をもとに要約処理ができるよう、要約対象の映像から類似アングル毎の映像期間をまとめる。つまり、図5(D)に示すように、映像結合部206は、要約処理の為に撮像アングルA、A’の映像期間を1つにまとめ(TA)、撮像アングルBの映像期間を1つにまとめ(TB)、撮像アングルCの映像期間を1つにまとめる(TC)。撮像アングルDの映像期間は1つしかないので、そのままである(TD)。
S308において、要約映像生成部207は、映像結合部206がまとめた映像期間(TA、TB、TC、TD)ごとに要約映像を生成する。具体的には、図5(E)に示すように、要約映像生成部207は、映像結合部206がまとめた4つの映像期間TA、TB、TC、TDについて、それぞれ要約処理を実施し、要約映像(要約A、B、C、D)を生成する。
なお、映像結合部206に要約対象の映像から類似撮像アングル毎の映像期間をまとめた情報がない場合、すなわち、要約対象の映像内で撮像アングルが変わらない場合、通常の要約処理を実施する。
なお、映像結合部206に要約対象の映像から類似撮像アングル毎の映像期間をまとめた情報がない場合、すなわち、要約対象の映像内で撮像アングルが変わらない場合、通常の要約処理を実施する。
S308において要約映像生成部207が要約映像を生成する際に、同一撮像アングル内で、かつ、異なる映像期間内に同一のオブジェクトが存在する場合がある。この場合、要約映像生成部207は、要約映像を生成する処理として、前景をオブジェクトとして認識する。要約映像生成部207は、撮像アングルが切り替わる直前に撮像されているオブジェクトと、同一の撮像アングルに戻った直後のオブジェクトとの類似性(同一性)を判定する。要約映像生成部207は、同一の撮像アングルの前後で同一のオブジェクトがあると判定した場合、要約映像内に当該オブジェクトを同時には表示させない(同一時刻に同一のオブジェクトが現れないようにする)。例えば、同一のオブジェクトは、要約映像内において時系列で表示させる。
なお、オブジェクトを時系列で表示させると、撮像アングルの切り替わりのタイミングで、要約映像内においてオブジェクトが瞬時に移動する(例えば、位置P1から位置P2へ瞬時に移動する)ことが考えられる。オブジェクトが瞬時に移動することを回避するために、要約映像生成部207は、要約処理時に撮像アングルが切り替わる直前のオブジェクトの画像を、所定時間(例えば、1秒)かけて、撮像アングルが切り替わった直後の位置までスライドさせて表示させる。つまり、オブジェクトの画像は位置P1から位置P2まで、所定時間でスライド(移動)するように表示する。このように、本実施形態では、要約映像において撮像アングルの切り替わりのタイミングでオブジェクトの移動が所定速度以上にならないように要約映像を生成する。要約映像においてオブジェクトの移動が所定速度以上にならないようにするために、例えば、要約映像においてオブジェクトが所定速度未満で移動する映像を追加する。オブジェクトをスライドさせて表示させることで、同一オブジェクトではあるが、撮像された時刻が異なる旨を映像内で明示することができる。
S309において、要約映像生成部207は、生成した要約映像が複数あるかを判定する。S309の判定結果がYesの場合、S310に進む。
S310おいて、要約映像生成部207は、複数の要約映像を一つの要約映像ファイルとなるよう、複数の要約映像を結合する。具体的には、図5(F)に示すように、4つの要約映像(要約A、B、C、D)を結合して、一つの要約映像ファイルを生成する。
S309の判定結果がNoの場合、つまり、要約映像生成部207が生成した要約映像が一つしかない場合(例えば、要約Aのみの場合)、処理を終了する。
S310おいて、要約映像生成部207は、複数の要約映像を一つの要約映像ファイルとなるよう、複数の要約映像を結合する。具体的には、図5(F)に示すように、4つの要約映像(要約A、B、C、D)を結合して、一つの要約映像ファイルを生成する。
S309の判定結果がNoの場合、つまり、要約映像生成部207が生成した要約映像が一つしかない場合(例えば、要約Aのみの場合)、処理を終了する。
本実施形態によれば、複数の撮像アングルで撮像装置20が撮像した映像を要約する撮像システム10において、撮像アングル毎に(背景画像毎に)要約処理を実施する。つまり、本実施形態では、要約映像を生成する際に、背景画像の類似性を判定し、背景画像が類似した映像をまとめて要約画像を生成する。よって、視認性の良い要約映像を生成することができる。撮像装置20がパン、チルト、ズーム動作が可能なネットワークカメラである場合においても、要約映像では背景画像毎にオブジェクトを表示させることができる。
本実施形態では、背景画像が一致する映像をまとめて一つの要約映像としている。従って、撮像アングルが変わる度に要約映像を作成する場合(例えば、図5(B)の2つのAについて2つの要約映像を生成する場合)と比較して、圧縮率の高い要約映像を作成することができる。
本実施形態では、背景画像が一致する映像をまとめて一つの要約映像としている。従って、撮像アングルが変わる度に要約映像を作成する場合(例えば、図5(B)の2つのAについて2つの要約映像を生成する場合)と比較して、圧縮率の高い要約映像を作成することができる。
なお、図2(a)に示した撮像装置20の構成は一例であり、機能モジュール(例えば、22、23、26)の一部はハードウェアによって実現されてもよい。また、図3に示したクライアント装置40の機能構成も一例であり、機能モジュール(200〜207)の一部はハードウェアによって実現されてもよい。ハードウェアにより実現される場合、例えば、所定のコンパイラを用いることで、各機能モジュールの機能を実現するためのプログラムからFPGA上に自動的に専用回路を生成すればよい。FPGAは、Field Programmable Gate Arrayの略である。また、FPGAと同様にしてGate Array回路を形成し、ハードウェアとして実現するようにしてもよい。また、ASIC(Application Specific Integrated Circuit)により実現するようにしてもよい。また、図2(a)および図3に示した機能モジュールの構成は一例であり、複数の機能モジュールが1つの機能モジュールを構成するようにしてもよいし、いずれかの機能モジュールが複数の機能を行うモジュールに分かれてもよい。
撮像装置20およびクライアント装置40は、図2および図3に示した以外の要素を含んでもよい。例えば、撮像装置20は表示部や操作部を有してもよい。
撮像装置20はネットワークカメラに限定されない。撮像装置20は、撮像を行う機能と、撮像により取得した映像を送信する機能を有する装置であればよい。
上記した実施形態では、表示装置50がクライアント装置40と別々に示されているが、表示装置50をクライアント装置40に組み込んでもよい。表示装置50がクライアント装置に一体化される場合は、表示装置50は、例えば、出力部45に組み込まれ、出力部45が表示機能付きの出力部になる。
撮像装置20はサーバ30を介してクライアント装置40に接続されているが、サーバ30を介さずにクライアント装置40に接続されてもよい。
また、クライアント装置40の一部もしくは全部を撮像装置20に組み込んでもよい。例えば、撮像装置20の中に、クライアント装置40の要約映像生成機能等を組み込み、撮像装置20が図5(F)のような要約映像を生成するようにしてもよい。この場合、撮像装置20が生成した要約映像を、例えば、表示装置50に送信して表示させる。
撮像装置20はネットワークカメラに限定されない。撮像装置20は、撮像を行う機能と、撮像により取得した映像を送信する機能を有する装置であればよい。
上記した実施形態では、表示装置50がクライアント装置40と別々に示されているが、表示装置50をクライアント装置40に組み込んでもよい。表示装置50がクライアント装置に一体化される場合は、表示装置50は、例えば、出力部45に組み込まれ、出力部45が表示機能付きの出力部になる。
撮像装置20はサーバ30を介してクライアント装置40に接続されているが、サーバ30を介さずにクライアント装置40に接続されてもよい。
また、クライアント装置40の一部もしくは全部を撮像装置20に組み込んでもよい。例えば、撮像装置20の中に、クライアント装置40の要約映像生成機能等を組み込み、撮像装置20が図5(F)のような要約映像を生成するようにしてもよい。この場合、撮像装置20が生成した要約映像を、例えば、表示装置50に送信して表示させる。
撮像装置20がプリセット巡回設定でのみ動作する場合には、図3のS301、S303、S304およびS305は省略してよい。
上記した実施形態では、撮像アングルA、B、CおよびDの映像の全てについて要約映像を生成したが、特定の撮像アングル(例えば、撮像アングルA)のみについて要約映像を生成するようにしてもよい。あるいは、撮像アングルA〜Dのうち、特定のオブジェクトが映っている撮像アングルの映像だけについて要約映像を生成してもよい。
上記した実施形態では、撮像アングルA、B、CおよびDの映像の全てについて要約映像を生成したが、特定の撮像アングル(例えば、撮像アングルA)のみについて要約映像を生成するようにしてもよい。あるいは、撮像アングルA〜Dのうち、特定のオブジェクトが映っている撮像アングルの映像だけについて要約映像を生成してもよい。
20:撮像装置、30:サーバ、40:クライアント装置、41:制御部、50:表示装置、200:映像取得部、201:アングル情報取得部、203:背景画像抽出部、205:背景画像認識部、206:映像結合部、207:要約映像生成部
Claims (12)
- 映像の中で検知された対象物の出現順序を変更することにより、要約映像を生成する情報処理装置において、
複数の撮像アングルで撮像部が撮像した映像を取得する第1の取得手段と、
前記第1の取得手段が取得した映像のうち、背景画像が類似する撮像区間の映像を複数抽出する抽出手段と、
前記抽出手段が抽出した複数の撮像区間の映像を用いて1つの要約映像を生成する生成手段と、
を備える情報処理装置。 - 前記複数の撮像アングルに関する情報を取得する第2の取得手段をさらに備え、
前記抽出手段は、前記第2の取得手段が取得した情報を用いて、前記背景画像が類似する撮像区間の映像を複数抽出することを特徴とする請求項1に記載の情報処理装置。 - 前記複数の撮像アングルは、周期的に変化する複数の撮像アングルであり、
前記第2の取得手段は、前記周期的に変化する複数の撮像アングルに関する情報を取得することを特徴とする請求項2に記載の情報処理装置。 - 前記映像に所定のオブジェクトが映っているかを判定する判定手段をさらに備え、
前記生成手段は、前記要約映像において同一のオブジェクトが同一時刻に複数現れないように前記要約映像を生成することを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。 - 前記判定手段が、前記映像に前記所定のオブジェクトが映っていると判定した場合、前記生成手段は、前記所定のオブジェクトが映っている映像についてのみ、前記要約映像を生成することを特徴とする請求項4に記載の情報処理装置。
- 前記生成手段は、前記要約映像において前記撮像アングルの切り替わりのタイミングで前記所定のオブジェクトの移動が所定速度以上にならないように前記要約映像を生成することを特徴とする請求項5に記載の情報処理装置。
- 前記生成手段は、前記要約映像において前記所定のオブジェクトの移動が所定速度以上にならないようにするために、前記要約映像において前記所定のオブジェクトが所定速度未満で移動する映像を追加することを特徴とする請求項6に記載の情報処理装置。
- 前記生成手段は、前記複数の撮像アングルのうちの所定の撮像アングルについてのみ前記要約映像を生成することを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
- 前記生成手段が各撮像アングルについて1つの要約映像を生成した場合、当該要約映像を結合する結合手段をさらに備えることを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
- 請求項1から8のいずれか1項に記載の情報処理装置と、
複数の撮像アングルで映像を撮像する撮像部と、
を備える装置。 - 映像の中で検知された対象物の出現順序を変更することにより、要約映像を生成する情報処理方法において、
複数の撮像アングルで撮像部が撮像した映像を取得するステップと、
前記取得するステップで取得した映像のうち、背景画像が類似する撮像区間の映像を複数抽出するステップと、
前記抽出するステップで抽出した複数の撮像区間の映像を用いて1つの要約映像を生成するステップと、
を有する情報処理方法。 - コンピュータを、請求項1から9のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019188341A JP2021064871A (ja) | 2019-10-15 | 2019-10-15 | 情報処理装置および情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019188341A JP2021064871A (ja) | 2019-10-15 | 2019-10-15 | 情報処理装置および情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021064871A true JP2021064871A (ja) | 2021-04-22 |
Family
ID=75486612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019188341A Pending JP2021064871A (ja) | 2019-10-15 | 2019-10-15 | 情報処理装置および情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021064871A (ja) |
-
2019
- 2019-10-15 JP JP2019188341A patent/JP2021064871A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4912117B2 (ja) | 追跡機能付き撮像装置 | |
JP4961965B2 (ja) | 被写体追跡プログラム、被写体追跡装置、およびカメラ | |
JP5018767B2 (ja) | 被写体追跡プログラム、被写体追跡装置、およびカメラ | |
KR101530255B1 (ko) | 객체 자동 추적 장치가 구비된 cctv 시스템 | |
US20160142680A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2016063468A (ja) | 映像処理装置、映像処理方法及び映像処理システム | |
JP2016096481A (ja) | 制御装置、撮像システム、制御方法、及び、プログラム | |
WO2021168804A1 (zh) | 图像处理方法、图像处理装置和图像处理系统 | |
JP5247338B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2009171428A (ja) | デジタルカメラ装置および電子ズームの制御方法およびプログラム | |
JP2007049631A (ja) | 撮像装置 | |
JP2008217714A (ja) | 追跡装置、追跡方法、及び追跡プログラム | |
JP2015228564A (ja) | 監視カメラシステム | |
JP6700706B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2008211534A (ja) | 顔検知装置 | |
CN116017136A (zh) | 拍摄设备的控制方法和装置、存储介质及电子装置 | |
JP2021064871A (ja) | 情報処理装置および情報処理方法 | |
JP2014236313A (ja) | 表示制御装置、表示制御システム、及び、プログラム | |
CN113691731B (zh) | 一种处理方法、装置和电子设备 | |
JP2019153886A (ja) | 監視カメラ制御システム及び監視カメラ制御方法 | |
WO2024062971A1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
JP2009141606A (ja) | 映像処理システム、映像処理装置、映像処理方法 | |
JP2005267005A (ja) | 画像データ処理装置及びプログラム | |
JP2023063765A (ja) | 画像処理装置、画像処理方法、画像処理システム、およびプログラム | |
JP6808398B2 (ja) | 制御装置、撮像装置、制御方法、及びプログラム |