JP2020191514A - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JP2020191514A
JP2020191514A JP2019094997A JP2019094997A JP2020191514A JP 2020191514 A JP2020191514 A JP 2020191514A JP 2019094997 A JP2019094997 A JP 2019094997A JP 2019094997 A JP2019094997 A JP 2019094997A JP 2020191514 A JP2020191514 A JP 2020191514A
Authority
JP
Japan
Prior art keywords
sound collecting
sound
area
imaging
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019094997A
Other languages
English (en)
Inventor
弘隆 関
Hirotaka Seki
弘隆 関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019094997A priority Critical patent/JP2020191514A/ja
Publication of JP2020191514A publication Critical patent/JP2020191514A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】集音領域が撮像領域から外れた場合でもユーザが集音領域を確認できるようにする情報処理装置を提供する。
【解決手段】情報処理装置は、集音機能を有する撮像装置により撮像された撮像画像を取得して表示する表示手段と、表示手段により表示された撮像画像に対して、撮像装置の集音領域を設定する設定手段と、撮像装置により撮像される撮像領域を変更する変更手段と、変更手段により撮像領域が変更された場合、集音領域が表示手段により表示されている撮像画像内にあるかを判定する判定手段と、判定手段が、集音領域は撮像画像内にないと判定した場合、集音領域に関する情報を表示手段に表示させる制御手段と、を備える。
【選択図】図6

Description

本発明は、情報処理装置および情報処理方法に関する。
従来より、インターネットやイントラネットを利用したネットワークカメラシステムが普及している。ネットワークカメラシステムでは、例えば、カメラとPC(PersonalComputer)とをネットワークで接続する。そして、カメラで撮像した画像や、カメラに内蔵されたマイク(もしくは外付けされたマイク)で収録した音声を、ネットワークを介して、PCに送信する。ネットワークカメラシステムのユーザは、画像および音声をPCのモニタやスピーカ等で視聴することができる。
カメラがPTZ(パン・チルト・ズーム)機能を有する場合、ネットワークカメラシステムのユーザは、PCのモニタを確認しながら、遠く離れた場所に設置したカメラを遠隔操作することができる。また、カメラがPTZ機能を有する場合、複数の場所の監視を1台のモニタで行うことも可能である。
ネットワークカメラシステムを利用したテレビ会議システムやライブストリーミングカメラも普及している。例えば、テレビ会議システムでは、複数の無指向性マイクを使用し、当該複数の無指向性マイクから出力される音声信号を所定の方法で処理することにより、入力音声の指向性を形成する(ビームフォーミング技術)。また、特許文献1では、ビームフォーミング技術を利用したネットワークカメラが提案されている。
特開2012−29209号公報
しかしながら、PTZ機能を有するカメラにおいてビームフォーミング等により集音領域を指定した後にパン・チルト・ズーム動作を行うと、集音領域が撮像領域から外れてしまいモニタに表示されなくなってしまうことがある。集音領域がモニタに表示されなくなると、ユーザは、どこから集音しているのか分からなくなってしまい、不便である。
上記課題に鑑みて、本発明の目的は、集音領域が撮像領域から外れた場合でもユーザが集音領域を確認できるようにする情報処理装置を提供することである。
上記した課題を解決するために、本発明の1つの態様による情報処理装置は、集音機能を有する撮像装置により撮像された撮像画像を取得して表示する表示手段と、前記表示手段により表示された撮像画像に対して、前記撮像装置の集音領域を設定する設定手段と、前記撮像装置により撮像される撮像領域を変更する変更手段と、前記変更手段により前記撮像領域が変更された場合、前記集音領域が前記表示手段により表示されている撮像画像内にあるかを判定する判定手段と、前記判定手段が、前記集音領域は前記撮像画像内にないと判定した場合、前記集音領域に関する情報を前記表示手段に表示させる制御手段と、を備える。
本発明によれば、集音領域が撮像領域から外れた場合でも集音領域を確認することが可能となる。
本発明に係る実施形態のネットワークカメラの構成図の一例である。 ビームフォーミング技術を説明するための概念図。 本発明に係る実施形態のクライアント装置の構成図の一例である。 本発明に係る実施形態の集音領域指定方法の一例を示す図である。 本発明に係る実施形態のフローチャートである。 本発明に係る実施形態のフローチャートである。 本発明に係る実施形態のフローチャートである。 本発明に係る実施形態の集音領域表示方法の一例である。
以下、本発明の実施形態を、図面を参照して詳細に説明する。なお、以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。実施形態の構成は、本発明が適用される装置の仕様や各種条件(使用条件、使用環境等)によって適宜修正又は変更され得る。本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されない。また、後述する各実施形態の一部を適宜組み合わせて構成してもよい。
実施形態1
<ネットワークカメラシステムの構成>
本実施形態に係るネットワークカメラシステムの構成例を、図1を用いて説明する。本実施形態に係るネットワークカメラシステム10は、図1に示すように、ネットワークカメラ100とクライアント装置200とを有している。ネットワークカメラ100は撮像装置の一例である。本実施形態では、ネットワークカメラ100は集音機能を有する。クライアント装置200は、情報処理装置の一例である。クライアント装置200は、例えば、PC(パーソナルコンピュータ)である。
ネットワークカメラ100とクライアント装置200とは、LANやインターネットなどのネットワーク150に接続されており、互いにデータ通信が可能な状態となっている。ネットワーク150は有線ネットワークまたは無線ネットワークである。なお、ネットワークカメラ100とクライアント装置200とは、複数のネットワークを介して接続されてもよい。また、ネットワークカメラ100とクライアント装置200とは、1つ以上の装置を介して接続されてもよい。つまり、ネットワークカメラ100とクライアント装置200とが互いにデータ通信を行うことが可能であれば、ネットワークカメラ100とクライアント装置200との間のネットワーク構成は、特定のネットワーク構成に限定されない。
<ネットワークカメラの構成>
ネットワークカメラ100は、撮像部101、画像処理部102、フォーカス・絞り駆動部103、フォーカス・絞り制御部104、パン駆動部105、チルト駆動部106、ズーム駆動部107およびパン・チルト・ズーム制御部108を備える。また、ネットワークカメラ100は、マイクM1、M2、音声処理部109、システム制御部110、通信部111およびメモリ112を備える。なお、パンはネットワークカメラ100のパンニング(panning)を意味し、チルトはネットワークカメラ100のチルティング(tilting)を意味する。
撮像部101は、レンズおよび撮像素子から構成され、被写体を含む外界の光を電気信号に変換し、変換した電気信号を画像信号として、フレーム毎に画像処理部102に送信する。
画像処理部102は、撮像部101から受信する各フレームの画像信号に対して適当な画像信号処理を施すことで、デジタルデータとしての撮像画像を生成する。
フォーカス・絞り駆動部103は、ファーカスレンズ・絞り機構により構成される。フォーカス・絞り駆動部103の動作は、フォーカス・絞り制御部104が生成するフォーカス・絞り制御コマンドに従って制御される。
フォーカス・絞り制御部104は、例えば、クライアント装置200からの指示に基づいて、フォーカス・絞り制御コマンドを生成する。
パン駆動部105は、撮像部101のパン角を変更するためのメカ駆動系および駆動源のモータにより構成される。パン駆動部105の動作はパン・チルト・ズーム制御部108が生成するパン動作コマンドに従って制御される。パン・チルト・ズーム制御部108は、例えば、クライアント装置200からの指示に基づいて、パン動作コマンドを生成する。
チルト駆動部106は、撮像部101のチルト角を変更するためのメカ駆動系および駆動源のモータにより構成される。チルト駆動部106の動作はパン・チルト・ズーム制御部108が生成するチルト動作コマンドに従って制御される。パン・チルト・ズーム制御部108は、例えば、クライアント装置200からの指示に基づいて、チルト動作コマンドを生成する。
ズーム駆動部107は、ズームレンズの駆動系およびその駆動源のモータにより構成される。ズーム駆動部107の動作はパン・チルト・ズーム制御部108が生成するズーム制御コマンドに従って制御される。パン・チルト・ズーム制御部108は、例えば、クライアント装置200からの指示に基づいて、ズーム制御コマンドを生成する。
マイクM1、M2はコンデンサマイクやMEMS(Micro−Electrical−Mechanical Systems)マイク等により構成される。マイクM1、M2は、マイクに入ってくる音を電気信号に変換することにより、音声信号を生成する。音声処理部109は、マイクM1、M2から受信する音声信号に対して適当な音声信号処理を施すことで、デジタルデータとしての音声信号を生成する。なお、図1にはマイクが2つ示されているが、マイクは3個以上あってもよい。
システム制御部110は、ネットワークカメラ100を構成する各部の動作制御を行う。また、システム制御部110は、ネットワーク150を介したクライアント装置200とのデータの送受信を行うよう、通信部111を制御する。
メモリ112は、各処理を実行する際に一時的に若しくは恒久的に情報を格納しておくために使用される。例えば、クライアント装置200からの制御指示により静止画像、パノラマ画像、動画像等の撮像データや音声データを記録することが可能である。また、メモリ112は、各種パラメータや、システム制御部110が実行するプログラム格納領域、プログラム実行中のワーク領域等として使用され得る。さらに、メモリ112は、ネットワークカメラ100の撮像方向や、パン・チルト・ズーム制御部104を駆動するための制御パラメータ等を保持することもできる。システム制御部110はメモリ112に保持されたプログラムを実行することができる。
メモリ112は、例えば、ROM、RAM、HDD、フラッシュメモリまたは着脱可能なSDカードなどの記憶媒体により構成される。ROMはRead Only Memoryの略である。RAMはRandom Access Memoryの略である。HDDはHard Disc Driveの略である。
システム制御部110は、画像処理部102から順次送信されてくる各フレームの撮像画像や音声処理部109から順次送信されてくる音声信号を順次、通信部111からネットワーク150を介してクライアント装置200に送信する。
また、システム制御部110は、ネットワーク110および通信部111を介して、クライアント装置200から送信された各種のコマンドを受信する。システム制御部110は、当該受信したコマンドに応じた処理も実行する。
例えば、システム制御部110がクライアント装置200からカメラ制御コマンドを受信すると、システム制御部110は、ネットワークカメラ100の撮像条件の設定や、撮像方向におけるパン角およびチルト角の制御を行う。
制御の一例を挙げると、システム制御部110がパン制御コマンドを受信すると、システム制御部110はパン動作コマンドを生成し、当該パン動作コマンドをパン・チルト・ズーム制御部108に送信する。パン動作コマンドを受信したパン・チルト・ズーム制御部108は、パン動作コマンドに従ってパン駆動部105を制御する。そして、パン駆動部105が、撮像部101のパン角を制御する(変更する)。
なお、ネットワークカメラ100は、図1に示した以外の要素を含んでもよい。例えば、ネットワークカメラ100は、アラート(例えば、警告音や警告光)を発する警告部を有してもよい。
図2は音声処理部109が集音処理のために行うビームフォーミング(特定の方向の音声を強調して集音する技術)を説明する概念図である。図2に示すように、2つのマイクM1とM2の間の距離をaとし、マイクM1とM2を結ぶ直線S1と、マイクM1から音源までの直線S2がなす角度をθとすると、音源から2つのマイクM1、M2までの距離差dは
d=a・cosθ
である。よって、音源から2つのマイクM1、M2に音が到達するまでの時間差tは、音速をvとすると
t=a/v・cosθ
となる。角度θを所定の角度に設定すると、マイクM1、M2への音源からの音到達の時間差tが一意に求まるため、当該時間差tを適切な値に設定して到達音を足し合わせることで、音源からの音が強調される。一方、他の角度からの音は時間差tとは異なる時間差で到達するので、強調されることはない。このようにして、入力音声の指向性を形成する技術をビームフォーミング技術と呼ぶ。
よって、マイクM1、M2が無指向性の場合でも、音声処理部109の音声信号処理により特定方向の集音化を実現することができる。クライアント装置200のユーザは、ネットワークカメラ100が撮像する領域を見ながら、マウスやタッチパネル(後述するクライアント装置200の入力部207)を用いて、集音する領域(以下、「集音領域」と称する)を自由に設定することができる。また、設定した集音領域を示す領域枠は、ネットワークカメラ100が撮像する撮像画像(ライブ画像)に重畳することで、常に確認することができる。
<クライアント装置の構成>
次に、図3を用いてクライアント装置200の構成例を説明する。
クライアント装置200は、通信部201、メモリ202、システム制御203、画像処理部204、モニタ205、カメラ制御UI処理部206、入力部207、スピーカ制御部208およびスピーカ209を備える。UIはUser Interfaceの略である。
通信部201は、ネットワーク150を介してネットワークカメラ100とのデータの送受信を行う。例えば、ネットワークカメラ100からネットワーク150を介して撮像画像等がクライアント装置200に送信されてきた場合、通信部201は、当該撮像画像等を受信して、システム制御部203を介して画像処理部204に転送する。また、通信部201は、システム制御部203を介してカメラ制御UI処理部206から各種のコマンドを受信すると、当該コマンドを、ネットワーク150を介してネットワークカメラ100に送信する。
システム制御部203は、クライアント装置200の全体を制御する。システム制御部203は、例えば、1つまたは複数のプロセッサ(例えば、CPUやMPU)により構成される。
画像処理部204は、通信部201から撮像画像を受信すると、当該撮像画像に各種の画像処理を行う。そして、画像処理部204は、画像処理済みの撮像画像をモニタ205に送信する。画像処理済みの撮像画像を受信したモニタ205は、モニタ205の表示画面上に、画像処理済みの撮像画像を表示する。モニタ205は、撮像部101が撮像した画像を、クライアント装置200において再生する。
モニタ205は、液晶画面などにより構成されており、画像処理部204から受信した撮像画像や、後述する様々なGUI(グラフィカルユーザインタフェース)等を表示する。
カメラ制御UI処理部206は、ネットワークカメラ100の撮像条件の設定やパン角やチルト角等を指示する。また、カメラ制御UI処理部206は、様々なGUIをモニタ205の表示画面上に表示させる。
入力部207は、キーボードやマウスなどにより構成されている。ユーザは、入力部207を操作することで、モニタ205上のGUIを操作することができる。また、ユーザは、入力部207を操作することで、各種のコマンドをクライアント装置200に入力することができる。カメラ制御UI処理部206は、入力部207の操作に対応した処理を行い、当該処理により得られた情報をシステム制御部203に送信する。なお、入力部207はモニタ205内に備わるタッチパネルでもよい。ユーザはタッチパネルにタッチする(タッチパネルを操作する)ことで直感的な操作を行うことができる。入力部207は、操作部と称してもよい。
スピーカ制御部208は、通信部201からシステム制御部203を介して音声信号を受けると、当該音声信号に各種の音声信号処理を行う。そして、スピーカ制御部208は、信号処理済みの音声信号をスピーカ209に送信する。
音声信号を受信したスピーカ209は、当該音声信号に応じた音を生成して出力する。スピーカ209は、マイクM1、M2に入った音を、クライアント装置200において再生する。
このように、クライアント装置200は、ネットワークカメラ100からネットワーク150を介して送信された撮像画像を取得し、画像の再生を行うこと(モニタ205に撮像画像を表示すること)ができる。また、クライアント装置200は、ネットワークカメラ100からネットワーク150を介して送信された音声信号を取得して、音声の再生を行うことができる。さらに、クライアント装置200は、ネットワーク150を介してネットワークカメラ100を制御することができる。
なお、パン駆動部105の駆動範囲とチルト駆動部106の駆動範囲とズーム駆動部107の駆動範囲(すなわち全撮像領域)は、メモリ112に予め記憶(入力)されているとする。ネットワークカメラ100のシステム制御部110は、メモリ112の記憶内容を参照することにより、パン駆動部105の駆動範囲とチルト駆動部106の駆動範囲を知ることができる。また、システム制御部110は、パン・チルト・ズーム制御部108を介して、パン駆動部105、チルト駆動部106およびズーム駆動部107の現在の位置を知ることができる。これにより、システム制御部110は、全撮像領域に対する現在の撮像領域を知ることが可能である。全撮像領域に対する現在の撮像領域の情報は、撮像画像と一緒に、撮像領域座標データとして、ネットワークカメラ100からクライアント装置200に送信される。クライアント装置200のカメラ制御UI処理部206は、ネットワークカメラ100の撮像画像を表示するとともに、全撮像領域座標のGUIおよび現在の撮像領域座標のGUIなどをモニタ205の表示画面上に表示させることも可能である。
また、クライアント装置200は、図3に示した以外の要素を含んでもよい。例えば、クライアント装置200は、アラート(例えば、警告光)を発する警告部を有してもよい。アラートが警告音の場合、クライアント装置200はスピーカ209から警告音を発する。
<集音領域の指定方法と座標送出>
ユーザがクライアント装置200のモニタ205を用いて集音領域を指定(設定)する際の操作および処理を、図4を用いて説明する。
まず、集音領域の位置および大きさを指定する操作について説明する。
ユーザは、マウスやタッチパネルなどの入力部207を操作して、モニタ205上で矩形302を規定する対角線301を指示する。具体的には、入力部207の操作(マウスの操作やタッチパネルへのタッチ操作)によりポインタやタッチを移動して軌跡(対角線301)を形成することにより、集音領域(矩形302)の位置および大きさを指定することができる。
このように、ユーザの操作に応じてマウスもしくはタッチの軌跡301を対角線とする矩形302が設定される。従って、ユーザはモニタ205において矩形の対角線を指定することで、所望の位置と大きさを持つ集音領域を指定することができる。矩形302は集音領域を示すので、符号302は以下の記載において集音領域を指す場合にも用いることがある。
クライアント装置200のシステム制御部203は、全撮像領域の座標情報304と、表示領域303の座標情報305と、集音領域302の座標情報306をモニタ205に表示する。全撮像領域は、予め決められている領域であり、ネットワークカメラ100のパン・チルト動作から撮像できる最大撮像領域である。表示領域303は、現在のパン・チルト・ズームにより決まる現在の撮像領域であり、ネットワークカメラ100の現在の画角に対応している領域である。集音領域302は、ユーザの操作によって設定された集音領域である。集音領域302の座標情報306は、入力部207で指定した軌跡301で規定される矩形302の横方向座標(座標X)と縦方向座標(座標Y)からなる。
集音領域302が設定されると、座標Xおよび座標Yの情報は、クライアント装置200からネットワークカメラ100に送信され、ネットワークカメラ100のシステム制御部110は、受信した座標Xおよび座標Yの情報をメモリ112に記録する。
<集音領域の撮像および集音>
次に、集音領域の撮像サブフローを、図5のフローチャートを用いて説明する。
本実施形態において、ネットワークカメラ100は、クライアント装置200にて集音領域302の指定(設定)がなされると、集音領域302の集音を行うと共に、集音領域302の撮像を行う。そして、ネットワークカメラ100は、集音領域302の座標情報306と共に撮像画像(集音領域の画像)をメモリ112に保存する。
図5は、クライアント装置200において集音領域302が指定された後に、ネットワークカメラ100が集音領域302を撮像する手順を示すフローチャートである。SはStepの略である。
S101において、クライアント装置200は、ネットワークカメラ100が撮像した画像を受信しモニタ205に表示する。
S102おいて、クライアント装置200は、ユーザが図4で示したように入力部207を操作して集音領域302を設定したか(指定したか)を判定する。集音領域302が設定された場合(S102:Yes)、S103に進む。集音領域302が設定されていない場合、S102を繰り返す。
S103おいて、クライアント装置200は、入力部207で設定された集音領域302の座標情報305をネットワークカメラ100に送信する。なお、クライアント装置200は、座標情報305を集音座標データとして、自装置のメモリ202に保存する。
S104において、ネットワークカメラ100はクライアント装置200から座標情報305を受信し、座標情報305を集音座標データとしてメモリ112に保存する。
S105において、ネットワークカメラ100は指定された集音領域302の座標の画像を撮像する。
S106において、ネットワークカメラ100は、撮像画像(集音領域302の画像)をメモリ112に保存する。集音領域302の画像は、集音領域302が設定された際にネットワークカメラ100が撮像した画像である。
S107において、ネットワークカメラ100のシステム制御部110は、マイクM1、M2に入力される音を所望の形態で受信するために、音声処理部109を制御する。具体的には、システム制御部110は、音声処理部109で、ビームフォーミングによる集音処理を行う。
なお、システム制御部110は音声処理部110で(ビームフォーミングにより)集音化された音声信号を、通信部111を介してクライアント装置200に送信する。当該音声信号を受信したクライアント装置200は、当該音声信号に応じた音声をスピーカ209から出力するようにスピーカ制御部208の制御を行う。
<集音領域が表示範囲内にあるかの判定>
次に、集音領域302が表示範囲(現在モニタ205に表示されている表示領域303)内にあるかを判定するサブフローについて、図6のフローチャートを用いて説明する。
図6のS201において、ネットワークカメラ100のシステム制御部110は集音領域の設定が行われたかを判定する。判定結果がYesの場合、S202に進む。判定結果がNoの場合、S201を繰り返す。
S202において、システム制御部110は、メモリ112に保存されている集音座標データを読み出すことにより、集音領域302の情報(集音領域座標)を取得する。
S203において、システム制御部110は、パン・チルト・ズーム制御部108よりパン・チルト・ズームの位置データを取得して、現在の撮像領域より撮像領域座標を算出する。
S204において、システム制御部110は集音領域座標と撮像領域座標を比較し、比較の結果、集音領域が撮像領域(モニタ205に表示されている撮像画像)内にあるかどうかを判定する。
S205において、システム制御部110は、S204の判定結果をクライアント装置200に送信する。
<メインフローチャート>
次に、図1、図3、図7および図8を用いて、本実施形態の動作について説明する。図7は、本実施例のメインフローチャートである。なお、ネットワークカメラ100は、図5のサブフローを既に実行しているとする。
S301において、ネットワークカメラ100は、ユーザによりパン制御、チルト制御およびズーム制御の少なくとも1つが行われ撮像領域(撮像範囲)が変更がされたか否かを判定する。S301の判定結果がYesの場合、S302に進む。S301の判定結果がNoの場合、S301を繰り返す。
S302において、パン・チルト・ズーム制御部108は、システム制御部110からのコマンドに従って、パン駆動部105、チルト駆動部106およびズーム駆動部107を駆動して、撮像領域を変更する。
S303において、ネットワークカメラ100は、図6のサブフローを行う。
S304において、ネットワークカメラ100は、集音領域が撮像画像の表示範囲内(撮像画像内)に入っているかを判定する。判定結果がYesの場合、S308に進む。判定結果がNoの場合、S305に進む。
S305において、ネットワークカメラ100は、図5のサブフローで撮像してメモリ112に記録した撮像画像(過去の画像)を、クライアント装置200に送信する。
S306において、クライアント装置200はネットワークカメラ100から集音領域の撮像画像を受信する。そして、システム制御部203は画像処理部204を制御して、モニタ205に、受信した撮像画像を表示させる。さらに、S307において、クライアント装置200はモニタ205にアイコン704(図8)を表示させる。アイコンは、グラフィカルユーザインタフェースの一例である。
図8は、モニタ205に、S306で受信した撮像画像(過去の画像)703とアイコン704とを表示した例を示している。モニタ205の画面表示には、現在の撮像領域(ライブ画像)303が表示されており、撮像領域303の下にサブウィンドウ702が形成(規定)される。そして、サブウィンドウ702内に、ネットワークカメラ100から受信した過去の画像703(図5のS106で保存した画像)とアイコン704とが表示される。図8において、サブウィンドウ702は、破線で示された矩形のエリアである。
アイコン704は、ネットワークカメラ100の上方から集音領域302と撮像領域303を見た俯瞰図を表示している。より詳しくは、アイコン(俯瞰図)704は、集音領域302の座標情報306に基づいて作成された第1の扇状部分705と、撮像領域(表示領域)303の座標情報305に基づいて作成された第2の扇状部分706とを表示している。アイコン704を見ると、第1の扇状部分705と第2の扇状部分706とにより、集音領域302(または画像703)と撮像領域303との位置関係が一目で(直観的に)把握できる。第1の扇状部分705は集音領域を示す図形であり、第2の扇状部分706は現在の撮像領域を示す図形である。
このように、S304において集音領域が撮像範囲外であると判定された場合は、モニタ205は、現在の撮像画像を撮像領域303に表示し、さらに過去の画像703およびアイコン704をサブウィンドウ702に表示する。S304において集音領域が撮像範囲外であると判定される場合とは、例えば、図5のサブフローを終了した後に、ネットワークカメラ100により撮像される撮像領域が変更されて、ネットワークカメラ100の画角が集音領域から外れる場合である。
一方、S304において集音領域が撮像範囲内(撮像画像内)にあると判定された場合は、S308において、過去の画像703を非表示にし、S309において、アイコン704も非表示にする(図4のような画面になる)。S304において集音領域が撮像範囲内であると判定される場合とは、例えば、集音領域から外れていたネットワークカメラ100の画角が集音領域内に戻る場合である。このような場合、モニタ205に表示されていた過去の画像703とアイコン704は消去される。
<実施形態の効果>
上記したように、本実施形態によれば、ネットワークカメラ100が表示画角外を集音していても、クライアント装置200のモニタ205には、集音領域を示す情報(集音領域302の画像703とアイコン704)が表示される。ユーザはクライアント装置200のモニタ205(集音領域302の画像703とアイコン704)を見ることにより、どのエリアを集音しているのかが分かる。つまり、本実施形態によれば、集音指定領域が撮像領域から外れた場合でも集音指定領域を確認することが可能となる。集音領域を示す情報は、集音領域に関する情報である。
また、集音領域が画角内に戻ったならば、画像703とアイコン704を消去する(非表示にする)ので、画像703とアイコン704の表示が必要な場合にのみ、画像703とアイコン704をモニタ205に表示する。
なお、集音領域の撮像画像703とアイコン704に、ボタンまたはスイッチの機能を持たせてもよい。その場合、ユーザがボタン(撮像画像703および/またはアイコン704)を押下すると、例えば、ネットワークカメラ100は、現在の撮像領域から集音領域に撮像領域を変更する(変更後の撮像領域が集音領域を含むようにする)。撮像画像703とアイコン704は、グラフィカルユーザインタフェースとしてモニタ205に表示されることで、ボタンまたはスイッチとして機能することができる。
また、ユーザがボタン(撮像画像703および/またはアイコン704)を押下すると、モニタ205は、音声の集音機能を続行させるか否かをユーザに選択を促すメニューを表示してもよい。当該メニューをユーザが選択すると、ネットワークカメラ100は集音を中止して全方位(無指向)の音声を収録するようにしてもよい。このメニューは、ネットワークカメラ100の集音機能による集音を継続させるかを決定する決定部として機能する。
また、本実施形態では集音領域が現在の撮像領域から完全に外れている場合について説明したが、集音領域の一部が現在の撮像領域に含まれている場合も有り得る。集音領域の一部が現在の撮像領域に含まれている場合は、集音領域の残りの部分(または集音領域の全部)をサブウィンドウ702に表示してもよい。つまり、集音領域の一部が現在の撮像領域に含まれている場合は、集音領域の残部または全部を示す情報をモニタ205に表示させてもよい。また、集音領域の残部または全部を示す情報をモニタ205に表示するかしないかをユーザに選択させてもよい。表示するかしないかをユーザに選択させる場合は、選択メニュー(選択部)がモニタ205に表示される。その際に、ユーザの選択により、集音領域の撮像画像703とアイコン704の両方または一方を非表示にしてもよい。
図4の状態から集音領域302の一部(または全部)が現在の撮像領域303から外れると、ネットワークカメラ100またはクライアント装置200はアラート(例えば、警告音、警告光)を発してもよい。
上記した実施形態では、クライアント装置200はPC(パーソナルコンピュータ)であるとしたが、クライアント装置200は、通信機能を有するノートパソコン、タブレット端末、スマートフォン等でもよい。また、撮像装置の例としてネットワークカメラ100を説明したが、他の種類の撮像装置をネットワークカメラ100の代わりに用いてもよい。
上記した実施形態では、モニタ205は、クライアント装置200に含まれるとしたが、クライアント装置200の外部に設けてもよい。また、スピーカ209もクライアント装置200の外部に設けてもよい。
上記した実施形態ではマイクM1、M2は、ネットワークカメラ100に内蔵されているが、マイクM1、M2は、ネットワークカメラ100に外付けされてもよい。
図7ではS306の後にS307が実行されるように描かれているが、S306とS307は同時に実行してもよいし、S307をS306の前に実行してもよい。同様に、S308とS309は同時に実行してもよいし、S309をS308の前に実行してもよい。
上記した実施形態では、S304の判定結果がNoの場合、モニタ205に過去の画像703とアイコン704を表示するとした(S306、S307)が、モニタ205に過去の画像703だけを表示してもよい。あるいは、モニタ205にアイコン704だけを表示してもよい。モニタ205に過去の画像703だけ(またはアイコン704だけ)を表示する場合であっても、ユーザは、集音領域が現在の画角の外になったことを認識できるからである。つまり、本実施形態では、集音領域が現在の画角の外になった場合に、集音領域を示す情報をモニタ205に追加表示することにより、集音領域が現在の画角の外になったことをユーザに提示できればよい。
図1に示したネットワークカメラ100の機能構成は一例であり、機能モジュール(例えば、102、104、108〜111)の一部はハードウェアによって実現されてもよい。また、図3に示したクライアント装置200の機能構成も一例であり、機能モジュール(例えば、201、203、204、206、208)の一部はハードウェアによって実現されてもよい。ハードウェアにより実現される場合、例えば、所定のコンパイラを用いることで、各機能モジュールの機能を実現するためのプログラムからFPGA上に自動的に専用回路を生成すればよい。FPGAは、Field Programmable Gate Arrayの略である。また、FPGAと同様にしてGate Array回路を形成し、ハードウェアとして実現するようにしてもよい。また、ASIC(Application Specific Integrated Circuit)により実現するようにしてもよい。また、図1および図3に示した機能モジュールの構成は一例であり、複数の機能モジュールが1つの機能モジュールを構成するようにしてもよいし、いずれかの機能モジュールが複数の機能を行うモジュールに分かれてもよい。
クライアント装置200の機能・構成をネットワークカメラ100に組み込んでもよい。この場合、ネットワークカメラ100がモニタ(表示部)を備え、図5〜図7のフローチャートに示された処理を、ネットワークカメラ100が実行する。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
10…ネットワークカメラシステム、100…ネットワークカメラ、101…撮像部、109…音声処理部、200…クライアント装置、203…システム制御部、205…モニタ、206…カメラ制御UI処理部、302…集音領域、303…表示領域、702…サブウィンドウ、704…アイコン、M1…マイク、M2…マイク

Claims (14)

  1. 集音機能を有する撮像装置により撮像された撮像画像を取得して表示する表示手段と、
    前記表示手段により表示された撮像画像に対して、前記撮像装置の集音領域を設定する設定手段と、
    前記撮像装置により撮像される撮像領域を変更する変更手段と、
    前記変更手段により前記撮像領域が変更された場合、前記集音領域が前記表示手段により表示されている撮像画像内にあるかを判定する判定手段と、
    前記判定手段が、前記集音領域は前記撮像画像内にないと判定した場合、前記集音領域に関する情報を前記表示手段に表示させる制御手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記集音領域に関する情報は、前記集音領域の画像を含むことを特徴とする請求項1に記載の情報処理装置。
  3. 前記集音領域に関する情報は、前記集音領域と前記撮像領域の位置関係を示す情報を含むことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記集音領域に関する情報は、現在の撮像領域を示す図形と、前記集音領域を示す図形とを含むことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記集音領域に関する情報はグラフィカルユーザインタフェースとして前記表示手段に表示され、前記グラフィカルユーザインタフェースが操作されると、前記変更手段は、前記撮像装置の撮像領域が前記集音領域を含むように、前記撮像領域を変更することを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. 前記集音領域の画像は、前記集音領域が設定された際に前記撮像装置が撮像した画像であることを特徴とする請求項2に記載の情報処理装置。
  7. 前記集音領域に関する情報が前記表示手段に表示された後に、前記集音領域が前記撮像画像内に移動した場合、前記制御手段は、前記集音領域に関する情報を前記表示手段において非表示にすることを特徴とする請求項1乃至6のいずれか1項に記載の情報処理装置。
  8. 前記撮像装置の集音機能は特定の方向の音声を強調して集音する機能であり、前記判定手段が、前記集音領域は前記撮像画像内にないと判定した場合、前記撮像装置に前記集音機能による集音を継続させるかを決定する決定手段をさらに備えることを特徴とする請求項1乃至7のいずれか1項に記載の情報処理装置。
  9. 前記判定手段が、前記集音領域の一部は前記撮像画像内にあると判定した場合、前記制御手段は、前記集音領域の残部または全部に関する情報を前記表示手段に表示させることを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
  10. 前記判定手段が、前記集音領域の一部は前記撮像画像内にあると判定した場合、前記集音領域の残部または全部に関する情報を前記表示手段に表示させるか否かを選択する選択手段をさらに備えることを特徴とする請求項1乃至9のいずれか1項に記載の情報処理装置。
  11. 前記撮像装置はネットワークカメラであることを特徴とする請求項1乃至10のいずれか1項に記載の情報処理装置。
  12. 撮像手段と、
    前記撮像手段により撮像された撮像画像を表示する表示手段と、
    前記表示手段により表示された撮像画像に対して、集音領域を設定する設定手段と、
    前記設定手段により設定された集音領域の音声を強調して集音する集音手段と、
    前記撮像手段により撮像される撮像領域を変更する変更手段と、
    前記変更手段により前記撮像領域が変更された場合、前記集音領域が前記表示手段により表示されている撮像画像内にあるかを判定する判定手段と、
    前記判定手段が、前記集音領域は前記撮像画像内にないと判定した場合、前記集音領域に関する情報を前記表示手段に表示させる制御手段と、
    を備えることを特徴とする撮像装置。
  13. 集音機能を有する撮像装置により撮像された撮像画像を表示部に表示するステップと、
    前記表示部に表示された撮像画像に対して、前記撮像装置の集音領域を設定するステップと、
    前記撮像装置により撮像される撮像領域が変更された場合、前記集音領域が前記表示部により表示されている撮像画像内にあるかを判定するステップと、
    前記判定するステップが、前記集音領域は前記撮像画像内にないと判定した場合、前記集音領域に関する情報を前記表示部に表示させるステップと、
    を有することを特徴とする情報処理方法。
  14. コンピュータを、請求項1乃至11のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2019094997A 2019-05-21 2019-05-21 情報処理装置および情報処理方法 Pending JP2020191514A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019094997A JP2020191514A (ja) 2019-05-21 2019-05-21 情報処理装置および情報処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019094997A JP2020191514A (ja) 2019-05-21 2019-05-21 情報処理装置および情報処理方法

Publications (1)

Publication Number Publication Date
JP2020191514A true JP2020191514A (ja) 2020-11-26

Family

ID=73454818

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019094997A Pending JP2020191514A (ja) 2019-05-21 2019-05-21 情報処理装置および情報処理方法

Country Status (1)

Country Link
JP (1) JP2020191514A (ja)

Similar Documents

Publication Publication Date Title
EP3367662B1 (en) Control device, camera system, and program
JP6547496B2 (ja) 通信装置、通信方法、プログラムおよび通信システム
US9648278B1 (en) Communication system, communication apparatus and communication method
JP2011205573A (ja) 制御装置、カメラシステム及びプログラム
EP2018065A1 (en) Camera apparatus and image recording/reproducing method
CN108965656B (zh) 显示控制设备、显示控制方法和存储介质
JP6218090B2 (ja) 指向性制御方法
US10225650B2 (en) Directivity control system, directivity control device, abnormal sound detection system provided with either thereof and directivity control method
US20170127020A1 (en) Communication system, communication device, and communication method
JP2007288354A (ja) カメラ装置、画像処理装置および画像処理方法
KR102314943B1 (ko) 정보 처리장치, 정보 처리방법 및 기억매체
US10939030B2 (en) Video audio processing system and method of controlling the video audio processing system
JP6835205B2 (ja) 撮影収音装置、収音制御システム、撮影収音装置の制御方法、及び収音制御システムの制御方法
JP2019205161A (ja) 撮像装置、撮像装置の制御方法およびプログラム
JP2020191514A (ja) 情報処理装置および情報処理方法
JP2016119620A (ja) 指向性制御システム及び指向性制御方法
JP2020017904A (ja) 撮像装置の制御装置、方法及びプログラム
JP5464290B2 (ja) 制御装置、制御方法、及びカメラシステム
JP7111202B2 (ja) 収音制御システム及び収音制御システムの制御方法
JP2017108287A (ja) 通信装置、制御方法及び制御プログラム
JP2011205574A (ja) 制御装置、カメラシステム及びプログラム
JP2019140566A (ja) 情報処理装置、情報処理方法及びプログラム
JP2013201634A (ja) カメラ制御装置、カメラ制御方法及びカメラ制御プログラム
JP2019149718A (ja) 撮像装置およびその制御方法、監視システム
JP2019140599A (ja) 情報処理装置、情報処理方法及びプログラム