JP2021002729A - インターホンシステム、制御方法及びプログラム - Google Patents

インターホンシステム、制御方法及びプログラム Download PDF

Info

Publication number
JP2021002729A
JP2021002729A JP2019115001A JP2019115001A JP2021002729A JP 2021002729 A JP2021002729 A JP 2021002729A JP 2019115001 A JP2019115001 A JP 2019115001A JP 2019115001 A JP2019115001 A JP 2019115001A JP 2021002729 A JP2021002729 A JP 2021002729A
Authority
JP
Japan
Prior art keywords
unit
image
processing
speaker
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019115001A
Other languages
English (en)
Inventor
守雄 中村
Morio Nakamura
守雄 中村
龍司 夏目
Ryuji Natsume
龍司 夏目
菊池 彰洋
Akihiro Kikuchi
彰洋 菊池
正也 花園
Masaya Hanazono
正也 花園
西川 尚之
Naoyuki Nishikawa
尚之 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2019115001A priority Critical patent/JP2021002729A/ja
Publication of JP2021002729A publication Critical patent/JP2021002729A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Studio Devices (AREA)

Abstract

【課題】話者の判別がし易い画像を生成することができるインターホンシステム、制御方法及びプログラムを提供する。【解決手段】インターホンシステム1は、方向推定部182と、処理制御部185と、を備える。方向推定部182は、音取得部13が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。処理制御部185は、方向推定部182の推定結果に基づいて、所定の領域を撮像する撮像部121に対する第1処理及び撮像部121が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。【選択図】図1

Description

本開示は、一般にインターホンシステム、制御方法及びプログラムに関する。より詳細には、本開示は、撮像部が撮像した画像に対する処理を行うインターホンシステム、制御方法及びプログラムに関する。
特許文献1には、玄関に設置されて居住者を呼び出して通話するための玄関子機(インターホン装置)と、宅内に設置されて玄関子機からの呼び出しに応答するための居室親機(情報端末)と、を備えるインターホンシステムが記載されている。
玄関子機は、訪問者を撮像するためのカメラと、マイクロホンアレイと、子機CODECと、位相差検出部と、到来方向推定部と、映像信号処理部と、を備える。マイクロホンアレイは、複数のマイクロホンを備える。子機CODECは、マイクロホンアレイが収音して出力する複数チャネルの音声信号をデジタル信号に変換する。位相差検出部は、居室親機に玄関子機から伝送された複数チャネルのデジタル音声信号から音声信号の位相差を検出する。到来方向推定部は、検出した位相差情報を基に音声の到来方向を推定する。映像信号処理部は、到来方向推定部の推定結果を基にモニタに表示する映像をパン・チルトする。
特開2016−189570号公報
ところで、特許文献1のインターホンシステムでは、カメラで撮像された映像をそのままの状態でパン・チルトするため、カメラの撮像環境によっては、訪問者(話者)を判別が困難となる可能性がある。
本開示は上記課題に鑑みてなされ、話者の判別がし易い画像を生成することができるインターホンシステム、制御方法及びプログラムを提供することを目的とする。
本開示の一態様に係るインターホンシステムは、方向推定部と、処理制御部と、を備える。前記方向推定部は、音取得部が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。前記処理制御部は、前記方向推定部の推定結果に基づいて、所定の領域を撮像する撮像部に対する第1処理及び前記撮像部が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。
本開示の一態様に係る制御方法は、方向推定ステップと、処理制御ステップと、を含む。前記方向推定ステップは、音取得部が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。前記処理制御ステップは、前記方向推定ステップの推定結果に基づいて、所定の領域を撮像する撮像部に対する第1処理及び前記撮像部が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。
本開示の一態様に係るプログラムは、コンピュータに、前記制御方法を実行させるためのプログラムである。
本開示によると、話者の判別がし易い画像を生成することができる。
図1は、一実施形態に係るインターホンシステムとしてのインターホン装置の構成を説明する図である。 図2は、同上のインターホン装置を含む通話システムの構成を説明する図である。 図3A及び図3Bは、同上のインターホン装置の方向推定部による話者の方向の推定を説明する図である。 図4A及び図4Bは、同上のインターホン装置の処理制御部により話者領域の推定を説明する図である。 図5は、同上のインターホン装置の動作を説明する図である。 図6は、変形例1に係るインターホンシステムとしてのインターホン装置の構成を説明する図である。
以下に説明する実施形態及び変形例は、本開示の一例に過ぎず、本開示は、実施形態及び変形例に限定されない。以下の実施形態及び変形例以外であっても、本開示に係る技術的思想を逸脱しない範囲であれば、設計等に応じて種々の変更が可能である。
(実施形態)
以下、本実施形態に係るインターホンシステム1について、図1〜図5を用いて説明する。
(1)概要
以下、本実施形態に係るインターホンシステム1について、説明する。
本実施形態に係るインターホンシステム1は、図2に示すように、通話システム2に適用される。通話システム2は、例えば、マンション等の集合住宅5に適用される。本実施形態に係る通話システム2は、インターホンシステム1としてのインターホン装置10と、複数(図2では2つ)の情報端末20と、制御装置30と、複数(図2では2つ)のドアホン40と、を備えている。通話システム2では、複数の情報端末20の各々とインターホン装置10とが制御装置30を介して通信を行うように構成されている。また、通話システム2では、複数の情報端末20と複数のドアホン40とが一対一に対応している。なお、本実施形態に係る通話システム2は、集合住宅5以外に、戸建住宅に適用されてもよい。あるいは、通話システム2は、事務所、店舗、学校若しくは介護施設等の非住宅施設等に適用されてもよい。
複数の情報端末20の各々は、例えば、集合住宅5に含まれる複数の住戸E2の各々に設けられている住戸端末(親機)である。各情報端末20は、例えば、各住戸E2の内側に設けられている。各情報端末20は、第2幹線62、分岐線63、及び分岐器50を介して制御装置30に接続されている。各情報端末20は、制御装置30を介して、インターホン装置10との間で通信(例えば、通話、及び制御信号の送信等)を行うように構成されている。さらに、各情報端末20は、接続線64を介して対応するドアホン40に接続されている。各情報端末20は、対応するドアホン40との間で通信(例えば、通話、及び制御信号の送信等)を行うように構成されている。
インターホン装置10は、例えば、集合住宅5の共用玄関(ロビー)E1に設けられているロビーインターホン(子機)である。インターホン装置10は、第1幹線61を介して制御装置30に接続されている。インターホン装置10は、制御装置30を介して、各情報端末20との間で通信(例えば、通話、及び映像信号の送信等)を行うように構成されている。インターホン装置10は、例えば、共用玄関E1の壁W1に取り付けられている(図3A,図3B参照)。インターホン装置10が映像信号を情報端末20に送信することで、情報端末20は、映像を表示することができる。
制御装置30は、例えば、集合住宅5の管理室E3に設けられている。制御装置30は、第1幹線61を介してインターホン装置10に接続され、かつ第2幹線62を介して各情報端末20に接続されている。つまり、制御装置30は、各情報端末20とインターホン装置10との間の通信を中継するように構成されている。
複数のドアホン40の各々は、例えば、集合住宅5の各住戸E2の外側に設けられている。各ドアホン40は、接続線64を介して対応する情報端末20に接続されている。各ドアホン40は、対応する情報端末20との間で通信(例えば、通話、映像信号の送信等)を行うように構成されている。
本実施形態では、第1幹線61、第2幹線62、分岐線63、及び接続線64は、いずれもツイストペア線である。つまり、実際には、第1幹線61、第2幹線62、分岐線63、及び接続線64は2本の電線で構成されるが、図面上は1本の線で表している。第1幹線61、第2幹線62、分岐線63、及び接続線64の少なくとも1つはツイストペア線以外の電線であってもよい。
本実施形態に係るインターホン装置10は、方向推定部182と、処理制御部185を備える。方向推定部182は、音取得部13が取得した音に係る音情報に基づいて、音声を発する話者である対象者200の方向を推定する。処理制御部185は、方向推定部182の推定結果に基づいて、所定の領域を撮像する撮像部121に対する第1処理及び撮像部121が撮像した画像(映像)に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。ここで、対象者200は、例えば、集合住宅5への訪問者であるが、インターホン装置10から各住戸E2を呼び出す者であればよく、外出先から帰宅した各住戸E2の住人等であってもよい。
本実施形態に係るインターホン装置10(インターホンシステム1)では、対象者200の方向を予測し、その予測結果に応じて第1処理及び第2処理のうち少なくとも一方を制御する。そのため、撮像部121が撮像した画像を見易くすることができる。
(2)構成
(2−1)インターホン装置
インターホン装置10は、図1に示すように、通信部11、撮像装置12、音取得部13、操作部14、出力部15、表示部16、記憶部17及び制御部18を備える。
インターホン装置10は、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部18として機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
通信部11は、制御装置30を介して情報端末20と通信を行うための通信インタフェースを含んでいる。通信部11は、インターホン装置10と情報端末20との間で音データ及び制御信号等が双方向に伝送可能となるように、情報端末20との間で双方向に通信可能に構成されている。ここで、インターホン装置10からの信号には、情報端末20を特定するための情報(例えば、アドレス情報等)が含まれている。そのため、この信号に含まれるアドレス情報と一致するアドレス情報が割り当てられた情報端末20のみが信号を受信することができる。
撮像装置12は、被写体(ユーザ)を撮像するためのカメラであり、図1に示すように、撮像部121及び第1処理部122を有している。撮像部121は、撮像素子と、撮像素子の撮像面に被写体像を結像させるレンズと、レンズを保持するレンズ鏡筒等とを有している。撮像素子は、例えば、CCD(Charge Coupled Devices)イメージセンサ、又はCMOS(Complementary Metal-Oxide Semiconductor)イメージセンサ等の二次元イメージセンサである。撮像部121は、撮像範囲である所定の領域を撮像する。具体的には、撮像部121は、被写体からの光をレンズ等の光学系によって撮像素子の撮像面(受光面)上に結像させ、撮像素子にて被写体からの光を電気信号に変換する。そして、撮像部121は、撮像素子の出力信号を映像信号として制御部18に出力する。撮像部121は、インターホン装置10の左右方向の長さを均等に2分する位置に配置されている(図3A,図3B参照)。撮像部121の撮像範囲である所定の領域のサイズは、情報端末20が表示する画像(映像)のサイズよりも大きい。つまり、撮像部121が撮像した画像の一部が情報端末20で表示される。
本実施形態では、撮像装置12は動画を撮像するカメラである。さらに、本実施形態では、撮像装置12はカラー画像を撮像するカメラである。なお、撮像装置12は、静止画を撮像するカメラ(スチルカメラ)であってもよいし、モノクロ画像を撮像するカメラであってもよい。
第1処理部122は、撮像部121に対する処理(第1処理)を行う。第1処理は、例えば、露光調整、撮像部121のレンズの向きの調整等を含む。ここで、「レンズの向きの調整」とは、レンズの向きをチルト方向及びパン方向のうち少なくとも一方の方向に移動させることである。
音取得部13は、音を取得し、取得した音に係る音情報を制御部18に出力する。音取得部13は、複数のマイクロホンを有している。複数のマイクロホンの各々は、指向性を有するマイクロホンである。本実施形態では、音取得部13は、図1に示すように、2つのマイクロホン(第1マイクロホン131及び第2マイクロホン132)を有している。第1マイクロホン131及び第2マイクロホン132は、同一の指向性を有する。第1マイクロホン131及び第2マイクロホン132は、水平方向(左右方向)及び鉛直方向(上下方向)の少なくとも一方において互いに異なる位置に配置される。第1マイクロホン131及び第2マイクロホン132は、左右方向に沿って並べられて配置されている(図3A,図3B参照)。第1マイクロホン131及び第2マイクロホン132は、インターホン装置10の前方に位置する対象者200の音声(音)を含む周囲の音を取得し、取得した音をアナログの音信号(音情報)に変換して制御部18に出力する。
操作部14は、ユーザ(例えば、集合住宅5への訪問者、住人等)の操作を受け付けるように構成されている。操作部14は、例えば、複数の押ボタンスイッチ、及びタッチパネル等を有する入力インタフェースである。操作部14は、来訪者から呼び出しのための操作を受け付ける。操作部14に対して所定の操作(例えば押操作)がされると、住戸E2内の住居者を呼び出すための制御信号(呼出信号)が、通信部11及び制御装置30を介して、呼出対象の情報端末20に送信される。
出力部15は、例えばスピーカである。出力部15は、インターホン装置10が情報端末20と通話可能な状態である場合には、情報端末20から送信された音データに基づいた音(情報端末20の操作者の音声を含む)を出力する。
表示部16は、例えば、液晶ディスプレイである。表示部16は、映像を表示するように構成されている。また、表示部16は、対象者200に対してメッセージを表示するように構成されている。メッセージは、例えば、対象者200に発話を促すためのメッセージである。表示部16は、例えば、「お話しください」等のメッセージを表示する。この場合において、同様の音声メッセージを出力部15、又は出力部15とは別に設けられたスピーカから出力(報知)してもよい。また、表示部16とスピーカとを併用してもよい。なお、インターホン装置10がタッチパネルディスプレイを備えている場合には、タッチパネルディスプレイが表示部16と操作部14とを兼ねてもよい。
記憶部17は、読み書き可能なメモリで構成されている。記憶部17は、例えば、フラッシュメモリである。記憶部17は、例えば、撮像装置12で撮像された映像(画像)の映像データを記憶する。
制御部18は、図1に示すように、音声処理部181、方向推定部182、方向制御部183、第2処理部184及び処理制御部185を有している。
音声処理部181は、音取得部13が出力したアナログの音信号を取得する。音声処理部181は、取得したアナログの音信号を、デジタルの音信号に変換する。また、音声処理部181は、音取得部13から取得した音信号に対して所定のフィルタリング処理等を行うように構成されている。
方向推定部182は、撮像部121が撮像した画像において話者の方向を推定する。言い換えると、方向推定部182は、音取得部13が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。具体的には、方向推定部182は、第1信号と、第2信号との位相差に基づいて話者の方向を推定する。ここで、第1信号は、第1マイクロホン131が取得した音に基づく信号である。第2信号は、第2マイクロホン132が取得した音に基づく信号である。方向推定部182は、位相差に応じて第1マイクロホン131及び第2マイクロホン132のいずれかのマイクロホンの近くに話者(対象者200)が存在すると推定する。位相差が“0”である場合には、方向推定部182は、第1マイクロホン131及び第2マイクロホン132の中間に話者が存在すると推定する。第1マイクロホン131及び第2マイクロホン132は、左右方向に沿って並べられて配置されているので、方向推定部182は、第1信号と第2信号との位相差により、話者の位置を推定することができる。
さらに、1マイクロホン131及び第2マイクロホン132は、指向性を有しているので、音声の発生元(対象者200の口)の位置を推定するように構成されている。
例えば、対象者200(話者)が、インターホン装置10の正面に位置している場合には、対象者200から第1マイクロホン131までの距離及び対象者200から第2マイクロホン132までの距離が同一である。なお、距離が同一であるとは、許容される誤差を含む。そのため、第1マイクロホン131が取得した音声に基づく第1信号と第2マイクロホン132が取得した音声に基づく第2信号との位相差は“0”となる。その結果、方向推定部182は、第1マイクロホン131及び第2マイクロホン132の中間、つまりインターホン装置10の正面に話者が存在すると推定する。
対象者200(話者)が、インターホン装置10から見て右側に位置している場合には(図3B参照)、対象者200から第1マイクロホン131までの距離は、対象者200から第2マイクロホン132までの距離よりも短い。そのため、第1マイクロホン131が取得した音声に基づく第1音声信号と第2マイクロホン132が取得した音声に基づく第2音声信号とで位相差が発生する。方向推定部182は、位相差に基づいて、インターホン装置10から見て右側に話者が存在すると推定する。
方向制御部183は、方向推定部182の推定結果に基づいて、音取得部13による音の取得方向を制御する。具体的には、方向制御部183は、方向推定部182の推定結果に基づいて、第1マイクロホン131から入力される音のゲイン、及び第2マイクロホン132から入力される音のゲインをそれぞれ調整するように構成されている。より具体的には、方向制御部183は、第1マイクロホン131及び第2マイクロホン132の各々から入力される音声信号に対して各種演算を行うことで、所望の方向の感度を高めた音声信号に変換する。これにより、所望の方向のS/N比が向上する。例えば、話者が右側に存在すると方向推定部182が推定した場合、方向制御部183は、第1マイクロホン131から入力される音のゲインを1、第2マイクロホン132から入力される音のゲインを0とする。この場合、方向制御部183は、第1マイクロホン131から入力される音のみを出力することになる。つまり、制御部18は、方向推定部182の推定結果に基づいて、各マイクロホンから入力される音のゲインを方向制御部183が変えることで、音取得部13による音の取得方向を制御することができる。
第2処理部184は、撮像部121から映像信号を受け取り、信号処理により映像信号に含まれる映像を処理する。第2処理部184は、信号処理を行った後の映像データを、通信部11を介して情報端末20に送信する。また、第2処理部184は、信号処理を行った後の映像データを記憶部17に記憶させる。
第2処理部184は、処理制御部185の制御により、撮像部121が撮像した画像に対するパン制御とチルト制御とを除く処理(第2処理)を行う。第2処理は、撮像部121が撮像した画像を調整する画像調整処理を含む。ここで、画像調整処理は、画像に対する歪補正を含む。また、画像調整処理は、画像に対する階調補正及び色調補正のうち少なくとも一方を含む。すなわち、第2処理は、歪補正、階調補正及び色調補正等の話者の表示に係る処理を含み、画像を明瞭にする。さらに、第2処理は、画像を拡大する処理及び画像を縮小する処理を含む。
第2処理部184は、処理制御部185の制御により、撮像部121の撮像範囲である所定の領域に含まれ、後述する話者領域の画像に係る情報を基準とし、画像全体に対して第2処理を施す。例えば、第2処理部184は、話者領域に含まれる画素値を基準として、画像のうち話者領域を除く他の領域に対して画素値を小さくする処理を施す。この結果、話者領域は、他の領域と比較して明瞭になる。そのため、話者の顔を判別することが可能となる。
処理制御部185は、方向推定部182の推定結果に基づいて、所定の領域を撮像する撮像部121に対する第1処理及び撮像部121が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。
方向推定部182の推定結果には、左右方向において対象者200(話者)の位置がインターホン装置10から見て右側、左側、正面のいずれかであることが含まれている。そこで、処理制御部185は、撮像部121の撮像範囲である所定の領域R1を第1領域R11、第2領域R12及び第3領域R13の3つに均等に分割し、方向推定部182の推定結果を基に、第1領域R11、第2領域R12及び第3領域R13のうちいずれの領域に存在するかを判断する。また、方向推定部182の推定結果には、鉛直方向における対象者200の位置(対象者200の口の位置)が含まれる。そこで、鉛直方向における対象者200の位置の推定結果を用いて、対象者200の顔210を含む領域である話者領域R20を推定する。
例えば、処理制御部185は、方向推定部182の推定結果を基に、第1領域R11、第2領域R12及び第3領域R13のうち第1領域R11に話者が存在すると判断する(図4A参照)。さらに、処理制御部185は、鉛直方向における対象者200の位置の推定結果を用いて、対象者200の顔を含む話者領域R20を推定する。処理制御部185は、話者領域R20と他の領域とを比較して、第1処理及び第2処理のうち少なくとも1つの処理を行うように第1処理部122及び第2処理部184を制御する。具体的には、処理制御部185は、第1処理に含まれる露光処理、第2処理に含まれる歪補正、階調補正及び色調補正のうち、少なくとも1つの処理を行うように、第1処理部122及び第2処理部184を制御する。処理制御部185は、第2処理部184を制御する場合には、話者領域R20の画像に係る情報を基準とし、画像全体に対して第2処理を施すように、第2処理部184を制御する。
話者領域R20のすべてが所定の領域R1に含まれ、かつ話者領域R20のすべてが所定の領域R1のうち情報端末20で表示される領域(表示領域)に含まれていない場合には、処理制御部185は、表示領域を変更するように第2処理部184を制御する。言い換えると、処理制御部185は、パン制御とチルト制御とのうち一方の制御を行うように第2処理部184を制御する。つまり、処理制御部185は、所定の領域R1内において、パン方向及びチルト方向のうち少なくとも一方の方向に表示領域を移動させるように、第2処理部184を制御する。
話者領域R20のすべてが所定の領域R1に含まれない場合には、処理制御部185は、撮像部121のレンズの向きの調整を調整するよう第1処理部122を制御する。
撮像部121が撮像した画像には、図4Bに示すように、複数(図示例では2つ)の対象者200(対象者201,202)が含まれる場合がある。つまり、所定の領域R1は、複数(図示例では、2つ)の顔領域R30,R31を含む。顔領域R30は、対象者201の顔210を含む。顔領域R31は、対象者202の顔211を含む。この場合においても、処理制御部185は、方向推定部182の推定結果を基に、第1領域R11、第2領域R12及び第3領域R13のうち話者である対象者201が存在すると推定された領域(例えば、第1領域R11)を判断する。処理制御部185は、鉛直方向における対象者201の位置の推定結果を用いて、対象者201の顔210を含む顔領域R30を話者領域R20として推定する。つまり、所定の領域R1に複数の顔領域R30,R31が含まれる場合、処理制御部185は、方向推定部182の推定結果を基に、複数の顔領域R30,R31のうち1つの顔領域R30を話者領域R20として推定する。
(2−2)情報端末
情報端末20は、図2に示すように、第1通信部21と、第2通信部22と、制御部23と、通話部24と、映像処理部25と、表示部26と、操作部27と、記憶部28と、を備えている。
情報端末20は、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部23として機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
第1通信部21は、インターホン装置10(の通信部11)と通信するための通信インタフェースを含んでいる。第1通信部21は、第2幹線62、分岐線63、及び分岐器50を介して制御装置30に接続されている。第1通信部21は、制御装置30を介して、インターホン装置10に対して音声信号、及び制御信号等を送信する。さらに、第1通信部21は、制御装置30を介して、インターホン装置10から音声信号、及び映像信号等を受信する。
第2通信部22は、ドアホン40と通信するための通信インタフェースを含んでいる。第2通信部22は、接続線64を介してドアホン40に接続されている。第2通信部22は、ドアホン40に対して音声信号、及び制御信号等を送信し、ドアホン40から音声信号、及び映像信号等を受信する。
制御部23は、第1通信部21、第2通信部22、通話部24、及び映像処理部25等を制御するように構成されている。
通話部24は、スピーカ及びマイクロホンを含み、インターホン装置10、及びドアホン40との間で通話可能に構成されている。
映像処理部25は、インターホン装置10、及びドアホン40からの映像信号を受け取り、信号処理により映像信号に含まれる映像を処理するように構成されている。
表示部26は、例えば、液晶ディスプレイである。表示部26は、映像処理部25からの映像を表示するように構成されている。なお、情報端末20がタッチパネルディスプレイを備えている場合には、タッチパネルディスプレイが表示部26と操作部27とを兼ねてもよい。
操作部27は、ユーザ(例えば、各住戸E2の住人等)の操作を受け付けるように構成されている。操作部27は、少なくとも通話ボタンを有している。通話ボタンは、インターホン装置10、又はドアホン40からの呼び出しに対して、インターホン装置10、又はドアホン40との通信(訪問者等との通話)を開始するためのボタンである。つまり、第1通信部21が住人を呼び出すための呼出信号を受信している状態で通話ボタンが押されると、インターホン装置10、又はドアホン40と情報端末20との間で音声通話が可能になる。
記憶部28は、読み書き可能なメモリで構成されている。記憶部28は、例えば、フラッシュメモリである。記憶部28は、例えば、インターホン装置10、及びドアホン40からの映像データを記憶する。さらに、記憶部28は、情報端末20に割り当てられたアドレス情報(識別情報)を記憶する。
(2−3)制御装置
制御装置30は、図2に示すように、通信部31と、制御部32と、記憶部33と、を備えている。
制御装置30は、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部32として機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
通信部31は、各情報端末20、及びインターホン装置10と通信するための通信インタフェースを含んでいる。通信部31は、第1幹線61を介してインターホン装置10に接続され、第2幹線62を介して各情報端末20に接続されている。つまり、通信部31は、各情報端末20とインターホン装置10との間の通信を中継するように構成されている。
制御部32は、通信部31を制御するように構成されている。
記憶部33は、読み書き可能なメモリで構成されている。記憶部33は、例えば、フラッシュメモリである。記憶部33は、例えば、各住戸E2に割り当てられた部屋番号と、各情報端末20に割り当てられたアドレス情報との対応関係を表す対応テーブルを記憶する。つまり、制御装置30では、制御部32は、対応テーブルを参照して、インターホン装置10からの信号に含まれる部屋番号を対応する情報端末20のアドレス情報に置き換えた信号を作成し、この信号を通信部31から各情報端末20に送信させる。そして、各情報端末20では、制御部23は、第1通信部21が受信した信号に含まれるアドレス情報が、記憶部28に記憶されているアドレス情報と一致する場合には、この信号に含まれる情報を取得する。また、各情報端末20では、制御部23は、第1通信部21が受信した信号に含まれるアドレス情報が、記憶部28に記憶されているアドレス情報と一致しない場合には、この信号に含まれる情報を破棄する。
(2−4)ドアホン
各ドアホン40は、図2に示すように、接続線64を介して対応する情報端末20に接続されている。ドアホン40は、情報端末20に対して音声信号、及び映像信号等を送信する。さらに、ドアホン40は、情報端末20から音声信号、及び制御信号等を受信する。
(3)動作
ここでは、インターホンシステム1としてのインターホン装置10の動作について、図5を用いて説明する。
撮像装置12の撮像部121は、インターホン装置10の前方に位置している対象者200を撮像する(ステップS1)。
音取得部13は、対象者200の音声を取得する(ステップS2)。具体的には、音取得部13が有する第1マイクロホン131及び第2マイクロホン132の各々は、対象者200の音声(音)を含む周囲の音を取得し、取得した音をアナログの音信号に変換して制御部18に出力する。
方向推定部182は、音取得部13が取得した音に係る音情報に基づいて、音声を発する話者(対象者200)の方向を推定する(ステップS3)。具体的には、方向推定部182は、左右方向における話者の位置、及び鉛直方向における話者の位置を推定する。
方向制御部183は、方向推定部182の推定結果に基づいて、音取得部13による音の取得方向を制御する(ステップS4)。
処理制御部185は、制御処理を行う(ステップS5)。具体的には、処理制御部185は、方向推定部182の推定結果に基づいて、所定の領域R1を撮像する撮像部121に対する第1処理部122による第1処理及び撮像部121が撮像した画像に対するパン制御とチルト制御とを除く第2処理部184による第2処理のうち少なくとも一方を制御する。処理制御部185は、方向推定部182の推定結果を基に、話者領域R20を推定する。処理制御部185は、第1処理及び第2処理のうち少なくとも1つの処理を行う。例えば、処理制御部185は、話者領域R20の画像に係る情報を基準とし、画像全体に対して第2処理を施すように、第2処理部184を制御する。
(4)利点
以上説明したように、本実施形態のインターホン装置10の方向推定部182は、第1マイクロホン131及び第2マイクロホン132が取得した音に係る音情報を基に、話者(対象者200)の方向を推定している。処理制御部185は、方向推定部182の推定結果を基に、第1処理を行う第1処理部122及び第2処理を行う第2処理部184のうち少なくとも一方を制御する。第1処理は露光調整及びレンズの向きの調整を含み、第2処理は画像調整処理を含む。よって、インターホン装置10は、第1処理及び第2処理のいずれかを行うことで、話者の判別がし易い画像を生成することができる。
(5)変形例
以下に、変形例について列記する。なお、以下に説明する変形例は、上記実施形態と適宜組み合わせて適用可能である。
(5−1)変形例1
上記実施形態において、処理制御部185は、第1処理部122及び第2処理部184を制御する構成としたが、この構成に限定されない。
処理制御部185は、さらに、撮像部121の周辺に設けられた照明装置70を制御してもよい。
この場合のインターホンシステム1としてのインターホン装置10Aの構成について、図6を用いて説明する。なお、実施形態と同様の構成要素には同一の符号を付し、適宜その説明を省略する。本実施形態では、共用玄関E1に複数の照明装置70が設置されているとする。
インターホン装置10Aは、図6に示すように、第1通信部11a、第2通信部11b、撮像装置12、音取得部13、操作部14、出力部15、表示部16、記憶部17及び制御部18aを備える。
インターホン装置10Aは、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部18aとして機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
第1通信部11aは、実施形態の通信部11と同様に、制御装置30を介して情報端末20と通信を行うための通信インタフェースを含んでいる。
第2通信部11bは、複数(図示例では3つ)の照明装置70と通信を行うための通信インタフェースを含んでいる。第2通信部11bは、インターホン装置10Aと照明装置70との間で制御信号等が双方向に伝送可能となるように、照明装置70との間で双方向に通信可能に構成されている。ここで、インターホン装置10からの信号には、照明装置70を特定するための情報(例えば、アドレス情報等)が含まれている。そのため、この信号に含まれるアドレス情報と一致するアドレス情報が割り当てられた照明装置70のみが信号を受信することができる。インターホン装置10から照明装置70に送信される信号は、例えば調光を制御する信号である。
制御部18aは、図6に示すように、音声処理部181、方向推定部182、方向制御部183、第2処理部184、処理制御部185及び信号出力部186を有している。
処理制御部185は、実施形態1の機能に加えて、更に、複数の照明装置70のうち少なくとも1つの照明装置70を制御する。具体的には、処理制御部185は、方向推定部182の推定結果に基づいて、複数の照明装置70のうち制御対象となる少なくとも1つの照明装置70を特定する。処理制御部185は、特定した照明装置70に対して制御信号を出力するよう信号出力部186を制御する。例えば、処理制御部185は、方向推定部182の推定結果に基づいて、対象者200(話者)が存在すると推定された方向において、対象者200の背後に配置された照明装置70を特定する。処理制御部185は、特定した照明装置70の照度が低くなるように調光を制御するための信号(制御信号)を出力するように、信号出力部186を制御する。
信号出力部186は、撮像部121の周辺に設けられた照明装置70を制御する制御信号を出力する。信号出力部186は、方向推定部182の推定結果に基づいた制御信号を、制御対象の照明装置70に出力する。
これにより、例えば対象者200(話者)の背後を暗くするので、逆光により話者が認識しづらいという可能性を低くすることができる。
なお、制御対象となる照明装置70は、共用玄関E1に設けられた照明装置に限定されない。処理制御部185は、インターホン装置10に備えられた照明装置を制御対象としてもよい。
(5−2)変形例2
上記実施形態では、インターホン装置10がロビーインターホンであるが、インターホン装置10はロビーインターホンに限らず、例えば、ドアホンであってもよい。さらに、インターホン装置10は、住戸端末(親機)であってもよい。この場合、住戸端末には、内蔵のカメラ、又は外付けのカメラが設けられていてもよい。また、インターホン装置10は、管理室親機が設けられている場合には管理室親機であってもよい。インターホン装置10が管理室親機の場合、管理室親機には、内蔵のカメラ、又は外付けのカメラが設けられていてもよい。
(5−3)変形例3
上記実施形態では、方向推定部182は、左右方向、及び鉛直方向における対象者(話者)の位置を推定したが、これに限定されない。
方向推定部182は、更に、奥行き、つまりインターホン装置10から対象者200までの距離を推定してもよい。
処理制御部185は、推定した距離を基に、画像を拡大する処理及び画像を縮小する処理を第2処理部184が行うように第2処理部184を制御する。これにより、話者が撮像部121から遠い位置で音声を発している場合には画像を拡大することで、話者を判別し易くなる。また、話者が撮像部121に近い位置で音声を発している場合には画像を縮小することで、話者を判別し易くなる。つまり、インターホン装置10は、推定した距離を基に、拡大処理又は縮小処理を行うことで、話者を判別し易い画像を生成することができる。
(5−4)変形例4
上記実施形態では、処理制御部185は、第2処理部184を制御する場合には、話者領域R20の画像に係る情報を基準とし、画像全体に対して第2処理を施すように、第2処理部184を制御する構成とした。しかしながら、この構成に限定されない。
処理制御部185は、第2処理部184を制御する場合には、所定の領域R1のうち話者領域R20に対して第2処理を施すように、第2処理部184を制御してもよい。
この場合、第2処理部184は、話者領域R20に対して、第2処理を施す。例えば、第2処理部184は、話者領域R20に対して、画像調整処理を施す。
(5−5)変形例5
実施形態において、制御装置30と情報端末20との間の通信、及び情報端末20とドアホン40との間の通信は、無線通信であってもよい。
(5−6)変形例6
上記実施形態において、撮像装置12及び音取得部13は、インターホン装置10の必須の構成要素ではない。
(その他の変形例)
上記実施形態は、本開示の様々な実施形態の一つに過ぎない。上記実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。また、インターホンシステム1と同様の機能は、制御方法、コンピュータプログラム、又はプログラムを記録した非一時的な記録媒体等で具現化されてもよい。一態様に係るインターホンシステム1の制御方法は、方向推定ステップと、処理制御ステップと、を含む。方向推定ステップは、音取得部13が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。処理制御ステップは、方向推定ステップの推定結果に基づいて、所定の領域を撮像する撮像部121に対する第1処理及び撮像部121が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。一態様に係るプログラムは、コンピュータシステムを、上述したインターホンシステム1又はインターホンシステム1の制御方法として機能させるためのプログラムである。
本開示におけるインターホンシステム1又はインターホンシステム1の制御方法の実行主体は、コンピュータシステムを含んでいる。コンピュータシステムは、ハードウェアとしてのプロセッサ及びメモリを有する。コンピュータシステムのメモリに記録されたプログラムをプロセッサが実行することによって、本開示におけるインターホンシステム1又はインターホンシステム1の制御方法の実行主体としての機能が実現される。プログラムは、コンピュータシステムのメモリに予め記録されていてもよいが、電気通信回線を通じて提供されてもよい。また、プログラムは、コンピュータシステムで読み取り可能なメモリカード、光学ディスク、ハードディスクドライブ等の非一時的な記録媒体に記録されて提供されてもよい。コンピュータシステムのプロセッサは、半導体集積回路(IC)又は大規模集積回路(LSI)を含む1乃至複数の電子回路で構成される。複数の電子回路は、1つのチップに集約されていてもよいし、複数のチップに分散して設けられていてもよい。複数のチップは、1つの装置に集約されていてもよいし、複数の装置に分散して設けられていてもよい。
(まとめ)
以上説明したように、第1の態様のインターホンシステム(1)は、方向推定部(182)と、処理制御部(185)と、を備える。方向推定部(182)は、音取得部(13)が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。処理制御部(185)は、方向推定部(182)の推定結果に基づいて、所定の領域(R1)を撮像する撮像部(121)に対する第1処理及び撮像部(121)が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。
この構成によると、第1処理及び第2処理のいずれかを行うことで、話者の判別がし易い画像を生成することができる。
第2の態様のインターホンシステム(1)では、第1の態様において、処理制御部(185)は、方向推定部(182)の推定結果を基に、所定の領域(R1)のうち話者の顔を含む話者領域(R20)を推定する。
この構成によると、話者の顔(210)を含む話者領域(R20)を推定することができる。
第3の態様のインターホンシステム(1)では、第2の態様において、処理制御部(185)は、話者領域(R20)の画像に係る情報を基準とし、画像全体に対して第2処理を施す。
この構成によると、話者領域(R20)が明瞭な画像を生成することができる。
第4の態様のインターホンシステム(1)では、第2の態様において、処理制御部(185)は、話者領域(R20)に対して第2処理を施す。
この構成によると、話者領域(R20)が明瞭な画像を生成することができる。
第5の態様のインターホンシステム(1)では、第2〜第4のいずれかの態様において、所定の領域(R1)は、複数の人の顔(210,211)をそれぞれ含む複数の顔領域(例えば、顔領域R30,R31)を含む。処理制御部(185)は、方向推定部(182)の推定結果を基に、複数の顔領域のうち1つの顔領域(例えば、顔領域R30)を話者領域(R20)として推定する。
この構成によると、画像に複数の人物の顔が含まれる場合であっても、話者領域(R20)を推定することができる。
第6の態様のインターホンシステム(1)では、第1〜第5のいずれかの態様において、第1処理及び第2処理のうち少なくとも一方は、話者の表示に係る処理を含む。
この構成によると、話者が明瞭な画像を生成することができる。
第7の態様のインターホンシステム(1)では、第1〜第6のいずれかの態様において、第1処理は、画像に対する露光を調整する処理を含む。
この構成によると、話者の判別がし易い画像を生成することができる。
第8の態様のインターホンシステム(1)では、第1〜第7のいずれかの態様において、第2処理は、画像を調整する画像調整処理を含む。
この構成によると、話者の判別がし易い画像を生成することができる。
第9の態様のインターホンシステム(1)では、第8の態様において、画像調整処理は、画像に対する歪補正を含む。
この構成によると、話者の判別がし易い画像を生成することができる。
第10の態様のインターホンシステム(1)では、第8又は第9の態様において、画像調整処理は、画像に対する階調補正及び色調補正のうち少なくとも一方を含む。
この構成によると、話者の判別がし易い画像を生成することができる。
第11の態様のインターホンシステム(1)では、第1〜第10のいずれかの態様において、第2処理は、画像を拡大する処理及び画像を縮小する処理のうち少なくとも一方を含む。
この構成によると、話者の判別がし易い画像を生成することができる。
第12の態様のインターホンシステム(1)では、第1〜第11のいずれかの態様において、方向推定部(182)は、画像において話者の方向を推定する。
この構成によると、左右方向及び鉛直方向における話者の位置を推定することができる。
第13の態様のインターホンシステム(1)は、第1〜第12のいずれかの態様において、信号出力部(186)を、更に備える。信号出力部(186)は、撮像部(121)の周辺に設けられた照明装置(70)を制御する制御信号を出力する。信号出力部(186)は、方向推定部(182)の推定結果に基づいた制御信号を照明装置(70)に出力する。
この構成によると、撮像環境を適切な状態とすることができる。
第14の態様の制御方法は、方向推定ステップと、処理制御ステップと、を含む。方向推定ステップは、音取得部(13)が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する。処理制御ステップは、方向推定ステップの推定結果に基づいて、所定の領域(R1)を撮像する撮像部(121)に対する第1処理及び撮像部(121)が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する。
この制御方法によると、第1処理及び第2処理のいずれかを行うことで、話者の判別がし易い画像を生成することができる。
第15の態様のプログラムは、コンピュータに、第14の態様の制御方法を実行させるためのプログラムである。
このプログラムによると、話者の判別がし易い画像を生成することができる。
1 インターホンシステム
10 インターホン装置
13 音取得部
70 照明装置
121 撮像部
122 第1処理部
182 方向推定部
184 第2処理部
186 信号出力部
200 対象者(話者)
201,202 対象者
210,211 顔
R1 所定の領域
R20 話者領域
R30,R31 顔領域

Claims (15)

  1. 音取得部が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する方向推定部と、
    前記方向推定部の推定結果に基づいて、所定の領域を撮像する撮像部に対する第1処理及び前記撮像部が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する処理制御部と、を備える、
    インターホンシステム。
  2. 前記処理制御部は、方向推定部の推定結果を基に、前記所定の領域のうち前記話者の顔を含む話者領域を推定する、
    請求項1に記載のインターホンシステム。
  3. 前記処理制御部は、前記話者領域の画像に係る情報を基準とし、前記画像全体に対して前記第2処理を施す、
    請求項2に記載のインターホンシステム。
  4. 前記処理制御部は、前記話者領域に対して前記第2処理を施す、
    請求項2に記載のインターホンシステム。
  5. 前記所定の領域は、複数の人の顔をそれぞれ含む複数の顔領域を含み、
    前記処理制御部は、方向推定部の推定結果を基に、前記複数の顔領域のうち1つの顔領域を前記話者領域として推定する、
    請求項2〜4のいずれか一項に記載のインターホンシステム。
  6. 前記第1処理及び前記第2処理のうち少なくとも一方は、前記話者の表示に係る処理を含む、
    請求項1〜5のいずれか一項に記載のインターホンシステム。
  7. 前記第1処理は、前記画像に対する露光を調整する処理を含む、
    請求項1〜6のいずれか一項に記載のインターホンシステム。
  8. 前記第2処理は、前記画像を調整する画像調整処理を含む、
    請求項1〜7のいずれか一項に記載のインターホンシステム。
  9. 前記画像調整処理は、前記画像に対する歪補正を含む、
    請求項8に記載のインターホンシステム。
  10. 前記画像調整処理は、前記画像に対する階調補正及び色調補正のうち少なくとも一方を含む、
    請求項8又は9に記載のインターホンシステム。
  11. 前記第2処理は、前記画像を拡大する処理及び前記画像を縮小する処理のうち少なくとも一方を含む、
    請求項1〜10のいずれか一項に記載のインターホンシステム。
  12. 前記方向推定部は、前記画像において前記話者の方向を推定する、
    請求項1〜11のいずれか一項に記載のインターホンシステム。
  13. 前記撮像部の周辺に設けられた照明装置を制御する制御信号を出力する信号出力部を、更に備え、
    前記信号出力部は、前記方向推定部の推定結果に基づいた前記制御信号を前記照明装置に出力する、
    請求項1〜12のいずれか一項に記載のインターホンシステム。
  14. 音取得部が取得した音に係る音情報に基づいて、音声を発する話者の方向を推定する方向推定ステップと、
    前記方向推定ステップの推定結果に基づいて、所定の領域を撮像する撮像部に対する第1処理及び前記撮像部が撮像した画像に対するパン制御とチルト制御とを除く第2処理のうち少なくとも一方を制御する処理制御ステップと、を含む、
    制御方法。
  15. コンピュータに、請求項14に記載の制御方法を実行させるためのプログラム。
JP2019115001A 2019-06-20 2019-06-20 インターホンシステム、制御方法及びプログラム Pending JP2021002729A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019115001A JP2021002729A (ja) 2019-06-20 2019-06-20 インターホンシステム、制御方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019115001A JP2021002729A (ja) 2019-06-20 2019-06-20 インターホンシステム、制御方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2021002729A true JP2021002729A (ja) 2021-01-07

Family

ID=73995160

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019115001A Pending JP2021002729A (ja) 2019-06-20 2019-06-20 インターホンシステム、制御方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2021002729A (ja)

Similar Documents

Publication Publication Date Title
JP4501037B2 (ja) 通信制御システムと通信装置および通信方法
JP2008113396A (ja) ドアホンシステム及び玄関子機
WO2023231686A9 (zh) 一种视频处理方法和终端
JP2011055103A (ja) 集合住宅インターホンシステム
JP7054833B2 (ja) インターホン玄関装置、インターホンシステム、制御方法、及びプログラム
JP6409301B2 (ja) 電子機器
JP2021002729A (ja) インターホンシステム、制御方法及びプログラム
JP5750590B2 (ja) 撮像装置及びインターホン装置、インターホンシステム
JP7390582B2 (ja) 通話システム、制御方法及びプログラム
TW494684B (en) A remote video telephone system
JP7042440B2 (ja) インターホン装置、インターホンシステム、情報端末、処理方法及びプログラム
JP7390634B2 (ja) ロビーインターホン、インターホンシステム、画像情報出力方法及びプログラム
JP7113253B2 (ja) 呼出装置、情報端末、情報端末の制御方法、プログラム
JP2020184656A (ja) 音取得制御システム、情報端末、音取得制御方法、及びプログラム
JP2015111935A (ja) インターホンシステム、インターホン子機及びインターホン親機
JP7308445B2 (ja) 画像処理システム、画像処理方法及びプログラム
JP2021141572A (ja) 情報端末、インターホンシステム、処理方法及びプログラム
JP2009081514A (ja) テレビドアホン装置
JP2024014092A (ja) インターホンシステム
KR101614384B1 (ko) 멀티미디어 컨텐츠 입출력 장치
TW202308366A (zh) 資訊終端、對講機系統及程式
KR100972432B1 (ko) 자동 영상 조절 장치 및 그 방법
JP2020127088A (ja) インターホン装置、情報端末、及びインターホンシステム
JP2003333198A (ja) インタフォン・システム
JP2009261007A (ja) インターホンシステム