JP2020184656A - 音取得制御システム、情報端末、音取得制御方法、及びプログラム - Google Patents
音取得制御システム、情報端末、音取得制御方法、及びプログラム Download PDFInfo
- Publication number
- JP2020184656A JP2020184656A JP2019086734A JP2019086734A JP2020184656A JP 2020184656 A JP2020184656 A JP 2020184656A JP 2019086734 A JP2019086734 A JP 2019086734A JP 2019086734 A JP2019086734 A JP 2019086734A JP 2020184656 A JP2020184656 A JP 2020184656A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- sound acquisition
- sound
- acquisition
- control system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Studio Devices (AREA)
- Circuit For Audible Band Transducer (AREA)
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
Abstract
【課題】インターホン装置に対する対象者の位置にかかわらず対象者の音声を取得する。【解決手段】音取得制御システム7は、制御部22を備える。制御部22は、対象者の顔の位置に基づいて、音を取得する音取得部23を有するインターホン装置2の音取得部23による音の取得方向を制御する。【選択図】図1
Description
本開示は、音取得制御システム、情報端末、音取得制御方法、及びプログラムに関する。より詳細には、本開示は、音を取得する音取得部を備える音取得制御システム、情報端末、音取得制御方法、及びプログラムに関する。
特許文献1には、玄関に設置されて居住者を呼び出して通話するための玄関子機(インターホン装置)と、宅内に設置されて玄関子機からの呼び出しに応答するための居室親機(情報端末)と、を備えるインターホンシステムが記載されている。
玄関子機は、マイクロホンアレイと、子機CODECと、位相差検出部と、到来方向推定部と、映像信号処理部と、を備える。マイクロホンアレイは、複数のマイクロホンを備える。子機CODECは、マイクロホンアレイが収音して出力する複数チャネルの音声信号をデジタル信号に変換する。位相差検出部は、居室親機に玄関子機から伝送された複数チャネルのデジタル音声信号から音声信号の位相差を検出する。到来方向推定部は、検出した位相差情報を基に音声の到来方向を推定する。映像信号処理部は、到来方向推定部の推定結果を基にモニタに表示する映像をパン・チルトする。
ところで、特許文献1に記載のインターホンシステムでは、玄関子機に対する訪問者(対象者)の位置によっては訪問者の音声を取得できない可能性があった。
本開示の目的は、インターホン装置に対する対象者の位置にかかわらず対象者の音声を取得することができる音取得制御システム、情報端末、音取得制御方法、及びプログラムを提供することにある。
本開示の一態様に係る音取得制御システムは、制御部を備える。前記制御部は、対象者の顔の位置に基づいて、音を取得する音取得部を有するインターホン装置の前記音取得部による前記音の取得方向を制御する。
本開示の一態様に係る情報端末は、前記音取得制御システムにおける前記インターホン装置と通信可能な情報端末である。前記情報端末は、前記取得方向に関する情報を提示する提示部を備える。
本開示の一態様に係る音取得制御方法は、制御ステップを含む。前記制御ステップは、対象者の顔の位置に基づいて、音を取得する音取得部を有するインターホン装置の前記音取得部による前記音の取得方向を制御するステップである。
本開示の一態様に係るプログラムは、前記音取得制御方法を1以上のプロセッサに実行させるためのプログラムである。
本開示によれば、インターホン装置に対する対象者の位置にかかわらず対象者の音声を取得することができる、という効果がある。
(実施形態)
(1)概要
以下、本実施形態に係る音取得制御システム7、及び音取得制御システム7を適用したインターホンシステム10の概要について、図1を参照して説明する。
(1)概要
以下、本実施形態に係る音取得制御システム7、及び音取得制御システム7を適用したインターホンシステム10の概要について、図1を参照して説明する。
本実施形態に係る音取得制御システム7は、図1に示すように、インターホンシステム10に適用される。インターホンシステム10は、例えば、マンション等の集合住宅100に適用される集合住宅用のインターホンシステムである。本実施形態に係るインターホンシステム10は、複数(図1では2つ)の情報端末1と、インターホン装置2と、制御装置3と、複数(図1では2つ)のドアホン4と、を備えている。インターホンシステム10では、複数の情報端末1の各々とインターホン装置2とが制御装置3を介して通信を行うように構成されている。また、インターホンシステム10では、複数の情報端末1と複数のドアホン4とが一対一に対応している。なお、本実施形態に係るインターホンシステム10は、集合住宅100以外に、戸建住宅に適用されてもよい。あるいは、インターホンシステム10は、事務所、店舗、学校若しくは介護施設等の非住宅施設等に適用されてもよい。
複数の情報端末1の各々は、例えば、集合住宅100に含まれる複数の住戸101の各々に設けられている住戸端末(親機)である。各情報端末1は、例えば、各住戸101の内玄関に設けられている。各情報端末1は、第2幹線62、分岐線63、及び分岐器5を介して制御装置3に接続されている。各情報端末1は、制御装置3を介して、インターホン装置2との間で通信(例えば、通話、及び制御信号の送信等)を行うように構成されている。さらに、各情報端末1は、接続線64を介して対応するドアホン4に接続されている。各情報端末1は、対応するドアホン4との間で通信(例えば、通話、及び制御信号の送信等)を行うように構成されている。
インターホン装置2は、例えば、集合住宅100の共用玄関(ロビー)102に設けられているロビーインターホン(子機)である。インターホン装置2は、第1幹線61を介して制御装置3に接続されている。インターホン装置2は、制御装置3を介して、各情報端末1との間で通信(例えば、通話、及び映像信号の送信等)を行うように構成されている。
制御装置3は、例えば、集合住宅100の管理室103に設けられている。制御装置3は、第1幹線61を介してインターホン装置2に接続され、かつ第2幹線62を介して各情報端末1に接続されている。つまり、制御装置3は、各情報端末1とインターホン装置2との間の通信を中継するように構成されている。
複数のドアホン4の各々は、例えば、集合住宅100の各住戸101の外玄関に設けられている。各ドアホン4は、接続線64を介して対応する情報端末1に接続されている。各ドアホン4は、対応する情報端末1との間で通信(例えば、通話、映像信号の送信等)を行うように構成されている。
本実施形態では、第1幹線61、第2幹線62、分岐線63、及び接続線64は、いずれもツイストペア線である。つまり、実際には、第1幹線61、第2幹線62、分岐線63、及び接続線64は2本の電線で構成されるが、図面上は1本の線で表している。第1幹線61、第2幹線62、分岐線63、及び接続線64の少なくとも1つはツイストペア線以外の電線であってもよい。
本実施形態に係る音取得制御システム7は、制御部22を備える。制御部22は、対象者200の顔210(図4A参照)の位置に基づいて、音を取得する音取得部23を有するインターホン装置2の音取得部23による音の取得方向D1(図4A参照)を制御する。対象者200は、例えば、集合住宅100への訪問者であるが、インターホン装置2から各住戸101を呼び出す者であればよく、外出先から帰宅した各住戸101の住人等であってもよい。本実施形態では、音取得制御システム7はインターホン装置2で構成されている。
本実施形態に係る音取得制御システム7では、対象者200の顔210の位置に基づいて音取得部23による音の取得方向D1(音取得部23の指向性)を変更している。そのため、音取得部23による音の取得方向D1を対象者200の方向に向けることができ、インターホン装置2に対する対象者200の位置にかかわらず対象者200の音声(音)を取得することができる。
(2)構成
次に、本実施形態に係る音取得制御システム7(インターホン装置2)、及び音取得制御システム7を適用したインターホンシステム10の構成について、図1及び図2を参照して説明する。
次に、本実施形態に係る音取得制御システム7(インターホン装置2)、及び音取得制御システム7を適用したインターホンシステム10の構成について、図1及び図2を参照して説明する。
本実施形態に係るインターホンシステム10は、図1に示すように、複数(図1では2つ)の情報端末1と、インターホン装置2と、制御装置3と、複数(図1では2つ)のドアホン4と、を備えている。複数の情報端末1と複数のドアホン4とは一対一に対応している。
なお、以下の説明では、複数の対象者201,202を特に区別しない場合には、複数の対象者201,202の各々を「対象者200」ともいう。また、以下の説明では、複数の顔211,212を特に区別しない場合には、複数の顔211,212の各々を「顔210」ともいう。
(2.1)情報端末
情報端末1は、図1に示すように、第1通信部11と、第2通信部12と、制御部13と、通話部14と、映像処理部15と、表示部16と、操作部17と、記憶部18と、を備えている。
情報端末1は、図1に示すように、第1通信部11と、第2通信部12と、制御部13と、通話部14と、映像処理部15と、表示部16と、操作部17と、記憶部18と、を備えている。
第1通信部11は、インターホン装置2(の通信部21)と通信するための通信インターフェースである。第1通信部11は、第2幹線62、分岐線63、及び分岐器5を介して制御装置3に接続されている。第1通信部11は、制御装置3を介して、インターホン装置2に対して音声信号、及び制御信号等を送信する。さらに、第1通信部11は、制御装置3を介して、インターホン装置2から音声信号、及び映像信号等を受信する。
第2通信部12は、ドアホン4と通信するための通信インターフェースである。第2通信部12は、接続線64を介してドアホン4に接続されている。第2通信部12は、ドアホン4に対して音声信号、及び制御信号等を送信し、ドアホン4から音声信号、及び映像信号等を受信する。
制御部13は、例えば、1以上のプロセッサ及び1以上のメモリを有するコンピュータシステムを主構成とする。そして、コンピュータシステムのメモリに記録されたプログラムを、コンピュータシステムのプロセッサが実行することにより、制御部13の機能が実現される。プログラムは、メモリに予め記録されていてもよいし、インターネット等の電気通信回線を通じて、又はメモリカード等の非一時的記録媒体に記録されて提供されてもよい。制御部13は、第1通信部11、第2通信部12、通話部14、及び映像処理部15等を制御するように構成されている。
通話部14は、スピーカ及びマイクロホンを含み、インターホン装置2、及びドアホン4との間で通話可能に構成されている。
映像処理部15は、インターホン装置2、及びドアホン4からの映像信号を受けて、信号処理により映像信号に含まれる映像を処理するように構成されている。映像処理部15は、例えば、DSP(Digital Signal Processor)、又はFPGA(Field-ProgrammableGate Array)等のデバイスにて実現される。
表示部16は、例えば、液晶ディスプレイである。表示部16は、映像処理部15からの映像を表示するように構成されている。また、本実施形態では、表示部16は、音取得部23による音の取得方向D1に関する情報を表示するように構成されている。つまり、本実施形態では、表示部16は、音取得部23による音の取得方向D1に関する情報を提示する提示部19として機能する。言い換えると、情報端末1は、音取得部23による音の取得方向D1に関する情報を提示する提示部19を備えている。ここで、取得方向D1に関する情報は、取得方向D1を提示するように構成されていればよく、例えば、文字情報であってもよいし、画像情報であってもよい。また、提示部19は表示部16に限らず、例えば、通話部14のスピーカであってもよいし、通話部14のスピーカとは別に設けられたスピーカであってもよい。提示部19がスピーカの場合、取得方向D1に関する情報を音声で提示することになる。さらに、提示部19は、表示部16とスピーカとの両方で構成されていてもよい。なお、情報端末1がタッチパネルディスプレイを備えている場合には、タッチパネルディスプレイが表示部16と操作部17とを兼ねてもよい。
操作部17は、ユーザ(例えば、各住戸101の住人等)の操作を受け付けるように構成されている。操作部17は、少なくとも通話ボタンを有している。通話ボタンは、インターホン装置2、又はドアホン4からの呼び出しに対して、インターホン装置2、又はドアホン4との通話を開始するためのボタンである。つまり、第1通信部11が住人を呼び出すための呼出信号を受信している状態で通話ボタンが押されると、インターホン装置2、又はドアホン4と情報端末1との間で音声通話が可能になる。
記憶部18は、読み書き可能なメモリで構成されている。記憶部18は、例えば、フラッシュメモリである。記憶部18は、例えば、インターホン装置2、及びドアホン4からの映像データを記憶する。さらに、記憶部18は、情報端末1に割り当てられたアドレス情報(識別情報)を記憶する。
(2.2)インターホン装置
インターホン装置2は、図1に示すように、通信部21と、制御部22と、音取得部23と、通話部24と、表示部25と、操作部26と、記憶部27と、撮像部28と、を備えている。
インターホン装置2は、図1に示すように、通信部21と、制御部22と、音取得部23と、通話部24と、表示部25と、操作部26と、記憶部27と、撮像部28と、を備えている。
通信部21は、情報端末1(の第1通信部11)と通信するための通信インターフェースである。通信部21は、第1幹線61を介して制御装置3(の通信部31)に接続されている。通信部21は、制御装置3を介して、情報端末1に対して音声信号、及び映像信号等を送信する。さらに、通信部21は、制御装置3を介して、情報端末1から音声信号、及び制御信号等を受信する。ここで、インターホン装置2からの通信信号には、情報端末1を特定するための情報(例えば、アドレス情報等)が含まれている。そのため、この通信信号に含まれるアドレス情報と一致するアドレス情報が割り当てられた情報端末1のみが通信信号を受信することができる。
制御部22は、例えば、1以上のプロセッサ及び1以上のメモリを有するコンピュータシステムを主構成とする。そして、コンピュータシステムのメモリに記録されたプログラムを、コンピュータシステムのプロセッサが実行することにより、制御部22の機能が実現される。プログラムは、メモリに予め記録されていてもよいし、インターネット等の電気通信回線を通じて、又はメモリカード等の非一時的記録媒体に記録されて提供されてもよい。制御部22は、通信部21、音取得部23、通話部24、及び撮像部28等を制御するように構成されている。
また、制御部22は、図2に示すように、音声処理部221と、映像処理部222と、顔検出部223と、方向制御部224と、を有している。
音声処理部221は、音取得部23から入力されるアナログの音信号をデジタルの音信号に変換するように構成されている。また、音声処理部221は、音取得部23から入力される音信号に対して所定のフィルタリング処理等を行うように構成されている。
映像処理部222は、撮像部28からの映像信号を受けて、信号処理により映像信号に含まれる映像を処理するように構成されている。映像処理部222は、信号処理を行った後の映像データを、通信部21を介して情報端末1に送信する。また、映像処理部222は、信号処理を行った後の映像データを記憶部27に記憶させる。
顔検出部223は、撮像部28が撮像した画像I1(図3参照)における対象者200の顔210を検出するように構成されている。顔検出部223は、例えば、顔パーツ(目、鼻、口)の位置関係から対象者200の顔210を検出する。さらに、顔検出部223は、画像I1における顔210の位置を検出するように構成されている。顔検出部223は、検出結果として、画像I1における顔210の位置データを方向制御部224に出力する。なお、図3に示すように、画像I1に複数の顔210が含まれている場合には、複数の顔210の各々の位置データが検出結果に含まれる。
方向制御部224は、音取得部23による音の取得方向D1(図4A参照)を制御するように構成されている。具体的には、方向制御部224は、後述する第1マイクロホン231から入力される音のゲイン、及び後述する第2マイクロホン232から入力される音のゲインをそれぞれ調整するように構成されている。より具体的には、方向制御部224は、第1マイクロホン231及び第2マイクロホン232の各々から入力される音声信号に対して各種演算を行うことで、所望の方向の感度を高めた音声信号に変換する。これにより、所望の方向のS/N比が向上する。例えば、第1マイクロホン231から入力される音のゲインを1、第2マイクロホン232から入力される音のゲインを0とした場合、方向制御部224は、第1マイクロホン231から入力される音のみを出力することになる。つまり、制御部22は、各マイクロホンから入力される音のゲインを方向制御部224が変えることで、音取得部23による音の取得方向D1を制御することができる。ここで、方向制御部224は、顔検出部223の検出結果である、画像I1における顔210の位置データに基づいて、各マイクロホンから入力される音のゲインを調整する。言い換えると、制御部22は、インターホン装置2の撮像部28が撮像した画像I1における顔210の位置に基づいて取得方向D1を制御する。
音取得部23は、複数のマイクロホンを有している。複数のマイクロホンの各々は、指向性を有するマイクロホンである。本実施形態では、図2に示すように、2つのマイクロホン(第1マイクロホン231及び第2マイクロホン232)を有している。第1マイクロホン231及び第2マイクロホン232は、水平方向(左右方向)及び鉛直方向(上下方向)の少なくとも一方において互いに異なる指向性を有している。第1マイクロホン231及び第2マイクロホン232は、インターホン装置2の前方に位置する対象者200の音声(音)を含む周囲の音を取得し、取得した音をアナログの音信号に変換して制御部22に出力する。
通話部24は、スピーカ及びマイクロホンを含み、情報端末1との間で通話可能に構成されている。
表示部25は、例えば、液晶ディスプレイである。表示部25は、映像処理部222からの映像を表示するように構成されている。また、表示部25は、対象者200に対してメッセージを表示するように構成されている。つまり、本実施形態では、表示部25は、対象者200に対するメッセージを提示する提示部20として機能する。メッセージは、例えば、対象者200に発話を促すためのメッセージである。表示部25は、例えば、「お話しください」等のメッセージを表示する。この場合において、同様の音声メッセージを通話部24のスピーカ、又は通話部24のスピーカとは別に設けられたスピーカから出力(報知)してもよい。また、表示部25とスピーカとを併用してもよい。なお、インターホン装置2がタッチパネルディスプレイを備えている場合には、タッチパネルディスプレイが表示部25と操作部26とを兼ねてもよい。
操作部26は、ユーザ(例えば、集合住宅100への訪問者、住人等)の操作を受け付けるように構成されている。操作部26は、例えば、複数の押ボタンスイッチ、及びタッチパネル等を有する入力インターフェースである。
記憶部27は、読み書き可能なメモリで構成されている。記憶部27は、例えば、フラッシュメモリである。記憶部27は、例えば、撮像部28で撮像された映像(画像)の映像データを記憶する。
撮像部28は、撮像素子を有し、被写体(ユーザ)を撮像するためのカメラである。本実施形態では、撮像部28の撮像エリア(視野)は、インターホン装置2の前方に設定されている。本実施形態では、撮像部28は動画を撮像するカメラである。さらに、本実施形態では、撮像部28はカラー画像を撮像するカメラである。なお、撮像部28は、静止画を撮像するカメラ(スチルカメラ)であってもよいし、モノクロ画像を撮像するカメラであってもよい。
撮像素子は、例えば、CCD(Charge Coupled Devices)イメージセンサ、又はCMOS(Complementary Metal-Oxide Semiconductor)イメージセンサ等の二次元イメージセンサである。撮像部28は、被写体からの光をレンズ等の光学系によって撮像素子の撮像面(受光面)上に結像させ、撮像素子にて被写体からの光を電気信号に変換する。そして、撮像部28は、撮像素子の出力信号を映像信号として映像処理部222に出力する。
図3は、撮像部28が撮像した画像I1の一例を示す図である。図3に示す例では、対象者200は2人であるが、対象者200は1人であってもよいし、3人以上であってもよい。図3に示す例では、制御部22の顔検出部223は、画像I1から、対象者201の顔211と、対象者202の顔212と、を検出する。また、顔検出部223は、画像I1における顔211の位置と、画像I1における顔212の位置と、を検出する。そして、制御部22の方向制御部224は、顔検出部223の検出結果である、画像I1における顔211の位置と顔212の位置との少なくとも一方に基づいて、音取得部23による音の取得方向D1を制御する。言い換えると、制御部22は、インターホン装置2の撮像部28が撮像した画像I1に複数の対象者200の顔210が含まれている場合に、複数の顔210のうち少なくとも1つの顔210の位置に基づいて取得方向D1を制御する。ここで、インターホン装置2に対する対象者200の位置が変化した場合でも対象者200の音声(音)を取得できるように、制御部22は、音取得部23による音の取得方向D1をリアルタイムに制御することが好ましい。これにより、例えば、インターホン装置2に対する対象者200の位置が通話中に変化した場合でも、対象者200の移動方向に取得方向D1を制御することで、対象者200の音声(音)を取得することができる。
(2.3)制御装置
制御装置3は、図1に示すように、通信部31と、制御部32と、記憶部33と、を備えている。
制御装置3は、図1に示すように、通信部31と、制御部32と、記憶部33と、を備えている。
通信部31は、各情報端末1、及びインターホン装置2と通信するための通信インターフェースである。通信部31は、第1幹線61を介してインターホン装置2に接続され、第2幹線62を介して各情報端末1に接続されている。つまり、通信部31は、各情報端末1とインターホン装置2との間の通信を中継するように構成されている。
制御部32は、例えば、1以上のプロセッサ及び1以上のメモリを有するコンピュータシステムを主構成とする。そして、コンピュータシステムのメモリに記録されたプログラムを、コンピュータシステムのプロセッサが実行することにより、制御部32の機能が実現される。プログラムは、メモリに予め記録されていてもよいし、インターネット等の電気通信回線を通じて、又はメモリカード等の非一時的記録媒体に記録されて提供されてもよい。制御部32は、通信部31を制御するように構成されている。
記憶部33は、読み書き可能なメモリで構成されている。記憶部33は、例えば、フラッシュメモリである。記憶部33は、例えば、各住戸101に割り当てられた部屋番号と、各情報端末1に割り当てられたアドレス情報との対応関係を表す対応テーブルを記憶する。つまり、制御装置3では、制御部32は、対応テーブルを参照して、インターホン装置2からの通信信号に含まれる部屋番号を対応する情報端末1のアドレス情報に置き換えた通信信号を作成し、この通信信号を通信部31から各情報端末1に送信させる。そして、各情報端末1では、制御部13は、第1通信部11が受信した通信信号に含まれるアドレス情報が、記憶部18に記憶されているアドレス情報と一致する場合には、この通信信号に含まれる情報を取得する。また、各情報端末1では、制御部13は、第1通信部11が受信した通信信号に含まれるアドレス情報が、記憶部18に記憶されているアドレス情報と一致しない場合には、この通信信号に含まれる情報を破棄する。
(2.4)ドアホン
各ドアホン4は、図1に示すように、接続線64を介して対応する情報端末1に接続されている。ドアホン4は、情報端末1に対して音声信号、及び映像信号等を送信する。さらに、ドアホン4は、情報端末1から音声信号、及び制御信号等を受信する。
各ドアホン4は、図1に示すように、接続線64を介して対応する情報端末1に接続されている。ドアホン4は、情報端末1に対して音声信号、及び映像信号等を送信する。さらに、ドアホン4は、情報端末1から音声信号、及び制御信号等を受信する。
(3)動作
(3.1)動作例1
本実施形態に係る音取得制御システム7の動作例1について、図4A及び図4Bを参照して説明する。図4Aは対象者200が1人の場合を示し、図4Bは対象者200が複数(図4Bでは2人)の場合を示している。図4A及び図4Bでは、音取得制御システム7を構成するインターホン装置2が共用玄関102の壁面W1に取り付けられている。
(3.1)動作例1
本実施形態に係る音取得制御システム7の動作例1について、図4A及び図4Bを参照して説明する。図4Aは対象者200が1人の場合を示し、図4Bは対象者200が複数(図4Bでは2人)の場合を示している。図4A及び図4Bでは、音取得制御システム7を構成するインターホン装置2が共用玄関102の壁面W1に取り付けられている。
図4Aに示すように、対象者200が1人であり、かつ対象者200がインターホン装置2の正面に位置している場合を想定する。この場合、制御部22は、画像I1における対象者200の顔210の位置に基づいて、音取得部23による音の取得方向D1を、対象者200が位置しているインターホン装置2の正面方向に制御する。言い換えると、制御部22は、対象者200の顔210の位置に基づいて、音取得部23による音の取得方向D1を制御する。具体的には、制御部22の方向制御部224は、顔検出部223の検出結果に基づいて、音取得部23による音の取得方向D1がインターホン装置2の正面方向となるように、音取得部23の各マイクロホンから入力される音のゲインを調整する。この場合において、制御部22は、インターホン装置2から対象者200の顔210までの距離L1に基づいて、音取得部23が取得する音のゲインを制御することが好ましい。例えば、距離L1が短い場合には、対象者200から音取得部23までの距離も短くなるため、制御部22は、音取得部23が取得する音のゲインを小さくする。また、距離L1が長い場合には、対象者200から音取得部23までの距離も長くなるため、音取得部23が取得する音のゲインを大きくする。これにより、インターホン装置2から対象者200までの距離L1の長さにかかわらず、ほぼ一定の大きさの音声(音)を取得することができる。また、インターホン装置2から対象者200までの距離L1が長い場合でも、音取得部23が取得する音のゲインを大きくすることで、対象者200からの音声(音)を確実に取得することができる。
図4Bに示すように、対象者200が複数であり、かつ複数の対象者200がインターホン装置2の左寄りに位置している場合を想定する。この場合、制御部22は、画像I1における対象者201の顔211の位置、及び対象者202の顔212の位置に基づいて、領域R1の中心方向に取得方向D1を制御する。つまり、制御部22は、画像I1における複数の対象者201,202の顔211,212の位置から求められる代表方向(ここでは領域R1の中心方向)に取得方向D1を制御する。領域R1は、対象者201の顔211及び対象者202の顔212の両方を含む領域である。具体的には、制御部22の方向制御部224は、顔検出部223の検出結果に基づいて、音取得部23による音の取得方向D1が領域R1の中心方向となるように、音取得部23の各マイクロホンから入力される音のゲインを調整する。このように、複数の対象者201,202の顔211,212を含む領域R1の中心方向に取得方向D1を制御することで、複数の対象者201,202の音声(音)をより確実に取得することができる。
ここで、図4Bに示す例では、領域R1の中心方向は、鉛直方向(紙面に垂直な方向)から見たときの領域R1を2等分する方向である。また、本開示でいう「代表方向」は、画像I1における複数の顔210の位置から求められる方向であり、領域R1の中心方向は一例である。例えば、複数の対象者200のうち1人の対象者200が発話している場合には、この対象者200の方向を代表方向としてもよい。つまり、制御部22は、画像I1における複数の顔210のうち口元が動いている顔210の方向に取得方向D1を制御してもよい。この場合において、制御部22は、画像I1における複数の顔210のうち、インターホン装置2の提示部20(表示部25)がメッセージを提示した後に口元が動いている顔210の方向に取得方向D1を制御してもよい。これらの構成によれば、音取得部23による音の取得方向D1を、発話している対象者200の方向に向けることができるので、対象者200の音声(音)をより確実に取得することができる。
動作例1に係る音取得制御システム7では、制御部22は、図4A及び図4Bに示すように、音取得部23による音の取得方向D1を水平方向(左右方向)に制御することができる。言い換えると、制御部22は、水平方向に取得方向D1を制御することができる。例えば、発話中の対象者200の位置を音声だけで推定する場合には、マイクロホンの数が多い方が推定精度を高めることができる。これに対して、動作例1に係る音取得制御システム7では、発話中の対象者200の位置を画像I1から推定できるので、マイクロホンの数が少なくても取得方向(収音方向)D1を制御することができる。また、例えば、インターホン装置2の左右方向から騒音が発生している場合に、騒音に対する音声レベルを向上させることもできる。
ところで、制御部22は、画像I1における対象者200の顔210の大きさ、位置、及び個数の少なくとも1つに基づいて、音取得部23による音の取得範囲(図4Bでは領域R1)を変更することが好ましい。
まず、画像I1における対象者200の顔210の個数に基づいて、音取得部23による音の取得範囲を設定する場合を想定する。例えば、対象者200が2人の場合、制御部22は、2人の対象者200の顔210が音の取得範囲に含まれるように、音取得部23による音の取得範囲を設定する。図4Bに示す例では、取得範囲は領域R1に設定される。一方、対象者200が1人の場合、制御部22は、1人の対象者200の顔210が含まれるように取得範囲を設定する。この場合、取得範囲に含まれる顔210が1つであることから、対象者200が2人の場合に比べて取得範囲が小さくなる。
また、画像I1における顔210の大きさに基づいて、音取得部23による音の取得範囲を設定する場合を想定する。この場合、画像I1における顔210の大きさが大きくなるほどインターホン装置2に近づいていることになるため、制御部22は取得範囲を小さくする。一方、画像I1における顔210の大きさが小さくなるほどインターホン装置2から離れていることになるため、制御部22は取得範囲を大きくする。
また、画像I1における顔210の位置に基づいて、音取得部23による音の取得範囲を設定する場合を想定する。この場合、画像I1における中央寄りの位置に顔210があればインターホン装置2に近づいていることになるため、制御部22は取得範囲を小さくする。一方、画像I1における外縁寄りの位置に顔210があればインターホン装置2から離れていることになるため、制御部22は取得範囲を大きくする。
(3.2)動作例2
本実施形態に係る音取得制御システム7の動作例2について、図5A及び図5Bを参照して説明する。図5Aはインターホン装置2が共用玄関102の壁面W1に取り付けられている場合を示し、図5Bはインターホン装置2が共用玄関102に設けられた取付台8の取付面M1に取り付けられている場合を示している。図5A及び図5Bでは、対象者200が1人であるが、対象者200は複数であってもよい。
本実施形態に係る音取得制御システム7の動作例2について、図5A及び図5Bを参照して説明する。図5Aはインターホン装置2が共用玄関102の壁面W1に取り付けられている場合を示し、図5Bはインターホン装置2が共用玄関102に設けられた取付台8の取付面M1に取り付けられている場合を示している。図5A及び図5Bでは、対象者200が1人であるが、対象者200は複数であってもよい。
図5Aに示す例では、制御部22は、画像I1における対象者200の顔210の位置に基づいて、音取得部23による音の取得方向D1を、インターホン装置2の正面に位置する対象者200の方向に制御する。具体的には、制御部22の方向制御部224は、顔検出部223の検出結果に基づいて、音取得部23による音の取得方向D1が対象者200の正面方向となるように、音取得部23の各マイクロホンから入力される音のゲインを調整する。
図5Bに示す例では、制御部22は、画像I1における対象者200の顔210の位置に基づいて、音取得部23による音の取得方向D1を対象者200の正面方向に制御する。具体的には、制御部22の方向制御部224は、顔検出部223の検出結果に基づいて、音取得部23による音の取得方向D1が対象者200の正面方向となるように、音取得部23の各マイクロホンから入力される音のゲインを調整する。ここで、図5Bに示す例では、インターホン装置2が取り付けられる取付台8の取付面M1は、水平面(地表面)に対して傾斜角度θ1だけ傾斜している。そのため、各マイクロホンから入力される音のゲインを、図5Aと同様に調整した場合には、音取得部23による音の取得方向D1は、インターホン装置2の撮像部28の撮像方向P1と平行な方向になる。そこで、方向制御部224は、取得方向D1が撮像部28の撮像方向P1に対して角度θ2だけ下側を向くように、各マイクロホンから入力される音のゲインを調整する。なお、角度θ2は、90度から傾斜角度θ1を引いた値である。
この場合において、例えば、傾斜角度θ1が10度よりも小さければ、制御部22は、傾斜角度θ1を考慮しないで、画像I1における対象者200の顔210の位置のみに基づいて取得方向D1を制御する。一方、傾斜角度θ1が10度を超えていれば、制御部22は、傾斜角度θ1と、画像I1における対象者200の顔210の位置とに基づいて取得方向D1を制御する。
動作例2に係る音取得制御システム7では、制御部22は、図5A及び図5Bに示すように、音取得部23による音の取得方向D1を鉛直方向(上下方向)に制御することができる。言い換えると、制御部22は、鉛直方向に取得方向D1を制御することができる。例えば、発話中の対象者200の位置を音声だけで推定する場合には、マイクロホンの数が多い方が推定精度を高めることができる。これに対して、動作例2に係る音取得制御システム7では、発話中の対象者200の位置を画像I1から推定できるので、マイクロホンの数が少なくても取得方向(収音方向)D1を制御することができる。また、例えば、インターホン装置2の上下方向から騒音が発生している場合に、騒音に対する音声レベルを向上させることもできる。
ところで、図5Bに示す例では、インターホン装置2は、水平面(地表面)に対する傾斜角度がθ1である取付面M1に取り付けられている。そして、方向制御部224は、水平面に対する取付面M1の傾斜角度θ1と、画像I1における顔210の位置とに基づいて、各マイクロホンからの音のゲインを調整している。この場合において、制御部22は、インターホン装置2が取り付けられる取付面M1の傾斜角度θ1の代わりに、撮像部28の撮像方向P1を用いてもよい。言い換えると、制御部22は、インターホン装置2が取り付けられる取付面M1の傾斜角度θ1、及びインターホン装置2の撮像部28の撮像方向P1の少なくとも一方と顔210の位置とに基づいて取得方向D1を制御すればよい。撮像部28の撮像方向P1を用いた場合、方向制御部224は、取得方向D1が撮像方向P1に対して角度θ2だけ下側を向くように、各マイクロホンから入力される音のゲインを調整する。
ところで、制御部22は、ユーザ(例えば、住人等)が情報端末1の操作部17を操作することにより、音取得部23による音の取得方向D1を変更するように構成されていてもよい。この構成によれば、例えば、顔検出部223が顔210を誤検出し、対象者200の音声(音)が十分に聞き取れない場合に、取得方向D1を変更することにより対象者200の音声を聞き取りやすくすることができる。
(3.3)全体動作
次に、音取得制御システム7の全体動作について、図6を参照して説明する。
次に、音取得制御システム7の全体動作について、図6を参照して説明する。
撮像部28は、インターホン装置2の正面に位置している対象者200を撮像する(第1ステップS1)。制御部22の顔検出部223は、撮像部28が撮像した画像I1から対象者201,202の顔211,212を検出する(第2ステップS2)。また、顔検出部223は、画像I1における顔211,212の位置データを検出する(第3ステップS3)。そして、制御部22の方向制御部224は、顔検出部223の検出結果である、画像I1における顔211,212の位置データに基づいて、各マイクロホンから入力される音のゲインを調整する(第4ステップS4)。これにより、制御部22は、音取得部23による音の取得方向D1を制御することができる。本実施形態では、第4ステップS4が制御ステップである。
(4)変形例
上述の実施形態は、本開示の様々な実施形態の一つに過ぎない。上述の実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。また、音取得制御システム7と同様の機能は、音取得制御方法、コンピュータプログラム、又はコンピュータプログラムを記録した非一時的記録媒体等で具現化されてもよい。
上述の実施形態は、本開示の様々な実施形態の一つに過ぎない。上述の実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。また、音取得制御システム7と同様の機能は、音取得制御方法、コンピュータプログラム、又はコンピュータプログラムを記録した非一時的記録媒体等で具現化されてもよい。
一態様に係る音取得制御方法は、制御ステップ(第4ステップS4)を含む。制御ステップは、対象者200の顔210の位置に基づいて、音を取得する音取得部23を有するインターホン装置2の音取得部23による音の取得方向D1を制御するステップである。一態様に係るプログラムは、上述の音取得制御方法を1以上のプロセッサに実行させるためのプログラムである。
以下、上述の実施形態の変形例を列挙する。以下に説明する変形例は、適宜組み合わせて適用可能である。
本開示における音取得制御システム7は、例えば、制御部22に、コンピュータシステムを含んでいる。コンピュータシステムは、ハードウェアとしてのプロセッサ及びメモリを主構成とする。コンピュータシステムのメモリに記録されたプログラムをプロセッサが実行することによって、本開示における音取得制御システム7としての機能が実現される。プログラムは、コンピュータシステムのメモリに予め記録されてもよく、電気通信回線を通じて提供されてもよく、コンピュータシステムで読み取り可能なメモリカード、光学ディスク、ハードディスクドライブ等の非一時的記録媒体に記録されて提供されてもよい。コンピュータシステムのプロセッサは、半導体集積回路(IC)又は大規模集積回路(LSI)を含む1ないし複数の電子回路で構成される。ここでいうIC又はLSI等の集積回路は、集積の度合いによって呼び方が異なっており、システムLSI、VLSI(Very Large Scale Integration)、又はULSI(UltraLarge Scale Integration)と呼ばれる集積回路を含む。さらに、LSIの製造後にプログラムされる、FPGA(Field-Programmable Gate Array)、又はLSI内部の接合関係の再構成若しくはLSI内部の回路区画の再構成が可能な論理デバイスについても、プロセッサとして採用することができる。複数の電子回路は、1つのチップに集約されていてもよいし、複数のチップに分散して設けられていてもよい。複数のチップは、1つの装置に集約されていてもよいし、複数の装置に分散して設けられていてもよい。ここでいうコンピュータシステムは、1以上のプロセッサ及び1以上のメモリを有するマイクロコントローラを含む。したがって、マイクロコントローラについても、半導体集積回路又は大規模集積回路を含む1ないし複数の電子回路で構成される。
また、音取得制御システム7の複数の構成要素が、1つの筐体内に集約されていることは音取得制御システム7に必須の構成ではなく、音取得制御システム7の構成要素は、複数の筐体に分散して設けられていてもよい。さらに、音取得制御システム7の少なくとも一部の機能(例えば、制御部22)がクラウド(クラウドコンピューティング)等によって実現されてもよい。
(4.1)変形例1
以下、変形例1に係る音取得制御システム7について、図7及び図8を参照して説明する。変形例1に係る音取得制御システム7では、制御部22Aが抑制部225を有している点で上述の実施形態に係る音取得制御システム7と異なっている。なお、それ以外の構成については上述の実施形態に係る音取得制御システム7と同様であり、同一の構成要素には同一の符号を付して説明を省略する。
以下、変形例1に係る音取得制御システム7について、図7及び図8を参照して説明する。変形例1に係る音取得制御システム7では、制御部22Aが抑制部225を有している点で上述の実施形態に係る音取得制御システム7と異なっている。なお、それ以外の構成については上述の実施形態に係る音取得制御システム7と同様であり、同一の構成要素には同一の符号を付して説明を省略する。
変形例1に係る音取得制御システム7は、通信部21と、制御部22Aと、音取得部23と、通話部24と、表示部25(提示部20)と、操作部26と、記憶部27と、撮像部28と、を備えている。制御部22Aは、図7に示すように、音声処理部221、映像処理部222、顔検出部223、及び方向制御部224の他、抑制部225を有している。
抑制部225は、画像I1における顔210の位置に基づいて設定された取得方向D1以外の方向から音取得部23が取得した音を抑制するように構成されている。具体的には、抑制部225は、取得方向D1から音取得部23が取得した音に比べて、取得方向D1以外の方向から音取得部23が取得した音のゲインを小さくする。これにより、取得方向D1以外の方向から音取得部23が取得した音を抑制することができる。
例えば、図8に示すように、共用玄関102の壁面W1に取り付けられているインターホン装置2の正面に対象者200が位置している場合を想定する。また、例えば、音取得部23が3つのマイクロホン(第1マイクロホン、第2マイクロホン、第3マイクロホン)を有している場合を想定する。第1マイクロホンは、取得方向D1の方向に指向性を有するマイクロホンである。第2マイクロホンは、領域R2の方向に指向性を有するマイクロホンである。第3マイクロホンは、領域R3の方向に指向性を有するマイクロホンである。
この場合、制御部22は、音取得部23による音の取得方向D1をインターホン装置2の正面方向に制御する。また、制御部22の抑制部225は、取得方向D1以外の方向を含む領域R2,R3から音取得部23が取得する音を抑制する。具体的には、制御部22は、第1マイクロホンのゲインに対して第2マイクロホン及び第3マイクロホンのゲインを小さくする。これにより、領域R2,R3からの音について抑制することができる。このように、取得方向D1以外の方向からの不要な音を抑制することで、取得方向D1からの音声の音声レベルを相対的に向上させることができ、これにより情報端末1側では対象者200の音声が聞き取りやすくなる。
(4.2)その他の変形例
以下、その他の変形例を列挙する。
以下、その他の変形例を列挙する。
音取得部23は、例えば、ビームフォーミングによって音の取得方向D1を変更するように構成されていてもよい。また、音取得部23は、複数のマイクロホンのうち、選択するマイクロホンを切り替えることによって音の取得方向D1を変更するように構成されていてもよい。さらに、音取得部23は、マイクロホンの向きを切り替えることによって音の取得方向D1を変更するように構成されていてもよい。
また、音取得部23は、音の取得方向D1を連続的に変更するように構成されていてもよいし、段階的に変更するように構成されていてもよい。
上述の実施形態では、制御部22がインターホン装置2に含まれているが、制御部22は音取得制御システム7に含まれていればよく、インターホン装置2に含まれていなくてもよい。つまり、音取得制御システム7は、インターホン装置2で構成されていなくてもよい。
上述の実施形態では、音取得部23が2つのマイクロホン(第1マイクロホン231、第2マイクロホン232)を有しているが、音取得部23は3つ以上のマイクロホンを有していてもよい。これにより、音取得部23による音の取得方向D1の調整範囲を拡げることができると共に、取得方向D1をより細かく調整することができる。
上述の実施形態では、インターホン装置2がロビーインターホンであるが、インターホン装置2はロビーインターホンに限らず、例えば、住戸端末(親機)であってもよい。この場合、住戸端末には、内蔵のカメラ、又は外付けのカメラが設けられていてもよい。さらに、インターホン装置2は、例えば、ドアホンであってもよいし、管理室親機が設けられている場合には管理室親機であってもよい。インターホン装置2が管理室親機の場合、管理室親機には、内蔵のカメラ、又は外付けのカメラが設けられていてもよい。
(まとめ)
以上説明したように、第1の態様に係る音取得制御システム(7)は、制御部(22;22A)を備える。制御部(22;22A)は、対象者(200)の顔(210)の位置に基づいて、音を取得する音取得部(23)を有するインターホン装置(2)の音取得部(23)による音の取得方向(D1)を制御する。
以上説明したように、第1の態様に係る音取得制御システム(7)は、制御部(22;22A)を備える。制御部(22;22A)は、対象者(200)の顔(210)の位置に基づいて、音を取得する音取得部(23)を有するインターホン装置(2)の音取得部(23)による音の取得方向(D1)を制御する。
この態様によれば、対象者(200)の顔(210)の位置に基づいて音取得部(23)による音の取得方向(D1)を変更しているので、インターホン装置(2)に対する対象者(200)の位置にかかわらず対象者(200)の音声を取得することができる。
第2の態様に係る音取得制御システム(7)では、第1の態様において、制御部(22;22A)は、インターホン装置(2)の撮像部(28)が撮像した画像(I1)における顔(210)の位置に基づいて取得方向(D1)を制御する。
この態様によれば、撮像部(28)が撮像した画像(I1)に基づいて、音取得部(23)による音の取得方向(D1)を制御することができる。
第3の態様に係る音取得制御システム(7)では、第1又は2の態様において、制御部(22;22A)は、水平方向(左右方向)に取得方向(D1)を制御する。
この態様によれば、音取得部(23)による音の取得方向(D1)を水平方向に制御することができる。
第4の態様に係る音取得制御システム(7)では、第1〜3のいずれかの態様において、制御部(22;22A)は、鉛直方向(上下方向)に取得方向(D1)を制御する。
この態様によれば、音取得部(23)による音の取得方向(D1)を鉛直方向に制御することができる。
第5の態様に係る音取得制御システム(7)では、第1〜4のいずれかの態様において、制御部(22;22A)は、インターホン装置(2)が取り付けられる取付面(M1)の傾斜角度(θ1)、及びインターホン装置(2)の撮像部(28)の撮像方向(P1)の少なくとも一方と顔(210)の位置とに基づいて取得方向(D1)を制御する。
この態様によれば、インターホン装置(2)が斜めに取り付けられている場合でも、対象者(200)がいる方向に取得方向(D1)を制御することができる。
第6の態様に係る音取得制御システム(7)では、第1〜5のいずれかの態様において、制御部(22;22A)は、インターホン装置(2)の撮像部(28)が撮像した画像(I1)に複数の対象者(200)の顔(210)が含まれている場合に、複数の顔(210)のうち少なくとも1つの顔(210)の位置に基づいて取得方向(D1)を制御する。
この態様によれば、複数の対象者(200)がいる場合でも、複数の対象者(200)がいる方向に取得方向(D1)を制御することができる。
第7の態様に係る音取得制御システム(7)では、第6の態様において、制御部(22;22A)は、画像(I1)における複数の顔(210)の位置から求められる代表方向に取得方向(D1)を制御する。
この態様によれば、複数の対象者(200)の音声(音)を確実に取得することができる。
第8の態様に係る音取得制御システム(7)では、第6の態様において、制御部(22;22A)は、画像(I1)における複数の顔(210)のうち口元が動いている顔(210)の方向に取得方向(D1)を制御する。
この態様によれば、発話中の対象者(200)の方向に取得方向(D1)を制御することで、対象者(200)の音声(音)を確実に取得することができる。
第9の態様に係る音取得制御システム(7)では、第8の態様において、制御部(22;22A)は、画像(I1)における複数の顔(210)のうちインターホン装置(2)の提示部(20)がメッセージを提示した後に口元が動いている顔(210)の方向に取得方向(D1)を制御する。
この態様によれば、発話中の対象者(200)の方向に取得方向(D1)を制御することで、対象者(200)の音声(音)を確実に取得することができる。
第10の態様に係る音取得制御システム(7)では、第1〜9のいずれかの態様において、制御部(22;22A)は、インターホン装置(2)から顔(210)までの距離(L1)に基づいて、音取得部(23)が取得する音のゲインを制御する。
この態様によれば、インターホン装置(2)から離れた場所にいる対象者(200)の音声についても音声レベルを向上させることができる。
第11の態様に係る音取得制御システム(7)では、第1〜10のいずれかの態様において、制御部(22A)は、顔(210)の位置に基づいた取得方向(D1)以外の方向から音取得部(23)が取得した音を抑制する。
この態様によれば、取得方向(D1)以外の方向からの不要な音を抑制することで、取得方向(D1)からの音声の音声レベルを相対的に向上させることができる。
第12の態様に係る音取得制御システム(7)では、第1〜11のいずれかの態様において、制御部(22)は、インターホン装置(2)と通信可能な情報端末(1)が受け付けた操作情報に基づいて取得方向(D1)を変更する。
この態様によれば、対象者(200)の顔(210)の位置を誤検出した場合に、音取得部(23)による音の取得方向(D1)を変更することができる。
第13の態様に係る音取得制御システム(7)では、第1〜12のいずれかの態様において、制御部(22;22A)は、取得方向(D1)をリアルタイムに制御する。
この態様によれば、音取得部(23)による音の取得方向(D1)をリアルタイムに制御することができる。
第14の態様に係る音取得制御システム(7)では、第1〜13のいずれかの態様において、制御部(22;22A)は、インターホン装置(2)の撮像部(28)が撮像した画像(I1)における顔(210)の大きさ、位置、及び個数の少なくとも1つに基づいて音の取得範囲(R1)を変更する。
この態様によれば、画像(I1)における顔(210)の位置等に基づいて音取得部(23)による音の取得範囲(R1)を自動的に変更することができる。
第15の態様に係る情報端末(1)は、第1〜14のいずれかの態様に係る音取得制御システム(7)におけるインターホン装置(2)と通信可能な情報端末(1)である。情報端末(1)は、取得方向(D1)に関する情報を提示する提示部(20)を備える。
この態様によれば、取得方向(D1)に関する情報を提示部(20)に提示することで、所望の音声が聞き取れているかを情報端末(1)の利用者に知らせることができる。
第16の態様に係る音取得制御方法は、制御ステップ(第4ステップS4)を含む。制御ステップは、対象者(200)の顔(210)の位置に基づいて、音を取得する音取得部(23)を有するインターホン装置(2)の音取得部(23)による音の取得方向(D1)を制御するステップである。
この態様によれば、対象者(200)の顔(210)の位置に基づいて音取得部(23)による音の取得方向(D1)を変更しているので、インターホン装置(2)に対する対象者(200)の位置にかかわらず対象者(200)の音声を取得することができる。
第17の態様に係るプログラムは、第16の態様に係る音取得制御方法を1以上のプロセッサに実行させるためのプログラムである。
この態様によれば、対象者(200)の顔(210)の位置に基づいて音取得部(23)による音の取得方向(D1)を変更しているので、インターホン装置(2)に対する対象者(200)の位置にかかわらず対象者(200)の音声を取得することができる。
第2〜14の態様に係る構成については、音取得制御システム(7)に必須の構成ではなく、適宜省略可能である。
1 情報端末
2 インターホン装置
20 提示部
22,22A 制御部
23 音取得部
28 撮像部
7 音取得制御システム
200 対象者
210 顔
D1 取得方向
I1 画像
L1 距離
M1 取付面
P1 撮像方向
R1 領域(取得範囲)
S4 第4ステップ(制御ステップ)
θ1 傾斜角度
2 インターホン装置
20 提示部
22,22A 制御部
23 音取得部
28 撮像部
7 音取得制御システム
200 対象者
210 顔
D1 取得方向
I1 画像
L1 距離
M1 取付面
P1 撮像方向
R1 領域(取得範囲)
S4 第4ステップ(制御ステップ)
θ1 傾斜角度
Claims (17)
- 対象者の顔の位置に基づいて、音を取得する音取得部を有するインターホン装置の前記音取得部による前記音の取得方向を制御する制御部を備える、
音取得制御システム。 - 前記制御部は、前記インターホン装置の撮像部が撮像した画像における前記顔の位置に基づいて前記取得方向を制御する、
請求項1に記載の音取得制御システム。 - 前記制御部は、水平方向に前記取得方向を制御する、
請求項1又は2に記載の音取得制御システム。 - 前記制御部は、鉛直方向に前記取得方向を制御する、
請求項1〜3のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記インターホン装置が取り付けられる取付面の傾斜角度、及び前記インターホン装置の撮像部の撮像方向の少なくとも一方と前記顔の位置とに基づいて前記取得方向を制御する、
請求項1〜4のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記インターホン装置の撮像部が撮像した画像に複数の前記対象者の前記顔が含まれている場合に、前記複数の顔のうち少なくとも1つの顔の位置に基づいて前記取得方向を制御する、
請求項1〜5のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記画像における前記複数の顔の位置から求められる代表方向に前記取得方向を制御する、
請求項6に記載の音取得制御システム。 - 前記制御部は、前記画像における前記複数の顔のうち口元が動いている顔の方向に前記取得方向を制御する、
請求項6に記載の音取得制御システム。 - 前記制御部は、前記画像における前記複数の顔のうち前記インターホン装置の提示部がメッセージを提示した後に口元が動いている顔の方向に前記取得方向を制御する、
請求項8に記載の音取得制御システム。 - 前記制御部は、前記インターホン装置から前記顔までの距離に基づいて、前記音取得部が取得する音のゲインを制御する、
請求項1〜9のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記顔の位置に基づいた前記取得方向以外の方向から前記音取得部が取得した音を抑制する、
請求項1〜10のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記インターホン装置と通信可能な情報端末が受け付けた操作情報に基づいて前記取得方向を変更する、
請求項1〜11のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記取得方向をリアルタイムに制御する、
請求項1〜12のいずれか1項に記載の音取得制御システム。 - 前記制御部は、前記インターホン装置の撮像部が撮像した画像における前記顔の大きさ、位置、及び個数の少なくとも1つに基づいて前記音の取得範囲を変更する、
請求項1〜13のいずれか1項に記載の音取得制御システム。 - 請求項1〜14のいずれか1項に記載の音取得制御システムにおける前記インターホン装置と通信可能な情報端末であって、
前記取得方向に関する情報を提示する提示部を備える、
情報端末。 - 対象者の顔の位置に基づいて、音を取得する音取得部を有するインターホン装置の前記音取得部による前記音の取得方向を制御する制御ステップを含む、
音取得制御方法。 - 請求項16に記載の音取得制御方法を1以上のプロセッサに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019086734A JP2020184656A (ja) | 2019-04-26 | 2019-04-26 | 音取得制御システム、情報端末、音取得制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019086734A JP2020184656A (ja) | 2019-04-26 | 2019-04-26 | 音取得制御システム、情報端末、音取得制御方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020184656A true JP2020184656A (ja) | 2020-11-12 |
Family
ID=73044901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019086734A Pending JP2020184656A (ja) | 2019-04-26 | 2019-04-26 | 音取得制御システム、情報端末、音取得制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020184656A (ja) |
-
2019
- 2019-04-26 JP JP2019086734A patent/JP2020184656A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7133789B2 (ja) | 収音装置、収音システム、収音方法、プログラム、及びキャリブレーション方法 | |
US10306142B2 (en) | Headset | |
JP2019220848A (ja) | データ処理装置、データ処理方法及びプログラム | |
CN112995566A (zh) | 基于显示设备的声源定位方法、显示设备及存储介质 | |
WO2015198964A1 (ja) | 音声入出力機能付き撮像装置およびテレビ会議システム | |
JP2011087218A (ja) | 拡声システム | |
JP7095356B2 (ja) | 通信端末及び会議システム | |
JP2020184656A (ja) | 音取得制御システム、情報端末、音取得制御方法、及びプログラム | |
JP6071054B2 (ja) | 通信装置、及び音声入出力ユニットの制御方法 | |
US20230199380A1 (en) | Virtual space connection device | |
TWI788548B (zh) | 對講機裝置、對講機系統、資訊終端、處理方法及程式 | |
JP2011055103A (ja) | 集合住宅インターホンシステム | |
TWI762727B (zh) | 對講機裝置及對講機系統 | |
JP7390582B2 (ja) | 通話システム、制御方法及びプログラム | |
TWI818035B (zh) | 對講機門站、對講機系統、控制方法及程式 | |
JP2021141572A (ja) | 情報端末、インターホンシステム、処理方法及びプログラム | |
JP7361460B2 (ja) | コミュニケーション装置、コミュニケーションプログラム、及びコミュニケーション方法 | |
JP2021002729A (ja) | インターホンシステム、制御方法及びプログラム | |
TWI794478B (zh) | 呼叫裝置、資訊終端、資訊終端之控制方法及程式 | |
JP7308445B2 (ja) | 画像処理システム、画像処理方法及びプログラム | |
TW202308366A (zh) | 資訊終端、對講機系統及程式 | |
CN115334413B (zh) | 语音信号处理方法、系统、装置及电子设备 | |
EP4297398A1 (en) | Video recording method and electronic devices | |
JP2021140114A (ja) | 情報端末、インターホンシステム、処理方法及びプログラム | |
JP2024072182A (ja) | 情報端末、インターホンシステム、制御方法及びプログラム |