JP2023123165A - intercom device - Google Patents
intercom device Download PDFInfo
- Publication number
- JP2023123165A JP2023123165A JP2022027069A JP2022027069A JP2023123165A JP 2023123165 A JP2023123165 A JP 2023123165A JP 2022027069 A JP2022027069 A JP 2022027069A JP 2022027069 A JP2022027069 A JP 2022027069A JP 2023123165 A JP2023123165 A JP 2023123165A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- visitor
- voice
- response voice
- resident
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000004044 response Effects 0.000 claims abstract description 99
- 238000003384 imaging method Methods 0.000 claims abstract description 29
- 238000001454 recorded image Methods 0.000 claims description 17
- 230000015654 memory Effects 0.000 description 25
- 238000004891 communication Methods 0.000 description 22
- 238000000034 method Methods 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000003825 pressing Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
Images
Abstract
Description
本開示は、インターホン装置に関する。 The present disclosure relates to an intercom device.
住居外に設置されたインターホン子機を利用して居住者を呼び出すための呼出操作を行う訪問者をカメラにより撮像した撮像画像に基づいて訪問者の認証を行うインターホン装置が知られている。 2. Description of the Related Art There is known an intercom device that authenticates a visitor based on a captured image captured by a camera of a visitor performing a calling operation for calling a resident using an intercom handset installed outside the residence.
特許文献1には、呼出操作を受けて居住者の応答が無く一定時間が経過したら、親機CPUは特別動作モードに移行して玄関子機に設けられたカメラの撮像画像により訪問者の認証を行い、訪問者を認証したら玄関子機とハンディ親機との間の通話路を形成し、その後応答無く更に一定時間が経過したら電気錠を解錠するインターホン装置が開示されている。特許文献1に記載の技術によれば、訪問者が福祉関係者の場合、玄関子機から呼出操作をした際に居住者の応答操作が無くても通話を可能とし、更に玄関の電気錠の解錠も可能として、居住者の家族等の対応を待つことなく素早い対応を可能とする。
In
また、特許文献2には、インターホンシステムは、第1管理領域に設けられたインターホン親機と、第2管理領域に設けられたインターホン子機と、信号出力部とを備えるインターホンシステム、制御方法、及びプログラムが開示されている。信号出力部は、第1管理領域と第2管理領域とを隔てる開閉部材を解錠するための解錠信号を出力する。インターホン親機は、親機側表示部と録画部との少なくとも一方を有する。親機側表示部は、第1映像と第2映像との少なくとも一方を表示し、録画部は、第1映像と第2映像との少なくとも一方を録画する。インターホン親機は、信号出力部が解錠信号を出力した場合に、延長期間において親機側表示部による表示と録画部による録画との少なくとも一方を行う。特許文献2に記載の技術によれば、第2管理領域の監視を強化することができる。 Further, in Patent Document 2, an interphone system includes an interphone base unit provided in a first management area, an interphone slave unit provided in a second management area, and a signal output unit, a control method, and a program are disclosed. The signal output unit outputs an unlock signal for unlocking the opening/closing member that separates the first management area and the second management area. The interphone base unit has at least one of a base unit side display unit and a recording unit. The master-side display unit displays at least one of the first image and the second image, and the recording unit records at least one of the first image and the second image. When the signal output unit outputs the unlocking signal, the intercom master unit performs at least one of display by the master unit side display unit and recording by the recording unit during the extension period. According to the technology described in Patent Literature 2, it is possible to strengthen the monitoring of the second management area.
しかしながら、特許文献1に記載の技術では、訪問者が予め登録されている場合に、居住者の応答がなくても通話を可能とするものであるため、訪問者が不審者である場合の対応について開示されていない。
However, in the technique described in
特許文献2に記載の技術では、顔認証結果により、撮像した映像を録画することが記載されているが、訪問者が居住者の知り合いではない人物である場合や顔が映像に写らないような行動をとる不審者である場合の対応について開示されていない。 In the technique described in Patent Document 2, it is described that the captured video is recorded based on the result of face authentication. It does not disclose how to deal with a suspicious person who takes action.
したがって、これらの技術では、訪問者が予め登録されていない人物(知り合いではない人物や不審者)である場合に、居住者が発した音声を聞かれることにより、性別等についての居住者の個人情報を推測されてしまう虞や、居住者が在宅していることを知られてしまう虞があるというセキュリティ上の問題があった。 Therefore, with these technologies, if the visitor is a person who is not registered in advance (a person who is not an acquaintance or a suspicious person), by listening to the voice uttered by the resident, it is possible to identify the resident's individual such as gender. There is a security problem that the information may be guessed and the fact that the resident is at home may be known.
本開示は、このような問題を解決するためになされたものであり、居住者のプライバシーやセキュリティを確保可能なインターホン装置を提供することを目的とするものである。 The present disclosure has been made to solve such problems, and aims to provide an intercom device capable of ensuring the privacy and security of residents.
一実施の形態にかかるインターホン装置は、訪問者が利用するインターホン子機を備えたインターホン装置であって、訪問者を撮像する撮像部が撮像した撮像画像を取得する画像取得部と、画像取得部により取得された撮像画像に基づいて、訪問者を認識できたか、及び、訪問者が予め登録された登録者であるか、の少なくとも一方を判定する判定部と、判定部の判定結果に応じてインターホン子機の子機側音声出力部から出力する応答音声を選択し、選択した応答音声を子機側音声出力部に出力する応答音声選択部と、を有する。 An intercom device according to one embodiment is an intercom device that includes an intercom slave unit used by a visitor, and includes an image acquisition unit that acquires an image captured by an imaging unit that captures an image of the visitor, and an image acquisition unit. a determination unit that determines at least one of whether the visitor has been recognized and whether the visitor is a pre-registered registrant based on the captured image acquired by; a response voice selector that selects a response voice to be output from the slave unit side voice output unit of the intercom slave unit and outputs the selected response voice to the slave unit side voice output unit.
本開示により、居住者のプライバシーやセキュリティを確保可能なインターホン装置を提供することができる。 According to the present disclosure, it is possible to provide an intercom device that can ensure the privacy and security of residents.
実施の形態1
以下、図面を参照して本実施の形態について説明する。また、説明を明確にするため、以下の記載及び図面は、適宜、簡略化されている。図中に示したものは、全体の一部であり、図示しないその他の構成が実際には多く含まれる。さらに、以下の説明において同一又は同等の要素には、同一の符号を付し、重複する説明は省略する。
Hereinafter, this embodiment will be described with reference to the drawings. Also, for clarity of explanation, the following description and drawings are simplified as appropriate. What is shown in the drawing is a part of the whole, and actually includes many other configurations not shown. Furthermore, in the following description, the same or equivalent elements are denoted by the same reference numerals, and overlapping descriptions are omitted.
本実施形態にかかるインターホン装置の好適な実施形態の一つとして、戸建住宅に適用されるインターホン装置1に具体化して説明する。なお、インターホン装置1は、戸建住宅以外に、マンション等の集合住宅に適用してもよく、非住宅施設等に適用してもよい。
As one preferred embodiment of the intercom device according to the present embodiment, an
まず、図1を参照して、インターホン装置1の構成を説明する。図1は、実施の形態1にかかるインターホン装置の構成を示すブロック図である。図1に示すように、インターホン装置1は、住居内の居室等に設置されるインターホン親機(以下、親機20)と、住居外の玄関等に設置されるインターホン子機(以下、子機10)と、を有している。親機20は、子機10からの呼び出しに居住者が応答するため等に利用するユーザインタフェースである。子機10は、訪問者が居住者を呼び出して通話するため等に利用するユーザインタフェースである。
First, the configuration of the
親機20と子機10とは、互いに通信可能に構成されている。また、インターホン装置1は、1又は複数の子機10を備えていてもよい。インターホン装置1では、訪問者が子機10の呼出ボタンを押下した後、居住者が親機20の通話開始ボタンを押下して呼び出しに応答すると、通話路が形成されて親機20と子機10との間で通話が可能となる。
本実施形態にかかるインターホン装置1は、画像取得部32、判定部33、及び応答音声選択部34を含む応答音声制御装置30を有する。画像取得部32は、訪問者を撮像する撮像部11が撮像した撮像画像を取得する。判定部33は、画像取得部32により取得された撮像画像に基づいて、訪問者を認識できたか、及び、訪問者が予め登録された登録者であるか、の少なくとも一方を判定する。応答音声選択部34は、判定部33の判定結果に応じて子機10の子機側音声出力部14から出力する応答音声を選択し、選択した応答音声を子機側音声出力部14に出力する。
The
以下、応答音声制御装置30の機能が親機20と一体に構成されている場合を例示してインターホン装置1の詳細について説明する。ただし、応答音声制御装置30の機能は親機20及び子機10のそれぞれと独立した装置に設けられてもよく、複数の装置に分散して設けられてもよい。応答音声制御装置30の少なくとも一部の機能は、例えばクラウド(クラウドコンピューティング)等によって実現されてもよい。
Details of the
(子機10)
子機10は、撮像部11、子機側操作部12、子機側収音部13、子機側音声出力部14、子機側通信部15、及び子機側制御部16を有している。
(Handset 10)
The
撮像部11は、撮像エリアを撮像するためのカメラである。撮像部11は、CCD(Charge Coupled Devices)、又はCMOS(Complementary Metal-Oxide Semiconductor)等の撮像素子及びレンズ等の光学系を有している。撮像部11は、子機10を操作する訪問者の顔を撮像可能な位置に設けられている。撮像部11は、呼出中の撮像画像を生成する。呼出中とは、呼び出しの開始から終了までの期間であって、例えば訪問者より呼出ボタンが押下されてから所定の期間が経過するまでの期間に設定される。撮像部11は、撮像した撮像画像を画像信号として親機20又は応答音声制御装置30へ子機側通信部15を介して送信する。
The
また、本実施形態の撮像部11は、動画を撮像するカメラであるが、静止画を撮像するカメラであってもよい。さらに、本実施形態の撮像部11はカラー画像を撮像するカメラであるが、モノクローム画像を撮像するカメラであってもよい。なお、撮像部11は、子機10の筐体とは別体に設けられていてもよい。
Further, although the
子機側操作部12は、訪問者の入力操作を受け付ける。子機側操作部12は、呼出ボタンを含むボタン等の入力装置を有している。子機側操作部12は、訪問者は、子機側操作部12に含まれる呼出ボタンを押下することにより、居住者を呼び出すことができる。子機10は、訪問者による呼出ボタンの操作を受け付けると、住居内の居住者を呼び出すための呼出信号(制御信号)を子機側通信部15から親機20へ送信する。なお、子機側操作部12は、タッチパネルディスプレイにより構成されていてもよい。
The handset-
子機側収音部13は、マイクロホンを含む。子機側収音部13は、マイクロホンにより訪問者が発した音声を収音した音声を親機20に子機側通信部15を介して送信する。
The slave-side
子機側音声出力部14は、子機側通信部15を介して親機20から受信した音声信号又は応答音声制御装置30の出力音声に基づく応答音声をスピーカから出力する。子機側音声出力部14は、入力された音声信号をスピーカから出力する。
The handset-side
子機側通信部15は、親機20又は応答音声制御装置30との間で各種信号(映像信号、制御信号、音声信号等)を授受するために用いられる。子機側通信部15は、有線又は無線によって親機20又は応答音声制御装置30と電気的に接続され、親機20又は応答音声制御装置30との間で双方向に通信可能に構成されている。
The child device
子機側制御部16は、例えばプロセッサ及びメモリを主構成とするマイクロコンピュータで構成されている。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが子機側制御部16として機能する。これにより、撮像部11、子機側操作部12、子機側収音部13、子機側音声出力部14、及び子機側通信部15を制御する機能が実現される。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
The handset-
子機10は、訪問者による呼出ボタンの操作を受け付けると、撮像部11による撮像を開始するとともに、撮像部11が撮像した撮像画像を親機20又は応答音声制御装置30に送信する。また、居住者から通話のための操作(通話開始ボタンの操作)を受け付けた場合、子機10は、居住者が発した音声を親機20から受信して出力することにより、訪問者に対して居住者が発した音声を伝達する。また、居住者から通話のための操作を受け付けない場合、子機10は、応答音声制御装置30において選択された応答音声を出力することにより、訪問者に対して居住者側の応答音声(例えば音声メッセージ)を伝達する。
Upon receiving the operation of the call button by the visitor,
(親機20)
親機20は、表示部21、親機側操作部22、親機側収音部23、親機側音声出力部24、親機側通信部25、記憶部26、及び親機側制御部27を有している。これらに加えて、親機20は、応答音声制御装置30をさらに有している。
(Master device 20)
The
表示部21は、子機10から受信した撮像画像、保存メモリに保存された録画画像等の各種画像を表示するLCD(Liquid Crystal Display)等のディスプレイである。表示部21は、各種画像の他に各種操作メニュー等を表示してもよい。
The
親機側操作部22は、通話開始ボタン及び通話終了ボタン等のボタン、テンキー等の入力装置を有し、居住者の入力操作を受け付ける。居住者は、親機側操作部22を介して、種々の設定及び操作を親機20に入力することができる。例えば、居住者は、親機側操作部22を通じて住居内における居住者の在宅又は不在を示す在宅情報を親機20に入力する。具体的には、居住者は、親機側操作部22に含まれる在宅ボタン又は不在ボタンを押下することにより、在宅情報を親機20に入力することができる。
The main unit
また、居住者は、親機側操作部22に含まれる通話開始ボタンを押下することにより、訪問者との通話が可能となる。親機20は、居住者による通話開始ボタンの操作を受け付けると、親機20と子機10との間の通話路を形成し、親機側収音部23が収音した居住者が発した音声の音声信号を、子機10に親機側通信部25を介して送信する。親機20から音声信号を受信した子機10は、受信した音声信号に基づく居住者が発した音声を子機側音声出力部14から出力する。
Also, the resident can make a call with the visitor by pressing a call start button included in the base unit
また、居住者は、通話終了ボタンを押下することにより、訪問者との通話を終了(親機20と子機10との間の通話路を遮断)することができる。親機20は、居住者による通話終了ボタンの操作を受け付けると、表示部21による撮像画像の表示を終了する。これと同時に、子機10は、撮像部11による撮像を停止する。
Also, the resident can end the call with the visitor (cut off the call path between the
なお、表示部21及び親機側操作部22は、タッチパネルディスプレイにより一体に構成されてもよい。
Note that the
親機側収音部23は、マイクロホンを含む。親機側収音部23は、マイクロホンにより居住者が発した音声を収音する。
Base-side
親機側音声出力部24は、親機側通信部25を介して子機10から受信した音声信号に基づく訪問者が発した音声をスピーカから出力する。
Base-side
親機側通信部25は、子機10又は応答音声制御装置30との間で各種信号(制御信号、音声信号、画像信号等)を授受するために用いられる。親機側通信部25は、有線又は無線によって子機10及び応答音声制御装置30と電気的に接続され、子機10との間で双方向に通信可能に構成されている。
The parent device
親機側制御部27は、例えばプロセッサ及びメモリを主構成とするマイクロコンピュータで構成されている。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが親機側制御部27として機能する。これにより、表示部21、親機側操作部22、親機側収音部23、親機側音声出力部24、及び親機側通信部25を制御する機能が実現される。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
The master-
インターホン装置1では、居住者が親機20の通話開始ボタンを押下すると、親機20と子機10との間の通話路が形成される。これにより、親機20と子機10との間で通話が開始される。インターホン装置1は、親機20と子機10との間で通話路が形成された状態である場合には、訪問者が発した音声の音声信号及び居住者が発した音声の音声信号を送受信する。
In the
応答音声制御装置30は、在宅情報取得部31、画像取得部32、判定部33、応答音声選択部34、及び録画制御部35を有する。応答音声制御装置30には、自動応答モードと通話応答モードとの2つの動作モードがあり、通常は自動応答モードに設定されており、通話開始ボタンが押下されると通話応答モードに切り替わるようになっている。
The response
自動応答モードの応答音声制御装置30は、子機10から受信した撮像画像に基づいて訪問者の認識及び認証を行なった後、認識及び認証の少なくとも一方の結果に応じて選択した応答音声を子機10に送信する。一方、通話応答モードに移行した応答音声制御装置30は、処理を終了する。
The response
在宅情報取得部31は、住居内における居住者の在宅又は不在を示す在宅情報を取得する。例えば、在宅情報取得部31は、親機側操作部22を介して居住者が予め入力した在宅情報を取得する。
The stay-at-home
又は、応答音声制御装置30が予め登録された携帯端末と無線によって通信が可能に構成されている場合、在宅情報取得部31は、ネットワーク等を介して居住者が携行する携帯端末の現在位置情報を取得してもよい。携帯端末から現在位置情報を取得する場合、在宅情報取得部31は、携帯端末の現在位置情報が、居住者住所から所定の距離範囲以内であることを示す場合に、居住者が在宅であると判定し、携帯端末の現在位置情報が、居住者住所から所定の距離範囲以内でないことを示す場合に、居住者が不在であると判定するように構成するとよい。
Alternatively, if the response
携帯端末としては、例えば、ノートPC、タブレット端末、スマートフォン等の電子機器が挙げられる。在宅情報取得部31は、居住者が携行する携帯端末から現在位置情報を取得する。現在位置情報は、例えば携帯端末に内蔵される位置情報取得機能により取得される携帯端末の位置情報である。位置情報取得機能としては、GPS(Global Positioning System)等のGNSS(Global Navigation Satellite System)が挙げられる。位置情報は、携帯端末が通信するアクセスポイント等の位置情報であってもよい。
Portable terminals include, for example, electronic devices such as notebook PCs, tablet terminals, and smart phones. The at-home
また、応答音声制御装置30が玄関ドアに設けられている電気錠と有線又は無線によって通信が可能に構成されている場合、在宅情報取得部31は、電気錠の状態に関する情報を在宅情報として電気錠から取得してもよい。なお、玄関ドアは、インターホン装置1が設置される住居の玄関ドアである。電気錠から在宅情報を取得する場合、在宅情報取得部31は、電気錠が住居の外側から施錠されてから住居の外側から解錠されるまでの期間中は居住者の不在を示す在宅情報を取得するように構成するとよい。この場合、当該期間外は居住者の在宅を示す在宅情報を取得する。
In addition, when the response
画像取得部32は、子機10から受信した撮像画像を取得する。
The
判定部33は、撮像画像に基づいて訪問者の認識を行う認識部41と、撮像画像に基づいて訪問者の認証を行う認証部42と、を有する。例えば、認識部41は、訪問者の顔の特徴部分である目、鼻、口等の特徴量を撮像画像から抽出し、これらの特徴量が抽出された領域を人物の顔画像として認識する顔認識を行い、訪問者の顔を認識できたか否か、言い換えると、訪問者を人物であると認識できたか否かの判定を行う。認識部41は、人物の顔画像が認識可能である場合に認識が成立したと判定する。一方、認識部41は、訪問者が撮像エリア外にいたり顔を隠していたりすること等によって人物の顔画像が認識不能である場合や、撮像画像中に顔(人物)が認識不能である場合に、認識が不成立であると判定する。
The
認証部42は、認識部41により抽出された顔画像と記憶部26から読み出した登録者データとを比較して、訪問者の顔認証を行う。認証部42は、登録者データの中に撮像画像から抽出した顔画像と一致する顔画像が含まれていれば、認証が成立したと判定する。一方、認証部42は、登録者データの中に撮像画像から抽出した顔画像と一致する顔画像が含まれていなければ、認証が不成立であると判定する。
The
認証部42は、登録者データとして後述する知り合いデータを用いて訪問者が居住者の知り合いであることを認証する。例えば認証部42は、撮像画像と記憶部26から読み出した居住者の知り合いデータとを比較して数値化した両者の一致度合いが所定の閾値を超える場合に、訪問者が居住者の知り合いであると認証することができる。認証部42は、例えばニューラルネットワークによる機械学習によって学習された知り合い学習済モデルを用いて、撮像画像を知り合い学習済モデルに入力し、撮像画像が居住者の知り合いである度合いを数値として出力とするディープラーニング技術によって訪問者が居住者の知り合いであると認証してもよい。知り合い学習済モデルは、例えば、撮影画像と、その画像に知り合いの人物が含まれているか否かの教師データをセットにした入力データをニューラルネットワークに入力して機械学習した、学習済モデルである。このほか、公知の技術を用いて訪問者が居住者の知り合いであることの認証を行うことができる。
The
また、認証部42は、登録者データとして後述する特定業者データを用いて訪問者が配達業者等の特定業者であることを認証することもできる。例えば認証部42は、撮像画像と記憶部26から読み出した特定業者データとを比較して数値化した両者の一致度合いが所定の閾値を超える場合に、訪問者が特定業者であると認証することができる。認証部42は、上述したニューラルネットワークによる機械学習によって学習された特定業者学習済モデルを用いたディープラーニング技術によって、訪問者が特定業者であると認証してもよい。
The
さらに、認証部42は、登録者データとして後述する不審者データを用いて訪問者が不審者であることを認証することもできる。例えば認証部42は、撮像画像と記憶部26から読み出した不審者データとを比較して数値化した両者の一致度合いが所定の閾値を超える場合に、訪問者が不審者であると認証することができる。認証部42は、上述したニューラルネットワークによる機械学習によって学習された不審者学習済モデルを用いたディープラーニング技術によって、訪問者が不審者であると認証してもよい。
Furthermore, the
そして、本実施形態の認証部42は、予め登録された登録者の内容に応じて下記の4段階にレベル分けされたセキュリティレベルを設定することができる。
The
レベル1:知り合い
レベル2:知り合い+特定業者
レベル3:知り合い+特定業者+非不審者
レベル4:知り合い+特定業者+非不審者+不審者
Level 1: acquaintance Level 2: acquaintance + specific trader Level 3: acquaintance + specific trader + non-suspicious person Level 4: acquaintance + specific trader + non-suspicious person + suspicious person
セキュリティレベルをレベル1に設定すると、認証部42は、訪問者が知り合いである場合に、登録者であると判定する。
When the security level is set to
セキュリティレベルをレベル2に設定すると、認証部42は、訪問者が知り合い又は特定業者である場合に、登録者であると判定する。
When the security level is set to level 2, the
セキュリティレベルをレベル3に設定すると、認証部42は、訪問者が知り合い、特定業者、又は非不審者である場合に、登録者であると判定する。
When the security level is set to level 3, the
セキュリティレベルをレベル4に設定すると、認証部42は、全ての訪問者(知り合い、特定業者、非不審者、及び不審者)に対して、認証を行わない。
When the security level is set to level 4, the
録画制御部35は、撮像部11が撮像した撮像画像を録画した録画画像を保存又は破棄する処理を行なう。自動応答モードにおいて、判定部33により訪問者が登録者ではない未登録者であると判定された場合、又は在宅情報取得部31が取得した在宅情報が居住者の不在を示す場合、録画制御部35は、録画画像を記憶部26の保存メモリに保存する。
The
そして、応答音声制御装置30は、居住者の入力操作により再生要求がなされると、記憶部26から録画画像を読み出して表示部21に表示するとともに、録画画像に連動して子機側収音部13を介して録音された訪問者の音声を親機側音声出力部24から出力する。これにより、居住者は、録画画像及び訪問者の用件を確認することができる。本実施形態では、通話応答モードに切り替わると、録画制御部35が録画画像を破棄するように構成されるが、通話応答モードにおいても録画画像を保存するように構成してもよい。
Then, when a reproduction request is made by an input operation of the resident, the response
応答音声選択部34は、判定部33の判定結果に応じて子機側音声出力部14から出力する応答音声を選択し、選択した応答音声を子機側音声出力部14に親機側通信部25を介して送信(出力)する。応答音声選択部34は、判定部33の認識及び認証の少なくとも一方により、訪問者が認識できたか否か、訪問者が登録者であるか否かを判定する。例えば、応答音声選択部34は、訪問者が認識できない場合や訪問者が登録者でない場合、合成音声を子機側音声出力部14に出力する。また、例えば、応答音声選択部34は、訪問者が登録者である場合、居住者が発した音声又は居住者の録音音声を子機側音声出力部14に出力する。
The response
応答音声選択部34は、判定部33による認識及び認証により判別された訪問者の種類(登録者、特定業者、非不審者、不審者)に応じて、複数種類の音声メッセージの中からそれぞれ異なる音声メッセージを選択して子機側音声出力部14に出力してもよい。なお、応答音声制御装置30が通話応答モードの時は、親機20と子機10との間で通話が可能な状態であるため、居住者が発した音声が子機側音声出力部14から出力される。
The response
記憶部26は、ROM(Read Only Memory)、RAM(Random Access Memory)、不揮発性メモリ等から選択されるメモリにより構成される。
The
記憶部26は、録画画像を保存する保存メモリを有する。記憶部26は、録音された訪問者の音声と対応付けて録画画像を保存メモリに記憶する。記憶部26は、親機20に備えられるほか、応答音声制御装置30に備えられてもよい。
The
また、記憶部26は、登録者データを予め認証メモリに記憶している。登録者データは、携帯端末の画像フォルダに格納された登録者の各々の顔画像を含む写真のデータ等に基づいて自動生成される。居住者は、ネットワークを介して携帯端末から応答音声制御装置30に登録者データを送信することで、記憶部26に登録者データを記憶させることができる。応答音声制御装置30が携帯端末から受信したデータは、親機側操作部22を介して顔画像の追加、変更、及び削除を行なうことにより編集することができる。したがって、例えば携帯端末から受信したデータの中に登録者データに登録したくない人物の顔画像が含まれている場合、その人物の顔画像を削除して登録者データを管理することができる。
Further, the
また、記憶部26は、配達業者等の特定業者の特定業者データを予め認証メモリに記憶している。特定業者データは、特定業者を識別するためのデータである。特定業者を識別するためのデータとしては、特定業者が着用する制服や帽子に関する画像情報(色、柄等)、特定業者が属する会社の特有のシンボルマーク等に関する画像情報等が好ましい。
In addition, the
さらに、記憶部26は、不審者に関する不審者データを予め認証メモリに記憶している。不審者の条件としては、例えば多くの人が「不審」、「危険」と判定する人物の身体的特徴(例えば、顔)が用いられる。不審者の具体例としては、マスク、サングラス、手等で自身の顔を覆うことにより顔を隠している人物、顔を背けている人物(横顔の人物)等が挙げられる。
Further, the
また、記憶部26は、録音音声と合成音声との少なくとも一方の音声を予め応答音声メモリに記憶している。録音音声は、例えば予め親機側収音部23を介して居住者の発話を録音した音声である。合成音声は、例えば予め機械的に生成された音声である。録音音声及び合成音声は、応答音声制御装置30が外部装置から取得するように構成してもよい。録音音声及び合成音声は、訪問者の要件を伺う内容の音声メッセージ、訪問者に対する要望を伝える内容の音声メッセージ等にするとよい。
Further, the
このような音声メッセージの具体例としては、「どちら様ですか」、「ご用件は」、「マスクを外してください」等が挙げられる。居住者は、親機側操作部22を介して、記憶部26の応答音声メモリに記憶されている複数種類の音声メッセージの中から、応答音声の候補となる音声メッセージを設定することができる。
Specific examples of such voice messages include "Who are you?", "What is your business?" A resident can set a voice message as a candidate for a response voice from among a plurality of types of voice messages stored in a response voice memory of a
上記した保存メモリ、認証メモリ、及び応答音声メモリは、データを書き換え可能なメモリであって、HDD(Hard Disk Drive)、フラッシュメモリ(SSD:Solid State Drive)等の不揮発性メモリであることが好ましい。また、インターホン装置1が人工知能(AI:Artificial Intelligence)を搭載している場合、応答音声制御装置30は、過去に蓄積された複数のデータや学習済みモデルを蓄積可能である。また、応答音声制御装置30は、ニューラルネットワークやディープラーニング等のフレームワークによる機械学習も可能である。
The storage memory, authentication memory, and response voice memory described above are rewritable memories, and are preferably non-volatile memories such as HDDs (Hard Disk Drives) and flash memories (SSDs: Solid State Drives). . Moreover, when the
次に、インターホン装置1の動作の一例について、応答音声制御装置30が行なう処理を中心に説明する。図2は、図1に示すインターホン装置の動作を説明するフローチャートである。図2に示す処理フローでは、訪問者が登録者ではない場合、在宅情報が不在を示す場合に、応答音声として合成音声を選択して出力する場合を例に挙げて説明する。ただし、セキュリティ上の問題がなければ合成音声以外の音声(例えば、居住者の録音音声)を選択して出力してもよい。
Next, an example of the operation of the
訪問者が呼出ボタンを押下することにより子機10が呼出操作されると、子機10から親機20へ呼出信号が送信されて図2に示す処理フローが開始される。子機10は撮像部11を起動させて撮像を開始し、撮像した撮像画像の画像信号を応答音声制御装置30の画像取得部32に送信する。同時に、呼出信号及び画像信号を受信した親機20は、親機側音声出力部24のスピーカから呼出音を鳴動するとともに、表示部21に撮像画像を表示する。
When the visitor presses the call button to perform a calling operation on the
ステップS11において、在宅情報取得部31により在宅情報が取得されると、取得された在宅情報に基づいて居住者が在宅しているか否かが判別される。在宅情報が居住者の在宅を示す場合、ステップS12に処理が進む。在宅情報が居住者の不在を示す場合、ステップS21に処理が進む。
In step S11, when the stay-at-home
在宅を示す在宅情報であれば、ステップS12において、判定部33は、画像取得部32により取得された撮像画像に基づいて訪問者の認識及び認証を行なう。
If the at-home information indicates that the visitor is at home, the
判定部33により、訪問者が認識できない又は訪問者が登録者でないと判定された場合(ステップS12:YES)、ステップS13に処理が進む。判定部33により訪問者が登録者であると判定された場合(ステップS12:NO)、ステップS31に処理が進む。
If the
ステップS13において、応答音声選択部34は、記憶部26に記憶されている応答音声の候補の中から合成音声を選択する。応答音声制御装置30は、応答音声選択部34により選択された合成音声を子機10へ送信する。これと同時に、録画制御部35は、撮像画像の録画を開始する。そして、ステップS14に処理が進む。
In step S<b>13 , the response
ステップS14において、親機20と子機10との間で通話が開始されたか否かを判定する。この判定は、居住者による通話開始ボタンの操作が行われたことを親機側操作部22が受け付けたか否かに基づいて判定することができる。通話が開始されたと判定した場合(ステップS14:YES)、ステップS15に処理が進む。通話が開始されていないと判定した場合(ステップS14:NO)、ステップS22に処理が進む。
In step S14, it is determined whether or not a call has been started between the
通話が開始されたと判定されると、ステップS15において、録画制御部35は、録画画像を破棄する処理を行なう。そして、図2に示す処理フローが終了する。
When it is determined that the call has started, the
一方、ステップS11で不在を示す在宅情報であれば、ステップS21において、応答音声選択部34は、記憶部26の応答音声メモリに記憶されている応答音声の候補の中から合成音声を選択する。応答音声制御装置30は、応答音声選択部34により選択された合成音声を子機10へ送信する。これと同時に、録画制御部35は、撮像画像の録画を開始する。そして、ステップS22において、録画制御部35は、録画画像を保存する処理を行ない、図2に示す処理フローが終了する。
On the other hand, if the at-home information indicates absence in step S11, the response
また、ステップS12で訪問者が登録者であると判定されると、ステップS31において、応答音声選択部34は、自動応答モードから通話応答モードに切り替えることにより、親機側収音部23が収音した居住者が発した音声が選択され、図2に示す処理フローが終了する。
Further, when it is determined in step S12 that the visitor is a registrant, in step S31, the response
以上説明したように、本実施形態にかかるインターホン装置1は、上記した画像取得部32、判定部33、及び応答音声選択部34を有する。
As described above, the
このような構成によれば、訪問者の種類に応じて異なる音声メッセージが出力され得る。そのため、訪問者に居住者が在宅であるか不在であるかを知られずに用件を聞き出すことができる。その結果、不審な訪問者から身を守ることができる。 With such a configuration, different voice messages can be output according to the type of visitor. Therefore, it is possible to ask the visitor what to do without knowing whether the resident is at home or not. As a result, you can protect yourself from suspicious visitors.
また、インターホン装置1において、応答音声選択部34は、判定部33により訪問者が登録者ではないと判定された場合、予め記憶された合成音声を応答音声とする。
Further, in the
このような構成によれば、登録済みの訪問者である場合に居住者が発した音声又は居住者の録音音声による応答が実現され、認識不能な訪問者である場合や未登録の訪問者である場合には、合成音声による応答が実現される。そのため、認識可能な登録者以外の訪問者に居住者が発した音声を聞かれてしまう虞がなく、性別等についての居住者の個人情報を推測されてしまう虞や、居住者が在宅していること等の居住者の個人情報を知られてしまうことを回避できる。 According to such a configuration, a response by a resident's spoken voice or a resident's recorded voice is realized in the case of a registered visitor, and a response is realized in the case of an unrecognized visitor or an unregistered visitor. In some cases, synthetic speech responses are implemented. Therefore, there is no risk that visitors other than recognizable registrants will hear the voice uttered by the resident. It is possible to avoid revealing the personal information of the residents, such as the presence of the residents.
また、インターホン装置1において、判定部33は、予め記憶された不審者に関する不審者データを用いて訪問者が不審者であることをさらに認証し、応答音声選択部34は、判定部33により訪問者が不審者であることが認証されると、合成音声を応答音声とする。
Further, in the
このような構成によれば、不審者の検出が可能であるとともに、不審者に居住者が発した音声を聞かれてしまう虞がなく、性別等についての居住者の個人情報を推測されてしまう虞や、居住者が在宅していること等の居住者の個人情報を知られしまうことを回避できる。その結果、不審者から一層身を守ることができる。 According to such a configuration, it is possible to detect a suspicious person, and there is no fear that the suspicious person will hear the voice uttered by the resident, and the personal information of the resident such as gender can be guessed. It is possible to avoid the possibility that the resident's personal information such as that the resident is at home will be known. As a result, it is possible to further protect oneself from suspicious persons.
また、インターホン装置1は、住居内における居住者の在宅又は不在を示す在宅情報を取得する在宅情報取得部31を有する。また、インターホン装置は1は、判定部33により訪問者が登録者ではないと判定された場合、又は在宅情報取得部31が取得した在宅情報が不在を示す場合、撮像部11が撮像した撮像画像を録画した録画画像を保存する録画制御部35を有する。
The
このような構成によれば、居住者は録画画像及び録音された訪問者の音声を確認することにより、未登録の訪問者の情報を把握することができる。或いは、訪問者の来訪時に居住者が住居内に不在であっても、居住者は録画画像及び録音された訪問者の音声を確認することにより、不在中に来訪した訪問者の情報を把握することができる。 According to such a configuration, the resident can grasp the information of the unregistered visitor by confirming the recorded image and the recorded voice of the visitor. Alternatively, even if the resident is not in the residence when the visitor visits, the resident can grasp the information of the visitor who visited during the absence by checking the recorded image and the recorded voice of the visitor. be able to.
また、インターホン装置1において、応答音声選択部34は、判定部33により訪問者が登録者であると判定された場合、且つ在宅情報取得部31が取得した在宅情報が不在を示す場合、予め録音された録音音声を応答音声とする。
Further, in the
このような構成によれば、居住者が住居内に不在であっても、登録済みの訪問者である場合は用件を聞き出すことができるため。居住者は録画画像及び録音された訪問者の音声を確認することにより、訪問者の有無、訪問者が誰であるか、訪問者の用件等の不在中における訪問者の情報を把握することができる。 According to such a configuration, even if the resident is not in the residence, if the resident is a registered visitor, he/she can ask for the business. By checking the recorded images and the recorded voice of the visitor, the resident can grasp the information of the visitor during his/her absence, such as presence or absence of the visitor, who the visitor is, and what the visitor is doing. can be done.
以上詳細に説明したように、本実施形態によれば、居住者のプライバシーやセキュリティを確保可能なインターホン装置1を提供することができる。
As explained in detail above, according to this embodiment, it is possible to provide the
なお、本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば、上記実施形態では、不審者を認証するために不審者データを用いたが、不審者データの代わりに非不審者に関する非不審者データを記憶部26に記憶させてもよい。非不審者の条件としては、例えば多くの人が「穏やかそう」と判定する人物の身体的特徴(例えば、顔)を用いることができる。非不審者データを用いて非不審者の認証を行なう場合、例えば認証部42は、撮像画像と記憶部26から読み出した非不審者データとを比較して数値化した両者の一致度合いが所定の閾値を超えるか否かによって非不審者を認証することができる。
It should be noted that the present disclosure is not limited to the above embodiments, and can be modified as appropriate without departing from the scope of the present disclosure. For example, in the above embodiment, suspicious person data is used to authenticate a suspicious person, but non-suspicious person data related to a non-suspicious person may be stored in the
本開示は、SDG‘sの「住み続けられるまちづくりを」の実現に貢献し、公共施設の安心・安全に寄与する事項を含む。 This disclosure includes matters that contribute to the realization of the SDGs's "Sustainable urban development" and contribute to the safety and security of public facilities.
1 インターホン装置
10 子機
11 撮像部
12 子機側操作部
13 子機側収音部
14 子機側音声出力部
15 子機側通信部
16 子機側制御部
20 親機
21 表示部
22 親機側操作部
23 親機側収音部
24 親機側音声出力部
25 親機側通信部
26 記憶部
27 親機側制御部
30 応答音声制御装置
31 在宅情報取得部
32 画像取得部
33 判定部
34 応答音声選択部
35 録画制御部
41 認識部
42 認証部
1
Claims (5)
前記訪問者を撮像する撮像部が撮像した撮像画像を取得する画像取得部と、
前記画像取得部により取得された前記撮像画像に基づいて、前記訪問者を認識できたか、及び、前記訪問者が予め登録された登録者であるか、の少なくとも一方を判定する判定部と、
前記判定部の判定結果に応じて前記インターホン子機の子機側音声出力部から出力する応答音声を選択し、選択した前記応答音声を前記子機側音声出力部に出力する応答音声選択部と、
を有するインターホン装置。 An intercom device equipped with an intercom slave unit used by a visitor,
an image acquisition unit that acquires an image captured by an imaging unit that captures an image of the visitor;
a determination unit that determines at least one of whether the visitor has been recognized and whether the visitor is a pre-registered registrant based on the captured image acquired by the image acquisition unit;
a response voice selection unit that selects a response voice to be output from the handset-side voice output unit of the intercom slave unit according to the determination result of the determination unit, and outputs the selected response voice to the handset-side voice output unit; ,
An intercom device having
前記判定部により前記訪問者が前記登録者ではないと判定された場合、予め記憶された合成音声を前記応答音声とする、
請求項1に記載のインターホン装置。 The response voice selection unit
If the determination unit determines that the visitor is not the registrant, a pre-stored synthetic voice is used as the response voice.
The intercom device according to claim 1.
予め記憶された不審者に関する不審者データを用いて前記訪問者が前記不審者であることをさらに認証し、
前記応答音声選択部は、
前記判定部により前記訪問者が前記不審者であることが認証されると、予め記憶された合成音声を前記応答音声とする、
請求項1又は2に記載のインターホン装置。 The determination unit is
further authenticating that the visitor is the suspicious person using pre-stored suspicious person data relating to the suspicious person;
The response voice selection unit
When the determination unit authenticates that the visitor is the suspicious person, a pre-stored synthetic voice is used as the response voice.
The interphone device according to claim 1 or 2.
前記判定部により前記訪問者が前記登録者ではないと判定された場合、又は前記在宅情報取得部が取得した前記在宅情報が前記不在を示す場合、前記撮像部が撮像した前記撮像画像を録画した録画画像を保存する録画制御部と、
をさらに有する請求項1~3のいずれか1項に記載のインターホン装置。 a stay-at-home information acquisition unit that acquires stay-at-home information indicating whether a resident is at home or not in the residence;
When the determining unit determines that the visitor is not the registrant, or when the at-home information acquired by the at-home information acquiring unit indicates the absence, the captured image captured by the imaging unit is recorded. a recording control unit that saves recorded images;
The intercom device according to any one of claims 1 to 3, further comprising:
前記判定部により前記訪問者が前記登録者であると判定された場合、且つ前記在宅情報取得部が取得した前記在宅情報が前記不在を示す場合、予め録音された録音音声を前記応答音声とする、
請求項4に記載のインターホン装置。 The response voice selection unit
If the determination unit determines that the visitor is the registrant and if the presence-at-home information acquired by the presence-at-home information acquisition unit indicates that the visitor is absent, pre-recorded voice is used as the response voice. ,
The intercom device according to claim 4.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022027069A JP2023123165A (en) | 2022-02-24 | 2022-02-24 | intercom device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022027069A JP2023123165A (en) | 2022-02-24 | 2022-02-24 | intercom device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023123165A true JP2023123165A (en) | 2023-09-05 |
Family
ID=87885478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022027069A Pending JP2023123165A (en) | 2022-02-24 | 2022-02-24 | intercom device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2023123165A (en) |
-
2022
- 2022-02-24 JP JP2022027069A patent/JP2023123165A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109523678A (en) | The exchange method and device of intelligent entrance guard | |
CN204754706U (en) | Electronic peephole | |
CN105120122A (en) | Alarm method and device | |
CN110166726B (en) | Method for automatically identifying user, video terminal and video conference system | |
JP4772509B2 (en) | Doorphone and ringing tone control method for doorphone | |
JP2009100334A (en) | Apparatus and mobile terminal for dealing with visitor, and system therefor | |
JP2010074458A (en) | Intercom system | |
KR101480103B1 (en) | Access control apparatus and method using face recognition | |
JP4945356B2 (en) | Electric lock system | |
JP2023123165A (en) | intercom device | |
JP7016043B2 (en) | Intercom system, processing method and program | |
JP6335061B2 (en) | Intercom device | |
JP2007037088A (en) | Intercom device | |
JP2007104382A (en) | Interphone apparatus | |
JP2010212787A (en) | Door intercom device, program to function as each of means in door intercom device, door intercom system and information processing method for the door intercom device | |
JP6662056B2 (en) | Authentication system, personal digital assistant, server, and authentication program | |
JP2013131923A (en) | Intercom system, control method, and program | |
JP3864414B2 (en) | Personal verification device | |
JP2007150670A (en) | Intercom system | |
JP2007150511A (en) | Intercom system | |
JP3949051B2 (en) | Intercom device | |
JP2005217524A (en) | Security management system and security management method | |
JP2007096831A (en) | Interphone system | |
JP2010212903A (en) | Answer control device, answer control method, answer control program, answer equipment, and answer system | |
JP2007096833A (en) | Intercom system |