JP2021140114A - Information terminal, intercom system, processing method and program - Google Patents
Information terminal, intercom system, processing method and program Download PDFInfo
- Publication number
- JP2021140114A JP2021140114A JP2020040037A JP2020040037A JP2021140114A JP 2021140114 A JP2021140114 A JP 2021140114A JP 2020040037 A JP2020040037 A JP 2020040037A JP 2020040037 A JP2020040037 A JP 2020040037A JP 2021140114 A JP2021140114 A JP 2021140114A
- Authority
- JP
- Japan
- Prior art keywords
- voice recognition
- unit
- information terminal
- intercom
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 91
- 238000004891 communication Methods 0.000 claims description 76
- 238000000034 method Methods 0.000 claims description 29
- 230000008859 change Effects 0.000 claims description 22
- 230000008569 process Effects 0.000 claims description 22
- 230000001276 controlling effect Effects 0.000 claims 1
- 230000005236 sound signal Effects 0.000 description 16
- 238000007792 addition Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000003384 imaging method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
Images
Landscapes
- Interconnected Communication Systems, Intercoms, And Interphones (AREA)
- Telephone Function (AREA)
Abstract
Description
本開示は、一般に情報端末、インターホンシステム、処理方法及びプログラムに関し、より詳細には音声認識可能に構成された情報端末、インターホンシステム、処理方法及びプログラムに関する。 The present disclosure relates generally to information terminals, intercom systems, processing methods and programs, and more specifically to information terminals, intercom systems, processing methods and programs configured to be voice-recognizable.
従来、集合住宅等で用いられるインターホンシステムが知られている(例えば、特許文献1参照)。 Conventionally, an intercom system used in an apartment house or the like is known (see, for example, Patent Document 1).
特許文献1のインターホンシステムは、集合住宅の共同玄関に設置されるロビーインターホン、各住戸内に設置されるインターホン親機、及び各住戸の戸外(玄関先)に設置されるドアホン子器を備える。 The intercom system of Patent Document 1 includes a lobby intercom installed at the common entrance of an apartment house, an intercom master unit installed in each dwelling unit, and a doorphone slave unit installed outdoors (entrance) of each dwelling unit.
このようなインターホンシステムでは、来訪者は、ロビーインターホンを用いてインターホン親機を呼び出す。この呼出に応じて住戸の住人がインターホン親機に対して所定の操作を行うことでロビーインターホンとインターホン親機との間で通話が開始される。ドアホン子器でインターホン親機を呼び出したときも同様に、呼出に応じて住戸の住人がインターホン親機に対して所定の操作を行うことでドアホン子器とインターホン親機との間で通話が開始される。 In such an intercom system, the visitor calls the intercom master unit using the lobby intercom. In response to this call, the resident of the dwelling unit performs a predetermined operation on the intercom master unit to start a call between the lobby intercom and the intercom master unit. Similarly, when the intercom master unit is called by the doorphone slave unit, the resident of the dwelling unit performs a predetermined operation on the intercom master unit in response to the call, and a call is started between the doorphone slave unit and the intercom master unit. Will be done.
ところで、所定の操作として住戸の住人が発した音声を基に音声認識を行うシステムが存在する。音声認識では、処理負荷を高めることなく、精度良く行われることが望まれている。 By the way, there is a system that performs voice recognition based on the voice emitted by the resident of the dwelling unit as a predetermined operation. It is desired that speech recognition be performed with high accuracy without increasing the processing load.
本開示は上記課題に鑑みてなされ、音声認識の処理負荷を高めることなく、精度良く行うことが可能な情報端末、インターホンシステム、処理方法及びプログラムを提供することを目的とする。 The present disclosure has been made in view of the above problems, and an object of the present disclosure is to provide an information terminal, an intercom system, a processing method, and a program that can be performed accurately without increasing the processing load of voice recognition.
本開示の一態様に係る情報端末は、インターホン装置として動作する情報端末である。前記情報端末は、音取得部と、音声認識部と、制御処理部と、を備える。前記音取得部は、少なくともユーザの音声を含む音を取得する。前記音声認識部は、前記音取得部が取得した前記音に基づいた音声認識を行う。前記制御処理部は、前記音声認識部の音声認識結果に基づいて制御を行う。前記音声認識部は、音声認識で参照する情報を変更可能に構成されている。 The information terminal according to one aspect of the present disclosure is an information terminal that operates as an intercom device. The information terminal includes a sound acquisition unit, a voice recognition unit, and a control processing unit. The sound acquisition unit acquires at least a sound including a user's voice. The voice recognition unit performs voice recognition based on the sound acquired by the sound acquisition unit. The control processing unit performs control based on the voice recognition result of the voice recognition unit. The voice recognition unit is configured so that the information referred to in voice recognition can be changed.
本開示の一態様に係るインターホンシステムは、前記情報端末と、前記情報端末と通信するインターホン玄関装置と、を備える。 The intercom system according to one aspect of the present disclosure includes the information terminal and an intercom entrance device that communicates with the information terminal.
本開示の一態様に係る処理方法は、インターホン装置として動作する情報端末で用いられる処理方法である。前記処理方法は、音取得ステップと、音声認識ステップと、制御処理ステップと、を含む。前記音取得ステップは、少なくともユーザの音声を含む音を取得する。前記音声認識ステップは、前記音取得ステップで取得した前記音に基づいた音声認識処理を行う。前記制御処理ステップは、前記音声認識ステップでの音声認識結果に基づいて制御を行う。前記音声認識処理は、音声認識で参照する情報を変更可能に構成されている。 The processing method according to one aspect of the present disclosure is a processing method used in an information terminal operating as an intercom device. The processing method includes a sound acquisition step, a voice recognition step, and a control processing step. The sound acquisition step acquires a sound including at least the user's voice. The voice recognition step performs voice recognition processing based on the sound acquired in the sound acquisition step. The control processing step controls based on the voice recognition result in the voice recognition step. The voice recognition process is configured so that the information referred to in the voice recognition can be changed.
本開示の一態様に係るプログラムは、コンピュータに、前記処理方法を実行させるためのプログラムである。 The program according to one aspect of the present disclosure is a program for causing a computer to execute the processing method.
本開示によると、音声認識の処理負荷を高めることなく、精度良く行うことが可能である。 According to the present disclosure, it is possible to perform the speech recognition with high accuracy without increasing the processing load.
以下に説明する実施形態及び変形例は、本開示の一例に過ぎず、本開示は、実施形態及び変形例に限定されない。以下の実施形態及び変形例以外であっても、本開示に係る技術的思想を逸脱しない範囲であれば、設計等に応じて種々の変更が可能である。 The embodiments and modifications described below are merely examples of the present disclosure, and the present disclosure is not limited to the embodiments and modifications. Other than the following embodiments and modifications, various changes can be made according to the design and the like as long as they do not deviate from the technical idea of the present disclosure.
(実施形態)
以下、本実施形態に係るインターホン装置として動作する情報端末10を備えるインターホンシステム1について、図1〜図4を用いて説明する。
(Embodiment)
Hereinafter, the intercom system 1 including the
(1)概要
以下、本実施形態に係る情報端末10について、説明する。
(1) Outline Hereinafter, the
本実施形態に係る情報端末10は、図2に示すように、インターホンシステム1に適用される。インターホンシステム1は、例えば、マンション等の集合住宅5に適用される。本実施形態に係るインターホンシステム1は、情報端末10を備える。本実施形態では、インターホンシステム1は、各々がインターホン装置として動作する複数(図2では2つ)の情報端末10を備える。インターホンシステム1は、ロビーインターホン20(インターホン玄関装置)と、制御装置30と、複数(図2では2つ)の玄関子機40(インターホン玄関装置)とを、更に備える。インターホンシステム1では、複数の情報端末10の各々とロビーインターホン20とが制御装置30を介して通信を行うように構成されている。また、インターホンシステム1では、複数の情報端末10と複数の玄関子機40とが一対一に対応している。なお、本実施形態に係るインターホンシステム1は、集合住宅5以外に、戸建住宅に適用されてもよい。あるいは、インターホンシステム1は、事務所、店舗、学校若しくは介護施設等の非住宅施設等に適用されてもよい。
As shown in FIG. 2, the
複数の情報端末10の各々は、例えば、集合住宅5に含まれる複数の住戸E2の各々に設けられている住戸端末(インターホン親機)である。各情報端末10は、例えば、各住戸E2の内玄関に設けられている。各情報端末10は、第2幹線62、分岐線63、及び分岐器50を介して制御装置30に接続されている。各情報端末10は、制御装置30を介して、ロビーインターホン20との間で通信(例えば、通話、及び制御信号の送信等)を行うように構成されている。さらに、各情報端末10は、接続線64を介して対応する玄関子機40に接続されている。各情報端末10は、対応する玄関子機40との間で通信(例えば、通話、及び制御信号の送信等)を行うように構成されている。
Each of the plurality of
ロビーインターホン20は、例えば、集合住宅5の共用玄関(ロビー)E1に設けられている。ロビーインターホン20は、第1幹線61を介して制御装置30に接続されている。ロビーインターホン20は、制御装置30を介して、各情報端末10との間で通信(例えば、通話、及び映像信号の送信等)を行うように構成されている。ロビーインターホン20は、例えば、共用玄関E1の壁に取り付けられている。ロビーインターホン20が映像信号を情報端末10に送信することで、情報端末10は、映像(画像)を表示することができる。
The
制御装置30は、例えば、集合住宅5の管理室E3に設けられている。制御装置30は、第1幹線61を介してロビーインターホン20に接続され、かつ第2幹線62を介して各情報端末10に接続されている。つまり、制御装置30は、各情報端末10とロビーインターホン20との間の通信を中継するように構成されている。
The
複数の玄関子機40の各々は、例えば、集合住宅5の住戸E2の外玄関に設けられている。各玄関子機40は、接続線64を介して対応する情報端末10に接続されている。各玄関子機40は、対応する情報端末10との間で通信(例えば、通話、映像信号の送信等)を行うように構成されている。
Each of the plurality of
本実施形態では、第1幹線61、第2幹線62、分岐線63、及び接続線64は、いずれもツイストペア線である。つまり、実際には、第1幹線61、第2幹線62、分岐線63、及び接続線64は2本の電線で構成されるが、図面上は1本の線で表している。第1幹線61、第2幹線62、分岐線63、及び接続線64の少なくとも1つはツイストペア線以外の電線であってもよい。
In the present embodiment, the
本実施形態に係る情報端末10は、住戸E2内のユーザの音声を取得し、取得した音声に対して音声認識を施す。情報端末10は、音声認識の結果に基づいて、インターホンシステム1の操作に関する制御を行う。すなわち、情報端末10は、音声操作が可能に構成されている。例えば、情報端末10は、共用玄関E1に設けられた玄関扉200(扉)の開閉に係る制御を行うためのキーワード(制御用ワード)を住戸E2内のユーザの音声から取得すると、制御用ワードに応じた制御を行う。具体的には、情報端末10は、制御用ワードとして“ドアを開けて”を、音声認識により検出すると、玄関扉200(図2参照)を開くための制御を行う。ここで、玄関扉200は、電気錠201(図2参照)で開閉されるように構成されている。
The
本実施形態に係る情報端末10は、ネットワークNT1を介してサーバ70と通信可能構成されている。サーバ70は、情報端末10が音声操作に係る音声認識を行うための、複数の辞書ファイルを記憶している。例えば、複数の辞書ファイルの各々は、発音の特徴に関するファイルである。複数の辞書ファイルは、男性に関し、かつA地方の方言に関する辞書ファイル、女性に関し、かつA地方の方言に関する辞書ファイル、男性に関し、かつ子供に関する辞書ファイル、男性に関し、かつ高齢者に関する辞書ファイル等を含む。さらに、辞書ファイルは、男性に関し、かつ母国語(例えば、英語)に関する辞書ファイル、電気錠の開錠に係る音声の辞書ファイル等を含む。
The
本実施形態に係る情報端末10は、複数の辞書ファイルのうち少なくとも1つの辞書ファイルをサーバ70から取得し、記憶する。情報端末10は、記憶している辞書ファイルを用いて音声認識処理を行い、玄関扉200を開く操作(電気錠201の開錠操作)に係る制御等を行う。
The
本実施形態に係る情報端末10は、音取得部13と、音声認識部182と、制御処理部183と、を備える。音取得部13は、少なくともユーザの音声を含む音を取得する。音声認識部182は、音取得部13が取得した音に基づいた音声認識を行う。制御処理部183は、音声認識部182の音声認識結果に基づいて制御を行う。音声認識部182は、音声認識で参照する情報を変更可能に構成されている。
The
本実施形態の情報端末10では、音声認識部182は、音声認識で参照する情報を変更可能に構成されている。そのため、ユーザの発音の特徴(アクセント、方言等)に応じて、音声認識で参照する情報を変更することができるので、音声認識の精度をより高めることができる。
In the
(2)構成
(2−1)情報端末
情報端末10は、図1に示すように、第1通信部11、第2通信部12、音取得部13、操作部14、出力部15、表示部16、記憶部17、制御部18及び第3通信部19を備える。
(2) Configuration (2-1) Information terminal As shown in FIG. 1, the
情報端末10は、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部18として機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
The
第1通信部11は、ロビーインターホン20(の通信部21)と通信するための通信インタフェースである。第1通信部11は、第2幹線62、分岐線63、及び分岐器50を介して制御装置30に接続されている。第1通信部11は、制御装置30を介して、ロビーインターホン20に対して音声信号、及び制御信号等を送信する。さらに、第1通信部11は、制御装置30を介して、ロビーインターホン20から音声信号、及び映像信号等を受信する。
The first communication unit 11 is a communication interface for communicating with the lobby intercom 20 (communication unit 21). The first communication unit 11 is connected to the
第2通信部12は、玄関子機40と通信するための通信インタフェースである。第2通信部12は、接続線64を介して玄関子機40に接続されている。第2通信部12は、玄関子機40に対して音声信号、及び制御信号等を送信し、玄関子機40から音声信号、及び映像信号等を受信する。
The
第3通信部19は、外部(ここでは、サーバ70)と通信するための通信インタフェースである。第3通信部19は、ネットワークNT1を介してサーバ70に接続されている。第3通信部19は、辞書ファイルを要求する情報をサーバ70に送信し、サーバ70から複数の辞書ファイルのうち要求に応じた少なくとも1つの辞書ファイルを受信する。
The
音取得部13は、少なくともユーザの音声を含む音を取得し、取得した音に係る音情報を制御部18に出力する。音取得部13は、1つのマイクロホン131を有している。マイクロホン131は、情報端末10の前方に位置するユーザの音声(音)を含む周囲の音を取得し、取得した音をアナログの音信号(音情報)に変換して制御部18に出力する。
The
操作部14は、ユーザ(例えば、各住戸E2の住人等)の操作を受け付けるように構成されている。操作部14は、少なくとも通話ボタンを有している。通話ボタンは、ロビーインターホン20、又は玄関子機40からの呼び出しに対して、ロビーインターホン20、又は玄関子機40との通信(訪問者等との通話)を開始するためのボタンである。つまり、第1通信部11が住人を呼び出すための呼出信号を受信している状態で通話ボタンが押されると、ロビーインターホン20、又は玄関子機40と情報端末10との間で音声通話が可能になる。
The
出力部15は、例えばスピーカである。出力部15は、情報端末10がロビーインターホン20と通話可能な状態である場合には、ロビーインターホン20から送信された音データに基づいた音(訪問者等の音声を含む)を出力する。出力部15は、情報端末10が玄関子機40と通話可能な状態である場合には、玄関子機40から送信された音データに基づいた音(訪問者等の音声を含む)を出力する。
The
表示部16は、例えば、液晶ディスプレイである。表示部16は、映像を表示するように構成されている。表示部16は、情報端末10がロビーインターホン20と通話(通信)可能な状態である場合に、通信対象であるロビーインターホン20が撮像した映像を表示する。表示部16は、情報端末10が玄関子機40と通話(通信)可能な状態である場合に、通信対象である玄関子機40が撮像した映像を表示する。なお、情報端末10がタッチパネルディスプレイを備えている場合には、タッチパネルディスプレイが表示部16と操作部14とを兼ねてもよい。
The
記憶部17は、読み書き可能なメモリで構成されている。記憶部17は、例えば、フラッシュメモリである。記憶部17は、例えば、サーバ70から取得した少なくとも1つの辞書ファイルを記憶する。
The
辞書ファイルは、音声認識部182が音声認識可能な言語(日本語、英語等)の種類、同一言語における表現方法(方言、アクセント等)、同一言語における発音主体(男性、女性、子供、高齢者等)のうち、少なくとも1つに係る情報に基づく辞書ファイルを含む。以下、音声認識部182が音声認識可能な言語の種類、同一言語における表現方法、同一言語における発音主体のうち少なくとも1つに基づいた辞書ファイルを、言語情報に基づく辞書ファイルという。
The dictionary file contains the types of languages (Japanese, English, etc.) that the
さらに、辞書ファイルは、制御用ワードの検出のトリガーとなる所定のキーワードを含む辞書ファイル、及び制御用ワードを含む辞書ファイルを含む。 Further, the dictionary file includes a dictionary file containing a predetermined keyword that triggers the detection of the control word, and a dictionary file containing the control word.
制御部18は、図1に示すように、音声処理部181、音声認識部182、制御処理部183、表示処理部184及び送出部185を有している。
As shown in FIG. 1, the
音声処理部181は、音取得部13が出力したアナログの音信号を取得する。音声処理部181は、取得したアナログの音信号を、デジタルの音信号に変換する。また、音声処理部181は、音取得部13から取得した音信号に対して所定のフィルタリング処理等を行うように構成されている。音声処理部181は、例えばエコーキャンセラを含む。エコーキャンセラは、マイクロホン131から出力された音信号に対してエコーの抑制又は除去を行う。
The
音声認識部182は、音取得部13が取得した音声に基づいた音声認識処理を行う。音声認識部182は、音声処理部181が処理した音に対して、記憶部17が記憶している少なくとも1つの辞書ファイルを用いた音声認識処理を行う。
The
音声認識部182は、情報端末10とインターホン玄関装置(ロビーインターホン20、玄関子機40)との間で通信中、つまりユーザが通話中(インターホン通話中)において、音声認識処理が実行可能に構成されている。
The
音声認識部182は、インターホン玄関装置(ロビーインターホン20、玄関子機40)から呼び出しが行われている場合、つまりインターホンが非通話である場合に、音声認識処理により、音声処理部181が処理した音に所定のキーワードが含まれるか否かを判断する。音声認識部182は、音声処理部181が処理した音に所定のキーワードが含まれると判断する場合には、通信対象のインターホン玄関装置(ロビーインターホン20、玄関子機40)との通信(通話)を開始するよう、制御処理部183に指示する。音声認識部182は、情報端末10とインターホン玄関装置との間の通信が終了するまで、音声認識処理を行う。例えば、音声認識部182は、音声処理部181が処理した音に所定のキーワードが含まれると判断する場合には、インターホンシステム1における制御に係るキーワード(制御用ワード)の検出に係る音声認識処理を開始する。
The
音声認識部182は、情報端末10とインターホン玄関装置との間の通信が終了するまで、制御用ワードの検出に係る音声認識処理を行う。具体的には、音声認識部182は、音声処理部181が処理した音に制御用ワードが含まれるか否かを判断する。
The
音声認識部182は、所定のキーワードを取得する前に操作部14に対する操作によりインターホン玄関装置(ロビーインターホン20、玄関子機40)と情報端末10との間で通話が行われている場合には、所定のキーワードを取得するまでは、制御用ワードの検出に係る音声認識処理は行わない。音声認識部182は、通話中において、音声処理部181が処理した音に所定のキーワードが含まれるか否かを判断する。音声認識部182は、音声処理部181が処理した音に所定のキーワードが含まれると判断する場合には、制御用ワードの検出に係る音声認識処理を開始する。
When the
音声認識部182は、音声認識で参照する情報である辞書ファイルを変更可能に構成されている。ここで、情報の変更は、音声認識部182が音声認識可能なキーワードの追加を含む。キーワードは、例えば、情報端末10の動作及び情報端末10により制御可能な機器の動作のうち少なくとも一方の一部の動作であって、現時点で登録されている制御用ワード又は所定のキーワードにより制御される当該一部の動作以外の動作を制御するためのワードを含む。上記一部の動作は、インターホンシステム1における通話(インターホン通話)に関する動作を含む。また、上記一部の動作は、情報端末10が設置された施設5で入退するための玄関扉200に設けられた電気錠201の開錠動作を含む。上記一部の動作以外の動作とは、例えばインターホン通話に関する動作及び電気錠201の開錠動作とは異なる動作である。これにより、音声認識で制御可能な動作を追加することができる。
The
さらに、情報の変更は、音声認識部182が音声認識可能な言語の種類(日本語、英語等)の追加、同一言語における表現方法(方言等)の追加、及び同一言語における発音主体(男性、女性、子供、高齢者等)の追加のうち少なくとも1つを含む。具体的には、情報の変更は、音声認識部182が音声認識可能な言語の種類、同一言語における表現方法、同一言語における発音主体のうち少なくとも1つに基づいた辞書ファイル(言語情報に基づく辞書ファイル)の追加を含む。
Furthermore, the information can be changed by adding the types of languages (Japanese, English, etc.) that the
音声認識部182は、情報の変更に係る操作を操作部14が受け付けると、操作部14が受け付けた操作に基づいて、音声認識で参照する情報の変更内容を決定する。例えば、音声認識部182は、音声認識で参照する情報の変更内容として、追加するキーワードを含む辞書ファイル及び言語情報に基づく辞書ファイルのうち少なくとも一方を決定する。音声認識部182は、決定した辞書ファイルをサーバ70に要求する。音声認識部182は、サーバ70に要求した辞書ファイルをサーバ70から受信すると、受信した辞書ファイルを記憶部17に記憶する。
When the
音声認識部182は、音声認識で参照する情報の変更内容として、記憶部17で記憶している辞書ファイルの削除を決定する。音声認識部182は、削除対象の辞書ファイルを記憶部17から削除する。
The
制御処理部183は、音声認識部182の音声認識結果に基づいて制御を行う。制御処理部183は、情報端末10の動作、及び情報端末10により制御可能な機器の動作のうち少なくとも一方の一部の動作を、音声認識部182の音声認識結果に基づいて制御可能に構成されている。
The
制御処理部183は、通信対象のインターホン玄関装置(ロビーインターホン20、玄関子機40)との通信(通話)を開始する指示を受け取ると、情報端末10の動作を制御する。例えば、制御処理部183は、情報端末10とインターホン玄関装置(ロビーインターホン20、玄関子機40)との間で通話が行えるように、情報端末10とインターホン玄関装置との間の通信を確立するように、第1通信部11又は第2通信部12を制御する。
The
制御処理部183は、音声処理部181が処理した音において制御用ワードが含まれるか否かの音声認識部182による判断結果に応じて、情報端末10により制御可能な機器の動作を制御する。例えば、制御処理部183は、音声認識部182による制御用ワードの検出の有無に応じて、インターホンシステム1における制御に係る処理を行う。より詳細には、制御処理部183は、音声処理部181が処理した音に制御用ワードが含まれると音声認識部182が判断すると、音声処理部181が処理した音に含まれる制御用ワードに応じた処理を行う。例えば、情報端末10がロビーインターホン20と通信中に、情報端末10は、ユーザから制御用ワードとして“ドアを開けて”を含む音声を受け取る。この場合、音声認識部182は、音声処理部181が処理した音声に制御用ワード“ドアを開けて”が含まれると判断する。制御処理部183は、共用玄関E1から入室するための玄関扉200の電気錠201の開錠動作を制御する。例えば、制御処理部183は、共用玄関E1から入室するための玄関扉200の電気錠が開錠動作を行うように制御装置30を制御する。
The
さらに、制御処理部183は、ユーザから操作部14が所定の操作を受け付けた場合に、上記玄関扉200の電気錠201の開錠を制御する。
Further, the
表示処理部184は、表示部16に通信対象であるインターホン玄関装置(ロビーインターホン20、玄関子機40)が撮像した画像を表示させるための処理を行う。
The
送出部185は、音取得部13が取得した音に係る音データ(音情報)を、通話先の人が操作する装置に出力する。具体的には、送出部185は、音声処理部181でノイズの抑制又は除去がされた音の信号を、第1通信部11又は第2通信部12を介して、通信対象のインターホン玄関装置(ロビーインターホン20、玄関子機40)に送信する。例えば、情報端末10がロビーインターホン20と通信を行っている場合には、送出部185は、音声処理部181でノイズの抑制又は除去がされた音の信号を、第1通信部11を介してロビーインターホン20に送信する。
The
(2−2)ロビーインターホン
ロビーインターホン20は、図2に示すように、通信部21と、制御部22と、通話部23と、表示部24と、操作部25と、記憶部26と、撮像部27と、を備えている。
(2-2) Lobby intercom As shown in FIG. 2, the
ロビーインターホン20は、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部22として機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
The
通信部21は、情報端末10(の第1通信部11)と通信するための通信インタフェースである。通信部21は、第1幹線61を介して制御装置30(の通信部31)に接続されている。通信部21は、制御装置30を介して、情報端末10に対して音声信号、及び映像信号等を送信する。さらに、通信部21は、制御装置30を介して、情報端末10から音声信号、及び制御信号等を受信する。ここで、ロビーインターホン20からの通信信号には、情報端末10を特定するための情報(例えば、アドレス情報等)が含まれている。そのため、この通信信号に含まれるアドレス情報と一致するアドレス情報が割り当てられた情報端末10のみが通信信号を受信することができる。
The
制御部22は、通信部21、通話部23、及び撮像部27等を制御するように構成されている。
The
通話部23は、スピーカ及びマイクロホンを含み、情報端末10との間で通話可能に構成されている。
The
表示部24は、例えば、液晶ディスプレイである。表示部24は、撮像部27が撮像した映像を表示するように構成されている。また、表示部24は、訪問者等に対してメッセージを表示するように構成されている。メッセージは、例えば、訪問者等に発話を促すためのメッセージである。表示部24は、例えば、「お話しください」等のメッセージを表示する。この場合において、同様の音声メッセージを通話部23のスピーカ、又は通話部23のスピーカとは別に設けられたスピーカから出力(報知)してもよい。また、表示部24とスピーカとを併用してもよい。なお、情報端末10がタッチパネルディスプレイを備えている場合には、タッチパネルディスプレイが表示部24と操作部25とを兼ねてもよい。
The
操作部25は、ユーザ(例えば、集合住宅5への訪問者、住人等)の操作を受け付けるように構成されている。操作部25は、例えば、複数の押ボタンスイッチ、及びタッチパネル等を有する入力インタフェースである。
The
記憶部26は、読み書き可能なメモリで構成されている。記憶部26は、例えば、フラッシュメモリである。記憶部26は、例えば、撮像部27で撮像された映像(画像)の映像データを記憶する。
The
撮像部27は、撮像素子を有し、被写体(ユーザ)を撮像するためのカメラである。本実施形態では、撮像部27の撮像エリア(視野)は、情報端末10の前方に設定されている。本実施形態では、撮像部27は動画を撮像するカメラである。さらに、本実施形態では、撮像部27はカラー画像を撮像するカメラである。なお、撮像部27は、静止画を撮像するカメラ(スチルカメラ)であってもよいし、モノクロ画像を撮像するカメラであってもよい。
The image pickup unit 27 is a camera having an image pickup element and for taking an image of a subject (user). In the present embodiment, the imaging area (field of view) of the imaging unit 27 is set in front of the
撮像素子は、例えば、CCD(Charge Coupled Devices)イメージセンサ、又はCMOS(Complementary Metal-Oxide Semiconductor)イメージセンサ等の二次元イメージセンサである。撮像部27は、被写体からの光をレンズ等の光学系によって撮像素子の撮像面(受光面)上に結像させ、撮像素子にて被写体からの光を電気信号に変換する。そして、撮像部27は、撮像素子の出力信号を映像信号として制御部22に出力する。
The image sensor is, for example, a two-dimensional image sensor such as a CCD (Charge Coupled Devices) image sensor or a CMOS (Complementary Metal-Oxide Semiconductor) image sensor. The image pickup unit 27 forms an image of light from the subject on the image pickup surface (light receiving surface) of the image pickup element by an optical system such as a lens, and the image pickup element converts the light from the subject into an electric signal. Then, the image pickup unit 27 outputs the output signal of the image pickup element to the
(2−3)制御装置
制御装置30は、図2に示すように、通信部31と、制御部32と、記憶部33と、を備えている。
(2-3) Control device As shown in FIG. 2, the
制御装置30は、例えばプロセッサ及びメモリを有するマイクロコンピュータを有している。そして、プロセッサがメモリに格納されているプログラムを実行することにより、マイクロコンピュータが制御部32として機能する。プロセッサが実行するプログラムは、ここではマイクロコンピュータのメモリに予め記録されているが、メモリカード等の非一時的な記録媒体に記録されて提供されてもよいし、インターネット等の電気通信回線を通じて提供されてもよい。
The
通信部31は、各情報端末10、及びロビーインターホン20と通信するための通信インタフェースを含んでいる。通信部31は、第1幹線61を介してロビーインターホン20に接続され、第2幹線62を介して各情報端末10に接続されている。つまり、通信部31は、各情報端末10とロビーインターホン20との間の通信を中継するように構成されている。さらに、通信部31は、玄関扉200の電気錠201に接続され、電気錠201と通信可能に構成されている。
The
制御部32は、通信部31を制御するように構成されている。制御部32は、情報端末10からの指示により、玄関扉200の電気錠201の開錠動作を制御する。例えば、制御部32は、開錠を指示する開錠信号を電気錠201に通信部31を介して出力する。
The
記憶部33は、読み書き可能なメモリで構成されている。記憶部33は、例えば、フラッシュメモリである。記憶部33は、例えば、各住戸E2に割り当てられた部屋番号と、各情報端末10に割り当てられたアドレス情報との対応関係を表す対応テーブルを記憶する。つまり、制御装置30では、制御部32は、対応テーブルを参照して、ロビーインターホン20からの信号に含まれる部屋番号を対応する情報端末10のアドレス情報に置き換えた信号を作成し、この信号を通信部31から各情報端末10に送信させる。そして、各情報端末10では、制御部18は、第1通信部11が受信した信号に含まれるアドレス情報が、記憶部17に記憶されているアドレス情報と一致する場合には、この信号に含まれる情報を取得する。また、各情報端末10では、制御部18は、第1通信部11が受信した信号に含まれるアドレス情報が、記憶部17に記憶されているアドレス情報と一致しない場合には、この信号に含まれる情報を破棄する。
The
なお、本実施形態では、通信部31が電気錠201と接続されている構成としたが、この構成に限定されない。制御装置30は、通信部31とは別の通信部を有し、当該別の通信部が電気錠201と接続される構成であってもよい。
In the present embodiment, the
(2−4)玄関子機
各玄関子機40は、図2に示すように、接続線64を介して対応する情報端末10に接続されている。玄関子機40は、情報端末10に対して音声信号、及び映像信号等を送信する。さらに、玄関子機40は、情報端末10から音声信号、及び制御信号等を受信する。
(2-4) Entrance Slave Unit As shown in FIG. 2, each
(3)動作
ここでは、情報端末10の動作について説明する。
(3) Operation Here, the operation of the
(3−1)辞書ファイルの設定処理
まず、情報端末10が辞書ファイルの設定(変更)する際の処理、特に辞書ファイルを追加する際の処理について、図3を用いて説明する。
(3-1) Dictionary File Setting Process First, a process when the
情報端末10の音声認識部182は、情報の変更に係る操作を操作部14が受け付けると、操作部14が受け付けた操作に基づいて、音声認識で参照する情報の変更内容を決定する(ステップS1)。具体的には、表示部16は、追加可能な辞書ファイルの一覧を表示する。操作部14は、表示部16で表示された辞書ファイルの一覧から、追加対象となる少なくとも1つの辞書ファイルの選択に係る操作を受け付ける。音声認識部182は、選択された少なくとも1つの辞書ファイルを特定することで、音声認識で参照する情報の変更内容を決定する。音声認識部182は、選択された少なくとも1つの辞書ファイルを、サーバ70から取得する(ステップS2)。具体的には、音声認識部182は、選択された少なくとも1つの辞書ファイルをサーバ70に要求し、要求した少なくとも1つの辞書ファイルをサーバ70から受信する。
When the
音声認識部182は、設定処理を行う(ステップS3)。具体的には、音声認識部182は、取得した少なくとも1つの辞書ファイルを、記憶部17に記憶する。
The
(3−2)通話時の動作
ここでは、通話時における情報端末10の動作について、図4を用いて説明する。
(3-2) Operation during a call Here, the operation of the
音取得部13は、インターホン玄関装置(ロビーインターホン20、玄関子機40)から呼び出しが行われている場合、住戸E2のユーザからの音声を含む音を取得する(ステップS11)。
The
音声認識部182は、インターホン玄関装置から呼び出しが行われている場合、つまりインターホンが非通話である場合に、音声認識処理により、音声処理部181が処理した音に所定のキーワードが含まれるか否かを判断する(ステップS12)。
When the
音声処理部181が処理した音に所定のキーワードが含まれないと音声認識部182が判断する場合(ステップS12における「No」)、処理はステップS11に戻る。
When the
音声処理部181が処理した音に所定のキーワードが含まれると音声認識部182が判断する場合(ステップS12における「Yes」)、音声認識部182は、音声認識処理を行う。具体的には、音声認識部182は、インターホン玄関装置との通信(通話)を開始するよう、制御処理部183を制御する。音声認識部182は、情報端末10とインターホン玄関装置との間の通信が終了するまで、音声認識処理を行う。より詳細には、音声認識部182は、通話開始後において、インターホンシステム1における制御に係るキーワード(制御用ワード)の検出に係る音声認識処理を行う。
When the
音声認識部182は、制御用ワードを検出したか否かを判断する(ステップS14)。具体的には、音声認識部182は、音声処理部181が処理した音に制御用ワードが含まれるか否かを判断する。音声認識部182は、音声処理部181が処理した音に制御用ワードが含まれると判断する場合、制御用ワードを検出したと判断する。音声認識部182は、音声処理部181が処理した音に制御用ワードが含まれないと判断する場合、制御用ワードを検出していないと判断する。
The
制御用ワードを検出していないと音声認識部182が判断した場合(ステップS14における「No」)、処理はステップS13に戻る。音声認識部182は、通話中に音声処理部181が処理した音を用いて制御用ワードの検出に係る音声認識処理を行う。
When the
制御用ワードを検出したと音声認識部182が判断した場合(ステップS14における「Yes」)、制御処理部183は、制御処理を行う(ステップS15)。制御処理部183は、音声認識部182が検出した制御用ワードに応じて、情報端末10により制御対象の機器の動作を制御する。例えば、情報端末10がロビーインターホン20と通信中に、情報端末10は、ユーザから制御用ワードとして“ドアを開けて”を含む音声を受け取る。この場合、制御処理部183は、共用玄関E1から入室するための玄関扉200の電気錠201の開錠を行うように制御装置30を制御する。
When the
制御処理部183は、通話が終了したか否かを判断する(ステップS16)。通話が終了したと制御処理部183が判断する場合(ステップS16における「Yes」)、処理は終了する。通話が終了したと制御処理部183が判断する場合(ステップS16における「Yes」)、処理はステップS13に戻る。
The
(4)利点
以上説明したように、本実施形態の情報端末10は、インターホン装置(インターホン親機)として動作する。情報端末10は、音取得部13と、音声認識部182と、制御処理部183と、を備える。音取得部13は、少なくともユーザの音声を含む音を取得する。音声認識部182は、音取得部13が取得した音に基づいた音声認識を行う。制御処理部183は、音声認識部182の音声認識結果に基づいて制御を行う。音声認識部182は、音声認識で参照する情報を変更可能に構成されている。
(4) Advantages As described above, the
この構成によると、音声認識で参照する情報を変更することが可能であるので、ユーザの音声の特徴に応じた情報を音声認識で参照することが可能になる。これにより、本実施形態の情報端末10は、音声認識の精度をより高めることが可能である。
According to this configuration, it is possible to change the information referred to by voice recognition, so that it is possible to refer to information according to the characteristics of the user's voice by voice recognition. As a result, the
本実施形態において、音声認識で参照する情報の変更は、音声認識部182が音声認識可能な言語の種類の追加、同一言語における表現方法の追加、及び同一言語における発音主体の追加のうち少なくとも1つを含む。
In the present embodiment, the change of the information referred to by the voice recognition is at least one of the addition of the type of language that the
これにより、音声認識に用いる情報をユーザに適した情報に変更することができるので、音声認識の処理負荷を高めることなく、精度良く行うことが可能である。
音声認識の精度をより高めることできる。
As a result, the information used for voice recognition can be changed to information suitable for the user, so that the information can be performed accurately without increasing the processing load of voice recognition.
The accuracy of voice recognition can be further improved.
(5)変形例
上記実施形態は、本開示の様々な実施形態の一つに過ぎない。上記実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。
(5) Modified Example The above embodiment is only one of various embodiments of the present disclosure. The above-described embodiment can be changed in various ways depending on the design and the like as long as the object of the present disclosure can be achieved.
以下、上記の実施形態の変形例を列挙する。以下に説明する変形例は、適宜組み合わせて適用可能である。 Hereinafter, modifications of the above embodiment will be listed. The modifications described below can be applied in combination as appropriate.
(5−1)変形例1
インターホンシステム1は、住戸E2に設けられた警報システム80(図5参照)と連動させてもよい。警報システム80は、例えば、不審者の侵入を検知するシステム、火災等を検知するシステムを含む。情報端末10は、警報システム80が不審者の侵入を検知すると、警報音を出力する。さらに、情報端末10は、警報システム80が火災を検知すると、警報音を出力する。
(5-1) Modification 1
The intercom system 1 may be linked with the alarm system 80 (see FIG. 5) provided in the dwelling unit E2. The warning system 80 includes, for example, a system for detecting the intrusion of a suspicious person, a system for detecting a fire, and the like. When the alarm system 80 detects the intrusion of a suspicious person, the
この場合、制御処理部183が制御可能な制御として警報システム80の確認動作を制御してもよい。例えば、制御処理部183は、音声認識の結果に応じて、警報音の出力を確認するために当該警報音を出力するように、情報端末10を制御する。また、制御処理部183は、警報音の出力中における音声認識の結果に応じて、警報音の出力を停止するために当該警報音の出力を停止するように、情報端末10を制御する。
In this case, the confirmation operation of the alarm system 80 may be controlled as controllable control by the
なお、音声認識部182が、情報の変更(追加)に係る処理時に、警報音の出力又は停止に係る辞書ファイル、つまり警報音の出力又は停止を行うための制御用ワードを含む辞書ファイルを取得した場合には、上述した一部の動作以外の動作として、警報音の出力又は停止が相当する。
The
(5−2)変形例2
上記実施形態では、音声認識の結果に応じた情報端末10の動作を制御として、通信対象のインターホン玄関装置(ロビーインターホン20、玄関子機40)に応じた第1通信部11又は第2通信部12の制御を一例として説明した。しかしながら、情報端末10の動作の制御は、これに限定されない。
(5-2) Modification 2
In the above embodiment, the operation of the
例えば、制御処理部183は、音声認識により、出力部15が出力する音の音量を調整してもよい。なお、音声認識部182が、情報の変更(追加)に係る処理時に、音量調整に係る辞書ファイル、つまり音量調整を行うための制御用ワードを含む辞書ファイルを取得した場合には、上述した一部の動作以外の動作として、音量調整が相当する。
For example, the
(5−3)変形例3
上記実施形態において、インターホン通話中において、音取得部13が所定のキーワードを取得した場合に音声認識部182が制御用ワードの検出に係る音声認識処理を開始する構成としたが、この構成に限定されない。
(5-3) Modification 3
In the above embodiment, the
インターホン通話中において、音取得部13が所定のキーワードを取得することは必須ではない。すなわち、音声認識部182は、情報端末10とインターホン玄関装置(ロビーインターホン20、玄関子機40)とを用いた通話が開始されると、音取得部13が所定のキーワードを取得しなくても制御用ワードの検出に係る音声認識処理を開始する。言い換えると、音声認識部182は、インターホン通話中において、音取得部13による所定のキーワードの取得に依存することなく、制御に係る音声認識として制御用ワードの検出に係る音声認識処理を開始する。
It is not essential for the
(5−4)変形例4
上記実施形態において、情報端末10は、住戸端末(インターホン親機)とする構成としたが、この構成に限定されない。
(5-4) Modification 4
In the above embodiment, the
情報端末10は、インターホン玄関装置(ロビーインターホン20、玄関子機40)と通信可能に構成されている端末であればよく、例えばタブレット端末、スマートフォンであってもよい。
The
(5−5)変形例5
本実施形態では、制御装置30が電気錠201の開錠動作を制御する構成としたが、この構成に限定されない。
(5-5)
In the present embodiment, the
ロビーインターホン20が電気錠201の開錠動作を制御してもよい。この場合、ロビーインターホン20は、情報端末10からの電気錠201の開錠に係る指示を受け取ると、開錠信号を電気錠201に出力する。
The
(その他の変形例)
上記実施形態は、本開示の様々な実施形態の一つに過ぎない。上記実施形態は、本開示の目的を達成できれば、設計等に応じて種々の変更が可能である。また、情報端末10と同様の機能は、処理方法、コンピュータプログラム、又はプログラムを記録した非一時的な記録媒体等で具現化されてもよい。一態様に係る情報端末10の処理方法は、インターホン装置として動作する情報端末で用いられる処理方法である。処理方法は、音取得ステップと、音声認識ステップと、制御処理ステップと、を含む。音取得ステップは、少なくともユーザの音声を含む音を取得する。音声認識ステップは、音取得ステップで取得した音に基づいた音声認識処理を行う。制御処理ステップは、音声認識ステップでの音声認識結果に基づいて制御を行う。音声認識処理は、音声認識で参照する情報を変更可能に構成されている。一態様に係るプログラムは、コンピュータシステムを、上述した情報端末10又は情報端末10の処理方法として機能させるためのプログラムである。
(Other variants)
The above embodiment is only one of the various embodiments of the present disclosure. The above-described embodiment can be changed in various ways depending on the design and the like as long as the object of the present disclosure can be achieved. Further, the same function as that of the
本開示における情報端末10又は情報端末10の処理方法の実行主体は、コンピュータシステムを含んでいる。コンピュータシステムは、ハードウェアとしてのプロセッサ及びメモリを有する。コンピュータシステムのメモリに記録されたプログラムをプロセッサが実行することによって、本開示における情報端末10又は情報端末10の処理方法の実行主体としての機能が実現される。プログラムは、コンピュータシステムのメモリに予め記録されていてもよいが、電気通信回線を通じて提供されてもよい。また、プログラムは、コンピュータシステムで読み取り可能なメモリカード、光学ディスク、ハードディスクドライブ等の非一時的な記録媒体に記録されて提供されてもよい。コンピュータシステムのプロセッサは、半導体集積回路(IC)又は大規模集積回路(LSI)を含む1乃至複数の電子回路で構成される。ここでいうIC又はLSI等の集積回路は、集積の度合いによって呼び方が異なっており、システムLSI、VLSI(Very Large Scale Integration)、又はULSI(Ultra Large Scale Integration)と呼ばれる集積回路を含む。さらに、LSIの製造後にプログラムされる、FPGA(Field-Programmable Gate Array)、又はLSI内部の接合関係の再構成若しくはLSI内部の回路区画の再構成が可能な論理デバイスについても、プロセッサとして採用することができる。複数の電子回路は、1つのチップに集約されていてもよいし、複数のチップに分散して設けられていてもよい。複数のチップは、1つの装置に集約されていてもよいし、複数の装置に分散して設けられていてもよい。
The execution subject of the
また、情報端末10における複数の機能が、1つの筐体内に集約されていることは情報端末10に必須の構成ではなく、情報端末10の構成要素は、複数の筐体に分散して設けられていてもよい。さらに、情報端末10の少なくとも一部の機能、例えば、情報端末10の一部の機能がクラウド(クラウドコンピューティング)等によって実現されてもよい。
Further, it is not an essential configuration for the
(まとめ)
以上説明したように、第1の態様の情報端末(10)は、インターホン装置として動作する。情報端末(10)は、音取得部(13)と、音声認識部(182)と、制御処理部(183)と、を備える。音取得部(13)は、少なくともユーザの音声を含む音を取得する。音声認識部(182)は、音取得部(13)が取得した音に基づいた音声認識を行う。制御処理部(183)は、音声認識部(182)の音声認識結果に基づいて制御を行う。音声認識部(182)は、音声認識で参照する情報を変更可能に構成されている。
(summary)
As described above, the information terminal (10) of the first aspect operates as an intercom device. The information terminal (10) includes a sound acquisition unit (13), a voice recognition unit (182), and a control processing unit (183). The sound acquisition unit (13) acquires at least a sound including the user's voice. The voice recognition unit (182) performs voice recognition based on the sound acquired by the sound acquisition unit (13). The control processing unit (183) controls based on the voice recognition result of the voice recognition unit (182). The voice recognition unit (182) is configured so that the information referred to in the voice recognition can be changed.
この構成によると、音声認識の精度をより高めることが可能である。 According to this configuration, it is possible to further improve the accuracy of voice recognition.
第2の態様の情報端末(10)は、第1の態様において、外部(例えば、サーバ70)と通信する通信部(例えば、第3通信部19)を、更に備える。音声認識部(182)は、通信部が外部から受信した情報に基づいて音声認識に用いる情報の変更を行う。 In the first aspect, the information terminal (10) of the second aspect further includes a communication unit (for example, a third communication unit 19) that communicates with the outside (for example, the server 70). The voice recognition unit (182) changes the information used for voice recognition based on the information received from the outside by the communication unit.
この構成によると、音声認識に用いる情報を受信するので、情報端末(10)が音声認識に必要な情報のみを、情報端末(10)に記憶することができる。これにより、情報端末(10)は、ローカルで音声認識を行うので、取得した音声に対する応答性が、音声認識を外部の装置で行う場合と比較して高くなる。 According to this configuration, since the information used for voice recognition is received, the information terminal (10) can store only the information necessary for voice recognition in the information terminal (10). As a result, since the information terminal (10) performs voice recognition locally, the responsiveness to the acquired voice becomes higher than in the case where the voice recognition is performed by an external device.
第3の態様の情報端末(10)では、第1又は第2の態様において、情報の変更は、音声認識部(182)が音声認識可能なキーワード(例えば、所定のキーワード、制御用ワード)の追加を含む。 In the information terminal (10) of the third aspect, in the first or second aspect, the change of information is performed on a keyword (for example, a predetermined keyword, a control word) that can be voice-recognized by the voice recognition unit (182). Including additions.
この構成によると、ユーザに応じたキーワードを登録することができる。 According to this configuration, keywords according to the user can be registered.
第4の態様の情報端末(10)では、第3の態様において、制御処理部(183)は、情報端末(10)の動作、及び情報端末(10)により制御可能な機器の動作のうち少なくとも一方の一部の動作を、音声認識部(182)の音声認識結果に基づいて制御可能に構成されている。変更によって追加されるキーワードは、一部の動作以外の動作を制御するためのワードを含む。 In the information terminal (10) of the fourth aspect, in the third aspect, the control processing unit (183) has at least one of the operation of the information terminal (10) and the operation of the device controllable by the information terminal (10). One part of the operation can be controlled based on the voice recognition result of the voice recognition unit (182). Keywords added by the change include words to control actions other than some actions.
この構成によると、音声認識より制御可能な動作を追加することができる。 According to this configuration, it is possible to add an operation that can be controlled by voice recognition.
第5の態様の情報端末(10)では、第4の態様において、上記一部の動作は、インターホン通話に関する動作を含む。 In the information terminal (10) of the fifth aspect, in the fourth aspect, some of the above operations include an operation related to an intercom call.
この構成によると、音声認識によりインターホン通話を行うことができる。 According to this configuration, it is possible to make an intercom call by voice recognition.
第6の態様の情報端末(10)では、第4又は第5の態様において、一部の動作は、情報端末(10)が設置された施設(5)で入退するための玄関扉(200)に設けられた電気錠(201)の開錠動作、及び施設(5)内の警報システムの確認動作のうち少なくとも一方の動作を含む。 In the information terminal (10) of the sixth aspect, in the fourth or fifth aspect, some operations are performed by the entrance door (200) for entering and exiting at the facility (5) where the information terminal (10) is installed. ), And at least one of the operation of unlocking the electric lock (201) and the operation of confirming the warning system in the facility (5).
この構成によると、音声認識により電子錠の開錠動作及び警報システム(80)の確認動作のうち少なくとも一方の動作を含むことができる。 According to this configuration, at least one of the unlocking operation of the electronic lock and the confirmation operation of the alarm system (80) can be included by voice recognition.
第7の態様の情報端末(10)では、第1〜第6のいずれかの態様において、音声認識部(182)は、インターホン通話中において音声認識が実行可能に構成されている。 In the information terminal (10) of the seventh aspect, in any one of the first to sixth aspects, the voice recognition unit (182) is configured to be capable of performing voice recognition during an intercom call.
この構成によると、インターホンでの通話中においても音声認識による操作が可能となる。 According to this configuration, it is possible to operate by voice recognition even during a call with the intercom.
第8の態様の情報端末(10)では、第7の態様において、音声認識部(182)は、インターホンが非通話である場合に所定のキーワードを音取得部(13)が音を取得すると、制御に係る音声認識を開始する。音声認識部(182)は、インターホンが通話中である場合に所定のキーワードを音取得部(13)が音を取得すると制御に係る音声認識を開始、又はインターホンが通話中である場合には所定のキーワードの取得に依存することなく制御に係る音声認識を開始する。 In the information terminal (10) of the eighth aspect, in the seventh aspect, when the voice recognition unit (182) acquires a predetermined keyword when the intercom is non-calling, the sound acquisition unit (13) acquires the sound. Start voice recognition related to control. The voice recognition unit (182) starts voice recognition related to control when the sound acquisition unit (13) acquires a sound of a predetermined keyword when the interphone is in a call, or is predetermined when the interphone is in a call. Start voice recognition related to control without depending on the acquisition of the keyword of.
この構成によると、インターホンによる通話状態に関係なく、音声認識による操作が可能となる。 According to this configuration, the operation by voice recognition is possible regardless of the call state by the intercom.
第9の態様の情報端末(10)は、第1〜第8のいずれかの態様において、操作部(14)を、更に備える。音声認識部(182)は、操作部(14)が受け付けた操作に基づいて、音声認識で参照する情報の変更内容を決定する。 The information terminal (10) of the ninth aspect further includes an operation unit (14) in any one of the first to eighth aspects. The voice recognition unit (182) determines the content of the change of the information referred to in the voice recognition based on the operation received by the operation unit (14).
この構成によると、ユーザによる操作に基づいて情報の変更内容を決定することができる。 According to this configuration, it is possible to determine the content of information to be changed based on the operation by the user.
第10の態様の情報端末(10)では、第1〜第9のいずれかの態様において、情報の変更は、音声認識部が音声認識可能な言語の種類の追加、同一言語における表現方法の追加、及び同一言語における発音主体の追加のうち少なくとも1つを含む。 In the information terminal (10) of the tenth aspect, in any one of the first to ninth aspects, the change of information is the addition of the type of language that the voice recognition unit can recognize the voice, and the addition of the expression method in the same language. , And at least one of the additions of the sounding subject in the same language.
この構成によると、ユーザが発する音声に適した情報を追加することができる。 According to this configuration, it is possible to add information suitable for the voice emitted by the user.
第11の態様のインターホンシステム(1)は、第1〜第10のいずれかの態様の情報端末(10)と、情報端末(10)と通信するインターホン玄関装置(ロビーインターホン20、玄関子機40)と、を備える。
The intercom system (1) of the eleventh aspect is an intercom entrance device (
この構成によると、音声認識の精度をより高めることが可能である。 According to this configuration, it is possible to further improve the accuracy of voice recognition.
第12の態様の処理方法は、インターホン装置として動作する情報端末(10)で用いられる。処理方法は、音取得ステップと、音声認識ステップと、制御ステップと、を含む。音取得ステップは、少なくともユーザの音声を含む音を取得する。音声認識ステップは、音取得ステップで取得した音に基づいた音声認識処理を行う。制御処理ステップは、音声認識ステップでの音声認識結果に基づいて制御を行う。音声認識処理は、音声認識で参照する情報を変更可能に構成されている。 The processing method of the twelfth aspect is used in the information terminal (10) operating as an intercom device. The processing method includes a sound acquisition step, a voice recognition step, and a control step. The sound acquisition step acquires at least a sound including the user's voice. The voice recognition step performs voice recognition processing based on the sound acquired in the sound acquisition step. The control processing step controls based on the voice recognition result in the voice recognition step. The voice recognition process is configured so that the information referred to in the voice recognition can be changed.
この処理方法によると、音声認識の精度をより高めることが可能である。 According to this processing method, it is possible to further improve the accuracy of voice recognition.
第13の態様のプログラムは、コンピュータに、第12の態様の処理方法を実行させるためのプログラムである。 The program of the thirteenth aspect is a program for causing a computer to execute the processing method of the twelfth aspect.
このプログラムによると、音声認識の精度をより高めることが可能である。 According to this program, it is possible to improve the accuracy of speech recognition.
1 インターホンシステム
5 集合住宅
10 情報端末
13 音取得部
14 操作部
19 第3通信部(通信部)
20 ロビーインターホン(インターホン玄関装置)
40 玄関子機(インターホン玄関装置)
70 サーバ(外部)
80 警報システム
182 音声認識部
183 制御処理部
200 玄関扉(扉)
201 電気錠
1
20 Lobby intercom (intercom entrance device)
40 Entrance slave unit (intercom entrance device)
70 server (external)
80
201 electric lock
Claims (13)
少なくともユーザの音声を含む音を取得する音取得部と、
前記音取得部が取得した前記音に基づいた音声認識を行う音声認識部と、
前記音声認識部の音声認識結果に基づいて制御を行う制御処理部と、を備え、
前記音声認識部は、音声認識に参照する情報を変更可能に構成されている、
情報端末。 An information terminal that operates as an intercom device
A sound acquisition unit that acquires at least the sound including the user's voice,
A voice recognition unit that performs voice recognition based on the sound acquired by the sound acquisition unit, and a voice recognition unit.
A control processing unit that performs control based on the voice recognition result of the voice recognition unit is provided.
The voice recognition unit is configured to be able to change the information referred to for voice recognition.
Information terminal.
前記音声認識部は、前記通信部が外部から受信した情報に基づいて前記音声認識に用いる情報の変更を行う、
請求項1に記載の情報端末。 Further equipped with a communication unit that communicates with the outside
The voice recognition unit changes the information used for the voice recognition based on the information received from the outside by the communication unit.
The information terminal according to claim 1.
請求項1又は2に記載の情報端末。 The change of the information includes the addition of a keyword that can be voice-recognized by the voice recognition unit.
The information terminal according to claim 1 or 2.
前記情報端末の動作、及び前記情報端末により制御可能な機器の動作のうち少なくとも一方の一部の動作を、前記音声認識部の音声認識結果に基づいて制御可能に構成されており、
前記変更によって追加されるキーワードは、前記一部の動作以外の動作を制御するためのワードを含む、
請求項3に記載の情報端末。 The control processing unit
The operation of the information terminal and the operation of at least one part of the operation of the device controllable by the information terminal can be controlled based on the voice recognition result of the voice recognition unit.
The keywords added by the change include words for controlling actions other than some of the actions.
The information terminal according to claim 3.
請求項4に記載の情報端末。 Some of the operations include operations related to intercom calls.
The information terminal according to claim 4.
請求項4又は5に記載の情報端末。 The partial operation is an operation of at least one of an operation of unlocking an electric lock provided on a door for entering and exiting at a facility where the information terminal is installed and an operation of confirming an alarm system in the facility. include,
The information terminal according to claim 4 or 5.
請求項1〜6のいずれか一項に記載の情報端末。 The voice recognition unit is configured so that the voice recognition can be executed during an intercom call.
The information terminal according to any one of claims 1 to 6.
インターホンが非通話である場合に所定のキーワードを前記音取得部が前記音を取得すると、前記制御に係る前記音声認識を開始し、
インターホンが通話中である場合に前記所定のキーワードを前記音取得部が前記音を取得すると前記制御に係る前記音声認識を開始、又はインターホンが通話中である場合には前記所定のキーワードの取得に依存することなく前記制御に係る前記音声認識を開始する、
請求項7に記載の情報端末。 The voice recognition unit
When the sound acquisition unit acquires the sound with a predetermined keyword when the intercom is non-calling, the voice recognition related to the control is started.
When the sound acquisition unit acquires the sound when the intercom is in a call, the voice recognition related to the control is started, or when the intercom is in a call, the predetermined keyword is acquired. The voice recognition related to the control is started without depending on the control.
The information terminal according to claim 7.
前記音声認識部は、前記操作部が受け付けた操作に基づいて、前記音声認識で参照する前記情報の変更内容を決定する、
請求項1〜8のいずれか1項に記載の情報端末。 Further equipped with an operation unit
The voice recognition unit determines the content of the change of the information referred to in the voice recognition based on the operation received by the operation unit.
The information terminal according to any one of claims 1 to 8.
請求項1〜9のいずれか1項に記載の情報端末。 The change of the information includes at least one of the addition of the type of language that the voice recognition unit can recognize, the addition of the expression method in the same language, and the addition of the sounding subject in the same language.
The information terminal according to any one of claims 1 to 9.
前記情報端末と通信するインターホン玄関装置と、を備える、
インターホンシステム。 The information terminal according to any one of claims 1 to 10 and
An intercom entrance device that communicates with the information terminal is provided.
Intercom system.
少なくともユーザの音声を含む音を取得する音取得ステップと、
前記音取得ステップで取得した前記音に基づいた音声認識処理を行う音声認識ステップと、
前記音声認識ステップでの音声認識結果に基づいて制御を行う制御処理ステップと、を含み、
前記音声認識処理は、音声認識で参照する情報を変更可能に構成されている、
処理方法。 It is a processing method used in an information terminal that operates as an intercom device.
A sound acquisition step to acquire at least the sound including the user's voice,
A voice recognition step that performs voice recognition processing based on the sound acquired in the sound acquisition step, and a voice recognition step.
A control processing step that controls based on the voice recognition result in the voice recognition step is included.
The voice recognition process is configured so that the information referred to in the voice recognition can be changed.
Processing method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020040037A JP2021140114A (en) | 2020-03-09 | 2020-03-09 | Information terminal, intercom system, processing method and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020040037A JP2021140114A (en) | 2020-03-09 | 2020-03-09 | Information terminal, intercom system, processing method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021140114A true JP2021140114A (en) | 2021-09-16 |
Family
ID=77668534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020040037A Pending JP2021140114A (en) | 2020-03-09 | 2020-03-09 | Information terminal, intercom system, processing method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2021140114A (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003319079A (en) * | 2002-04-22 | 2003-11-07 | Matsushita Electric Works Ltd | Hands-free intercom |
JP2008219288A (en) * | 2007-03-01 | 2008-09-18 | Matsushita Electric Works Ltd | Intercom master unit and intercom system |
JP2010204442A (en) * | 2009-03-04 | 2010-09-16 | Nec Corp | Speech recognition device, speech recognition method, speech recognition program and program recording medium |
WO2014171144A1 (en) * | 2013-04-19 | 2014-10-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Control method for household electrical appliance, household electrical appliance control system, and gateway |
JP2018063328A (en) * | 2016-10-12 | 2018-04-19 | 株式会社東芝 | Electronic apparatus and method for controlling the same |
-
2020
- 2020-03-09 JP JP2020040037A patent/JP2021140114A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003319079A (en) * | 2002-04-22 | 2003-11-07 | Matsushita Electric Works Ltd | Hands-free intercom |
JP2008219288A (en) * | 2007-03-01 | 2008-09-18 | Matsushita Electric Works Ltd | Intercom master unit and intercom system |
JP2010204442A (en) * | 2009-03-04 | 2010-09-16 | Nec Corp | Speech recognition device, speech recognition method, speech recognition program and program recording medium |
WO2014171144A1 (en) * | 2013-04-19 | 2014-10-23 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Control method for household electrical appliance, household electrical appliance control system, and gateway |
JP2018063328A (en) * | 2016-10-12 | 2018-04-19 | 株式会社東芝 | Electronic apparatus and method for controlling the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104794834A (en) | Intelligent voice doorbell system and implementation method thereof | |
CN110858841B (en) | Electronic device and method for registering new user through authentication of registered user | |
CN112820300B (en) | Audio processing method and device, terminal and storage medium | |
JP7422321B2 (en) | Intercom system, setting method, and program | |
JP2021140114A (en) | Information terminal, intercom system, processing method and program | |
JP2022145842A (en) | Intercom system, control method, and program | |
JP7493187B2 (en) | Call system, control method, and program | |
JP7422320B2 (en) | Intercom system, setting method, and program | |
JP2021141572A (en) | Information terminal, intercom system, processing method and program | |
JP2024072185A (en) | Information terminal, intercom system, voice recognition system, control method, and program | |
JP2024072183A (en) | Information terminal, intercom system, voice recognition system, control method, and program | |
WO2020218146A1 (en) | Intercom system, setting method, and program | |
JP2024072184A (en) | Information terminal, intercom system, control method and program | |
JP2024072182A (en) | Information terminal, intercom system, control method and program | |
JP2021197662A (en) | Information terminal, intercom system, control method, and program | |
JP2020184656A (en) | Sound acquisition control system, information terminal, sound acquisition control method, and program | |
JP7352788B2 (en) | Intercom system, registration method, and program | |
JP7390582B2 (en) | Call system, control method and program | |
JP7390670B2 (en) | Image output method and program for communal entrance handsets, communal entrance handsets | |
JP2021002729A (en) | Intercom system, control method, and program | |
JP2020127088A (en) | Intercom equipment, information terminal, and intercom system | |
JP2024072187A (en) | Information terminal, intercom system, display method and program | |
TW202308366A (en) | Information terminal, intercom system, and program | |
CN112991589A (en) | Intelligent door lock system and sound processing method thereof | |
JP2018170644A (en) | Intercom device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221114 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230829 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240305 |