JP5252119B2 - Elevator voice call registration device - Google Patents
Elevator voice call registration device Download PDFInfo
- Publication number
- JP5252119B2 JP5252119B2 JP2012504246A JP2012504246A JP5252119B2 JP 5252119 B2 JP5252119 B2 JP 5252119B2 JP 2012504246 A JP2012504246 A JP 2012504246A JP 2012504246 A JP2012504246 A JP 2012504246A JP 5252119 B2 JP5252119 B2 JP 5252119B2
- Authority
- JP
- Japan
- Prior art keywords
- elevator
- information
- user
- acoustic model
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000605 extraction Methods 0.000 claims description 26
- 239000000284 extract Substances 0.000 claims description 13
- 230000007423 decrease Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 description 23
- 238000000034 method Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012850 discrimination method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
Images
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66B—ELEVATORS; ESCALATORS OR MOVING WALKWAYS
- B66B1/00—Control systems of elevators in general
- B66B1/34—Details, e.g. call counting devices, data transmission from car to control system, devices giving information to the control system
- B66B1/46—Adaptations of switches or switchgear
- B66B1/461—Adaptations of switches or switchgear characterised by their shape or profile
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- Computer Networks & Wireless Communication (AREA)
- Indicating And Signalling Devices For Elevators (AREA)
- Elevator Control (AREA)
Description
この発明は、エレベータの呼びを音声入力により登録するエレベータの音声呼び登録装置に関するものである。 The present invention relates to an elevator voice call registration device for registering elevator calls by voice input.
エレベータの呼びを音声入力により登録する音声呼び登録装置として、異なる認識手法を用いて音声認識を行う複数の音声認識処理部を備えたものが提案されている。この音声呼び登録装置は、複数の音声認識処理部の認識結果を併せて判定することで音声認識の確度を上げ、音声認識の確度により利用者に行う応答を変更する。これにより、利用者に快適な利用環境を与えることができる(例えば、特許文献1参照)。 As a voice call registration device for registering elevator calls by voice input, a device including a plurality of voice recognition processing units that perform voice recognition using different recognition methods has been proposed. This voice call registration device increases the accuracy of voice recognition by determining the recognition results of a plurality of voice recognition processing units together, and changes the response to the user according to the accuracy of voice recognition. Thereby, a comfortable use environment can be given to a user (for example, refer to patent documents 1).
しかしながら、特許文献1に記載のものを利用した場合、全ての利用者に対して同じ手法で音声認識を行うことになる。このため、音声認識処理部に用意された認識手法のいずれにも合わない音声を認識することができない。このような音声を発する利用者は、いつまでも音声入力による行先呼び等のエレベータの呼びを登録することができない。また、特許文献1に記載のものは、複数の音声認識処理部で同時に認識されないとエレベータの呼びを登録することができない。即ち、特許文献1に記載のものは、全ての利用者に対し、エレベータの呼びの登録を確定する敷居が一律に上がってしまい、使い勝手の悪いものとなっている。
However, when the one described in
これに対し、予め登録した利用者の音声のみ受付可能とする音声呼び登録装置が提案されている。この音声呼び登録装置によれば、音声の誤認識を低減することができる(例えば、特許文献2参照)。さらに、音声の分析結果を蓄積し、蓄積結果に基づいて、話者属性を認識する装置が提案されている。これらの装置によれば、話者属性の特定精度を向上し、音声の誤認識を更に低減することができる(例えば、特許文献3及び4参照)。
On the other hand, a voice call registration device has been proposed that can accept only the voice of a user registered in advance. According to this voice call registration device, voice misrecognition can be reduced (see, for example, Patent Document 2). Furthermore, an apparatus for accumulating speech analysis results and recognizing speaker attributes based on the accumulation results has been proposed. According to these apparatuses, it is possible to improve speaker attribute identification accuracy and further reduce speech misrecognition (see, for example,
しかしながら、特許文献2乃至4に記載のものを音声呼び登録装置に適用した場合、利用者を特定の話者に限定する必要がある。このため、特許文献2乃至4に記載のものの利用範囲は狭くなってしまう。一方、エレベータの音声呼び登録装置は、不特定多数の利用者の音声を認識する必要がある。このため、特許文献2乃至4に記載のものを音声呼び登録装置に適用することは困難である。
However, when the devices described in
これらに対し、利用用途、環境騒音で表される環境属性や発話者の性別や年齢で表される本人属性に合わせた複数の音声認識辞書(認識単語と音響モデル)を備えた装置が提案されている。この装置によれば、実際の環境属性や実際の本人属性を与えて、適切な音声認識辞書を選択することができ、発話者を限定せずに、発話者の特徴に合った音響モデルを選択することができる(例えば、特許文献5参照)。 On the other hand, devices with multiple speech recognition dictionaries (recognized words and acoustic models) are proposed according to the usage attribute, environmental attributes expressed by environmental noise, and individual attributes expressed by the gender and age of the speaker. ing. According to this device, it is possible to select an appropriate speech recognition dictionary by giving actual environment attributes and actual user attributes, and select an acoustic model that matches the characteristics of the speaker without limiting the speaker. (For example, refer to Patent Document 5).
しかしながら、特許文献5に記載のものを音声呼び登録装置に適用した場合、利用の都度、実際の環境属性や実際の利用者属性を与えなければならないという煩わしさがある。
However, when the one described in
これに対し、エレベータに設けられたカメラ装置から入力された情報に基づいて、成人男性、成人女性、子供等の利用者属性や人数を判別することで、利用状況に合った情報表示を行う表示装置が提案されている。この表示装置の判別手法を音響モデルの選択に適用すれば、利用者を限定せずに、利用者に合う可能性のある音響モデルを容易に選択することができる(例えば、特許文献6参照)。 On the other hand, a display that displays information according to the use situation by determining the user attributes and the number of adult men, adult women, children, etc. based on information input from the camera device provided in the elevator A device has been proposed. If this display device discriminating method is applied to the selection of an acoustic model, it is possible to easily select an acoustic model that may suit the user without limiting the user (see, for example, Patent Document 6). .
しかしながら、特許文献6に記載の判別手法が常に正確とは限らない。このため、利用者の特徴に合っていない音響モデルが選択されてしまう場合もあるという問題があった。 However, the discrimination method described in Patent Document 6 is not always accurate. For this reason, there is a problem that an acoustic model that does not match the user's characteristics may be selected.
この発明は、上述のような課題を解決するためになされたもので、その目的は、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデルを選択する可能性を高めることができるエレベータの音声呼び登録装置を提供することである。 The present invention has been made to solve the above-described problems, and its purpose is not to limit the user, but to register the elevator call by voice input in an easy manner. It is an object of the present invention to provide an elevator voice call registration device capable of increasing the possibility of selecting an acoustic model suitable for a feature.
この発明に係るエレベータの音声呼び登録装置は、エレベータのかご又は乗場に設けられた音声入力装置への入力音声を取り込む音声入力部と、音響特性が互いに異なる複数の音響モデルを記憶した音響モデル記憶部と、前記音声入力装置が設けられたかご又は乗場にいる利用者の特徴に関する利用者情報を抽出する利用者情報抽出部と、前記音声入力装置が設けられたかご又は乗場の位置を含む前記エレベータの状態に関するエレベータ情報を抽出するエレベータ情報抽出部と、前記利用者情報と前記エレベータ情報とに基づいて、前記入力音声から前記エレベータの呼びを認識する際に使用する音響モデルを、前記複数の音響モデルの中から選択する音響モデル選択部と、前記利用者情報抽出部が利用者情報を抽出する度に、抽出された利用者情報を前記エレベータ情報に対応付けて利用者の特徴の傾向に関する利用者傾向情報を蓄積する利用者情報記憶部と、を備え、前記音響モデル選択部は、前記利用者傾向情報に基づいて、前記エレベータが前記エレベータ情報に対応した状態のときに前記エレベータの呼びを認識する際に使用する音響モデルを選択するものである。
An elevator voice call registration device according to the present invention includes an audio input unit that captures input audio to an audio input device provided in an elevator car or a landing, and an acoustic model storage that stores a plurality of acoustic models having different acoustic characteristics. And a user information extracting unit for extracting user information relating to characteristics of a user at a car or a hall provided with the voice input device, and a position of a car or a hall provided with the voice input device An elevator information extraction unit that extracts elevator information related to the state of the elevator, and an acoustic model used when recognizing the elevator call from the input voice based on the user information and the elevator information, an acoustic model selection unit that selects from among acoustic models, every time the user information extraction unit extracts user information, extracted Comprising a user information storage unit to use user information in association with the elevator information storing user tendency information about trends in features of the user, wherein the acoustic model selection unit, based on the user tendency information The acoustic model to be used when recognizing the call of the elevator when the elevator is in a state corresponding to the elevator information is selected .
この発明によれば、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデルを選択する可能性を高めることができる。 According to the present invention, it is possible to increase the possibility of selecting an acoustic model that matches the user's characteristics when registering an elevator call by voice input in an easy manner without limiting the user.
この発明を実施するための形態について添付の図面に従って説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化ないし省略する。 A mode for carrying out the invention will be described with reference to the accompanying drawings. In addition, in each figure, the same code | symbol is attached | subjected to the part which is the same or it corresponds, The duplication description is simplified or abbreviate | omitted suitably.
実施の形態1.
一般に、エレベータはビル等の建築物に設けられる。このエレベータのかご内や乗場には、呼び登録装置が設けられる。この呼び登録装置を利用して、利用者はエレベータの呼びを登録する。そして、この呼び登録装置によって登録された呼びに応答して、エレベータのかごが昇降する。
Generally, an elevator is provided in a building such as a building. A call registration device is provided in the elevator car and at the landing. Using this call registration device, the user registers an elevator call. In response to the call registered by the call registration device, the elevator car moves up and down.
ここで、呼び登録装置の一つとして、エレベータの呼びを音声入力により登録する音声呼び登録装置が提案されている。この音声呼び登録装置は、かご内や乗場で利用者が発した音声を認識して、エレベータの呼びを登録するものである。この音声呼び登録装置を利用すれば、両手の塞がった利用者等であってもエレベータの呼びを容易に登録することができる。 Here, as one of call registration devices, a voice call registration device that registers elevator calls by voice input has been proposed. This voice call registration device recognizes a voice uttered by a user in a car or a hall and registers an elevator call. If this voice call registration device is used, a call of an elevator can be easily registered even by a user who has both hands closed.
かかる音声呼び登録装置においては、利用者の発した音声が誤認識されると、利用者の希望するエレベータの呼びを登録することができなくなってしまう。そこで、本実施の形態の音声呼び登録装置では、音声の認識精度を向上するようにした。以下、本実施の形態の音声呼び登録装置を具体的に説明する。 In such a voice call registration device, if the voice uttered by the user is erroneously recognized, the elevator call desired by the user cannot be registered. Therefore, in the voice call registration device of the present embodiment, the voice recognition accuracy is improved. Hereinafter, the voice call registration device of the present embodiment will be described in detail.
図1はこの発明の実施の形態1におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。
図1の音声呼び登録装置は、エレベータのかご内又は乗場に設けられる。この音声呼び登録装置は、音声入力部1、A/D変換部2、音声切出し部3、音響分析部4、情報入力部5、利用者情報抽出部6、ビル情報記憶部7、音響モデル選択部8、認識辞書9、複数の音響モデル10、音声認識部11を備える。FIG. 1 is a configuration diagram of an elevator voice call registration device and an elevator control unit according to
The voice call registration device of FIG. 1 is provided in an elevator car or a landing. This voice call registration device includes a
音声入力部1は、エレベータのかご内又は乗場に設けられたマイク等の音声入力装置(図示せず)への入力音声を取込む機能を備える。A/D変換部2は、音声入力部1が取り込んだ入力音声をディジタルデータに変換する機能を備える。音声切出し部3は、A/D変換部2から渡されたディジタルデータの無音区間を検出する機能を備える。また、音声切出し部3は、無音区間情報に基づいて、ディジタルデータの無音区間に挟まれた区間を、音声認識の対象となる発話区間として切り出す機能を備える。音響分析部4は、音声切出し部3に切り出された発話区間を、フーリエ変換等の演算処理によって音声認識に使用する特徴量データに変換する機能を備える。
The
情報入力部5は、センサ装置、秤装置、カメラ装置等、通常のエレベータに設けられている機器に検出された利用者の特徴に関する情報を取得する機能を備える。利用者情報抽出部6は、情報入力部5に入力された情報から利用者の背格好、かごへの乗車速度等、利用者の特徴に関する利用者情報を抽出する機能を備える。ビル情報記憶部7は、ビル情報を記憶する機能を備える。このビル情報は、エレベータが設けられたビル等の建築物の各階に入居しているテナントに関する情報等、当該建築物の各階の特徴に関する建築物情報からなる。即ち、ビル情報記憶部7は、建築物情報を記憶する建築物情報記憶部として機能する。
The
音響モデル選択部8は、ビル情報に対応付けられた利用者の特徴の傾向に関する利用者傾向情報を抽出する機能を備える。この利用者傾向情報は、音響モデル選択部8に記憶されていてもよいし、ビル情報記憶部7等の他の記憶部に記憶されていてもよい。また、音響モデル選択部8は、利用者情報抽出部6に抽出された利用者情報、ビル情報に対応づけられた利用者傾向情報等に基づいて、利用者属性を推定する機能を備える。
The acoustic
この利用者属性の種類は、センサ装置、秤装置、カメラ装置等の利用者の特徴の検出内容と検出精度とを考慮して、様々なものに設定可能となっている。例えば、利用者属性は、大人と子供とを区別するように設定される場合もある。また、利用者属性は、10代、20代等、各年代を区別するように設定される場合もある。さらに、利用者属性は、男性又は女性等、性別を区別するように設定される場合もある。加えて、利用者属性は、年代、性別等の複合条件で区別するように設定される場合もある。なお、音響モデル選択部8には、利用者属性を推定する際の利用者情報、ビル情報等の各情報の重み付けを適宜設定できるようにもなっている。
Various types of user attributes can be set in consideration of the detection contents and detection accuracy of user characteristics such as sensor devices, scale devices, and camera devices. For example, the user attribute may be set so as to distinguish an adult from a child. Further, the user attribute may be set so as to distinguish each age, such as teenagers and twenties. Further, the user attribute may be set so as to distinguish gender such as male or female. In addition, the user attributes may be set so as to be distinguished by complex conditions such as age and sex. The acoustic
認識辞書9は、例えば、「イッカイ」、「メインフロア」等、音声認識させたい単語を記憶する機能を備える。複数の音響モデル10は、各音響モデル記憶装置(図示せず)に記憶される。これらの音響モデル10は、各音素の特徴量データが一通り揃っている音響データからなる。これらの音響データは、年代、性別等、音響モデル選択部8が推定する利用者属性に対応し、音響特性が互いに異なっている。そして、これらの音響モデル10には、どの利用者属性に対応したモデルであるかを示すタグが予め付けられている。
The
音声認識部11は、音響モデル選択部8が推定した利用者属性に対応したタグを、複数の音響モデル10の中から検出する機能を備える。また、音声認識部11は、検出したタグを有する音響モデル10を、音響モデル選択部8が推定した利用者属性に一番近い特徴を持った音響モデル10として選択する機能を備える。即ち、実質的には、音声認識部11は、音響モデル選択部8が選択した音響モデル10を複数の音響モデル10の中から抽出するようになっている。さらに、音声認識部11は、選択した音響モデル10を使用して、音声入力部1への入力音声から認識辞書9に記述された単語を認識する機能を備える。
The
また、図1には、エレベータ制御部12も示される。このエレベータ制御部12は、呼び登録部13を備える。呼び登録部13は、認識辞書9の単語とエレベータが設けられたビル等の階床とを対応付けて予め記憶する機能を備える。例えば、認識辞書9の「イッカイ」には、文字通り、「1階」が対応付けて記憶される。認識辞書9の「メインフロア」にも、「1階」が対応付けて記憶される。そして、呼び登録部13は、音声認識部11に認識された単語に対応付けられた階床を認識した場合は、当該階床に対応した行先呼びをエレベータの呼びとして登録する。
FIG. 1 also shows an
また、エレベータ制御部12は、エレベータ情報管理部14も備える。このエレベータ情報管理部14は、様々なエレベータの状態を検出して管理する機能を備える。例えば、エレベータ情報管理部14は、音声入力装置が設けられたかごの又は乗場の位置、かごの走行方向、戸開閉状態等のエレベータ情報を管理する機能を備える。特に、エレベータ情報管理部14は、刻一刻と変化するかごの現在位置(現在階)を確実に検出して管理する。
The
本実施の形態においては、音響モデル選択部8は、エレベータ情報管理部14からエレベータ情報を抽出するエレベータ情報抽出部としても機能する。そして、音響モデル選択部8は、各エレベータ情報に対応付けられた利用者の特徴の傾向に関する利用者傾向情報を抽出する。この利用者傾向情報は、エレベータの利用者を一定期間調査することで把握される。この利用者傾向情報は、音響モデル選択部8に記憶されていてもよいし、他の記憶部に記憶されていてもよい。
In the present embodiment, the acoustic
かかる音響モデル選択部8は、ビル情報から抽出した利用者傾向情報を第1利用者傾向情報として認識し、エレベータ情報から抽出した利用者傾向情報を第2利用者傾向情報として認識する。そして、音響モデル選択部8は、利用者情報、第1利用者傾向情報だけでなく、第2利用者傾向情報をも考慮して、利用者属性を推定するようになっている。
The acoustic
次に、図2及び図3を用いて、本実施の形態の音声呼び登録装置がエレベータの呼びを登録する場合の動作を説明する。
図2はこの発明の実施の形態1におけるエレベータの音声呼び登録装置がエレベータの呼びを登録する場合の動作を説明するためのフローチャートである。図3はこの発明の実施の形態1におけるエレベータの音声呼び登録装置が音響モデルを選択する場合の動作を説明するためのフローチャートである。Next, using FIG. 2 and FIG. 3, the operation when the voice call registration device of the present embodiment registers an elevator call will be described.
FIG. 2 is a flowchart for explaining the operation when the elevator voice call registration device according to the first embodiment of the present invention registers an elevator call. FIG. 3 is a flowchart for explaining the operation in the case where the elevator voice call registration device according to
まず、図2を用いて、エレベータの呼びを登録する手順の概要を説明する。
即ち、ステップS1で、かご内又は乗場の音声入力装置に音声が入力されると、音声入力部1が当該音声を取り込んで、ステップS2に進む。ステップS2では、A/D変換部2が当該音声をディジタルデータに変換し、ステップS3に進む。First, an outline of a procedure for registering an elevator call will be described with reference to FIG.
That is, in step S1, when voice is input into the car or landing voice input device, the
ステップS3では、音声切出し部3が当該ディジタルデータの発話区間を切り出して検出し、ステップS4に進む。ステップS4では、音響分析部4が当該発話区間を音声認識に使用する特徴量データに変換して音響分析し、ステップS5に進む。ステップS5では、音響モデル選択部8が実質的に音響モデル10を選択し、ステップS6に進む。
In step S3, the
ステップS6では、音声認識部11が、音響分析部4に音響分析された特徴量データを、音響モデル選択部8に選択された音響モデル10の音響データと比較する。これにより、音声入力部1に取り込んだ入力音声が認識され、ステップS7に進む。ステップS7では、音声認識部11が入力音声の認識結果をエレベータ制御部12の呼び登録部13に出力し、ステップS8に進む。
In step S <b> 6, the
ステップS8では、呼び登録部13が当該認識結果に係る単語に対応付けられた階床を認識できたか否かを判断する。当該認識結果に係る単語に対応付けられた階床が認識されなかった場合は、動作が終了する。即ち、行先呼びは登録されない。これに対し、当該認識結果に係る単語に対応付けられた階床が認識された場合は、ステップS9に進む。ステップS9では、呼び登録部13が当該階床に対応した行先呼びを登録し、動作が終了する。
In step S8, the
ここで、図3のステップS5においては、上述したように、利用者情報、第1利用者傾向情報だけでなく、第2利用者傾向情報もが考慮され、入力音声からエレベータの呼びを認識する際に使用する音響モデル10が選択される。以下、図3を用いて、本実施の形態における音響モデル10の選択手順を具体的に説明する。
Here, in step S5 of FIG. 3, as described above, not only the user information and the first user tendency information but also the second user tendency information is considered, and the call of the elevator is recognized from the input voice. The
まず、ステップS11では、音響モデル選択部8が、ビル情報記憶部7のビル情報を参照し、ビル情報に対応付けられた第1利用者傾向情報を抽出する。その後、ステップS12に進み、音響モデル選択部8が、エレベータ情報管理部14のエレベータ情報を参照し、現状のエレベータ情報に対応付けられた第2利用者傾向情報を抽出する。
First, in step S11, the acoustic
その後、ステップS13に進み、利用者情報抽出部6が利用者情報を抽出する。その後、音響モデル選択部8が当該利用者情報を参照し、ステップS14に進む。ステップS14では、音響モデル選択部8が、利用者情報、第1利用者傾向情報だけでなく、第2利用者傾向情報をも考慮して、利用者属性を推定し、ステップS15に進む。ステップS15では、音響モデル選択部8が当該利用者属性に合った音響モデル10を実質的に選択し、動作が終了する。
Then, it progresses to step S13 and the user information extraction part 6 extracts user information. Thereafter, the acoustic
以上で説明した実施の形態1によれば、利用者情報、ビル情報だけでなく、エレベータ情報もが考慮され、エレベータの呼びを認識する際に使用する音響モデル10が選択される。このため、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデル10を選択する可能性を高めることができる。
According to the first embodiment described above, not only user information and building information but also elevator information is considered, and the
かかる音響モデル10の選択により、利用者が発した音声に対する認識精度を上げるとともに、利用者と同じ特性を持った発話者以外の無駄話やアナウンス装置からの流れる音声に反応しにくくすることができる。即ち、利用者が発した音声の誤認識と当該誤認識による呼びの誤登録とを防止する可能性を高めることができる。
The selection of the
また、利用者情報抽出部6は、一般にエレベータに設けられるセンサ装置、秤装置、カメラ装置等の機器が検出した利用者の特徴から利用者情報を抽出する。このため、特別な装置を付加することなく、容易な方法で、利用者の特徴に合った音響モデル10を選択する可能性を高めることができる。
The user information extraction unit 6 extracts user information from user characteristics detected by devices such as a sensor device, a scale device, and a camera device that are generally provided in an elevator. Therefore, it is possible to increase the possibility of selecting the
なお、実施の形態1においては、選択した音響モデル10を使用し、音声認識を1回のみ行って、エレベータの呼びを登録するようになっていた。しかしながら、認識尤度の閾値を設け、音声認識部11の認識結果として認識した単語と尤度を出力するようにし、エレベータの呼びを登録するか否かを判定してもよい。そして、利用者に特徴の合うものとして選択した音響モデル10での認識尤度が低かった場合に、認識尤度が閾値を超えるまで、音声認識に使用する音響モデル10の変更を繰り返してもよい。
In the first embodiment, the selected
また、実施の形態1においては、利用者情報とビル情報とエレベータ情報とに基づいて選択された音響モデル10を使用した入力音声の認識結果を出力して、エレベータの呼びを登録するようになっていた。しかしながら、全ての音響モデル10を使用した入力音声の認識結果のうち、利用者情報とビル情報とエレベータ情報とに基づいて選択された音響モデル10を使用した入力音声の認識結果を出力して、エレベータの呼びを登録するようにしてもよい。
In the first embodiment, the recognition result of the input voice using the
実施の形態2.
図4はこの発明の実施の形態2におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。なお、実施の形態1と同一又は相当部分には同一符号を付して説明を省略する。
FIG. 4 is a configuration diagram of an elevator voice call registration device and an elevator control unit according to
実施の形態2の音声呼び登録装置は、実施の形態1の音声呼び登録装置に利用者情報記憶部15を付加したものである。この利用者情報記憶部15は、利用者情報抽出部6が利用者情報を抽出する度に、抽出された利用者情報をエレベータ情報に対応付けて記憶することにより、第2利用者傾向情報を蓄積する機能を備える。
The voice call registration device according to the second embodiment is obtained by adding a user
即ち、実施の形態2においては、利用者情報記憶部15がエレベータ情報に連動して第2利用者傾向情報を学習する。そして、その学習結果が音響モデル10の選択に反映される。具体的には、音響モデル選択部8は、利用者情報、第1利用者傾向だけでなく、実際のエレベータの運用中に自動で蓄積された第2利用者傾向情報をも考慮して、エレベータの呼びを認識する際に使用する音響モデル10を選択するように設定される。
That is, in the second embodiment, the user
そして、本実施の形態の音響モデル選択部8は、第2利用者傾向情報の蓄積量の増加に伴って、第2利用者傾向情報の重み付けを増加させるとともに、第1利用者傾向情報の重み付けを減少させるように設定される。例えば、音響モデル選択部8は、第1利用者傾向情報の重み付けを第2利用者傾向情報の学習量に反比例して減少させるように設定される。
And the acoustic
かかる構成の音声呼び登録装置においては、音声認識部11は、エレベータ情報が変化する度に、エレベータの呼びを認識する際に使用する音響モデル10を、音響モデル選択部8が実質的に選択した音響モデル10に切り換える。そして、音声認識部11は、エレベータ情報が変化する度に切り換わった音響モデル10を使用して、音声入力部1が取り込んだ入力音声を認識する。
In the voice call registration device having such a configuration, the
以上で説明した実施の形態2によれば、実際のエレベータの運用中に蓄積されたエレベータ情報に対応した第2利用者傾向情報もが考慮され、エレベータが各エレベータ情報に対応した状態のときに使用される音響モデル10が選択される。このため、利用者の特徴に合った音響モデル10を選択する可能性をより高めることができる。
According to the second embodiment described above, the second user tendency information corresponding to the elevator information accumulated during the actual operation of the elevator is also taken into consideration, and the elevator is in a state corresponding to each elevator information. The
ここで、ビルに入居したテナント等の変更に伴って利用者の傾向が変わった場合、ビル情報を更新しないと、テナント等の変更当初は、利用者に合った音響モデル10を選択する可能性が下がる。しかしながら、実施の形態2においては、各エレベータ情報に対応した第2利用者傾向情報の蓄積量の増加に伴って、第2利用者傾向情報の重み付けが増加するとともに、ビル情報に対応した第1利用者傾向情報の重み付けが減少する。このため、エレベータの運用を継続して第2利用者傾向の蓄積量が増加すれば、ビル情報を手動で更新することを忘れていても、利用者に合った音響モデル10を選択する可能性を高くすることができる。
Here, if the user's tendency changes with the change of the tenant etc. who moved into the building, if the building information is not updated, the
実施の形態3.
図4はこの発明の実施の形態3におけるエレベータの音声呼び登録装置とエレベータ制御部の構成図である。なお、実施の形態1又は2と同一又は相当部分には同一符号を付して説明を省略する。
実施の形態3の音声呼び登録装置には、実施の形態1の情報入力部5、利用者情報抽出部6、ビル情報記憶部7に代わって、音声特徴抽出部16、音声特徴記憶部17、入力音声学習部18が設けられる。
FIG. 4 is a configuration diagram of an elevator voice call registration device and an elevator control unit according to
In the voice call registration device of the third embodiment, instead of the
音声特徴抽出部16は、音響分析部4によって変換された特徴量データから音声の特徴を抽出する機能を備える。この音声の特徴は、大人の声、子供の声、女性の声、男性の声等に区別される。即ち、実施の形態3においては、音声特徴抽出部16は、利用者の入力音声の特徴から利用者情報を抽出する利用者情報抽出部として機能する。
The speech
音声特徴記憶部17は、音声特徴抽出部16に音声の特徴が抽出される度に、利用者の音声の特徴をエレベータ情報と対応付けて記憶して、第2利用者傾向情報を蓄積する機能を備える。即ち、実施の形態3においては、音声特徴記憶部17が実施の形態2の利用者情報記憶部に相当するものとして機能する。
The voice
入力音声学習部18には、エレベータが各エレベータ情報に対応した状態のときに使用される音響モデル10の初期設定として不特定話者モデルが設定されている。そして、入力音声学習部18は、音声特徴記憶部17に蓄積された第2利用者傾向情報に基づいて、各エレベータ状態のときにどのような音声特徴を持った利用者が多いのかを学習する。即ち、入力音声学習部18は、上記学習によって、エレベータが各エレベータ情報に対応した状態のときに使用する音響モデル10の設定を徐々に変化させるようになっている。
In the input
そして、実施の形態3の音響モデル選択部8は、入力音声学習部18が学習した各エレベータ情報に対応した第2利用者傾向情報に基づいて、エレベータの呼びを認識する際に使用する音響モデル10を、複数の音響モデル10の中から選択するように設定されている。
And the acoustic
かかる構成の音声呼び登録装置においては、音声認識部11は、エレベータ情報が変化する度に、エレベータの呼びを認識する際に使用する音響モデル10を、音響モデル選択部8が実質的に選択した音響モデル10に切り換える。そして、音声認識部11は、エレベータ情報が変化する度に切り換わった音響モデル10を使用して、音声入力部1が取り込んだ入力音声を認識する。
In the voice call registration device having such a configuration, the
以上で説明した実施の形態3によれば、センサ装置、秤装置、カメラ装置からの利用者情報やビル情報に対応付けられた第1利用者傾向情報が抽出されなくても、利用者の特徴に合った音響モデル10を選択する可能性を高めることができる。
According to the third embodiment described above, even if the first user tendency information associated with the user information and the building information from the sensor device, the scale device, and the camera device is not extracted, the user characteristics It is possible to increase the possibility of selecting the
以上のように、この発明に係るエレベータの音声呼び登録装置によれば、利用者を限定せずに、容易な方法で、エレベータの呼びを音声入力により登録する際に利用者の特徴に合った音響モデルを選択する可能性を高めるエレベータに利用できる。 As described above, according to the elevator voice call registration device of the present invention, it is suitable for the characteristics of the user when registering the elevator call by voice input in an easy manner without limiting the user. It can be used for an elevator that increases the possibility of selecting an acoustic model.
1 音声入力部
2 A/D変換部
3 音声切出し部
4 音響分析部
5 情報入力部
6 利用者情報抽出部
7 ビル情報記憶部
8 音響モデル選択部
9 認識辞書
10 音響モデル
11 音声認識部
12 エレベータ制御部
13 呼び登録部
14 エレベータ情報管理部
15 利用者情報記憶部
16 音声特徴抽出部
17 音声特徴記憶部
18 入力音声学習部DESCRIPTION OF
Claims (7)
音響特性が互いに異なる複数の音響モデルを記憶した音響モデル記憶部と、
前記音声入力装置が設けられたかご又は乗場にいる利用者の特徴に関する利用者情報を抽出する利用者情報抽出部と、
前記音声入力装置が設けられたかご又は乗場の位置を含む前記エレベータの状態に関するエレベータ情報を抽出するエレベータ情報抽出部と、
前記利用者情報と前記エレベータ情報とに基づいて、前記入力音声から前記エレベータの呼びを認識する際に使用する音響モデルを、前記複数の音響モデルの中から選択する音響モデル選択部と、
前記利用者情報抽出部が利用者情報を抽出する度に、抽出された利用者情報を前記エレベータ情報に対応付けて利用者の特徴の傾向に関する利用者傾向情報を蓄積する利用者情報記憶部と、
を備え、
前記音響モデル選択部は、前記利用者傾向情報に基づいて、前記エレベータが前記エレベータ情報に対応した状態のときに前記エレベータの呼びを認識する際に使用する音響モデルを選択することを特徴とするエレベータの音声呼び登録装置。 A voice input unit that captures input voice to a voice input device provided in an elevator car or a landing;
An acoustic model storage unit storing a plurality of acoustic models having different acoustic characteristics;
A user information extraction unit for extracting user information relating to the characteristics of the user at the car or the landing provided with the voice input device;
An elevator information extraction unit for extracting elevator information related to the state of the elevator including the position of a car or a landing provided with the voice input device;
Based on the user information and the elevator information, an acoustic model selection unit that selects an acoustic model to be used when recognizing the elevator call from the input voice from the plurality of acoustic models;
A user information storage unit that stores user tendency information relating to a tendency of user characteristics by associating the extracted user information with the elevator information each time the user information extraction unit extracts user information; ,
Equipped with a,
The acoustic model selection unit selects, based on the user tendency information, an acoustic model to be used when recognizing the elevator call when the elevator is in a state corresponding to the elevator information. Voice call registration device for elevators.
を備えたことを特徴とする請求項1記載のエレベータの音声呼び登録装置。 A speech recognition unit that outputs a recognition result of the input speech using the acoustic model selected by the acoustic model selection unit;
The elevator voice call registration device according to claim 1, further comprising:
を備えたことを特徴とする請求項1記載のエレベータの音声呼び登録装置。 A speech recognition unit that outputs the recognition result of the input speech using the acoustic model selected by the acoustic model selection unit among the recognition results of the input speech using the plurality of acoustic models;
The elevator voice call registration device according to claim 1, further comprising:
を備え、
前記音響モデル選択部は、前記利用者傾向情報と前記建築物情報とに基づいて、前記エレベータの呼びを認識する際に使用する音響モデルを選択することを特徴とする請求項1〜請求項4のいずれかに記載のエレベータの音声呼び登録装置。 A building information storage unit that stores building information relating to the characteristics of each floor of the building in which the elevator is provided;
With
The acoustic model selection unit, on the basis of the user tends information and the building information, claims 1 to 4, characterized in that selecting an acoustic model to be used in recognizing the call of the elevator The elevator voice call registration device according to any one of the above.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2010/054222 WO2011111221A1 (en) | 2010-03-12 | 2010-03-12 | Voice call registration device for elevator |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011111221A1 JPWO2011111221A1 (en) | 2013-06-27 |
JP5252119B2 true JP5252119B2 (en) | 2013-07-31 |
Family
ID=44563063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012504246A Active JP5252119B2 (en) | 2010-03-12 | 2010-03-12 | Elevator voice call registration device |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5252119B2 (en) |
CN (1) | CN102762477B (en) |
WO (1) | WO2011111221A1 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5903061B2 (en) * | 2013-03-01 | 2016-04-13 | 株式会社日立製作所 | Elevator system |
CN104401822A (en) * | 2014-10-30 | 2015-03-11 | 合肥指南针电子科技有限责任公司 | Voice recognition automatic lift control method and system of intelligent residential district |
ES2831090T3 (en) * | 2016-12-06 | 2021-06-07 | Inventio Ag | Elevator installation with predictive call based on noise analysis |
CN110234586B (en) * | 2017-02-06 | 2020-11-13 | 三菱电机株式会社 | Elevator control device and control method |
CN108373081A (en) * | 2018-04-27 | 2018-08-07 | 上海贝思特电气有限公司 | A kind of voice broadcast control circuit |
US11257493B2 (en) | 2019-07-11 | 2022-02-22 | Soundhound, Inc. | Vision-assisted speech processing |
CN110853642B (en) * | 2019-11-14 | 2022-03-25 | 广东美的制冷设备有限公司 | Voice control method and device, household appliance and storage medium |
CN111348499A (en) * | 2020-03-02 | 2020-06-30 | 北京声智科技有限公司 | Elevator control method, elevator control device, electronic equipment and computer-readable storage medium |
CN113879923B (en) * | 2021-08-31 | 2023-08-04 | 北京声智科技有限公司 | Elevator control method, system, device, electronic equipment and storage medium |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1195789A (en) * | 1997-09-25 | 1999-04-09 | Hitachi Ltd | Voice recognition system and speaker adaptive method in the same |
JP2002128404A (en) * | 2000-10-27 | 2002-05-09 | Hitachi Building Systems Co Ltd | Device for registering call for elevator |
JP2002229584A (en) * | 2001-01-31 | 2002-08-16 | Toyota Central Res & Dev Lab Inc | Speech recognizing method, speech information retrieval method, program recording medium, speech recognition system, server computer for speech recognition, and server computer for speech information retrieval |
JP2005145692A (en) * | 2003-11-19 | 2005-06-09 | Nec Corp | Utilization facility optimal control system, elevator optimal control system, and optimal control method used for them |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3680477B2 (en) * | 1997-02-27 | 2005-08-10 | 富士通株式会社 | Speaker attribute recognition device and response device using the same |
JP2002274764A (en) * | 2001-03-05 | 2002-09-25 | Otis Elevator Co | Floor call sound registration method, and braille information notification device |
CN1394802A (en) * | 2002-07-31 | 2003-02-05 | 陈晓阳 | Speech recognition elevator floor selection system |
JP2006327739A (en) * | 2005-05-25 | 2006-12-07 | Mitsubishi Electric Corp | Landing call registering device of elevator |
-
2010
- 2010-03-12 WO PCT/JP2010/054222 patent/WO2011111221A1/en active Application Filing
- 2010-03-12 JP JP2012504246A patent/JP5252119B2/en active Active
- 2010-03-12 CN CN201080062704.1A patent/CN102762477B/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1195789A (en) * | 1997-09-25 | 1999-04-09 | Hitachi Ltd | Voice recognition system and speaker adaptive method in the same |
JP2002128404A (en) * | 2000-10-27 | 2002-05-09 | Hitachi Building Systems Co Ltd | Device for registering call for elevator |
JP2002229584A (en) * | 2001-01-31 | 2002-08-16 | Toyota Central Res & Dev Lab Inc | Speech recognizing method, speech information retrieval method, program recording medium, speech recognition system, server computer for speech recognition, and server computer for speech information retrieval |
JP2005145692A (en) * | 2003-11-19 | 2005-06-09 | Nec Corp | Utilization facility optimal control system, elevator optimal control system, and optimal control method used for them |
Also Published As
Publication number | Publication date |
---|---|
CN102762477B (en) | 2014-11-05 |
JPWO2011111221A1 (en) | 2013-06-27 |
CN102762477A (en) | 2012-10-31 |
WO2011111221A1 (en) | 2011-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5252119B2 (en) | Elevator voice call registration device | |
JP5601419B2 (en) | Elevator call registration device | |
JP6857581B2 (en) | Growth interactive device | |
CN110660201B (en) | Arrival reminding method, device, terminal and storage medium | |
US20150262574A1 (en) | Expression classification device, expression classification method, dissatisfaction detection device, dissatisfaction detection method, and medium | |
JP6654611B2 (en) | Growth type dialogue device | |
JP5494468B2 (en) | Status detection device, status detection method, and program for status detection | |
CN110570853A (en) | Intention recognition method and device based on voice data | |
JP2019020684A (en) | Emotion interaction model learning device, emotion recognition device, emotion interaction model learning method, emotion recognition method, and program | |
JP2015107867A (en) | Elevator voice call registration device | |
KR20190049260A (en) | Device and method for recognizing voice of vehicle | |
US20210183362A1 (en) | Information processing device, information processing method, and computer-readable storage medium | |
JP7024799B2 (en) | Operation support device for vehicles | |
JP6087542B2 (en) | Speaker recognition device, speaker recognition method, and speaker recognition program | |
JP7140523B2 (en) | Nursing care act estimation system | |
US20200111493A1 (en) | Speech recognition device and speech recognition method | |
KR102037789B1 (en) | Sign language translation system using robot | |
JP5668838B2 (en) | Elevator call registration device | |
JP6365304B2 (en) | Conversation analyzer and conversation analysis method | |
JP2006230446A (en) | Health-condition estimating equipment | |
JP2018087838A (en) | Voice recognition device | |
US10950227B2 (en) | Sound processing apparatus, speech recognition apparatus, sound processing method, speech recognition method, storage medium | |
JP2020148805A (en) | Voice recognition system and voice recognition method | |
JP4849630B2 (en) | Utterance content identification device and personal identification device | |
JP2018055155A (en) | Voice interactive device and voice interactive method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130401 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5252119 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |