JPH08259124A - エレベータの音声認識装置 - Google Patents
エレベータの音声認識装置Info
- Publication number
- JPH08259124A JPH08259124A JP7096109A JP9610995A JPH08259124A JP H08259124 A JPH08259124 A JP H08259124A JP 7096109 A JP7096109 A JP 7096109A JP 9610995 A JP9610995 A JP 9610995A JP H08259124 A JPH08259124 A JP H08259124A
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- voice
- recognition
- input
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Indicating And Signalling Devices For Elevators (AREA)
- Elevator Control (AREA)
Abstract
ができ、しかも効率よく学習を行って、認識確度の高い
音声認識装置を提供する。 【構成】マイクロフォン1に入力された音声をニューラ
ルネット14で認識し、その結果を表示装置5に表示し
て利用者に確認する。それに対する利用者の応答の認識
結果を認識結果判定部15で判定し、「イイエ」と認識
されると表示装置5に再度音声入力を促す表示を行う。
そして再入力された音声を再度認識してその結果を利用
者に再確認する。その結果、それに対する利用者の応答
が認識結果判定部15で今度は「ハイ」であると判断さ
れると、ニューラルネット学習装置16により、最初の
音声データを入力パターンとし二度目の認識結果を教師
信号としてニューラルネットの学習を行う。
Description
声を認識して呼びの登録やかごの運転制御を行うエレベ
ータの音声認識装置に係り、特にその音声認識用のニュ
ーラルネットのオンライン学習に関するものである。
水準を高め、乗客の快適感や安心感を高める手段とし
て、ユーザ・インターフェースの研究・開発が進んでい
る。ユーザ・インターフェースは大きく出力装置と入力
装置に別れるが、エレベータシステムの状況や様々な情
報を利用者に伝える出力装置としては、例えば乗場・か
ご内インフォメーションディスプレイや音声合成による
案内などが挙げられる。
めのボタンやドアの開閉ボタン或いは混雑度センサーな
どがあり、利用者の音声を認識して呼びの登録や種々の
運転指令をエレベータに与える音声認識装置などもその
一つである。
達手段であり、機械とのインタラクションにも有効であ
ろうと予想される。エレベータに音声認識機能があれ
ば、様々な面でユーザとの自然なコミュニケーションが
行え、例えば次のような利用法が考えられる。
作。 ・身体障害者への操作性の向上。 ・操作盤から離れた位置からの扉・出発の制御。 ・階床名以外にも、目的場所(部署・係・売り場等)に
よる呼びの登録。 更に音声入力を利用した個人識別により、アクセス管理
やセキュリティ確保なども考えられる。
近ニューラルネットの利用が種々提案されており、音声
認識についても例外ではない。
似たネットワークで、神経細胞モデル(ニューロン)が
複数個、複雑に接続され、各ニューロンの動作及びニュ
ーロン間の接続形態をうまく決めることによって、パタ
ーン認識機能や知識処理機能を埋め込むことができると
いうものであり、例えば「日経エレクトロニクス」19
87年8月10日号(No427)のP115〜P124
や1989年2月に産業図書株式会社から刊行された
「PDPモデル」などに開示されており、特にニューロ
ンを階層構造に配置したものは「バックプロパゲーショ
ン」と呼ばれる自律的学習アルゴリズムを利用できるこ
とに特徴がある。
割り当て制御では割り当てアルゴリズムを人間が一切考
える必要はなく、しかも各種の交通状況に対応して、結
果的には最適な割り当てかごを決定する判断システムを
自動的に生成することができるという優れた効果があ
り、エレベータの呼び割り当てに用いた例としては特開
平1−275381号「エレベータの群管理制御装置」
や、特開平3−31173号「エレベータの群管理制御
装置」、特願平5−243817号「エレベータ呼び割
り当て用ニューラルネットの学習方法」などがある。
このニューラルネットを用いる場合、音声認識用ニュー
ラルネットの作成に当たってはオフライン学習、すなわ
ちシステムを稼働させる前に予めニューラルネットに学
習させておく方法が一般的であった。このため、音声認
識用のニューラルネットは、システムの稼働後も一切成
長することなく、その認識確度は出荷前の学習の精度に
よって決まってしまうという問題があった。
ので、システムの稼働後にニューラルネットのオンライ
ン学習を行うことができ、しかもその際、ただ単に学習
を継続していくだけでなく、学習効果の高いと思われる
音声データだけを学習用サンプルとしてニューラルネッ
トを効率よく学習することのできる音声認識装置を提供
することを目的とする。
め、本発明においては、マイクロフォンに入力された音
声の認識結果を利用者に確認する手段と、その認識結果
が誤っている場合は再度音声の入力を促し、その認識結
果を再確認する手段と、再確認の認識結果が正しい場合
には、最初の入力音声データに基づくニューラルネット
への入力パターンと、前記再確認の認識結果(教師信
号)とを学習用サンプルとして前記ニューラルネットの
学習を行う学習手段とを備えたことを特徴とする。
声を入力すると、ニューラルネットにより認識処理が行
われ、その認識結果が利用者に確認される。その結果、
誤りであれば再度音声の入力を促し、その認識結果が再
確認される。そして再確認の結果、正しければ最初の音
声データに基づくニューラルネットへの入力パターン
と、前記再確認の認識結果(教師信号)とを学習用サン
プルとしてニューラルネットの学習が行われる。
図1は、本発明のハードウェア構成を示す全体図で、図
中、1はエレベータのかご内或いは乗場に設けられたマ
イクロフォン、2はマイクロフォン1からの入力音声信
号をニューラルネットを用いて認識処理する音声認識装
置、3は認識処理の結果に従って呼びの登録を行う呼び
登録装置、4は表示装置の表示内容を制御する表示制御
装置、5は表示制御装置4からの指令に従って、発声を
誘導するための表示や認識結果を表示するディスプレイ
等の表示装置である。
ンドパスフィルター等で構成されるA/Dボード2A、
CPUやROM,RAM等で構成されるCPUボード2
B、外部との通信を行うための通信用IC等で構成され
る通信ボード2Cからなっている。図2は、図1の構成
を機能ブロック図で表したもので、図1と同一のものは
同一符号にて示している。
ログ信号)をディジタル信号の音声データに変換するA
/D変換器、12は音声データから単語を切り出して例
えばn個のフレームに等分割し、高速フーリエ変換によ
り各フレームのパワースペクトラムを求め、それをm個
のバンドに分割し、各バンド毎に人間の聴覚系のサイク
ルバンドの重み付けをおこなって、n×m個の入力パタ
ーンを作成する前処理部、13はその入力パターンを一
時記憶する記憶装置、14は入力パターンをn×m個の
入力層のニューロンに入力し、その認識結果を出力する
音声認識用のニューラルネット、15はその認識結果に
基づいて呼びの登録指令や教師信号の出力を判断する認
識結果判定部、16は教師信号とそれに対応する入力パ
ターンに基づいてニューラルネットの学習を行うニュー
ラルネット学習装置である。
習手順を図3のフローチャートにより説明する。まず、
表示装置5に「行先階を言って下さい」というような、
利用者に発声を誘導する画面を表示する(ステップS
1)。利用客が例えば「ニカイ」と発声すると、マイク
ロフォン1に入力された音声信号は、A/D変換器11
及び前処理部12を介してニューラルネット14に入力
され、音声認識処理が行われる(ステップS2)ととも
に、その入力パターンは記憶装置13に一時記憶され
る。
と認識された場合は、その認識結果を表示装置5へ表示
し(ステップS3)、利用者にその認識結果が正しいか
否かを確認する。すなわち、その認識結果について「ハ
イ」か「イイエ」の発声を誘導する画面の表示を行い
(ステップS4)、利用客からの返答があると再びその
音声認識処理を行う(ステップS5)。その結果「ハ
イ」と認識した場合は(ステップS6)、最初の「ニカ
イ」という認識は正しかったものとして、呼び登録装置
3へその認識結果を通信し(ステップS7)、2階の呼
びを登録するとともに再びステップS1へと戻り、次の
新たな音声入力に備える。
トが一回目の処理で正しい認識を行ったので、この音声
データを用いてニューラルネットの学習を行う必要性は
少ないと考え、学習用サンプルの対象からは外すように
している。
に「イッカイ」と誤って認識し、確認の結果ステップS
6で「イイエ」と認識された場合は、ステップS8で例
えば「もう一度、行先階を言って下さい」のように、再
度発声を誘導する画面を表示し、再度入力された音声の
認識処理を行う(ステップS9)。そしてその認識結果
を表示する(ステップS10)とともに、前述と同様に
認識結果の再確認のための表示を行う(ステップS1
1)。そしてそれに対する返答の音声認識処理を行い
(ステップS12)、その結果再び「イイエ」であれば
このケースについては認識処理は困難と判断し、再びス
テップS1に戻って最初からやり直しとなるが、「ハ
イ」であればステップS13からステップS14へと進
み、その認識結果を呼び登録装置へ通信するとともに、
ステップS15以下でこのケースを学習の対象とする。
あったが二度目は正しく認識されたというケースについ
ては、一度目の音声データについて二度目の正しい認識
結果を教師信号として学習を行うことにより、ニューラ
ルネットの認識確度が向上することが期待される。
らS17へと直ちに進み、一度目の音声データと二度目
の認識結果に基づいてニューラルネットの学習を行うよ
うにしてもよいが、場合によっては一度目の音声が咳や
くしゃみであったり、全く関係のない会話であったりす
る可能性もあるので、ここでは一度目の認識結果と二度
目の認識結果を比較し(ステップS15)、ステップS
16で似ていると判断された場合だけステップS17で
学習を行うようにして、咳やくしゃみ等によるケースを
除くようにしている。
認識結果の類似の判断は、例えばニューラルネットの出
力層の「ニカイ」という単語に対応するニューロンの出
力の値を一度目と二度目とで比較して、その差が所定値
以下の場合は類似する、或いは両者の値がともに所定値
以上の場合は類似すると判断するなどの方法により行
う。
その結果、学習に効果の大きいと思われる音声データだ
けを対象として学習が継続的に行われることになる。な
お、上記の実施例では呼びの登録を行う場合について説
明したが、勿論、ドアの開閉やその他の運転制御を音声
認識で行う場合にも本発明を適用することができる。
っても実際に音声認識を行いながらニューラルネットの
学習を行うことができ、しかもその際、ただ単に学習を
継続していくことができるだけでなく、学習効果が大き
いと思われる音声データだけを学習用サンプルの対象と
しているので、ニューラルネットを効率よく学習するこ
とができ、認識確度の向上に大きな効果を発揮すること
ができる。
る。
すフローチャートである。
Claims (2)
- 【請求項1】 エレベータのかご或いは乗場に設けられ
たマイクロフォンからの入力音声信号を前処理して入力
し、その認識結果を出力するニューラルネットを備えた
エレベータの音声認識装置において、マイクロフォンに
入力された音声の認識結果を利用者に確認する手段と、
その認識結果が誤っている場合は再度音声の入力を促
し、その認識結果を再確認する手段と、再確認の認識結
果が正しい場合には、最初の入力音声データに基づくニ
ューラルネットへの入力パターンと、前記再確認の認識
結果(教師信号)とを学習用サンプルとして前記ニュー
ラルネットの学習を行う学習手段とを備えたことを特徴
とするエレベータの音声認識装置。 - 【請求項2】 エレベータのかご或いは乗場に設けられ
たマイクロフォンからの入力音声信号を前処理して入力
し、その認識結果を出力するニューラルネットを備えた
エレベータの音声認識装置において、マイクロフォンに
入力された音声の認識結果を利用者に確認する手段と、
その認識結果が誤っている場合は再度音声の入力を促
し、その認識結果を再確認する手段と、再確認の認識結
果が正しい場合は、最初の認識結果と再確認の認識結果
との類似性を比較する比較手段と、その結果類似してい
る場合には最初の入力音声データに基づくニューラルネ
ットへの入力パターンと、前記再確認の認識結果(教師
信号)とを学習用サンプルとして前記ニューラルネット
の学習を行う学習手段とを備えたことを特徴とするエレ
ベータの音声認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07096109A JP3077555B2 (ja) | 1995-03-28 | 1995-03-28 | エレベータの音声認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07096109A JP3077555B2 (ja) | 1995-03-28 | 1995-03-28 | エレベータの音声認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08259124A true JPH08259124A (ja) | 1996-10-08 |
JP3077555B2 JP3077555B2 (ja) | 2000-08-14 |
Family
ID=14156229
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07096109A Expired - Lifetime JP3077555B2 (ja) | 1995-03-28 | 1995-03-28 | エレベータの音声認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3077555B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011144034A (ja) * | 2010-01-18 | 2011-07-28 | Mitsubishi Electric Building Techno Service Co Ltd | 音声認識によるエレベータの操作装置 |
EP2497737A1 (en) * | 2009-11-06 | 2012-09-12 | Mitsubishi Electric Corporation | Elevator call registration device |
CN102892697A (zh) * | 2010-05-18 | 2013-01-23 | 三菱电机株式会社 | 电梯呼梯登记装置 |
CN104692198A (zh) * | 2013-12-05 | 2015-06-10 | 三菱电机株式会社 | 电梯语音呼梯登记装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03157697A (ja) * | 1989-11-16 | 1991-07-05 | Sekisui Chem Co Ltd | 単語認識システム |
JPH06255911A (ja) * | 1993-03-09 | 1994-09-13 | Toshiba Corp | エレベータの呼び登録装置 |
-
1995
- 1995-03-28 JP JP07096109A patent/JP3077555B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03157697A (ja) * | 1989-11-16 | 1991-07-05 | Sekisui Chem Co Ltd | 単語認識システム |
JPH06255911A (ja) * | 1993-03-09 | 1994-09-13 | Toshiba Corp | エレベータの呼び登録装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2497737A1 (en) * | 2009-11-06 | 2012-09-12 | Mitsubishi Electric Corporation | Elevator call registration device |
EP2497737A4 (en) * | 2009-11-06 | 2015-02-11 | Mitsubishi Electric Corp | ELEVATOR CALL RECORDING DEVICE |
JP2011144034A (ja) * | 2010-01-18 | 2011-07-28 | Mitsubishi Electric Building Techno Service Co Ltd | 音声認識によるエレベータの操作装置 |
CN102892697A (zh) * | 2010-05-18 | 2013-01-23 | 三菱电机株式会社 | 电梯呼梯登记装置 |
CN104692198A (zh) * | 2013-12-05 | 2015-06-10 | 三菱电机株式会社 | 电梯语音呼梯登记装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3077555B2 (ja) | 2000-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223488B (zh) | 语音唤醒方法、装置、设备及存储介质 | |
KR100826875B1 (ko) | 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치 | |
KR20200111853A (ko) | 전자 장치 및 전자 장치의 음성 인식 제어 방법 | |
CN108574773A (zh) | 用于车辆通信的使用机器学习的终端和移动终端的车辆控制方法 | |
KR102221513B1 (ko) | 음성 감정 인식 방법 및 시스템 | |
JP3280825B2 (ja) | 音声特徴分析装置 | |
US20240169994A1 (en) | Method and system for user voice identification using ensembled deep learning algorithms | |
JPS603699A (ja) | 適応性自動離散音声認識方法 | |
KR100426351B1 (ko) | 스펙트로그램의 상관관계를 이용한 음성 대조장치, 대조방법 및 그 기록매체 | |
US5278911A (en) | Speech recognition using a neural net | |
JP3077555B2 (ja) | エレベータの音声認識装置 | |
JPH0667698A (ja) | 音声認識装置 | |
WO2002103673A1 (en) | Neural network post-processor | |
Lashkari et al. | NMF-based cepstral features for speech emotion recognition | |
JPH0466999A (ja) | 文節境界検出装置 | |
JPH06161495A (ja) | 音声認識装置 | |
Dadang et al. | Security System Using A Robot Based On Speech Recognition | |
JPH07210197A (ja) | 話者識別方法 | |
JPH07325597A (ja) | 情報入力方法およびその方法を実施するための装置 | |
Sharma et al. | SNR Improvement in Voice Activity Detection | |
Rojas et al. | Statistics and neural networks | |
JPH05313689A (ja) | 話者認識方式 | |
JPH08259123A (ja) | エレベータの音声認識用ニューラルネットの学習方法 | |
CN118430537A (zh) | 一种防干扰的语音识别方法、装置、电子设备及存储介质 | |
Valencia-Jiménez et al. | Holonic multi-agent system model for fuzzy automatic speech/speaker recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090616 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100616 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100616 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110616 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120616 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120616 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130616 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140616 Year of fee payment: 14 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |