JP3077555B2 - エレベータの音声認識装置 - Google Patents

エレベータの音声認識装置

Info

Publication number
JP3077555B2
JP3077555B2 JP07096109A JP9610995A JP3077555B2 JP 3077555 B2 JP3077555 B2 JP 3077555B2 JP 07096109 A JP07096109 A JP 07096109A JP 9610995 A JP9610995 A JP 9610995A JP 3077555 B2 JP3077555 B2 JP 3077555B2
Authority
JP
Japan
Prior art keywords
recognition result
neural network
recognition
voice
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP07096109A
Other languages
English (en)
Other versions
JPH08259124A (ja
Inventor
武 緑谷
一郎 長島
誠 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitec Co Ltd
Original Assignee
Fujitec Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitec Co Ltd filed Critical Fujitec Co Ltd
Priority to JP07096109A priority Critical patent/JP3077555B2/ja
Publication of JPH08259124A publication Critical patent/JPH08259124A/ja
Application granted granted Critical
Publication of JP3077555B2 publication Critical patent/JP3077555B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Indicating And Signalling Devices For Elevators (AREA)
  • Elevator Control (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、エレベータ利用者の音
声を認識して呼びの登録やかごの運転制御を行うエレベ
ータの音声認識装置に係り、特にその音声認識用のニュ
ーラルネットのオンライン学習に関するものである。
【0002】
【従来の技術】最近、エレベータの利用者へのサービス
水準を高め、乗客の快適感や安心感を高める手段とし
て、ユーザ・インターフェースの研究・開発が進んでい
る。ユーザ・インターフェースは大きく出力装置と入力
装置に別れるが、エレベータシステムの状況や様々な情
報を利用者に伝える出力装置としては、例えば乗場・か
ご内インフォメーションディスプレイや音声合成による
案内などが挙げられる。
【0003】一方、入力装置としては呼びを登録するた
めのボタンやドアの開閉ボタン或いは混雑度センサーな
どがあり、利用者の音声を認識して呼びの登録や種々の
運転指令をエレベータに与える音声認識装置などもその
一つである。
【0004】特に音声は人と人との最も基本的な情報伝
達手段であり、機械とのインタラクションにも有効であ
ろうと予想される。エレベータに音声認識機能があれ
ば、様々な面でユーザとの自然なコミュニケーションが
行え、例えば次のような利用法が考えられる。
【0005】・荷物等によって手を使えない状態での操
作。 ・身体障害者への操作性の向上。 ・操作盤から離れた位置からの扉・出発の制御。 ・階床名以外にも、目的場所(部署・係・売り場等)に
よる呼びの登録。 更に音声入力を利用した個人識別により、アクセス管理
やセキュリティ確保なども考えられる。
【0006】ところで、エレベータの分野においては最
近ニューラルネットの利用が種々提案されており、音声
認識についても例外ではない。
【0007】このニューラルネットとは、人間の脳を真
似たネットワークで、神経細胞モデル(ニューロン)が
複数個、複雑に接続され、各ニューロンの動作及びニュ
ーロン間の接続形態をうまく決めることによって、パタ
ーン認識機能や知識処理機能を埋め込むことができると
いうものであり、例えば「日経エレクトロニクス」19
87年8月10日号(No427)のP115〜P124
や1989年2月に産業図書株式会社から刊行された
「PDPモデル」などに開示されており、特にニューロ
ンを階層構造に配置したものは「バックプロパゲーショ
ン」と呼ばれる自律的学習アルゴリズムを利用できるこ
とに特徴がある。
【0008】このニューラルネットを用いると、例えば
割り当て制御では割り当てアルゴリズムを人間が一切考
える必要はなく、しかも各種の交通状況に対応して、結
果的には最適な割り当てかごを決定する判断システムを
自動的に生成することができるという優れた効果があ
り、エレベータの呼び割り当てに用いた例としては特開
平1−275381号「エレベータの群管理制御装置」
や、特開平3−31173号「エレベータの群管理制御
装置」、特願平5−243817号「エレベータ呼び割
り当て用ニューラルネットの学習方法」などがある。
【0009】
【発明が解決しようとする課題】ところで、音声認識に
このニューラルネットを用いる場合、音声認識用ニュー
ラルネットの作成に当たってはオフライン学習、すなわ
ちシステムを稼働させる前に予めニューラルネットに学
習させておく方法が一般的であった。このため、音声認
識用のニューラルネットは、システムの稼働後も一切成
長することなく、その認識確度は出荷前の学習の精度に
よって決まってしまうという問題があった。
【0010】本願はこうした問題点に鑑みてなされたも
ので、システムの稼働後にニューラルネットのオンライ
ン学習を行うことができ、しかもその際、ただ単に学習
を継続していくだけでなく、学習効果の高いと思われる
音声データだけを学習用サンプルとしてニューラルネッ
トを効率よく学習することのできる音声認識装置を提供
することを目的とする。
【0011】
【課題を解決するための手段】上記目的を達成するた
め、本発明においては、マイクロフォンに入力された音
声の認識結果を利用者に確認する手段と、その認識結果
が誤っている場合は再度音声の入力を促し、その認識結
果を再確認する手段と、再確認の認識結果が正しい場合
は、最初の認識結果と再確認の認識結果との類似性を比
較する比較手段と、その結果類似している場合には最初
の入力音声データに基づくニューラルネットへの入力パ
ターンと、前記再確認の認識結果(教師信号)とを学習
用サンプルとして前記ニューラルネットの学習を行う学
習手段とを備えたことを特徴とする。
【0012】
【作用】本発明によれば、利用者がマイクロフォンに音
声を入力すると、ニューラルネットにより認識処理が行
われ、その認識結果が利用者に確認される。その結果、
誤りであれば再度音声の入力を促し、その認識結果が再
確認される。そして再確認の結果、正しければ最初の音
声データに基づくニューラルネットへの入力パターン
と、前記再確認の認識結果(教師信号)とを学習用サン
プルとしてニューラルネットの学習が行われる。
【0013】
【実施例】以下、本発明の一実施例について説明する。
図1は、本発明のハードウェア構成を示す全体図で、図
中、1はエレベータのかご内或いは乗場に設けられたマ
イクロフォン、2はマイクロフォン1からの入力音声信
号をニューラルネットを用いて認識処理する音声認識装
置、3は認識処理の結果に従って呼びの登録を行う呼び
登録装置、4は表示装置の表示内容を制御する表示制御
装置、5は表示制御装置4からの指令に従って、発声を
誘導するための表示や認識結果を表示するディスプレイ
等の表示装置である。
【0014】この音声認識装置2は、A/D変換器やバ
ンドパスフィルター等で構成されるA/Dボード2A、
CPUやROM,RAM等で構成されるCPUボード2
B、外部との通信を行うための通信用IC等で構成され
る通信ボード2Cからなっている。図2は、図1の構成
を機能ブロック図で表したもので、図1と同一のものは
同一符号にて示している。
【0015】図2において、11は入力音声信号(アナ
ログ信号)をディジタル信号の音声データに変換するA
/D変換器、12は音声データから単語を切り出して例
えばn個のフレームに等分割し、高速フーリエ変換によ
り各フレームのパワースペクトラムを求め、それをm個
のバンドに分割し、各バンド毎に人間の聴覚系のサイク
ルバンドの重み付けをおこなって、n×m個の入力パタ
ーンを作成する前処理部、13はその入力パターンを一
時記憶する記憶装置、14は入力パターンをn×m個の
入力層のニューロンに入力し、その認識結果を出力する
音声認識用のニューラルネット、15はその認識結果に
基づいて呼びの登録指令や教師信号の出力を判断する認
識結果判定部、16は教師信号とそれに対応する入力パ
ターンに基づいてニューラルネットの学習を行うニュー
ラルネット学習装置である。
【0016】以上の構成において、次に本発明による学
習手順を図3のフローチャートにより説明する。まず、
表示装置5に「行先階を言って下さい」というような、
利用者に発声を誘導する画面を表示する(ステップS
1)。利用客が例えば「ニカイ」と発声すると、マイク
ロフォン1に入力された音声信号は、A/D変換器11
及び前処理部12を介してニューラルネット14に入力
され、音声認識処理が行われる(ステップS2)ととも
に、その入力パターンは記憶装置13に一時記憶され
る。
【0017】音声認識の結果、それが例えば「ニカイ」
と認識された場合は、その認識結果を表示装置5へ表示
し(ステップS3)、利用者にその認識結果が正しいか
否かを確認する。すなわち、その認識結果について「ハ
イ」か「イイエ」の発声を誘導する画面の表示を行い
(ステップS4)、利用客からの返答があると再びその
音声認識処理を行う(ステップS5)。その結果「ハ
イ」と認識した場合は(ステップS6)、最初の「ニカ
イ」という認識は正しかったものとして、呼び登録装置
3へその認識結果を通信し(ステップS7)、2階の呼
びを登録するとともに再びステップS1へと戻り、次の
新たな音声入力に備える。
【0018】すなわち、このケースではニューラルネッ
トが一回目の処理で正しい認識を行ったので、この音声
データを用いてニューラルネットの学習を行う必要性は
少ないと考え、学習用サンプルの対象からは外すように
している。
【0019】しかし、もし実際には「ニカイ」であるの
に「イッカイ」と誤って認識し、確認の結果ステップS
6で「イイエ」と認識された場合は、ステップS8で例
えば「もう一度、行先階を言って下さい」のように、再
度発声を誘導する画面を表示し、再度入力された音声の
認識処理を行う(ステップS9)。そしてその認識結果
を表示する(ステップS10)とともに、前述と同様に
認識結果の再確認のための表示を行う(ステップS1
1)。そしてそれに対する返答の音声認識処理を行い
(ステップS12)、その結果再び「イイエ」であれば
このケースについては認識処理は困難と判断し、再びス
テップS1に戻って最初からやり直しとなるが、「ハ
イ」であればステップS13からステップS14へと進
み、その認識結果を呼び登録装置へ通信するとともに、
ステップS15以下でこのケースを学習の対象とする。
【0020】すなわちこの、一度目の認識結果は誤りで
あったが二度目は正しく認識されたというケースについ
ては、一度目の音声データについて二度目の正しい認識
結果を教師信号として学習を行うことにより、ニューラ
ルネットの認識確度が向上することが期待される。
【0021】従って、このケースではステップS15か
らS17へと直ちに進み、一度目の音声データと二度目
の認識結果に基づいてニューラルネットの学習を行うよ
うにしてもよいが、場合によっては一度目の音声が咳や
くしゃみであったり、全く関係のない会話であったりす
る可能性もあるので、ここでは一度目の認識結果と二度
目の認識結果を比較し(ステップS15)、ステップS
16で似ていると判断された場合だけステップS17で
学習を行うようにして、咳やくしゃみ等によるケースを
除くようにしている。
【0022】なお、ここで一度目の認識結果と二度目の
認識結果の類似の判断は、例えばニューラルネットの出
力層の「ニカイ」という単語に対応するニューロンの出
力の値を一度目と二度目とで比較して、その差が所定値
以下の場合は類似する、或いは両者の値がともに所定値
以上の場合は類似すると判断するなどの方法により行
う。
【0023】このようにして以上の手順が繰り返され、
その結果、学習に効果の大きいと思われる音声データだ
けを対象として学習が継続的に行われることになる。な
お、上記の実施例では呼びの登録を行う場合について説
明したが、勿論、ドアの開閉やその他の運転制御を音声
認識で行う場合にも本発明を適用することができる。
【0024】
【発明の効果】本発明によれば、システムの稼働後であ
っても実際に音声認識を行いながらニューラルネットの
学習を行うことができ、しかもその際、ただ単に学習を
継続していくことができるだけでなく、学習効果が大き
いと思われる音声データだけを学習用サンプルの対象と
しているので、ニューラルネットを効率よく学習するこ
とができ、認識確度の向上に大きな効果を発揮すること
ができる。
【図面の簡単な説明】
【図1】本発明のハードウェア構成を示す全体図であ
る。
【図2】本発明の全体を示す機能ブロック図である。
【図3】本発明によるニューラルネットの学習手順を示
すフローチャートである。
【符号の説明】
1 マイクロフォン 2 音声認識装置 3 呼び登録装置 4 表示制御装置 5 表示装置 11 A/D変換器 12 前処理部 13 記憶装置 14 ニューラルネット 15 認識結果判定部 16 ニューラルネット学習装置
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G66B 1/00 - 3/02 G10L 11/00 - 21/06

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 エレベータのかご或いは乗場に設けられ
    たマイクロフォンからの入力音声信号を前処理して入力
    し、その認識結果を出力するニューラルネットを備えた
    エレベータの音声認識装置において、 マイクロフォンに入力された音声の認識結果を利用者に
    確認する手段と、その認識結果が誤っている場合は再度
    音声の入力を促し、その認識結果を再確認する手段と、
    再確認の認識結果が正しい場合は、最初の認識結果と再
    確認の認識結果との類似性を比較する比較手段と、その
    結果類似している場合には最初の入力音声データに基づ
    くニューラルネットへの入力パターンと、前記再確認の
    認識結果(教師信号)とを学習用サンプルとして前記ニ
    ューラルネットの学習を行う学習手段とを備えたことを
    特徴とするエレベータの音声認識装置。
JP07096109A 1995-03-28 1995-03-28 エレベータの音声認識装置 Expired - Lifetime JP3077555B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07096109A JP3077555B2 (ja) 1995-03-28 1995-03-28 エレベータの音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07096109A JP3077555B2 (ja) 1995-03-28 1995-03-28 エレベータの音声認識装置

Publications (2)

Publication Number Publication Date
JPH08259124A JPH08259124A (ja) 1996-10-08
JP3077555B2 true JP3077555B2 (ja) 2000-08-14

Family

ID=14156229

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07096109A Expired - Lifetime JP3077555B2 (ja) 1995-03-28 1995-03-28 エレベータの音声認識装置

Country Status (1)

Country Link
JP (1) JP3077555B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5569534B2 (ja) * 2009-11-06 2014-08-13 三菱電機株式会社 エレベータの呼び登録装置
JP5589394B2 (ja) * 2010-01-18 2014-09-17 三菱電機ビルテクノサービス株式会社 音声認識によるエレベータの操作装置
CN102892697B (zh) * 2010-05-18 2014-12-31 三菱电机株式会社 电梯呼梯登记装置
JP2015107867A (ja) * 2013-12-05 2015-06-11 三菱電機株式会社 エレベータの音声呼び登録装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2543603B2 (ja) * 1989-11-16 1996-10-16 積水化学工業株式会社 単語認識システム
JPH06255911A (ja) * 1993-03-09 1994-09-13 Toshiba Corp エレベータの呼び登録装置

Also Published As

Publication number Publication date
JPH08259124A (ja) 1996-10-08

Similar Documents

Publication Publication Date Title
KR100826875B1 (ko) 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치
US5212821A (en) Machine-based learning system
EP1482480B1 (en) Learning apparatus, learning method, and robot apparatus
CN108574773A (zh) 用于车辆通信的使用机器学习的终端和移动终端的车辆控制方法
Pacnik et al. Voice operated intelligent wheelchair-VOIC
JPS603699A (ja) 適応性自動離散音声認識方法
CN111667812A (zh) 一种语音合成方法、装置、设备及存储介质
JPS62239231A (ja) 口唇画像入力による音声認識方法
EP1280137B1 (en) Method for speaker identification
US5278911A (en) Speech recognition using a neural net
CN1312656C (zh) 说话人标准化方法及用该方法的语音识别装置
JP3077555B2 (ja) エレベータの音声認識装置
Patel et al. Teachable interfaces for individuals with dysarthric speech and severe physical disabilities
JPH0667698A (ja) 音声認識装置
Lashkari et al. NMF-based cepstral features for speech emotion recognition
CN112309183A (zh) 适用于外语教学的交互式听说练习系统
Kouroupetroglou et al. 4.7 Speech Technology for Disabled and Elderly People
JP2564200B2 (ja) 話者認識方法
JPH08259123A (ja) エレベータの音声認識用ニューラルネットの学習方法
Tanaka Next major application systems and key techniques in speech recognition technology
Williams End-to-end signal factorization for speech: identity, content, and style
JPH02254498A (ja) 音韻分類記号化装置
JP2515609B2 (ja) 話者認識方法
JPH05313689A (ja) 話者認識方式
Roy et al. A phoneme probability display for individuals with hearing disabilities

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090616

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100616

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110616

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120616

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130616

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140616

Year of fee payment: 14

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term