JPH04125266A - エレベータの情報入力装置 - Google Patents
エレベータの情報入力装置Info
- Publication number
- JPH04125266A JPH04125266A JP2243945A JP24394590A JPH04125266A JP H04125266 A JPH04125266 A JP H04125266A JP 2243945 A JP2243945 A JP 2243945A JP 24394590 A JP24394590 A JP 24394590A JP H04125266 A JPH04125266 A JP H04125266A
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- voice
- section
- elevator
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 abstract description 24
- 230000008569 process Effects 0.000 abstract description 16
- 238000006243 chemical reaction Methods 0.000 abstract description 3
- 238000005070 sampling Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Landscapes
- Indicating And Signalling Devices For Elevators (AREA)
- Elevator Control (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の目的〕
(産業上の利用分野)
に関する。
(従来の技術)
音声認識手段を有する従来のエレベータ装置について図
面を用いて説明する。第4図及び第5図にて図示したエ
レベータ装置の概要は、エレベータ利用者から発せられ
た音声を受けてこれを電気信号に変換して出力するマイ
クロホーン(以下「マイク」という)のごとき音声入力
手段と、マイクから出力された電気信号を入力してエレ
ベータ利用者が発した音声を認識し、これに基づいて必
要な信号処理を実施するマイクロコンピュータ等から成
る音声認識ユニットのごとき音声認識手段とから成って
いる。前記マイクは、例えばエレベータホールにあって
は第5図符号4にて示すように、エレベータドア1の脇
のホール呼びボタン3が配設されている位置の近傍に配
設されており、一方、前記音声認識ユニットは、第4図
にて図示するような各部を具備した構成となっている。
面を用いて説明する。第4図及び第5図にて図示したエ
レベータ装置の概要は、エレベータ利用者から発せられ
た音声を受けてこれを電気信号に変換して出力するマイ
クロホーン(以下「マイク」という)のごとき音声入力
手段と、マイクから出力された電気信号を入力してエレ
ベータ利用者が発した音声を認識し、これに基づいて必
要な信号処理を実施するマイクロコンピュータ等から成
る音声認識ユニットのごとき音声認識手段とから成って
いる。前記マイクは、例えばエレベータホールにあって
は第5図符号4にて示すように、エレベータドア1の脇
のホール呼びボタン3が配設されている位置の近傍に配
設されており、一方、前記音声認識ユニットは、第4図
にて図示するような各部を具備した構成となっている。
なお、第5図にて、符号2は、エレベータの昇降かどの
現在位置を表示する位置表示手段である。また音声が認
識できた場合OKクランプ5Aが点灯し、認識できなか
った場合リジェクトランプ15Bが点灯する。
現在位置を表示する位置表示手段である。また音声が認
識できた場合OKクランプ5Aが点灯し、認識できなか
った場合リジェクトランプ15Bが点灯する。
第4図において、A/D変換部6は、マイク4から入力
されたエレベータ利用者が発した音声信号に対応する電
気信号(即ち、アナログ信号)を受けてこれを前記電気
信号に対応したディジタル信号に変換した後出力する。
されたエレベータ利用者が発した音声信号に対応する電
気信号(即ち、アナログ信号)を受けてこれを前記電気
信号に対応したディジタル信号に変換した後出力する。
バンドパスフィルタ部7、音声区間検出部8、サンプリ
ング部9等は、音声認識処理に必要な入力音声の周波数
分析を始めとする各種信号処理を行なうために設けられ
ている。即ち、バンドパスフィルタ部7には、ディジタ
ルシグナルプロセッサ(rDsPJと略記する)が使用
されている。
ング部9等は、音声認識処理に必要な入力音声の周波数
分析を始めとする各種信号処理を行なうために設けられ
ている。即ち、バンドパスフィルタ部7には、ディジタ
ルシグナルプロセッサ(rDsPJと略記する)が使用
されている。
前記バンドパスフィルタ部7は、A/D変換部6から出
力されたディジタル信号を受けて、高速フーリエ変換(
通常、rFFTJという)にて前記マイク4を通して入
力された音声信号の帯域制限をディジタル的に行ない、
サンプリング周波数12KHz、 12ビツトのディジ
タル値を得るようになっている。更に前記バンドパスフ
ィルタ部7は、前記サンプリング周波数12KHz、1
2ビツトのディジタル値から音声信号の特徴のみを抽出
し、8履sec単位のスペクトル系列に変換して情報量
の圧縮を行なった後、出力する。バンドパスフィルタ部
7が上述したような信号処理を行なう理由としては、前
記サンプリング周波数12 K Hz、12ビツトのデ
ィジタル値が音声信号に対して連続的な数値となってい
るためである。
力されたディジタル信号を受けて、高速フーリエ変換(
通常、rFFTJという)にて前記マイク4を通して入
力された音声信号の帯域制限をディジタル的に行ない、
サンプリング周波数12KHz、 12ビツトのディジ
タル値を得るようになっている。更に前記バンドパスフ
ィルタ部7は、前記サンプリング周波数12KHz、1
2ビツトのディジタル値から音声信号の特徴のみを抽出
し、8履sec単位のスペクトル系列に変換して情報量
の圧縮を行なった後、出力する。バンドパスフィルタ部
7が上述したような信号処理を行なう理由としては、前
記サンプリング周波数12 K Hz、12ビツトのデ
ィジタル値が音声信号に対して連続的な数値となってい
るためである。
音声区間検出部8は、前記バンドパスフィルタ部7から
の出力を受けて有効な音声信号の抽出を行なうとともに
、この抽出した音声信号に基づいて実際に音声認識すべ
き音声データをまとめるようになっている。サンプリン
グ部9は、前記音声区間検出部8から出力された実際に
音声認識すべき音声データを受けると、この音声データ
が辞書記憶部10に格納されている音声認識に用いる辞
書パターンの音声区間長に適合するように正規化する。
の出力を受けて有効な音声信号の抽出を行なうとともに
、この抽出した音声信号に基づいて実際に音声認識すべ
き音声データをまとめるようになっている。サンプリン
グ部9は、前記音声区間検出部8から出力された実際に
音声認識すべき音声データを受けると、この音声データ
が辞書記憶部10に格納されている音声認識に用いる辞
書パターンの音声区間長に適合するように正規化する。
前記音声データ即ちエレベータ利用者からの入力音声の
長さは、各々のエレベータ利用者毎に異なるからである
。前記サンプリング部9は、前記正規化により前記音声
データを256点のデータ(16X]、6の三次元デー
タ)に変換した後出力する。
長さは、各々のエレベータ利用者毎に異なるからである
。前記サンプリング部9は、前記正規化により前記音声
データを256点のデータ(16X]、6の三次元デー
タ)に変換した後出力する。
辞書記憶部10には、256点の辞書パターン記憶(登
録)されている。前記辞書記憶部10に記憶(登録)さ
れる単語数は例えば16単語程度であり、認識区別しに
くい音声には数種類の単語が辞書に格納されている。例
えば、1階は「イツカイ」、「イチカイ」等、複数個の
辞書を持つようにすれば、音声認識率の向上を図ること
ができる。CPTJ5はプログラム記憶部12に格納さ
れている音声認識処理を行なうのに必要な処理手順が示
されているプログラムに基づき、サンプリング部9から
出力された前記256点のデータと、辞書記憶部10に
記憶されている256点の辞書パターンとを比較して類
似度を演算する。CPU5は、前記類似度演算の結果前
記辞書記憶部10の中から最も類似度の高い辞書パター
ンを抽出し、この抽出した辞書パターンを音声認識の処
理結果として操作出力部11に出力するようになってい
る。操作出力部11は、CPU5からの出力信号を受け
てこれをエレベータ制御部13に出力する。エレベータ
制御部13は、操作出力部11を通してCPU5から出
力される信号を受けると、この信号に基づいてエレベー
タ装置の駆動を制御する。また認識結果は認識結果表示
部14より表示部15に送られ、OK、?の表現を行な
っている。
録)されている。前記辞書記憶部10に記憶(登録)さ
れる単語数は例えば16単語程度であり、認識区別しに
くい音声には数種類の単語が辞書に格納されている。例
えば、1階は「イツカイ」、「イチカイ」等、複数個の
辞書を持つようにすれば、音声認識率の向上を図ること
ができる。CPTJ5はプログラム記憶部12に格納さ
れている音声認識処理を行なうのに必要な処理手順が示
されているプログラムに基づき、サンプリング部9から
出力された前記256点のデータと、辞書記憶部10に
記憶されている256点の辞書パターンとを比較して類
似度を演算する。CPU5は、前記類似度演算の結果前
記辞書記憶部10の中から最も類似度の高い辞書パター
ンを抽出し、この抽出した辞書パターンを音声認識の処
理結果として操作出力部11に出力するようになってい
る。操作出力部11は、CPU5からの出力信号を受け
てこれをエレベータ制御部13に出力する。エレベータ
制御部13は、操作出力部11を通してCPU5から出
力される信号を受けると、この信号に基づいてエレベー
タ装置の駆動を制御する。また認識結果は認識結果表示
部14より表示部15に送られ、OK、?の表現を行な
っている。
上述した構成のエレベータ装置には、不特定話者単語認
識と称される音声認識方法が用いられるのが一般的であ
り、この音声認識方法によれば、不特定話者即ち誰の音
声でも認識することが可能である。又、上記不特定話者
単語認識と称される方法においては、例えば、音声内容
が「ヒラケ」、「トジロ」、「ゴカイ」等の単語単位で
音声認識されるようになっている。
識と称される音声認識方法が用いられるのが一般的であ
り、この音声認識方法によれば、不特定話者即ち誰の音
声でも認識することが可能である。又、上記不特定話者
単語認識と称される方法においては、例えば、音声内容
が「ヒラケ」、「トジロ」、「ゴカイ」等の単語単位で
音声認識されるようになっている。
第6図は、上記第4図、第5図にて図示した構成のエレ
ベータ装置における音声認識の処理過程を示す音声波形
図である。第6図において、第6図(a)はマイク4か
ら入力された音声波形を示しており、この音声波形には
、前記CPU5が上述したプロセスを経て音声認識すべ
き単語の他に様々な雑音が混入している。第6図(b)
は、前記音声区間検出部8による音声認識に必要な単語
の区間の抽出の過程を図示している。音声区間検出部8
による上記信号処理が必要な理由は、上述したように、
第6図(a)にて示した音声波形に、音声認識すべき単
語の他に様々な雑音が混入しているためである。上記処
理においては、前記第6図(a)にて示した音声波形の
中から最も特徴のある振幅を持った音声が入力されたこ
とを検出することが条件となるので、大きな騒音がマイ
ク4から入力されたときには誤検知する可能性がある。
ベータ装置における音声認識の処理過程を示す音声波形
図である。第6図において、第6図(a)はマイク4か
ら入力された音声波形を示しており、この音声波形には
、前記CPU5が上述したプロセスを経て音声認識すべ
き単語の他に様々な雑音が混入している。第6図(b)
は、前記音声区間検出部8による音声認識に必要な単語
の区間の抽出の過程を図示している。音声区間検出部8
による上記信号処理が必要な理由は、上述したように、
第6図(a)にて示した音声波形に、音声認識すべき単
語の他に様々な雑音が混入しているためである。上記処
理においては、前記第6図(a)にて示した音声波形の
中から最も特徴のある振幅を持った音声が入力されたこ
とを検出することが条件となるので、大きな騒音がマイ
ク4から入力されたときには誤検知する可能性がある。
第6図(c)は、前記バントパスフィルタ部7からの出
力結果を示しており、バンドパスフィルタ部7からは図
のごと〈16チヤネルの周波数帯のデータが出力される
。
力結果を示しており、バンドパスフィルタ部7からは図
のごと〈16チヤネルの周波数帯のデータが出力される
。
前記第4図にて図示した構成において、例えばエレベー
タ利用者がマイク4に向って「ゴカイ」と発音すると、
この「ゴカイ」に対応するアナログ電圧信号がA/D変
換器6を通してバンドパスフィルタ部7、音声区間検出
部8、サンプリング部9にて夫々既述のような信号処理
が施されてCPU5に出力される。CPU5は、サンプ
リング部9を通して与えられた信号と辞書記憶部10に
記憶されている辞書パターンとから所定の音声認識処理
動作を実行し、操作出力部11を通してエレベータ制御
部13に出力する。この操作出力部11からの出力によ
ってエレベータ制御部13はエレベータ装置を構成する
各部の制御を行なう。即ち、5階の呼び応答ランプを点
灯するとともに、エレベータかご駆動機構を制御してエ
レベータがごを5階へと移動するので、従来のようにエ
レベータ利用者が5階の呼びボタンを押した場合と全く
同様となる。
タ利用者がマイク4に向って「ゴカイ」と発音すると、
この「ゴカイ」に対応するアナログ電圧信号がA/D変
換器6を通してバンドパスフィルタ部7、音声区間検出
部8、サンプリング部9にて夫々既述のような信号処理
が施されてCPU5に出力される。CPU5は、サンプ
リング部9を通して与えられた信号と辞書記憶部10に
記憶されている辞書パターンとから所定の音声認識処理
動作を実行し、操作出力部11を通してエレベータ制御
部13に出力する。この操作出力部11からの出力によ
ってエレベータ制御部13はエレベータ装置を構成する
各部の制御を行なう。即ち、5階の呼び応答ランプを点
灯するとともに、エレベータかご駆動機構を制御してエ
レベータがごを5階へと移動するので、従来のようにエ
レベータ利用者が5階の呼びボタンを押した場合と全く
同様となる。
(発明が解決しようとする課題)
上述した構成の音声認識機能を具備したエレベータ情報
入力装置においては呼びボタンを押さなくとも利用者の
声で操作ができるわけであるが、エレベータにおいての
音声指令は事務機器のように接話マイクを使用するわけ
ではなく多くの利用者の前で声を出さなければならない
ように周囲環境が異なる。
入力装置においては呼びボタンを押さなくとも利用者の
声で操作ができるわけであるが、エレベータにおいての
音声指令は事務機器のように接話マイクを使用するわけ
ではなく多くの利用者の前で声を出さなければならない
ように周囲環境が異なる。
その結果、音声を発する場合には他の利用者を気にしな
がら行なうことになり、結果的に正常に認識されない場
合が多くなる。利用者はこのような環境で何度か声を発
しなけれるばならない状態が続くと、利用者に対して精
神的苦痛を与えることになる。
がら行なうことになり、結果的に正常に認識されない場
合が多くなる。利用者はこのような環境で何度か声を発
しなけれるばならない状態が続くと、利用者に対して精
神的苦痛を与えることになる。
つまり、現在では音声による指令を受は付ける装置は一
般的でなく、かつ、エレベータのように公衆の前で行わ
なければならない装置はないので利用者が慣れていない
ために認識できない結果が生じるわけである。
般的でなく、かつ、エレベータのように公衆の前で行わ
なければならない装置はないので利用者が慣れていない
ために認識できない結果が生じるわけである。
またエレベータ情報入力装置では利用者の音声の処理結
果をrOKJ 、r?Jなどにより結果表示するため、
利用者から見れば何が問題で認識されなかったのかわか
らないため不満が残る欠点があった。
果をrOKJ 、r?Jなどにより結果表示するため、
利用者から見れば何が問題で認識されなかったのかわか
らないため不満が残る欠点があった。
これらの問題は特に音声認識機能を具備したエレベータ
情報入力装置を初めて使用する人にとっては重大であり
、初めて使用した時に悪い印象を持ってしまうとその人
は二度と本装置を使用しなくなってしまう恐れがあり、
本装置による使い勝手の向上が有効にならないことにな
ってしまう欠点になっていた。
情報入力装置を初めて使用する人にとっては重大であり
、初めて使用した時に悪い印象を持ってしまうとその人
は二度と本装置を使用しなくなってしまう恐れがあり、
本装置による使い勝手の向上が有効にならないことにな
ってしまう欠点になっていた。
さらに、従来のエレベータ情報入力装置は利用者の音声
がどのような標準パターンと類似しているかを判定して
いるので利用者に対して有効な発生方法を教示するのは
従来、何等考慮されていない。
がどのような標準パターンと類似しているかを判定して
いるので利用者に対して有効な発生方法を教示するのは
従来、何等考慮されていない。
本発明は上記欠点を解決するために音声認識処理におけ
る内部情報を利用者に報知し、利用者の音声指令が装置
内でどのように解釈されたかを明確にして音声の認識率
を向上させるエレベータの情報入力装置を提供するもの
である。
る内部情報を利用者に報知し、利用者の音声指令が装置
内でどのように解釈されたかを明確にして音声の認識率
を向上させるエレベータの情報入力装置を提供するもの
である。
(課題を解決するための手段)
上記目的を達成するために本発明ではマイクに入力され
た音を受けてこれを電気信号に変換して音声認識を実施
する過程において久方音声の大きさ、音声認識実行にお
ける類似度演算点数、また音声波形等の内で情報をとり
だす手段を備え、音声の認識処理と伴にこれら内部情報
を利用者に報知できる構成としている。
た音を受けてこれを電気信号に変換して音声認識を実施
する過程において久方音声の大きさ、音声認識実行にお
ける類似度演算点数、また音声波形等の内で情報をとり
だす手段を備え、音声の認識処理と伴にこれら内部情報
を利用者に報知できる構成としている。
(作用)
入力音声と標準パターン音声との類似度を比較部にて演
算し、この演算結果を、表示部に表示し、音声指令の演
算処理内容を利用客に報知する。
算し、この演算結果を、表示部に表示し、音声指令の演
算処理内容を利用客に報知する。
(実施例)
以下、図面により本発明の一実施例について説明する。
第1図は本発明によるブロック図である。
従来構成の第4図と比較すると本装置の内部情報を格納
して利用者に報知するための記憶部である内部情報格納
部16が追加されている。一般に音声認識処理はDSP
などの専用処理装置で分析しているが、その判定はCP
U5にて実施しているのでこの内部情報格納部16はC
PU5のレジスタとなる。
して利用者に報知するための記憶部である内部情報格納
部16が追加されている。一般に音声認識処理はDSP
などの専用処理装置で分析しているが、その判定はCP
U5にて実施しているのでこの内部情報格納部16はC
PU5のレジスタとなる。
次に本発明により利用者に対する報知情報量を拡大する
と単にランプ表示では表現しきれないため報知に画像表
示部15Aが追加される。これは漢字表示を考えると3
20 X 32ドツト以上の画素数があれば充分な表現
ができる。またこの画像表示用に画像表示用の記憶部と
画像制御部を備えた認識結果表示部14Aを付加する必
要がある。
と単にランプ表示では表現しきれないため報知に画像表
示部15Aが追加される。これは漢字表示を考えると3
20 X 32ドツト以上の画素数があれば充分な表現
ができる。またこの画像表示用に画像表示用の記憶部と
画像制御部を備えた認識結果表示部14Aを付加する必
要がある。
第2図は、本発明の一実施例に従うエレベータ装置が用
いられているエレベータホールの外観図である。本実施
例に従うエレベータ装置は、エレベータ利用者から発せ
られた音声によりエレベータ利用者の行き先階を登録す
るようになっているものである。第2図において、前記
第5図と同一物には同一符号を付す。なお、符号3Aは
、行先呼応答ランプであり、音声認識の結果たる階数(
1〜5)が点灯表示されるように構成されている。
いられているエレベータホールの外観図である。本実施
例に従うエレベータ装置は、エレベータ利用者から発せ
られた音声によりエレベータ利用者の行き先階を登録す
るようになっているものである。第2図において、前記
第5図と同一物には同一符号を付す。なお、符号3Aは
、行先呼応答ランプであり、音声認識の結果たる階数(
1〜5)が点灯表示されるように構成されている。
第2図にて図示した構成によれば、エレベータ利用者が
エレベータかとに乗る前にマイク4を通して行先階を入
力することによって自動的に呼びが登録されるようにな
っているので、エレベータかご内では呼び登録する必要
がない。
エレベータかとに乗る前にマイク4を通して行先階を入
力することによって自動的に呼びが登録されるようにな
っているので、エレベータかご内では呼び登録する必要
がない。
第7図は、本発明の一実施例に従うエレベータ装置の構
成を示すブロック図である。第7図において、前記第4
図と同一物には同一符号を付す。
成を示すブロック図である。第7図において、前記第4
図と同一物には同一符号を付す。
本実施例は利用者からの音声指令が基準値を超える類似
度を得ることができなかった場合にその最も類似度の高
い単語とその得点を表示して利用者に報知するものであ
り、前述の如くエレベータホールからの行先呼に限った
場合を図示した。従って内部情報格納部16Aの構成は
音声認識結果の第一候補単語を示すレジスタとその演算
結果の得点を示す類似度得点レジスタの2つのレジスタ
になっている。
度を得ることができなかった場合にその最も類似度の高
い単語とその得点を表示して利用者に報知するものであ
り、前述の如くエレベータホールからの行先呼に限った
場合を図示した。従って内部情報格納部16Aの構成は
音声認識結果の第一候補単語を示すレジスタとその演算
結果の得点を示す類似度得点レジスタの2つのレジスタ
になっている。
類似度の判定は3次元の2つの波形を比較するため各種
の方法が採用されているが、一般的には各ポイントにお
ける波形の差分を2乗して加えた値になっており、単純
に100点などの判定はできないが、相対的な数値とし
て100点表現することは容易である。ただし、この場
合全く異った音声でも数10点の表示をしてしまうが実
用上問題はない。
の方法が採用されているが、一般的には各ポイントにお
ける波形の差分を2乗して加えた値になっており、単純
に100点などの判定はできないが、相対的な数値とし
て100点表現することは容易である。ただし、この場
合全く異った音声でも数10点の表示をしてしまうが実
用上問題はない。
次に報知内容は第8図に示すように文字による表現を行
なう。この場合20文字×2行程度の表示容量が必要で
ある。漢字1文字を16 X 16ドツトで表現すると
すれば320 X 32ドツトの画像表示部15が必要
であり、認識結果表示部14もその表示に必要な画像記
憶部(1,5にバイト程度)を有する。
なう。この場合20文字×2行程度の表示容量が必要で
ある。漢字1文字を16 X 16ドツトで表現すると
すれば320 X 32ドツトの画像表示部15が必要
であり、認識結果表示部14もその表示に必要な画像記
憶部(1,5にバイト程度)を有する。
一般に画像表示はパーソナルコンピュータに代表される
ように汎用的に使用されているのでここでは詳細は略す
。
ように汎用的に使用されているのでここでは詳細は略す
。
次に上記構成の制御動作を、主に第3図にて図示するフ
ローチャートを併用しながら説明する。
ローチャートを併用しながら説明する。
音声区間検出部8において、バンドパスフィルタ部7か
ら出方された信号中から有効な音声の抽出が行なわれ、
この抽出された音声がサンプリング部9を通して与えら
れることによって、CPU5は、マイク4を通してエレ
ベータ利用者から音声が入力されたものと認識する(ス
テップ1o1)。
ら出方された信号中から有効な音声の抽出が行なわれ、
この抽出された音声がサンプリング部9を通して与えら
れることによって、CPU5は、マイク4を通してエレ
ベータ利用者から音声が入力されたものと認識する(ス
テップ1o1)。
ステップ101において、エレベータ利用者から音声が
入力されたことを認識すると、通常行なわれているのと
同様な音声認識処理を実行しくステップ102) 、ス
テップ102にて行なわれた音声認識処理結果の類似度
演算を行なう。即ち、サンプリング部9から与えられた
256点の音声データと辞書記憶部10内に記憶されて
いる256パターンとを比較して類似度を演算し、類似
度が第1位〜第3位程度の認識単語と類似度結果とを8
力する(ステップ103)。
入力されたことを認識すると、通常行なわれているのと
同様な音声認識処理を実行しくステップ102) 、ス
テップ102にて行なわれた音声認識処理結果の類似度
演算を行なう。即ち、サンプリング部9から与えられた
256点の音声データと辞書記憶部10内に記憶されて
いる256パターンとを比較して類似度を演算し、類似
度が第1位〜第3位程度の認識単語と類似度結果とを8
力する(ステップ103)。
ステップ104ではステップ103で実施された各候補
の単語のうち第1位の単語が80%を超える類似度を示
した場合にその単語を認識結果と判定する。
の単語のうち第1位の単語が80%を超える類似度を示
した場合にその単語を認識結果と判定する。
この決定方法は構成によって異なるが、類似度の判定基
準を高くすると、正常認識と判定される率が低くなるた
め正確に発音しないと認識できなくなる。
準を高くすると、正常認識と判定される率が低くなるた
め正確に発音しないと認識できなくなる。
一般にエレベータが使用される環境は周囲の暗騒音は定
常的に低いが利用客のざわめきや廊下を歩く靴音などの
非定常的な騒音が発生するため類似度は80%程度が好
ましい。ここでの80%は同時に類似度80点と表現で
きる。ここで類似度が基準値以上であれば通常の認識動
作であるステップ105以降の処理を行ない、類似度が
基準値以下であれば本発明による内部情報の表示である
ステップ108以降の処理を行なう。
常的に低いが利用客のざわめきや廊下を歩く靴音などの
非定常的な騒音が発生するため類似度は80%程度が好
ましい。ここでの80%は同時に類似度80点と表現で
きる。ここで類似度が基準値以上であれば通常の認識動
作であるステップ105以降の処理を行ない、類似度が
基準値以下であれば本発明による内部情報の表示である
ステップ108以降の処理を行なう。
ここではまず正常処理について説明する。ステップ10
5では類似度の高い第一候補の呼びを示す単語にカイ、
サンカイなど)を選び出しステップ106でその単語を
呼びデータの形に変換する。
5では類似度の高い第一候補の呼びを示す単語にカイ、
サンカイなど)を選び出しステップ106でその単語を
呼びデータの形に変換する。
呼びデータは一般的に1バイトのデータ構造の内に1ビ
ツト毎に意味を持つ形であるので階床を1ビツトのデー
タに変換する処理となっている。
ツト毎に意味を持つ形であるので階床を1ビツトのデー
タに変換する処理となっている。
ステップ107は第8図(b)に示すように認識結果を
文字表現する処理を行なっている。本図ではパニカイ”
の単語を認識して呼びを登録したことを示している。
文字表現する処理を行なっている。本図ではパニカイ”
の単語を認識して呼びを登録したことを示している。
次に本発明であるステップ108以降を説明する。
ステップ108は先に音声認識処理過程の説明時に示し
た類似度演算過程において計算された各候補の単語のう
ち最も類似度の高い第一候補単語を抽出することを示し
ている。音声認識は久方音声と辞書に格納されたすべて
の単語の類似度を演算しているのでこの結果を検索する
ことにより容易に実施できる。
た類似度演算過程において計算された各候補の単語のう
ち最も類似度の高い第一候補単語を抽出することを示し
ている。音声認識は久方音声と辞書に格納されたすべて
の単語の類似度を演算しているのでこの結果を検索する
ことにより容易に実施できる。
ステップ109は同様に利用客に報知できる形に類似度
を変換する処理を示している。通常このような報知は詳
細表現しても意味がないので数値の丸め処理になってい
る。本例では1ケタ目の数値を四捨五入している。
を変換する処理を示している。通常このような報知は詳
細表現しても意味がないので数値の丸め処理になってい
る。本例では1ケタ目の数値を四捨五入している。
従って類似度45%では表示は50点となる。
ステップ110では以上の結果を文字情報に変換して認
識結果表示部14へ書き込むことを示している。表示例
として第8図(c)を示す。
識結果表示部14へ書き込むことを示している。表示例
として第8図(c)を示す。
また第8図(a)は音声入力待ち状態の表示である。
本実施例によれば音声指令の類似度が低い時でも単に?
”を表現して再発声を要求するのではなく最も近い辞書
記憶部の階番号とその得点を表示するので利用者は再発
声する時に注意して指令することができる。
”を表現して再発声を要求するのではなく最も近い辞書
記憶部の階番号とその得点を表示するので利用者は再発
声する時に注意して指令することができる。
つまり゛′ニカイ″と発声したのに結果が3階。
50点のように発声した内容と異なる結果が得られた時
は周囲の騒音や発声する前に余分な音を出した(例えば
″え〜っと2階”)ことが考えられる。
は周囲の騒音や発声する前に余分な音を出した(例えば
″え〜っと2階”)ことが考えられる。
特に何人かの人が集まって本装置を使用している場合な
ど多く発声するため、利用者は次には気をつけて発声で
きる。また同様にして結果が2階。
ど多く発声するため、利用者は次には気をつけて発声で
きる。また同様にして結果が2階。
50点のように発声した内容とは一致しているが得点が
低い場合には声が小さい、マイクとの距離が長いなど主
として音声のレベルが低い場合に生じるため利用者は次
には発声位置、量に注意できる。
低い場合には声が小さい、マイクとの距離が長いなど主
として音声のレベルが低い場合に生じるため利用者は次
には発声位置、量に注意できる。
このように本実施例では類似度の演算結果の報知により
、利用者が発声方法について学習する効果がある。
、利用者が発声方法について学習する効果がある。
一般にエレベータは不特定多数の人が利用するので各利
用者すべての音声を認識することは困難であるが、本実
施例では点数表示といった形で利用者が興味を持ってエ
レベータを利用できる効果がある。
用者すべての音声を認識することは困難であるが、本実
施例では点数表示といった形で利用者が興味を持ってエ
レベータを利用できる効果がある。
上述の実施例では音声認識の結果類似度が基準値を超え
なかった場合に第一候補階床と類似度得点を報知する場
合を示したが、類似度が基準値以上であっても得点表示
してもよい。
なかった場合に第一候補階床と類似度得点を報知する場
合を示したが、類似度が基準値以上であっても得点表示
してもよい。
また、この類似度の表現は数値に限らずパーセントを示
す円グラフや棒グラフなどの図形表示も容易に実施可能
である。
す円グラフや棒グラフなどの図形表示も容易に実施可能
である。
この−例を第9図に示す。これは画像表示可能な高解像
画面(例えば液晶など)上に類似度を円グラフ表現して
いる。この結果利用者は直感的に結果を判断することが
できる。
画面(例えば液晶など)上に類似度を円グラフ表現して
いる。この結果利用者は直感的に結果を判断することが
できる。
また別の表現として音声波形を上記画面上に表示して同
時に辞書に格納済の音声波形を表示すれば、波形の違い
により騒音の影響を知ることができる。
時に辞書に格納済の音声波形を表示すれば、波形の違い
により騒音の影響を知ることができる。
また入力音声の大きさを棒グラフによりレベルメータ表
示するだけでも利用者は発声した音声の量を知ることが
でき、声が小さいなどの問題点発見ができる。この例を
第10図に示す。
示するだけでも利用者は発声した音声の量を知ることが
でき、声が小さいなどの問題点発見ができる。この例を
第10図に示す。
また以上表示による報知について説明したが音声により
結果表示してもよい。
結果表示してもよい。
本発明によれば音声認識処理内容を簡素化して利用者に
報知するので音声指令に対して意図しなかった結果が得
られてもその原因を推測して発声方法や操作位置を見直
すことができるので、その結果認識率が向上するだけで
なく、楽しんで利用することができるので利用者とエレ
ベータの信頼感の向上も行なえる。
報知するので音声指令に対して意図しなかった結果が得
られてもその原因を推測して発声方法や操作位置を見直
すことができるので、その結果認識率が向上するだけで
なく、楽しんで利用することができるので利用者とエレ
ベータの信頼感の向上も行なえる。
一方エレベータホールは建物の通路であり長時間マイク
の前に立つことは通行のさまたげとなるが認識率の向上
によってその時間を短くすることができ、全体的なサー
ビス向上の効果もある。
の前に立つことは通行のさまたげとなるが認識率の向上
によってその時間を短くすることができ、全体的なサー
ビス向上の効果もある。
また音声認識技術は現在では完全な不特定話者の認識は
困難とされ、認識できない話者の存在があるが本発明に
よれば利用者の学習効果により、エレベータ利用者すべ
ての音声を認識できるようになる利点もある。
困難とされ、認識できない話者の存在があるが本発明に
よれば利用者の学習効果により、エレベータ利用者すべ
ての音声を認識できるようになる利点もある。
第1図は本発明によるエレベータ情報入力装置の構成を
示すブロック図、第2図は本発明の一実施例に従うエレ
ベータ装置が用いられているエレベータホールの外観図
、第3図は第1図にて示した構成の制御動作を示すフロ
ーチャート、第4図は従来技術に従うエレベータ装置の
構成を示すブロック図、第5図は従来技術に従うエレベ
ータ装置が用いられているエレベータホールの外観図、
第6図は音声認識機能を具備した一般的なエレベータ装
置の音声認識処理過程における音声波形図、第7図は本
発明の一実施例に従うエレベータ装置と同様の表示例を
示す図である。 5・・・CPU 6・・・A/D変換部7・
・・バンドパスフィルタ部 8・・・音声区間検出部 9・・・サンプリング部10
・・・辞書記憶部 11・・・操作出力部12・・
・プログラム記憶部 13・・・エレベータ制御部 14・・・認識結果表示
部15A・・・画像表示部 16・・・内部情報格納
部代理人 弁理士 則 近 憲 佑 SA 第 図 第 図 第 図 第 図 /S 第 図 第 図 (b) 第 図 H HJ6 問シlシー(昭5辷= (C) 第 図
示すブロック図、第2図は本発明の一実施例に従うエレ
ベータ装置が用いられているエレベータホールの外観図
、第3図は第1図にて示した構成の制御動作を示すフロ
ーチャート、第4図は従来技術に従うエレベータ装置の
構成を示すブロック図、第5図は従来技術に従うエレベ
ータ装置が用いられているエレベータホールの外観図、
第6図は音声認識機能を具備した一般的なエレベータ装
置の音声認識処理過程における音声波形図、第7図は本
発明の一実施例に従うエレベータ装置と同様の表示例を
示す図である。 5・・・CPU 6・・・A/D変換部7・
・・バンドパスフィルタ部 8・・・音声区間検出部 9・・・サンプリング部10
・・・辞書記憶部 11・・・操作出力部12・・
・プログラム記憶部 13・・・エレベータ制御部 14・・・認識結果表示
部15A・・・画像表示部 16・・・内部情報格納
部代理人 弁理士 則 近 憲 佑 SA 第 図 第 図 第 図 第 図 /S 第 図 第 図 (b) 第 図 H HJ6 問シlシー(昭5辷= (C) 第 図
Claims (1)
- エレベータのかご及びホールで利用客の音声による指令
を認識して操作を行なうエレベータにおいて入力音声と
標準パターン音声の比較部と前記比較結果の類似度を演
算する手段と文字図形データの表示部と前記類似度演算
結果を出力する手段を備え音声指令の演算処理内容を利
用客に報知することを特徴とするエレベータの情報入力
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2243945A JPH04125266A (ja) | 1990-09-17 | 1990-09-17 | エレベータの情報入力装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2243945A JPH04125266A (ja) | 1990-09-17 | 1990-09-17 | エレベータの情報入力装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04125266A true JPH04125266A (ja) | 1992-04-24 |
Family
ID=17111376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2243945A Pending JPH04125266A (ja) | 1990-09-17 | 1990-09-17 | エレベータの情報入力装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04125266A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7044584B2 (en) | 1997-07-15 | 2006-05-16 | Silverbrook Research Pty Ltd | Wide format pagewidth inkjet printer |
JP2010202309A (ja) * | 2009-03-02 | 2010-09-16 | Mitsubishi Electric Corp | エレベーターの呼び登録装置 |
WO2011086663A1 (ja) * | 2010-01-12 | 2011-07-21 | 三菱電機株式会社 | エレベーターの呼び登録装置 |
-
1990
- 1990-09-17 JP JP2243945A patent/JPH04125266A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7044584B2 (en) | 1997-07-15 | 2006-05-16 | Silverbrook Research Pty Ltd | Wide format pagewidth inkjet printer |
JP2010202309A (ja) * | 2009-03-02 | 2010-09-16 | Mitsubishi Electric Corp | エレベーターの呼び登録装置 |
WO2011086663A1 (ja) * | 2010-01-12 | 2011-07-21 | 三菱電機株式会社 | エレベーターの呼び登録装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3674990B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
US5255341A (en) | Command input device for voice controllable elevator system | |
JP4867804B2 (ja) | 音声認識装置及び会議システム | |
KR20060081076A (ko) | 음성인식으로 층수를 지정하는 엘리베이터 | |
JPS6147440B2 (ja) | ||
CN112607536B (zh) | 一种电梯控制的方法、装置、计算机设备和存储介质 | |
JP2007500367A (ja) | 音声認識方法およびコミュニケーション機器 | |
JPH0373775A (ja) | エレベータの情報入力装置 | |
JPH08297496A (ja) | 音声特徴分析装置 | |
JPS6044225B2 (ja) | エレベ−タ | |
JPH04125266A (ja) | エレベータの情報入力装置 | |
JPH03284589A (ja) | エレベータの音声登録装置 | |
JP2647207B2 (ja) | エレベータの呼び登録装置 | |
JP2014228644A (ja) | 報知装置 | |
JP2006038929A (ja) | 音声案内装置、音声案内方法およびナビゲーション装置 | |
JP2000029486A (ja) | 音声認識システムおよび方法 | |
JP2002229592A (ja) | 音声認識装置 | |
JP2825272B2 (ja) | エレベータ装置 | |
JP3846500B2 (ja) | 音声認識対話装置および音声認識対話処理方法 | |
JPH06255911A (ja) | エレベータの呼び登録装置 | |
JPH03293274A (ja) | エレベータの音声登録装置 | |
JP2001042894A (ja) | 音声認識装置及び方法 | |
JPH04298464A (ja) | エレベータの情報入力装置 | |
JPH10198393A (ja) | 会話記録装置 | |
KR20080061901A (ko) | 로봇의 입출력 장치에 의한 효율적인 음성인식 방법 및시스템 |