JPH0954597A - 項目入力装置 - Google Patents

項目入力装置

Info

Publication number
JPH0954597A
JPH0954597A JP7205506A JP20550695A JPH0954597A JP H0954597 A JPH0954597 A JP H0954597A JP 7205506 A JP7205506 A JP 7205506A JP 20550695 A JP20550695 A JP 20550695A JP H0954597 A JPH0954597 A JP H0954597A
Authority
JP
Japan
Prior art keywords
recognition
voice
evaluation value
candidate
input device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7205506A
Other languages
English (en)
Inventor
Tetsuya Tsurumi
哲也 鶴見
Terumichi Fukumoto
照道 福本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Information Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Information Systems Co Ltd filed Critical Matsushita Information Systems Co Ltd
Priority to JP7205506A priority Critical patent/JPH0954597A/ja
Publication of JPH0954597A publication Critical patent/JPH0954597A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Ticket-Dispensing Machines (AREA)
  • Devices For Checking Fares Or Tickets At Control Points (AREA)

Abstract

(57)【要約】 【課題】 音声による各種項目の入力操作を効率良く行
うことを可能となす項目入力装置を提供することを目的
としている。 【解決手段】 マイクロホン2を通じて音声入力された
項目を、音声認識辞書3を参照して音声認識し、上位3
つの認識候補をその評価値と共に認識候補記憶手段5に
記憶する。更に、評価値比較手段7にて、閾値格納手段
6に格納された3つの閾値を使って評価値の比較を行っ
て認識結果を決定し、認識結果記憶手段8に記憶する。
認識結果については、ディスプレイ9に表示され、ま
た、音声合成装置10で音声合成されて、スピーカ11
を通じ音声出力される。更に、最終決定された認識結果
については、認識結果通知手段によって券売機14へ通
知される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、各種項目の入力
を、音声によって行う項目入力装置に関するものであ
る。
【0002】
【従来の技術】近年、音声認識や音声合成技術の発達に
伴い、入力操作性の向上を図る目的で、それらの音声処
理技術を応用した様々な装置が開発されている。自動券
売機等の各種販売装置で使用されている音声による項目
入力装置は、その一つの応用例である。
【0003】一方、音声認識技術では、入力情報が、話
者に依存する音声という不安定な要素であるために、通
常は、その認識結果として複数の認識候補が出力され、
更に、それらの複数の認識候補の間には順位付けがなさ
れるようになっている。その場合、第1番目となる認識
候補が、常に操作者が意図した入力項目であるとは必ず
しも断定することはできないので、従来より、複数の認
識候補を表示部に表示したり、或いは、音声合成してそ
の内容を発音することによって、操作者に対して認識候
補の提示を行い、その中から選択させるという方法がと
られている。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た従来方法によれば、項目入力を行う際に、必ず、操作
者に認識候補を選択させるという作業手順をとらせてい
るので、その分、操作者にとっては、項目入力操作の面
での煩わしさを否定することはできず、けっして効率的
であるとは言い難かった。
【0005】本発明は、かかる現状に鑑みてなされたも
のであり、音声による各種項目の入力操作を効率良く行
うことを可能となす項目入力装置を提供することを目的
としている。
【0006】
【課題を解決するための手段】上記目的を達成するため
に、本請求項1に記載の発明は、入力すべき項目内容を
音声入力するための音声入力手段と、入力される前記項
目内容に関して基準となる音声認識候補を格納した音声
認識辞書と、前記音声認識辞書を参照して、音声入力さ
れた前記項目内容についての音声認識を行い、認識候補
をその評価値と共に出力する音声認識手段と、前記認識
候補及びその評価値を記憶する認識候補記憶手段と、前
記評価値について段階的に設定される所定数の閾値を格
納した閾値格納手段と、前記認識候補記憶手段に記憶さ
れた認識候補についての評価値と、前記閾値格納手段に
格納された所定数の閾値とを比較する比較手段と、前記
比較手段の比較結果を記憶する認識結果記憶手段とを備
えていることを特徴としている。
【0007】また、本請求項2に記載の発明は、前記音
声認識辞書が、入力すべき項目内容に関する正規の単語
に加えて、予想される話者の発音単語や省略単語が格納
されていることを特徴としている。また、本請求項3に
記載の発明は、前記音声認識手段が、音声入力された単
語についての特徴パラメ−タを求めて、前記音声認識辞
書に格納された正規の単語についての特徴パラメ−タと
のマッチング処理を行い、両特徴パラメータ間の距離の
最も小さいものから順に所定数の認識候補を取り出すと
共に、取り出された所定数の認識候補のマッチ度を評価
するために、前記距離に依存する評価値を求めることを
特徴としている。
【0008】また、本請求項4に記載の発明は、前記評
価値が、前記距離の逆数として定義されるか、或いは、
前記距離の最大値で正規化した後、1からの減算値とし
て定義されることを特徴としている。また、本請求項5
に記載の発明は、前記閾値格納手段が、前記認識候補が
無意味な認識候補であるか否かを、前記評価値によって
判定するための識別レベルとなる第1の閾値と、前記認
識候補が有意な認識候補であるか否かを、前記評価値に
よって判定するための識別レベルとなる第2の閾値と、
前記認識候補の中で最も評価値が高いものを認識結果で
あると特定するための識別レベルとなる第3の閾値とを
格納していることを特徴としている。
【0009】また、本請求項6に記載の発明は、前記第
3の閾値が、取り出された前記認識候補の中で最も高い
評価値と、その次に高い評価値との差の最小値を統計的
に求めた値に設定されることを特徴としている。また、
本請求項7に記載の発明は、前記認識結果記憶手段が、
前記比較手段の比較結果が、第1位の認識候補の評価値
が前記第1の閾値を下回る場合には、認識結果として音
声の再入力を指示するものと決定し、第1位の認識候補
の評価値が前記第2の閾値を上回り、且つ、該第1位の
認識候補の評価値と第2位の認識候補の評価値との差が
前記第3の閾値を上回る場合には、認識結果として第1
位の認識候補を出力するものと決定し、その他の場合に
ついては、認識結果として第1位、第2位、第3位の3
つの認識候補を出力するものと決定して記憶することを
特徴としている。
【0010】また、本請求項8に記載の発明は、請求項
1記載の項目入力装置であって、更に、記憶された認識
結果の表示、並びに、話者に対する操作指示メッセージ
の表示を行う表示手段と、記憶された認識結果に従っ
て、話者に対する操作指示メッセージを与える必要があ
る場合に、該操作指示メッセージの音声通知を行う音声
通知手段と、前記表示手段に認識候補が複数表示された
場合に、話者にその中の一つを選択させるための選択操
作手段とを備えていることを特徴としている。
【0011】上記構成によれば、本項目入力装置では、
認識候補記憶手段に記憶された、所定数の認識候補につ
いての評価値を、閾値格納手段に格納されている段階的
に設定された閾値と比較することができるので、第1位
の認識候補を認識結果として特定することが妥当である
かどうかについての判断がなされる。そのため、第1位
の認識候補が認識結果とされた場合には、従来のよう
に、複数の認識候補の中から一つの候補を選択するとい
う操作が不要となり、話者に対する操作性の向上が図ら
れる。また、音声認識で使用する音声認識辞書には、話
者の予想される発音や省略を含んだ単語も含めて格納し
てあるので、正規の発音による単語でなくてもかなりの
確率で以て正しく認識されるので、認識ヒット率の向上
が図られる。
【0012】
【発明の実施の形態】以下、本発明の実施の形態につい
て、図面を参照しながら具体的に説明する。図1は、本
発明にかかる項目入力装置の一構成例を示すブロック図
であって、音声認識券売機の接客部に応用した例を示し
ている。この項目入力装置1は、大きく、音声入力・認
識部Iと、認識候補決定部IIと、表示・操作部III と、
音声出力部IVとから構成されており、決定された認識結
果を受け取った券売機14が券売動作を行うようになっ
ている。
【0013】音声入力・認識部I には、音声入力手段で
あるマイクロホン2と、入力音声を認識する際に使用さ
れる音声認識辞書3と、音声認識辞書3を参照してマイ
クロホン2からの入力音声の認識を行う音声認識手段4
とが備えられている。ここで、音声認識辞書3には、認
識基準となる必要な全ての駅名が予め格納されている。
また、音声認識手段4では、認識候補となる上位3つの
候補をその評価値(後述する)と共に出力するようにな
っている。
【0014】また、認識候補決定部IIには、前記音声認
識手段4で認識された上位3候補を、夫々の評価値と共
に記憶する認識候補記憶手段5と、各認識候補を評価す
る際に使用される何段階かの閾値を格納した閾値格納手
段6と、認識候補の評価値を前記閾値と比較する評価値
比較手段7と、その比較結果を元に認識結果を記憶する
認識結果記憶手段8と、最終的に決定された認識結果を
券売機14に対して通知する認識結果通知部13とが備
えられている。
【0015】また、表示・操作部III には、認識結果及
び操作案内等を表示するディスプレイ9と、認識候補が
複数表示された場合に、その中から一つの候補を選択す
る選択指示や、その他の入力操作をボタン操作で行うた
めの入力手段となるタッチパネル12とが備えられてい
る。また、音声出力部IVには、認識結果や操作案内等を
音声で以て操作者に知らせるために音声合成する音声合
成装置10と、合成された音声の出力手段となるスピ−
カ11とが備えられている。
【0016】図2は、図1に示す項目入力装置1の動作
の流れを示すフローチャ−トであって、操作者が、券売
機14に対し、「乗車駅名」を音声入力する場合に行わ
れる項目入力装置1の動作の流れについて示している。
先ず、マイクロホン2を通じて、乗車駅名を音声入力す
る(S1)。続いて、音声認識手段4では、音声認識辞
書3を参照して、上位3つの認識候補をその評価値と共
に出力する(S2。なお、このステップS2の処理内容
については、図3において説明する)。そして、かかる
上位3つの認識候補を、その評価値と共に、認識候補記
憶手段5に記憶する(S3)。
【0017】次に、評価値比較手段7では、記憶された
各認識候補の評価値を、閾値格納手段6に格納されてい
る閾値と比較して、決定した認識結果を出力する(S
4。なお、このステップS4の処理内容については、図
4において説明する)。そして、かかる認識結果を、認
識結果記憶手段8に記憶する(S5)。ここで、認識結
果として再入力指示を行うべきである場合(S6におい
てYesの場合)には、ディスプレイ9に、音声による
項目の再入力を促すメッセージを表示し(S7)、更
に、音声合成装置10及びスピーカ11を通じて音声出
力して、操作者にその旨通知し(S8)、ステップS1
の処理に戻る。そこで、操作者は、再度、マイクロホン
2を通じて乗車駅名の入力を行うことになる。
【0018】また、認識結果として第1位の認識候補1
のみを出力すべきである場合(S6においてNo、S9
においてYesの場合)には、該認識候補1をディスプ
レイ9に表示する(S10)。更に、音声合成装置10
及びスピーカ11を通じて音声出力して、操作者に認識
候補1を通知し(S14)、ステップS15の処理に移
行する。
【0019】また、認識結果として認識候補1〜3を出
力すべきである場合(S9においてNoの場合)には、
操作者に、それら3つの認識候補の中からいづれか一つ
の候補を選択させるために、認識候補1〜3と、それら
についての選択を指示するメッセージをディスプレイ9
に表示する(S11)。更に、音声合成装置10及びス
ピーカ11を通じて音声出力して、操作者にその旨通知
する(S12)。そこで、操作者は、ディスプレイ9に
表示された認識候補1〜3の中から最適なものをタッチ
パネル12により選択する(S13)。
【0020】このようにして最終的に認識結果が決定さ
れると、認識結果通知手段13は、音声入力された乗車
駅名についての最終認識結果を、券売機14へ通知する
(S15)。なお、降車駅名の音声入力についても、上
記と全く同様な動作が行われる。そして、券売機14で
は、入力された乗車駅名及び降車駅名をもとにして、該
当する乗車区間について乗車券を発行する。
【0021】図3は、図1に示す音声認識手段4で行わ
れる音声認識処理の内容を示すフローチャートである。
先ず、マイクロホン2を通じて入力された発声駅名を解
析し、その特徴パラメータを求める(S31)。具体的
には、マイクロホン2より入力された音声は、所定の時
刻(t1 、t2、・・・、tm )毎に高速フーリエ変換
され、周波数スペクトルデータとして入力バッファに格
納される。ここで、時刻t i におけるj番目の周波数ス
ペクトルの振幅をFijとし、周波数スペクトルのサンプ
リングポイントの数をnとすると、「F11、F12、・・
・、F1n」、「F21、F22、・・・、F2n」、・・・・
・・、「Fm1、Fm2、・・・、Fmn」なるデータ群が得
られる。これらF11〜Fmnを入力単語の特徴パラメータ
とする。
【0022】続いて、音声認識辞書3を参照しながら、
特徴パラメータについてのマッチングを行う(S3
2)。ここでは、発生駅名の特徴パラメータと、音声認
識辞書3に予め格納されている全ての駅名についての基
準となる特徴パラメータとの間にてマッチングが行われ
る。音声認識辞書3には、予め、次のレコードレイアウ
トで以て、比較基準となる特徴パラメータが登録されて
いる。具体的には、単語kの時刻ti におけるj番目の
周波数スペクトルの振幅をFijk とすると、単語1につ
いては、「F11 1 、F12 1 、・・・、F1n 1 」、「F21
1 、F22 1 、・・・、F2n 1 」、・・・・・・、「Fm1
1 、Fm2 1 、・・・、Fmn 1 」、単語2については、
「F11 2 、F12 2 、・・・、F1n 2 」、「F21 2 、F22
2 、・・・、F2n 2 」、・・・・・・、「Fm1 2 、Fm2
2 、・・・、Fmn 2 」・・・・・・となる特徴パラメー
タが登録されている。
【0023】そして、この場合に使用する音声認識辞書
3には、予め、正規の駅名に加えて、予想される話者の
発音や省略単語も含めて登録されている。例えば、駅名
が「東京」である場合、正規の発音である「とうきょ
う」以外に「と−きょ−」も登録されている。このよう
に、正規の発音の単語が入力されなかった場合であって
も、その内容を高い確率で以て正しく認識することがで
きるようになっているので、認識についてのヒット率は
高められている。
【0024】次に、音声認識辞書3においてマッチング
された複数の特徴パラメータについて、先に求めた発声
駅名の特徴パラメータとの間の距離を求める(S3
3)。即ち、音声認識は、入力音声の特徴パラメータと
音声認識辞書3に格納されている各単語の特徴パラメー
タとの間の距離を計算して評価することにより行う。か
かる距離は、マッチング結果としてあげられる幾つかの
駅名と、発声駅名とのマッチングの程度を表わしてい
る。具体的には、入力音声と音声認識辞書3のk番目の
単語との特徴パラメータの距離Dk を次式で以て定義す
る。 〔数1〕 Dk =Σ(i=1〜m)Σ(j=1〜n){Fij−Fijk 2 そして、音声認識辞書3に登録されている各単語につい
てDk を計算し、Dkの小さいものから順に3つの特徴
パラメータを取り出す(S34)。
【0025】続いて、取り出した3つの特徴パラメータ
に該当する駅名を上位3つの認識候補とし、求めた前記
距離をもとに、夫々の評価値を計算する(S35)。具
体的には、i(i=1、2、3)番目の認識候補が音声
認識辞書3の単語jである場合、その認識候補の評価値
Ei を次式で以て定義する。 〔数2〕 Ei =1−(Dj /MAX Dk ) ここで、MAX Dk は、前記計算したDk の最大値を
意味する。
【0026】このように定義することで、Ei の値を常
に0と1の間の値とすることができ、閾値A、B、C
(後述する)の設定が容易でわかり易いものとなる。ま
た、特徴パラメータの距離Dj が小さいほど(即ち、認
識候補として有力なほど)評価値Ei は1に近く、特徴
パラメータの距離Dj が大きいほど(即ち、認識候補と
しての可能性が少ないほど)評価値Ei は0に近くな
り、評価値の大小が認識候補の優劣と対応するので、わ
かり易く好都合となる。
【0027】その後、取り出した3つの認識候補と求め
た夫々の評価値を、認識候補記憶手段5へ出力して(S
36)、リターンする。図4は、図2に示すフローチャ
ートにおけるステップS4で使用される評価値比較のア
ルゴリズムを示すフローチャートであって、図1に示す
評価値比較手段7が、図3に示すフローチャートにおけ
るステップS35で求めた評価値を比較する場合のアル
ゴリズムとなっている。
【0028】図1に示す閾値格納手段6には、前記評価
値を比較するための3つの閾値A、B、Cが格納されて
いる。閾値Aは、無意味な認識候補であるか否かについ
ての識別レベルであって、認識候補の評価値がA以下で
あれば無意味な音声入力がなされたとものとみなす。ま
た、閾値Bは、有意な認識候補であるか否かについての
識別レベルであって、B>Aであり、認識候補の評価値
がB以上であれば有意な音声入力がなされたとみなす。
更に、閾値Cは、認識候補の中で最も評価値が高いもの
を認識結果であると特定できるか否かについての識別レ
ベルであって、第1位の認識候補の評価値と第2位の認
識候補の評価値との差がC以上であれば、第1位の評価
値を持つ認識候補を認識結果と特定する。
【0029】上記3つの閾値A、B、Cについては、全
て事前の音声入力テストによって求められる。そして、
閾値Aについては、テストを行った音声について、有意
な認識候補が出力されるぎりぎりの値以下の近傍に設定
される。また、閾値B及びCについては、3つの認識候
補がすべて有意な認識候補として出力され、且つ、第1
位の認識候補が常に入力音声の単語に一致するよう設定
する。更に、閾値Cについては、認識候補の中で最も高
い評価値とその次に高い評価値との差を統計的に求め
て、その最小値に設定される。
【0030】以下、ここに示すフローチャートに従い、
評価値比較のアルゴリズムを説明する。ここで、音声認
識手段4が認識した上位3つの認識候補1、2、3の各
評価値を、夫々、E1、E2、E3とする。但し、E1
>E2>E3である。先ず、E1<Aである場合(S4
1においYesの場合)には、認識候補1、2、3は全
て無意味であるとみなされるので、評価値比較手段7
は、認識結果記憶手段8に対し認識結果として再入力指
示コマンドを出力する(S42)。
【0031】また、E1≧Aの場合(S41においてN
oの場合)には、更にE1>Bであるか否かを判定する
(S43)。そして、E1>Bである場合(S43にお
いてYesの場合)には、ひき続き、(E1−E2)>
Cであるか否かを判定する(S44)。この場合、E1
>Bであり、且つ(E1−E2)>Cである場合(S4
3及びS44においYesの場合)には、認識候補1が
有意であり、且つ、入力音声の認識候補1とのマッチン
グ度が、認識候補2とのマッチング度よりもはるかに高
いとみなされるので、評価値比較手段7は、認識結果記
憶手段8に対し認識結果として認識候補1を出力する
(S45)。
【0032】また、A≦E1≦Bの場合(S41におい
てNo、S43においてNoの場合)、或いは、E1>
Bであっても、(E1−E2)≦Cの場合(S43にお
いてYes、S44においてNoの場合)には、認識候
補1〜3を同列に扱い、評価値比較手段7は、認識結果
記憶手段8に対して認識候補1〜3を全て出力する(S
46)。
【0033】以上のように、本項目入力装置1が接客部
に応用された券売機14では、操作者が音声入力した乗
車駅名(或いは降車駅名)についての複数の認識候補が
そのまま出力されるのではなく、第1位の認識候補を認
識結果として特定することが妥当であるか否かについて
の判断がなされる。そして、第1の認識候補が発声した
単語であるとかなりの確率で以て判断できる場合には、
第1の認識候補を認識結果として表示され、券売機14
へ出力される。このため、操作者にとっては、通常の音
声入力を行う限りは、従来のように、複数の認識候補の
中から必要な候補を選択するという作業が不要となり、
操作性が大きく改善される。
【0034】また、音声認識手段4が使用する音声認識
辞書3には、操作者(話者)の予想される発音や省略音
声をも含んだ駅名単語が登録されているので、正規発音
の単語が入力されなかった場合であっても、高い確率で
以てその正しい認識を行うことができるので、上記操作
性の向上をより一層確実なものとしている。なお、上記
発明の実施の形態では、音声入力手段であるマイクロホ
ン2と音声出力手段であるスピーカ11とを別々に設け
るように構成したが、勿論、それらを一体とした送受話
器を用いるように構成してもかまわない。また、認識候
補記憶手段5と閾値格納手段6と評価値比較手段7の各
機能を音声認識手段4に持たせ、該音声認識手段4から
決定した認識結果を直接出力するように構成してもかま
わない。更に、表示された複数の認識候補の中から必要
な候補を操作者に選択させる手段としては、タッチパネ
ル12を使用するものとして説明したが、複数の認識候
補と併せて数字等のキーをディスプレイ9上に表示させ
て、マウス等のクリックによって選択させるように構成
してもかまわない。
【0035】
【発明の効果】以上の本発明によれば、従来の音声認識
型の項目入力装置では、必ず、提示された複数の認識候
補の中から必要なものを話者に選択させるという作業手
順を強いていたのが、第1位の認識候補が認識結果とし
て特定することが妥当であるかどうかについての判断が
なされ、該第1位の認識候補が、話者が発声した単語で
あると、かなりの確率で以て判断できる場合には、他の
認識候補の提示が省略されて、該第1の認識候補のみが
提示される。従って、話者にとっては、項目入力操作の
煩わしさが改善され、操作のスピードアップが図られる
ため、大変、使い勝手の良い項目入力装置となり得る。
【0036】また、音声認識のために使用される音声認
識辞書には、話者の予想される発音や省略を含んだ単語
も含めて格納されているので、正規発音の単語が入力さ
れなかった場合であっても、かなりの確率で以て正しく
認識される。従って、より一層の操作性の向上が図れる
と共に、利用する不特定多数の話者に対しても、問題を
生じることなく、安心して目的とする項目の入力が行え
るようになる。
【図面の簡単な説明】
【図1】本発明にかかる項目入力装置の一構成例を示す
ブロック図である。
【図2】図1に示す項目入力装置の動作の流れを示すフ
ローチャートである。
【図3】図1に示す音声認識手段4で行われる音声認識
処理の内容を示すフローチャートである。
【図4】図2に示すフローチャートにおけるステップS
4で使用される評価値比較のアルゴリズムを示すフロー
チャートである。
【符号の説明】
1 項目入力装置 2 マイクロホン 3 音声認識辞書 4 音声認識手段 5 認識候補記憶手段 6 閾値格納手段 7 評価値比較手段 8 認識結果記憶手段 9 ディスプレイ 10 音声合成装置 11 スピーカ 12 タッチパネル 13 認識結果通知手段 14 券売機 I 音声入力・認識部 II 認識候補決定部 III 表示・操作部 IV 音声出力部
フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G07B 5/00 G07B 5/00 D 15/02 15/02

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 入力すべき項目内容を音声入力するため
    の音声入力手段と、 入力される前記項目内容に関して基準となる音声認識候
    補を格納した音声認識辞書と、 前記音声認識辞書を参照して、音声入力された前記項目
    内容についての音声認識を行い、認識候補をその評価値
    と共に出力する音声認識手段と、 前記認識候補及びその評価値を記憶する認識候補記憶手
    段と、 前記評価値について段階的に設定される所定数の閾値を
    格納した閾値格納手段と、 前記認識候補記憶手段に記憶された認識候補についての
    評価値と、前記閾値格納手段に格納された所定数の閾値
    とを比較する比較手段と、 前記比較手段の比較結果を記憶する認識結果記憶手段
    と、 を備えていることを特徴とする項目入力装置。
  2. 【請求項2】 前記音声認識辞書は、入力すべき項目内
    容に関する正規の単語に加え、予想される話者の発音単
    語や省略単語が格納されていることを特徴とする請求項
    1記載の項目入力装置。
  3. 【請求項3】 前記音声認識手段は、音声入力された単
    語についての特徴パラメ−タを求めて、前記音声認識辞
    書に格納された正規の単語についての特徴パラメ−タと
    のマッチング処理を行い、両特徴パラメータ間の距離の
    最も小さいものから順に所定数の認識候補を取り出すと
    共に、 取り出された所定数の認識候補のマッチ度を評価するた
    めに、前記距離に依存する評価値を求めることを特徴と
    する請求項2記載の項目入力装置。
  4. 【請求項4】 前記評価値は、前記距離の逆数として定
    義されるか、或いは、前記距離の最大値で正規化した
    後、1からの減算値として定義されることを特徴とする
    請求項3記載の項目入力装置。
  5. 【請求項5】 前記閾値格納手段は、 前記認識候補が無意味な認識候補であるか否かを、前記
    評価値によって判定するための識別レベルとなる第1の
    閾値と、 前記認識候補が有意な認識候補であるか否かを、前記評
    価値によって判定するための識別レベルとなる第2の閾
    値と、 前記認識候補の中で最も評価値が高いものを認識結果で
    あると特定するための識別レベルとなる第3の閾値と、 を格納していることを特徴とする請求項3記載の項目入
    力装置。
  6. 【請求項6】 前記第3の閾値は、取り出された前記認
    識候補の中で最も高い評価値と、その次に高い評価値と
    の差の最小値を統計的に求めた値に設定されることを特
    徴とする請求項5記載の項目入力装置。
  7. 【請求項7】 前記認識結果記憶手段は、前記比較手段
    の比較結果が、 第1位の認識候補の評価値が前記第1の閾値を下回る場
    合には、認識結果として音声の再入力を指示するものと
    決定し、 第1位の認識候補の評価値が前記第2の閾値を上回り、
    且つ、該第1位の認識候補の評価値と第2位の認識候補
    の評価値との差が前記第3の閾値を上回る場合には、認
    識結果として第1位の認識候補を出力するものと決定
    し、 その他の場合については、認識結果として第1位、第2
    位、第3位の3つの認識候補を出力するものと決定して
    記憶することを特徴とする請求項6記載の項目入力装
    置。
  8. 【請求項8】 請求項1記載の項目入力装置であって、
    更に、 記憶された認識結果の表示、並びに、話者に対する操作
    指示メッセージの表示を行う表示手段と、 記憶された認識結果に従って、話者に対する操作指示メ
    ッセージを与える必要がある場合に、該操作指示メッセ
    ージの音声通知を行う音声通知手段と、 前記表示手段に認識候補が複数表示された場合に、話者
    にその中の一つを選択させるための選択操作手段と、 を備えていることを特徴とする項目入力装置。
JP7205506A 1995-08-11 1995-08-11 項目入力装置 Pending JPH0954597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7205506A JPH0954597A (ja) 1995-08-11 1995-08-11 項目入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7205506A JPH0954597A (ja) 1995-08-11 1995-08-11 項目入力装置

Publications (1)

Publication Number Publication Date
JPH0954597A true JPH0954597A (ja) 1997-02-25

Family

ID=16507997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7205506A Pending JPH0954597A (ja) 1995-08-11 1995-08-11 項目入力装置

Country Status (1)

Country Link
JP (1) JPH0954597A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002536691A (ja) * 1999-02-08 2002-10-29 クゥアルコム・インコーポレイテッド 音声認識除去方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002536691A (ja) * 1999-02-08 2002-10-29 クゥアルコム・インコーポレイテッド 音声認識除去方式

Similar Documents

Publication Publication Date Title
US6377922B2 (en) Distributed recognition system having multiple prompt-specific and response-specific speech recognizers
US6269335B1 (en) Apparatus and methods for identifying homophones among words in a speech recognition system
US6477500B2 (en) Text independent speaker recognition with simultaneous speech recognition for transparent command ambiguity resolution and continuous access control
US6751591B1 (en) Method and system for predicting understanding errors in a task classification system
US8095363B1 (en) Method and system for predicting understanding errors in a task classification system
US6192337B1 (en) Apparatus and methods for rejecting confusible words during training associated with a speech recognition system
Walker et al. Using natural language processing and discourse features to identify understanding errors in a spoken dialogue system
JPH0612092A (ja) 音声認識装置およびその動作方法
JP2002511154A (ja) ユーザにオーディオ・フィードバックを与える拡張可能音声認識システム
WO2006054724A1 (ja) 音声認識装置及び方法ならびにプログラム
JPS603699A (ja) 適応性自動離散音声認識方法
KR19990008459A (ko) 개선된 신뢰도의 단어 인식방법 및 단어 인식기
JP3703991B2 (ja) 自由音声評点法を用いた動的音声認識の方法および装置
US11315573B2 (en) Speaker recognizing method, speaker recognizing apparatus, recording medium recording speaker recognizing program, database making method, database making apparatus, and recording medium recording database making program
JP2008262120A (ja) 発話評価装置及び発話評価プログラム
JP3526101B2 (ja) 音声認識装置
JPH05143093A (ja) 発声された単語のモデルを生成する方法および装置
JP4661239B2 (ja) 音声対話装置及び音声対話方法
CN112863495A (zh) 信息处理方法、装置及电子设备
JPH1020883A (ja) ユーザ認証装置
JP3468572B2 (ja) 対話処理装置
JPH0954597A (ja) 項目入力装置
CN112424771A (zh) 信息处理设备、信息处理方法以及程序
JP2000347684A (ja) 音声認識システム
JP3340163B2 (ja) 音声認識装置