JPH11231892A

JPH11231892A - 音声認識装置

Info

Publication number: JPH11231892A
Application number: JP10035817A
Authority: JP
Inventors: Isamu Tateno; 勇立野
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 1998-02-18
Filing date: 1998-02-18
Publication date: 1999-08-27
Anticipated expiration: 2018-02-18
Also published as: JP3849283B2

Abstract

(57)【要約】【課題】音声認識を失敗したとき再度の音声入力を促
す構成において、音声認識をより確実に素早くできるよ
うにする。【解決手段】初期値（ｉ＝１）を設定してから（Ｓ
１）、音声入力を受付ける（Ｓ２）。このとき、音声デ
ータを音声認識できなかった場合に（Ｓ３：ＮＯ）、前
回データと同一であると判断される共に（Ｓ６：ＹＥ
Ｓ）、ｉ≧Ｎ（例えば３）であったときは、ｉをインク
リメントしてから（Ｓ１０）、上位音声認識候補をデー
タ保存し（Ｓ１２）、「もう一度言って下さい」と音声
出力する。そして、ｉ≧３となったときは、データ保存
している上位音声認識候補を順に音声案内し、使用者が
「はい」と返答した音声認識候補を音声認識結果として
確定する。これにより、音声認識できない状態が継続し
ているときは、異なる音声案内により音声認識をより確
実に素早くできるようになる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力音声と複数の
比較対象パターン候補とを比較して類似度の高いものを
認識結果として出力するような音声認識装置に関する。

【０００２】

【従来の技術】従来より、入力音声から判読されたデー
タを予め記憶してある標準パターンと比較し、その類似
度が最大となる標準パターンを認識結果とする音声認識
装置が実用化されている。

【０００３】

【発明が解決しようとする課題】しかしながら、入力音
声の高低、強弱、イントネーション等の入力要因や、判
別処理能力によっては常に識別できるとは限らないの
で、認識不具合時には使用者に再入力を促す同じ音声案
内を実行するようにしているが、音声認識できない毎に
再入力を促す同じ音声案内を繰返すことから、使用者に
とって使い勝手が悪く使用感が著しく低下する場合があ
る。

【０００４】例えば、入力音声を認識できない場合、
「もう一度言って下さい」と音声案内するようになって
いる構成がある。このような構成では、複数回同じよう
な音声入力を行うことが多いため、次回以降も入力音声
の認識ができない確率が高い。結果としてその都度「も
う一度言って下さい」と繰返して音声案内されることと
なる。このため、使用者にとっては不快であり、逐一音
声入力しているにもかかわらず一向に音声認識できな
い。また、認識不良を解消するために、次にどのように
発声すればよいかの推定も容易ではなく、使い勝手が悪
い。

【０００５】本発明は上記事情に鑑みてなされたもの
で、その目的は、音声認識を失敗したとき再度の音声入
力を促す構成において、音声認識をより確実に行うこと
が可能な使い勝手に優れた音声認識装置を提供すること
にある。

【０００６】

【課題を解決するための手段】請求項１の発明によれ
ば、使用者が音声入力すると、音声入力手段は、入力音
声を音声信号に変換する。そして、認識手段は、音声入
力手段からの音声信号を、予め辞書手段に記憶されてい
る複数の比較対象パターン候補と比較して類似度の高い
ものを認識結果とする。ここで、音声案内手段は、認識
手段による音声認識が失敗したときは、例えば「もう一
度言って下さい」と再度の音声入力を促す音声案内を実
行する。

【０００７】ところで、認識手段による音声認識が失敗
する毎に「もう一度言って下さい」と音声案内すること
は使用者にとっては煩わしいと共に、音声入力できない
状態が継続することになる。

【０００８】そこで、音声案内手段は、認識手段による
音声認識が所定回数失敗したときは、「もう一度言って
下さい」という音声案内に代えて、別の音声入力が発声
させるように準備された所定の予備音声案内を実行す
る。従って、認識手段は、音声案内手段による予備音声
案内に応じて入力された音声データに基づいて音声認識
することによりより確実に音声認識することができるよ
うになる。よって、使用者にとっては、次にどのように
発声すれば正しく音声認識されるか好適に誘導されるこ
とになり、使い勝手がよい。

【０００９】請求項２の発明によれば、上述した音声案
内動作は、使用者が同一の入力音声を繰返して音声入力
したと判断した際に音声認識できなかったとみなすよう
にしているので、再度の音声入力を促す音声案内を効果
的に行うことができる。

【００１０】請求項３の発明によれば、使用者の好みに
よって再度の音声入力を促す音声案内を行う回数を任意
に設定することができるので、使用者の使い勝手を向上
することができる。

【００１１】請求項４の発明によれば、認識手段が入力
音声を認識できなかったときは、認識候補記憶手段は、
音声認識候補のうちから類似度の高い上位音声認識候補
を記憶する。つまり、音声認識結果が「ふじ＊＊」であ
れば、「富士宮市」、「富士山」、「富士急ハイラン
ド」などを上位音声認識候補とする。

【００１２】そして、音声案内手段は、認識候補記憶手
段に記憶された上位音声認識候補を用いて問い掛ける。
つまり、「富士宮市ですか」、「富士山ですか」、「富
士急ハイランドですか」などと音声案内するので、認識
手段は、問い掛けに応じた返答に対して音声認識するこ
とにより、音声認識を素早く行うことができる。尚、こ
の問い掛けとして、記憶された上位音声認識候補を類似
度の高い順に問い掛けるようにしてもよい。

【００１３】請求項５の発明によれば、属性確定手段
は、認識手段による認識結果に基づいて音声データの属
性を確定する。つまり、音声認識した音声データが地名
データに属するのか、施設データに属するのか、遊園地
データに属するのか等を確定する。

【００１４】そして、音声案内手段は、属性確定手段が
例えば入力音声は地名データに属していると判断したと
きは、この属性に適した質問として例えば「東京都です
か」とか、「都道府県名を教えて下さい」と音声案内す
る。これにより、認識手段は、使用者の返答に対して音
声認識することにより、音声認識をより確実に素早く行
うことができる。

【００１５】請求項６の発明によれば、音声案内手段
は、学習手段が必要とする所定の音声を使用者に対して
発声させるように問い掛ける。例えば「音声を学習しま
すあいうえおとお話し下さい」と問い掛ける。

【００１６】そして、学習手段は、使用者が音声入力し
た「あいうえお」という音声データに基づいて使用者の
音声データの特徴を学習する。これにより、認識手段
は、学習手段が学習した特徴に基づいて音声認識するこ
とにより、音声認識をより確実に素早く行うことができ
る。

【００１７】請求項７の発明によれば、音声案内手段
は、使用者を特定するための質問を問い掛ける。つま
り、「あなたの名前を言って下さい」とか、「あなたに
登録された番号を入力して下さい」と問い掛ける。

【００１８】そして、使用者が自分の名前を音声入力し
たり、或いは登録された番号を操作入力すると、認識手
段は、問い掛けに応じて特定した使用者に対応して特徴
記憶手段に記憶されている特徴に基づいて音声認識する
ので、音声認識をより確実に素早く行うことができる。

【００１９】

【発明の実施の形態】（第１の実施の形態）以下、本発
明をカーナビゲーションに適用した第１の実施の形態を
図面を参照して説明する。図１は本発明の概略構成を示
すブロック図である。この図１において、カーナビゲー
ションシステム１は、位置検出器２、地図データ入力器
３、操作スイッチ群４、これらに接続された制御回路
５、この制御回路５に接続された外部メモリ６、表示装
置７、リモコンセンサ８及び音声認識装置９を備えて構
成されている。制御回路５はマイクロコンピュータを主
体として構成されており、内部には、周知のＣＰＵ、Ｒ
ＯＭ、ＲＡＭ、Ｉ／Ｏ及びこれらの構成を接続するバス
ライン（何れも図示せず）が備えられている。

【００２０】位置検出器２は、周知構成の地磁気センサ
１０、ジャイロスコープ１１、距離センサ１２、及び衛
星からの電波に基づいて車両の位置を検出するＧＰＳ
（Global Positioning System ）のためのＧＰＳ受信機
１３を有している。制御回路５は、位置検出器２の各セ
ンサが性質の異なる誤差を有しているため、各々補間し
ながら使用するように構成されている。

【００２１】地図データ入力器３は、位置検出の精度向
上のための所謂マップマッチング用データ、地図データ
及び目印データを含む各種データを入力するための装置
である。そのための媒体としては、ＣＤ−ＲＯＭを用い
るのが一般的であるが、メモリカードなどの他の媒体を
用いるようにしてもよい。

【００２２】表示装置７はカラー表示機能を備えてお
り、その画面には、位置検出器２から入力された車両現
在位置マークと、地図データ入力器３より入力された地
図データと、さらに地図上に表示する誘導経路や後述す
る設定地点の目印などの付加データとを重ねて表示する
ようになっている。

【００２３】また、カーナビゲーションシステム１は、
リモートコントロール端末１４（以下、リモコンと称す
る）に対する操作によりリモコンセンサ８から、或いは
操作スイッチ群４により目的地の位置を入力すると、現
在位置からその目的地までの最適な経路を自動的に選択
して誘導経路を形成して表示する所謂経路案内機能も備
えている。このような自動的に最適な経路を設定する手
法は、ダイクストラ法などの手法が知られている。操作
スイッチ群４は、例えば、表示装置７と一体になったタ
ッチスイッチ若しくはメカニカルスイッチなどが用いら
れ、各種入力に使用される。

【００２４】そして、音声認識装置９は、上記操作スイ
ッチ群４或いはリモコン１４が手動操作により目的地な
どを指示するために用いられるのに対して、使用者が音
声で入力することによっても同様に目的地などを指示す
ることができるようにするための装置として設けられて
いる。

【００２５】この音声認識装置９は、対話制御部１５
（音声案内手段、属性確定手段、学習手段に相当）、音
声合成部１６、音声認識部１７（認識手段、辞書手段、
認識候補記憶手段、特徴記憶手段に相当）、音声入力部
１８、マイク１９、ＰＴＴ（Push-To-Talk）スイッチ２
０、スピーカ２１を備えて構成されている。

【００２６】音声認識部１７は、音声入力部１８から入
力された音声データ（入力音声）を、対話制御部１５か
らの指示により入力音声の認識処理を行い、その認識結
果を対話制御部１５に返す。即ち、音声入力部１８から
取得した音声データに対し、記憶している辞書データを
用いて照合を行い、複数の比較対象パターン候補と比較
して類似度の高い上位比較対象パターンを対話制御部１
５へ出力する。入力音声中の単語系列の認識は、音声入
力部１８から入力された音声データを順次音響分析して
音響特徴量（例えばケプストラム）を抽出し、この音響
分析によって得られた音響的特徴量時系列データを得
る。そして、周知のＤＰマッチング法によって、この時
系列データをいくつかの区間に分け、各区間が辞書デー
タとして格納されたどの単語に対応しているかを求め
る。

【００２７】また、音声入力部１８は、マイク１９にて
取り込んだ周囲の音声をデジタルデータに変換して音声
認識部１７に出力するものである。本実施形態において
は、使用者がＰＴＴスイッチ２０を押しながらマイク１
９を介して音声を入力するようになっている。具体的に
は、音声入力部１８は、ＰＴＴスイッチ２０が押された
かどうかを判断しており、ＰＴＴスイッチ２０が押され
ていない場合には、その音声入力処理を実行しないよう
にしている。従って、ＰＴＴスイッチ２０が押されてい
る間にマイク１９を介して入力された音声データのみが
音声認識部１７へ出力されることになる。

【００２８】ここで、音声認識部１７と対話制御部１５
について説明する。図２は、音声認識部１７及び対話制
御部１５の詳細構成を示したものである。まず、図２に
示す構成では、音声認識部１７が照合部２２と辞書部２
３とで構成されており、対話制御部１５が記憶部２４、
入力部２５、後処理部２６及び辞書制御部２７で構成さ
れている。音声認識部１７においては、照合部２２が、
音声入力部１８から取得した音声データに対し、辞書部
２３内に記憶されている辞書データを用いて照合を行う
のであるが、その照合部における照合処理に先立って、
対話制御部１５の辞書制御部２７が辞書に記憶されてい
る辞書データの制御を行う。具体的には、記憶部２４に
記憶されている参照データを参照して省略可能な上位階
層リストを作成し、その省略可能な上位階層部分を辞書
部２３内に記憶されている辞書データから一時的に省略
する。このように辞書制御がなされた辞書データを用い
て照合部２２が照合処理を実行するものである。

【００２９】そして、照合部２２にて複数の比較対象パ
ターン候補と比較されて類似度が高いとされた上位比較
対象パターンは、対話制御部１５の記憶部へ出力される
こととなる。

【００３０】音声認識部１７においては、照合部２２
が、音声入力部１８から取得した音声データに対し、辞
書部２３内に記憶されている複数の比較対象パターン候
補と比較して類似度の高い上位比較対象パターンを対話
制御部１５の記憶部２４へ出力する。そして、記憶部２
４では、この上位比較対象パターンを記憶しておく。ま
た、入力部２５は制御回路５からの外部状況を入力する
のであるが、その入力した外部状況も記憶部２４に記憶
される。この場合の外部状況とは、上述した位置検出器
２によって検出した位置に基づく現在値のデータであ
る。尚、この記憶部２４に記憶された上位比較対象パタ
ーンや入力した外部状況である現在データなどは、所定
の確定指示がなされた場合にはクリアされる。

【００３１】そして、後処理部２６では、例えば上記所
定の確定指示がなされた場合に制御回路５へデータを送
って所定の処理をするように指示する「確定後処理」を
実行したり、或いは音声合成部１６へ音声データを送っ
て発音させるように指示する処理を実行する。尚、この
場合の制御回路５へ送るデータとしては、最終的な認識
結果としての上位比較対象パターンの全てでもよいし、
或いはその内の最上位のものだけでもよい。

【００３２】次に、本実施の形態のカーナビゲーション
システム１の動作について説明する。尚、音声認識装置
９に関係する部分が特徴であるので、カーナビゲーショ
ンシステムとしての一般的な動作を簡単に説明した後、
音声認識装置９に関係する部分の動作について詳しく説
明する。

【００３３】カーナビゲーションシステム１の電源オン
後に、表示装置７上に表示されるメニューから、運転者
がリモコン１４（操作スイッチ群４でも同様に操作でき
る。以後の説明においても同じ）により、案内経路を表
示装置７に表示させるために経路情報表示処理を選択し
た場合、或いは音声認識装置９を介して希望するメニュ
ーをマイク１９を介して音声入力することで、対話制御
部１５から制御回路５へ、リモコン１４に対する操作に
より選択されるのと同様の指示がなされた場合、次のよ
うな処理を実施する。

【００３４】即ち、運転者が表示装置７上の地図に基づ
いて、音声或いはリモコン１４などの操作によって目的
地を入力すると、位置検出器２により車両の現在地が求
められ、目的地と現在地との間に、ダイクストラ法によ
りコスト計算して、現在地から目的地までの最も短距離
の経路を誘導経路として求める処理が行われる。そし
て、表示装置７上の道路地図に重ねて誘導経路を表示し
て、運転者に適切なルートを案内する。このような誘導
経路を求める計算処理や案内処理は一般的によく知られ
た処理であるので説明は省略する。

【００３５】次に、カーナビゲーションシステム１にお
ける動作について、上述の経路案内のための目的地を音
声入力する場合を例にとって説明する。図３は、その場
合の処理を示すフローチャートである。

【００３６】まず、初期値を設定する（Ｓ１）。つま
り、ｉを１に設定すると共に、繰返し許容回数Ｎを予め
使用者により設定されている例えば３に設定する。そし
て、使用者による音声入力を受け付ける（Ｓ２）。つま
り、上述したように、ＰＴＴスイッチ２０が押されてい
る間にマイク１９を介して入力された音声データのみが
音声入力部１８から音声認識部１７に出力されるので、
この音声入力部１７からの音声入力を受け付ける。

【００３７】ここで、例えば使用者が「ふじさん（富士
山）」と音声入力したときは、地名辞書のtree構成を示
す図４に示すように、「ふ」が「根」（tree構成のもっ
とも左に位置する◎（ノード）から先行順走査にしたが
って各辺（tree構成の−）に割り付けられた音節を辿る
ことで「ふじさん」という単語が完成する。

【００３８】次に音声認識処理を実行する。基本的に
は、取得した音声データに対して辞書部２３内に記憶さ
れている辞書データを用いて照合を行う。そして、照合
開始頂点から始まる単語との照合結果により「ふじさ
ん」を認識することができるので（Ｓ３：ＹＥＳ）、
「富士山を表示します」と音声出力してから（Ｓ４）、
該当する地図画面を表示する（Ｓ５）。

【００３９】ところで、使用者が「ふじ」とだけ音声入
力したときは、「ふじ」が「富士宮市」なのか、「富士
山」なのか、「富士急ハイランド」なのか、それとも他
の「ふじ」が頭につく語なのかを音声認識ができないこ
とがある（Ｓ３：ＮＯ）。また、使用者が「ふじさん」
と早口で音声入力した場合において、「ふじ」と認識す
ることができるものの、それ以降の語を認識できないと
きは、同様に「ふじ」を正しく音声認識できないことに
なる。

【００４０】このような場合、次のようにして予備音声
案内を実行する。即ち、音声認識データが前回データと
同一かを判断する（Ｓ６）。このとき、音声認識データ
は前回データと同一でないと共に（Ｓ６：ＮＯ）、ｉ＝
１であることから（Ｓ９：ＹＥＳ）、ｉをインクリメン
ト（ｉ＝２）すると共に、照合結果による上位音声認識
候補（例えば富士宮市、富士山、富士急ハイランド、…
…）をデータ保存してから（Ｓ１２）、「もう一度言っ
て下さい」と音声案内する（Ｓ１３）。

【００４１】そして、使用者が「ふじ」と再び音声入力
したと認識した場合は、再び音声認識できない。このと
き、音声認識できなかった音声データが前回データであ
ると判断されると共に（Ｓ６：ＹＥＳ）、ｉ≧３でない
ことを確認してから（Ｓ７：ＮＯ）、ｉをインクリメン
ト（ｉ＝３）すると共に、照合結果による上位候補をデ
ータ保存してから（Ｓ１２）、「もう一度言って下さ
い」と音声案内する（Ｓ１３）。

【００４２】ここで、以上のようにして「もう一度言っ
て下さい」と２回音声案内するにもかかわらず再度同一
の音声データを音声認識できなかったときは、ｉ＝３で
あることから（Ｓ７：ＹＥＳ）、データ保存されている
照合結果のうちの上位音声認識候補から順に使用者に音
声案内する。この場合、上位候補は、照合結果の類似度
を数値化して決定する。

【００４３】そして、上位候補から順に「富士宮市です
か」、「富士山ですか」、「富士急ハイランドですか」
などと順に問い掛け（Ｓ８）、使用者が「はい」若しく
は「＊＊＊です」などと上位候補の何れかを特定するよ
うな返答した問い掛けを認識結果として確定し、該当す
る地図を表示する。

【００４４】このような第１の実施の形態によれば、所
定回数連続して音声認識に失敗したときは、音声認識結
果による上位候補から順に問い掛けるようにしたので、
音声認識を失敗する毎に「もう一度入力下さい」と繰返
して音声案内する構成に比較して、使用者にとっては、
使用感が向上すると共に、音声認識をより確実に素早く
行うことができるようになる。

【００４５】また、音声認識結果ができなかった場合に
おいて前回の音声認識結果と同一のときのみ音声認識を
失敗したとみなすようにしたので、使用者が入力音声を
途中で変更した場合には、そのタイミングから失敗回数
をカウントすることになり、再入力を促す音声案内を適
切な回数だけ行うことができ、使用感の向上を図ること
ができる。

【００４６】また、音声認識を失敗したときは、音声認
識の上位候補データを保存し、その上位候補のうちの類
似度の高い順に問い掛けるようにしたので、少ない問い
掛けにより音声入力を認識することができる。

【００４７】尚、問い掛け音声は、保存データのうち類
似度の高い順にしなくとも、保存データをランダムに
（順次）問い掛けるようにしてもよい。

【００４８】（第２の実施の形態）音声認識部１７には
複数の音声データの属性（例えばコマンドデータ、施設
データ、住所データ等）を確定する属性確定機能が備え
られている（属性確定手段に相当）。

【００４９】即ち、上述したように使用者が発声する音
声データの認識が所定回数連続して失敗している状態で
は、一方において音声認識結果に基づいて音声データの
属性を確定し、その確定した属性に適した音声案内を行
う。つまり、音声認識により音声データが住所データで
あると確定した場合は、まず、「都道府県名を入力して
下さい」と音声案内する。そして、使用者が「静岡県」
と音声入力することにより上位階層データを確定したと
きは、「次に市区郡町村名を入力して下さい」と音声案
内することにより、中間階層データを音声入力により確
定し、以後、下位階層データである町域データ（大字、
小字、番地）を確定することにより住所データを確定す
るようにしてもよい。

【００５０】このような第２の実施の形態によれば、音
声データの属性が確定したときは、属性に適した質問を
問い掛けることにより、音声データの属性に適した音声
認識を行うことができ、第１の実施の形態と同様に、音
声認識をより確実に素早く行うことができる。

【００５１】（第３の実施の形態）音声認識部１７には
使用者の発声特徴を学習する学習機能が備えられている
（学習手段に相当）。即ち、使用者の音声データを所定
回数連続して音声認識できなかったときは、例えば「音
声を学習しますあいうえおとお話し下さい」と音声案
内する。

【００５２】そして、使用者が「あいうえお」と音声入
力したときは、音声データに基づいて使用者の音声の特
徴を学習してから、「学習完了しました入力下さい」
と音声案内し、学習した音声の特徴に基づいて音声デー
タを音声認識する。

【００５３】この第３の実施の形態によれば、使用者の
音声の特徴を学習し、学習した音声の特徴に基づいて音
声認識を行うようにしたので、第１の実施の形態と同様
に、音声認識をより確実に素早く行うことができる。

【００５４】（第４の実施の形態）音声認識装置１７に
は、予め使用者の音声の特徴が学習により記憶されてい
る（特徴記憶手段に相当）。

【００５５】この場合、使用者の音声データを所定回数
連続して音声認識できなかったときは、音声入力或いは
スイッチ操作により使用者を特定するように音声案内
し、音声データ或いはスイッチ入力により使用者が特定
できたときは、その使用者に対応して学習記憶してある
特徴で音声認識する。

【００５６】この第４の実施の形態によれば、使用者の
音声特徴を予め学習記憶しておき、使用者を特定したと
きに使用者の音声の特徴に基づいて音声認識するように
したので、第１の実施の形態と同様に、音声認識をより
確実に素早く行うことができる。

【００５７】本発明は、上記実施の形態にのみ限定され
るものではなく、次のように変形または拡張できる。音
声認識データを所定回数連続して失敗したときの音声案
内としては、「もう一度言って下さい」という音声案内
に代えて、「もっとゆっくり言って下さい」、或いは
「もっとはっきり言って下さい」、或いは「省略せずに
言って下さい」というように音声案内するようにしても
よい。尚、上記実施の形態に示される繰返し許容回数Ｎ
が１であれば、音声認識が一回失敗した時点で即予備案
内が実行される。

【００５８】音声認識装置の適用としては、空調システ
ムに適用して、音声入力により設定温度、空調モード
（冷房、暖房、ドライ）の選択、或いは風向モードの選
択を行うようにしてもよい。さらには、カーオーディ
オ、パワ−ウインドの開閉、ミラーの角度調整に適用す
るようにしてもよい。

【００５９】ナビゲーションシステムや空調システム
を、例えば携帯型ナビゲーションシステム或いは屋内用
空調装置などのように車載機器以外に適用してもよい。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態における全体構成を
示すブロック図

【図２】音声認識部及び対話制御部を詳細に示すブロッ
ク図

【図３】全体の動作を示すフローチャート

【図４】地名の階層構造の説明図

【符号の説明】

１はカーナビゲーションシステム、１５は対話制御部
（音声案内手段、属性確定手段、学習手段）、１７は音
声認識部（認識手段、辞書手段、認識候補記憶手段、特
徴記憶手段）、１９はマイク（音声入力手段）である。

Claims

【特許請求の範囲】

【請求項１】入力音声を音声信号に変換するための音
声入力手段と、この音声入力手段からの音声信号を、予め辞書手段に記
憶されている複数の比較対象パターン候補と比較して類
似度の高いものを認識結果とする認識手段と、この認識
手段による音声認識が失敗したときは再度の音声入力を
促す音声案内を実行する音声案内手段とを備えた音声認
識装置において、前記音声案内手段は、前記認識手段による音声認識が所
定回数失敗したときは、再度の音声入力を促す前記音声
案内に代えて別の音声入力を促す所定の予備音声案内を
実行し、前記認識手段は、前記音声案内手段による予備音声案内
に応じて入力された音声入力に基づいて音声認識するこ
とを特徴とする音声認識装置。
【請求項２】前記音声案内手段は、前記認識手段が音
声認識できなかった入力音声が前回認識できなかった入
力音声と同一であると判断した場合に音声認識を失敗し
たとみなすことを特徴とする請求項１記載の音声認識装
置。
【請求項３】前記所定回数は、使用者により更新可能
であることを特徴とする請求項１または２記載の音声認
識装置。
【請求項４】前記認識手段が音声認識できなかったと
きは音声認識候補のうちから類似度の高い上位音声認識
候補を記憶する認識候補記憶手段を備え、前記音声案内手段は、前記認識候補記憶手段に記憶され
た上位音声認識候補を用いた問い掛けを前記予備音声案
内として実行し、前記認識手段は、前記音声案内手段による問い掛けに応
じた返答に対して音声認識することを特徴とする請求項
１乃至３の何れかに記載の音声認識装置。
【請求項５】前記認識手段による認識結果に基づいて
音声データの属性を確定する属性確定手段を備え、前記音声案内手段は、前記属性確定手段が確定した属性
に適した質問の問い掛けを前記予備音声案内として実行
し、前記認識手段は、前記音声案内手段による問い掛けに応
じた返答に対して音声認識することを特徴とする請求項
１乃至３の何れかに記載の音声認識装置。
【請求項６】音声データの特徴を学習する学習手段を
備え、前記音声案内手段は、前記学習手段が必要とする所定の
音声を使用者に対して発声させるような問い掛けを前記
予備音声案内として実行し、前記学習手段は、前記音声案内手段による問い掛けに応
じた返答に基づいて音声の特徴を学習し、前記認識手段は、前記学習手段が学習した音声の特徴に
基づいて音声認識することを特徴とする請求項１乃至３
の何れかに記載の音声認識装置。
【請求項７】予め使用者毎の音声データの特徴を記憶
している特徴記憶手段を備え、前記音声案内手段は、使用者を特定するための質問の問
い掛けを前記予備音声案内として実行し、前記認識手段は、前記音声案内手段による問い掛けに応
じて特定した使用者に対応して前記特徴記憶手段に記憶
されている特徴に基づいて音声認識することを特徴とす
る請求項１乃至３の何れかに記載の音声認識装置。