JP2006343661A

JP2006343661A - 音声認識装置および音声認識プログラム

Info

Publication number: JP2006343661A
Application number: JP2005171058A
Authority: JP
Inventors: Yoichiro Nishikawa; 洋一郎西川; Hiroya Murao; 浩也村尾
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 2005-06-10
Filing date: 2005-06-10
Publication date: 2006-12-21

Abstract

【課題】この発明は、音声認識候補が複数存在する場合に、ユーザが画面をあまり注視しなくても目的の語句を容易に選択できるようになる音声認識装置を提供することを目的する。
【解決手段】第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、関連語句抽出手段によって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第２の音声辞書を作成する辞書作成手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第２の音声辞書を参照して抽出する第２の音声認識手段を備えている。
【選択図】図１

Description

この発明は、音声認識装置および音声認識プログラムに関する。

音声認識装置においては、音声認識候補が複数存在する場合、複数の音声認識候補から目的の語句を決定するための処理が必要となる。複数の音声認識候補から目的の語句を決定する方法として、次のような方法が知られている。

（１）複数の音声認識候補を一覧表示し、ユーザ操作によって目的の語句を選択させる。
（２）複数の音声認識候補を一覧表示し、ユーザに目的の語句に対応する表示番号を発声させる。

上記（１）の方法では、候補一覧の表示画面（音声認識候補選択画面）をユーザが注視する必要がある。上記（２）の方法では、目的の語句に対応する表示番号が何番であるかをユーザが認識する必要がある。そして、目的の語句に対応する表示番号が常に同じとは限らないため、音声認識候補選択画面を注視する必要がある。

この発明は、音声認識候補が複数存在する場合に、ユーザが画面をあまり注視しなくても目的の語句を容易に選択できるようになる音声認識装置および音声認識プログラムを提供することを目的する。

請求項１に記載の音声認識装置は、予め用意された複数の音声データ毎に認識語句を記憶した第１の音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、入力された音声データに対応する認識語句を、第１の音声辞書を参照して抽出する第１の音声認識手段、第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、関連語句抽出手段によって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第２の音声辞書を作成する辞書作成手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第２の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第２の音声認識手段を備えていることを特徴とする。

請求項２に記載の音声認識装置は、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１の音声認識手段、第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する関連語句抽出手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語句抽出手段によって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第２の音声認識手段を備えていることを特徴とする。

請求項３に記載の音声認識装置は、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１の音声認識手段、第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第２の音声認識手段を備えていることを特徴とする。

請求項３に記載の音声認識装置は、請求項１乃至３に記載の音声認識装置において、音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させる手段を備えていることを特徴とする。

請求項５に記載の音声認識プログラムは、予め用意された複数の音声データ毎に認識語句を記憶した第１の音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、入力された音声データに対応する認識語句を、第１の音声辞書を参照して抽出する第１ステップ、第１ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第２ステップ、第２ステップによって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第２の音声辞書を作成する第３ステップ、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第４ステップ、ならびに関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第２の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第５ステップをコンピュータに実行させるものであることを特徴とする。

請求項６に記載の発明の音声認識プログラムは、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１ステップ、第１ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する第２ステップ、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第３ステップ、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、第２ステップによって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第４ステップをコンピュータに実行させるものであることを特徴とする。

請求項８に記載の音声認識プログラムは、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１ステップ、第１ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第２ステップ、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第３ステップ、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第４ステップをコンピュータに実行させるものであることを特徴とする。

請求項８に記載の音声認識プログラムは、請求項５乃至７に記載の音声認識プログラムにおいて、音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させるステップをコンピュータに実行させるためのプログラムを備えていることを特徴とする。

この発明によれば、音声認識候補が複数存在する場合に、ユーザが画面をあまり注視しなくても目的の語句を容易に選択できるようになる。

以下、図面を参照して、この発明の実施例について説明する。

〔１〕音声認識装置の構成についての説明

図１は、音声認識装置の構成を示している。
音声認識装置は、マイク１、音声入力装置２、中央制御装置３、第１の音声認識装置４、第２の音声認識装置５、関連語管理装置６、表示装置７、音声出力装置８およびスピーカ９を備えている。

第１の音声認識装置４は、第１の認識用音声辞書４１を備えている。第２の音声認識装置５は、第２の認識用音声辞書５１を備えている。関連語管理装置６は、関連語データベース（関連語ＤＢ）６１を備えている。ただし、第２の認識用音声辞書５１は、音声認識の途中で作成される辞書である。

第１の認識用音声辞書４１は、入力された音声データに対応する認識語句を抽出するために用いられる辞書である。図２は、第１の認識用音声辞書４１の内容の一部の一例を示している。第１の認識用音声辞書４１には、複数の音声データ毎に、その番号（音声データ番号）とそのデータ番号に対応する認識語句とが記憶されている。なお、第１の認識用音声辞書４１に登録される音声データには、後述する各関連語句に対応する音声データも含まれている。なお、音声データとしては、音声波形データまたは音声波形をモデル化したデータが用いられる。

関連語ＤＢ６１は、音声認識候補が複数存在する場合に、各音声認識候補に対応する関連語句を抽出するために用いられる辞書である。図３は、関連語ＤＢ６１の内容の一部の一例を示している。関連語ＤＢ６１には、認識語句毎に、対応する関連語句と、その関連語句に対応する音声データの番号（第１の認識用音声辞書４１内の音声データ番号）が記憶されている。

〔２〕音声認識処理手順についての説明

図４は、音声認識処理手順を示している。
マイク１を介して音声入力装置２に音声が入力されると、音声入力装置２によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置３を介して第１の音声認識装置４に入力される（ステップＳ１）。第１の音声認識装置４は第１の認識用音声辞書４１を参照して、音声データに対応する認識語句を音声認識候補として抽出する（ステップＳ２）。

そして、中央制御装置３は、第１の音声認識装置４によって抽出された音声認識候補が１つのみであるか否かを判定する（ステップＳ３）。第１の音声認識装置４によって抽出された音声認識候補が１つのみである場合には、当該音声認識候補を目的の語句として確定する（ステップＳ４）。

第１の音声認識装置４によって抽出された音声認識候補が複数存在する場合には、中央制御装置３からの指示により、関連語管理装置６は関連語ＤＢ６１を参照して、各音声認識候補に対応する関連語句およびその関連語句に対応する音声データ番号を抽出する。中央制御装置３は、関連語管理装置６によって抽出された各音声認識候補に対応する関連語句およびその関連語句に対応する音声データ番号を取得する（ステップＳ５）。

中央制御装置３は、取得した各音声認識候補に対応する関連語句およびその関連語句に対応する音声データ番号に基づいて、取得した各関連語句に対応する音声データ（音声データ番号に基づいて第１の認識用音声辞書４１から取得する）と、その関連語句に対応する認識語句とからなる第２の認識用音声辞書５１を作成する（ステップＳ６）。

この後、中央制御装置３は、取得した各音声認識候補に対応する関連語句に基づいて、各音声認識候補をそれに対応する関連語句とともに表示装置７に表示する（ステップＳ７）。このような表示画面を音声認識候補選択画面と呼ぶことにする。そして、例えば「目的の語句に対応する関連語句を音声入力してください」と言うような入力要求メッセージを音声出力装置８およびスピーカ９を用いて音声出力する（ステップＳ８）。

例えば、上記ステップＳ１でユーザが”天気”を音声入力した場合に、第１の音声認識装置４によって「天気」、「電気」、「展示」および「点字」の４つの語句を音声認識候補として決定したとする。この場合には、「天気」、「電気」、「展示」および「点字」に対応する関連語句および音声データ番号は、それぞれ「気候」（音声データ番号：１０）、「エレクトロニクス」（音声データ番号：５８）、「ディスプレイ」（音声データ番号：３０）、「記号文字」（音声データ番号：３６）となる。

したがって、上記ステップＳ６では、図５に示すような、第２の認識用音声辞書５１が作成される。また、上記ステップＳ７では、図９（ａ）に示すような、音声認識候補選択画面が表示される。この例では、各音声認識候補毎に、音声認識候補の後にそれに対応する関連語句が表示されている。

上記ステップＳ８で入力要求メッセージが音声出力された後、ユーザによって目的の語句に対応する関連語句が音声入力されると、音声入力装置２によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置３を介して第２の音声認識装置５に入力される（ステップＳ９）。第２の音声認識装置５は、上記ステップＳ５で作成された第２の認識用音声辞書５１を参照して、入力された音声データに対応する認識語句を抽出する（ステップＳ１０）。抽出された認識語句を目的の語句として決定する（ステップＳ１１）。

なお、第１の音声認識装置４と第２の音声認識装置５としては、同一の音声認識装置を用いることができる。

〔３〕音声認識処理手順の他の例についての説明
上記実施例では、第２の認識用辞書を作成しているが、第２の認識用辞書を作成しなくてもよい。

図６は、第２の認識用辞書を作成しない場合の音声認識処理手順を示している。
上述した関連語ＤＢ６１には、図３に示すように、認識語句毎に、対応する関連語句と、その関連語句に対応する音声データの番号（第１の認識用音声辞書４１内の音声データ番号）が記憶されているが、図６の音声認識処理では、関連語句に対応する音声データの番号は不要であるので、関連語ＤＢ６１として、認識語句毎に対応する関連語句が記憶されているものが用いられる。

マイク１を介して音声入力装置２に音声が入力されると、音声入力装置２によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置３を介して第１の音声認識装置４に入力される（ステップＳ２１）。第１の音声認識装置４は第１の認識用音声辞書４１を参照して、音声データに対応する認識語句を音声認識候補として抽出する（ステップＳ２２）。

そして、中央制御装置３は、第１の音声認識装置４によって抽出された音声認識候補が１つのみであるか否かを判定する（ステップＳ２３）。第１の音声認識装置４によって抽出された音声認識候補が１つのみである場合には、当該音声認識候補を目的の語句として確定する（ステップＳ２４）。

第１の音声認識装置４によって抽出された音声認識候補が複数存在する場合には、中央制御装置３からの指示により、関連語管理装置６は関連語ＤＢ６１を参照して、各音声認識候補に対応する関連語句を抽出する。中央制御装置３は、関連語管理装置６によって抽出された各音声認識候補に対応する関連語句を取得し、各音声認識候補と関連語との対応表を作成する（ステップＳ２５）。ステップＳ２２で抽出された音声認識候補が、例えば、「天気」、「電気」、「展示」および「点字」である場合には、ステップＳ２５では図７に示すような対応表が作成される。

中央制御装置３は、各音声認識候補をそれに対応する関連語句とともに表示装置７に表示する（ステップＳ２６）。このような表示画面を音声認識候補選択画面と呼ぶことにする。そして、例えば「目的の語句に対応する関連語句を音声入力してください」と言うような入力要求メッセージを音声出力装置８およびスピーカ９を用いて音声出力する（ステップＳ２７）。

上記ステップＳ２７で入力要求メッセージが音声出力された後、ユーザによって目的の語句に対応する関連語句が音声入力されると、音声入力装置２によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置３を介して第１の音声認識装置４に入力される（ステップＳ２８）。第１の音声認識装置４は、第１の認識用音声辞書４１を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”としてとして抽出する（ステップＳ２９）。

中央制御装置３は、第１の音声認識装置４によって抽出された”目的の語句に対応する関連語句”に対応する音声認識候補を、上記ステップＳ２５で作成した対応表（図７）から抽出し、抽出した音声認識候補を目的の語句として確定する（ステップＳ３０）。例えば、第１の音声認識装置４によって抽出された”目的の語句に対応する関連語句”が「気候」である場合には、ステップＳ３０では、上記ステップＳ２５で作成した対応表（図７）の関連語句「気候」に対応する音声認識候補「気候」が、目的の語句として確定される。

なお、上記ステップＳ３０では、第１の音声認識装置４によって抽出された”目的の語句に対応する関連語句”に対応する音声認識候補を、上記ステップＳ２５で作成した対応表（図７）から抽出しているが、第１の音声認識装置４によって抽出された”目的の語句に対応する関連語句”に対応する音声認識候補を、関連語ＤＢ６１から抽出するようにしてもよい。

〔４〕従来例との比較
ユーザが”天気”を意図して音声入力したところ、「天気」、「電気」、「展示」および「点字」の４つの音声認識候補が抽出された場合について、従来例と上記実施例とを比較する。

従来例では、図８（ａ）に示すように、１．天気、２．電気、３．展示、４．点字からなる音声認識候補選択画面が表示される。従来例では、目的の語句である１．天気をマウス等を操作することにより選択するか、その番号を確認して音声入力する。この場合、マウス等を操作するのは面倒である。

一方、本実施例では、図９（ａ）に示すように、天気：気候、電気：エレクトロニクス、展示：ディスプレス、点字：記号文字からなる音声認識候補選択画面が表示される。ユーザは、目的の語句「天気」に対応する関連語句「気候」を音声入力することにより、「天気」が目的の語句として認識される。

従来例では、別の機会に、ユーザが再度”天気”を意図して音声入力した場合に音声認識結果が微妙に異なると、図８（ｂ）に示すように、音声認識候補の表示順序が異なる可能性がある。そうすると、目的の語句である天気の番号が前回と異なるので、番号を音声入力する方法でも、その番号を認識するためには、音声認識候補選択画面を注視する必要がある。

一方、上記実施例では、図９（ｂ）に示すように、音声認識候補の表示順序が異なったとしても、目的の語句「天気」に対応する関連語句「気候」は前回と同じなので、それまでに「天気」に対応する関連語句が「気候」であることを覚えていれば、画面を注視しなくても、関連語句である「気候」を発声できる。

音声認識装置の構成を示すブロック図である。第１の認識用音声辞書４１の内容の一部の一例を示す模式図である。関連語ＤＢ６１の内容の一部の一例を示す模式図である。音声認識処理手順を示すフローチャートである。第２の認識用音声辞書５１の一例を示す模式図である。音声認識処理手順の他の例を示すフローチャートである。図６のステップＳ２５で作成される対応表の一例を示す模式図である。従来例による音声認識候補選択画面の一例を示す模式図である。本実施例による音声認識候補選択画面の一例を示す模式図である。

符号の説明

１マイク
２音声入力装置
３中央制御装置
４第１の音声認識装置
５第２の音声認識装置
６関連語管理装置
７表示装置
８音声出力装置
９スピーカ

Claims

予め用意された複数の音声データ毎に認識語句を記憶した第１の音声辞書、
各認識語句毎にその関連語句を記憶した関連語データベース、
入力された音声データに対応する認識語句を、第１の音声辞書を参照して抽出する第１の音声認識手段、
第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、
関連語句抽出手段によって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第２の音声辞書を作成する辞書作成手段、
各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに
関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第２の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第２の音声認識手段、
を備えていることを特徴とする音声認識装置。
予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、
入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１の音声認識手段、
第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する関連語句抽出手段、
各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに
関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語句抽出手段によって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第２の音声認識手段を備えていることを特徴とする音声認識装置。
予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、
入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１の音声認識手段、
第１の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、
各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに
関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第２の音声認識手段を備えていることを特徴とする音声認識装置。
音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させる手段を備えていることを特徴とする請求項１乃至３に記載の音声認識装置。
予め用意された複数の音声データ毎に認識語句を記憶した第１の音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、
入力された音声データに対応する認識語句を、第１の音声辞書を参照して抽出する第１ステップ、
第１ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第２ステップ、
第２ステップによって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第２の音声辞書を作成する第３ステップ、
各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第４ステップ、ならびに
関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第２の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第５ステップ、
をコンピュータに実行させるための音声認識プログラム。
予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、
入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１ステップ、
第１ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する第２ステップ、
各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第３ステップ、ならびに
関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、第２ステップによって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第４ステップ、
をコンピュータに実行させるための音声認識プログラム。
予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、
入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第１ステップ、
第１ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第２ステップ、
各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第３ステップ、ならびに
関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第４ステップ、
をコンピュータに実行させるための音声認識プログラム。
音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させるステップをコンピュータに実行させるためのプログラムを備えていることを特徴とする請求項５乃至７に記載の音声認識プログラム。