JP2006343661A - 音声認識装置および音声認識プログラム - Google Patents

音声認識装置および音声認識プログラム Download PDF

Info

Publication number
JP2006343661A
JP2006343661A JP2005171058A JP2005171058A JP2006343661A JP 2006343661 A JP2006343661 A JP 2006343661A JP 2005171058 A JP2005171058 A JP 2005171058A JP 2005171058 A JP2005171058 A JP 2005171058A JP 2006343661 A JP2006343661 A JP 2006343661A
Authority
JP
Japan
Prior art keywords
phrase
recognition
voice
word
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005171058A
Other languages
English (en)
Inventor
Yoichiro Nishikawa
洋一郎 西川
Hiroya Murao
浩也 村尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2005171058A priority Critical patent/JP2006343661A/ja
Publication of JP2006343661A publication Critical patent/JP2006343661A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 この発明は、音声認識候補が複数存在する場合に、ユーザが画面をあまり注視しなくても目的の語句を容易に選択できるようになる音声認識装置を提供することを目的する。
【解決手段】 第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、関連語句抽出手段によって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第2の音声辞書を作成する辞書作成手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第2の音声辞書を参照して抽出する第2の音声認識手段を備えている。
【選択図】 図1

Description

この発明は、音声認識装置および音声認識プログラムに関する。
音声認識装置においては、音声認識候補が複数存在する場合、複数の音声認識候補から目的の語句を決定するための処理が必要となる。複数の音声認識候補から目的の語句を決定する方法として、次のような方法が知られている。
(1)複数の音声認識候補を一覧表示し、ユーザ操作によって目的の語句を選択させる。
(2)複数の音声認識候補を一覧表示し、ユーザに目的の語句に対応する表示番号を発声させる。
上記(1)の方法では、候補一覧の表示画面(音声認識候補選択画面)をユーザが注視する必要がある。上記(2)の方法では、目的の語句に対応する表示番号が何番であるかをユーザが認識する必要がある。そして、目的の語句に対応する表示番号が常に同じとは限らないため、音声認識候補選択画面を注視する必要がある。
この発明は、音声認識候補が複数存在する場合に、ユーザが画面をあまり注視しなくても目的の語句を容易に選択できるようになる音声認識装置および音声認識プログラムを提供することを目的する。
請求項1に記載の音声認識装置は、予め用意された複数の音声データ毎に認識語句を記憶した第1の音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、入力された音声データに対応する認識語句を、第1の音声辞書を参照して抽出する第1の音声認識手段、第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、関連語句抽出手段によって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第2の音声辞書を作成する辞書作成手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第2の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第2の音声認識手段を備えていることを特徴とする。
請求項2に記載の音声認識装置は、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、各認識語句毎にその関連語句を記憶した関連語データベース、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1の音声認識手段、第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する関連語句抽出手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語句抽出手段によって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第2の音声認識手段を備えていることを特徴とする。
請求項3に記載の音声認識装置は、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、 各認識語句毎にその関連語句を記憶した関連語データベース、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1の音声認識手段、第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第2の音声認識手段を備えていることを特徴とする。
請求項3に記載の音声認識装置は、請求項1乃至3に記載の音声認識装置において、音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させる手段を備えていることを特徴とする。
請求項5に記載の音声認識プログラムは、予め用意された複数の音声データ毎に認識語句を記憶した第1の音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、入力された音声データに対応する認識語句を、第1の音声辞書を参照して抽出する第1ステップ、第1ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第2ステップ、第2ステップによって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第2の音声辞書を作成する第3ステップ、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第4ステップ、ならびに関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第2の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第5ステップをコンピュータに実行させるものであることを特徴とする。
請求項6に記載の発明の音声認識プログラムは、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1ステップ、第1ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する第2ステップ、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第3ステップ、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、第2ステップによって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第4ステップをコンピュータに実行させるものであることを特徴とする。
請求項8に記載の音声認識プログラムは、予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1ステップ、第1ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第2ステップ、各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第3ステップ、ならびに関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第4ステップをコンピュータに実行させるものであることを特徴とする。
請求項8に記載の音声認識プログラムは、請求項5乃至7に記載の音声認識プログラムにおいて、音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させるステップをコンピュータに実行させるためのプログラムを備えていることを特徴とする。
この発明によれば、音声認識候補が複数存在する場合に、ユーザが画面をあまり注視しなくても目的の語句を容易に選択できるようになる。
以下、図面を参照して、この発明の実施例について説明する。
〔1〕音声認識装置の構成についての説明
図1は、音声認識装置の構成を示している。
音声認識装置は、マイク1、音声入力装置2、中央制御装置3、第1の音声認識装置4、第2の音声認識装置5、関連語管理装置6、表示装置7、音声出力装置8およびスピーカ9を備えている。
第1の音声認識装置4は、第1の認識用音声辞書41を備えている。第2の音声認識装置5は、第2の認識用音声辞書51を備えている。関連語管理装置6は、関連語データベース(関連語DB)61を備えている。ただし、第2の認識用音声辞書51は、音声認識の途中で作成される辞書である。
第1の認識用音声辞書41は、入力された音声データに対応する認識語句を抽出するために用いられる辞書である。図2は、第1の認識用音声辞書41の内容の一部の一例を示している。第1の認識用音声辞書41には、複数の音声データ毎に、その番号(音声データ番号)とそのデータ番号に対応する認識語句とが記憶されている。なお、第1の認識用音声辞書41に登録される音声データには、後述する各関連語句に対応する音声データも含まれている。なお、音声データとしては、音声波形データまたは音声波形をモデル化したデータが用いられる。
関連語DB61は、音声認識候補が複数存在する場合に、各音声認識候補に対応する関連語句を抽出するために用いられる辞書である。図3は、関連語DB61の内容の一部の一例を示している。関連語DB61には、認識語句毎に、対応する関連語句と、その関連語句に対応する音声データの番号(第1の認識用音声辞書41内の音声データ番号)が記憶されている。
〔2〕音声認識処理手順についての説明
図4は、音声認識処理手順を示している。
マイク1を介して音声入力装置2に音声が入力されると、音声入力装置2によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置3を介して第1の音声認識装置4に入力される(ステップS1)。第1の音声認識装置4は第1の認識用音声辞書41を参照して、音声データに対応する認識語句を音声認識候補として抽出する(ステップS2)。
そして、中央制御装置3は、第1の音声認識装置4によって抽出された音声認識候補が1つのみであるか否かを判定する(ステップS3)。第1の音声認識装置4によって抽出された音声認識候補が1つのみである場合には、当該音声認識候補を目的の語句として確定する(ステップS4)。
第1の音声認識装置4によって抽出された音声認識候補が複数存在する場合には、中央制御装置3からの指示により、関連語管理装置6は関連語DB61を参照して、各音声認識候補に対応する関連語句およびその関連語句に対応する音声データ番号を抽出する。中央制御装置3は、関連語管理装置6によって抽出された各音声認識候補に対応する関連語句およびその関連語句に対応する音声データ番号を取得する(ステップS5)。
中央制御装置3は、取得した各音声認識候補に対応する関連語句およびその関連語句に対応する音声データ番号に基づいて、取得した各関連語句に対応する音声データ(音声データ番号に基づいて第1の認識用音声辞書41から取得する)と、その関連語句に対応する認識語句とからなる第2の認識用音声辞書51を作成する(ステップS6)。
この後、中央制御装置3は、取得した各音声認識候補に対応する関連語句に基づいて、各音声認識候補をそれに対応する関連語句とともに表示装置7に表示する(ステップS7)。このような表示画面を音声認識候補選択画面と呼ぶことにする。そして、例えば「目的の語句に対応する関連語句を音声入力してください」と言うような入力要求メッセージを音声出力装置8およびスピーカ9を用いて音声出力する(ステップS8)。
例えば、上記ステップS1でユーザが”天気”を音声入力した場合に、第1の音声認識装置4によって「天気」、「電気」、「展示」および「点字」の4つの語句を音声認識候補として決定したとする。この場合には、「天気」、「電気」、「展示」および「点字」に対応する関連語句および音声データ番号は、それぞれ「気候」(音声データ番号:10)、「エレクトロニクス」(音声データ番号:58)、「ディスプレイ」(音声データ番号:30)、「記号文字」(音声データ番号:36)となる。
したがって、上記ステップS6では、図5に示すような、第2の認識用音声辞書51が作成される。また、上記ステップS7では、図9(a)に示すような、音声認識候補選択画面が表示される。この例では、各音声認識候補毎に、音声認識候補の後にそれに対応する関連語句が表示されている。
上記ステップS8で入力要求メッセージが音声出力された後、ユーザによって目的の語句に対応する関連語句が音声入力されると、音声入力装置2によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置3を介して第2の音声認識装置5に入力される(ステップS9)。第2の音声認識装置5は、上記ステップS5で作成された第2の認識用音声辞書51を参照して、入力された音声データに対応する認識語句を抽出する(ステップS10)。抽出された認識語句を目的の語句として決定する(ステップS11)。
なお、第1の音声認識装置4と第2の音声認識装置5としては、同一の音声認識装置を用いることができる。
〔3〕音声認識処理手順の他の例についての説明
上記実施例では、第2の認識用辞書を作成しているが、第2の認識用辞書を作成しなくてもよい。
図6は、第2の認識用辞書を作成しない場合の音声認識処理手順を示している。
上述した関連語DB61には、図3に示すように、認識語句毎に、対応する関連語句と、その関連語句に対応する音声データの番号(第1の認識用音声辞書41内の音声データ番号)が記憶されているが、図6の音声認識処理では、関連語句に対応する音声データの番号は不要であるので、関連語DB61として、認識語句毎に対応する関連語句が記憶されているものが用いられる。
マイク1を介して音声入力装置2に音声が入力されると、音声入力装置2によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置3を介して第1の音声認識装置4に入力される(ステップS21)。第1の音声認識装置4は第1の認識用音声辞書41を参照して、音声データに対応する認識語句を音声認識候補として抽出する(ステップS22)。
そして、中央制御装置3は、第1の音声認識装置4によって抽出された音声認識候補が1つのみであるか否かを判定する(ステップS23)。第1の音声認識装置4によって抽出された音声認識候補が1つのみである場合には、当該音声認識候補を目的の語句として確定する(ステップS24)。
第1の音声認識装置4によって抽出された音声認識候補が複数存在する場合には、中央制御装置3からの指示により、関連語管理装置6は関連語DB61を参照して、各音声認識候補に対応する関連語句を抽出する。中央制御装置3は、関連語管理装置6によって抽出された各音声認識候補に対応する関連語句を取得し、各音声認識候補と関連語との対応表を作成する(ステップS25)。ステップS22で抽出された音声認識候補が、例えば、「天気」、「電気」、「展示」および「点字」である場合には、ステップS25では図7に示すような対応表が作成される。
中央制御装置3は、各音声認識候補をそれに対応する関連語句とともに表示装置7に表示する(ステップS26)。このような表示画面を音声認識候補選択画面と呼ぶことにする。そして、例えば「目的の語句に対応する関連語句を音声入力してください」と言うような入力要求メッセージを音声出力装置8およびスピーカ9を用いて音声出力する(ステップS27)。
上記ステップS27で入力要求メッセージが音声出力された後、ユーザによって目的の語句に対応する関連語句が音声入力されると、音声入力装置2によって入力された音声に対応する音声データが生成され、生成された音声データが中央制御装置3を介して第1の音声認識装置4に入力される(ステップS28)。第1の音声認識装置4は、第1の認識用音声辞書41を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”としてとして抽出する(ステップS29)。
中央制御装置3は、第1の音声認識装置4によって抽出された”目的の語句に対応する関連語句”に対応する音声認識候補を、上記ステップS25で作成した対応表(図7)から抽出し、抽出した音声認識候補を目的の語句として確定する(ステップS30)。例えば、第1の音声認識装置4によって抽出された”目的の語句に対応する関連語句”が「気候」である場合には、ステップS30では、上記ステップS25で作成した対応表(図7)の関連語句「気候」に対応する音声認識候補「気候」が、目的の語句として確定される。
なお、上記ステップS30では、第1の音声認識装置4によって抽出された”目的の語句に対応する関連語句”に対応する音声認識候補を、上記ステップS25で作成した対応表(図7)から抽出しているが、第1の音声認識装置4によって抽出された”目的の語句に対応する関連語句”に対応する音声認識候補を、関連語DB61から抽出するようにしてもよい。
〔4〕従来例との比較
ユーザが”天気”を意図して音声入力したところ、「天気」、「電気」、「展示」および「点字」の4つの音声認識候補が抽出された場合について、従来例と上記実施例とを比較する。
従来例では、図8(a)に示すように、1.天気、2.電気 、3.展示、4.点字 からなる音声認識候補選択画面が表示される。従来例では、目的の語句である1.天気をマウス等を操作することにより選択するか、その番号を確認して音声入力する。この場合、マウス等を操作するのは面倒である。
一方、本実施例では、図9(a)に示すように、天気:気候、電気:エレクトロニクス 、展示:ディスプレス、点字:記号文字からなる音声認識候補選択画面が表示される。ユーザは、目的の語句「天気」に対応する関連語句「気候」を音声入力することにより、「天気」が目的の語句として認識される。
従来例では、別の機会に、ユーザが再度”天気”を意図して音声入力した場合に音声認識結果が微妙に異なると、図8(b)に示すように、音声認識候補の表示順序が異なる可能性がある。そうすると、目的の語句である天気の番号が前回と異なるので、番号を音声入力する方法でも、その番号を認識するためには、音声認識候補選択画面を注視する必要がある。
一方、上記実施例では、図9(b)に示すように、音声認識候補の表示順序が異なったとしても、目的の語句「天気」に対応する関連語句「気候」は前回と同じなので、それまでに「天気」に対応する関連語句が「気候」であることを覚えていれば、画面を注視しなくても、関連語句である「気候」を発声できる。
音声認識装置の構成を示すブロック図である。 第1の認識用音声辞書41の内容の一部の一例を示す模式図である。 関連語DB61の内容の一部の一例を示す模式図である。 音声認識処理手順を示すフローチャートである。 第2の認識用音声辞書51の一例を示す模式図である。 音声認識処理手順の他の例を示すフローチャートである。 図6のステップS25で作成される対応表の一例を示す模式図である。 従来例による音声認識候補選択画面の一例を示す模式図である。 本実施例による音声認識候補選択画面の一例を示す模式図である。
符号の説明
1 マイク
2 音声入力装置
3 中央制御装置
4 第1の音声認識装置
5 第2の音声認識装置
6 関連語管理装置
7 表示装置
8 音声出力装置
9 スピーカ

Claims (8)

  1. 予め用意された複数の音声データ毎に認識語句を記憶した第1の音声辞書、
    各認識語句毎にその関連語句を記憶した関連語データベース、
    入力された音声データに対応する認識語句を、第1の音声辞書を参照して抽出する第1の音声認識手段、
    第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、
    関連語句抽出手段によって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第2の音声辞書を作成する辞書作成手段、
    各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに
    関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第2の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第2の音声認識手段、
    を備えていることを特徴とする音声認識装置。
  2. 予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、 各認識語句毎にその関連語句を記憶した関連語データベース、
    入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1の音声認識手段、
    第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する関連語句抽出手段、
    各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに
    関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語句抽出手段によって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第2の音声認識手段を備えていることを特徴とする音声認識装置。
  3. 予め用意された複数の音声データ毎に認識語句を記憶した音声辞書、 各認識語句毎にその関連語句を記憶した関連語データベース、
    入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1の音声認識手段、
    第1の音声認識手段によって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する関連語句抽出手段、
    各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる表示手段、ならびに
    関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第2の音声認識手段を備えていることを特徴とする音声認識装置。
  4. 音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させる手段を備えていることを特徴とする請求項1乃至3に記載の音声認識装置。
  5. 予め用意された複数の音声データ毎に認識語句を記憶した第1の音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、
    入力された音声データに対応する認識語句を、第1の音声辞書を参照して抽出する第1ステップ、
    第1ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第2ステップ、
    第2ステップによって抽出された各関連語に対応する音声データ毎に、その関連語句に対応する認識語句を記憶した第2の音声辞書を作成する第3ステップ、
    各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第4ステップ、ならびに
    関連語句が音声入力された場合に、入力された音声データに対応する認識語句を、第2の音声辞書を参照して抽出し、抽出した認識語句を目的の語句として確定する第5ステップ、
    をコンピュータに実行させるための音声認識プログラム。
  6. 予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、
    入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1ステップ、
    第1ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出するとともに、各音声認識候補と関連語句との対応表を作成する第2ステップ、
    各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第3ステップ、ならびに
    関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、第2ステップによって作成された対応表に基づいて特定し、特定した認識語句を目的の語句として確定する第4ステップ、
    をコンピュータに実行させるための音声認識プログラム。
  7. 予め用意された複数の音声データ毎に認識語句を記憶した音声辞書および各認識語句毎にその関連語句を記憶した関連語データベースを含んでおり、
    入力された音声データに対応する認識語句を、音声辞書を参照して抽出する第1ステップ、
    第1ステップによって抽出された認識語句が複数存在する場合には、それらの認識語句を音声認識候補として、各音声認識候補に対応する関連語句を、関連語データベースを参照して抽出する第2ステップ、
    各音声認識候補とそれに対応する関連語句とを示す音声認識候補選択画面を表示させる第3ステップ、ならびに
    関連語句が音声入力された場合に、音声辞書を参照して、入力された音声データに対応する認識語句を”目的の語句に対応する関連語句”として抽出し、抽出した”目的の語句に対応する関連語句”に対応する認識語句を、関連語データベースに基づいて特定し、特定した認識語句を目的の語句として確定する第4ステップ、
    をコンピュータに実行させるための音声認識プログラム。
  8. 音声認識候補選択画面を表示させた後、目的の語句に対応する関連語句をユーザに音声入力させるための入力要求メッセージを音声出力させるステップをコンピュータに実行させるためのプログラムを備えていることを特徴とする請求項5乃至7に記載の音声認識プログラム。
JP2005171058A 2005-06-10 2005-06-10 音声認識装置および音声認識プログラム Withdrawn JP2006343661A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005171058A JP2006343661A (ja) 2005-06-10 2005-06-10 音声認識装置および音声認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005171058A JP2006343661A (ja) 2005-06-10 2005-06-10 音声認識装置および音声認識プログラム

Publications (1)

Publication Number Publication Date
JP2006343661A true JP2006343661A (ja) 2006-12-21

Family

ID=37640660

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005171058A Withdrawn JP2006343661A (ja) 2005-06-10 2005-06-10 音声認識装置および音声認識プログラム

Country Status (1)

Country Link
JP (1) JP2006343661A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017175351A1 (ja) * 2016-04-07 2017-10-12 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017175351A1 (ja) * 2016-04-07 2017-10-12 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置
JPWO2017175351A1 (ja) * 2016-04-07 2018-08-02 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置
US10839800B2 (en) 2016-04-07 2020-11-17 Sony Interactive Entertainment Inc. Information processing apparatus

Similar Documents

Publication Publication Date Title
US7389235B2 (en) Method and system for unified speech and graphic user interfaces
JP2013068952A (ja) 音声認識結果の統合
EP1405169B1 (en) Information processing apparatus and method, and program product
JP6535998B2 (ja) 音声学習装置および制御プログラム
JP2011100169A (ja) インターネットページのハイパーリンクを作動させる音声認識方法
KR20060055313A (ko) 음성 명령을 명확하게 해주는 중앙집중식 방법 및 시스템
US20150073801A1 (en) Apparatus and method for selecting a control object by voice recognition
JP2007206888A (ja) 応答生成装置、方法及びプログラム
JP2007193166A (ja) 対話装置、対話方法及びプログラム
JP6100101B2 (ja) 音声認識を利用した候補選択装置および候補選択方法
JP2008203516A (ja) 情報処理装置および情報処理方法
JP6641680B2 (ja) 音声出力装置、音声出力プログラムおよび音声出力方法
JP6676093B2 (ja) 異言語間コミュニケーション支援装置及びシステム
JP2007127896A (ja) 音声認識装置及び音声認識方法
JP2003157095A (ja) 音声認識装置及びその方法、プログラム
JP2004226698A (ja) 音声認識装置
JP2006343661A (ja) 音声認識装置および音声認識プログラム
JP3762191B2 (ja) 情報入力方法、情報入力装置及び記憶媒体
JP2005031150A (ja) 音声処理装置および方法
JP4012228B2 (ja) 情報入力方法、情報入力装置及び記憶媒体
JP7013702B2 (ja) 学習支援装置、学習支援方法、及び、プログラム
JP2017054038A (ja) 学習支援装置及びその学習支援装置用のプログラム
JP4924148B2 (ja) 発音学習支援装置及び発音学習支援プログラム
JP2008058678A (ja) 音声出力装置及び音声出力プログラム
KR20080052306A (ko) 네비게이션 시스템에 이용되는 음성 인식 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20080116