JP4832097B2 - 音声対話システム - Google Patents

音声対話システム Download PDF

Info

Publication number
JP4832097B2
JP4832097B2 JP2006034812A JP2006034812A JP4832097B2 JP 4832097 B2 JP4832097 B2 JP 4832097B2 JP 2006034812 A JP2006034812 A JP 2006034812A JP 2006034812 A JP2006034812 A JP 2006034812A JP 4832097 B2 JP4832097 B2 JP 4832097B2
Authority
JP
Japan
Prior art keywords
voice
speech recognition
speech
dictionary
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006034812A
Other languages
English (en)
Other versions
JP2007212919A (ja
Inventor
勲 田中
收 岩田
昌宏 神谷
雅彦 久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2006034812A priority Critical patent/JP4832097B2/ja
Publication of JP2007212919A publication Critical patent/JP2007212919A/ja
Application granted granted Critical
Publication of JP4832097B2 publication Critical patent/JP4832097B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、ユーザとの間で音声により入出力を行う音声対話システムに関する。
音声による入力及び出力を通して利用者との対話を実現する音声対話システムが知られている。現状の音声対話は、音声認識の性能に左右されるところ、音声認識では、100%の確率で正しく音声を認識することは困難である。そこで、音声が認識されると、認識結果を示す合成音声が生成され、出力される。ユーザは、その認識結果を知り、認識結果が正しいか否かを判断する。
そして、認識結果が誤っているときには、ユーザは、再度、音声を発声して対話システムへ入力する。しかしながら、複数回連続して誤認識が発生し、何度も同じ言葉の発声を促された場合、ユーザの不快感を招くという問題が存在する。また最悪の場合、何度も誤認識を続け目的を達成することができないという事態(デッドロック)も起こり得る。
認識性能を向上させる方法として、あらかじめユーザに検索を行うジャンルを指定させ、設定されたジャンルから検索を行うことで、検索される語彙数を減少させて誤認識を低減させる技術(例えば、下記特許文献1参照)も存在するが、音声認識では、語彙数が少なくても非常に似た単語(「岡山」と「和歌山」、「U2」と「ゆず」等)が認識辞書に登録されていれば、誤認識が発生し易い。そのため、ユーザがジャンルを任意に指定し語彙数を減らせば誤認識を回避することができる、デッドロックを回避することができる、とは言い難い。
なお、本発明に関連する先行技術文献として、下記特許文献1は、前述のように、音声認識用検索対象候補として単語辞書に用意された複数のジャンルのうちいずれのジャンルを検索対象とするかを予め設定し、前記設定したジャンルの中の検索を希望する施設名称を音声入力することにより、自車位置から前記ジャンル毎に設定された所定距離範囲内の施設名称を検索して表示することを特徴とする音声によるエリア内施設検索方法を開示している。
また、下記特許文献2は、利用者から発せられる音声を入力し、入力された前記音声の認識処理を実行する音声認識装置において、前記音声を含む音声情報を入力する手段と、前記音声の認識に関する状況を検知する手段と、検知された前記状況を示す状況情報に基づいて、それぞれが入力された音声の認識処理を実行する複数の音声認識手段のうち、少なくとも1つ選択する手段を有し、選択された少なくとも1つの音声認識手段を用いて、入力された前記音声の認識処理を実行することを特徴とする音声認識装置を開示している。
また、下記特許文献3は、入力された単語の音声を周波数分析した結果を複数の認識テンプレートを用いて作成した単語辞書と照合して音声認識する際に、誤認識が発生した場合には複数回のやり直しを許容するとともに、特定回数のやり直し後にも誤認識が発生した場合には、それまで使用していた認識テンプレートを他の認識テンプレートに入れ替えて音声認識を再実行することを特徴とする音声認識方法を開示している。
また、下記特許文献4は、入力音声に対して認識処理を行い音声認識結果を出力する音声認識部と、各対話状態における、音声認識対象語彙、音声認識結果及び誤認識回数に応じた遷移先対話状態を規定した対話手順を保持する対話手順記憶部と、音声認識の正誤回数を保持する音声認識正誤回数記憶部と、前記音声認識正誤回数記憶部に保持された音声認識の正誤回数と前記音声認識部が出力する音声認識結果に基づいて、前記対話手順記憶部に保持された対話手順を参照して遷移先対話状態を決定して出力する遷移先対話状態決定部と、前記音声認識部が出力する音声認識結果に対する正誤結果を出力し、前記遷移先対話状態決定部が出力する遷移先対話状態へ対話状態を遷移する対話管理部と、を備えたことを特徴とする音声対話装置を開示している。
特開2003−21530号公報 特開2003−140691号公報 特開2002−108386号公報 特開2000−293194号公報
本発明は、上述した問題点に鑑みてなされたものであり、その目的は、同じ音声の発生をユーザに何度も促すことを回避してデッドロックを防止することができる音声対話システムを提供することにある。
上記目的を達成するために、本発明によれば、指定されたテキスト内容の合成音声信号を出力する音声合成部と、音声認識辞書を参照して入力音声信号に対する認識処理を行い、音声認識結果を出力する音声認識部と、前記音声認識部による音声認識結果に基づいて検索されるデータベースと、前記音声認識部において参照される音声認識辞書を記憶するための音声認識辞書記憶部と、前記データベースを参照して前記音声認識辞書記憶部に音声認識辞書を構築する音声認識辞書構築部と、音声対話のための対話シナリオを記憶及び管理する対話シナリオ部と、前記対話シナリオ部、前記音声合成部及び前記音声認識部を制御して音声対話を実行させ、音声対話の実行状態に基づいて、音声認識辞書を切り替える処理を前記音声認識辞書構築部に実行させる対話制御部と、を具備することを特徴とする音声対話システムが提供される。
一つの好適な態様では、前記データベースは、複数のカテゴリの各々に基づく検索が可能であり、前記対話制御部は、検索対象カテゴリに対応する音声認識辞書を準備する制御を行い、更に、前記対話制御部は、一つの検索対象カテゴリについての音声認識処理における連続した誤認識によるデッドロックを回避する制御を行う。
そして、好ましくは、前記対話シナリオ部は、あるカテゴリでの検索において連続して繰り返された誤認識の回数を記憶し、前記対話制御部は、前記対話シナリオ部において記憶されている連続誤認識回数が一定数を超えた場合、他のカテゴリを検索対象とする状態に対話シナリオの状態を遷移させるよう対話シナリオ部に要求する。
そして、好ましくは、前記対話制御部は、対話シナリオの状態遷移と同時に、音声認識辞書構築部に音声対話シナリオの状態に合わせた音声認識辞書の作成を要求する。
そして、好ましくは、前記音声認識辞書構築部は、前記対話制御部からの音声認識辞書の作成の要求を受けて、前記データベースを参照し、新しい検索対象カテゴリに対応する音声認識辞書を構築して現在の音声認識辞書と差し替え、さらに、前記対話制御部は、誤認識が発生し認識しづらい旨及び検索対象カテゴリが変更された旨をユーザに伝える内容の合成音声信号を音声合成部から出力させる制御を行う。
そして、好ましくは、前記対話制御部は、差し替え後の音声認識辞書で音声認識が成功した場合、誤認識が発生した状態に対話シナリオを遷移させるよう前記対話シナリオ部に要求するとともに、当該認識結果で前記データベースの検索対象を絞り込み、当該絞り込みを行った状態の音声認識辞書を作成して音声認識辞書を更新するよう前記音声認識辞書構築部に要求する。
また、好ましくは、前記対話制御部は、差し替え後の音声認識辞書でも音声認識が失敗した場合、更に他のカテゴリを検索対象とする状態への対話シナリオの遷移と、対応する音声認識辞書への更なる更新と、ユーザへの音声案内と、を実行させるための制御を繰り返す。
ここで、好ましくは、前記対話制御部は、検索対象カテゴリを切り替える際、予め設定された判断基準に基づいて、一つのカテゴリを新たな検索対象として選択する。
また、好ましくは、前記対話制御部は、複数回の音声認識辞書の更新を経て音声認識が成功した場合、最初に誤認識を繰り返したカテゴリでの検索状態に処理を遷移させる。
あるいは、前記対話制御部は、複数回の音声認識辞書の更新を経て音声認識が成功した場合、直前に誤認識を繰り返したカテゴリでの検索状態に処理を遷移させる。
また、好ましくは、前記対話制御部は、全てのカテゴリについて音声認識が失敗した場合、YES/NO形式での音声認識に移行させる制御を行う。
例えば、前記対話制御部は、全てのカテゴリについて音声認識が失敗した場合、変更されてきたカテゴリの中に属する語彙について一つずつ音声出力を行って確認を求める対話処理を実行する。
本発明による音声対話システムにおいては、複数のカテゴリの各々から検索可能なデータベースを音声認識により検索する際に、誤認識を連続した場合に検索対象のカテゴリが自動的に変更され、異なる音声認識辞書で検索が行われるため、同じ音声の発生をユーザに何度も促すことがなく、デッドロックが回避される。
また、異なる音声認識辞書で検索を行い、その結果を用い、最初に誤認識を連続して行った際の音声認識辞書を絞り込むことで、誤認識を繰り返したときよりも語彙数の少なくなった音声認識辞書で検索を行うため、以前は誤認識を繰り返していた検索対象についても認識がしやすくなる。また、誤認識を繰り返した際に検索対象を自動的に変更させることができ、ユーザの負担が軽減される。さらに、全てのカテゴリについて認識することができない場合でも、YES/NO形式の二者択一で音声認識をさせることで、デッドロックを回避することができる。
以下、添付図面を参照して本発明の実施形態について説明する。図1は、本発明による音声対話システムのハードウェア構成の例を示すブロック図である。同図に示されるように、この音声対話システムは、音声対話により楽曲検索を行うものであり、音声合成部10、音声認識部12、データベース14、音声認識辞書記憶部16、音声認識辞書構築部18、対話シナリオ部20及び対話制御部22を備える。
そして、音声合成部10は、指定されたテキスト内容の合成音声信号をスピーカ11に出力する。また、音声認識部12は、音声認識辞書を参照してマイク13からの入力音声信号に対する認識処理を行い、音声認識結果を出力する。また、データベース14は、「アーティスト名(登録数10)」、「アルバム名(登録数20)」、「ジャンル名(登録数5)」及び「曲名(登録数300)」の4種の項目(カテゴリ)を持つ楽曲データベースであり、音声認識部12による音声認識結果に基づいて検索される。
音声認識辞書記憶部16は、音声認識部12において参照される音声認識辞書を記憶する。また、音声認識辞書構築部18は、データベース14を参照して音声認識辞書記憶部16に音声認識辞書を構築する。また、対話シナリオ部20は、音声対話のための対話シナリオを記憶及び管理する。さらに、対話制御部22は、対話シナリオ部20、音声合成部10及び音声認識部12を制御して音声対話を実行させ、音声対話の実行状態に基づいて、音声認識辞書を切り替える処理を音声認識辞書構築部18に実行させる。
図1に示される音声対話システムにおいて、データベース14は、4種のカテゴリ「アーティスト名」、「アルバム名」、「ジャンル名」及び「曲名」の各々に基づく検索が可能であり、対話制御部22は、検索対象カテゴリに対応する音声認識辞書を準備する制御を行う。更に、対話制御部22は、一つの検索対象カテゴリについての音声認識処理における連続した誤認識によるデッドロックを回避する制御を行う。具体的には、この音声対話システムは、音声対話により、楽曲検索を行う場合に、何度も連続して誤認識が起こった際に同じ単語の発声を促すのではなく、異なるカテゴリに属する単語をユーザに発声させることで、デッドロックを回避する。
図2及び図3は、図1に示される音声対話システムにおける音声入力処理の第一構成例を示すフローチャートである。一連の処理は、対話制御部22の制御の下で実行される。まず、音声対話システムは、音声認識辞書をあるカテゴリ(例えば「アーティスト名」)検索用に設定する。具体的には、音声認識辞書構築部18が、データベース14を参照し、例えば「アーティスト名」を検索するための音声認識辞書を音声認識辞書記憶部16に構築する。同時に、対話シナリオ部20が、同一カテゴリに係る検索において連続して誤認識した回数を記憶するための変数「No match」を0に初期化する(ステップ102)。
次いで、音声対話システムは、「・・・名をどうぞ。」(例えば「アーティスト名をどうぞ。」)との合成音声を出力する(ステップ104)。次いで、音声対話システムは、ユーザからの音声入力を受け付ける(ステップ106)。次いで、音声対話システムは、その音声入力に対する音声認識結果に基づいて「・・・(認識されたアーティスト名)ですね。」との合成音声を出力し、ユーザに確認を求める(ステップ108)。
これに対し、ユーザが、「はい」若しくは「いいえ」と音声を発するか又は操作ボタンを操作することにより応答するため、音声対話システムは、認識結果が正解であったか否かを判定する(ステップ110)。認識結果が正解であった場合には、音声対話システムは、音声入力処理を終了する。
一方、認識結果が誤っていた場合には、音声対話システムは、変数「No match」をインクリメントし(ステップ112)、インクリメント後の変数「No match」が、辞書が変更されるべきことを示す所定の定数「X」に達したか否かを判定する(ステップ114)。
変数「No match」が定数「X」に達していない場合には、音声対話システムは、「もう一度、・・・名をどうぞ。」(例えば「もう一度、アーティスト名をどうぞ。」)との合成音声を出力し(ステップ116)、ステップ106にループバックする。ステップ114において変数「No match」が定数「X」に達したと判定される場合、音声対話システムは、まず、変数「No match」を「0」に初期化する(ステップ118)。
次いで、音声対話システムは、音声認識辞書を異なるカテゴリ検索用のものに切り替えることで設定を変更する。具体的には、対話制御部22が、対話シナリオの状態を別の状態、即ち、別カテゴリによる検索の状態に遷移させるよう対話シナリオ部20に要求を出し、対話シナリオ部20に実現させる。同時に、対話制御部22は、音声認識辞書構築部18に音声対話シナリオの状態に合わせた辞書の作成を要求し、新しい辞書を作成させる。例えば、音声認識辞書が「アーティスト名」用のものから「アルバム名」用のものに切り替えられ、「アーティスト名」による検索の状態から「アルバム名」による検索の状態へと遷移する(ステップ120)。
別の状態に遷移させるための基準としては、例えば、遷移可能なカテゴリの中で最も上位階層にあるカテゴリによる検索状態へ遷移させることができる。あるいは、登録数(認識語彙数)の最も少ない辞書を作成させることが可能なカテゴリによる検索状態へ遷移させてもよい。さらに、音声対話システムが認識率を管理し又は推測することができる場合には、最も認識率の高い辞書の作成が期待されるカテゴリによる検索状態へ遷移させることも可能である。また、これら選択基準に対し、どれか一つを選択し事前に決定しておく方法や、選択基準に重み付けを行い全ての選択基準の合計スコアが最も高いカテゴリを選択する方法が考えられる。
次いで、音声対話システムにおける対話制御部22は、誤認識が発生し認識しづらい旨と検索対象のカテゴリが変更された旨とをユーザに伝える内容の合成音声信号を出力するように音声合成部10を制御する。すなわち、音声対話システムは、「申し訳ございません。アーティスト名が認識しづらいようです。先にアルバム名をどうぞ。」等と提案し、ユーザにアルバム名を発声させる(ステップ122)。
次いで、音声対話システムは、ユーザからの音声入力を受け付け(ステップ124)、それに対する音声認識結果に基づいて「・・・(認識されたアルバム名)ですね。」との合成音声を出力し、ユーザに確認を求める(ステップ126)。これに対し、ユーザが、「はい」若しくは「いいえ」と音声を発するか又は操作ボタンを操作することにより応答するため、音声対話システムは、認識結果が正解であったか否かを判定する(ステップ128)。
その認識結果が誤っていた場合には、音声対話システムは、変数「No match」をインクリメントし(ステップ130)、インクリメント後の変数「No match」が、辞書が変更されるべきことを示す所定の定数「X」に達したか否かを判定する(ステップ132)。変数「No match」が定数「X」に達していない場合には、音声対話システムは、「もう一度、・・・名をどうぞ。」(例えば「もう一度、アルバム名をどうぞ。」)との合成音声を出力し(ステップ134)、ステップ124にループバックする。
ステップ132において変数「No match」が定数「X」に達したと判定される場合には、音声対話システムは、ステップ118にループバックする。すなわち、対話制御部22は、差し替え後の辞書でも、音声認識が失敗した場合、さらに異なるカテゴリ用のものに辞書を更新させ、検索を行わせる。例えば、「アルバム名」についても音声認識が失敗した場合、システムは「申し訳ございません。アルバム名も認識しづらいようです。先にジャンル名をどうぞ。」等と提案し、ユーザに異なるカテゴリについて発声させる。この処理は、あるカテゴリについて正しく認識ができるか、又は全てのカテゴリについて誤認識が繰り返されるまで続く。
一方、ステップ128において認識結果が正解であったと判定された場合(即ち、差し替え後の音声認識辞書で音声認識が成功した場合)には、対話制御部22は、当該認識結果でデータベース14の検索対象を絞り込み、当該絞り込みを行った状態の音声認識辞書を作成して音声認識辞書を更新するよう音声認識辞書構築部18に要求するとともに、誤認識が発生した状態に対話シナリオを遷移させるよう対話シナリオ部20に要求する(ステップ136)。そして、変数「No match」を「0」に初期化し(ステップ138)、ステップ104にループバックする。
例えば、「アーティスト名」検索での音声認識に失敗し、次いで「アルバム名」検索での音声認識に成功した場合、「アーティスト名」検索の状態に戻るとともに、「アルバム名」検索の結果から、その「アルバム名」を有する「アーティスト名」に絞り込んだ辞書が構築される。かくして、辞書が絞り込まれ、最初の誤認識の際よりも、認識結果の候補が少ないため、正しく認識することができる可能性が高くなっており、デッドロックが回避されやすくなる。
また、この第一構成例では、複数回辞書を更新した後に音声認識が成功したとすると、最初に誤認識を繰り返したカテゴリを検索する状態に遷移する。例えば、「アーティスト名」検索での音声認識に失敗し、次いで「アルバム名」検索での音声認識にも失敗したが、更に次の「ジャンル名」検索での音声認識に成功した場合、「ジャンル名」検索の結果から、その「ジャンル名」を有する「アーティスト名」に絞り込んだ辞書が構築され、「アーティスト名」検索の状態に遷移する。
ところで、検索対象とすることができるカテゴリが無くなった場合には、これまでの変更されてきたカテゴリの中で最も上位階層のカテゴリに属する各語彙(単語)について「・・・でよいですか?」という質問を一つずつ繰り返すことにより、「はい」又は「いいえ」の回答を求める形式、即ちYES/NOの回答を求める形式で対話が進行する状態へ遷移させることができる。あるいは、これまでの変更されてきたカテゴリの中で最も語彙数の少ないカテゴリに属する各語彙について「・・・でよいですか?」という質問を一つずつ繰り返すようにしてもよいし、更には、最初に誤認識を繰り返したカテゴリに属する各語彙について「・・・でよいですか?」という質問を一つずつ繰り返すようにしてもよい。これにより確実にデッドロックを回避することができる。
図4及び図5は、図1に示される音声対話システムにおける音声入力処理の第二構成例を示すフローチャートである。まず、この第二構成例におけるステップ202、204、206、208、210、212、214及び216の処理内容は、前述の第一構成例におけるステップ102、104、106、108、110、112、114及び116の処理内容と同一である。
そして、ステップ214において、同一カテゴリにおいて連続して誤認識した回数を示す変数「No match」が、辞書が変更されるべきことを示す定数「X」に達したと判定される場合、音声対話システムは、変数「N Error」を「1」に設定する(ステップ218)。ここで、「N Error」は、音声認識辞書を変更した回数を記憶するための変数である。
次いで、ステップ220、222、224、226、228、230、232、234及び236の処理内容は、前述の第一構成例におけるステップ118、120、122、124、126、128、130、132及び134の処理内容と同一である。次いで、ステップ234において変数「No match」が定数「X」に達したと判定される場合には、音声対話システムは、変数「N Error」をインクリメントし(ステップ238)、ステップ220にループバックする。
また、ステップ230において認識結果が正解であったと判定された場合(即ち、差し替え後の音声認識辞書で音声認識が成功した場合)には、変数「N Error」をデクリメントする(ステップ240)。次いで、変数「N Error」が「0」に等しいか否かを判定する(ステップ242)。
ステップ242において変数「N Error」が「0」でないと判定される場合には、前回、誤認識が発生した検索状態に対話シナリオを遷移させるよう対話シナリオ部20に要求するとともに、今回の認識結果でデータベース14の検索対象を絞り込み、当該絞り込みを行った状態の音声認識辞書を作成するよう音声認識辞書構築部18に要求する(ステップ244)。そして、変数「No match」を「0」に初期化し(ステップ246)、ステップ226にループバックする。
一方、ステップ242において変数「N Error」が「0」であると判定される場合には、最初に誤認識が発生した検索状態に対話シナリオを遷移させるよう対話シナリオ部20に要求するとともに、これまでの全ての認識結果でデータベース14の検索対象を絞り込み、当該絞り込みを行った状態の音声認識辞書を作成するよう音声認識辞書構築部18に要求し(ステップ248)、ステップ204にループバックする。
このように、この第二構成例では、例えば、「アーティスト名」検索での音声認識に失敗し、次いで「アルバム名」検索での音声認識にも失敗したが、更に次の「ジャンル名」検索での音声認識に成功した場合、「ジャンル名」検索の結果から、その「ジャンル名」を有する「アルバム名」に絞り込んだ辞書が構築され、「アルバム名」検索の状態に遷移する。そして、二度目の「アルバム名」検索での音声認識に成功すると、「ジャンル名」検索の結果及び「アルバム名」検索の結果から、その「ジャンル名」及び「アルバム名」を有する「アーティスト名」に絞り込んだ辞書が構築され、「アーティスト名」検索の状態に遷移することとなる。
本発明による音声対話システムのハードウェア構成の例を示すブロック図である。 本発明による音声対話システムにおける音声入力処理の第一構成例を示すフローチャート(1/2)である。 本発明による音声対話システムにおける音声入力処理の第一構成例を示すフローチャート(2/2)である。 本発明による音声対話システムにおける音声入力処理の第二構成例を示すフローチャート(1/2)である。 本発明による音声対話システムにおける音声入力処理の第二構成例を示すフローチャート(2/2)である。
符号の説明
10 音声合成部
11 スピーカ
12 音声認識部
13 マイク
14 データベース
16 音声認識辞書記憶部
18 音声認識辞書構築部
20 対話シナリオ部
22 対話制御部

Claims (3)

  1. ユーザとの音声対話によりデータを検索する音声対話システムであって、
    (a)複数のカテゴリによりデータを検索することが可能なデータベースと、
    (b)前記データベースのカテゴリを参照して音声認識辞書を構築する音声認識辞書構築部と、
    (c)前記音声認識辞書を参照してユーザからの入力音声を音声認識し、音声認識結果を出力する音声認識部と、
    (d)合成音声を出力する音声合成部と、
    (e)前記データベース、前記音声認識辞書構築部、前記音声認識部、及び音声合成部を制御する対話制御部と、
    を備え、前記対話制御部は、
    (f)第1のカテゴリの音声認識辞書を音声認識辞書構築部に構築させることと、
    (g)音声認識処理として、
    (g1)該構築された音声認識辞書を参照して入力音声を音声認識部に認識させて音声認識結果を出力させることと、
    (g2)該出力された音声認識結果を合成音声として音声合成部に出力させることと、
    を含み、さらに、
    (h)音声認識結果の確認として、
    (h1)該合成音声により出力された音声認識結果がユーザによりが正解として確定された場合に音声対話を終了することと、
    (h2)ユーザにより音声認識結果が不正解として確定された場合は、再発声するようにユーザを促す合成音声を音声合成部から出力すると共に再度音声認識処理を行うことと、
    を含み、さらに、
    (i)不正解として確定された回数が一定回数を超えると、第2のカテゴリの音声認識辞書を音声認識辞書構築部に構築させ、音声認識で参照する音声辞書を該構築した辞書に変更し、上記音声認識処理を行うことと、
    (j)第2のカテゴリの音声認識辞書での音声認識結果の確認において正解が確定された場合においては第1のカテゴリの音声認識辞書のうち第2のカテゴリの音声認識で確定されたものに合致するもののみで音声認識辞書を音声認識辞書構築部に構築させ、音声認識で参照する音声辞書を該構築した辞書に変更し、上記音声認識処理を行うことと、
    を備える音声対話システム。
  2. 前記対話制御部は、全てのカテゴリについて音声認識が失敗した場合、YES/NO形式での音声認識に移行させる制御を行う、請求項に記載の音声対話システム。
  3. 前記対話制御部は、全てのカテゴリについて音声認識が失敗した場合、変更されてきたカテゴリの中に属する語彙について一つずつ音声出力を行って確認を求める対話処理を実行する、請求項に記載の音声対話システム。
JP2006034812A 2006-02-13 2006-02-13 音声対話システム Expired - Fee Related JP4832097B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006034812A JP4832097B2 (ja) 2006-02-13 2006-02-13 音声対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006034812A JP4832097B2 (ja) 2006-02-13 2006-02-13 音声対話システム

Publications (2)

Publication Number Publication Date
JP2007212919A JP2007212919A (ja) 2007-08-23
JP4832097B2 true JP4832097B2 (ja) 2011-12-07

Family

ID=38491390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006034812A Expired - Fee Related JP4832097B2 (ja) 2006-02-13 2006-02-13 音声対話システム

Country Status (1)

Country Link
JP (1) JP4832097B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014192959A1 (ja) 2013-05-31 2014-12-04 ヤマハ株式会社 音声合成を用いて発言に応答する技術
US10217452B2 (en) 2014-10-20 2019-02-26 Yamaha Corporation Speech synthesis device and method
US10224021B2 (en) 2014-07-02 2019-03-05 Yamaha Corporation Method, apparatus and program capable of outputting response perceivable to a user as natural-sounding

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160045353A (ko) 2014-10-17 2016-04-27 현대자동차주식회사 에이브이엔 장치, 차량, 및 에이브이엔 장치의 제어방법
JP6950919B2 (ja) 2017-02-10 2021-10-13 株式会社アナリティックウェア 対話装置、制御装置、対話システム、対話方法、制御方法、およびプログラム
KR102420280B1 (ko) * 2017-10-30 2022-07-13 엘지전자 주식회사 이동 단말기
JP6841535B1 (ja) * 2020-01-29 2021-03-10 株式会社インタラクティブソリューションズ 会話解析システム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2656234B2 (ja) * 1985-08-15 1997-09-24 株式会社東芝 会話音声理解方法
JPH06332493A (ja) * 1993-05-19 1994-12-02 Canon Inc 音声対話型情報検索装置及び方法
JP3501488B2 (ja) * 1993-12-29 2004-03-02 キヤノン株式会社 音声認識装置及び方法
JP3755941B2 (ja) * 1996-10-18 2006-03-15 松下電器産業株式会社 音声対話装置及び対話方法
JP3933813B2 (ja) * 1999-04-08 2007-06-20 三菱電機株式会社 音声対話装置
JP2002108386A (ja) * 2000-09-29 2002-04-10 Matsushita Electric Ind Co Ltd 音声認識方法および装置と車載ナビゲーション装置
JP3873953B2 (ja) * 2003-08-29 2007-01-31 株式会社デンソー 再生装置及びプログラム
JP2006039381A (ja) * 2004-07-29 2006-02-09 Nissan Motor Co Ltd 音声対話装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014192959A1 (ja) 2013-05-31 2014-12-04 ヤマハ株式会社 音声合成を用いて発言に応答する技術
US9685152B2 (en) 2013-05-31 2017-06-20 Yamaha Corporation Technology for responding to remarks using speech synthesis
US10490181B2 (en) 2013-05-31 2019-11-26 Yamaha Corporation Technology for responding to remarks using speech synthesis
US10224021B2 (en) 2014-07-02 2019-03-05 Yamaha Corporation Method, apparatus and program capable of outputting response perceivable to a user as natural-sounding
US10217452B2 (en) 2014-10-20 2019-02-26 Yamaha Corporation Speech synthesis device and method
US10789937B2 (en) 2014-10-20 2020-09-29 Yamaha Corporation Speech synthesis device and method

Also Published As

Publication number Publication date
JP2007212919A (ja) 2007-08-23

Similar Documents

Publication Publication Date Title
JP4832097B2 (ja) 音声対話システム
JP4542974B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
JP6203288B2 (ja) 音声を認識するシステムおよび方法
US7848926B2 (en) System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
JP4260788B2 (ja) 音声認識機器制御装置
JP5706384B2 (ja) 音声認識装置、音声認識システム、音声認識方法および音声認識プログラム
JP5200712B2 (ja) 音声認識装置、音声認識方法及びコンピュータプログラム
WO2015075975A1 (ja) 対話制御装置及び対話制御方法
US20080126093A1 (en) Method, Apparatus and Computer Program Product for Providing a Language Based Interactive Multimedia System
JP2002156995A (ja) 音声処理システム
JP2008203559A (ja) 対話装置及び方法
WO2012001458A1 (en) Voice-tag method and apparatus based on confidence score
US20170249935A1 (en) System and method for estimating the reliability of alternate speech recognition hypotheses in real time
JP2006267319A (ja) 音声書き起こし支援装置及びその方法ならびに修正箇所決定装置
US5706397A (en) Speech recognition system with multi-level pruning for acoustic matching
JP6690484B2 (ja) 音声認識用コンピュータプログラム、音声認識装置及び音声認識方法
JP4634156B2 (ja) 音声対話方法および音声対話装置
US8185393B2 (en) Human speech recognition apparatus and method
US11693622B1 (en) Context configurable keywords
EP1899955B1 (en) Speech dialog method and system
JP2010164918A (ja) 音声翻訳装置、および方法
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JP2000056795A (ja) 音声認識装置
JP3790038B2 (ja) サブワード型不特定話者音声認識装置
JP2008243076A (ja) 翻訳装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110920

R150 Certificate of patent or registration of utility model

Ref document number: 4832097

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140930

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees