JP3700266B2 - 音声対話制御方法および音声対話システム - Google Patents

音声対話制御方法および音声対話システム Download PDF

Info

Publication number
JP3700266B2
JP3700266B2 JP18906096A JP18906096A JP3700266B2 JP 3700266 B2 JP3700266 B2 JP 3700266B2 JP 18906096 A JP18906096 A JP 18906096A JP 18906096 A JP18906096 A JP 18906096A JP 3700266 B2 JP3700266 B2 JP 3700266B2
Authority
JP
Japan
Prior art keywords
dialogue
keyword
voice
control method
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP18906096A
Other languages
English (en)
Other versions
JPH1031497A (ja
Inventor
俊之 小高
ズハエル トラベルシ
明雄 天野
信夫 畑岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP18906096A priority Critical patent/JP3700266B2/ja
Publication of JPH1031497A publication Critical patent/JPH1031497A/ja
Application granted granted Critical
Publication of JP3700266B2 publication Critical patent/JP3700266B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、情報検索などを行なうために利用する計算機システムに係り、特に、マイクとスピーカあるいは電話などの音声入出力インタフェースを備え、誰でも容易に利用することができる音声対話システムに関するものである。
【0002】
【従来の技術】
音声対話システムでは一般に、利用者のシステムに対するデータ入力において音声認識の技術を用いている。音声によるデータ入力は、電話を通して使う場合、あるいは車の運転中などのいわゆるハンズアイビジーの状況下使う場合、非常に有効である。
【0003】
普通は複数の項目(例えば、電話番号検索のアプリケーションでは相手の所属と名前、チケットの予約のアプリケーションでは月日、時間、大人または子供、枚数等)に対してデータを入力する。しかし一方、音声認識において100%の認識率を実現することは不可能であり、利用者の入力に対して、入力項目毎にシステムの認識結果を確認することが必須である。例えば、文または文節単位の音声認識が可能な音声対話システムでの対話例は、
システム:「相手の所属と名前をどうぞ」
利用者 :「資材課の佐藤さん」
システム:「資材課の佐藤ですね」
利用者 :「はい」
となる。この例のように、文または文節単位の音声認識が可能なシステムで認識が正しく行われた場合は、入力時間も短く利用効率が良くなる。しかし、文または文節単位の認識の場合、複数のキーワード(ここでの例では相手の所属と名前)の組合せ分だけ認識対象の種類が多くなるばかりでなく、助詞も含めた表現のバラエティが多様になるという点で、単語認識に比較して認識性能が低くなる。さらに、認識を間違えた場合は、次のような問題も発生する。
【0004】
システム:「相手の所属と名前をどうぞ」
利用者 :「資材課の佐藤さん」
システム:「資材課の加藤ですね」
利用者 :「いいえ」
システム:「相手の所属と名前をどうぞ」
最初のシステムの質問に、所属と名前という2つのキーワードが含まれている。この場合、システム側でこのやりとりだけからでは、利用者が否定したことが所属と名前のどちらか片方だけを誤認識したことを意味するのか、あるいは両方誤認識したことを意味するのか、が特定できない。したがって、所属と名前の両方のキーワードが正しく認識されるまで、同じ質問を繰り返すことになる。この場合は、時間がかかるという問題がある。また別な対処方法として、利用者に誤認識された方だけ再入力してもらう方法も考えられる。この場合は、所属か名前かわからない発声を認識しなければならないので、音声認識の性能に対する要求が現状で対応可能なレベルより高くなるという問題がある上、そのように利用者の発声を誘導するにはどうすれば良いかという、解決が非常に困難な課題が生じる。
【0005】
これに対して、単語認識の場合は認識対象の表現のバラエティが抑えられ、現状レベルでもほぼ満足のいく認識性能が得られる。また、項目を1つずつ質問し、確認するために、確実に1項目ずつのデータ入力が行える。例えば、次のようになる。
【0006】
システム:「相手の所属をどうぞ」
利用者 :「資材課」
システム:「資材課ですか」
利用者 :「はい」
システム:「相手の名前をどうぞ」
利用者 :「佐藤」
システム:「佐藤ですか」
利用者 :「はい」
ただし、ここに示したようにやりとりが長くなり全体に時間がかかる傾向になるという大きな問題が残る。
【0007】
【発明が解決しようとする課題】
上記のような従来の音声対話システムにおいて、現状の音声認識性能と時間的な利用効率は相反するパラメータであった。
【0008】
本発明の目的は、現状で可能な音声認識性能の範囲で、最も効率良くデータ入力が行え、利用者とシステムとの間で円滑な対話を実現できる音声対話システムを提供することにある。
【0009】
【課題を解決するための手段】
本発明によれば、以下のような手段による対話制御方法および以下のような手段を設けた音声対話システムが提供される。
【0010】
タスク管理手段に要求を出しその返答結果に応じて、応答生成手段、認識語彙補足手段、キーワード判定手段、およびキーワード保持手段を制御し、また認識語彙補足手段を介して音声認識手段を、さらに応答生成手段を介して音声合成手段を制御し、システムと利用者の間の対話を進行させる対話制御手段の元で、
前記キーワード保持手段は、前記対話制御手段の要求に基づき、キーワードの保持、削除、最新のキーワードの通知を行い、
前記対話制御手段は、タスク管理手段に対話の進行上における次のアクションを促すガイダンス内容を要求して該ガイダンス内容を受け取り、また前記キーワード保持手段に最新のキーワードを要求して該最新のキーワードを受け取り、前記ガイダンス内容と前記最新のキーワード、およびそれらを用いて応答文を生成させる指示を応答生成手段へ通知し、前記応答生成手段は、前記対話制御手段から受け取った指示に従い、 対話の進行上における次のアクションを促すガイダンス文の中に、同時に受け取った前段階の認識結果でもある最新のキーワードを含めた応答文を生成し、音声合成手段へ出力し、
次に前記対話制御手段は、タスク管理手段に対話の進行上における次の認識語彙を要求して該認識語彙を受け取り、タスクに依存したキーワードからなる該認識語彙を認識語彙補足手段へ送り、
前記認識語彙補足手段は、前記対話制御手段より受け取った認識語彙に、「取消」「ヘルプ」「ストップ」「もう一度」「わからない」「任意」などのタスクから独立なコマンドを表す単語を補足して、音声認識手段およびキーワード判定手段に渡し、
前記キーワード判定手段は、前記認識語彙補足手段より得た補足後の認識語彙と前記音声認識手段より得た認識結果とを比較し、該認識結果が前記タスクから独立なコマンドか、タスクに依存したキーワードかを判定し、その判定結果を対話制御手段へ送り、
さらに次に前記対話制御手段は、前記キーワード判定手段の判定結果を元に、該判定結果がキーワードである場合は、それをキーワード保持手段に送ると共に該キーワードをタスク管理手段に送り、 前記判定結果がコマンドである場合は、各コマンドに対する処理を行う。
【0011】
【発明の実施の形態】
以下図を用いて本発明の実施例を説明する。
【0012】
図1は本発明による音声対話システムの一実施例を示すブロック図である。音声対話システムは、あるタスクを遂行することを目的として、利用者とシステムが音声を使ってやりとりをするようなシステムである。本発明による音声対話システムは、対話制御手段(5)の制御の元に動作する。対話制御手段(5)の動作については、後で詳述する。
【0013】
タスク管理手段(10)は、タスクに依存した処理を全て担当する。タスクに依存した情報(タスク遂行の手順、場面毎の入力待ち語彙、等)を管理したり、対話制御手段からのタスクの進行等についての問い合わせなどに返答したりする。
【0014】
音声認識手段(2)は、与えられた認識語彙の範囲内で、入力される音声(1)を認識し、認識結果を1つの単語あるいは複数の単語の列として出力する。音声認識手段(2)の実現方法としては様々な手法が考えられ、本発明はその方法を限定しない。例えば、HMM(HiddenMarkovModel)という確率モデルを用いる手法が扱いやすい。この方法を用いれば、任意の認識語彙をテキストとして与えるだけで、音声認識できる構成にすることができる。詳細は、“中川聖一:”確率モデルによる音声認識、電子情報通信学会、1988”他の文献に詳しいので、本明細書では省略する。
【0015】
認識語彙補足手段(3)は、対話制御手段(5)より受け取った認識語彙に、特にタスクから独立なコマンドを表す単語等を補足して、音声認識手段に渡す。ここで、コマンドとしては、 「違います」「違う」「いいえ」「取消」「キャンセル」などの否定あるいは取消を意味する単語、 「ヘルプ」などの助言要求を意味する単語、 「ストップ」「停止」「中止」などのシステムの処理の停止要求を意味する単語、「もう一度」
「リピート」などの直前のシステム応答の再出力要求を意味する単語、などがある。さらに、「わかりません」「わからない」などの不明を意味する単語、「問わない」「何でも良い」「任意」などの任意を意味する単語なども認識語彙補足手段(3)で補足され得る単語とする。図3に認識語彙の例を示しており、人名の認識語彙を例に取り、補足前(a)と補足後(b)の認識語彙を示している。
【0016】
キーワード判定手段(6)は、音声認識手段(2)より得られた認識結果がタスクから独立なコマンドか、タスクに依存したキーワードかを判定し、その結果を対話制御手段へ送る。ここで、判定結果は、例えば図4に示すように表現される。図4に示した例では、1つの判定結果が、2つの値の組み合わせで表現される。左側が判定結果の種類を表しており、「CMD」はコマンド、「KW」はキーワードを表す。 また、「CMD」と組み合わされている「CANCEL」、「HELP」はコマンドの種類を表している。さらに「KW」と組み合わされている“資材課”や“佐藤”は実データ値を示している。
【0017】
キーワード保持手段(6)は、対話制御手段の指示に従って、渡されたキーワードをスタック形式で保持したり、スタックに積まれているキーワードを対話制御手段に通知したりする。
【0018】
応答生成手段(7)は、対話制御手段(5)からの指示に従い、タスクを遂行するために必要な項目の内容(名前などの実データ値)を質問するような応答文を生成する。
【0019】
音声合成手段(8)は、応答生成手段(7)から得られる応答文を音声波形に変換してスピーカなどの電気信号から音波へ変換するデバイスにより空間中を伝播する音声(9)として出力する。
【0020】
図2は対話制御手段の処理フローを示す図である。簡単のために、本発明による音声対話システムでデータ入力のみが行われる場合のフローを示している。実際のタスクにおいては、利用者に対する結果のみの提示なども含まれることになる。
【0021】
次に、図2のフローに従って、電話接続サービスなどをタスクとして、所属名に‘資材課’、人名に‘佐藤’を入力する場合を仮定して処理手順を説明する。
【0022】
同タスク管理手段に対話の進行上における次のアクションを促すガイダンス内容を要求し、
まずサービスが開始された時点では、対話制御手段(5)は、 タスク管理手段(10)へ対話の進行上における次のアクションを促すガイダンス内容を要求する。この要求に対する返答は、 次のガイダンス内容が「所属の質問」である、として得られる。次に、対話制御手段(5)は、キーワード保持手段から最新のキーワードを受理しようとする。システム利用開始直後は、キーワード保持手段はからであり、その旨が対話制御手段へ通知される。次に、対話制御手段(5)は、次のガイダンス内容(「所属の質問」)と、あれば最新のキーワード(この段階では「なし」)を応答生成手段(7)に送り、応答文を生成するように指示する。応答生成手段(7)では、 ガイダンス内容が「所属の質問」であるので、例えば“所属をどうぞ”というような質問文を生成して、音声出力手段(8)に送る。続いて、対話制御手段(5)は、「所属」を音声認識するための認識語彙を、認識語彙補足手段(3)へ送る。ここでの認識語彙は、先の、次のアクションを促すガイダンス内容を要求した際に、タスク管理手段(10)より一緒に受け取ることとする。あるいは、この段階であらためて、タスク管理手段に問い合わせて、受理しても良い。この後、認識語彙補足手段(3)で補足された認識語彙は、音声認識手段(2)に送られる。そして、利用者の発声に対する音声認識手段(2)よる認識結果は、キーワード判定手段(4)を介してコマンドかキーワードかの判定が付加され、図4に示したような形式で対話制御手段(5)に戻される。今の仮定では、ここでの受理結果は「KW]+「資材課」である。すなわち、対話制御手段(5)はキーワードをキーワード保持手段(6)のスタックにキーワードをPOPし、さらに、タスク管理手段(10)に対してキーワードを通知する。この時点で、タスク管理手段(10)は、内部でタスクの進行状態が更新される。
【0023】
ここで、図2のフローの最初に戻り、対話制御手段(5)は、再びタスク管理手段(10)へ、対話の進行上における次のアクションを促すガイダンス内容を要求する。この要求に対する返答は、次のガイダンス内容が「名前の質問」であるである、として得られる。次に、対話制御手段(5)は、キーワード保持手段から最新のキーワードを問い合わせ、先ほどPOPされたばかりの「資材課」が得られる。そして、対話管理手段(5)は、次のガイダンス内容(「名前の質問」)と最新のキーワード(「資材課」)を応答生成手段(7)に送り、応答文を生成するように指示する。応答生成手段(7)では、 「資材課」を含めて、かつ、「名前」を問い合わせるような質問文、例えば“資材課で名前は何ですか”とか“資材課の誰ですか”というような質問文を生成して、音声出力手段(8)に送る。続いて、対話制御手段(5)は、「名前」を音声認識するための認識語彙を、認識語彙補足手段(3)へ送る。そしてまた、音声認識手段(2)による認識結果は、キーワード判定手段(4)を介してコマンドかキーワードかの判定が付加され、図4に示したような形式で対話制御手段(5)に戻される。今の仮定では、ここでの受理結果は「KW]+「佐藤」となる。以上の繰り返しで、基本的な対話が進行していく。
【0024】
次に、利用者の「資材課」の発声が誤認識されて、認識結果が「施設課」になったと仮定した場合の例を説明する。先の“資材課の誰ですか”の代わりに“施設課の誰ですか”というシステム出力になっているはずであり、それに対して、利用者は“違います”と答えたとする。キーワード判定手段(4)より受け取った結果が「KW」+「佐藤」でなく、「CMD」+「CANCEL」となる。この場合、対話制御手段(5)はキーワード保持手段(6)に対して、キーワードを1つ(今の場合「資材課」)POPするように指示する。さらに、タスク管理手段(10)に対して、POPされた「資材課」を取り消すように通知する。ここで、対話制御手段(5)の処理は図2のフローの最初に戻り、タスク管理手段(10)、キーワード保持手段(6)への問い合わせをし、次のアクションを促すガイダンス内容が「所属の質問」であり、最新のキーワードは「なし」であることを応答生成手段(7)に送り、応答生成手段(7)で再び、“所属をどうぞ”というような質問文が生成される。
【0025】
最後に、本発明による音声対話システムを利用した場合の、対話例を示す。タスクを電話の接続サービスとした場合の例である。
【0026】
システム:「相手の所属をどうぞ」
利用者 :「資材課」
システム:「資材課の誰ですか」
利用者 :「佐藤」
システム:「佐藤さんに電話をつなぎます」
次に、1番目の項目で誤認識した場合の対話例を示す。
【0027】
Figure 0003700266
次に、2番目以降の項目で誤認識した場合の対話例を示す。
【0028】
Figure 0003700266
図1において、利用者とシステムとの間のメディアとして、音声のみしか描いていないが、文字、画像、など他のメディアも含めた対話システムでも良い。また、ボタン入力を用意し、取消などをボタン入力するようにしても良い。遠隔地の電話機から利用している際には、取消などにタッチトーン信号を用いても良い。
【0029】
図1におけるタスク管理手段はタスクに特有の処理も含んでいる。例えば、遠隔地の電話機からシステムを利用する形態の場合、電話回線の制御などが考えられる。
上記の様に、本願では、タスク管理手段の管理している対話の進行上における次のアクションを促すガイダンス内容と、キーワード保持手段が保持している前段階の認識結果である最新のキーワードを用いて、 対話の進行上における次のアクションを促すガイダンス文の中に、前記最新のキーワードを含めた応答文を応答生成手段で生成し、出力させると共に、認識語彙補足手段において、タスク管理手段の管理している対話の進行上における次の場面での認識語彙に、タスクから独立なコマンドを表す単語を補足し、その補足後の認識語彙の範囲内で、音声認識手段において利用者の発話した音声を認識させ、キーワード判定手段において、その認識結果が前記タスクから独立なコマンドか、それ以外のタスクに依存したキーワードかを判定し、その判定結果がコマンドである場合は、各コマンドに対する処理を行い、さらに前記判定結果が前記キーワードである場合は、該判定結果であるキーワードを新たに最新のキーワードとしてキーワード保持手段へ保持させると同時に、さらに該判定結果であるキーワードをタスク管理手段へ通知する、以上を繰り返すことにより音声を進行させることを特徴とする音声対話制御方法を開示する。
更に前記コマンドについては、以下の実施例を開示する。少なくとも「違います」「違う」「いいえ」「取消」「キャンセル」などの否定あるいは取消を意味する単語を含み、 前記判定結果が該否定あるいは取消を意味する単語である場合に、前記キーワード保持手段に最新のキーワードを1つ削除するように指示し、同時に前記タスク管理手段に1つ前の要求項目の内容が取り消されたことを通知する。少なくとも「ヘルプ」などの助言要求を意味する単語を含み、 前記判定結果が該助言要求を意味する単語である場合に、応答生成手段において、使い方についてのメッセージ文を出力させる。少なくとも「ストップ」「停止」「中止」「中断」などのシステムの処理の停止要求を意味する単語を含み、前記判定結果が該停止要求を意味する単語である場合に、対話進行を停止する。少なくと も「もう一度」「リピート」などの直前のシステム応答の再出力要求を意味する単語を含み、前記判定結果が該再出力要求を意味する単語である場合に、応答生成手段が1つ以上の応答文を蓄積し後で参照できる手段を持ち、直前に出力した応答文の再出力させる。少なくとも「わかりません」「わからない」などの不明を意味する単語を含み、前記判定結果が該不明を意味する単語である場合に、前記タスク管理手段に1つ前の要求項目の内容が不明であることを通知し、同時に同タスク管理手段に対話の進行上における次のアクションを促すガイダンス内容を要求し、その返答内容に従って対話進行する。少なくとも「問わない」「何でも良い」「任意」などの任意を意味する単語を含み、前記判定結果が該任意を意味する単語である場合に、タスク管理手段に要求項目の内容が任意であることを通知し、同時に同タスク管理手段に対話の進行上における次のアクションを促すガイダンス内容を要求し、 その返答内容に従って対話進行する。
【0030】
【発明の効果】
本発明によれば、複数項目のデータ入力を音声で行う音声対話システムにおいて、音声認識を利用する際に必須の確認に関して、確認のみのシステム出力を省略し、認識結果を次のガイダンス文に含めて提示することでやりとりの数を減少させることにより、 単語音声認識程度の音声認識能力しか持たない音声対話システムでも、利用者とシステムとの間で効率良く音声対話が進行できる効果が得られる。
【図面の簡単な説明】
【図1】本発明による音声対話システムの構成の一実施例を示すブロック図である。
【図2】対話制御手段の処理手順を示すフローチャートである。
【図3】認識語彙の一例を示す図である。
【図4】キーワード判定手段から対話制御手段に渡されるデータ構造の一例を示す図である。
【図5】キーワード保持手段に保持されるデータの一例を示す図である。
【符号の説明】
1…利用者の音声、2…音声認識手段、3…認識語彙補足手段、
4…キーワード判定手段、5…対話制御手段、6…キーワード保持手段、
7…応答生成手段、8…音声出力手段、9…システムの出力音声、
10…タスク管理手段。

Claims (6)

  1. タスク管理手段の管理している対話の進行上における次のアクションを促すガイダンス内容と、キーワード保持手段が保持している前段階の認識結果である最新のキーワードを用いて、対話の進行上における次のアクションを促すガイダンス文の中に、前記最新のキーワードを含めた応答文を応答生成手段で生成し、出力させると共に、
    認識語彙補足手段において、タスク管理手段の管理している対話の進行上における次の場面での認識語彙に、タスクから独立なコマンドを表す単語を補足し、その補足後の認識語彙の範囲内で、音声認識手段において利用者の発話した音声を認識させ、
    キーワード判定手段において、その認識結果が前記タスクから独立なコマンドか、それ以外のタスクに依存したキーワードかを判定し、
    その判定結果がコマンドである場合は、各コマンドに対する処理を行い、
    さらに前記判定結果が前記キーワードである場合は、該判定結果であるキーワードを新たに最新のキーワードとしてキーワード保持手段へ保持させるとともに該判定結果であるキーワードをタスク管理手段へ通知する、
    以上を繰り返すことにより音声を進行させ
    前記コマンドは、少なくとも「問わない」「何でも良い」「任意」などの任意を意味する単語を含み、前記判定結果が該任意を意味する単語である場合に、上記タスク管理手段に要求項目の内容が任意であることを通知するとともに同タスク管理手段に対話の進行上における次のアクションを促すガイダンス内容を要求し、その返答内容に従って対話進行することを特徴とする音声対話制御方法。
  2. 前記請求項1記載の音声対話制御方法において、前記コマンドは、少なくとも「違います」「違う」「いいえ」「取消」「キャンセル」などの否定あるいは取消を意味する単語を含み、 前記判定結果が該否定あるいは取消を意味する単語である場合に、前記キーワード保持手段に最新のキーワードを1つ削除するように指示し、同時に前記タスク管理手段に1つ前の要求項目の内容が取り消されたことを通知することを特徴とする音声対話制御方法。
  3. 前記請求項1記載の音声対話制御方法において、前記コマンドは、少なくとも「ヘルプ」などの助言要求を意味する単語を含み、 前記判定結果が該助言要求を意味する単語である場合に、応答生成手段において、使い方についてのメッセージ文を出力させることを特徴とする音声対話制御方法。
  4. 前記請求項1記載の音声対話制御方法において、前記コマンドは、少なくとも「ストップ」「停止」「中止」「中断」などのシステムの処理の停止要求を意味する単語を含み、前記判定結果が該停止要求を意味する単語である場合に、対話進行を停止することを特徴とする音声対話制御方法。
  5. 前記請求項1記載の音声対話制御方法において、 前記応答生成手段は1つ以上の応答文を蓄積し、後で参照できる手段を持ち、前記コマンドは、少なくとも「もう一度」「リピート」などの直前のシステム応答の再出力要求を意味する単語を含み、前記判定結果が該再出力要求を意味する単語である場合に、応答生成手段において直前に出力した応答文の再出力させることを特徴とする音声対話制御方法。
  6. 前記請求項1記載の音声対話制御方法において、前記コマンドは、少なくとも「わかりません」「わからない」などの不明を意味する単語を含み、前記判定結果が該不明を意味する単語である場合に、前記タスク管理手段に1つ前の要求項目の内容が不明であることを通知するとともに同タスク管理手段に対話の進行上における次のアクションを促すガイダンス内容を要求し、その返答内容に従って対話進行することを特徴とする音声対話制御方法。
JP18906096A 1996-07-18 1996-07-18 音声対話制御方法および音声対話システム Expired - Fee Related JP3700266B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18906096A JP3700266B2 (ja) 1996-07-18 1996-07-18 音声対話制御方法および音声対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18906096A JP3700266B2 (ja) 1996-07-18 1996-07-18 音声対話制御方法および音声対話システム

Publications (2)

Publication Number Publication Date
JPH1031497A JPH1031497A (ja) 1998-02-03
JP3700266B2 true JP3700266B2 (ja) 2005-09-28

Family

ID=16234630

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18906096A Expired - Fee Related JP3700266B2 (ja) 1996-07-18 1996-07-18 音声対話制御方法および音声対話システム

Country Status (1)

Country Link
JP (1) JP3700266B2 (ja)

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3505982B2 (ja) * 1997-10-24 2004-03-15 日産自動車株式会社 音声対話装置
JP2000020089A (ja) * 1998-07-07 2000-01-21 Matsushita Electric Ind Co Ltd 音声認識方法及びその装置、並びに音声制御システム
JP3178426B2 (ja) 1998-07-29 2001-06-18 日本電気株式会社 自然言語対話システム及び自然言語対話プログラム記録媒体
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP2002073080A (ja) * 2000-09-01 2002-03-12 Fujitsu Ten Ltd 音声対話システム
JP3576511B2 (ja) * 2001-09-19 2004-10-13 松下電器産業株式会社 音声対話装置
JP4705398B2 (ja) * 2005-03-31 2011-06-22 クラリオン株式会社 音声案内装置、音声案内装置の制御方法及び制御プログラム
JP4589843B2 (ja) * 2005-08-10 2010-12-01 日本電信電話株式会社 対話方法、対話装置、対話プログラムおよび記録媒体
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
JP6540414B2 (ja) * 2015-09-17 2019-07-10 本田技研工業株式会社 音声処理装置および音声処理方法
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback

Also Published As

Publication number Publication date
JPH1031497A (ja) 1998-02-03

Similar Documents

Publication Publication Date Title
JP3700266B2 (ja) 音声対話制御方法および音声対話システム
JP3454897B2 (ja) 音声対話システム
WO2021160191A1 (zh) 一种实现人机协同的语音通讯系统及方法
KR102097621B1 (ko) 이미지 및/또는 다른 센서 데이터 기반의 자동화 어시스턴트 요청 해석
US9088652B2 (en) System and method for speech-enabled call routing
US9292488B2 (en) Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US7184539B2 (en) Automated call center transcription services
CN107564510A (zh) 一种语音虚拟角色管理方法、装置、服务器和存储介质
US6724864B1 (en) Active prompts
US20110172989A1 (en) Intelligent and parsimonious message engine
CN103714813A (zh) 短语辨认系统和方法
JP2001005488A (ja) 音声対話システム
JP2007529831A (ja) 音声対話型メッセージング方法及び装置
US20060069563A1 (en) Constrained mixed-initiative in a voice-activated command system
Boyce Natural spoken dialogue systems for telephony applications
JPH06100959B2 (ja) 音声対話装置
US20060025996A1 (en) Method and apparatus to improve name confirmation in voice-dialing systems
EP3444810A1 (en) Spoken dialogue management
JP2001134285A (ja) 音声認識装置
JP4304959B2 (ja) 音声対話制御方法、音声対話制御装置および音声対話制御プログラム
AU2020447125B2 (en) Hot-word free pre-emption of automated assistant response presentation
JP2019138989A (ja) 情報処理装置、情報処理方法、及びプログラム
JP7058305B2 (ja) 情報処理装置、音声出力方法、音声出力プログラム
CN110125946B (zh) 自动通话方法、装置、电子设备及计算机可读介质
JP6761007B2 (ja) 情報処理装置、音声出力方法、音声出力プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040316

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050621

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050704

LAPS Cancellation because of no payment of annual fees