JP3662780B2 - 自然言語を用いた対話システム - Google Patents

自然言語を用いた対話システム Download PDF

Info

Publication number
JP3662780B2
JP3662780B2 JP20253899A JP20253899A JP3662780B2 JP 3662780 B2 JP3662780 B2 JP 3662780B2 JP 20253899 A JP20253899 A JP 20253899A JP 20253899 A JP20253899 A JP 20253899A JP 3662780 B2 JP3662780 B2 JP 3662780B2
Authority
JP
Japan
Prior art keywords
task
response sentence
natural language
input
command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20253899A
Other languages
English (en)
Other versions
JP2001034289A (ja
Inventor
誠也 長田
伸一 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP20253899A priority Critical patent/JP3662780B2/ja
Publication of JP2001034289A publication Critical patent/JP2001034289A/ja
Application granted granted Critical
Publication of JP3662780B2 publication Critical patent/JP3662780B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、自然言語を用いた対話システムに関し、特に、ユーザの曖昧な発話を解釈しユーザへの応答を行なうシステム及び装置に関する。
【0002】
【従来の技術】
タスクに対するユーザの発話は一般的には曖昧なものであり、曖昧な発話を解釈する従来のシステムとして以下のようなものがあげられる。
【0003】
第1のシステムは、曖昧な発話に対してシステムが確認の応答を行い、それに対してユーザに肯定か否定かを答えさせることでユーザの発話を解釈するものである。例えば特開平9-171394号公報には、システムがユーザの曖昧な発話から生成できるタスクを列挙し、列挙したタスクの中から1つずつユーザの意図に合うかどうか質問し、ユーザが肯定を意味する語を入力すると、システムはそのタスクが正しい解釈であると決定する。
【0004】
第2のシステムは、ユーザの曖昧な発話をシステムはさまざまな手がかりを用いて一意に解釈して、確認なしにタスクを実行するものである。
【0005】
【発明が解決しようとする課題】
しかしながら、上記した従来のシステムは下記記載の問題点を有している。
【0006】
上記第1のシステムの問題点は、ユーザが曖昧な発話するたびにシステムが確認の応答文を出力することから、ユーザはそのたびに応答文に答えなくてはならず、煩雑であり、負担がかかる、ということである。
【0007】
一方、上記第2のシステムの問題点は、ユーザの曖昧性のある発話を一意に解釈して必ず実行してしまうと、システムの解釈が間違っていた時にユーザはシステムが行ってしまったタスクに対して修正を行わなくてはならず、結果としてユーザに負担がかかる、ということである。
【0008】
したがって、本発明は、上記問題点に鑑みてなされたものであって、その目的は、ユーザが発話した後、ユーザにできるだけ負荷のかけることなく、タスクの実行と応答文の出力を行なうシステム及び装置を提供することにある。これ以外の本発明の目的、特徴、利点等は以下の説明から、当業者には直ちに明らかとされるであろう。
【0009】
【課題を解決するための手段】
前記目的を達成する本発明は、入力手段から入力された自然言語を受け取り、語彙辞書を参照して1又は複数のタスクコマンドに変換する自然言語解析手段と、曖昧性解消情報を参照して、複数のタスクコマンドを1つに絞り込むとともに、絞り込みの仕方から、確信度を求める曖昧性解消手段と、絞り込んだタスクコマンドと求められた確信度と語彙辞書を参照して確信度に応じた応答文を生成し、出力手段に出力する応答文生成手段とを備える。より詳細には、本発明は、入力された自然言語を解釈するために必要な語彙と、該自然言語の解釈結果から応答文を生成するために必要な語彙を予め記憶する辞書記憶部と、前記辞書記憶部を参照して、入力された自然言語の解釈を行う自然言語解析手段と、前記自然言語解析手段で求められた解釈結果が複数存在した時に、1つの解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部と、前記自然言語解析手段で求められた解釈結果が複数存在した時に、前記曖昧性解消情報記憶部を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消手段と、前記曖昧性解消手段で絞り込んだ解釈結果を応答文として出力し、その際、前記曖昧性解消手段で求められた前記確信度に応じて応答文を変化させる応答文生成手段と、を備える。
【0010】
本発明は、前記曖昧性解消手段で求められた解釈を受けて、該解釈をタスクコマンドに変換し、前記タスクコマンドからタスクを実行するタスク実行手段をさらに備える。
【0011】
本発明においては、前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、前記タスク実行手段でタスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、前記タスク実行手段でタスクを実行する前にタスクを実行してとよいか否かを確認するための応答文を生成するか、を決定する。
【0012】
本発明においては、実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部と、キャンセルの意味を表す入力があったときに、前記タスク実行手段でキャンセルコマンドを実行するとともに、
前記応答文生成手段において、キャンセルコマンドを実行したことを報告する応答文を生成する。
【0013】
本発明においては、システムがタスクコマンドを実行してようかどうかの確認をとる応答文を出力した後、時間の経過を測定する時間管理手段を備え、前記時間管理手段で計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない時には、肯定を表す入力が前記入力装置に入力されたものと解釈する。
【0014】
【発明の実施の形態】
本発明の好ましい実施の形態について以下に説明する。本発明の自然言語を用いた対話システムは、入力された自然言語を解釈する自然言語解析手段(図1の21)と、解釈結果が複数存在する時に解釈を1つに絞り込むとともに、その絞り込み方を用いて、確信度を求める曖昧性解消手段(図1の22)と、1つに絞り込まれたタスクコマンドから確信度に応じた応答文を生成する応答文生成手段(図1の23)と、を有する。
【0015】
本発明においては、ユーザの曖昧な発話を確信度というパラメータに変換し、確信度に応じた応答文を生成することにより、自然な対話を行うことができる。
【0016】
本発明はその好ましい第1の実施の形態において、図1を参照すると、入力手段(1)から入力された自然言語に対して辞書記憶部(31)を参照して解釈を行う自然言語解析手段(21)と、自然言語解析手段(21)で求められた解釈結果が複数存在した時に、自然言語解析手段(21)で求められた解釈結果が複数存在した時に、解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部(32)の情報を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消手段(22)と、曖昧性解消手段(22)で絞り込んだ解釈結果を応答文として出力手段(4)から出力し、その際、前記曖昧性解消手段で求められた前記確信度に応じて応答文を変化させる応答文生成手段(23)と、を備える。
【0017】
自然言語解析手段(21)で求められた複数の解釈として複数の処理要求(タスクコマンド)がある場合、曖昧性解消手段(22)は、曖昧性解消情報記憶部(32)に記憶された情報(例えば処理対象の物理的な条件、入力された自然言語の文脈、ユーザの操作履歴等)に基づき、複数の処理要求のうち妥当な処理要求を一つ選択するとともに確信度を設定する。その際、自然言語解析手段(21)で求められた解釈が一つの場合、曖昧性がないため、確信度最大とする。
【0018】
本発明は、その好ましい第2の実施の形態において、図3を参照すると、曖昧性解消手段(22)で求められた解釈を受けて、該解釈をタスクコマンドに変換し、前記タスクコマンドからタスクを実行するタスク実行手段(24)をさらに備える。
【0019】
応答文生成手段(23)は、前記曖昧性解消手段(22)で求められた確信度に応じて、前記タスク実行手段(24)でタスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、タスク実行手段(24)でタスクを実行する前にタスクを実行してよいか否かを確認するための応答文を生成するかを決定する。
【0020】
すなわち、自然言語解析手段(21)では、入力された自然言語を解釈し、該入力された自然言語から解釈可能な処理要求(タスクコマンド)が複数ある場合、前記曖昧性解消手段(22)で複数のタスクコマンドを一つに絞り込み、該一つの絞り込まれた確信度が小の場合、タスクコマンドを直ちに実行せずに、未実行タスクコマンド記憶部(33)に一旦記憶しておき、タスクを実行する前にタスクを実行してよいか否かを確認するための応答文を出力する。該応答文に対してユーザが肯定を意味する入力を行なった場合、未実行タスクコマンド記憶部(33)からタスクコマンドを取り出して、タスク実行手段でタスクコマンドを実行し、タスク実行完了の応答文を出力し、一方否定入力の場合、未実行タスク取り消しの応答文を作成して出力する。
【0021】
応答文生成手段(23)が、曖昧性解消手段(22)で求められた確信度に応じて、応答文を生成するかしないかを決定するようにしてもよい。
【0022】
応答文生成手段(23)は、曖昧性解消手段(22)で求められた確信度に応じて、曖昧性解消手段(22)が解釈した結果を、報告、確認、質問のうちのいずれかを表す応答文に変更する。
【0023】
本発明は、その好ましい第3の実施の形態において、図5を参照すると、タスク実行手段で実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部(34)を備え、ユーザからキャンセルの意味を表す入力があったときに、タスク実行手段でキャンセルコマンドを実行するとともに、応答文生成手段(22)では、キャンセルコマンドを実行したことを報告する応答文を生成する。
【0024】
本発明は、その好ましい第4の実施の形態において、図7を参照すると、絞り込まれたタスクコマンドの確信度が低いときに、応答文生成手段(22)では、タスクコマンドを実行していいかどうかの確認をとる応答文を出力し、該応答文を出力した後、時間の経過を測定するタイマ等の時間管理手段(35)を備え、計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない時には、肯定を表す入力が入力手段(1)に入力されたものと解釈する。
【0025】
時間管理手段(35)によって前記所定の時間が経過した後に、肯定を表す入力が入力手段(1)に入力されたか否かを、曖昧性解消手段(22)で求めた確信度に応じて決定するようにしてもよい。
【0026】
本発明の実施の形態において、自然言語解析手段、曖昧性解消手段、応答文生成手段、及びタスク実行手段はコンピュータ等データ処理装置上で実行されるプログラムにより各々の処理・機能が実現される。この場合、該プログラムを記録した記録媒体又は通信媒体より該プログラムをデータ処理装置に読み出して実行することにより本発明を実施することができる。
【0027】
【実施例】
本発明の実施例について図面を参照して以下に説明する。
【0028】
本発明の第1の実施例について説明する。図1は、本発明の第1の実施例の構成を示す図である。図1を参照すると、本発明の第1の実施例は、キーボードや音声認識装置等の入力装置1と、プログラム制御により動作するデータ処理装置2と、情報を記憶する記憶装置3と、ディスプレイ装置や音声合成装置等の出力装置4とを含む。
【0029】
記憶装置3は、辞書記憶部31と、曖昧性解消情報記憶部32とを備えている。辞書記憶部31には、タスクを実行するためにユーザが使う語彙、及び、ユーザへの応答文を生成するために使う語彙があらかじめ記憶されている。
【0030】
曖昧性解消情報記憶部32には、タスクがどのような構成になっているのか、タスク先の現在の状態、ユーザが発話した文脈等、ユーザの発話の曖昧性を解消するために必要な情報が記憶されている。
【0031】
データ処理装置2は、自然言語解析手段21と、曖昧性解消手段22と、応答文生成手段23と、を備えている。
【0032】
自然言語解析手段21は、入力装置1で得た入力文字列を辞書記憶部31に記憶された語彙を用いて解釈する。
【0033】
曖昧性解消手段22は、自然言語解析手段21で複数の解釈結果が得られた時に、曖昧性解消情報記憶部32の情報を参照して、解釈を1つに絞る。
【0034】
また、解釈の絞り方に応じてシステムが曖昧性を解消した結果の確信度も求める。
【0035】
確信度は、どの手段を用いて曖昧性が解消されたか、また曖昧性解消情報記憶部に記憶されているどの情報を用いて曖昧性が解消されたかを用いて、求められる。
【0036】
以下、タスクとして、家庭内の機器操作を例に挙げて、確信度の定義の一例について説明する。
【0037】
(1).自然言語解析手段21で解釈が1つに絞られていた時は確信度最大とする。
【0038】
(2).タスクを実行の可否によって解釈を1つに絞った時、例えば「つけて」という入力に対して、
・「テレビをつける」というタスクと、
・「ビデオをつける」というタスクと、
・「明かりをつける」というタスクと、
の3つ解釈が自然言語解析手段21で行われたときに、例えば、曖昧性解消情報記憶部32の情報から、テレビと明かりの電源はすでについており(電源オンとされており)、ビデオの電源はついていない場合、「ビデオをつける」という解釈に、曖昧性解消手段22で解釈を1つに絞った時には、確信度大とする。
【0039】
(3).文脈によって解釈を1つに絞った時、例えば「1チャンネルにして」という入力に対して、自然言語解析手段21で、
・「テレビのチャンネルを1にする」というタスクと、
・「ビデオのチャンネルを1にする」というタスクと、
の二つの解釈ができたときに、前回の入力が「テレビをつけて」であったため、「テレビ」が話題になっているものと判断して、「テレビのチャンネルを1にする」と曖昧性解消手段22で1に絞った時には「確信度中」とする。
【0040】
(4).ユーザの操作の頻度によって解釈を1つに絞った時、
例えば「つけて」という入力に対して、自然言語解析手段21で、
・「テレビをつける」というタスク、
・「ビデオをつける」というタスク、
・「明かりをつける」というタスク
の三つに解釈できた時に、今までの過去の履歴を見ると、「明かりをつける」ことが多いので、「明かりをつける」という解釈に、曖昧性解消手段22で1つに絞った時には、「確信度小」とする。
【0041】
(5).曖昧性を解消する手がかりが何もないため、自然言語解析手段21で見つけた順番を用いて曖昧性解消手段22で解釈を1つに絞った時には、「確信度最小」とする。
【0042】
応答文生成手段23は、曖昧性解消手段22で1つに絞った解釈と、その確信度、さらに辞書記憶部3を使って、ユーザにできるだけ負担にならないような応答文を生成する。
【0043】
例えば、確信度が高い時には、タスクを実行してしまい、実行した結果を伝える応答文を生成する。
【0044】
一方、確信度が低い時には、タスクを実行せずに、実行していいかどうかの応答文を生成する。
【0045】
図2は、本発明の一実施例の処理手順を示す流れ図である。図1及び図2を参照して、本発明の一実施例の動作について詳細に説明する。
【0046】
入力装置1で得た入力文字列は、自然言語解析手段21に供給される(図2のステップ101)。
【0047】
自然言語解析手段21は、辞書記憶部31に記憶されている語彙を参照して、この入力文字列を解釈する(図2のステップ102)。
【0048】
曖昧性解消手段22は、曖昧性解消情報記憶部32に記憶されている情報を参照して、解釈が複数存在している時に解釈を1つに絞り込む(図2のステップ103)。
【0049】
また、どのように解釈を1つに絞ったかを用いてシステムが曖昧性を解消した結果の確信度を求める(図2のステップ104)。
【0050】
応答文生成手段23は、辞書記憶部31に記憶されている語彙を参照して、確信度の大きさに応じて異なった応答文を生成し、出力装置4に出力する(図2のステップ105)。
【0051】
本発明の第1の実施例について具体例に即して以下に説明する。
【0052】
入力装置1として、マイクを備え、該マイクから入力された信号をディジタル信号に変換して音声認識を行ない認識結果をテキストコードとして出力する音声認識システムからなるものとする。データ処理装置2はパーソナル・コンピュータよりなり、磁気ディスク記憶装置等よりなる記憶装置3を備える。また出力装置4は、スピーカを備えた音声合成システムよりなり、応答文生成手段23から出力されたテキスト情報を音声合成して音声出力する。
【0053】
データ処理装置2(パーソナル・コンピュータ)は、自然言語解析手段21、曖昧性解消手段22、応答文生成手段23を備え、これらの各手段は、CPU(中央演算装置)で実行されるプログラムによりその処理・機能が実現される。すなわち、該プログラムを記録した記録媒体、もしくは通信媒体から該プログラムを読み出してデータ処理装置2で実行することにより、本発明を実施することができる。記憶装置3には、辞書31及び曖昧性解消情報記憶部32を備える。
【0054】
以下は本発明を適用したシステムとして、テレビとビデオの電源等の制御を行なう構成を例に説明する。なお、記憶装置1の曖昧性解消情報記憶部32には、テレビ及びビデオの各機器の電源のオン・オフ状態が記憶管理されるものとする。
【0055】
ユーザが、テレビとビデオがある家の中で、テレビを操作するために、「電源つけて」と、入力装置1のマイクに向かって話したとする。
【0056】
入力装置1をなす音声認識システムは、「電源つけて」と音声認識して、テキスト文字に変換する。
【0057】
このテキスト文字と、辞書記憶部31を参照して自然言語解析手段31は、「テレビの電源をつける」と「ビデオの電源をつける」という複数の解釈結果を出力する。
【0058】
曖昧性解消手段32は、曖昧性解消情報として、テレビ及びビデオの各機器の現在状態を見ると、「テレビの電源はオフ」、「ビデオの電源はオン」であることから、「テレビの電源をつける」という解釈(タスク)に絞り込む。
【0059】
また機器の現在状態から、曖昧性を解消することができたことから、確信度での最大〜最小の5段階評価のうち「確信度大」であるとする。
【0060】
応答文生成手段23では、確信度大と「テレビの電源をつける」という解釈結果と辞書記憶部31を参照して、「テレビの電源をつけます」という応答文を生成し、出力装置4をなす音声合成システムでスピーカに出力する。
【0061】
次に本発明の第2の実施例について図面を参照して詳細に説明する。
【0062】
図3は、本発明の第2の実施例の構成を示す図である。図3において、図1と同等の要素には同一の参照符号が付されている。図3を参照すると、本発明の第2の実施例は、図1を参照して説明した前記第1の実施例に対して、タスク実行手段24がデータ処理装置2に追加されており、未実行タスクコマンド記憶部33が記憶装置3にさらに付加されて構成されている。
【0063】
タスク実行手段24は、曖昧性解消手段22で生成された解釈を、応答文生成手段23で実行すべきタスクであるか否かを判断し、実行すべきタスクであると判断された時に、タスクを実行する。
【0064】
未実行タスクコマンド記憶部33は、応答文生成手段23で応答文を生成した中で、確信度が低く、応答文が質問型「〜しますか」などになったときに、そのタスクコマンドを記憶している。
【0065】
図4は、本発明の第2の実施例の動作を説明するための流れ図である。図3及び図4を参照して、本発明の第2の実施例の動作について説明する。入力装置1で得た入力文字列は自然言語解析手段21に供給され(図4のステップ201)、自然言語解析手段21は、辞書記憶部31に記憶されている語彙を参照して、この入力文字列を解釈し、解釈可能な複数のタスクコマンドに変換し(図4のステップ202)、曖昧性解消手段22は、曖昧性解消情報記憶部32に記憶されている情報を参照して、タスクコマンドが複数存在している時に1つに絞り込み(図4のステップ203)、また、どのようにタスクコマンドを1つに絞ったかを用いてシステムが曖昧性を解消した結果の確信度を求める(図4のステップ204)。
【0066】
前記第1の実施例では、確信度の大きさにかかわらず、応答文生成手段23で応答文を生成し、出力装置4で出力していた。
【0067】
本発明の第2の実施例では、曖昧性解析手段22で求められた確信度に応じて、システムがタスクコマンドを実行してよいかどうか判断する(図4のステップ205)。
【0068】
ステップ205で、確信度が低く、タスクコマンドを実行してはいけないと判断したときには、未実行タスクコマンド記憶部33に、タスクコマンドが記憶される(図4のステップ208)。
【0069】
そして、タスクコマンドを実行してよいかどうかを表す「〜していいですか?」というような応答文を応答文生成手段23で生成する(図4のステップ209)。
【0070】
該応答文に対する、ユーザからの返答入力を入力装置1を介してを得ると(ステップ201)、自然言語解析手段21は、入力の自然言語と未実行タスクコマンド記憶部33で記憶されている未実行タスクコマンドを参照して、解釈可能な複数のタスクコマンドに変換する(図4のステップ202)。
【0071】
図4のステップ203では、複数のタスクコマンドの絞り込みを行ない、ステップ204では、絞り込まれたタスクコマンドの確信度を求め、確信度によりタスクコマンドを実行してよいかどうかを判断する。
【0072】
「〜していいですか?」のような応答に対して、図4のステップ204で求めた確信度が高いときには、入力が「はい」のような肯定を意味する入力か、「いいえ」のような否定を意味する入力かどうかを判断する(図4のステップ206)。
【0073】
ユーザから入力が、肯定を意味するものである時には、応答文生成手段23はタスク実行手段24にタスクコマンドを送り、タスク実行手段24でタスクを実行する。
【0074】
また応答文生成手段23は、タスクの実行完了を表す「〜しました。」のような応答文を生成する(図4のステップ207)。
【0075】
また、否定を意味する入力の時には、タスクコマンドを破棄し、未実行タスクの取り消しを表す「〜を取り消します」のような応答文を生成する(図4のステップ210)。
【0076】
本発明の第2の実施例について具体例に即して説明する。以下の例でも、前記第1の実施例と同様にテレビとビデオがある家の中での状況を想定して説明する。
【0077】
今、ユーザがテレビの電源をつけるために、「テレビ」とマイクに向かって話したとする。
【0078】
入力装置1をなす音声認識システムは、「テレビ」と音声認識し、テキスト文字に変換する。
【0079】
このテキスト文字と辞書記憶部31とを参照して、自然言語解析手段21は、
・「テレビの電源をつける」、
・「テレビのチャンネルを1にする」、
・「テレビのチャンネルを2にする」、…
といった複数のタスクコマンドに変換する。
【0080】
曖昧性解消手段22は、曖昧性解消情報記憶部32からテレビの現在状況を見て、入力された「テレビ」に対するタスクとしては、「テレビの電源はオフ」から、「テレビの電源をつける」くらいの操作で大丈夫だろうと判断し、絞り込む。また確信度は前記確信度での最大〜最小の5段階評価で「確信度最小」と求めたとする。
【0081】
応答文生成手段23は、確信度最小と「テレビの電源をつける」というタスクコマンドと辞書記憶部31を参照して、「テレビをつけますか?」という応答文を生成し、出力装置4をなす音声合成システムのスピーカーに出力する。
【0082】
また「テレビの電源をつける」というタスクコマンドを未実行タスクコマンド記憶部33に記憶する。
【0083】
このシステムからの応答後に、ユーザが「はい」と入力すると、自然言語解析手段31は、辞書記憶部31を参照して、この発話が肯定を意味する語だと認識し、また未実行タスクコマンド記憶部33に、「テレビの電源をつける」というコマンドが記憶されているため、「テレビの電源をつける」というタスクコマンドを生成する。
【0084】
曖昧性解消手段22では、すでにタスクコマンドが一意に決まっているため、確信度を最大〜最小の5段階評価で、「確信度最大」とする。
【0085】
応答文生成手段23では、確信度最大と「テレビの電源をつける」というタスクコマンドと辞書記憶部31を参照して、「テレビの電源をつけました」という応答文を生成し、音声合成システムでスピーカに出力する。
【0086】
次に本発明の第3の実施例について図面を参照して詳細に説明する。
【0087】
図5は、本発明の第3の実施例の構成を示す図である。図5において、図3に示した要素と同等の要素には同一の参照符号が付されている。
【0088】
図5を参照すると、本発明の第3の実施例は、データ処理装置2は、図3に示した前記第2の実施例と同様に、自然言語解析手段21、曖昧製解消手段22、応答文生成手段23、タスク実行手段24を備えている。記憶装置3は、辞書記憶部31、曖昧性解消情報記憶部32、キャンセルコマンド記憶部34を備えている。
【0089】
キャンセルコマンド記憶部34には、ユーザの意図に反したタスクを実行してしまったときに、元に復旧するためのタスクコマンドが予め記憶されている。
【0090】
図6は、本発明の第3の実施例の動作を説明するための流れ図である。図5及び図6を参照して、本発明の第3の実施例の動作について詳細に説明する。なお、図6のステップ301〜304は、図2に示したステップ201〜204と同様とされる。
【0091】
前記第1の実施例では、曖昧性解消手段22で確信度が高く求められてしまうと、ユーザの意図に反したものでも、応答文生成部23で実行完了の応答文を生成して出力装置4に出力してしまう。
【0092】
本発明の第3の実施例においては、システムがタスク実行完了の応答文を応答文生成手段23で生成し、出力装置4に出力した時に、キャンセルや取り消しを意味する入力を受け付けると、図6のステップ301−304の一連の処理において、図4のステップ201−204の前記第2の実施例の処理と同様に、タスクコマンドを1つに絞り込む。その際、キャンセルや取り消しを意味する入力を受け付けた時には、キャンセルコマンドが絞り込まれる。
【0093】
絞り込まれたタスクコマンドがキャンセルコマンドであるか否か判定する(図6のステップ305)。
【0094】
キャンセルコマンドでなければ、前記第1の実施例と同様に、確信度に応じて応答文生成部23で応答文を生成し、出力装置4に出力する(図6のステップ306)。
【0095】
キャンセルコマンドである場合、キャンセルコマンド記憶部34を参照して応答文生成部23で応答文を生成し、出力装置4に出力する(図6のステップ307)。
【0096】
例えば、システムが「テレビをつけました」という応答文を返した時に、ユーザが、キャンセルや取り消しを意味する入力として、「違う」と答えた時に、システムは、「テレビを消しました」という応答文を生成する。
【0097】
本発明の第3の実施例について具体例に即して説明する。以下でも、前記第1の実施例と同様にテレビとビデオがある家の中での状況を想定する。
【0098】
今、ユーザがテレビの電源をつけるために、「テレビをつけて」とマイクに向かって話したとする。
【0099】
入力装置1をなす音声認識システムは、あやまって「ビデオをつけて」と誤認識し、テキスト文字に変換する。このテキスト文字と辞書記憶部31を参照して自然言語解析手段21は、「ビデオの電源をつける」というタスクコマンドに変換する。
【0100】
曖昧性解消手段22では、すでにタスクコマンドが一意に決まっているので、「確信度最大」とする。
【0101】
応答文生成手段23は、「確信度最大」と、「ビデオの電源をつける」というタスクコマンドと辞書記憶部31を参照して、「ビデオの電源をつけました」という応答文を生成し、出力装置4をなす音声合成システムでスピーカに出力する。
【0102】
また、キャンセルコマンド記憶部34に、「ビデオの電源をつける」という操作の逆操作である「ビデオの電源を消す」というコマンドが記憶される。
【0103】
システムはユーザの意図とは異なる応答をしたために、マイクからユーザは「違う」と入力した場合、自然言語解析手段31は辞書記憶部31を参照してこの発話がキャンセルを意味する語だと認識し、またキャンセルコマンド記憶部34に「ビデオの電源を消す」というタスクコマンドが記憶されていることを認識して、「ビデオの電源を消す」というタスクコマンドを生成する。
【0104】
曖昧性解消手段22では、すでにタスクコマンドが一意に決まっているので、確信度最大とする。
【0105】
応答文生成手段23では、「確信度最大」と「ビデオの電源を消す」というタスクコマンドと辞書記憶部31を参照して、「ビデオの電源を消しました」という応答文を生成し、該応答文を出力装置4をなす音声合成システムよりスピーカに出力する。
【0106】
次に本発明の第4の実施例について説明する。図7は、本発明の第4の実施例の構成を示す図である。図7を参照すると、本発明の第4の実施例は、図3に示した前記第2の実施例に、時間管理部35を記憶装置3に備えたものである。
【0107】
図8は、本発明の第4の実施例の動作を説明するための流れ図である。図7及び図8を参照して、本発明の第4の実施例の動作について説明する。
【0108】
図8のステップ402−405、ステップ408−409は、その流れ図を図4に示した前記第2の実施例における202−205、ステップ208−209と同一とされ、また、図8のステップ406、407、410は、前記第2の実施例におけるステップ206、207、210と同一の処理とされている。前記第2の実施例と同様な手順で、図8のステップ409まで処理が終わったとする。前記第2の実施例では、図4に示すように、ステップ209で応答文を生成して、入力装置1でユーザからの返答入力を待ち、返答が入力されたときにステップ201からの処理を行っている。
【0109】
本発明の第4の実施例では、システムがユーザの入力を待つような応答をしたときに、時間管理部35に現在時刻を設定し、入力装置1では、不図示のタイマ(計時手段)により予め定められた一定時間だけ待つことにする(図8のステップ401)。
【0110】
一定時間内に、すなわち、タイマでのタイムアウト発生前に、応答文に対するユーザからの入力があれば、以下の処理を前記第2の実施例と同様に行う(図8のステップ402以降)。
【0111】
一定時間の間にユーザからの入力がなければ、すんわち、タイマでのタイムアウトが発生した際には、ユーザは、応答の内を了解したものとして、入力装置1にユーザが肯定を意味する入力を行なったものとみなす。
【0112】
ステップ409で生成された「〜していいですか?」のような応答に対して、図8のステップ404で求めた確信度が高いときには、入力が「はい」のような肯定を意味する入力か、「いいえ」のような否定を意味する入力かどうかを判断する(図8のステップ406)。
【0113】
ユーザから入力が、肯定を意味するものである時には、応答文生成手段23はタスク実行手段24にタスクコマンドを送り、タスク実行手段24でタスクを実行する。
【0114】
また応答文生成手段23は、タスクの実行完了を表す「〜しました。」のような応答文を生成する(図8のステップ407)。
【0115】
また、否定を意味する入力の時には、タスクコマンドを破棄し、未実行タスクの取り消しを表す「〜を取り消します」のような応答文を生成する(図8のステップ410)。
【0116】
本発明の第4の実施例について具体例に即して以下に説明する。以下でも、前記第2の実施例と同様にテレビとビデオがある家の中での状況を想定して説明する。
【0117】
今、ユーザがテレビの電源をつけた後に、テレビのチャンネルを1にするために「1チャンネルにして」とマイクに向かって話したものとする。音声認識システムは「1チャンネルにして」と認識し、テキスト文字に変換する。
【0118】
このテキスト文字と辞書を参照して自然言語解析手段31は、「テレビのチャンネルを1にする」、「ビデオのチャンネルを1にする」という複数のタスクコマンドに変換する。
【0119】
曖昧性解消手段22では、文脈を用いて「テレビの電源をつける」を実行した後であることから、「テレビのチャンネルを1にする」であるものと判断する。また、文脈を用いて曖昧性を解消したので、確信度を中とする。
【0120】
応答文生成手段23では確信度中と「テレビのチャンネルを1にする」というタスクコマンドと辞書記憶部31を参照して、「テレビのチャンネルを1にしますね」という応答文を生成し、出力装置4をなす音声合成システムでスピーカに出力する。
【0121】
また、未実行タスクコマンド記憶部33に「テレビのチャンネルを1にする」というタスクコマンドを記憶する。
【0122】
またスピーカで応答文を出力するのと同時に、時間管理部35に、現在時刻を記憶させる。
【0123】
出力装置4をなすスピーカからの応答文を出力した後、ユーザから一定時間入力がないときには、入力装置1から肯定を表す語が入力されたものとして、前記第2の実施例と同様な処理を行い、応答文生成手段23において、「テレビのチャンネル1を1にしました」という応答文を生成し、該応答文を、出力装置4をなす音声合成システムよりスピーカに出力する。
【0124】
【発明の効果】
以上説明したように、本発明によれば下記記載の効果を奏する。
【0125】
本発明の第1の効果は、にユーザはその応答に必ずしも返答する必要がなくなるので、ユーザにかかる負荷を削減する、ということである。
【0126】
その理由は次の通りである。本発明においては、システムが求めた確信度を用いて応答文を変化させることで、システムは必ずしも確認を求める応答文を出力するわけではない。このため、ユーザはシステムからの応答に必ずしも返答する必要がないためである。
【0127】
本発明の第2の効果は、システムが操作を行う前に、ユーザとシステムとの対話により曖昧性を解消することを可能とし、システムがユーザの本来の意図とは異なった解釈をする可能性を低減し、その結果、ユーザは修正取り消し作業を行う可能性を特段に低減している、ということである。
【0128】
その理由は、本発明においては、システムが求めた確信度が低いときには、システムは、システムで解釈したタスクを実行してよいかどうかをユーザに質問する構成とされているためである。
【0129】
本発明の第3の効果は、システムがユーザの意図と異なった解釈をしてしまう場合でも、修正取り消し可能とし、ユーザにかかる負荷を削減する、ということである。
【0130】
本発明の第4の効果は、システムがユーザに質問をしたときに、ユーザから一定時間応答がないとシステムに肯定を表す語が入力されたときと同様な処理がおこなわれ、このため、ユーザはシステムの確認を表す応答に必ずしも答える必要がないので、ユーザの負荷を削減する、ということである。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図である。
【図2】本発明の第1の実施例の動作を説明するための流れ図である。
【図3】本発明の第2の実施例の構成を示すブロック図である。
【図4】本発明の第2の実施例の動作を説明するための流れ図である。
【図5】本発明の第3の実施例の構成を示す図である。
【図6】本発明の第3の実施例の動作を説明するための流れ図である。
【図7】本発明の第4の実施例の構成を示す図である。
【図8】本発明の第4の実施例の動作を説明するための流れ図である。
【符号の説明】
1 入力装置
2 データ処理装置
3 記憶装置
4 出力装置
21 自然言語解析手段
22 曖昧性解消手段
23 応答文生成手段
24 タスク実行手段
31 辞書記憶部
32 曖昧性解消情報記憶部
33 未実行タスクコマンド記憶部
34 キャンセルコマンド記憶部
35 時間管理部

Claims (19)

  1. 入力された自然言語を解釈するために必要な語彙と、該自然言語の解釈結果から応答文を生成するために必要な語彙とを予め記憶する辞書記憶部と、
    前記辞書記憶部を参照して、入力手段から入力された自然言語の解釈を行う自然言語解析手段と、
    前記自然言語解析手段で求められた解釈結果が複数存在した場合、1つの解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部と、
    前記自然言語解析手段で求められた解釈結果が複数存在した場合に、前記曖昧性解消情報記憶部を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消手段と、
    前記曖昧性解消手段で絞り込んだ解釈結果を応答文として出力し、その際、前記曖昧性解消手段で求められた前記確信度に応じて応答文を変更させる応答文生成手段と、
    を備えたことを特徴とする自然言語を用いた対話システム。
  2. 前記曖昧性解消手段で1つに絞り込んだ解釈結果および前記曖昧性解消手段で求められた確信度を受けて、該解釈結果に対応するタスクコマンドを実行するタスク実行手段をさらに備えたことを特徴とする請求項1に記載の自然言語を用いた対話システム。
  3. 前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、前記タスク実行手段でタスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、前記タスク実行手段でタスクを実行する前にタスクを実行してよいか否かを確認するための応答文を生成するか、を決定する、ことを特徴とする請求項2に記載の自然言語を用いた対話システム。
  4. 前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、応答文を生成するかしないかを決定する、ことを特徴とする請求項2に記載の自然言語を用いた対話システム。
  5. 前記応答文生成手段が、前記曖昧性解消手段で求められた確信度に応じて、前記曖昧性解消手段が解釈した結果を、報告、確認、及び質問のうちのいずれかを表す応答文に変更する、ことを特徴とする請求項2、3、4のいずれか一に記載の自然言語を用いた対話システム。
  6. 実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部と、
    キャンセルの意味を表す入力がなされたときに、前記タスク実行手段でキャンセルコマンドを実行するとともに、前記応答文生成手段において、キャンセルコマンドを実行したことを報告する応答文を生成する、ことを特徴とする請求項2、3、4、5のいずれか一に記載の自然言語を用いた対話システム。
  7. システムがタスクコマンドを実行してよいかどうかの確認をとる応答文を出力した後、時間の経過を測定する時間管理手段を備え、
    前記時間管理手段で計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない場合には、肯定を表す入力が前記入力手段から入力されたものと解釈する、ことを特徴とする請求項2乃至6のいずれか一に記載の自然言語を用いた対話システム。
  8. 前記時間管理手段で計時を開始後、前記所定の時間が経過した後に、肯定を表す入力が前記入力手段から入力されたか否かを、前記曖昧性解消手段で求めた確信度に応じて決定する、ことを特徴とする請求項7に記載の自然言語を用いた対話システム。
  9. 入力手段から入力された自然言語を受け取り、語彙辞書を参照して1又は複数のタスクコマンドに変換する自然言語解析手段と、
    曖昧性解消情報を参照して、曖昧性を解消するための所定の情報に基づき複数のタスクコマンドを1つに絞り込むとともに、前記所定の情報に基づいた絞り込みの仕方から、前記1つに絞り込んだタスクコマンドに対する確信度を求める曖昧性解消手段と、
    前記曖昧性解消手段で1つに絞り込んだタスクコマンドと、前記曖昧性解消手段で求められた前記確信度と語彙辞書とを参照して、前記確信度に応じた応答文を生成し、出力手段に出力する応答文生成手段と、を備えたことを特徴とする自然言語対話処理装置。
  10. 入力手段から入力された自然言語を語彙辞書を参照して解釈し、解釈結果として該自然言語に対応した1又は複数のタスクコマンドを候補として出力する自然言語解析手段と、
    前記自然言語解析手段で求められたタスクコマンドが複数存在した場合、該解釈された自然言語の文脈情報、タスクの履歴情報、該タスク候補の処理対象物の状況情報のいずれかの情報を含む、曖昧性を解消するための所定の情報に基づき、1つのタスクコマンドに絞り込むとともに、前記所定の情報に基づいた絞り込みの仕方から、前記1つに絞り込んだタスクコマンドに対する確信度を求める曖昧性解消手段と、
    前記曖昧性解消手段で1つに絞り込んだタスクコマンド及び前記曖昧性解消手段で求められた前記確信度に応じて応答文を自動作成して出力手段から出力する応答文生成手段と、
    前記タスクコマンドを実行するタスク実行手段と
    を備えたことを特徴とする自然言語対話処理装置。
  11. 前記一つの絞り込まれたタスクコマンドの確信度が小の場合、該タスクコマンドを直ちに実行せずに一旦未実行コマンド記憶手段に記憶しておき、前記応答文生成手段が、前記タスクコマンドを実行してよいか否かを確認するための応答文を生成して前記出力手段に出力し、
    該応答文に対してユーザが肯定を意味する入力を前記入力手段から行なった場合、前記未実行コマンド記憶手段からタスクコマンドを取り出して前記タスク実行手段で前記タスクコマンドを実行し、前記応答文生成手段ではタスク実行完了の応答文を出力し、一方、否定を意味する入力が前記入力手段から行われた場合、前記応答文生成手段では未実行タスク取り消しの応答文を作成して出力する、ことを特徴とする請求項10記載の自然言語対話処理装置。
  12. 前記タスク実行手段で実行したタスクコマンドの操作をキャンセルするキャンセルコマンドを記憶するキャンセルコマンド記憶手段をさらに備え、
    タスクコマンド実行後該タスクのキャンセルの意味を表す入力が前記入力手段から行われたときに、前記キャンセルコマンド記憶手段から前記キャンセルコマンドを読み出して前記タスク実行手段で前記キャンセルコマンドを実行するとともに、前記応答文生成手段において、前記キャンセルコマンドを実行したことを報告する応答文を生成出力する、ことを特徴とする請求項10又は11記載の自然言語対話処理装置。
  13. 前記応答文生成手段が、前記タスクコマンドを実行してよいか否かを確認するための応答文を生成して出力した後、時間の経過を測定する時間管理手段を備え、
    前記時間管理手段で計時を開始後、あらかじめ定められた所定の時間が経過しても、ユーザからの応答がない場合には、肯定を表す入力が前記入力手段に入力されたものと解釈する、ことを特徴とする請求項11記載の自然言語対話処理装置。
  14. 前記入力手段が入力された音声を認識してテキストに変換出力する音声認識手段よりなり、前記出力手段が、前記応答文生成手段で作成された前記応答文のテキスト情報を入力し音声合成して音声出力手段から出力する音声合成手段よりなる、ことを特徴とする請求項10乃至13のいずれか一に記載の自然言語対話処理装置。
  15. 請求項14記載の自然言語対話処理装置において、
    一又は複数の機器の所定の操作を、前記所定の操作を指示するユーザからの音声入力により行なうことを特徴とする自然言語対話処理装置。
  16. (a)入力手段から入力された自然言語について語彙辞書記憶部を参照して解釈を行う自然言語解析処理と、
    (b)前記自然言語解析処理で求められた解釈結果が複数存在した時に、複数の解釈結果を1つの解釈結果に絞り込むための手がかりとして用いられる情報を記憶する曖昧性解消情報記憶部を参照して、前記複数の解釈結果を1つに絞り込むとともに、前記1つに絞り込んだ解釈結果に対する確信度を求める曖昧性解消処理と、
    (c)前記曖昧性解消処理で絞り込んだ解釈結果を語彙辞書記憶部を参照して応答文として自動生成し出力手段から出力し、その際、前記曖昧性解消手段で求められた前記確信度に応じて応答文を変化させる応答文生成処理と、
    の前記(a)乃至(c)の処理をコンピュータで実行させるためのプログラムを記録した記録媒体。
  17. 請求項16記載の記録媒体において、
    (d)前記曖昧性解消処理(b)で1つに絞り込んだ解釈結果および前記曖昧性解消手段で求められた確信度を受けて、前記解釈結果に対応するタスクコマンドを実行する処理、
    を前記コンピュータで実行させるためのプログラムを記録した記録媒体。
  18. 請求項17記載の記録媒体において、
    前記応答文生成処理(c)が、前記曖昧性解消処理(b)で求められた確信度に応じて、タスクを実行した後にタスクの実行を報告する応答文を生成するか、もしくは、タスクを実行する前にタスクを実行してよいか否かを確認するための応答文を生成するかを決定する処理を含み、前記処理を前記コンピュータで実行させるためのプログラムを記録した記録媒体。
  19. 請求項17記載の記録媒体において、
    実行を行ったタスクコマンドに対する逆操作のタスクコマンドを記憶するキャンセルコマンド記憶部を備え、
    (f)キャンセルの意味を表す入力が前記入力手段から行われたときに、キャンセルコマンドを実行するとともに、前記応答文生成処理(c)において、キャンセルコマンドを実行したことを報告する応答文を生成する処理を、前記コンピュータで実行させるためのプログラムを記録した記録媒体。
JP20253899A 1999-07-16 1999-07-16 自然言語を用いた対話システム Expired - Fee Related JP3662780B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20253899A JP3662780B2 (ja) 1999-07-16 1999-07-16 自然言語を用いた対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20253899A JP3662780B2 (ja) 1999-07-16 1999-07-16 自然言語を用いた対話システム

Publications (2)

Publication Number Publication Date
JP2001034289A JP2001034289A (ja) 2001-02-09
JP3662780B2 true JP3662780B2 (ja) 2005-06-22

Family

ID=16459171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20253899A Expired - Fee Related JP3662780B2 (ja) 1999-07-16 1999-07-16 自然言語を用いた対話システム

Country Status (1)

Country Link
JP (1) JP3662780B2 (ja)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0721987B2 (ja) * 1991-07-16 1995-03-08 株式会社愛知電機製作所 真空切替遮断器
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
JP3450823B2 (ja) * 2000-12-01 2003-09-29 株式会社ナムコ 模擬会話システム、模擬会話方法、および情報記憶媒体
JP3523213B2 (ja) * 2001-03-28 2004-04-26 株式会社ジャストシステム コマンド処理装置、コマンド処理方法、及びコマンド処理プログラム
JP4724943B2 (ja) * 2001-04-05 2011-07-13 株式会社デンソー 音声認識装置
JP3724461B2 (ja) 2002-07-25 2005-12-07 株式会社デンソー 音声制御装置
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2005300989A (ja) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp 音声認識システム
US8942985B2 (en) * 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US7925975B2 (en) 2006-03-10 2011-04-12 Microsoft Corporation Searching for commands to execute in applications
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
JP2009036999A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8762156B2 (en) * 2011-09-28 2014-06-24 Apple Inc. Speech recognition repair using contextual information
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
JP6073881B2 (ja) * 2012-06-19 2017-02-01 株式会社Nttドコモ 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
KR101959188B1 (ko) 2013-06-09 2019-07-02 애플 인크. 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
DE112016006496T5 (de) * 2016-02-26 2018-11-15 Mitsubishi Electric Corporation Stimmerkennungsvorrichtung
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10282218B2 (en) * 2016-06-07 2019-05-07 Google Llc Nondeterministic task initiation by a personal assistant module
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
CN108447471B (zh) * 2017-02-15 2021-09-10 腾讯科技(深圳)有限公司 语音识别方法及语音识别装置
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
JP2019185360A (ja) * 2018-04-09 2019-10-24 富士ゼロックス株式会社 情報処理装置およびプログラム
JP2022054050A (ja) * 2020-09-25 2022-04-06 富士フイルムビジネスイノベーション株式会社 情報処理装置、回答処理装置、情報処理システム、情報処理プログラム及び回答処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216618A (ja) * 1991-11-18 1993-08-27 Toshiba Corp 音声対話システム
US6052666A (en) * 1995-11-06 2000-04-18 Thomson Multimedia S.A. Vocal identification of devices in a home environment
JPH11143489A (ja) * 1997-11-10 1999-05-28 Sony Corp 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車

Also Published As

Publication number Publication date
JP2001034289A (ja) 2001-02-09

Similar Documents

Publication Publication Date Title
JP3662780B2 (ja) 自然言語を用いた対話システム
US6327566B1 (en) Method and apparatus for correcting misinterpreted voice commands in a speech recognition system
US7848926B2 (en) System, method, and program for correcting misrecognized spoken words by selecting appropriate correction word from one or more competitive words
JP4542974B2 (ja) 音声認識装置、音声認識方法および音声認識プログラム
US7260529B1 (en) Command insertion system and method for voice recognition applications
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
JP3454897B2 (ja) 音声対話システム
JP4729902B2 (ja) 音声対話システム
US20020123893A1 (en) Processing speech recognition errors in an embedded speech recognition system
JP2002258890A (ja) 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体
JP3476007B2 (ja) 認識単語登録方法、音声認識方法、音声認識装置、認識単語登録のためのソフトウエア・プロダクトを格納した記憶媒体、音声認識のためのソフトウエア・プロダクトを格納した記憶媒体
JP2011504624A (ja) 自動同時通訳システム
US6963834B2 (en) Method of speech recognition using empirically determined word candidates
JP5396530B2 (ja) 音声認識装置および音声認識方法
JP5160594B2 (ja) 音声認識装置および音声認識方法
WO2003079188A1 (fr) Procede de fonctionnement d'un objet logiciel au moyen d'une langue naturelle et programme correspondant
US7181397B2 (en) Speech dialog method and system
JP4537755B2 (ja) 音声対話システム
JP2006162782A (ja) 音声認識装置
JP2010204442A (ja) 音声認識装置、音声認識方法、音声認識プログラムおよびプログラム記録媒体
JP2001306091A (ja) 音声認識システムおよび単語検索方法
US20210064640A1 (en) Information processing apparatus and information processing method
JP2020118872A (ja) 情報入力システム及び方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050324

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080401

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090401

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100401

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110401

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120401

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120401

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130401

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130401

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140401

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees