JP4186992B2 - 応答生成装置、方法及びプログラム - Google Patents

応答生成装置、方法及びプログラム Download PDF

Info

Publication number
JP4186992B2
JP4186992B2 JP2006023682A JP2006023682A JP4186992B2 JP 4186992 B2 JP4186992 B2 JP 4186992B2 JP 2006023682 A JP2006023682 A JP 2006023682A JP 2006023682 A JP2006023682 A JP 2006023682A JP 4186992 B2 JP4186992 B2 JP 4186992B2
Authority
JP
Japan
Prior art keywords
predicate
case
response
extracted
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006023682A
Other languages
English (en)
Other versions
JP2007206888A (ja
Inventor
良子 徳久
立太 寺嶌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Central R&D Labs Inc
Original Assignee
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Central R&D Labs Inc filed Critical Toyota Central R&D Labs Inc
Priority to JP2006023682A priority Critical patent/JP4186992B2/ja
Publication of JP2007206888A publication Critical patent/JP2007206888A/ja
Application granted granted Critical
Publication of JP4186992B2 publication Critical patent/JP4186992B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、応答生成装置、方法及びプログラムに係り、ユーザと円滑に対話を行うための応答生成装置、方法及びプログラムに関する。
従来、予め決められたプランに基づいて対話を行う対話システムが提案されている。例えば、カーナビゲーションシステムは、目的地検索、旅行案内、文書検索等の予め定められたタスクを実行するために、ドライバとの対話を行うように設計されている。
一方、日常の対話では、あらかじめ具体的な目的などは意識されていない。このため、例えば話し相手をするロボットのような非課題遂行型の対話システムは、ユーザが対話を楽しめるように、できる限り長く応答をすることが求められる。よって、上記対話システムは、あらかじめ大局的な制御規則を定めてその枠にはまった対話のみを許すというのではなく、局所的な相互作用を重視して臨機応変な対話を行うという枠組みが必要になってくる。
そこで、人同士が日常行っているような自然な対話を行う対話装置が提案されている(例えば特許文献1参照。)。上記対話装置は、ユーザから入力が入ると内部状態記憶部4に記憶されている、その入力の元となった対話装置の発話内容から、入力状態候補選択部6および入力状態同定部8においてユーザの発話内容を同定し、それに適した応答を応答生成部12で作成するという局所的な制御モデルを導入している。
具体的には、上記対話装置は、ユーザ発話の意図が質問(「固定情報提供要請」もしくは「一般情報提供要請」)の場合はその質問に答え(受動的情報提供)、ユーザの発話意図があいさつの場合は「情報提供の提起」、「自発的情報提供」、「話題転換」、「あいさつ」のいずれかを発話する、というルールが決められていた。
また、断片的な未完成文の入力を許し、不足する情報に応じた問い合わせ文を生成する自然言語対話装置が提案されている(例えば特許文献2参照。)自然言語対話装置は、ユーザから入力された文を形態素解析し、形態素解析結果の単語列をそのまま構文解析する。すでに問い合わせ格が格納されていれば、対応する格要素を構文解析結果から抽出し意味解析する。格納されていなければ、構文解析結果をそのまま意味解析する。実行する機能を遂行するための情報が不足だと、その情報に対応する格を格納し、問い合わせ文を生成してユーザに提示する。
特開2001−357053号公報 特開平9−6790号公報
特許文献1の対話装置は、例えば、「暑いな」というユーザ発話に対して「ほんまやな」、「泳ぎに行きたいな」に対して「沖縄がええで」と応答するために、ユーザがある事態について述べる「基本対話」に対して予め発話を用意する必要がある。
しかし、ユーザ発話(基本対話)のバリエーションは膨大であるため、各々のユーザ発話に対して発話を用意するのは、コストの問題から現実的ではない。
また、特許文献2の自然言語対話装置は、ユーザ発話に不足する情報を問い合わすだけだと、対話が一方通行になってしまい、ユーザに対話を楽しませることができない問題がある。
本発明は、上述した課題を解決するために提案されたものであり、コストをかけることなくユーザと円滑に対話を行うことができる応答生成装置、方法及びプログラムを提供することを目的とする。
上述した課題を解決するため、本発明は、発話が入力される入力手段と、複数の述語と前記各述語に対応する1つ以上の格要素とが予め記憶された格辞書記憶手段を備え、前記入力手段に入力された発話を解析して、述語及びそれを修飾する格要素を抽出し、前記抽出された述語と前記格辞書記憶手段とを照合して前記抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から、前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完する解析手段と、前記解析手段により抽出された述語及び格要素と、格要素を確認するために予め用意された発話、述語が行われた理由、時、場所のいずれか1つを確認するために予め用意された発話、複数の述語同士の関係を確認するために予め用意された発話、のいずれか1つの発話と、に基づいて、前記抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成し、前記解析手段で抽出された述語に対して必須の格要素が補完された場合には、前記解析手段により抽出された述語及び補完された格要素と、述語の必須格が補完された格要素であるかを確認するために予め用意された発話と、に基づいて、前記抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成する応答生成手段と、前記応答生成手段により生成された応答のいずれか1つを出力する応答出力手段と、を備えている。
入力手段は、発話内容を入力できればよく、音声であるか否かを問わない。解析手段は、入力手段に入力された発話を解析して、その発話に含まれる述語及びそれを修飾する格要素を抽出する。さらに、解析手段は、複数の述語と前記各述語に対応する1つ以上の格要素とが予め記憶された格辞書記憶手段を備え、前記抽出された述語と前記格辞書記憶手段とを照合して、前記抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から、前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完する。そして、応答生成手段は、前記抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成する。また、応答生成手段は、述語に対して必須の格要素が補完された場合には、前記抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成する。応答出力手段は、生成された応答のいずれか1つを出力する。応答出力手段は、音声により応答を出力してもよいし、画像により応答を出力してもよい。
したがって、上記発明は、入力された発話を解析して、述語及びそれを修飾する格要素を抽出し、抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成する。また、上記発明は、抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完し、抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成する。これにより、発話内容に応じた応答を生成することができる。
なお、本発明は、応答生成方法及びプログラムにも適用可能である。
本発明は、入力された発話を解析して、述語及びそれに対応する格要素を抽出し、抽出された述語又は格要素を確認するための応答を生成することにより、コストをかけることなく、円滑に対話を行うことができる。
以下、本発明の好ましい実施の形態について図面を参照しながら詳細に説明する。
[第1の実施形態]
図1は、本発明の第1の実施形態に係る応答生成装置の構成を示すブロック図である。
第1の実施形態に係る応答生成装置は、ユーザ発話から音声信号を生成するマイクロホン11と、マイクロホン11から出力された音声信号を認識する認識部12と、ユーザ発話を解析する解析部13と、解析結果に基づいて応答発話を生成する応答生成部14と、応答発話を音声出力するスピーカ21と、応答発話を画像出力するディスプレイ22と、を備えている。
図2は、解析部13の構成を示すブロック図である。解析部13は、ユーザ発話の形態素解析を行う形態素解析器31と、各文節の係り受け(修飾関係)を解析する係り受け解析器32と、述語と格要素を抽出する格解析器33と、抽出された述語に必須の格を補完する必須格補完エンジン34と、述語と必須格(格要素)との関係を定義する格辞書35と、述語同士の関係を解析する述語関係解析器36と、述語同士の関係を定義する述語関係データベース37と、を備えている。
ここで、日本語における格は、ガ格、ヲ格、ニ格、カラ格、ト格、デ格、ヘ格、マデ格、ヨリ格の9種類がある(「基礎日本語文法―改訂版―」くろしお出版、p74−80)。格要素は、格の直前にくる名詞句であり、「述語」を修飾する文節に含まれる。「述語」は、発話の中に表現される動きや状態を表す単語であり、品詞が動詞、形容詞、サ変名詞で始まる文節をいう。
図3は、格辞書35の構成を示す図である。格辞書35は、述語と必須格との関係、すなわち、述語とそれに共起する格との関係を示している。格辞書35は、例えば「作る」は「人ガ」、「物ヲ」、「人ニ」と共起し、「器用だ」は「人ガ」と共起することを定義している。ここで、「人」は人に関する名詞、「物」は物に関する名詞を示している。
図4は、述語関係データベース37の構成を示す図である。述語関係データベース37は、述語1と述語2の関係を表している。例えば、「器用だ」は、「作る」の「理由」となる。「向かう」は、「行く」と「同格」である。「調べる」は、「知る」の「手段」となる。逆に、「知る」は、「調べる」の「結果」となる。
以上のように構成された応答生成装置は、第1の応答生成ルーチンを実行することにより、ユーザとの間で例えば次のような対話例1を実現することができる。以下、ユーザ発話に対する本装置の発話を「システム発話」という。
(対話例1)
ユーザ発話1:お父さんはすごく器用で、リビングのサイドボードとかを全部作ったの。
システム発話2:サイドボードを作ったの?
ユーザ発話3:そうなの。リビングにホームシアターシステムを作ったりもして。
システム発話4:お父さんが作ったの?
ユーザ発話5:そう。
システム発話6:それでそれで?
図5は、ユーザ発話に対する応答を生成する第1の応答生成ルーチンを示すフローチャートである。最初に、ユーザ発話1「お父さんはすごく器用で、リビングのサイドボードとかを全部作ったの。」が入力された場合を例に挙げて説明する。
ステップS1では、応答生成装置の各部が初期化され、ステップS2に進む。そして、マイクロホン11はユーザ発話に応じた音声信号を生成し、認識部12は音声信号を認識する。
ステップS2では、解析部13は、認識部12で認識されたユーザ発話を解析する。このとき、図2に示す解析部13を構成する各部は、次の処理を行う。
最初に、形態素解析器31は、形態素解析を行い、ユーザ発話から品詞などの形態素情報を出力する。形態素解析器31は、例えば図6に示すように、「お父さん(名詞)」、「は(助詞)」、「すごく(形容詞)」、・・・、「作っ(動詞)」、「た(助動詞)」、「の(助詞)」を出力する。
係り受け解析器32は、形態素解析器31の解析結果を用いて、次のように各文節の係り受け(修飾関係)を解析する。例えば図7に示すように、「お父さんは」及び「すごく」は、「器用で」に係っている。「リビングの」は「サイドボードとかを」に係っている。「器用で」、「サイドボードとかを」、「全部」は、それぞれ「作ったの」に係っている。
格解析器33は、係り受け解析器32の解析結果の中から述語と格要素を抽出する。具体的には、格解析器33は、係り受け解析器32の解析結果の中から、図8に示すように、述語である「器用だ」とそれを修飾する「お父さんガ」とを抽出する。格解析器33は、更に、もう1つの述語である「作る」とそれを修飾する「サイドボードヲ」とを抽出する。
必須格補完エンジン34は、格解析器33の解析結果と格辞書35とを照合して、本来述語が共起する格である必須格を補完して出力する。例えば、「作る」は、図3の格辞書35によると「人ガ(ガ格)」、「物ヲ(ヲ格)」、「人ニ(ニ格)」と共起する関係にある。一方、図8に示す解析結果では、「作る」は、既に「サイドボードヲ(ヲ格)」と修飾関係があるが、その他のガ格、ニ格と修飾関係がない。
そこで、必須格補完エンジン34は、「作る」に共起するその他の格(ガ格、ニ格)を補完する。しかし、図8に示す解析結果ではガ格(お父さんガ)は存在するが、ニ格は存在していない。よって、本実施形態では、必須格補完エンジン34は、図9に示すように、「作る」に対してニ格は補完せず、ガ格(お父さんガ)のみを補完する。
なお、「器用だ」は、図3の格辞書35によると「人ガ(ガ格)」、と共起する関係にあるが、図8に示す解析結果では「お父さんガ(ガ格)」と既に修飾関係にある。よって、必須格補完エンジン34は、「器用だ」に対しては補完する必要はない。
述語関係解析器36は、述語関係データベース37を参照して、必須格補完エンジン34の補完結果に含まれる述語同士の関係を求める。ここでは、述語関係解析器36は、図10に示すように、「器用だ(現在)」と「作る(過去)」の間には「理由」の関係があることを求める。以上の処理が終わると、図5のステップS3に進む。
ステップS3では、図1に示す応答生成部14は、図11に示すように、a)発話された格要素を確認すること(格要素の確認)、b)省略された格要素を質問すること(省略格要素の質問)、c)述語が行われた理由、時、場所を質問すること(述語の質問)、d)述語同士の関係を確認すること(述語同士の関係確認)、の4種類の発話候補を生成して、ステップS4に進む。
発話候補としては、ユーザ発話1に対して、a)の場合、例えば「お父さんが器用なの?」、「お父さんが作ったの?」、「サイドボードを作ったの?」が生成される。b)の場合、例えば「誰に作ったの?」が生成される。c)の場合、例えば「どうして器用なの?」、「いつ器用なの?」、「いつ作ったの?」、「どこで作ったの?」が生成される。d)の場合、「器用だから作ったの?」が生成される。
ステップS4では、応答生成部14は、発話候補が複数存在するかを判定し、肯定判定のときはステップS5に進み、否定判定のときはステップS6に進む。なお、発話候補が1つの場合、後述のステップにおいてその発話候補が応答発話として用いられる。
ステップS5では、応答生成部14は、発話候補の中から1つをランダムに選択し、選択したものを応答発話として、ステップS6に進む。
ステップS6では、スピーカ21は応答生成部14で生成された応答発話を音声出力し、又はディスプレイ22は応答生成部14で生成された応答発話を画像出力して、ステップS7に進む。これにより、ユーザ発話に対する応答がユーザに提示される。ここでは、例えば、システム発話2「サイドボードを作ったの?」が提示される。
ステップS7では、ユーザ発話の次の入力があるか否かが判定され、肯定判定のとき(例えばユーザ発話3があったとき)はステップS2に戻り、否定判定ときは処理を終了する。
以上のように、第1の実施形態に係る応答生成装置は、ユーザ発話から述語及び格要素を抽出し、抽出した述語又は格要素を確認する応答を生成するので、予め対話プランを用意することなく応答することができる。また、応答生成装置は、ユーザ発話がある限り、そのユーザ発話を深掘りする応答を生成するので、円滑に対話をすることができる。さらに、応答生成装置は、ユーザ発話に含まれる述語又は格要素から応答を生成することにより、応答生成の過程で特定のトピックに関するプランや知識が不要となり、あらゆるトピックについて応答することができる。
なお、応答生成装置は、上述した構成に限定されるものではなく、例えば図12に示すように、マイクロホン11及び認識部12に代わりにキーボード11aを用いたものであってもよい。すなわち、ユーザ発話を入力する入力部は、特に限定されるものではない。また、後述する実施形態でも同様である。
[第2の実施形態]
つぎに、本発明の第2の実施形態について説明する。なお、第1の実施形態と同一の部位には同一の符号を付し、主に第1の実施形態と異なる部分について説明する。
図13は、本発明の第2の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図1に示す構成に、相槌を生成する相槌生成部15を追加したものである。
相槌生成部15は、図14に示すように、「へぇ」、「ふーん」、「それでそれで?」、「そうなんだ」、「ふむふむ」等の複数の相槌を記憶しており、解析部13の解析結果を用いて相槌を生成する。
以上のように構成された応答生成装置は、第2の応答生成ルーチンを実行することにより、応答発話を生成し、又は必要に応じて相槌を生成する。
図15は、第2の応答生成ルーチンを示すフローチャートである。第2の応答生成ルーチンは、図5に示す第1の応答生成ルーチンにステップS11及びS12を加えたものである。
具体的には、ステップS2が終了すると、ステップS11に進む。ステップS11では、応答生成部14は、解析部13の解析結果を用いて、ユーザ発話中に述部または格要素が存在するか否かを判定し、肯定判定のときはステップS3に進み、否定判定のとき(述部又は格要素が1つもないとき)はステップS12に進む。
ステップS12では、応答生成部14は、図14に示す複数の相槌の中から1つをランダムに選択し、選択した相槌(例えば「それでそれで?」)をスピーカ21及びディスプレイ22に供給して、ステップS6に進む。
この結果、ステップS6では、スピーカ21は相槌(例えば「それでそれで?」)を音声出力し、又はディスプレイ22はその相槌を画像出力して、ステップS7に進む。
以上のように、第2の実施形態に係る応答生成装置は、ユーザ発話に述語又は格要素が存在するか否かを判定し、いずれかが存在するときは第1の実施形態と同様にして応答発話を生成し、いずれも存在しないときは相槌を生成する。これにより、ユーザ発話に明確な単語がない場合であっても、相槌で応答することによってユーザとの対話を円滑にすることができる。
[第3の実施形態]
つぎに、本発明の第3の実施形態について説明する。なお、上述の実施形態と同一の部位には同一の符号を付し、主に異なる部分について説明する。
図16は、本発明の第3の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図13に示す構成に、複数の発話候補から1つを選択する応答選択部16を追加したものである。
応答選択部16は、応答生成部14で生成された複数の発話候補から1つを選択し、選択したものを応答発話としてスピーカ21及びディスプレイ22に供給する。発話候補がない場合、すなわち相槌生成部15で相槌が生成された場合は、応答選択部16は、その相槌をスピーカ21及びディスプレイ22に供給する。
また、応答選択部16は、複数の発話候補から1つを選択するための発話選択ルールを記憶している。発話選択ルールは、図17に示すように、優先度1)〜4)まである。優先度1)は最も優先度が高く、優先度4)は最も優先度が低い。優先度1)は発話された格要素を確認すること、優先度2)は述語が省略された理由、時、場所のいずれかを質問すること、優先度3)は省略された格要素を質問すること、優先度4)は述語同士の関係を確認すること、を表している。
以上のように構成された応答生成装置は、第3の応答生成ルーチンを実行することにより、発話候補の中から最も優先度の高いものを選択する。
図18は、第3の応答生成ルーチンを示すフローチャートである。第3の応答生成ルーチンは、図15に示す第2の応答生成ルーチンにステップS21及びS22を加えたものである。
具体的には、ステップS4で肯定判定のときはステップS21に進む。ステップS21では、応答選択部16は、図17に示す発話選択ルールに従って、応答生成部14で生成された発話候補から1つを選択する。本実施形態では、図11に示すa)格要素の確認、b)省略格要素の質問、d)述語同士の関係確認、c)述語の質問の順に優先度が高いものとする。
そこで、第1の実施の形態で生成された複数の発話候補を発話選択ルールに照らし合わせると、
優先度1)「お父さんが器用なの?」、「お父さんが作ったの?」、「サイドボードを作ったの?」
優先度2)「どうして器用なの?」、「いつ器用なの?」、「いつ作ったの?」、「どこで作ったの?」
優先度3)「誰に作ったの?」
優先度4)「器用だから作ったの?」
となる。
応答選択部16は、複数の発話候補から最も優先度の高い「お父さんが器用なの?」、「お父さんが作ったの?」、「サイドボードを作ったの?」を選択して、ステップS22に進む。
ステップS22では、応答選択部16は、同じ優先度の発話候補が複数存在するか否かを判定し、肯定判定のときはステップS5に進み、否定判定のときはステップS6に進む。そして、ステップS22からステップS5に進むと、優先度1)の3つの発話候補の中からランダムに1つが選択され、ステップS6を経て、優先度の高い発話候補が応答発話として、ユーザに提示される。
以上のように、第3の実施形態に係る応答生成装置は、複数の発話候補から優先度の高いものを1つ選択してユーザに提示することにより、ユーザとの対話を円滑に進めることができる。
なお、発話候補を選択する基準となる優先度は、固定である必要はなく、出力された応答発話に応じて動的に変化してもよい。例えば、応答選択部16は、今回格要素の確認を示す発話候補を選択した場合、次回はその発話候補の優先度を最も低く変更してもよい。これにより、同じ内容の応答が連続して出力されるのが回避されるので、対話が単調になるのを防止することができる。
[第4の実施形態]
つぎに、本発明の第4の実施形態について説明する。なお、上述の実施形態と同一の部位には同一の符号を付し、主に異なる部分について説明する。
図19は、本発明の第4の実施形態に係る応答生成装置の構成を示すブロック図である。上記応答生成装置は、図16に示す構成に、文脈管理部17及び文脈データベース18を追加したものである。
文脈データベース18には、文脈管理部17を介して、認識部12、解析部13、応答生成部14、応答選択部16の履歴が逐次記録される。例えば、文脈データベース18には、ユーザとの対話の履歴(文脈情報)として、認識部12における音響モデルの絞り込み、解析部13で抽出された述語及び格要素、さらに補完された必須格、応答生成部14による文脈に基づく応答発話、応答選択部16による選択された発話候補に関する情報が記録される。また、文脈管理部17は、ユーザとの対話を進めながら逐次文脈データベース18の文脈情報を更新する。
以上のように構成された応答生成装置は、ユーザとの過去の対話の履歴である文脈情報を用いて、ユーザ発話に対する応答を生成する。ここで、ユーザ発話が「新築した時なんて、リビングのサイドボードとかを全部作ったの。」であるのに対して、その前のユーザとシステムの過去の対話(前文脈)が図20に示す対話例2である場合を挙げて説明する。
ここで、文脈データベース18には、前文脈についての解析部13の解析結果が記録されており、例えば、前文脈に含まれる「述語」及びそれと修飾関係(共起関係)にある1つ以上の「格要素」が記録されている。
具体的には、文脈データベース18には、図21に示すように、「聞く」に対してそれと修飾関係にある「お父さんガ」及び「言うことヲ」の関係、「おねだり上手だ」に対してそれと修飾関係にある「お母さんガ」の関係、「聞く」に対してそれと修飾関係にある「言うことヲ」の関係が記録されている。
そして、マイクロホン11に上記のユーザ発話が入力されると、図2に示す解析部13の格解析器33は、図22に示すように、述語として「作る」を抽出すると共に、「作る」と修飾関係にある格要素「新築した時ニ」、「サイドボードヲ」を抽出する。
次に、必須格補完エンジン34は、格解析器33の解析結果と格辞書35とを照合して、本来述語が共起する格を補完して出力する。ここで、「作る」は、図3の格辞書35によるとガ格、ヲ格、ニ格と共起する関係にあるが、図8に示す解析結果ではガ格がない。そこで、必須格補完エンジン34は、図21に示す前文脈の解析結果から最近のガ格である「お父さんガ」を抽出し、その「お父さんガ」を「作る」のガ格として補完する。
述語関係解析器36は、述語関係データベース37を参照して、文脈データベース18に記録されている前文脈の述語と必須格補完エンジン34から出力された述語との関係を求める。
ここでは、述語関係解析器36は、図23に示すように、「聞く(現在)」→「作る(過去)」の述語同士の間には「理由」の関係があり、「おねだり上手だ(現在)」→「作る(過去)」の述語同士の間には「理由」の関係があるので、これらの関係を求める。
応答生成部14は、解析部13の解析結果を用いて応答発話を生成する。例えば、応答生成部14は、述語同士の関係を用いて、今回のユーザ発話に含まれる述語「作る」が行われた理由、時、場所のいずれかについての質問を生成する。本実施形態では、図23に示すように、「聞く(現在)」→「作る(過去)」の述語同士については、「ホイホイ言うこと聞いちゃって?」が生成される。また、「おねだり上手だ(現在)」→「作る(過去)」の述語同士については、「お母さんがおねだり上手だから?」が生成される。
また例えば、応答生成部14は、解析部13の必須格補完エンジン34で補完された格を確認する応答発話を生成する。本実施形態では、「お父さんが作ったの?」が生成される。
応答選択部16は、文脈データベース18を用いて、相槌生成部15で生成された応答発話の中から1つの応答発話を選択する。例えば、応答選択部16は、文脈データベース18に記憶されている前文脈及び今回のユーザ発話から、対話の主題を抽出し、対話の主題に関連する応答発話を選択する。主題の抽出方法としては、例えば、解析部13で抽出された格要素の中で最近の格要素を抽出してもよいし、前文脈及び今回のユーザ発話の中で最も多い格要素を抽出してもよい。
本実施形態では、対話の主題として「サイドボード」が抽出され、図24に示すように、その結果「サイドボードを作ったの?」が選択される。そして、この発話は、スピーカ21及びディスプレイ22に供給され、ユーザに提示される。
以上のように、第4の実施形態に係る応答生成装置は、過去の対話の履歴を用いてユーザ発話の述語に不足していた格要素を補完し、述語と補完した格要素とに基づいて応答発話を生成する。これにより、上記応答生成装置は、ユーザ発話の情報が不足した場合であっても、対話の流れに沿った最適な応答をすることができる。
また、応答生成装置は、ユーザ発話に対して複数の発話候補を生成した場合は、過去の対話の履歴の中から対話の主題を抽出し、その主題に関する応答発話を選択して出力することにより、対話のポイントを外すことなく円滑に対話を継続することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、特許請求の範囲に記載された範囲内で設計上の変更をされたものにも適用可能であるのは勿論である。
例えば応答発話を提示する手段として、スピーカ21やディスプレイ22を使用したが、その他、応答内容を表現できるロボット装置を使用してもよい。また、各実施形態に係る応答生成装置は、スピーカ21、ディスプレイ22の一方のみを備えていてもよい。
本発明の第1の実施形態に係る応答生成装置の構成を示すブロック図である。 解析部の構成を示すブロック図である。 格辞書の構成を示す図である。 述語関係データベースの構成を示す図である。 ユーザ発話に対する応答を生成する第1の応答生成ルーチンを示すフローチャートである。 形態素解析器から出力される形態素情報を示す図である。 文節の係り受けの関係を示す図である。 格解析器によって抽出された述語とそれに対応する格要素とを示す図である。 「作る」に対して必須格であるガ格の格要素が補完された状態を示す図である。 述語同士の関係を示す図である。 発話候補の種類を示す図である。 応答生成装置の他の構成を示すブロック図である。 本発明の第2の実施形態に係る応答生成装置の構成を示すブロック図である。 相槌の候補を示す図である。 第2の応答生成ルーチンを示すフローチャートである。 本発明の第3の実施形態に係る応答生成装置の構成を示すブロック図である。 発話候補の優先度を示す図である。 第3の応答生成ルーチンを示すフローチャートである。 本発明の第4の実施形態に係る応答生成装置の構成を示すブロック図である。 対話例2を示す図である。 文脈データベースに記録されている履歴の一部を示す図である。 格解析器によって抽出される述語と格要素とを示す図である。 文脈データベースを用いて求められる述語同士の関係を示す図である。 文脈データベースを用いて選択された発話候補を示す図である。
符号の説明
11 マイクロホン
12 認識部
13 解析部
14 応答生成部
15 相槌生成部
16 応答選択部
17 文脈管理部
18 文脈データベース
21 スピーカ
22 ディスプレイ

Claims (9)

  1. 発話が入力される入力手段と、
    複数の述語と前記各述語に対応する1つ以上の格要素とが予め記憶された格辞書記憶手段を備え、前記入力手段に入力された発話を解析して、述語及びそれを修飾する格要素を抽出し、前記抽出された述語と前記格辞書記憶手段とを照合して前記抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から、前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完する解析手段と、
    前記解析手段により抽出された述語及び格要素と、格要素を確認するために予め用意された発話、述語が行われた理由、時、場所のいずれか1つを確認するために予め用意された発話、複数の述語同士の関係を確認するために予め用意された発話、のいずれか1つの発話と、に基づいて、前記抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成し、前記解析手段で抽出された述語に対して必須の格要素が補完された場合には、前記解析手段により抽出された述語及び補完された格要素と、述語の必須格が補完された格要素であるかを確認するために予め用意された発話と、に基づいて、前記抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成する応答生成手段と、
    前記応答生成手段により生成された応答のいずれか1つを出力する応答出力手段と、
    を備えた応答生成装置。
  2. 前記解析手段は、一の述語と、他の述語と、前記一の述語と前記他の述語との述語同士の関係として理由、同格、又は手段・結果のいずれか1つと、が予め記憶された述語関係記憶手段を備え、複数の述語を抽出したときに前記述語関係記憶手段に基づいて、抽出した複数の述語同士の関係が理由、同格、又は手段・結果のいずれであるかを解析し、
    前記応答生成手段は、前記解析手段により解析された述語同士の関係と、前記述語同士の関係が理由である場合の発話として一の述語の理由は他の述語によるものかを確認するために予め用意された発話、前記述語同士の関係が同格である場合の発話として一の述語は他の述語の同格になっているかを確認するために予め用意された発話、前記述語同士の関係が手段・結果である場合の発話として一の述語は他の述語の手段・結果になっているかを確認するために予め用意された発話、のいずれか1つの発話と、に基づいて、一の述語の理由は他の述語によるものかを確認するための応答、一の述語は他の述語の同格になっているかを確認するための応答、一の述語は他の述語の手段・結果になっているかを確認するための応答、のいずれか1つの応答を生成する
    請求項1に記載の応答生成装置。
  3. 予め用意された複数の発話の種類に対してそれぞれ優先度を示した発話選択ルールを記憶する発話選択ルール記憶手段と、
    前記発話選択ルール記憶手段に記憶された発話選択ルールに基づいて、前記応答生成手段により生成された複数の応答から、各々の応答に対応する発話種類の優先度に基づいて、最も優先度の高い発話種類に対応する応答を選択する応答選択手段と、を更に備え、
    前記応答出力手段は、前記応答選択手段により選択された応答を出力する
    請求項2に記載の応答生成装置。
  4. 少なくとも前記解析手段の過去の解析結果を記憶する記憶手段を更に備え、
    前記解析手段は、前記抽出された述語と前記格辞書記憶手段とを照合して、前記抽出された述語に対して必須の格要素が不足するときに、前記不足する格要素を、前記記憶手段に記憶された解析手段の過去の解析結果に含まれる格要素から補完する
    請求項1に記載の応答生成装置。
  5. 少なくとも前記解析手段の過去の解析結果を記憶する記憶手段を更に備え、
    前記解析手段は、前記述語関係記憶手段に基づいて、抽出した述語と、前記記憶手段に記憶されている過去の解析結果に含まれる述語との関係が理由、同格、又は手段・結果のいずれであるかを解析する
    請求項2に記載の応答生成装置。
  6. 少なくとも前記解析手段の過去の解析結果及び前記応答生成手段の過去の生成結果を記憶する記憶手段と、
    前記記憶手段に記憶された情報から発話の主題を抽出し、応答生成手段により生成された複数の応答から、抽出した主題を含む応答を選択する選択手段と、を更に備えた
    請求項1に記載の応答生成装置。
  7. 解析手段、複数の述語と前記各述語に対応する1つ以上の格要素とが予め記憶された格辞書記憶手段を備え、入力手段に入力された発話を解析して、述語及びそれを修飾する格要素を抽出し、前記抽出された述語と前記格辞書記憶手段とを照合して、前記抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から、前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完し、
    応答生成手段、前記解析手段により抽出された述語又は格要素と、格要素を確認するために予め用意された発話、述語が行われた理由、時、場所のいずれか1つを確認するために予め用意された発話、複数の述語同士の関係を確認するために予め用意された発話、のいずれか1つの発話と、に基づいて、前記抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成し、前記解析手段で抽出された述語に対して必須の格要素が補完された場合には、前記解析手段により抽出された述語及び補完された格要素と、述語の必須格が補完された格要素であるかを確認するために予め用意された発話と、に基づいて、前記抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成し、
    応答出力手段、前記応答生成手段により生成された応答のいずれか1つを出力する
    応答生成方法。
  8. コンピュータを、
    発話が入力される入力手段と、
    複数の述語と前記各述語に対応する1つ以上の格要素とが予め記憶された格辞書記憶手段を備え、前記入力手段に入力された発話を解析して、述語及びそれを修飾する格要素を抽出し、前記抽出された述語と前記格辞書記憶手段とを照合して前記抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から、前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完する解析手段と、
    前記解析手段により抽出された述語及び格要素と、格要素を確認するために予め用意された発話、述語が行われた理由、時、場所のいずれか1つを確認するために予め用意された発話、複数の述語同士の関係を確認するために予め用意された発話、のいずれか1つの発話と、に基づいて、前記抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成し、前記解析手段で抽出された述語に対して必須の格要素が補完された場合には、前記解析手段により抽出された述語及び補完された格要素と、述語の必須格が補完された格要素であるかを確認するために予め用意された発話と、に基づいて、前記抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成する応答生成手段と、
    前記応答生成手段により生成された応答のいずれか1つを出力する応答出力手段と、
    して機能させるための応答生成プログラム。
  9. 発話が入力される入力手段と、
    複数の述語と前記各述語に対応する1つ以上の格要素とが予め記憶された格辞書記憶手段を備え、前記入力手段に入力された発話を解析して、述語及びそれを修飾する格要素を抽出し、前記抽出された述語と前記格辞書記憶手段とを照合して前記抽出された述語に対して必須の格要素が不足するときに、抽出された他の述語に対する必須の格要素の中から、前記不足する格要素と同じ必須格を抽出し、抽出した必須格を前記抽出された述語に対する必須の格要素として補完する解析手段と、
    前記解析手段により述語及び格要素が抽出された場合に、前記解析手段により抽出された述語及び格要素と、格要素を確認するために予め用意された発話、述語が行われた理由、時、場所のいずれか1つを確認するために予め用意された発話、複数の述語同士の関係を確認するために予め用意された発話、のいずれか1つの発話と、に基づいて、前記抽出された格要素を確認するための応答、述語が行われた理由、時、場所のいずれか1つを確認するための応答、複数の述語同士の関係を確認するための応答、のいずれか1つの応答を生成し、前記解析手段で抽出された述語に対して必須の格要素が補完された場合には、前記解析手段により抽出された述語及び補完された格要素と、述語の必須格が補完された格要素であるかを確認するために予め用意された発話と、に基づいて、前記抽出された述語の必須格が補完された格要素であるかを確認するための応答を生成する応答生成手段と、
    前記解析手段で述語、格要素のいずれも抽出されなかった場合に、相槌記憶手段に予め記憶された相槌を用いて、相槌を生成する相槌生成手段と、
    前記応答生成手段により生成された応答のいずれか1つ又は前記相槌生成手段により生成された相槌を出力する出力手段と、
    を備えた応答生成装置。
JP2006023682A 2006-01-31 2006-01-31 応答生成装置、方法及びプログラム Expired - Fee Related JP4186992B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006023682A JP4186992B2 (ja) 2006-01-31 2006-01-31 応答生成装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006023682A JP4186992B2 (ja) 2006-01-31 2006-01-31 応答生成装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007206888A JP2007206888A (ja) 2007-08-16
JP4186992B2 true JP4186992B2 (ja) 2008-11-26

Family

ID=38486320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006023682A Expired - Fee Related JP4186992B2 (ja) 2006-01-31 2006-01-31 応答生成装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4186992B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5150277B2 (ja) * 2008-01-25 2013-02-20 日本電信電話株式会社 言語処理装置、言語処理方法および言語処理プログラム並びに言語処理プログラムを記録した記録媒体
JP5045486B2 (ja) * 2008-02-19 2012-10-10 トヨタ自動車株式会社 対話装置及びプログラム
JP5212204B2 (ja) * 2009-03-19 2013-06-19 トヨタ自動車株式会社 応答生成装置及びプログラム
JP5381211B2 (ja) * 2009-03-23 2014-01-08 トヨタ自動車株式会社 音声対話装置及びプログラム
JP5405381B2 (ja) * 2010-04-19 2014-02-05 本田技研工業株式会社 音声対話装置
CN103119585B (zh) * 2010-12-17 2015-12-02 北京交通大学 知识获取装置及方法
JP6375605B2 (ja) * 2013-09-25 2018-08-22 ヤマハ株式会社 音声制御装置、音声制御方法およびプログラム
EP3007165B1 (en) 2013-05-31 2018-08-01 Yamaha Corporation Technology for responding to remarks using speech synthesis
EP2933067B1 (en) * 2014-04-17 2019-09-18 Softbank Robotics Europe Method of performing multi-modal dialogue between a humanoid robot and user, computer program product and humanoid robot for implementing said method
JP6649200B2 (ja) * 2016-08-04 2020-02-19 日本電信電話株式会社 発話生成装置、方法、及びプログラム
JP6775465B2 (ja) * 2017-04-21 2020-10-28 日本電信電話株式会社 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム
US11971915B2 (en) * 2019-06-18 2024-04-30 Nippon Telegraph And Telephone Corporation Language processor, language processing method and language processing program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117923A (ja) * 1999-10-21 2001-04-27 Cai Kk コンピュータによる自然語対話システム
JP2001175657A (ja) * 1999-12-21 2001-06-29 Ricoh Co Ltd 自然言語対話装置、その方法および記憶媒体
JP2004191407A (ja) * 2002-12-06 2004-07-08 Casio Comput Co Ltd 会話システム及び会話処理プログラム
JP2005213318A (ja) * 2004-01-28 2005-08-11 Tokyo Printing Ink Mfg Co Ltd ポリオレフィン系樹脂組成物とその成形品

Also Published As

Publication number Publication date
JP2007206888A (ja) 2007-08-16

Similar Documents

Publication Publication Date Title
JP4186992B2 (ja) 応答生成装置、方法及びプログラム
JP4826275B2 (ja) 応答生成装置、方法及びプログラム
JP7204690B2 (ja) 作成者が提供したコンテンツに基づいて対話型ダイアログアプリケーションを調整すること
JP3454897B2 (ja) 音声対話システム
JP3994368B2 (ja) 情報処理装置および情報処理方法、並びに記録媒体
US8180647B2 (en) Automated sentence planning in a task classification system
WO2016067418A1 (ja) 対話制御装置および対話制御方法
KR101203188B1 (ko) 개인 운율 모델에 기반하여 감정 음성을 합성하기 위한 방법 및 장치 및 기록 매체
Russo et al. Dialogue systems and conversational agents for patients with dementia: The human–robot interaction
JP4729902B2 (ja) 音声対話システム
Wilks et al. Some background on dialogue management and conversational speech for dialogue systems
Pittermann et al. Handling emotions in human-computer dialogues
JP2009037458A (ja) 応答システム、及び応答内容制御方法
JP2008152637A (ja) 応答生成装置及び応答生成プログラム
JP2005284209A (ja) 音声認識方式
JP5381211B2 (ja) 音声対話装置及びプログラム
López et al. Lifeline dialogues with roberta
JP2000330588A (ja) 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体
Griol et al. Fusion of sentiment analysis and emotion recognition to model the user's emotional state
Ondas et al. Design and development of the Slovak multimodal dialogue system with the BML Realizer Elckerlyc
Ferreira et al. Natural Language Processing and Cloud Computing in Disease Prevention and Management
JPH11102196A (ja) 音声対話システム及び音声対話方法及び記録媒体
JP4056298B2 (ja) 言語コンピュータ、言語処理方法、ならびに、プログラム
Hunyadi et al. Incompleteness and fragmentation: Possible formal cues to cognitive processes behind spoken utterances
Carrión On the development of Adaptive and Portable Spoken Dialogue Systems: Emotion Recognition, Language Adaptation and Field Evaluation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080121

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080407

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080819

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080901

R151 Written notification of patent or utility model registration

Ref document number: 4186992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130919

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees