JP2004191407A - 会話システム及び会話処理プログラム - Google Patents
会話システム及び会話処理プログラム Download PDFInfo
- Publication number
- JP2004191407A JP2004191407A JP2002355628A JP2002355628A JP2004191407A JP 2004191407 A JP2004191407 A JP 2004191407A JP 2002355628 A JP2002355628 A JP 2002355628A JP 2002355628 A JP2002355628 A JP 2002355628A JP 2004191407 A JP2004191407 A JP 2004191407A
- Authority
- JP
- Japan
- Prior art keywords
- adjective
- conversation
- user
- data
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Toys (AREA)
Abstract
【課題】複雑な処理を必要とせずに、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることのできる会話システムを提供する。
【解決手段】不揮発性メモリ17の情報記憶領域20の国語辞書データから得られる形容詞または形容動詞の語幹データと情報記憶領域22の活用語尾データを用いて、音声入力部12を通じて入力されたユーザの発言の中から形容詞または形容動詞を抽出する。このユーザの発言から抽出された形容詞または形容動詞を利用して、その発言に対する返事としての発言文を作成して音声出力部14により出力する。形容詞や形容動詞は人間の感性にかかわる言葉なので、これを利用することで複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現できる。
【選択図】 図1
【解決手段】不揮発性メモリ17の情報記憶領域20の国語辞書データから得られる形容詞または形容動詞の語幹データと情報記憶領域22の活用語尾データを用いて、音声入力部12を通じて入力されたユーザの発言の中から形容詞または形容動詞を抽出する。このユーザの発言から抽出された形容詞または形容動詞を利用して、その発言に対する返事としての発言文を作成して音声出力部14により出力する。形容詞や形容動詞は人間の感性にかかわる言葉なので、これを利用することで複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現できる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、会話型ロボット等の玩具類やテレビゲーム機などに用いられる会話システムであって、ユーザがコンピュータを相手に会話することで楽しみや安らぎなどを得ることのできる会話システム及び会話処理プログラムに関する。
【0002】
【従来の技術】
従来、テレビゲーム機や玩具等に用いられる会話システムの多くは、通常、予め決められたシナリオに沿って会話を行う方式(以下、「シナリオ方式」と呼ぶ)を採用している。この「シナリオ方式」で用いられるシナリオは、実現性を考慮して、会話システムがまず話題を限定するような発言を行い、その後の会話の進展も、分岐が極力少なくなるように作られている。このため、人間(ユーザ)が会話の主導権をとれず、会話の流れが平凡だったり、不自然だったりするなどの欠点がある。
【0003】
そこで、「シナリオ方式」以外の会話システムとして、「人工知能」的な会話システムが考えられている。この「人工知能」的な会話システムとは、ユーザの発言を構文解析することにより意味を抽出して、発言の意図を理解し、それに基づいて返事を作り出そうとするシステムである。
【0004】
なお、従来、「シナリオ方式」を用いた会話システムとして、例えば特許文献1の「模擬会話システム」が知られている。この「模擬会話システム」では、ユーザの発した言葉が認識できなかった場合であっても会話の継続進行を実現するために、質問に対して登録されている登録語か否かを判別し、登録語がである場合には当該登録語に応じて返答文を決定し、登録語がでない場合には会話状況に応じて次の質問を決定する。
【0005】
【特許文献1】
特開2002−169590号公報
【0006】
【発明が解決しようとする課題】
上述したように、「シナリオ方式」以外の会話システムとして、「人工知能」的な会話システムが考えられている。しかしながら、この「人工知能」的な会話システムは、ユーザの発言を構文解析すると共に意味を抽出し、発言の意図を理解するといった人間の頭脳に近い複雑な処理を行って会話を実現するものである。このため、高度な技術が必要であると共に、あるゆる分野に対応させることは困難である。つまり、例えば「切符販売」や「情報検索」などのように、会話が限定された分野にしか適用することができない。
【0007】
そこで、本発明は、複雑な処理を必要とせずに、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることのできる会話システム及び会話処理プログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
(1) 本発明の会話システムは、ユーザとの間で会話を行う会話システムであって、会話相手であるユーザの発言を入力する入力手段と、この入力手段から入力されたユーザの発言に含まれる特定の品詞を抽出する品詞抽出手段と、この品詞抽出手段によって抽出された特定の品詞を利用して当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、この発言文作成手段によって作成された発言文を出力する出力手段とを具備して構成される。
【0009】
このような構成の会話システムによれば、ユーザの発言に含まれる特定の品詞が利用されて、その発言に対する返事としての発言文が作成される。この特定の品詞とは、具体的には形容詞または形容動詞である。形容詞や形容動詞は、人間の感性にかかわる言葉なので、これを利用することで複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現できるものであり、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。
【0010】
(2) 本発明の会話システムは、ユーザとの間で会話を行う会話システムであって、会話相手であるユーザの発言を入力する入力手段と、形容詞または形容動詞の語幹を表すデータ、形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶した記憶手段と、この記憶手段の語幹データおよび活用語尾データに基づいて、前記入力手段から入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する品詞抽出手段と、この品詞抽出手段によって抽出された形容詞または形容動詞を前記記憶手段の基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、この発言文作成手段によって作成された発言文を出力する出力手段とを具備して構成される。
【0011】
このような構成の会話システムによれば、会話相手であるユーザの発言が入力された際に、予め記憶された形容詞または形容動詞の語幹データおよび活用語尾データに基づいて、そのユーザの発言の中から形容詞または形容動詞が抽出される。そして、この抽出されたユーザ発言中の形容詞または形容動詞が予め記憶された基本構成文データに適用されて、当該ユーザの発言に対する返事としての発言文が作成される。
【0012】
このようにして、ユーザの発言に含まれる形容詞または形容動詞を利用した発言がなされる。形容詞や形容動詞は、人間の感性にかかわる言葉なので、これを利用することで、複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現できるものであり、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。
【0013】
また、前記構成の会話システムにおいて、前記品詞抽出手段は、ユーザの発言の中に包含関係にある形容詞または形容動詞が存在する場合に、包含される方を除外することを特徴とする。これにより、例えば「暑苦しかった」とユーザが発言した場合に、そのユーザ発言の中から「暑苦しかった」の他に「苦しかった」の両方を抽出してしまう不具合を回避できる。
【0014】
また、前記構成の会話システムにおいて、前記発言文作成手段は、前記品詞抽出手段によって複数の形容詞または形容動詞が抽出された場合に、ユーザの発言の中で最も後方に位置するものを発言文の作成に採用することを特徴とする。これにより、例えば「彼女は美しいが冷たい」とユーザが発言した場合に、「美しい」と「冷たい」のうちの「冷たい」が発言文の作成に採用されることになる。これは、話者はより強く伝えたい形容詞を後方に置くことケースが多いことによるものである。
【0015】
また、前記構成の会話システムにおいて、否定、質問、仮定、推定、伝聞のうちの少なくとも1つの意味を表す可能性のある文要素データを記憶した文要素データ記憶手段と、ユーザの発言の中に前記文要素データ記憶手段の文要素データが含まれている場合に、そこから抽出された形容詞または形容動詞を利用した発言を回避する発言回避手段とをさらに具備したことを特徴とする。これは、通常、ユーザの発言に、否定、質問、仮定、推定、伝聞などの要素が含まれている場合には、そこから抽出した形容詞または形容動詞を利用して「相手にフィードバックする発言」をするとおかしくなるので、これを回避するものである。
【0016】
(3) 本発明の会話システムは、ユーザとの間で会話を行う会話システムであって、会話相手であるユーザの発言を入力する入力手段と、国語辞書データを記憶した第1の記憶手段と、形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶した第2の記憶手段と、前記第1の記憶手段の国語辞書データに基づいて会話処理に用いる形容詞または形容動詞の語幹データを作成する語幹作成手段と、この語幹作成手段によって作成された形容詞または形容動詞の語幹データと前記第2の記憶手段に記憶された活用語尾データとに基づいて、前記入力手段から入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する品詞抽出手段と、この品詞抽出手段によって抽出された形容詞または形容動詞を前記第2の記憶手段の基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、この発言文作成手段によって作成された発言文を出力する出力手段とを具備して構成される。
【0017】
このような構成の会話システムによれば、国語辞書データに基づいて会話処理に用いる形容詞または形容動詞の語幹データが作成される。会話相手であるユーザの発言が入力されると、その形容詞または形容動詞の語幹データと予め記憶された活用語尾データに基づいて、そのユーザの発言の中から形容詞または形容動詞が抽出される。そして、この抽出されたユーザ発言中の形容詞または形容動詞が予め記憶された基本構成文データに適用されて、当該ユーザの発言に対する返事としての発言文が作成される。
【0018】
このようにして、ユーザの発言に含まれる形容詞または形容動詞を利用した発言がなされる。形容詞や形容動詞は、人間の感性にかかわる言葉なので、これを利用することで「相手にフィードバックする発言」を複雑な処理を必要とせずに簡単に実現できるものであり、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。さらに、電子辞書機能の1つである国語辞書のデータを利用して、会話処理に必要な形容詞または形容動詞の語幹データを得ることができる。
【0019】
また、前記構成の会話システムにおいて、前記品詞抽出手段は、ユーザの発言に含まれる形容詞または形容動詞と同じ語句が他の品詞として前記国語辞書データに存在する場合には、それを除外することを特徴とする。これにより、例えば「早い者勝ちだよ」とユーザが発言した場合に、そこから抽出される「早い」を採用して「早いと感じたのですね」と発言してしまうなど、不適切なフィードバック型発言をしてしまうことを回避することができる。
【0020】
また、前記構成の会話システムにおいて、予め除外対象として指定された特定の形容詞または形容動詞を記憶した除外対象記憶手段を備え、前記語幹作成手段は、前記除外対象記憶手段に記憶された特定の形容詞または形容動詞を除いて、前記国語辞書データから会話処理に用いる形容詞または形容動詞の語幹データを抽出することを特徴とする。
【0021】
例えば、「いけない」は「悪い」という意味の形容詞の場合もあるが、「行けない」という意味である可能性もある。「行けない」という意味で「いけない」は複数の品詞の合成語なので他の処理ではこれを排除できない。このようなフィードバック型の発言にとって不都合な形容詞(「いけない・」、「あお・い」、「あか・い」など)を予め除外対象として指定しておくことで、これらを除去して適切なフィードバック型発言を行うことができる。
【0022】
【発明の実施の形態】
まず、本発明の会話システムによって実現される会話処理の概要について説明する。
【0023】
本発明の会話システムは、単なる相槌ではなく、会話相手の真意を問うような、あるいは、再考を促すような発言を複雑な処理を必要とせずに実現するものである。このような相手の真意を問うような発言、再考を促すような発言などのことを「相手にフィードバックする発言」と呼ぶ。これに対し、「単なる相槌」とは、例えば「そうだね」,「そうそう」などのように、どんな場面でも使えてしまうような同意や共感の発言のことである。「単なる相槌」が続くと、会話システムが共感してくれているという満足を人間(ユーザ)は得にくくなる。さらには、自分の話を本当に聞いてくれているのだろうか、などと疑いを持つようにもなる。
【0024】
ここで、会話システムは、雑談などの自然な会話における人間の任意の発言を解析してその意味を理解することは難しく、非常に高性能な情報処理を必要とする。このため、上述した「相手にフィードバックする発言」を実現するためには、人間の発言の意味が分かっていなくても対応できるような、単純で実現的な仕組みを考える必要がある。
【0025】
そこで、本発明では、人間(ユーザ)の発言の中にある形容詞と形容動詞を利用することで、「相手にフィードバックする発言」を作り出す。形容詞、形容動詞がこの現実的な仕組みを提供してくれる主な理由は次の通りである。
【0026】
(1) 形容詞や形容動詞は、人間の感性にかかわる言葉なので、これらに焦点をあてて「相手にフィードバックする発言」を行うと、適切で高い効果の出る場合が多い。なお、他の品詞の場合には、人間が単に事実を述べているだけである可能性も高く、そのような品詞に焦点をあてて「相手にフィードバックする発言」を行っても、不適切だったり効果が少なかったりする。
【0027】
(2) 形容詞、形容動詞は活用変化が単純なので処理が簡単である。例えば、動詞を利用しようとすると活用変化の処理が複雑で難しくなる。
【0028】
(3) 形容詞や形容動詞に対しての「相手にフィードバックする発言」ならば、大胆に省略を用いた単純な発言で済ますことができる。他の品詞を対象とした場合には、人間の発言の中から他の語句を見つけ出す必要ができてしまうことが多い。例えば、動詞であれば、主語や目的語や修飾語を伴わないと極端に舌足らずな発言となる可能性が高い。そのような語句を人間の発言の中から間違わずに抽出するのは非常に難しい。また、抽出できたとしても、それらを使って正しい日本語を組み立てるのも難しい。
【0029】
本実施形態では、説明を簡潔にするために、形容詞だけを用いて「相手にフィードバックする発言」を行う場合を想定して説明する。また、本出願人によって出願済みの文章データベースを利用した会話処理(特願2002−233090号公報参照)と、人工知能のような高度な処理を行わずに本当の会話らしいものを実現する、一般に人工無能と称される方式の会話処理を併用して「相手にフィードバックする発言」を作り出す処理を行い、これらの異なった味わいのある発言を適切に組み合わせて会話を行うものとする。
【0030】
前者の会話処理(特願2002−233090号公報に開示されている方式)のことをここでは「文章データベース利用型会話処理」と呼び、後者の人工無能と称される方式の会話処理をここでは単に「人工無能型会話処理」と呼ぶことにする。これらについては前記公報に詳しく記載されているため、ここではその詳しい説明は省略するものとする。
【0031】
以下、図面を参照して本発明の一実施形態に係る会話システムについて説明する。
【0032】
図1は本発明の一実施形態に係る会話システムのハードウェア構成を示すブロック図である。この会話システムは、ユーザの発言に対し、あたかも人間が返事をしているかの如く発言して会話を進めるためのものであり、例えば会話型ロボット等の玩具類やテレビゲーム機などに搭載される。
【0033】
図1では、本システムを汎用のコンピュータによって実現した場合の基本的な構成が示されており、CPU11、音声入力部12、A/D変換部13、音声出力部14、D/A変換部15、ワークメモリ16、不揮発性メモリ17によって構成されている。
【0034】
CPU11は、不揮発性メモリ17などに記憶されたプログラムを読み込むことにより、そのプログラムに記述された手順に従って所定の処理を実行する。音声入力部12は、会話時にユーザの音声を入力するためのマイクである。この音声入力部12から入力されたユーザの音声(アナログデータ)はA/D変換部13でデジタルデータに変換されてCPU11に取り込まれる。CPU11はワークメモリ16を用いて処理を行い、ユーザの発言に対する返事をD/A変換部15を介して出力する。D/A変換部15は、CPU11によって生成された音声データをアナログデータに変換して音声出力部14に与える。音声出力部14は、これを外部に出力するためのスピーカである。
【0035】
ワークメモリ16には、CPU11の処理動作に必要なデータが記憶される。このワークメモリ16には、後述する発言処理選択用の初期相対確率テーブルT1の値をバッファしておくための相対確率テーブルバッファ16aや、後述するフィードバック型発言処理時に用いられる形容詞の語幹+形容詞対象活用語尾データのリストをバッファしておくためのリストバッファ16bなどが設けられている。
【0036】
不揮発性メモリ17は、例えばフラッシュメモリからなり、電源が切れても記憶内容が消えない書き換え可能なメモリである。この不揮発性メモリ17には、本発明の会話システムを実現するためのプログラムが記憶されたプログラム領域17aの他、会話処理に必要な各種情報が記憶された情報記憶領域18〜25が設けられている。
【0037】
不揮発性メモリ17の情報記憶領域18には、上述した文章データベース利用型会話処理用のデータが記憶されている。この文章データベース利用型会話処理用データは、文章データベースとこの文章データベースを利用して会話処理するのに必要な前回発言日時などを含む各種データからなる。
【0038】
文章データベースとは、例えば小説、戯曲、映画やドラマのシナリオ、落語や漫才の記録、実際の会話記録など、会話文を含んだ既存の文章情報を対象として、その文章情報から会話部分の文章だけを抜き出して作成されたデータベースや、例えばニュース記事など、会話文を含まない既存の文章情報(書き言葉による文章情報)を対象として、その文章情報から会話として利用可能な部分の文章を抜き出して作成されたデータベースなどである。文章データベース利用型会話処理では、このような既存文章から会話に利用可能な文章を抽出して集めておき、ユーザの発言に対して、これらの中から適切な文章を選んで発言することを特徴としている。
【0039】
不揮発性メモリ17の情報記憶領域19には、パターン対応返事データベース+前回発言日時が記憶されている。このパターン対応返事データベース+前回発言日時は、人工無能型会話処理で用いるパターン対応返事データベースと、その中の登録返事ごとに設けた前回発言日時データである。前記文章データベース利用型会話処理の場合と同様に、ある登録返事を発言として用いた場合には、その時点の日時を対応する前回発言日時データに記録し、それを用いて、同じ登録返事をしばらくの間採用しないようにする。
【0040】
不揮発性メモリ17の情報記憶領域20〜24には、フィードバック型会話処理に必要な情報が記憶されいる。このうち、情報記憶領域20には、国語辞書データが記憶されている(図2参照)。この国語辞書データは、電子辞書機能の1つとして搭載されており、通常は、言葉の意味を調べる場合などに用いられる。本実施形態では、この国語辞書データをフィードバック型会話処理に利用するものである。
【0041】
情報記憶領域21には、除外形容詞リストが記憶されている。情報記憶領域22には、形容詞対象活用語尾データが記憶されている。情報記憶領域23には、発言構成データ+前回発言日時が記憶されている。これらの除外形容詞リスト、形容詞対象活用語尾データ、回避文要素データ、発言構成データ+前回発言日時の各データは、「相手にフィードバックする発言」を作り出すための形容詞関連データとして用いられる(図3参照)。
【0042】
情報記憶領域24には、回避文要素データが記憶されている(図4参照)。回避文要素データは、「相手にフィードバックする発言」として不適切な要素を示したもので、「否定」、「質問」、「仮定」、「推定」、「伝聞」などの各要素に分類される。
【0043】
また、不揮発性メモリ17の情報記憶領域25には、発言処理選択用の初期相対確率テーブルT1が記憶されている。この初期相対確率テーブルT1は、上述した3つの異なる発言処理(会話処理を実現するアルゴリズム)を選択するためのテーブルである。これらのアルゴリズムに対応した会話処理毎に数値が設定されていて、その数値の大きさがそのアルゴリズムの会話処理が選択される相対的な確率に反映される。
【0044】
本実施形態における初期相対確率テーブルT1には、文章データベース利用型会話処理に「5」、人工無能型会話処理に「3」、「相手にフィードバックする発言」を作成するフィードバック型会話処理に「2」といった値が予め初期値として設定されているものとする。
【0045】
図2は本システムの不揮発性メモリ17の情報記憶領域18に記憶された国語辞書データの一例を示す図である。
【0046】
本実施形態では、国語辞書データを利用して、フィードバック型会話処理に必要な形容詞の語幹データを作成する。国語辞書データは、電子辞書機能の1つであって、図2に示すように、各語句毎にその項目見出しとそれに対応した説明のデータからなる。なお、図中の「…」は他にも多くの項目があることを表している。
【0047】
図3は本システムの不揮発性メモリ17の情報記憶領域21〜23に記憶された形容詞関連データの一例を示す図である。この形容詞関連データは、除外形容詞リスト、形容詞対象活用語尾データ、発言構成データ+前回発言日時を含んでいる。
【0048】
除外形容詞リストは、フィードバック型の発言にとって不都合な形容詞を除外対象としてリストアップしたものであり、「いけない・」、「あお・い」、「あか・い」などが含まれている。
【0049】
形容詞対象活用語尾データは、国語辞書データなどから発言対象として抽出された形容詞の語幹に付加する活用語尾を示したものであり、「い」や「かった」などが含まれる。例えば国語辞書データにおいて、形容詞の項目見出し「あつくるし・い[暑苦しい]」の語幹部分は「あつくるし[暑苦し]」であり、これに対し、形容詞対象活用語尾データの「い」と「かった」を繋ぐことで、「あつくるしい」、「暑苦しい」、「あつくるしかった」、「暑苦しかった」を作成する。
【0050】
発言構成データ+前回発言日時は、発言構成データとそれを用いて発言したときの日時を示している。発言構成データとは、例えば「“形容詞語幹”+“い”とかんじたのですね」や「たしかに“形容詞語幹”+“活用語尾”」、「そうですか。“形容詞語幹”+“い”と感じたと思いますか」…といったように、形容詞を利用した発言(相手にフィードバックする発言)の基本構成を示すものである。
【0051】
図4は本システムの不揮発性メモリ17の情報記憶領域24に記憶された回避文要素データの一例を示す図である。
【0052】
否定、質問、仮定、推定、伝聞などの意味を表す可能性のある発言は、「相手にフィードバックする発言」には不適切であり、これらは予め回避文要素データとして情報記憶領域24に記憶されている。
【0053】
図4において、回避文要素データの中の「*」は任意の文字数の文字を表すワイルドカード文字である。例えば、「*いつ*」はユーザの発言のどこかに「いつ」という文字があることを意味し、「*か」はユーザの発言の最後が「か」であることを意味する。また、「[]」の記号に挟まれた部分は、この中の文字のどれか一文字であることを意味する。例えば、「*[いだ]と*」は、ユーザの発言のどこかに、「いと」または「だと」が含まれることを意味する。
【0054】
このような構成の会話システムにおいて、音声入力部12から入力されたユーザの音声はA/D変換部13にてデジタルデータに変換された後、CPU11に与えられる。CPU11では、「音声認識処理」→「会話処理」→「読み上げ処理」といった順で各処理を行ってユーザの発言に対する返事を返す。
【0055】
すなわち、まず、「音声認識処理」により音声から文字への変換を行ってテキスト形式の文章を作成する。なお、「音声認識処理」では仮名漢字変換処理も同時に行われているものとする。次に、このテキスト形式の文章に対して「会話処理」を施してユーザの発言に対する返事を作成し、これを「読み上げ処理」によって読み上げる。このときCPU11にてユーザに対する返事として生成された音声データはD/A変換部15によってアナログデータに変換された後、音声出力部14を通じて出力される。
【0056】
ここで、「音声認識処理」と「読み上げ処理」については一般的に知られている手法を用いるものとしてその詳しい説明は省略する。以下では、本システムの「会話処理」を中心に、図5乃至図7に示すフローチャートを参照して具体的な処理手順について詳しく説明する。なお、これらのフローチャートで示される処理は、本システムに備えられたCPU11がプログラムを読み込むことで実行する。
【0057】
図5は本システムにおける発言作成処理の流れを示すフローチャートであり、本システムに搭載された複数(ここでは3つ)の会話処理を確率的に選択する処理を示している。この発言作成処理は、本システムの話相手であるユーザの発言後に、それに対する返事としての発言を作成する場合に実行される。
【0058】
上述したように、本システムでは、アルゴリズムの異なる会話処理として、文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の3種類の会話処理を備えており、これらに対する選択確率の初期値が初期相対確率テーブルT1に設定されている。
【0059】
CPU11は、まず、この初期相対確率テーブルT1の値をワークメモリ16の相対確率テーブルバッファ16aにコピーする(ステップA11)。そして、CPU11は、この相対確率テーブルバッファ16aにコピーされた初期相対確率テーブルT1の値が示す相対的な確率に従って、前記3つの会話処理の1つを選択する(ステップA12)。
【0060】
初期時における文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の比率は5対3対2である。すなわち、文章データベース利用型会話処理は5割の確率で、人工無能型会話処理は3割の確率で、フィードバック型会話処理は2割の確率で選択されるようになっている。これにより、どの会話処理によって発言されるのかはランダムで予測がつかないようにしながら、各会話処理の大局的な比率をコントロールして全体的な会話の味わいを制御できる。
【0061】
前記ステップA12において、文章データベース利用型会話処理が選択されたとすると、CPU11は不揮発性メモリ17の情報記憶領域18に記憶されたデータを用いて文章データベース利用型会話処理を実行し、会話相手であるユーザに対する発言を行う(ステップA13)。その際に、CPU11は、相対確率テーブルバッファ16aに現在セットされている文章データベース利用型会話処理の値を0にする(ステップA14)。
【0062】
また、人工無能型会話処理が選択された場合、あるいは、フィードバック型会話処理が選択された場合でも同様であり、CPU11はその選択された会話処理を実行して発言を行うと共に、当該会話処理に対応した確率の値を0にする(ステップA15〜A18)。
【0063】
なお、人工無能型会話処理には、不揮発性メモリ17の情報記憶領域19に記憶されたデータが用いられる。フィードバック型会話処理には、不揮発性メモリ17の情報記憶領域20〜24に記憶されたデータが用いられる。フィードバック型会話処理については、後に図6および図7のフローチャートを参照して詳しく説明する。
【0064】
ここで、選択された会話処理を用いて発言することができれば、それで発言作成処理は終わる。しかし、ユーザが発言の内容や、それ以前の会話システムの発言の経緯で、選択された会話処理では発言ができない場合がある。例えば、その会話処理で対応するのが困難な種類の発言をユーザが発したり、内容としては利用可能な発言が見つけだせるが、その発言の前回発言日時からすると充分な時間が経過していない場合などである。このような場合には発言せずに終わると、無口な会話システムになってしまうので、以下のようにして他の会話処理での発言を試みる。
【0065】
すなわち、1回目にステップA12にて文章データベース利用型会話処理が選択されたが発言できなかったとすると(ステップA19→A20のNo)、2回目にはステップA12に来たときには、文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の選択確率の比が0対3対2に更新される。したがって、人工無能型会話処理は6割の確率で、フィードバック型会話処理は4割の確率で選択されることになる。3回目にステップA12に来たときには残った会話処理が必ず選択される。なお、3回とも発言できなかった場合、つまり、すべての値が0になった場合には(ステップA20のYes)、ここでは処理を終了して発言なしとする。
【0066】
このように、文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の3種類の会話処理を任意選択的に使用してユーザに対する発言を行って会話を進めていく。
【0067】
次に、前記各会話処理のうちのフィードバック型会話処理について詳しく説明する。なお、文章データベース利用型会話処理と人工無能型会話処理の説明については省略するものとする。
【0068】
図6および図7は本システムにおけるフィードバック型発言処理の流れを示すフローチャートである。なお、フィードバック型発言処理を構成する各ステップB11〜B24の処理のうち、ステップB11とB12は処理A、ステップB13〜B15は処理B、ステップB16〜B20は処理Cとして括ることができる。
【0069】
CPU11は、まず、不揮発性メモリ17の情報記憶領域20に記憶された国語辞書データを利用して会話処理に用いる形容詞を見つけ出す(ステップB11)。国語辞書データは、電子辞書機能の1つとして本システムに搭載されたものであって、図2に示すように項目見出しとその項目見出しに対応する説明データを有する。
【0070】
この国語辞書データから会話処理に用いる形容詞を見つけ出すには、国語辞書データの「説明」の部分に形容詞であることを示す特定の記号(例えば(形))が付された項目を検索すれば良い。ただし、他の品詞の意味も含んだ項目について除外するので、「な・い[ない・無い]」のように、形容詞以外の記号(例えば(補形))が含まれる項目については除外するものとする。これを除外するのは、「美しくない」などの「ない」を形容詞と間違えて採用してしまわないようにするためである。
【0071】
また、前記ステップB11において、形容詞であっても、不揮発性メモリ17の情報記憶領域21に記憶された除外形容詞リストに登録されているものは除外する。この除外形容詞リストを用いて、なぜ一部の形容詞を除外するのかについては後に述べる。
【0072】
続いて、CPU11は、不揮発性メモリ17の情報記憶領域22に記憶された形容詞対象活用データを用いて、国語辞書データから抽出した形容詞の語幹に形容詞対象活用データを繋いだ文字列をユーザの発言の中からパターンマッチィングにより検索し、該当するものをすべてリストアップしてワークメモリ16のリストバッファ16bに格納する(ステップB12)。
【0073】
国語辞書データを利用して形容詞の語幹を抽出するには、国語辞書データの項目見出しの書式の記号を削除するとともに、項目見出しの最初の語の区切り記号「・」より後が活用語尾であることを利用すれば良い。
【0074】
図2に示すように、例えば形容詞の項目見出し「あつくるし・い[暑苦しい]」であれば、その中に含まれる「・」や「[]」は単なる記号であり、「・」の後の「い」が活用語尾を示している。したがって、この項目に対しては、「あつくるし」と「暑苦し」が形容詞の語幹として抽出されることになる。これに、図3に示す形容詞対象活用語尾データの「い」と「かった」を繋ぐと、「あつくるしい」、「暑苦しい」、「あつくるしかった」、「暑苦しかった」の4種類ができる。これがユーザの発言の中にあるか否かを調べる。
【0075】
例えば、ユーザの発言が「あの部屋は暑苦しかった」だったとすると、その中の「暑苦しかった」がリストアップされることになる。同様の処理を他の形容詞についても行う。この例の場合には、「暑苦しかった」の他に「苦しかった」もリストアップされることになる。
【0076】
次に、CPU11は、前記ステップB12でリストアップした形容詞の語幹+形容詞対象活用語尾データの中から位置も含めた包含関係にあるものを調べる(ステップB13)。該当するものがあれば(ステップB14のYes)、CPU11は包含される方(文字数の少ない方)をリストから外す(ステップB15)。
【0077】
前記「位置も含めた包含関係」とは、例えば「暑苦しかった」と「苦しかった」のような関係のことである。つまり、ユーザの発言として、例えば「暑苦しかった」があり、これに対して「暑苦しかった」の他に、「苦しかった」の方も抽出してしまった場合である。両方を採用すると間違った返事になるので、一方をリストから外す。この場合、包含される方(つまり、文字数の少ない方)の形容詞である「苦しかった」をリストから外すものとする。
【0078】
なお、「苦しい」は「暑苦しい」に含まれてしまうからといって最初から「苦しい」を除外すると、例えば「今日のトレーニングは苦しかった」といったユーザの発言に対してフィードバック型発言ができなくなる。つまり、位置も考慮に入れるというのは、「暑苦しかった。とても苦しかったよ」の中の「苦しかった」については除外しないことを意味している。
【0079】
次に、CPU11は、リストアップした形容詞の語幹+形容詞対象活用語尾データを含む他の品詞の項目見出しが国語辞書データの中にないかを調べる(ステップB16)。国語辞書データの中に該当するものがあれば(ステップB17のYes)、さらにCPU11はその見出し語がユーザの発言の中の対応する形容詞の語幹+形容詞対象活用語尾データのところにあるか否かを調べる(ステップB18)。その結果、ユーザの発言に該当するものがあった場合には(ステップB19のYes)、CPU11はその形容詞の語幹+形容詞対象活用語尾データをリストから外す(ステップB20)。
【0080】
すなわち、前記の例で言えば、ユーザの発言「暑苦しかった」が国語辞書データの項目見出しに含まれないかを調べることになる。この場合、「暑苦しかった」は国語辞書データの中に他の品詞としてはないので、リストから外されることはない。これにより、「暑苦しかった」だけがリストに残されて次の処理へと進むことになる。
【0081】
このようにして、リストアップされた語幹+形容詞対象活用語尾データを所定の条件により絞り込み、発言に適切なものだけを残す。ここで、CPU11はリストに残った形容詞の語幹+形容詞対象活用語尾データの数を調べる(ステップB21)。その結果、形容詞の語幹+形容詞対象活用語尾データの数が0個である場合には、発言不可であるので、ここでのフィードバック型発言処理を終了する。
【0082】
形容詞の語幹+形容詞対象活用語尾データの数が1個であれば、CPU11は不揮発性メモリ17の情報記憶領域24に記憶された回避文要素データを用いて、ユーザの発言の中にこの回避文要素データが存在するか否かを調べる(ステップB22)。つまり、ユーザの発言「あの部屋は暑苦しかった」に対し、図4に示す回避文要素データが含まれているか否かを調べる。回避文要素データとは、「相手にフィードバックする発言」には不適切な要素(否定、質問、仮定、推定、伝聞など)を定義したものである。
【0083】
この処理により、否定、質問、仮定、推定、伝聞などの意味を表す可能性のある発言を回避する。すなわち、この回避文要素データのどれかがユーザの発言の中にあると、回避文要素データの「分類」で定義されている否定、質問、仮定、推定、伝聞などの要素が含まれる可能性があると考えられる。ユーザの発言にこのような要素が含まれている場合に、「相手にフィードバックする発言」をするとおかしくなる。そこで、それらの可能性がないときだけ、フィードバック型発言を行うものとする。前記の例では、「あの部屋は暑苦しかった」はどの回避文要素データも含まないので次の処理へ進む。
【0084】
ユーザの発言の中に回避文要素データがなかった場合には(ステップB22のNo)、CPU11は不揮発性メモリ17の情報記憶領域23に記憶された発言構成データ+前回発言日時を用いて、再度発言に用いるには早すぎる発言構成データを除外し、残った発言構成データの中からランダムに1つを選択する(ステップB23)。
【0085】
「再度発言に用いるには早すぎる発言構成データ」とは、例えば少なくとも当日の前回発言日時を有する発言構成データなどである。このような発言構成データを除外しておくことで、ユーザに対して同じセリフを発言してしまうことを回避する。発言構成データは、図3で説明したように、例えば「“形容詞語幹”+“い”とかんじたのですね」や「たしかに“形容詞語幹”+“活用語尾”」、「そうですか。“形容詞語幹”+“い”と感じたと思いますか」…といったように、形容詞を利用した発言(相手にフィードバックする発言)の基本構成を示すものである。
【0086】
次に、CPU11は前記選択した発言構成データを用いて、「相手にフィードバックする発言」を作成して発言する(ステップB24)。詳しくは、前記選択した発言構成データの「¥形容詞語幹¥」の部分を形容詞語幹とし、「$活用語尾$」の部分を形容詞対象活用語尾データに置き換えることで、発言用の文データを作成し、これを音声処理して発言する。
【0087】
前記の例で説明すると、ユーザの発言「暑苦しかった」に対し、「暑苦しいと感じたのですね」、「たしかに暑苦しかった」、「どうして暑苦しいと感じたと思いますか」などを作成して返事として発言することになる。これにより、「相手にフィードバックする発言」を実現できる。
【0088】
一方、前記ステップB21において、リストに残った形容詞の語幹+形容詞対象活用語尾データの数が2個以上であった場合には、CPU11は所定の条件に基づいてそれらの中の1つだけを選択して、他のデータをリストから外す(ステップB25)。
【0089】
この場合、ユーザの発言の中で最も後方にあるものを選択対象とし、その形容詞の語幹+形容詞対象活用語尾データだけを残して、他のデータをリストから外すものとする。例えば、「彼女は美しいが冷たい」とユーザが発言した場合に、「美しい」と「冷たい」の2つがリストに残る。そこで、後方にある「冷たい」を採用する。これは、話者はより強く伝えたい形容詞を後方に置くことケースが多いことによるものである。
【0090】
なお、2個以上の形容詞が残った場合にはフィードバック型の発言をやめる案や、他の語句も解析して決める案など、他の処理で対応する案なども考えられる。
【0091】
以降の処理は前記ステップB22〜B24と同様である。
【0092】
すなわち、ユーザの発言の中に回避文要素データをあるか否かをチェックし(ステップB22)、ユーザ発言に回避文要素データが含まれている場合に、最近発言したものを除いて発言構成データを選択した後(ステップB23)、その発言構成データに基づいて「相手にフィードバックする発言」を作成して発言する(ステップB24)。
【0093】
ところで、上述したフィードバック型発言処理において、処理Cの部分(ステップB16〜B20)は、例えばユーザの発言が「早い者勝ちだよ」といったような場合などに意味を持つ。
【0094】
すなわち、ユーザの発言が「早い者勝ちだよ」であったとすると、その中の「早い」がリストアップされる。しかし、これをそのまま用いて「早いと感じたのですね」と返事したのでは会話として成り立たない。ここで、国語辞書データには、「早い者勝ち」といった語句全体が名詞としての項目見出しにある。また、「早い者勝ち」はユーザの発言「早い者勝ちだよ」の中にあるので、前記処理Cにより、「早い」は発言用のリストからは外されることになる。
【0095】
また、前記ステップB22において、ユーザの発言に否定、疑問、仮定、推定、伝聞などの意味が含まれる可能性がある場合に、フィードバック型発言を避けるのは、例えば「あの部屋は暑苦しいですか」、「あの部屋が暑苦しかったらどうしよう」、「あの部屋が暑苦しいとは思わない」などに対して、「暑苦しいと感じたのですね」などと返事をしたのではおかしいからである。
【0096】
ユーザの発言の中に、これらの意味があるかどうかを正確に判定するのは非常に難しい。本発明では、それらの意味を含む可能性がある場合を見つけ出す。フィードバック型の発言はそれが可能な場合に必ず行わなくてはならないものではない。むしろ頻度が多すぎると、会話が不自然になることさえある。そこで、ここでは疑わしきは排除する方針をとることができ、回避文要素データを用いてそれらの意味が含まれる可能性を見つけ出すだけで良い。
【0097】
なお、前記ステップB22の処理は、発言構成データの内容にも依存するところなので、本実施形態以外の様々な方法も考えられる。
【0098】
除外形容詞リストにある形容詞は、不都合な場合があるのに他の処理では排除できない特別な形容詞である。例えば、「いけない」は「悪い」という意味の形容詞の場合もあるが、「行けない」という意味である可能性もある。「行けない」という意味で「いけない」は複数の品詞の合成語なので、本実施形態で示した他の処理ではこれを排除できない。また、「赤い」や「青い」などは形容詞ではあるが、これは客観的な情報を述べただけである可能性が高い。例えば、「赤い車を買った」に対して「赤いと感じたのですね」といった発言は不適当な場合の方が多い。
【0099】
これらの形容詞に対してフィードバック型の発言をしないために、本実施形態では、除外形容詞リストを用いて排除している。この除外形容詞リストの内容も発言構成データの内容に依存するので様々な方法が考えられる。例えば、本実施形態では他の品詞があることを調べて除外した「な・い[ない・無い]」などについても、除外形容詞リストを用いて除外しても良い。
【0100】
以上のように、本発明の会話システムによれば、ユーザの発言に使われていた形容詞が会話システムの返事の中に利用されるので、単なる相槌などからは得られないような会話を実現できる。つまり、ユーザは、自分の言ったことを会話システムが理解して返事してくれているといったような強い満足感を得ることができる。
【0101】
形容詞には、人間の感情や意見が反映されている場合が多く、それに焦点をあてた返事ができるので、その返事は人間の感情を動かしたり思考を促したりする可能性が高く、効果的である。ユーザには自らの感情や意見をフィードバックされることになるので、自分の感情や考えを問い直すきっかけとなり、カウンセリング的な効果もある。
【0102】
また、アルゴリズムの異なる複数の会話処理(文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理)から確率的に1つを選んで発言を作成するので、その時々で異なる味わいの発言を行うことができる。つまり、ユーザに発言を予測されないように、様々なタイプの発言を混在しながら会話を進めて行くことができる。これにより、単調な会話や機械的な会話を避けることができる。
【0103】
また、複数の会話処理(アルゴリズム)を選択する相対的な確率をコントロールすることで、異なる味わいの発言のバランスを適切に保つことができる。さらに、選択された会話処理では発言が作成できなかった場合に、最初は選ばれなかった他の会話処理を再び試みることで、ユーザの発言に対して何の応答もできない状態を大幅に減らすことができる。
【0104】
また、他の形容詞に包含される形容詞を除外するので、不適切な返事になることはない。同様に、他の品詞の語句に含まれる形容詞は除外するので、不適切な返事になることはない。
【0105】
(変形例)
前記実施形態では、形容詞を利用する場合を想定して説明したが、形容動詞を利用しても良く、形容詞と形容動詞の両方を用いても良い。
【0106】
また、形容詞対象活用語尾データを2種類しか設けなかったが、他の活用変化やそれに続く他の助詞などを用いたデータを設けても良い。
【0107】
また、異なる形容詞対象活用語尾データに対して同じ処理を行ったが、形容詞対象活用語尾データ毎に、あるいは、それらをグループ分けしたグループ毎に、異なる発言構成データを用いるなど、異なる処理を施しても良い。
【0108】
また、形容詞の語幹とそれに続く形容詞対象活用語尾データの語句を用いて処理を行ったが、これらの近傍の他の語句を利用しても良い。例えば、形容詞の語幹+「い」に続くのが名詞か否かまでを識別して、それが名詞の場合にはそのための異なる処理を行うようにしても良い。例えば、「彼は素晴らしい選手だよ」に対して「そうですか、素晴らしい選手なんですか」などである。
【0109】
また、発言構成データ毎に前回発言日時を設け、同じ発言構成データを用いた発言頻度を制限するようにしたが、発言構成データ全体で1つだけ、あるいは、これらを同じ種類毎にグループ分けしてそのグループ毎に前回発言日時を設けておき、異なる発言構成データであっても同じタイプの発言は制限するようにしても良い。
【0110】
また、前回発言日時とは異なるデータを用いて同種の発言頻度を制限しても良い。例えば、前回発言日時の代わりに発言構成データの選択確率を設けておき、発言構成データを発言に用いた場合にその発言構成データに対応した選択確率を0にするなどの小さな値に再設定し、以後、時間の経過とともにそれを徐々にインクリメントしていくなどである。
【0111】
また、形容詞であっても他の品詞の意味もある語は除外したが(ステップB11の処理)、それがユーザの発言の中で形容詞として使われているかどうかを判断した上で、形容詞として使われていない場合にだけ除外するようにしても良い。
【0112】
また、フィードバック型発言で必要な処理のすべてを、会話システムが実際に会話するときに実行するようにしたが、これらの処理の一部を会話システムが事前に行っておくことでも良い。その際に、その作業を実際に会話する時に用いる制御部ではない他の制御部(パソコンなど)が行っても良い。
【0113】
例えば、除外形容詞リストに含まれないで、かつ、品詞が形容詞のみの項目見出しを見つけ出す処理、形容詞の語幹+形容詞対象活用語尾データを含む他の品詞の項目見出しがないかを調べる処理、形容詞の語幹を抽出する処理などについては他のコンピュータで事前に行い、その結果で得られたデータを本システムの不揮発性メモリ17に書き込んでおくなどである。その場合は、フィードバック型発言に用いてよい形容詞の語幹のリストなどが、不揮発性メモリ17に予め書き込まれることになる。
【0114】
また、本システムが辞書機能を持ち、辞書データを流用してフィードバック型発言を行うものとして説明したが、この種の辞書機能を持たず、辞書データの代わりに、フィードバック型会話処理に必要な情報だけを不揮発性メモリ17に持たせておくことでも良い。
【0115】
また、ユーザの発言の中から否定や仮定などの意味を探す時に、ユーザの発言全体に対してパターンマッチングを行ったが、フィードバック発言の対象となる形容詞の位置を考慮に入れたパターンマッチングを行っても良い。例えば、対象となる形容詞の後に否定的な語句「ない」が有るかなどを調べても良い。さらに、単純なパターンマッチングではなく、現実的な範囲で文法的な解析などの、より複雑な処理を利用しても良い。
【0116】
他の処理においても、できるだけ簡単なやり方で表現する例を示したが、より複雑な処理を利用しても良い。
【0117】
また、発言処理選択用の初期相対確率テーブルT1の値を用いて、選択候補の会話処理の中の1つを直接的に選択したが、結果として相対的な選択確率をコントロールできる手法であれば他の方法であっても良い。例えば、個々の会話処理を選択する確率を予め設定しておいて、それぞれの会話処理を順番に取り上げてそれを用いるかどうかを確率的に決める。そして、当該会話処理による発言が作成できた場合にはそこでやめ、そうでない場合には次の順番の会話処理に対して同様のことを行う、などである。
【0118】
要するに、本発明は前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。
【0119】
更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、実施形態で示される全構成要件から幾つかの構成要件が削除されても、「発明が解決しようとする課題」で述べた効果が解決でき、「発明の効果」の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0120】
なお、上述した実施形態において記載した手法、つまり、図5乃至図7の各フローチャートに示される処理は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、そのプログラム自体をネットワーク等の伝送媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムあるいは伝送媒体を介して提供されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
【0121】
【発明の効果】
以上詳記したように本発明によれば、ユーザの発言に含まれる特定の品詞である形容詞または形容動詞を着目し、この形容詞または形容動詞を利用してユーザの発言に対する返事としての発言を行うようにしたことで、複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現でき、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る会話システムのハードウェア構成を示すブロック図。
【図2】前記会話システムの不揮発性メモリに記憶された国語辞書データの一例を示す図。
【図3】前記会話システムの不揮発性メモリに記憶された形容詞関連データ(除外形容詞リスト、形容詞対象活用語尾データ、発言構成データ+前回発言日時)の一例を示す図。
【図4】前記会話システムの不揮発性メモリに記憶された回避文要素データの一例を示す図。
【図5】前記会話システムにおける複数の会話処理を用いた発言作成処理の流れを示すフローチャート。
【図6】前記会話システムにおけるフィードバック型発言処理の流れを示すフローチャート。
【図7】前記会話システムにおけるフィードバック型発言処理の流れを示すフローチャート。
【符号の説明】
11…CPU
12…音声入力部
13…A/D変換部
14…音声出力部
15…D/A変換部
16…ワークメモリ
16a…相対確率テーブルバッファ
16b…リストバッファ
17…不揮発性メモリ
17a…プログラム領域
18〜25…会話処理用の情報記憶領域
【発明の属する技術分野】
本発明は、会話型ロボット等の玩具類やテレビゲーム機などに用いられる会話システムであって、ユーザがコンピュータを相手に会話することで楽しみや安らぎなどを得ることのできる会話システム及び会話処理プログラムに関する。
【0002】
【従来の技術】
従来、テレビゲーム機や玩具等に用いられる会話システムの多くは、通常、予め決められたシナリオに沿って会話を行う方式(以下、「シナリオ方式」と呼ぶ)を採用している。この「シナリオ方式」で用いられるシナリオは、実現性を考慮して、会話システムがまず話題を限定するような発言を行い、その後の会話の進展も、分岐が極力少なくなるように作られている。このため、人間(ユーザ)が会話の主導権をとれず、会話の流れが平凡だったり、不自然だったりするなどの欠点がある。
【0003】
そこで、「シナリオ方式」以外の会話システムとして、「人工知能」的な会話システムが考えられている。この「人工知能」的な会話システムとは、ユーザの発言を構文解析することにより意味を抽出して、発言の意図を理解し、それに基づいて返事を作り出そうとするシステムである。
【0004】
なお、従来、「シナリオ方式」を用いた会話システムとして、例えば特許文献1の「模擬会話システム」が知られている。この「模擬会話システム」では、ユーザの発した言葉が認識できなかった場合であっても会話の継続進行を実現するために、質問に対して登録されている登録語か否かを判別し、登録語がである場合には当該登録語に応じて返答文を決定し、登録語がでない場合には会話状況に応じて次の質問を決定する。
【0005】
【特許文献1】
特開2002−169590号公報
【0006】
【発明が解決しようとする課題】
上述したように、「シナリオ方式」以外の会話システムとして、「人工知能」的な会話システムが考えられている。しかしながら、この「人工知能」的な会話システムは、ユーザの発言を構文解析すると共に意味を抽出し、発言の意図を理解するといった人間の頭脳に近い複雑な処理を行って会話を実現するものである。このため、高度な技術が必要であると共に、あるゆる分野に対応させることは困難である。つまり、例えば「切符販売」や「情報検索」などのように、会話が限定された分野にしか適用することができない。
【0007】
そこで、本発明は、複雑な処理を必要とせずに、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることのできる会話システム及び会話処理プログラムを提供することを目的とする。
【0008】
【課題を解決するための手段】
(1) 本発明の会話システムは、ユーザとの間で会話を行う会話システムであって、会話相手であるユーザの発言を入力する入力手段と、この入力手段から入力されたユーザの発言に含まれる特定の品詞を抽出する品詞抽出手段と、この品詞抽出手段によって抽出された特定の品詞を利用して当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、この発言文作成手段によって作成された発言文を出力する出力手段とを具備して構成される。
【0009】
このような構成の会話システムによれば、ユーザの発言に含まれる特定の品詞が利用されて、その発言に対する返事としての発言文が作成される。この特定の品詞とは、具体的には形容詞または形容動詞である。形容詞や形容動詞は、人間の感性にかかわる言葉なので、これを利用することで複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現できるものであり、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。
【0010】
(2) 本発明の会話システムは、ユーザとの間で会話を行う会話システムであって、会話相手であるユーザの発言を入力する入力手段と、形容詞または形容動詞の語幹を表すデータ、形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶した記憶手段と、この記憶手段の語幹データおよび活用語尾データに基づいて、前記入力手段から入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する品詞抽出手段と、この品詞抽出手段によって抽出された形容詞または形容動詞を前記記憶手段の基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、この発言文作成手段によって作成された発言文を出力する出力手段とを具備して構成される。
【0011】
このような構成の会話システムによれば、会話相手であるユーザの発言が入力された際に、予め記憶された形容詞または形容動詞の語幹データおよび活用語尾データに基づいて、そのユーザの発言の中から形容詞または形容動詞が抽出される。そして、この抽出されたユーザ発言中の形容詞または形容動詞が予め記憶された基本構成文データに適用されて、当該ユーザの発言に対する返事としての発言文が作成される。
【0012】
このようにして、ユーザの発言に含まれる形容詞または形容動詞を利用した発言がなされる。形容詞や形容動詞は、人間の感性にかかわる言葉なので、これを利用することで、複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現できるものであり、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。
【0013】
また、前記構成の会話システムにおいて、前記品詞抽出手段は、ユーザの発言の中に包含関係にある形容詞または形容動詞が存在する場合に、包含される方を除外することを特徴とする。これにより、例えば「暑苦しかった」とユーザが発言した場合に、そのユーザ発言の中から「暑苦しかった」の他に「苦しかった」の両方を抽出してしまう不具合を回避できる。
【0014】
また、前記構成の会話システムにおいて、前記発言文作成手段は、前記品詞抽出手段によって複数の形容詞または形容動詞が抽出された場合に、ユーザの発言の中で最も後方に位置するものを発言文の作成に採用することを特徴とする。これにより、例えば「彼女は美しいが冷たい」とユーザが発言した場合に、「美しい」と「冷たい」のうちの「冷たい」が発言文の作成に採用されることになる。これは、話者はより強く伝えたい形容詞を後方に置くことケースが多いことによるものである。
【0015】
また、前記構成の会話システムにおいて、否定、質問、仮定、推定、伝聞のうちの少なくとも1つの意味を表す可能性のある文要素データを記憶した文要素データ記憶手段と、ユーザの発言の中に前記文要素データ記憶手段の文要素データが含まれている場合に、そこから抽出された形容詞または形容動詞を利用した発言を回避する発言回避手段とをさらに具備したことを特徴とする。これは、通常、ユーザの発言に、否定、質問、仮定、推定、伝聞などの要素が含まれている場合には、そこから抽出した形容詞または形容動詞を利用して「相手にフィードバックする発言」をするとおかしくなるので、これを回避するものである。
【0016】
(3) 本発明の会話システムは、ユーザとの間で会話を行う会話システムであって、会話相手であるユーザの発言を入力する入力手段と、国語辞書データを記憶した第1の記憶手段と、形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶した第2の記憶手段と、前記第1の記憶手段の国語辞書データに基づいて会話処理に用いる形容詞または形容動詞の語幹データを作成する語幹作成手段と、この語幹作成手段によって作成された形容詞または形容動詞の語幹データと前記第2の記憶手段に記憶された活用語尾データとに基づいて、前記入力手段から入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する品詞抽出手段と、この品詞抽出手段によって抽出された形容詞または形容動詞を前記第2の記憶手段の基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、この発言文作成手段によって作成された発言文を出力する出力手段とを具備して構成される。
【0017】
このような構成の会話システムによれば、国語辞書データに基づいて会話処理に用いる形容詞または形容動詞の語幹データが作成される。会話相手であるユーザの発言が入力されると、その形容詞または形容動詞の語幹データと予め記憶された活用語尾データに基づいて、そのユーザの発言の中から形容詞または形容動詞が抽出される。そして、この抽出されたユーザ発言中の形容詞または形容動詞が予め記憶された基本構成文データに適用されて、当該ユーザの発言に対する返事としての発言文が作成される。
【0018】
このようにして、ユーザの発言に含まれる形容詞または形容動詞を利用した発言がなされる。形容詞や形容動詞は、人間の感性にかかわる言葉なので、これを利用することで「相手にフィードバックする発言」を複雑な処理を必要とせずに簡単に実現できるものであり、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。さらに、電子辞書機能の1つである国語辞書のデータを利用して、会話処理に必要な形容詞または形容動詞の語幹データを得ることができる。
【0019】
また、前記構成の会話システムにおいて、前記品詞抽出手段は、ユーザの発言に含まれる形容詞または形容動詞と同じ語句が他の品詞として前記国語辞書データに存在する場合には、それを除外することを特徴とする。これにより、例えば「早い者勝ちだよ」とユーザが発言した場合に、そこから抽出される「早い」を採用して「早いと感じたのですね」と発言してしまうなど、不適切なフィードバック型発言をしてしまうことを回避することができる。
【0020】
また、前記構成の会話システムにおいて、予め除外対象として指定された特定の形容詞または形容動詞を記憶した除外対象記憶手段を備え、前記語幹作成手段は、前記除外対象記憶手段に記憶された特定の形容詞または形容動詞を除いて、前記国語辞書データから会話処理に用いる形容詞または形容動詞の語幹データを抽出することを特徴とする。
【0021】
例えば、「いけない」は「悪い」という意味の形容詞の場合もあるが、「行けない」という意味である可能性もある。「行けない」という意味で「いけない」は複数の品詞の合成語なので他の処理ではこれを排除できない。このようなフィードバック型の発言にとって不都合な形容詞(「いけない・」、「あお・い」、「あか・い」など)を予め除外対象として指定しておくことで、これらを除去して適切なフィードバック型発言を行うことができる。
【0022】
【発明の実施の形態】
まず、本発明の会話システムによって実現される会話処理の概要について説明する。
【0023】
本発明の会話システムは、単なる相槌ではなく、会話相手の真意を問うような、あるいは、再考を促すような発言を複雑な処理を必要とせずに実現するものである。このような相手の真意を問うような発言、再考を促すような発言などのことを「相手にフィードバックする発言」と呼ぶ。これに対し、「単なる相槌」とは、例えば「そうだね」,「そうそう」などのように、どんな場面でも使えてしまうような同意や共感の発言のことである。「単なる相槌」が続くと、会話システムが共感してくれているという満足を人間(ユーザ)は得にくくなる。さらには、自分の話を本当に聞いてくれているのだろうか、などと疑いを持つようにもなる。
【0024】
ここで、会話システムは、雑談などの自然な会話における人間の任意の発言を解析してその意味を理解することは難しく、非常に高性能な情報処理を必要とする。このため、上述した「相手にフィードバックする発言」を実現するためには、人間の発言の意味が分かっていなくても対応できるような、単純で実現的な仕組みを考える必要がある。
【0025】
そこで、本発明では、人間(ユーザ)の発言の中にある形容詞と形容動詞を利用することで、「相手にフィードバックする発言」を作り出す。形容詞、形容動詞がこの現実的な仕組みを提供してくれる主な理由は次の通りである。
【0026】
(1) 形容詞や形容動詞は、人間の感性にかかわる言葉なので、これらに焦点をあてて「相手にフィードバックする発言」を行うと、適切で高い効果の出る場合が多い。なお、他の品詞の場合には、人間が単に事実を述べているだけである可能性も高く、そのような品詞に焦点をあてて「相手にフィードバックする発言」を行っても、不適切だったり効果が少なかったりする。
【0027】
(2) 形容詞、形容動詞は活用変化が単純なので処理が簡単である。例えば、動詞を利用しようとすると活用変化の処理が複雑で難しくなる。
【0028】
(3) 形容詞や形容動詞に対しての「相手にフィードバックする発言」ならば、大胆に省略を用いた単純な発言で済ますことができる。他の品詞を対象とした場合には、人間の発言の中から他の語句を見つけ出す必要ができてしまうことが多い。例えば、動詞であれば、主語や目的語や修飾語を伴わないと極端に舌足らずな発言となる可能性が高い。そのような語句を人間の発言の中から間違わずに抽出するのは非常に難しい。また、抽出できたとしても、それらを使って正しい日本語を組み立てるのも難しい。
【0029】
本実施形態では、説明を簡潔にするために、形容詞だけを用いて「相手にフィードバックする発言」を行う場合を想定して説明する。また、本出願人によって出願済みの文章データベースを利用した会話処理(特願2002−233090号公報参照)と、人工知能のような高度な処理を行わずに本当の会話らしいものを実現する、一般に人工無能と称される方式の会話処理を併用して「相手にフィードバックする発言」を作り出す処理を行い、これらの異なった味わいのある発言を適切に組み合わせて会話を行うものとする。
【0030】
前者の会話処理(特願2002−233090号公報に開示されている方式)のことをここでは「文章データベース利用型会話処理」と呼び、後者の人工無能と称される方式の会話処理をここでは単に「人工無能型会話処理」と呼ぶことにする。これらについては前記公報に詳しく記載されているため、ここではその詳しい説明は省略するものとする。
【0031】
以下、図面を参照して本発明の一実施形態に係る会話システムについて説明する。
【0032】
図1は本発明の一実施形態に係る会話システムのハードウェア構成を示すブロック図である。この会話システムは、ユーザの発言に対し、あたかも人間が返事をしているかの如く発言して会話を進めるためのものであり、例えば会話型ロボット等の玩具類やテレビゲーム機などに搭載される。
【0033】
図1では、本システムを汎用のコンピュータによって実現した場合の基本的な構成が示されており、CPU11、音声入力部12、A/D変換部13、音声出力部14、D/A変換部15、ワークメモリ16、不揮発性メモリ17によって構成されている。
【0034】
CPU11は、不揮発性メモリ17などに記憶されたプログラムを読み込むことにより、そのプログラムに記述された手順に従って所定の処理を実行する。音声入力部12は、会話時にユーザの音声を入力するためのマイクである。この音声入力部12から入力されたユーザの音声(アナログデータ)はA/D変換部13でデジタルデータに変換されてCPU11に取り込まれる。CPU11はワークメモリ16を用いて処理を行い、ユーザの発言に対する返事をD/A変換部15を介して出力する。D/A変換部15は、CPU11によって生成された音声データをアナログデータに変換して音声出力部14に与える。音声出力部14は、これを外部に出力するためのスピーカである。
【0035】
ワークメモリ16には、CPU11の処理動作に必要なデータが記憶される。このワークメモリ16には、後述する発言処理選択用の初期相対確率テーブルT1の値をバッファしておくための相対確率テーブルバッファ16aや、後述するフィードバック型発言処理時に用いられる形容詞の語幹+形容詞対象活用語尾データのリストをバッファしておくためのリストバッファ16bなどが設けられている。
【0036】
不揮発性メモリ17は、例えばフラッシュメモリからなり、電源が切れても記憶内容が消えない書き換え可能なメモリである。この不揮発性メモリ17には、本発明の会話システムを実現するためのプログラムが記憶されたプログラム領域17aの他、会話処理に必要な各種情報が記憶された情報記憶領域18〜25が設けられている。
【0037】
不揮発性メモリ17の情報記憶領域18には、上述した文章データベース利用型会話処理用のデータが記憶されている。この文章データベース利用型会話処理用データは、文章データベースとこの文章データベースを利用して会話処理するのに必要な前回発言日時などを含む各種データからなる。
【0038】
文章データベースとは、例えば小説、戯曲、映画やドラマのシナリオ、落語や漫才の記録、実際の会話記録など、会話文を含んだ既存の文章情報を対象として、その文章情報から会話部分の文章だけを抜き出して作成されたデータベースや、例えばニュース記事など、会話文を含まない既存の文章情報(書き言葉による文章情報)を対象として、その文章情報から会話として利用可能な部分の文章を抜き出して作成されたデータベースなどである。文章データベース利用型会話処理では、このような既存文章から会話に利用可能な文章を抽出して集めておき、ユーザの発言に対して、これらの中から適切な文章を選んで発言することを特徴としている。
【0039】
不揮発性メモリ17の情報記憶領域19には、パターン対応返事データベース+前回発言日時が記憶されている。このパターン対応返事データベース+前回発言日時は、人工無能型会話処理で用いるパターン対応返事データベースと、その中の登録返事ごとに設けた前回発言日時データである。前記文章データベース利用型会話処理の場合と同様に、ある登録返事を発言として用いた場合には、その時点の日時を対応する前回発言日時データに記録し、それを用いて、同じ登録返事をしばらくの間採用しないようにする。
【0040】
不揮発性メモリ17の情報記憶領域20〜24には、フィードバック型会話処理に必要な情報が記憶されいる。このうち、情報記憶領域20には、国語辞書データが記憶されている(図2参照)。この国語辞書データは、電子辞書機能の1つとして搭載されており、通常は、言葉の意味を調べる場合などに用いられる。本実施形態では、この国語辞書データをフィードバック型会話処理に利用するものである。
【0041】
情報記憶領域21には、除外形容詞リストが記憶されている。情報記憶領域22には、形容詞対象活用語尾データが記憶されている。情報記憶領域23には、発言構成データ+前回発言日時が記憶されている。これらの除外形容詞リスト、形容詞対象活用語尾データ、回避文要素データ、発言構成データ+前回発言日時の各データは、「相手にフィードバックする発言」を作り出すための形容詞関連データとして用いられる(図3参照)。
【0042】
情報記憶領域24には、回避文要素データが記憶されている(図4参照)。回避文要素データは、「相手にフィードバックする発言」として不適切な要素を示したもので、「否定」、「質問」、「仮定」、「推定」、「伝聞」などの各要素に分類される。
【0043】
また、不揮発性メモリ17の情報記憶領域25には、発言処理選択用の初期相対確率テーブルT1が記憶されている。この初期相対確率テーブルT1は、上述した3つの異なる発言処理(会話処理を実現するアルゴリズム)を選択するためのテーブルである。これらのアルゴリズムに対応した会話処理毎に数値が設定されていて、その数値の大きさがそのアルゴリズムの会話処理が選択される相対的な確率に反映される。
【0044】
本実施形態における初期相対確率テーブルT1には、文章データベース利用型会話処理に「5」、人工無能型会話処理に「3」、「相手にフィードバックする発言」を作成するフィードバック型会話処理に「2」といった値が予め初期値として設定されているものとする。
【0045】
図2は本システムの不揮発性メモリ17の情報記憶領域18に記憶された国語辞書データの一例を示す図である。
【0046】
本実施形態では、国語辞書データを利用して、フィードバック型会話処理に必要な形容詞の語幹データを作成する。国語辞書データは、電子辞書機能の1つであって、図2に示すように、各語句毎にその項目見出しとそれに対応した説明のデータからなる。なお、図中の「…」は他にも多くの項目があることを表している。
【0047】
図3は本システムの不揮発性メモリ17の情報記憶領域21〜23に記憶された形容詞関連データの一例を示す図である。この形容詞関連データは、除外形容詞リスト、形容詞対象活用語尾データ、発言構成データ+前回発言日時を含んでいる。
【0048】
除外形容詞リストは、フィードバック型の発言にとって不都合な形容詞を除外対象としてリストアップしたものであり、「いけない・」、「あお・い」、「あか・い」などが含まれている。
【0049】
形容詞対象活用語尾データは、国語辞書データなどから発言対象として抽出された形容詞の語幹に付加する活用語尾を示したものであり、「い」や「かった」などが含まれる。例えば国語辞書データにおいて、形容詞の項目見出し「あつくるし・い[暑苦しい]」の語幹部分は「あつくるし[暑苦し]」であり、これに対し、形容詞対象活用語尾データの「い」と「かった」を繋ぐことで、「あつくるしい」、「暑苦しい」、「あつくるしかった」、「暑苦しかった」を作成する。
【0050】
発言構成データ+前回発言日時は、発言構成データとそれを用いて発言したときの日時を示している。発言構成データとは、例えば「“形容詞語幹”+“い”とかんじたのですね」や「たしかに“形容詞語幹”+“活用語尾”」、「そうですか。“形容詞語幹”+“い”と感じたと思いますか」…といったように、形容詞を利用した発言(相手にフィードバックする発言)の基本構成を示すものである。
【0051】
図4は本システムの不揮発性メモリ17の情報記憶領域24に記憶された回避文要素データの一例を示す図である。
【0052】
否定、質問、仮定、推定、伝聞などの意味を表す可能性のある発言は、「相手にフィードバックする発言」には不適切であり、これらは予め回避文要素データとして情報記憶領域24に記憶されている。
【0053】
図4において、回避文要素データの中の「*」は任意の文字数の文字を表すワイルドカード文字である。例えば、「*いつ*」はユーザの発言のどこかに「いつ」という文字があることを意味し、「*か」はユーザの発言の最後が「か」であることを意味する。また、「[]」の記号に挟まれた部分は、この中の文字のどれか一文字であることを意味する。例えば、「*[いだ]と*」は、ユーザの発言のどこかに、「いと」または「だと」が含まれることを意味する。
【0054】
このような構成の会話システムにおいて、音声入力部12から入力されたユーザの音声はA/D変換部13にてデジタルデータに変換された後、CPU11に与えられる。CPU11では、「音声認識処理」→「会話処理」→「読み上げ処理」といった順で各処理を行ってユーザの発言に対する返事を返す。
【0055】
すなわち、まず、「音声認識処理」により音声から文字への変換を行ってテキスト形式の文章を作成する。なお、「音声認識処理」では仮名漢字変換処理も同時に行われているものとする。次に、このテキスト形式の文章に対して「会話処理」を施してユーザの発言に対する返事を作成し、これを「読み上げ処理」によって読み上げる。このときCPU11にてユーザに対する返事として生成された音声データはD/A変換部15によってアナログデータに変換された後、音声出力部14を通じて出力される。
【0056】
ここで、「音声認識処理」と「読み上げ処理」については一般的に知られている手法を用いるものとしてその詳しい説明は省略する。以下では、本システムの「会話処理」を中心に、図5乃至図7に示すフローチャートを参照して具体的な処理手順について詳しく説明する。なお、これらのフローチャートで示される処理は、本システムに備えられたCPU11がプログラムを読み込むことで実行する。
【0057】
図5は本システムにおける発言作成処理の流れを示すフローチャートであり、本システムに搭載された複数(ここでは3つ)の会話処理を確率的に選択する処理を示している。この発言作成処理は、本システムの話相手であるユーザの発言後に、それに対する返事としての発言を作成する場合に実行される。
【0058】
上述したように、本システムでは、アルゴリズムの異なる会話処理として、文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の3種類の会話処理を備えており、これらに対する選択確率の初期値が初期相対確率テーブルT1に設定されている。
【0059】
CPU11は、まず、この初期相対確率テーブルT1の値をワークメモリ16の相対確率テーブルバッファ16aにコピーする(ステップA11)。そして、CPU11は、この相対確率テーブルバッファ16aにコピーされた初期相対確率テーブルT1の値が示す相対的な確率に従って、前記3つの会話処理の1つを選択する(ステップA12)。
【0060】
初期時における文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の比率は5対3対2である。すなわち、文章データベース利用型会話処理は5割の確率で、人工無能型会話処理は3割の確率で、フィードバック型会話処理は2割の確率で選択されるようになっている。これにより、どの会話処理によって発言されるのかはランダムで予測がつかないようにしながら、各会話処理の大局的な比率をコントロールして全体的な会話の味わいを制御できる。
【0061】
前記ステップA12において、文章データベース利用型会話処理が選択されたとすると、CPU11は不揮発性メモリ17の情報記憶領域18に記憶されたデータを用いて文章データベース利用型会話処理を実行し、会話相手であるユーザに対する発言を行う(ステップA13)。その際に、CPU11は、相対確率テーブルバッファ16aに現在セットされている文章データベース利用型会話処理の値を0にする(ステップA14)。
【0062】
また、人工無能型会話処理が選択された場合、あるいは、フィードバック型会話処理が選択された場合でも同様であり、CPU11はその選択された会話処理を実行して発言を行うと共に、当該会話処理に対応した確率の値を0にする(ステップA15〜A18)。
【0063】
なお、人工無能型会話処理には、不揮発性メモリ17の情報記憶領域19に記憶されたデータが用いられる。フィードバック型会話処理には、不揮発性メモリ17の情報記憶領域20〜24に記憶されたデータが用いられる。フィードバック型会話処理については、後に図6および図7のフローチャートを参照して詳しく説明する。
【0064】
ここで、選択された会話処理を用いて発言することができれば、それで発言作成処理は終わる。しかし、ユーザが発言の内容や、それ以前の会話システムの発言の経緯で、選択された会話処理では発言ができない場合がある。例えば、その会話処理で対応するのが困難な種類の発言をユーザが発したり、内容としては利用可能な発言が見つけだせるが、その発言の前回発言日時からすると充分な時間が経過していない場合などである。このような場合には発言せずに終わると、無口な会話システムになってしまうので、以下のようにして他の会話処理での発言を試みる。
【0065】
すなわち、1回目にステップA12にて文章データベース利用型会話処理が選択されたが発言できなかったとすると(ステップA19→A20のNo)、2回目にはステップA12に来たときには、文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の選択確率の比が0対3対2に更新される。したがって、人工無能型会話処理は6割の確率で、フィードバック型会話処理は4割の確率で選択されることになる。3回目にステップA12に来たときには残った会話処理が必ず選択される。なお、3回とも発言できなかった場合、つまり、すべての値が0になった場合には(ステップA20のYes)、ここでは処理を終了して発言なしとする。
【0066】
このように、文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理の3種類の会話処理を任意選択的に使用してユーザに対する発言を行って会話を進めていく。
【0067】
次に、前記各会話処理のうちのフィードバック型会話処理について詳しく説明する。なお、文章データベース利用型会話処理と人工無能型会話処理の説明については省略するものとする。
【0068】
図6および図7は本システムにおけるフィードバック型発言処理の流れを示すフローチャートである。なお、フィードバック型発言処理を構成する各ステップB11〜B24の処理のうち、ステップB11とB12は処理A、ステップB13〜B15は処理B、ステップB16〜B20は処理Cとして括ることができる。
【0069】
CPU11は、まず、不揮発性メモリ17の情報記憶領域20に記憶された国語辞書データを利用して会話処理に用いる形容詞を見つけ出す(ステップB11)。国語辞書データは、電子辞書機能の1つとして本システムに搭載されたものであって、図2に示すように項目見出しとその項目見出しに対応する説明データを有する。
【0070】
この国語辞書データから会話処理に用いる形容詞を見つけ出すには、国語辞書データの「説明」の部分に形容詞であることを示す特定の記号(例えば(形))が付された項目を検索すれば良い。ただし、他の品詞の意味も含んだ項目について除外するので、「な・い[ない・無い]」のように、形容詞以外の記号(例えば(補形))が含まれる項目については除外するものとする。これを除外するのは、「美しくない」などの「ない」を形容詞と間違えて採用してしまわないようにするためである。
【0071】
また、前記ステップB11において、形容詞であっても、不揮発性メモリ17の情報記憶領域21に記憶された除外形容詞リストに登録されているものは除外する。この除外形容詞リストを用いて、なぜ一部の形容詞を除外するのかについては後に述べる。
【0072】
続いて、CPU11は、不揮発性メモリ17の情報記憶領域22に記憶された形容詞対象活用データを用いて、国語辞書データから抽出した形容詞の語幹に形容詞対象活用データを繋いだ文字列をユーザの発言の中からパターンマッチィングにより検索し、該当するものをすべてリストアップしてワークメモリ16のリストバッファ16bに格納する(ステップB12)。
【0073】
国語辞書データを利用して形容詞の語幹を抽出するには、国語辞書データの項目見出しの書式の記号を削除するとともに、項目見出しの最初の語の区切り記号「・」より後が活用語尾であることを利用すれば良い。
【0074】
図2に示すように、例えば形容詞の項目見出し「あつくるし・い[暑苦しい]」であれば、その中に含まれる「・」や「[]」は単なる記号であり、「・」の後の「い」が活用語尾を示している。したがって、この項目に対しては、「あつくるし」と「暑苦し」が形容詞の語幹として抽出されることになる。これに、図3に示す形容詞対象活用語尾データの「い」と「かった」を繋ぐと、「あつくるしい」、「暑苦しい」、「あつくるしかった」、「暑苦しかった」の4種類ができる。これがユーザの発言の中にあるか否かを調べる。
【0075】
例えば、ユーザの発言が「あの部屋は暑苦しかった」だったとすると、その中の「暑苦しかった」がリストアップされることになる。同様の処理を他の形容詞についても行う。この例の場合には、「暑苦しかった」の他に「苦しかった」もリストアップされることになる。
【0076】
次に、CPU11は、前記ステップB12でリストアップした形容詞の語幹+形容詞対象活用語尾データの中から位置も含めた包含関係にあるものを調べる(ステップB13)。該当するものがあれば(ステップB14のYes)、CPU11は包含される方(文字数の少ない方)をリストから外す(ステップB15)。
【0077】
前記「位置も含めた包含関係」とは、例えば「暑苦しかった」と「苦しかった」のような関係のことである。つまり、ユーザの発言として、例えば「暑苦しかった」があり、これに対して「暑苦しかった」の他に、「苦しかった」の方も抽出してしまった場合である。両方を採用すると間違った返事になるので、一方をリストから外す。この場合、包含される方(つまり、文字数の少ない方)の形容詞である「苦しかった」をリストから外すものとする。
【0078】
なお、「苦しい」は「暑苦しい」に含まれてしまうからといって最初から「苦しい」を除外すると、例えば「今日のトレーニングは苦しかった」といったユーザの発言に対してフィードバック型発言ができなくなる。つまり、位置も考慮に入れるというのは、「暑苦しかった。とても苦しかったよ」の中の「苦しかった」については除外しないことを意味している。
【0079】
次に、CPU11は、リストアップした形容詞の語幹+形容詞対象活用語尾データを含む他の品詞の項目見出しが国語辞書データの中にないかを調べる(ステップB16)。国語辞書データの中に該当するものがあれば(ステップB17のYes)、さらにCPU11はその見出し語がユーザの発言の中の対応する形容詞の語幹+形容詞対象活用語尾データのところにあるか否かを調べる(ステップB18)。その結果、ユーザの発言に該当するものがあった場合には(ステップB19のYes)、CPU11はその形容詞の語幹+形容詞対象活用語尾データをリストから外す(ステップB20)。
【0080】
すなわち、前記の例で言えば、ユーザの発言「暑苦しかった」が国語辞書データの項目見出しに含まれないかを調べることになる。この場合、「暑苦しかった」は国語辞書データの中に他の品詞としてはないので、リストから外されることはない。これにより、「暑苦しかった」だけがリストに残されて次の処理へと進むことになる。
【0081】
このようにして、リストアップされた語幹+形容詞対象活用語尾データを所定の条件により絞り込み、発言に適切なものだけを残す。ここで、CPU11はリストに残った形容詞の語幹+形容詞対象活用語尾データの数を調べる(ステップB21)。その結果、形容詞の語幹+形容詞対象活用語尾データの数が0個である場合には、発言不可であるので、ここでのフィードバック型発言処理を終了する。
【0082】
形容詞の語幹+形容詞対象活用語尾データの数が1個であれば、CPU11は不揮発性メモリ17の情報記憶領域24に記憶された回避文要素データを用いて、ユーザの発言の中にこの回避文要素データが存在するか否かを調べる(ステップB22)。つまり、ユーザの発言「あの部屋は暑苦しかった」に対し、図4に示す回避文要素データが含まれているか否かを調べる。回避文要素データとは、「相手にフィードバックする発言」には不適切な要素(否定、質問、仮定、推定、伝聞など)を定義したものである。
【0083】
この処理により、否定、質問、仮定、推定、伝聞などの意味を表す可能性のある発言を回避する。すなわち、この回避文要素データのどれかがユーザの発言の中にあると、回避文要素データの「分類」で定義されている否定、質問、仮定、推定、伝聞などの要素が含まれる可能性があると考えられる。ユーザの発言にこのような要素が含まれている場合に、「相手にフィードバックする発言」をするとおかしくなる。そこで、それらの可能性がないときだけ、フィードバック型発言を行うものとする。前記の例では、「あの部屋は暑苦しかった」はどの回避文要素データも含まないので次の処理へ進む。
【0084】
ユーザの発言の中に回避文要素データがなかった場合には(ステップB22のNo)、CPU11は不揮発性メモリ17の情報記憶領域23に記憶された発言構成データ+前回発言日時を用いて、再度発言に用いるには早すぎる発言構成データを除外し、残った発言構成データの中からランダムに1つを選択する(ステップB23)。
【0085】
「再度発言に用いるには早すぎる発言構成データ」とは、例えば少なくとも当日の前回発言日時を有する発言構成データなどである。このような発言構成データを除外しておくことで、ユーザに対して同じセリフを発言してしまうことを回避する。発言構成データは、図3で説明したように、例えば「“形容詞語幹”+“い”とかんじたのですね」や「たしかに“形容詞語幹”+“活用語尾”」、「そうですか。“形容詞語幹”+“い”と感じたと思いますか」…といったように、形容詞を利用した発言(相手にフィードバックする発言)の基本構成を示すものである。
【0086】
次に、CPU11は前記選択した発言構成データを用いて、「相手にフィードバックする発言」を作成して発言する(ステップB24)。詳しくは、前記選択した発言構成データの「¥形容詞語幹¥」の部分を形容詞語幹とし、「$活用語尾$」の部分を形容詞対象活用語尾データに置き換えることで、発言用の文データを作成し、これを音声処理して発言する。
【0087】
前記の例で説明すると、ユーザの発言「暑苦しかった」に対し、「暑苦しいと感じたのですね」、「たしかに暑苦しかった」、「どうして暑苦しいと感じたと思いますか」などを作成して返事として発言することになる。これにより、「相手にフィードバックする発言」を実現できる。
【0088】
一方、前記ステップB21において、リストに残った形容詞の語幹+形容詞対象活用語尾データの数が2個以上であった場合には、CPU11は所定の条件に基づいてそれらの中の1つだけを選択して、他のデータをリストから外す(ステップB25)。
【0089】
この場合、ユーザの発言の中で最も後方にあるものを選択対象とし、その形容詞の語幹+形容詞対象活用語尾データだけを残して、他のデータをリストから外すものとする。例えば、「彼女は美しいが冷たい」とユーザが発言した場合に、「美しい」と「冷たい」の2つがリストに残る。そこで、後方にある「冷たい」を採用する。これは、話者はより強く伝えたい形容詞を後方に置くことケースが多いことによるものである。
【0090】
なお、2個以上の形容詞が残った場合にはフィードバック型の発言をやめる案や、他の語句も解析して決める案など、他の処理で対応する案なども考えられる。
【0091】
以降の処理は前記ステップB22〜B24と同様である。
【0092】
すなわち、ユーザの発言の中に回避文要素データをあるか否かをチェックし(ステップB22)、ユーザ発言に回避文要素データが含まれている場合に、最近発言したものを除いて発言構成データを選択した後(ステップB23)、その発言構成データに基づいて「相手にフィードバックする発言」を作成して発言する(ステップB24)。
【0093】
ところで、上述したフィードバック型発言処理において、処理Cの部分(ステップB16〜B20)は、例えばユーザの発言が「早い者勝ちだよ」といったような場合などに意味を持つ。
【0094】
すなわち、ユーザの発言が「早い者勝ちだよ」であったとすると、その中の「早い」がリストアップされる。しかし、これをそのまま用いて「早いと感じたのですね」と返事したのでは会話として成り立たない。ここで、国語辞書データには、「早い者勝ち」といった語句全体が名詞としての項目見出しにある。また、「早い者勝ち」はユーザの発言「早い者勝ちだよ」の中にあるので、前記処理Cにより、「早い」は発言用のリストからは外されることになる。
【0095】
また、前記ステップB22において、ユーザの発言に否定、疑問、仮定、推定、伝聞などの意味が含まれる可能性がある場合に、フィードバック型発言を避けるのは、例えば「あの部屋は暑苦しいですか」、「あの部屋が暑苦しかったらどうしよう」、「あの部屋が暑苦しいとは思わない」などに対して、「暑苦しいと感じたのですね」などと返事をしたのではおかしいからである。
【0096】
ユーザの発言の中に、これらの意味があるかどうかを正確に判定するのは非常に難しい。本発明では、それらの意味を含む可能性がある場合を見つけ出す。フィードバック型の発言はそれが可能な場合に必ず行わなくてはならないものではない。むしろ頻度が多すぎると、会話が不自然になることさえある。そこで、ここでは疑わしきは排除する方針をとることができ、回避文要素データを用いてそれらの意味が含まれる可能性を見つけ出すだけで良い。
【0097】
なお、前記ステップB22の処理は、発言構成データの内容にも依存するところなので、本実施形態以外の様々な方法も考えられる。
【0098】
除外形容詞リストにある形容詞は、不都合な場合があるのに他の処理では排除できない特別な形容詞である。例えば、「いけない」は「悪い」という意味の形容詞の場合もあるが、「行けない」という意味である可能性もある。「行けない」という意味で「いけない」は複数の品詞の合成語なので、本実施形態で示した他の処理ではこれを排除できない。また、「赤い」や「青い」などは形容詞ではあるが、これは客観的な情報を述べただけである可能性が高い。例えば、「赤い車を買った」に対して「赤いと感じたのですね」といった発言は不適当な場合の方が多い。
【0099】
これらの形容詞に対してフィードバック型の発言をしないために、本実施形態では、除外形容詞リストを用いて排除している。この除外形容詞リストの内容も発言構成データの内容に依存するので様々な方法が考えられる。例えば、本実施形態では他の品詞があることを調べて除外した「な・い[ない・無い]」などについても、除外形容詞リストを用いて除外しても良い。
【0100】
以上のように、本発明の会話システムによれば、ユーザの発言に使われていた形容詞が会話システムの返事の中に利用されるので、単なる相槌などからは得られないような会話を実現できる。つまり、ユーザは、自分の言ったことを会話システムが理解して返事してくれているといったような強い満足感を得ることができる。
【0101】
形容詞には、人間の感情や意見が反映されている場合が多く、それに焦点をあてた返事ができるので、その返事は人間の感情を動かしたり思考を促したりする可能性が高く、効果的である。ユーザには自らの感情や意見をフィードバックされることになるので、自分の感情や考えを問い直すきっかけとなり、カウンセリング的な効果もある。
【0102】
また、アルゴリズムの異なる複数の会話処理(文章データベース利用型会話処理、人工無能型会話処理、フィードバック型会話処理)から確率的に1つを選んで発言を作成するので、その時々で異なる味わいの発言を行うことができる。つまり、ユーザに発言を予測されないように、様々なタイプの発言を混在しながら会話を進めて行くことができる。これにより、単調な会話や機械的な会話を避けることができる。
【0103】
また、複数の会話処理(アルゴリズム)を選択する相対的な確率をコントロールすることで、異なる味わいの発言のバランスを適切に保つことができる。さらに、選択された会話処理では発言が作成できなかった場合に、最初は選ばれなかった他の会話処理を再び試みることで、ユーザの発言に対して何の応答もできない状態を大幅に減らすことができる。
【0104】
また、他の形容詞に包含される形容詞を除外するので、不適切な返事になることはない。同様に、他の品詞の語句に含まれる形容詞は除外するので、不適切な返事になることはない。
【0105】
(変形例)
前記実施形態では、形容詞を利用する場合を想定して説明したが、形容動詞を利用しても良く、形容詞と形容動詞の両方を用いても良い。
【0106】
また、形容詞対象活用語尾データを2種類しか設けなかったが、他の活用変化やそれに続く他の助詞などを用いたデータを設けても良い。
【0107】
また、異なる形容詞対象活用語尾データに対して同じ処理を行ったが、形容詞対象活用語尾データ毎に、あるいは、それらをグループ分けしたグループ毎に、異なる発言構成データを用いるなど、異なる処理を施しても良い。
【0108】
また、形容詞の語幹とそれに続く形容詞対象活用語尾データの語句を用いて処理を行ったが、これらの近傍の他の語句を利用しても良い。例えば、形容詞の語幹+「い」に続くのが名詞か否かまでを識別して、それが名詞の場合にはそのための異なる処理を行うようにしても良い。例えば、「彼は素晴らしい選手だよ」に対して「そうですか、素晴らしい選手なんですか」などである。
【0109】
また、発言構成データ毎に前回発言日時を設け、同じ発言構成データを用いた発言頻度を制限するようにしたが、発言構成データ全体で1つだけ、あるいは、これらを同じ種類毎にグループ分けしてそのグループ毎に前回発言日時を設けておき、異なる発言構成データであっても同じタイプの発言は制限するようにしても良い。
【0110】
また、前回発言日時とは異なるデータを用いて同種の発言頻度を制限しても良い。例えば、前回発言日時の代わりに発言構成データの選択確率を設けておき、発言構成データを発言に用いた場合にその発言構成データに対応した選択確率を0にするなどの小さな値に再設定し、以後、時間の経過とともにそれを徐々にインクリメントしていくなどである。
【0111】
また、形容詞であっても他の品詞の意味もある語は除外したが(ステップB11の処理)、それがユーザの発言の中で形容詞として使われているかどうかを判断した上で、形容詞として使われていない場合にだけ除外するようにしても良い。
【0112】
また、フィードバック型発言で必要な処理のすべてを、会話システムが実際に会話するときに実行するようにしたが、これらの処理の一部を会話システムが事前に行っておくことでも良い。その際に、その作業を実際に会話する時に用いる制御部ではない他の制御部(パソコンなど)が行っても良い。
【0113】
例えば、除外形容詞リストに含まれないで、かつ、品詞が形容詞のみの項目見出しを見つけ出す処理、形容詞の語幹+形容詞対象活用語尾データを含む他の品詞の項目見出しがないかを調べる処理、形容詞の語幹を抽出する処理などについては他のコンピュータで事前に行い、その結果で得られたデータを本システムの不揮発性メモリ17に書き込んでおくなどである。その場合は、フィードバック型発言に用いてよい形容詞の語幹のリストなどが、不揮発性メモリ17に予め書き込まれることになる。
【0114】
また、本システムが辞書機能を持ち、辞書データを流用してフィードバック型発言を行うものとして説明したが、この種の辞書機能を持たず、辞書データの代わりに、フィードバック型会話処理に必要な情報だけを不揮発性メモリ17に持たせておくことでも良い。
【0115】
また、ユーザの発言の中から否定や仮定などの意味を探す時に、ユーザの発言全体に対してパターンマッチングを行ったが、フィードバック発言の対象となる形容詞の位置を考慮に入れたパターンマッチングを行っても良い。例えば、対象となる形容詞の後に否定的な語句「ない」が有るかなどを調べても良い。さらに、単純なパターンマッチングではなく、現実的な範囲で文法的な解析などの、より複雑な処理を利用しても良い。
【0116】
他の処理においても、できるだけ簡単なやり方で表現する例を示したが、より複雑な処理を利用しても良い。
【0117】
また、発言処理選択用の初期相対確率テーブルT1の値を用いて、選択候補の会話処理の中の1つを直接的に選択したが、結果として相対的な選択確率をコントロールできる手法であれば他の方法であっても良い。例えば、個々の会話処理を選択する確率を予め設定しておいて、それぞれの会話処理を順番に取り上げてそれを用いるかどうかを確率的に決める。そして、当該会話処理による発言が作成できた場合にはそこでやめ、そうでない場合には次の順番の会話処理に対して同様のことを行う、などである。
【0118】
要するに、本発明は前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。
【0119】
更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば、実施形態で示される全構成要件から幾つかの構成要件が削除されても、「発明が解決しようとする課題」で述べた効果が解決でき、「発明の効果」の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0120】
なお、上述した実施形態において記載した手法、つまり、図5乃至図7の各フローチャートに示される処理は、コンピュータに実行させることのできるプログラムとして、例えば磁気ディスク(フレキシブルディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリなどの記録媒体に書き込んで各種装置に適用したり、そのプログラム自体をネットワーク等の伝送媒体により伝送して各種装置に適用することも可能である。本装置を実現するコンピュータは、記録媒体に記録されたプログラムあるいは伝送媒体を介して提供されたプログラムを読み込み、このプログラムによって動作が制御されることにより、上述した処理を実行する。
【0121】
【発明の効果】
以上詳記したように本発明によれば、ユーザの発言に含まれる特定の品詞である形容詞または形容動詞を着目し、この形容詞または形容動詞を利用してユーザの発言に対する返事としての発言を行うようにしたことで、複雑な処理を必要とせずに「相手にフィードバックする発言」を簡単に実現でき、自然な会話、特に単なる相槌ではなく、相手の真意を問うような、あるいは、再考を促すような発言をしながら会話を円滑的に進めることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る会話システムのハードウェア構成を示すブロック図。
【図2】前記会話システムの不揮発性メモリに記憶された国語辞書データの一例を示す図。
【図3】前記会話システムの不揮発性メモリに記憶された形容詞関連データ(除外形容詞リスト、形容詞対象活用語尾データ、発言構成データ+前回発言日時)の一例を示す図。
【図4】前記会話システムの不揮発性メモリに記憶された回避文要素データの一例を示す図。
【図5】前記会話システムにおける複数の会話処理を用いた発言作成処理の流れを示すフローチャート。
【図6】前記会話システムにおけるフィードバック型発言処理の流れを示すフローチャート。
【図7】前記会話システムにおけるフィードバック型発言処理の流れを示すフローチャート。
【符号の説明】
11…CPU
12…音声入力部
13…A/D変換部
14…音声出力部
15…D/A変換部
16…ワークメモリ
16a…相対確率テーブルバッファ
16b…リストバッファ
17…不揮発性メモリ
17a…プログラム領域
18〜25…会話処理用の情報記憶領域
Claims (12)
- ユーザとの間で会話を行う会話システムであって、
会話相手であるユーザの発言を入力する入力手段と、
この入力手段から入力されたユーザの発言に含まれる特定の品詞を抽出する品詞抽出手段と、
この品詞抽出手段によって抽出された特定の品詞を利用して当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、
この発言文作成手段によって作成された発言文を出力する出力手段と
を具備したことを特徴とする会話システム。 - 前記特定の品詞は、形容詞または形容動詞であることを特徴とする請求項1記載の会話システム。
- ユーザとの間で会話を行う会話システムであって、
会話相手であるユーザの発言を入力する入力手段と、
形容詞または形容動詞の語幹を表すデータ、形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶した記憶手段と、
この記憶手段の語幹データおよび活用語尾データに基づいて、前記入力手段から入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する品詞抽出手段と、
この品詞抽出手段によって抽出された形容詞または形容動詞を前記記憶手段の基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、
この発言文作成手段によって作成された発言文を出力する出力手段と
を具備したことを特徴とする会話システム。 - 前記品詞抽出手段は、ユーザの発言の中に包含関係にある形容詞または形容動詞が存在する場合に、包含される方を除外することを特徴とする請求項3記載の会話システム。
- 前記発言文作成手段は、前記品詞抽出手段によって複数の形容詞または形容動詞が抽出された場合に、ユーザの発言の中で最も後方に位置するものを発言文の作成に採用することを特徴とする請求項3記載の会話システム。
- 否定、質問、仮定、推定、伝聞のうちの少なくとも1つの意味を表す可能性のある文要素データを記憶した文要素データ記憶手段と、
ユーザの発言の中に前記文要素データ記憶手段の文要素データが含まれている場合に、そこから抽出された形容詞または形容動詞を利用した発言を回避する発言回避手段と
をさらに具備したことを特徴とする請求項3記載の会話システム。 - ユーザとの間で会話を行う会話システムであって、
会話相手であるユーザの発言を入力する入力手段と、
国語辞書データを記憶した第1の記憶手段と、
形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶した第2の記憶手段と、
前記第1の記憶手段の国語辞書データに基づいて会話処理に用いる形容詞または形容動詞の語幹データを作成する語幹作成手段と、
この語幹作成手段によって作成された形容詞または形容動詞の語幹データと前記第2の記憶手段に記憶された活用語尾データとに基づいて、前記入力手段から入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する品詞抽出手段と、
この品詞抽出手段によって抽出された形容詞または形容動詞を前記第2の記憶手段の基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する発言文作成手段と、
この発言文作成手段によって作成された発言文を出力する出力手段と
を具備したことを特徴とする会話システム。 - 前記品詞抽出手段は、ユーザの発言に含まれる形容詞または形容動詞と同じ語句が他の品詞として前記国語辞書データに存在する場合には、それを除外することを特徴とする請求項7記載の会話システム。
- 予め除外対象として指定された特定の形容詞または形容動詞を記憶した除外対象記憶手段を備え、
前記語幹作成手段は、前記除外対象記憶手段に記憶された特定の形容詞または形容動詞を除いて、前記国語辞書データから会話処理に用いる形容詞または形容動詞の語幹データを抽出することを特徴とする請求項7記載の会話システム。 - ユーザとの間で会話を行うコンピュータに用いられる会話処理プログラムであって、
前記コンピュータに、
会話相手であるユーザの発言を入力する機能と、
前記入力されたユーザの発言に含まれる特定の品詞を抽出する機能と、
前記抽出された特定の品詞を利用して当該ユーザの発言に対する返事としての発言文を作成する機能と、
前記作成された発言文を出力する機能と
を実行させるための会話処理プログラム。 - ユーザとの間で会話を行うコンピュータに用いられる会話処理プログラムであって、
前記コンピュータに、
会話相手であるユーザの発言を入力する機能と、
形容詞または形容動詞の語幹を表すデータ、形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶する機能と、
前記語幹データおよび前記活用語尾データに基づいて、前記入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する機能と、
前記抽出された形容詞または形容動詞を前記基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する機能と、
前記作成された発言文を出力する機能と
を実行させるための会話処理プログラム。 - ユーザとの間で会話を行うコンピュータに用いられる会話処理プログラムであって、
前記コンピュータに、
会話相手であるユーザの発言を入力する機能と、
国語辞書データを記憶する機能と、
形容詞または形容動詞の語幹に繋げる特定の活用語尾を表すデータ、形容詞または形容動詞を利用した発言文の基本構成を表すデータを記憶する機能と、
前記国語辞書データから会話処理に用いる形容詞または形容動詞の語幹データを抽出する機能と、
前記抽出された形容詞または形容動詞の語幹データと前記活用語尾データとに基づいて、前記入力されたユーザの発言に含まれる形容詞または形容動詞を抽出する機能と、
前記抽出された形容詞または形容動詞を前記基本構成文データに適用することにより、当該ユーザの発言に対する返事としての発言文を作成する機能と、
前記作成された発言文を出力する機能と
を実行させるための会話処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002355628A JP2004191407A (ja) | 2002-12-06 | 2002-12-06 | 会話システム及び会話処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002355628A JP2004191407A (ja) | 2002-12-06 | 2002-12-06 | 会話システム及び会話処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004191407A true JP2004191407A (ja) | 2004-07-08 |
Family
ID=32756267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002355628A Pending JP2004191407A (ja) | 2002-12-06 | 2002-12-06 | 会話システム及び会話処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004191407A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007206888A (ja) * | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2009163619A (ja) * | 2008-01-09 | 2009-07-23 | Toyota Central R&D Labs Inc | 応答生成装置、及び応答生成プログラム |
JP2010224608A (ja) * | 2009-03-19 | 2010-10-07 | Toyota Central R&D Labs Inc | 応答生成装置及びプログラム |
JP2016045655A (ja) * | 2014-08-21 | 2016-04-04 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
JP2016080981A (ja) * | 2014-10-21 | 2016-05-16 | トヨタ自動車株式会社 | 応答生成装置、応答生成方法及び応答生成プログラム |
JP2018160248A (ja) * | 2018-05-01 | 2018-10-11 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
JP2019015837A (ja) * | 2017-07-06 | 2019-01-31 | 一般社団法人It&診断支援センター・北九州 | 猫の性格を持つ会話型ロボット及び猫の性格を発現させる対話管理プログラム |
-
2002
- 2002-12-06 JP JP2002355628A patent/JP2004191407A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007206888A (ja) * | 2006-01-31 | 2007-08-16 | Toyota Central Res & Dev Lab Inc | 応答生成装置、方法及びプログラム |
JP2009163619A (ja) * | 2008-01-09 | 2009-07-23 | Toyota Central R&D Labs Inc | 応答生成装置、及び応答生成プログラム |
JP2010224608A (ja) * | 2009-03-19 | 2010-10-07 | Toyota Central R&D Labs Inc | 応答生成装置及びプログラム |
JP2016045655A (ja) * | 2014-08-21 | 2016-04-04 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
US9653078B2 (en) | 2014-08-21 | 2017-05-16 | Toyota Jidosha Kabushiki Kaisha | Response generation method, response generation apparatus, and response generation program |
JP2016080981A (ja) * | 2014-10-21 | 2016-05-16 | トヨタ自動車株式会社 | 応答生成装置、応答生成方法及び応答生成プログラム |
JP2019015837A (ja) * | 2017-07-06 | 2019-01-31 | 一般社団法人It&診断支援センター・北九州 | 猫の性格を持つ会話型ロボット及び猫の性格を発現させる対話管理プログラム |
JP2018160248A (ja) * | 2018-05-01 | 2018-10-11 | トヨタ自動車株式会社 | 応答生成方法、応答生成装置及び応答生成プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200395008A1 (en) | Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models | |
CN111564202B (zh) | 基于人机对话的心理疏导方法、心理疏导终端和存储介质 | |
US8843372B1 (en) | Natural conversational technology system and method | |
US8935163B2 (en) | Automatic conversation system and conversation scenario editing device | |
US8219397B2 (en) | Data processing system for autonomously building speech identification and tagging data | |
CN105991847B (zh) | 通话方法和电子设备 | |
US9361589B2 (en) | System and a method for providing a dialog with a user | |
Ruede et al. | Yeah, right, uh-huh: a deep learning backchannel predictor | |
JPWO2017200072A1 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
Ruede et al. | Enhancing Backchannel Prediction Using Word Embeddings. | |
US10360911B2 (en) | Analyzing conversations to automatically identify product features that resonate with customers | |
JP2024502946A (ja) | 音声認識トランスクリプトの句読点付け及び大文字化 | |
JPWO2017200076A1 (ja) | 対話方法、対話システム、対話装置、およびプログラム | |
Nadeak et al. | AN ANALYSIS OF ILLOCUTIONARY ACT AND PERLOCUTIONARY ACT OF JUDY HOPPS'UTTERANCES IN ZOOTOPIA MOVIE (2016) | |
Bowden et al. | Entertaining and opinionated but too controlling: a large-scale user study of an open domain Alexa prize system | |
Chi et al. | Neural, neural everywhere: Controlled generation meets scaffolded, structured dialogue | |
Inupakutika et al. | Integration of NLP and Speech-to-text Applications with Chatbots | |
JP2004191407A (ja) | 会話システム及び会話処理プログラム | |
Penry Williams | Appeals to Semiotic Registers in Ethno‐Metapragmatic Accounts of Variation | |
JP2004226881A (ja) | 会話システム及び会話処理プログラム | |
JP2022531994A (ja) | 人工知能ベースの会話システムの生成および動作 | |
JP6787472B2 (ja) | 対話制御装置、対話制御方法及びプログラム | |
JP7248615B2 (ja) | 出力装置、出力方法及び出力プログラム | |
Karat et al. | Speech and language interfaces, applications, and technologies | |
Tong | Speech to text with emoji |