JP2004258902A - Conversation controller, and conversation control method - Google Patents
Conversation controller, and conversation control method Download PDFInfo
- Publication number
- JP2004258902A JP2004258902A JP2003047872A JP2003047872A JP2004258902A JP 2004258902 A JP2004258902 A JP 2004258902A JP 2003047872 A JP2003047872 A JP 2003047872A JP 2003047872 A JP2003047872 A JP 2003047872A JP 2004258902 A JP2004258902 A JP 2004258902A
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- information
- unit
- topic
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、会話制御装置及び会話制御方法に関する。
【0002】
【従来の技術】
従来からの会話制御装置においては、利用者からの発話内容に基づいて、その発話内容に対応する予め格納された回答文を出力することができる(例えば、特許文献1。)。
【0003】
【特許文献1】
特開2002−169804号(第6−15頁、図16)
【0004】
【発明が解決しようとする課題】
しかしながら、利用者の発話内容が複数の意味に捉えられ、その発話内容に対応する回答文が複数あるような場合には、会話制御装置は、一般的に最初に検索した回答文を出力していた。このため、会話制御装置は、利用者の発話内容が複数の意味に捉えられる場合には、その各意味の中から、予め展開したい特定の話題に関係する発話内容の意味を選出し、選出した発話内容の意味に対応する回答文を出力することができなかった。
【0005】
例えば、利用者からの発話内容が{IRを教えて下さい}である場合は、その発話内容は、遊技機における演出画像のIR(イナズマ ラッシュ)又は会社のIR(Investor Relations)の意味に捉えられることがある。この場合、会話制御装置は、各回答文の中から、遊技機における演出画像のIR(イナズマ ラッシュ)に対応する回答文を最初に検索したときには、その最初に検索した回答文を出力していた。
【0006】
すなわち、会話制御装置は、会社のIRに対応する回答文を出力したいときであっても、演出画像のIR(イナズマ ラッシュ)に対応する回答文を最初に検索したときには、その最初に検索した回答文を自動的に出力していた。このため、利用者からの発話内容が複数の意味に捉えられる場合には、予め展開させたい特定の話題に関係する回答文を出力することのできるシステムの開発が望まれていた。
【0007】
そこで、本発明は以上の点に鑑みてなされたものであり、利用者の発話内容が複数の意味に捉えられる場合には、予め展開したい特定の話題に関係する回答文を出力することで、現在の話題を特定の話題に誘導することのできる会話制御装置及び会話制御方法を提供することを課題とする。
【0008】
【課題を解決するための手段】
本発明は、上記課題を解決すべくなされたものであり、利用者から入力された発話内容を含む入力情報に基づいて入力情報に対応する回答文を検索する際に、利用者から入力された入力情報に基づいて予め記憶された複数のフレーズの中から、入力情報を含む各フレーズを検索し、検索された各フレーズに基づいて各フレーズの中から、予め展開したい話題に関係するフレーズを選出し、選出したフレーズに対応する回答文を検索することを特徴とする。
【0009】
すなわち、本発明は、上記フレーズには一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報が含まれ、複数の第二形態素情報には、利用者への回答文及び回答文として選出されるための優先順位が対応付けられており、各第二形態素情報及び各回答文を予め記憶し、利用者から入力された入力情報に含めれる文字列に基づいて、文字列の最小単位を構成する少なくとも一つの形態素を第一形態素情報として抽出し、抽出された第一形態素情報に基づいて、予め記憶された各第二形態素情報の中から、第一形態素情報を含む第二形態素情報を検索し、複数の第二形態素情報が検索された場合には、検索された各第二形態素情報に対応付けられた各優先順位の大きさに応じて、検索された各第二形態素情報の中から一の第二形態素情報を選出し、選出された第二形態素情報に基づいて、第二形態素情報に対応付けられた回答文を検索することを特徴とする。
【0010】
このような本願に係る発明によれば、抽出された第一形態素情報を含む第二形態素情報として、第二形態素情報1及び第二形態素情報2が検索された場合には、会話制御装置は、検索された第二形態素情報1及び第二形態素情報2の中から、例えば高い優先順位が対応付けられた第二形態素情報1を選択し、選択した第二形態素情報1に対応付けられた回答文を出力することができる。ここで、入力情報を含む各フレーズが複数検索されること、又は入力情報を構成する第一形態素情報を含む第二形態素情報が複数検索されるということは、入力情報が複数の意味に捉えられることを意味する。
【0011】
すなわち、入力情報が複数の意味に捉えられる場合、第二形態素情報(又はフレーズ)が複数検索された場合には、会話制御装置は、各第二形態素情報の中から、会話制御装置で予め展開したい話題に関係する第二形態素情報(高い優先順位が対応付けられている第二形態素情報)を選択することができる。
【0012】
これにより、会話制御装置は、利用者からの発話内容に基づく受動的な回答文を出力(例えば、利用者からの質問内容に忠実に答えること)するものではなく、会話制御装置から自発的に特定の話題に展開させる能動的な回答文を出力すること、言い換えると現在の話題を特定の話題に誘導する回答文を出力することができる。
【0013】
上記発明においては、今回検索された各第二形態素情報が所定の基準回数を越えて検索された場合には、前回選出された第二形態素情報とは異なる前記第二形態素情報を、今回検索された各第二形態素情報の中から選出するものであってもよい。これにより、前回選出された第二形態素情報が今回検索された各第二形態素情報に含まれ、今回検索された各第二形態素情報が所定の基準回数を越えて検索された場合には、会話制御装置は、前回選出された第二形態素情報とは異なる前記第二形態素情報を、今回検索された各第二形態素情報の中から選出することができる。
【0014】
すなわち、利用者から同様の発話内容が繰り返し発話された場合には、会話制御装置は、その繰り返された回数に応じて順次第二形態素情報を変更することができる。この結果、会話制御装置は、繰り返された発話内容の回数に応じて、現在の話題から特定の話題へと誘導させる回答文を逐一変更することができる。
【0015】
上記発明においては、回答文には特定の話題に誘導させるための内容が含まるものであってもよい。この場合には、特定の話題に誘導させるための内容が回答文に含まれるので、会話制御装置は、その回答文を出力することにより、現在の話題を予め展開させたい話題へとより的確に誘導することができる。すなわち、会話制御装置は、現在の話題についての主導権を内部的に握り、その現在の話題を特定のストーリにより的確に誘導することができる。
【0016】
上記発明においては、前回検索された第二形態素情報が今回検索された各第二形態素情報に含まれる場合には、今回検索された各第二形態素情報の中から、前回検索された第二形態素情報に対応付けられた優先順位の次の優先順位を特定し、特定した優先順位に対応付けられた第二形態素情報を選出するのが好ましい。
【0017】
【発明の実施の形態】
[第一実施形態]
(会話制御システムの基本構成)
本発明に係る会話制御システムについて図面を参照しながら説明する。図1は、本実施形態に係る会話制御装置1を有する会話制御システムの概略構成図である。
【0018】
同図に示すように、会話制御装置1は、入力部100と、音声認識部200と、会話制御部300と、文解析部400と、会話データベース500と、出力部600と、音声認識辞書記憶部700とを備えている。
【0019】
尚、本実施形態では、説明の便宜上、利用者の発話内容(この発話内容は、入力情報の一種)に限定して説明するが、この利用者の発話内容に限定されるものではなく、キーボード等から入力された入力情報であってもよい。従って、以下に示す「発話内容」は、「発話内容」を「入力情報」に置き換えて説明することもできる。
【0020】
同様にして、後述の説明では、説明の便宜上、「発話文のタイプ」(発話種類)に限定して説明するが、この「発話文のタイプ」に限定されるのではなく、キーボードなどから入力された入力情報の種類を示す「入力種類」であってもよい。従って、以下に示す「発話文のタイプ」(発話種類)は、「発話種類」を「入力種類」に置き換えて説明することもできる。
【0021】
入力部100は、利用者からの入力情報を取得する取得手段であり、本実施形態では、マイクロホン、キーボード等が挙げられる。この入力部100は、利用者から入力された入力情報に基づいて、入力情報を示す文字列を特定する文字認識手段でもある。
【0022】
ここで、入力情報とは、キーボード等を通じて入力された文字、記号、音声等を意味するものである。具体的に、入力部100は、利用者の入力情報(音声以外)を取得し、取得した入力情報を会話制御部300に出力する。また、利用者からの発話内容(この発話内容は、音声からなるものであり、入力情報の一種である)をマイクロホンなどで取得した入力部100は、取得した発話内容を構成する音声を音声信号として音声認識部200に出力する。
【0023】
音声認識部200は、入力部100で取得した発話内容に基づいて、発話内容に含まれる文字列を特定する文字認識手段である。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号を解析し、解析した音声信号に含まれる文字列を、音声認識辞書記憶部700に格納されている辞書を用いて特定し、特定した文字列を文字列信号として会話制御部300に出力する。音声認識辞書記憶部700は、標準的な音声信号に対応する辞書を格納しているものである。
【0024】
前記文解析部400は、入力部100又は音声認識部200で特定された文字列を解析するものであり、本実施形態では、図2に示すように、形態素抽出部410と、文節解析部420と、文構造解析部430と、発話種類判定部440と、形態素データベース450と、発話種類データベース460とを有している。
【0025】
形態素抽出部410は、入力部100又は音声認識部200で特定された文字列に基づいて、文字列の最小単位を構成する少なくとも一つの形態素を第一形態素情報として抽出する形態素抽出手段である。
【0026】
具体的に、管理部310から文字列信号が入力された形態素抽出部410は、入力された文字列信号に対応する文字列の中から各形態素を抽出する。ここで、形態素とは、本実施形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、図3に示すように、例えば、名詞、形容詞、動詞などの品詞が挙げられる。各形態素は、本実施形態では、m1、m2、・・・、mlと表現する。
【0027】
即ち、形態素抽出部410は、入力された文字列信号に対応する文字列と、形態素データベース450に予め格納されている名詞、形容詞、動詞などの形態素群とを照合し、文字列の中から形態素群と一致する各形態素(m1、m2、・・・)を抽出し、抽出した各形態素を抽出信号として文節解析部420に出力する。
【0028】
文節解析部420は、形態素抽出部410で抽出された各形態素に基づいて、各形態素を文節形式に変換する変換手段である。具体的に、形態素抽出部410から抽出信号が入力された文節解析部420は、入力された抽出信号に対応する各形態素を用いて文節形式にまとめる。
【0029】
ここで、文節形式とは、本実施形態では、日本語文法において、自立語又は自立語に一つ以上の付属語がついた文、或いは、日本語文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切りの文を意味する。この文節は、本実施形態では、p1、p2、・・・pkと表現する。
【0030】
即ち、文節解析部420は、図4に示すように、入力された抽出信号に対応する各形態素に基づいて各形態素の係り受け要素(例えば、が(m2)・は(m4)・を(m5)・・)を抽出し、抽出した係り受け要素に基づいて各形態素を各文節にまとめることを行う。同図に示す「t」は、転置を意味する。
【0031】
各形態素を各文節にまとめた文節解析部420は、各形態素をまとめた各文節と、各文節を構成する各形態素とを含む文型情報を文型信号として文構造解析部430及び発話種類判定部440に出力する。
【0032】
文構造解析部430は、文節解析部420で分節された第一形態素情報の各形態素を主体格、対象格などの各属性に分類する分類手段である。具体的に、文節解析部420から文型信号が入力された文構造解析部430は、入力された文型信号に対応する各形態素と各形態素からなる文節とに基づいて、文節に含まれる各形態素の「格構成」を決定する。
【0033】
ここで、「格構成」とは、文節における実質的な概念を示す格(属性)を意味するものであり、本実施形態では、例えば、主語・主格を意味するサブジェクト(主体格)、対象を意味するオブジェクト(対象格)、動作を意味するアクション、時間を意味するタイム(テンス、アスペクト)、場所を意味するロケーション等が挙げられる。本実施形態では、サブジェクト、オブジェクト、アクションの三要素の「格」(格構成)に対応付けられた各形態素を第一形態素情報とする。
【0034】
即ち、文構造解析部430は、図5に示すように、例えば、各形態素の係り受け要素が”が”又は”は”である場合は、その係り受け要素の前にある形態素がサブジェクト(主語又は主格)であると判断する。また、文構造解析部430は、例えば、各形態素の係り受け要素が”の”又は”を”である場合は、その係り受け要素の前にある形態素がオブジェクト(対象)であると判断する。
【0035】
更に、文構造解析部430は、例えば、各形態素の係り受け要素が”する”である場合は、その係り受け要素の前にある形態素がアクション(述語;この述語は動詞、形容詞などから構成される)であると判断する。
【0036】
各文節を構成する各形態素の「格構成」を決定した文構造解析部430は、決定した「格構成」に対応付けられた第一形態素情報に基づいて、後述する話題(トピック)の範囲を特定させるための話題検索命令信号を反射的判定部320に出力する。
【0037】
発話種類判定部440は、文節解析部420で特定された文節に基づいて、発話内容(入力情報)の種類を示す発話種類(入力種類)を特定する種類特定手段である。具体的に、文節解析部420から入力された文型信号に対応する各形態素と各形態素から構成される文節とに基づいて、「発話文のタイプ」(発話種類)を判定する。
【0038】
ここで、「発話文のタイプ」は、本実施形態では、図6に示すように、陳述文(D;Declaration)、感想文(I;Impression)、条件文(C;Condition)、結果文(E;Effect)、時間文(T;Time)、場所文(L;Location)、反発文(N;Negation)などから構成されるものである。これらの各文は、図6に示すように、肯定文(A;Answer)又は質問文(Q;Question)で表現される。
【0039】
陳述文とは、利用者の意見又は考えなどからなる文を意味するものであり、本実施形態では、図6に示すように、例えば”佐藤が好きだ”などの文が挙げられる。感想文とは、利用者が抱く感想からなる文を意味するものである。場所文とは、場所的な要素からなる文を意味するものである。
【0040】
結果文とは、話題に対して文が結果の要素を含む文から構成されるものを意味する。時間文とは、話題に関わる時間的な要素を含む文から構成されるものを意味する。
【0041】
条件文とは、一つの発話を話題と捉えた場合に、話題の前提、話題が成立している条件や理由などの要素を含む文から構成されるものを意味する。反発文とは、発話相手に対して反発するような要素を含む文から構成されるものを意味する。各「発話文のタイプ」についての例文は、図6に示す通りである。
【0042】
即ち、発話種類判定部440は、入力された文型信号に対応する各文節に基づいて、その各文節と発話種類データベース460に格納されている各辞書とを照合し、各文節の中から、各辞書に関係する文要素を抽出する。各文節の中から各辞書に関係する文要素を抽出した発話種類判定部440は、抽出した文要素に基づいて、「発話文のタイプ」を判定する。文要素とは、文字列の種類を特定するための分の種別を意味し、文要素は、本実施形態では、上記説明した定義句(〜のことだ)などが挙げられる。
【0043】
ここで、上記発話種類データベース460は、図7に示すように、定義句(例えば、〜のことだ)に関係する辞書を備えた定義表現事例辞書、肯定句(例えば、賛成、同感、ピンポーン)に関係する辞書を備えた肯定事例辞書、結果句(例えば、それで、だから)に関係する辞書を備えた結果表現事例辞書、挨拶句(例えば、こんにちは)に関係する辞書を備えた挨拶事例辞書、否定句(例えば、馬鹿言うんじゃないよ、反対)に関係する辞書を備えた否定事例辞書などから構成され、各辞書は、「発話文のタイプ」と関連付けられている。
【0044】
これにより、発話種類判定部440は、文節と発話種類データベース460に格納されている各辞書とを照合し、文節の中から各辞書に関連する文要素を抽出し、抽出した文要素に関連付けられた判定の種類を参照することで、「発話文のタイプ」を判定することができる。
【0045】
この発話種類判定部440は、後述する話題検索部360からの指示に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号を回答文検索部370に出力する。
【0046】
前記会話データベース500は、一つの文字、複数の文字列又はこれらの組み合わせからなる各形態素を示す第二形態素情報と、発話内容に対する利用者への回答文とを予め相互に関連付けて複数記憶する回答記憶手段(談話記憶手段;形態素記憶手段)である。また、会話データベース500は、複数の回答文に対応付けられた各回答文の種類を示す回答種類を、第二形態素情報に関連付けて予め複数記憶する回答記憶手段(談話記憶手段)でもある。
【0047】
更に、会話データベース500は、利用者から入力されるであろう入力内容又は利用者への回答文に関連性のある範囲を構成する形態素を示す談話範囲(キーワード)を予め複数記憶する形態素記憶手段でもある。この談話範囲(キーワード)には、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報が複数関連付けられ、各第二形態素情報には、利用者への回答文がそれぞれに関連付けてられている。
【0048】
更にまた、会話データベース500は、第二形態素情報を構成する各要素を、主格からなる主体各、目的格からなる対象格などの属性に分類して記憶する回答記憶手段(談話記憶手段)でもある。
【0049】
この会話データベース500は、図8に示すように、本実施形態では、大きく分けると、利用者から発話されるであろう発話内容又は利用者への回答文について関連性のある範囲を意味する談話範囲(ディスコース)と、利用者が発話している内容に最も密接な関連性のある範囲を意味する話題(トピック)とから構成されている。同図に示すように、”談話範囲”は、本実施形態では、”話題”の上位概念として位置付けるものとする。
【0050】
各談話範囲は、図9に示すように、階層構造となるように構成することができる。同図に示すように、例えば、ある談話範囲(映画)に対する上位概念の談話範囲(娯楽)は、上の階層構造に位置するようにし、談話範囲(映画)に対する下位概念の談話範囲(映画の属性、上映映画)は、下の階層構造に位置するようにすることができる。即ち、各談話範囲は、本実施形態では、他の談話範囲との間で上位概念、下位概念、同義語、対義語の関係が明確となる階層位置に配置することかできる。
【0051】
上述の如く、談話範囲は、各話題から構成されるものであり、本実施形態では、例えば、談話範囲がA映画名であれば、A映画名に関係する複数の話題を含んでいる。
【0052】
この話題は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素、即ち、利用者から発話されるであろう発話内容を構成する各形態素を意味するものであり、本実施形態では、サブジェクト(主体格)、オブジェクト(対象格)、アクションの「格」(属性)に対応付けられた各形態素からなるものである。これら三要素に対応付けられた各形態素は、本実施形態では、話題タイトル(この話題タイトルは、”話題”の下位概念に相当するものである)(第二形態素情報)と表現することにする。
【0053】
尚、話題タイトルには、上記三要素に対応付けられた各形態素に限定されるものではなく、他の「格」、即ち、時間を意味するタイム(テンス、アスペクト)、場所を意味するロケーション、条件を意味するコンディション、感想を意味するインプレッション、結果を意味するエフェクトなどに対応付けられた各形態素を有してもよい。
【0054】
この話題タイトル(第二形態素情報)は、本実施形態では、会話データベース500に予め格納されているものであり、上記第一形態素情報(利用者が発話した発話内容から導かれたもの)とは区別されるものである。
【0055】
例えば、話題タイトルは、談話範囲が”A映画名”である場合には、図10に示すように、サブジェクト(A映画名)、オブジェクト(監督)、アクション(素晴らしい){これは、”A映画名の監督は素晴らしい”を意味する}から構成されるものである。
【0056】
話題タイトルのうち、「格構成」(サブジェクト、オブジェクト、アクションなど)に対応付けられた形態素がない場合は、その部分については、本実施形態では、”*”を示すことにする。
【0057】
例えば、{A映画名って?}の文を話題タイトル(サブジェクト;オブジェクト;アクション)に変換すると、{A映画名って?}の文のうち、”A映画名”がサブジェクトとして特定することができるが、その他”オブジェクト””アクション”は文の要素になっていないので、話題タイトルは、”サブジェクト”(A映画名);”オブジェクト”なし(*);”アクション”なし(*)となる(図10参照)。
【0058】
回答文は、本実施形態では、各話題タイトル(第二形態素情報)に関連付けられている(図8参照)。回答文は、本実施形態では、本実施形態では、図11に示すように、利用者から発話された発話文のタイプに対応した回答をするために、陳述文(D;Declaration)、感想文(I;Impression)、条件文(C;Condition)、結果文(E;Effect)、時間文(T;Time)、場所文(L;Location)、否定文(N;Negation)などのタイプ(回答種類)に分類されている。
【0059】
即ち、各回答文は、図12に示すように、例えば、談話範囲(佐藤){下位概念;ホームラン、上位概念;草野球、同義語;パンダ佐藤・佐藤選手・パンダ}及び各話題タイトルと関連付けられている。
【0060】
同図に示すように、例えば、話題タイトル1−1が{(佐藤;*;好きだ):これは、上述の如く(サブジェクト;オブジェクト;アクション)の順番からなるものである。この順番は、以下同様とする}である場合は、その話題タイトル1−1に対応する回答文1−1は、(DA;陳述肯定文”佐藤が好きです”)、(IA;感想肯定文”佐藤がとても好きです”)、(CA;条件肯定文”佐藤のホームランはとても印象的だからです”)、(EA;結果肯定文”いつも佐藤の出る試合をテレビ観戦してしまいます”)、(TA;時間肯定文”実は、甲子園での5打席連続敬遠から好きになっています”)、(LA;場所肯定文”打撃に立ったときの真剣な顔が好きですね”)、(NA;反発肯定文”佐藤を嫌いな人とは話したくないですね、さよなら”)などが挙げられる。
【0061】
前記会話制御部300は、本実施形態では、図2に示すように、管理部310と、反射的判定部320と、鸚鵡返し判定部330と、談話範囲決定部340と、省略文補完部350と、話題検索部360と、回答文検索部370とを有している。
【0062】
前記管理部310は、会話制御部300の全体を制御するものである。具体的に、入力部100又は音声認識部200から文字列が入力された管理部310は、入力された文字列を文字列信号として形態素抽出部410に出力する。また、管理部310は、回答文検索部370で取得された回答文を出力部600に出力する。
【0063】
反射的判定部320は、形態素抽出部410で抽出された第一形態素情報と各定型内容を照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索する定型取得手段である。
【0064】
ここで、定型内容とは、利用者からの発話内容に対して定型的な内容を回答するための反射要素情報を意味し、この反射要素情報は、反射要素データベース801(定型記憶手段)に予め複数記憶されている。反射要素情報としては、本実施形態では、図13に示すように、例えば”おはよう”、”こんにちは”、”こんばんわ”、”やあ”などの「挨拶的要素」、「なるほど」、「本当?」などの「定型的要素」などが挙げられる。
【0065】
具体的に、文構造解析部430から話題検索命令信号が入力された反射的判定部320は、入力された話題検索命令信号に含まれる第一形態素情報と反射要素データベース801に記憶されている各反射要素情報とを照合し、各反射要素情報の中から、第一形態素情報を含む反射要素情報を検索し、検索した反射要素情報を管理部310に出力する。
【0066】
即ち、反射要素情報をD1、第一形態素情報をWとすると、反射的判定部320は、W∩D1≠φ(φ;空集合)の関係が成立していると判断した場合は、上記反射的な回答を行うための処理を行う。
【0067】
例えば、利用者が”おはよう”という発話内容を発した場合には、反射的判定部320は、発話内容”おはよう”と各反射要素情報とを照合し、各反射要素情報の中から、発話内容”おはよう”を含む(と一致する)反射要素情報”おはよう”を検索し、検索した反射要素情報”おはよう”を管理部310に出力する。
【0068】
反射的判定部320は、各反射要素情報の中から、発話内容を含む反射要素情報を検索することができない場合には、文構造解析部430から入力された話題検索命令信号を鸚鵡返し判定部330に出力する。
【0069】
鸚鵡返し判定部330は、形態素抽出部410で抽出された現在の第一形態素情報と、鸚鵡返し要素データベース802に記憶されている過去の回答文とを照合し、現在の第一形態素情報が過去の回答文に含まれる場合には、合意内容を取得する定型取得手段である。
【0070】
ここで、鸚鵡返しとは、本実施形態では、利用者の発話内容をそのまま(又はそれに近い内容を)言い返すことを意味する。鸚鵡返し要素は、本実施形態では、直前に会話制御装置1から出力された回答文を構成する第一形態素情報などからなるのもであり、図14に示すように、例えば、”馬は美しい”(馬;*;美しい)、”佐藤が好きです”(佐藤;*;好きです)などが挙げられる。
【0071】
また、鸚鵡返し要素データベース802は、利用者から入力された入力情報に合意するための合意内容を予め記憶する合意記憶手段でもある。合意内容には、例えば、前回、利用者から入力された入力情報(利用者により前回の入力情報が”A映画名の監督はS氏ですか”である場合には、合意内容としては、”A映画名の監督はS氏です”)、又は ”その通りです”、”本当です”などが挙げられる。
【0072】
具体的に、反射的判定部320から話題検索命令信号が入力された鸚鵡返し判定部330は、各鸚鵡返し要素毎に、入力された話題検索命令信号に含まれる第一形態素情報と鸚鵡返し要素を構成する各形態素とを照合し、鸚鵡返し要素の中に第一形態素情報が含まれているかを判断する(図14参照)。
【0073】
鸚鵡返し判定部330は、各鸚鵡返し要素の中に第一形態素情報が含まれていると判断した場合には、合意内容を取得し、取得した合意内容からなる回答文を管理部310に出力(鸚鵡返し処理)する。即ち、鸚鵡返し要素(前回の回答文など)をS、第一形態素情報をWとすると、鸚鵡返し判定部330は、W⊂S、W≠φの関係が成立している場合には、上記に示す鸚鵡返し処理を行う。
【0074】
例えば、会話制御装置1が回答文として”A映画名の監督はS氏です”(A映画名の監督;S氏;*)(この順番は、サブジェクト;オブジェクト;アクションの順番、以下同様とする)を出力し、その後、利用者が出力された回答文に対して”A映画名の監督はS氏ですか”(A映画名の監督;S氏;*)と発話した場合には、鸚鵡返し判定部330は、利用者の第一形態素情報(A映画名の監督;S氏;*)と回答文の各形態素(A映画名の監督;S氏;*)とが一致しているので、利用者は回答文に対して鸚鵡返しを行っていると断定し、記憶されている合意内容”その通りです”などを取得し、取得した合意内容を出力する。
【0075】
また、鸚鵡返し判定部330は、形態素抽出部410で抽出された現在の第一形態素情報と、鸚鵡返し要素データベース802に記憶されている過去の第一形態素情報とを照合し、現在の第一形態素情報が過去の第一形態素情報に含まれる場合には、反発内容を取得する定型取得手段でもある。
【0076】
具体的には、利用者が”馬は美しい”という発話内容を発話し、会話制御装置1が回答文として”馬は躍動感があって良いですね”の内容を出力した場合に、後に利用者が”馬は美しい”という発話内容を繰り返したときは、鸚鵡返し判定部330は、現在の発話内容”馬は美しい”を構成する各形態素(第一形態素情報){馬;*;美しい}と前の発話内容”馬は美しい”を構成する各形態素(第一形態素情報){馬;*;美しい}とが一致しているので、利用者は会話制御装置1からの回答文”馬は躍動感があって良いですね”については全く聞いていないものと断定することができる。
【0077】
この場合、鸚鵡返し判定部330は、利用者が会話制御装置1からの回答文を聞いていないので、記憶された反発内容(例えば、同じ内容を繰り返さないでよ”など)取得し、取得した反発内容を出力することができる。
【0078】
一方、鸚鵡返し判定部330は、第一形態素情報が前回の回答文の内容と同一、又は第一形態素情報が前回の第一形態素情報と同一でないと判断した場合には、反射的判定部320から入力された話題検索命令信号を談話範囲決定部340に出力する。
【0079】
尚、上記の鸚鵡返し判定部330は、「会話制御装置1の回答文」に対して利用者が鸚鵡返しを行った場合の処理を示してきたが、更に以下の処理も行うことができる。例えば、出力部600が”馬は美しい”という回答文を出力した場合、この回答文に対して利用者が”どうして馬は美しいの?”、”どうして美しいの?”、又は”どうして?”と発話した場合に対して行う鸚鵡返し判定部330の処理である。
【0080】
この場合、鸚鵡返し判定部330は、出力した回答文S”馬は美しい”と利用者からの発話内容W(”どうして馬は美しいの?(疑問文)”又は”どうして美しいの?(疑問文)”)とを照合すると、(W−c)⊂S、S≠φ、c≠φ(このcは、Wの発話種類を意味し、この発話種類は、後述する発話種類判定部440で判定されるものである。発話種類には、後述するように、例えば、疑問文などが挙げられる。)の関係が成立するので、”条件付”の鸚鵡返し処理(回答文に対して利用者が疑問文付きの鸚鵡返しを行った場合の処理)を行う。
【0081】
”条件付”の鸚鵡返し処理としては、例えば、会話制御装置1が”馬は美しいね”の回答文を出力した場合に、上記利用者が”どうして馬は美しいの?”の発話内容を発したときは、利用者の疑問等を解消するため、鸚鵡返し判定部330が”だって馬は美しいじゃない”などの回答文を鸚鵡返し要素データベース802の中から取得し、取得した回答文を管理部310に出力する処理を行う。
【0082】
談話範囲決定部340は、文節解析部420で抽出された第一形態素情報と予め記憶された各談話範囲とを照合し、各談話範囲の中から、第一形態素情報に含まれる形態素と一致する談話範囲を検索する談話範囲検索手段である。
【0083】
具体的に、鸚鵡返し判定部330から話題検索命令信号が入力された談話範囲決定部340は、入力された談話検索命令信号に基づいて、利用者の談話範囲を決定する。即ち、談話範囲決定部340は、入力された検索命令信号に基づいて、会話データベース500の中から、利用者が発話している内容について関連性のある範囲(談話範囲)を検索する。
【0084】
例えば、談話範囲決定部340は、入力された話題検索命令信号に含まれる第一形態素情報が(面白い映画;*;ある){面白い映画はある?}である場合には、この第一形態素情報と談話範囲群とを照合し、談話範囲群に第一形態素情報を構成する形態素(例えば”映画”)が含まれているときは、第一形態素情報に含まれる”映画”を談話範囲として決定する。この場合、談話範囲決定部340は、第一形態素情報に談話範囲”映画”が含まれているので、入力された第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0085】
一方、談話範囲決定部340は、第一形態素情報に談話範囲群が含まれていない場合には、入力された第一形態素情報を話題検索命令信号に含めて省略文補完部350に出力する。
【0086】
これにより、後述する話題検索部360は、談話範囲決定部340で決定された”談話範囲”に属する各「話題タイトル」と、文構造解析部430で特定された第一形態素情報とを照合することができるので、”全て”の「話題タイトル」(第二形態素情報)と第一形態素情報とを照合する必要がなくなり、後述する回答文検索部370は、最終的な回答文を検索するまでの時間を短縮することができる。
【0087】
尚、談話範囲決定部340は、上記の如く、第一形態素情報と談話範囲群とを照合し、談話範囲群に第一形態素情報の形態素が含まれていれば、その形態素を談話範囲として決定していたが、これに限定されるものではなく、鸚鵡返し判定部330で直前に検索された鸚鵡返し要素の形態素、又は利用者が発話した発話内容を構成する形態素を談話範囲として決定しても良い。後述する省略文補完部350は、上記談話範囲決定部340で決定された談話範囲を用いて、その談話範囲を、形態素が省略されている第一形態素情報に付加することができる。
【0088】
省略文補完部350は、文節解析部420で抽出された第一形態素情報に基づいて第一形態素情報を構成する各属性(サブジェクト、オブジェクト、アクションなど)の中から、形態素を含まない属性を検索する属性検索手段である。また、省略文補完部350は、検索した属性に基づいて、属性に、談話範囲決定部340で検索された談話範囲を構成する形態素を付加する形態素付加手段でもある。
【0089】
具体的に、談話範囲決定部340から話題検索命令信号が入力された省略文補完部350は、入力された談話検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報からなる発話内容が省略文であるかを判定し、第一形態素情報からなる発話内容が省略文である場合には、第一形態素情報が属する談話範囲の形態素を、第一形態素情報に付加する。
【0090】
例えば、省略文補完部350は、入力された話題検索命令信号に含まれる第一形態素情報を構成する形態素が(監督;*;*)(監督は?)(この文は、”何の”監督であるかが不明であるので、省略文を意味する。)である場合には、談話範囲決定部340で決定された談話範囲(A映画名;このA映画名は映画のタイトルを示すものである)に属する第一形態素情報であれば、第一形態素情報を構成する形態素に、決定された談話範囲(A映画名)を第一形態素情報に付加(”A映画名”の監督;*;*)する。
【0091】
即ち、第一形態素情報をW、決定された談話範囲をDとすると、省略文補完部350は、Wに談話範囲Dを付加し、付加後の第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0092】
これにより、第一形態素情報が省略文であり、日本語として明解でない場合であっても、省略文補完部350は、第一形態素情報がある談話範囲に属している場合には、例えば、その談話範囲D(A映画名)を第一形態素情報W(監督;*;*)に付加し、第一形態素情報をW’(A映画名の監督;*;*){A映画名の監督は?}として扱うことができるので、利用者の発話内容が省略文である場合であっても、前に決定された談話範囲に基づいて省略文を補完することができ、省略文を明確にすることができる。
【0093】
このため、省略文補完部350が、第一形態素情報を構成する発話内容が省略文であっても、第一形態素情報を構成する発話内容が適正な日本語となるように、第一形態素情報に特定の形態素を補完することができるので、話題検索部360は、補完後の第一形態素情報に基づいて、第一形態素情報に関連する最適な「話題タイトル」(第二形態素情報)を取得することができ、回答文検索部370は、話題検索部360で取得された「話題タイトル」に基づいて利用者の発話内容により適した回答文を出力することができる。
【0094】
話題検索部360は、文節解析部420で抽出された第一形態素情報又は省略文補完部350で補完された第一形態素情報と、各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報を検索する検索手段である。
【0095】
具体的に、談話範囲決定部340又は省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、談話範囲決定部340で決定された談話範囲に属する各「話題タイトル」(第二形態素情報)の中から、第一形態素情報の形態素を含む「話題タイトル」を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0096】
例えば、第一形態素情報を構成する「格構成」が(佐藤;*;好きだ){佐藤は好きだ}である場合には、話題検索部360は、図12に示すように、上記「格構成」に属する各形態素(佐藤;*;好きだ)と談話範囲(佐藤)に属する各話題タイトル1−1〜1−4とを照合し、各話題タイトル1−1〜1−4の中から「格構成」に属する各形態素(佐藤;*;好きだ)と一致(又は近似)する話題タイトル1−1(佐藤;*;好きだ)を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0097】
話題検索部360から検索結果信号が入力された発話種類判定部440は、入力された検索結果信号に基づいて、該当する利用者に対して回答する特定の回答文を検索させるための回答検索命令信号(この回答検索命令信号には、判定した「発話文のタイプ」も含まれる)を回答文検索部370に出力する。
【0098】
回答文検索部370は、話題検索部360で検索された第二形態素情報(話題タイトル)に基づいて、第二形態素情報に関連付けられた回答文を検索する回答検索手段である。また、回答文検索部370は、話題検索部360で検索された第二形態素情報に基づいて、特定された利用者の発話種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、利用者の発話種類と一致する回答種類を取得する第二検索手段でもある。
【0099】
具体的に、話題検索部360から検索結果信号と、発話種類判定部440から回答検索命令信号とが入力された回答文検索部370は、入力された検索結果信号に対応する話題タイトル(検索結果によるもの;第二形態素情報)と回答検索命令信号に対応する「発話文のタイプ」(発話種類)とに基づいて、その「話題タイトル」に関連付けられている回答文群の中から、「発話文のタイプ」(DA、IA、CAなど)と一致する回答種類(この回答種類は、図11に示す「回答文のタイプ」を意味する)からなる回答文を検索する。
【0100】
例えば、回答文検索部370は、検索結果に対応する話題タイトルが図12に示す話題タイトル1−1(佐藤;*;好きだ)である場合は、その話題タイトル1−1に関連付けられている回答文1−1(DA、IA、CAなど)の中から、発話種類判定部440で判定された「発話文のタイプ」(例えばDA;発話種類)と一致する回答種類(DA)からなる回答文1−1(DA;(私も)佐藤が好きです)を検索し、この検索した回答文を回答文信号として管理部310に出力する。
【0101】
回答文検索部370から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。また、反射的判定部320から反射要素情報、又は鸚鵡返し判定部330から鸚鵡返し処理の内容が入力された管理部310は、入力された反射要素情報に対応する回答文、入力された鸚鵡返し処理の内容に対応する回答文を出力部600に出力する。
【0102】
出力部600は、回答文検索部370で取得された回答文を出力する出力手段であり、本実施形態では、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部310から回答文が入力された出力部600は、入力された回答文{例えば、私も佐藤が好きです}を出力する。
【0103】
(会話制御装置を用いた会話制御方法)
上記構成を有する会話制御装置1による会話制御方法は、以下の手順により実施することができる。図15は、本実施形態に係る会話制御方法の手順を示すフロー図である。
【0104】
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(S101)。具体的に入力部100は、利用者の発話内容を構成する音声を取得し、取得した音声を音声信号として音声認識部200に出力する。また、入力部100は、利用者から入力された入力情報(音声以外)に基づいて、入力情報(音声以外)に含まれる文字列を特定し、特定した文字列を文字列信号として会話制御部300に出力する。
【0105】
次いで、音声認識部200が、入力部100で取得した発話内容に基づいて、発話内容に含まれる文字列を特定するステップを行う(S102)。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号を解析し、解析した音声信号に含まれる文字列を、音声認識辞書記憶部700に格納されている辞書を用いて特定し、特定した文字列を文字列信号として会話制御部300に出力する。
【0106】
そして、形態素抽出部410が、音声認識部200で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う(S103)。
【0107】
具体的に、管理部310から文字列信号が入力された形態素抽出部410は、入力された文字列信号に対応する文字列と、形態素データベース450に予め格納されている名詞、形容詞、動詞などの形態素群とを照合し、文字列の中から形態素群と一致する各形態素(m1、m2、・・・)を抽出し、抽出した各形態素を抽出信号として文節解析部420に出力する。
【0108】
そして、文節解析部420は、形態素抽出部410で抽出された各形態素に基づいて、各形態素を文節形式にまとめるステップを行う(S104)。具体的に、形態素抽出部410から抽出信号が入力された文節解析部420は、入力された抽出信号に対応する各形態素を用いて文節形式にまとめる。
【0109】
即ち、文節解析部420は、図4に示すように、入力された抽出信号に対応する各形態素に基づいて各形態素の係り受け要素(例えば、が・は・を・・)を抽出し、抽出した係り受け要素に基づいて各形態素を各文節にまとめることを行う。 各形態素を各文節にまとめた文節解析部420は、各形態素をまとめた各文節と、各文節を構成する各形態素とを含む文型情報を文型信号として文構造解析部430及び発話種類判定部440に出力する。
【0110】
その後、文構造解析部430が、文節解析部420で分節された第一形態素情報の各形態素を主体格、対象格などの各属性に分類するステップを行う(S105)。具体的に、文節解析部420から文型信号が入力された文構造解析部430は、入力された文型信号に対応する各形態素と各形態素からなる文節とに基づいて、文節に含まれる各形態素の「格構成」を決定する。
【0111】
即ち、文構造解析部430は、図5に示すように、例えば、各形態素の係り受け要素が”が”又は”は”である場合は、その係り受け要素の前にある形態素がサブジェクト(主語又は主格)であると判断する。また、文構造解析部430は、例えば、各形態素の係り受け要素が”の”又は”を”である場合は、その係り受け要素の前にある形態素がオブジェクト(対象)であると判断する。
【0112】
更に、文構造解析部430は、例えば、各形態素の係り受け要素が”する”である場合は、その係り受け要素の前にある形態素がアクション(述語;この述語は動詞、形容詞などから構成される)であると判断する。
【0113】
各文節を構成する各形態素の「格構成」を決定した文構造解析部430は、決定した「格構成」に対応付けられた第一形態素情報に基づいて、後述する話題(トピック)の範囲を特定させるための話題検索命令信号を話題検索部360に出力する。
【0114】
次いで、発話種類判定部440は、文節解析部420で特定された文節に基づいて、発話内容の種類を示す発話種類を特定するステップを行う(S106)。具体的に、文節解析部420から入力された文型信号に対応する各形態素と各形態素から構成される文節とに基づいて、「発話文のタイプ」(発話種類)を判定する。
【0115】
即ち、発話種類判定部440は、入力された文型信号に対応する各文節に基づいて、その各文節と発話種類データベース460に格納されている各辞書とを照合し、各文節の中から、各辞書に関係する文要素を抽出する。各文節の中から各辞書に関係する文要素を抽出した発話種類判定部440は、抽出した文要素に基づいて、「発話文のタイプ」を判定する。
【0116】
この発話種類判定部440は、後述する話題検索部360からの指示に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号を回答文検索部370に出力する。
【0117】
次いで、反射的判定部320が、形態素抽出部410で抽出された第一形態素情報と各定型内容を照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索するステップを行う(S107;反射的処理)。
【0118】
具体的に、文構造解析部430から話題検索命令信号が入力された反射的判定部320は、入力された話題検索命令信号に含まれる第一形態素情報と反射要素データベース801に記憶されている各反射要素情報(定型内容)とを照合し、各反射要素情報の中から、第一形態素情報を含む反射要素情報を検索し、検索した反射要素情報を管理部310に出力する。
【0119】
反射的判定部320は、各反射要素情報の中から、第一形態素情報を含む反射要素情報を検索することができない場合には、文構造解析部430から入力された話題検索命令信号を鸚鵡返し判定部330に出力する。
【0120】
次いで、鸚鵡返し判定部330が、形態素抽出部410で抽出された第一形態素情報と各鸚鵡返し要素を照合し、各鸚鵡返し要素の中から、第一形態素情報を含む鸚鵡返し要素を検索するステップを行う(S108;鸚鵡返し処理)。
【0121】
鸚鵡返し判定部330は、各鸚鵡返し要素の中に第一形態素情報が含まれていると判断した場合には、第一形態素情報を含む鸚鵡返し要素を取得し、取得した鸚鵡返し要素からなる回答文を管理部310に出力(鸚鵡返し処理)する。即ち、鸚鵡返し要素(前回出力された回答文、前回利用者が発話した発話内容など)をS、第一形態素情報をWとすると、鸚鵡返し判定部330は、W⊂S、W≠φの関係が成立している場合には、上記に示す鸚鵡返し処理を行う。
【0122】
一方、鸚鵡返し判定部330は、各鸚鵡返し要素の中に第一形態素情報が含まれていないと判断した場合には、反射的判定部320から入力された話題検索命令信号を談話範囲決定部340に出力する。
【0123】
そして、談話範囲決定部340が、文節解析部420で抽出された第一形態素と各談話範囲とを照合し、各談話範囲の中から、第一形態素情報を含む談話範囲を検索(決定)するステップを行う(S109)。
【0124】
具体的に、鸚鵡返し判定部330から話題検索命令信号が入力された談話範囲決定部340は、入力された検索命令信号に基づいて、会話データベース500の中から、利用者が発話している内容について関連性のある範囲(談話範囲)を検索する。
【0125】
例えば、談話範囲決定部340は、入力された話題検索命令信号に含まれる第一形態素情報が(面白い映画;*;ある){面白い映画はある?}である場合には、この第一形態素情報と談話範囲群とを照合し、談話範囲群に第一形態素情報を構成する形態素(例えば”映画”)が含まれているときは、第一形態素情報に含まれる”映画”を談話範囲として決定する。この場合、談話範囲決定部340は、第一形態素情報に談話範囲”映画”が含まれているので、入力された第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0126】
一方、談話範囲決定部340は、第一形態素情報に談話範囲群が含まれていない場合には、入力された第一形態素情報を話題検索命令信号に含めて省略文補完部350に出力する。
【0127】
次いで、省略文補完部350が、文節解析部420で抽出された第一形態素情報に基づいて第一形態素情報を構成する各属性(サブジェクト、オブジェクト、アクションなど)の中から、形態素を含まない属性を検索するステップを行う。その後、省略文補完部350が、検索した形態素を含まない属性に基づいて、その属性に、談話範囲決定部340で検索された談話範囲を構成する形態素を付加するステップを行う(S110;省略文を補完)。
【0128】
具体的に、談話範囲決定部340から話題検索命令信号が入力された省略文補完部350は、入力された談話検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報からなる発話内容が省略文であるかを判定し、第一形態素情報からなる発話内容が省略文である場合には、第一形態素情報が属する談話範囲の形態素を、第一形態素情報に付加する。
【0129】
例えば、省略文補完部350は、入力された話題検索命令信号に含まれる第一形態素情報を構成する形態素が(監督;*;*)(監督は?)(この文は、”何の”監督であるかが不明であるので、省略文を意味する。)である場合には、前に談話範囲決定部340で決定された談話範囲(A映画名;このA映画名とは映画のタイトルを示すものである)に属する第一形態素情報であれば、第一形態素情報を構成する形態素に、決定された談話範囲の形態素(A映画名)を第一形態素情報に付加(”A映画名”の監督;*;*)する。
【0130】
即ち、第一形態素情報をW、決定された談話範囲をDとすると、省略文補完部350は、第一形態素情報Wに談話範囲Dを付加し、付加後の第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0131】
次いで、話題検索部360が、文節解析部420で抽出された第一形態素情報又は省略文補完部350で補完された第一形態素情報と、各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報を検索するステップを行う(S111)。
【0132】
具体的に、談話範囲決定部340又は省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、談話範囲決定部340で決定された談話範囲に属する各「話題タイトル」(第二形態素情報)の中から、第一形態素情報の形態素を含む「話題タイトル」を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0133】
例えば、第一形態素情報を構成する「格構成」が(佐藤;*;好きだ){佐藤は好きだ}である場合には、話題検索部360は、図12に示すように、上記「格構成」に属する各形態素(佐藤;*;好きだ)と談話範囲(佐藤)に属する各話題タイトル1−1〜1−4とを照合し、各話題タイトル1−1〜1−4の中から「格構成」に属する各形態素(佐藤;*;好きだ)と一致(又は近似)する話題タイトル1−1(佐藤;*;好きだ)を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0134】
話題検索部360から検索結果信号が入力された発話種類判定部440は、入力された検索結果信号に基づいて、該当する利用者に対して回答する特定の回答文を検索させるための回答検索命令信号(この回答検索命令信号には、判定した「発話文のタイプ」も含まれる)を回答文検索部370に出力する。
【0135】
そして、回答文検索部370が、話題検索部360で検索された第二形態素情報に基づいて、特定された利用者の発話種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に基づいて回答種類に関連付けられている回答文を検索するステップを行う(S112)。
【0136】
具体的に、話題検索部360から検索結果信号と、発話種類判定部440から回答検索命令信号とが入力された回答文検索部370は、入力された検索結果信号に対応する話題タイトル(検索結果によるもの;第二形態素情報)と回答検索命令信号に対応する「発話文のタイプ」(発話種類)とに基づいて、その「話題タイトル」に関連付けられている回答文群の中から、「発話文のタイプ」(DA、IA、CAなど)と一致する回答種類(この回答種類は、図11に示す「回答文のタイプ」を意味する)からなる回答文を検索する。
【0137】
例えば、回答文検索部370は、検索結果に対応する話題タイトルが図12に示す話題タイトル1−1(佐藤;*;好きだ)である場合は、その話題タイトル1−1に関連付けられている回答文1−1(DA、IA、CAなど)の中から、発話種類判定部440で判定された「発話文のタイプ」(例えばDA;発話種類)と一致する回答種類(DA)からなる回答文1−1(DA;(私も)佐藤が好きです)を検索し、この検索した回答文を回答文信号として管理部310に出力する。
【0138】
次いで、回答文検索部370から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。また、反射的判定部320から反射要素情報、又は鸚鵡返し判定部330から鸚鵡返し処理の内容が入力された管理部310は、入力された反射要素情報に対応する回答文、入力された鸚鵡返し処理の内容に対応する回答文を出力部600に出力する(S113)。管理部310から回答文が入力された出力部600は、入力された回答文{例えば、私も佐藤が好きです}を出力する。
【0139】
(会話制御装置及び会話制御方法による作用及び効果)
上記構成を有する本願に係る発明によれば、反射的判定部320が、利用者から発話された発話内容を構成する第一形態素情報と予め記憶された各定型内容とを照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索することができるので、反射的判定部320は、例えば第一形態素情報が”こんにちは”などの定型内容である場合には、この定型内容と同一の定型内容”こんにちは”等を回答することができる。
【0140】
また、反射的判定部320は、利用者の発話内容が定型内容である場合には、その定型内容(挨拶など)を回答するので、利用者は、最初に、会話制御装置1との間で意思の疎通をしているような感覚を味わうことができる。
【0141】
また、鸚鵡返し判定部330が、現在の第一形態素情報と過去の回答文とを照合し、現在の第一形態素情報が過去の回答文に含まれていない場合には、予め記憶してある合意内容を取得することができるので、鸚鵡返し判定部330は、利用者から現在入力された入力情報と過去の回答文とが一致していれば、利用者が過去の回答文に対して鸚鵡返し(利用者が回答文に対して聞き直していること)の入力情報を入力したものと断定することができる。
【0142】
この場合、鸚鵡返し判定部330は、利用者が過去の回答文に対して鸚鵡返しを行っているので、記憶されている合意内容を取得し、取得した合意内容(例えば、”その通りです”など)を出力することができる。これにより、利用者は、会話制御装置1から出力された回答文の意味が分からなければ、もう一度聞き直して、再度回答文を聞き直すことができるので、恰も他の利用者と会話しているような感覚を味わうことができる。
【0143】
また、鸚鵡返し判定部330が、現在の第一形態素情報と過去の第一形態素情報とを照合し、現在の第一形態素情報が過去の第一形態素情報に含まれる場合には、反発内容を取得することができるので、鸚鵡返し判定部330は、前回入力された入力情報が今回入力された入力情報に含まれている場合には、利用者が前の入力情報と同一の内容を反復して入力したものと判断することができ、利用者が会話制御装置からの回答文に対して適切に回答していないものと断定することができる。
【0144】
この場合、鸚鵡返し判定部330は、利用者が前回の回答文に対して適切に回答していないので、利用者に対して反発するため、記憶されている反発内容を取得し、取得した反発内容を出力する。これにより、利用者は、会話制御装置1からの回答文に対して適切な入力情報を入力しなければ、会話制御装置1から反発内容が出力されるので、恰も他の利用者と会話しているような感覚を味わうことができる。
【0145】
また、話題検索部360は、第一形態素情報と近似する第二形態素情報を検索するには、”談話範囲”に属する各第二形態素情報と第一形態素情報とを照合すればよく、”全て”の第二形態素情報と第一形態素情報とを照合する必要がないので、第一形態素情報と近似している第二形態素情報を検索するまでの時間を短縮することができる。
【0146】
この結果、話題検索部360が、第一形態素情報と近似している第二形態素情報を短時間で検索(ピンポイント検索)することができるので、回答文検索部370は、話題検索部360で検索された第二形態素情報に基づいて第二形態素情報に関連付けられている回答文を短時間で取得することができ、会話制御装置1は、利用者からの発話内容に対して迅速に回答することができる。
【0147】
また、話題検索部360が、各第二形態素情報の中から、第一形態素情報を構成する形態素(利用者の発話内容を構成する要素)を含む第二形態素情報を検索し、回答文検索部370が、話題検索部360で検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答文を検索することができるので、回答文検索部370は、利用者の発話内容を構成する各形態素(第一形態素情報)に基づいて、各形態素により構築される意味空間(主体、対象等)を考慮し、かかる意味空間に基づいて予め作成された回答文を検索することができることとなり、単に発話内容の全体をキーワードとして、そのキーワードに関連付けられた回答文を検索するよりも、より発話内容に適した回答文を検索することができる。
【0148】
また、話題検索部360は、第一形態素情報を含む第二形態素情報を検索するので、利用者の発話内容と完全に一致する第二形態素情報を検索する必要がなく、会話制御装置1を開発する開発者は、利用者から発話されるであろう発話内容に対応する膨大な回答文を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
【0149】
更に、回答文検索部370が、”談話範囲”に属する各第二形態素情報に関連付けられた回答種類(陳述、肯定、場所、反発など)の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に基づいて回答種類に対応付けられた回答文を検索することができるので、会話制御装置1は、利用者の会話内容を構成する発話種類、例えば、利用者が単に意見を述べたもの、利用者が抱く感想からなるもの、利用者が場所的な要素を述べたものなどに基づいて、複数の回答文の中から利用者の発話種類にマッチした回答文を検索することができることとなり、該当する利用者に対してより最適な回答をすることができる。
【0150】
更にまた、回答文検索部370は、談話範囲決定部340で検索された”談話範囲”にのみ属する各第二形態素情報に関連付けられた回答種類の中から、利用者の発話種類と一致する回答種類を検索(ピンポイント検索が可能)するだけでよいので、”全て”の第二形態素情報に関連付けられた回答種類と利用者の発話種類とを逐一検索する必要がなくなり、利用者の発話種類に対応する最適な回答文を短時間で取得することができる。
【0151】
最後に、省略文補完部350は、利用者の発話内容を構成する第一形態素情報が省略文であり、日本語として明解でない場合であっても、第一形態素情報がある談話範囲に属している場合には、その談話範囲を第一形態素情報に付加し、省略文からなる第一形態素情報を補完することができる。
【0152】
これにより、省略文補完部350は、第一形態素情報を構成する発話内容が省略文であっても、第一形態素情報を構成する発話内容が適正な日本語となるように、第一形態素情報に特定の形態素(談話範囲を構成する形態素など)を補完することができるので、話題検索部360は、省略文補完部350で補完された補完後の第一形態素情報に基づいて、第一形態素情報に関連する最適な第二形態素情報を取得することができ、回答文検索部370は、話題検索部360で取得された第二形態素情報に基づいて利用者の発話内容により適した回答文を出力することができる。
【0153】
この結果、会話制御装置1は、利用者からの入力情報が省略文であったとしても、ニューロネットワーク、AI知能などの機能を用いることなく、過去の検索結果を通じて、その省略文が何を意味するのかを推論することができ、会話制御装置1の開発者は、ニューロネットワーク、AI知能を搭載する必要がないので、会話制御装置1のシステムをより簡便に構築することができる。
【0154】
[変更例]
尚、本発明は、上記実施形態に限定されるものではなく、以下に示すような変更を加えることができる。
【0155】
(第一変更例)
本変更例においては、会話データベース500は、複数の形態素の集合からなる集合群の全体を示す要素情報を、集合群に関連付けて複数記憶する要素記憶手段であってもよい。更に、形態素抽出部410は、文字列から抽出した形態素と各集合群とを照合し、各集合群中から、抽出された形態素を含む集合群を選択し、選択した集合群に関連付けられた要素情報を第一形態素情報として抽出してもよい。
【0156】
図16に示すように、利用者が発話した文字列に含まれる各形態素には、類似しているものがある。例えば、図16に示すように、集合群の全体を示す要素情報を「贈答」とすると、「贈答」は、プレゼント、贈り物、御歳暮、御中元、お祝いなど(集合群)と相互に類似しているので、形態素抽出部410は、「贈答」に類似する形態素(上記のプレゼントなど)がある場合には、その類似する形態素については、「贈答」として取り扱うことができる。
【0157】
即ち、形態素抽出部410は、例えば、文字列から抽出した形態素が「プレゼント」である場合には、図16に示すように、「プレゼント」を代表する要素情報が「贈答」であるので、上記「プレゼント」を「贈答」に置き換えることができる。
【0158】
これにより、形態素抽出部410が相互に類似する形態素を整理することができるので、会話制御装置を開発する開発者は、相互に類似した各第一形態素情報から把握される意味空間に対応した第二形態素情報及び第二形態素情報に関係する回答文を逐一作成する必要がなくなり、結果的に、記憶部に格納させるデータ量を低減させることができる。
【0159】
(第二変更例)
図17に示すように、本変更例においては、割合計算部361と、選択部362とを話題検索部360に備えてもよい。
【0160】
割合計算部361は、形態素抽出部410で抽出された第一形態素情報と各第二情報とを照合し、各第二形態素情報毎に、第二形態素情報に対して第一形態素情報が占める割合を計算する計算手段である。
【0161】
具体的に、文構造解析部430から話題検索命令信号が入力された割合計算部361は、図17に示すように、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と会話データベース500に格納されている談話範囲に属する各話題タイトル(第二形態素情報)とを照合し、各話題タイトル毎に、それぞれの話題タイトルの中に、第一形態素情報が占める割合を計算する。
【0162】
例えば、図18に示すように、利用者から発話された発話文を構成する第一形態素情報が(佐藤;*;好きだ){佐藤は好きだ}である場合は、割合計算部361は、「格構成」に属する各形態素(佐藤;*;好きだ)と話題タイトルに含まれる各形態素(佐藤;*;好きだ)とを照合し、上記話題タイトルに、「格構成」に属する各形態素(佐藤;*;好きだ)が含まれる割合を、100%であると計算する。割合計算部361は、これらの計算を話題タイトル毎に行い、計算した各割合を割合信号として選択部362に出力する。
【0163】
選択部362は、割合計算部361で各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択する選択手段である。
【0164】
具体的に、割合計算部361から割合信号が入力された選択部362は、入力された割合信号に含まれる各割合(「格構成」の要素/「話題タイトル」の要素×100)の中から、例えば割合の高い話題タイトルを選択する(図18参照)。割合の高い話題タイトルを選択した選択部362は、選択した話題タイトルを検索結果信号として回答文検索部370及び発話種類判定部440に出力する。回答文検索部370は、選択部362で選択された話題タイトルに基づいて、話題タイトルに関連付けられた回答文を検索する。
【0165】
これにより、選択部362が、各第二形態素情報毎に、第二形態素情報に対して該第一形態素情報が占める割合を計算し、各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択することができるので、選択部362は、例えば、第一形態素情報(利用者の発話内容を構成するもの)が第二形態素情報に占める割合の大きい第二形態素情報を、複数ある第二形態素情報群の中から取得することができれば、第一形態素情報から把握される意味空間を踏襲した第二形態素情報をより的確に取得することができ、結果的に、回答文検索部370は、利用者の発話内容に対して最適な回答をすることができる。
【0166】
また、選択部362は、複数の話題タイトルの中から、割合計算部361で計算された割合の高い話題タイトルを選択することができるので、利用者の発話文に含まれる「格構成」に属する各形態素と会話データベース500に格納されている各話題タイトルとが完全に一致しなくても、「格構成」に属する各形態素に密接する話題タイトルを取得することができる。
【0167】
この結果、選択部362が第一形態素情報を構成する「格構成」に密接する話題タイトルを取得することができるので、会話制御装置1を開発する開発者は、第一形態素情報を構成する「格構成」と完全に一致する話題タイトルを会話データベース500に逐一格納する必要がなくなるので、会話データベース500の容量を低減させることができる。
【0168】
更に、割合計算部361は、談話範囲決定部340で検索された”談話範囲”にのみ属する各第二形態素情報毎に、第二形態素情報に対して該第一形態素情報が占める割合を計算するので、”全て”の第二形態素情報に対して第一形態素情報が占める割合を計算する必要がなくなり、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより短時間で取得することができ、結果的に、取得した第二形態素情報に基づいて利用者からの発話内容に対しての最適な回答文を迅速に出力することができる。
【0169】
尚、割合計算部361は、分類された各属性に属する第一形態素情報の各形態素と、予め記憶された各属性に属する各第二形態素情報の各形態素とを各属性毎に照合し、各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の各形態素を含む第二形態素情報を検索する第一検索手段であってもよい。
【0170】
具体的に、話題検索命令信号が入力された割合計算部361は、入力された話題検索命令信号に含まれる「格構成」の各「格」(サブジェクト;オブジェクト;アクション)毎に、その「格」に属する各形態素と、同一の「格」からなる話題タイトルの「格」に属する各形態素とを照合し、互いの「格」を構成する形態素が同一か否かを判定する。
【0171】
例えば、図19に示すように、割合計算部361は、「格構成」の「格」の形態素が(犬;人;噛んだ){犬が人を噛んだ}である場合は、それらの形態素”犬”、”人”、”噛んだ”と、それらの形態素を構成する「格」と同一の「格」からなる話題タイトルの形態素”犬”、”人”、”噛んだ”とを照合し、話題タイトルを構成する各形態素”犬”、”人”、”噛んだ”のうち、各形態素に対応する「格」と同一の「格」からなる「格構成」の形態素”犬”、”人”、”噛んだ”と一致している割合を算出(100%)する。
【0172】
もし、話題タイトルを構成する要素が(人;犬;噛んだ){人が犬を噛んだ}である場合には、割合計算部361は、上記と同様の手順により、二つの格に属する形態素が異なるので、「格構成」を構成する形態素と「話題タイトル」との「格」毎の一致度を33%であると算出する(図19参照)。
【0173】
割合を計算した割合計算部361は、各割合の中から、割合の高い話題タイトルを選択し、選択した話題タイトルを検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0174】
これにより、割合計算部361が、分類された各「格構成」(主体格、対象格など)に属する第一形態素情報の各形態素と、予め記憶された話題タイトルとを各「格」毎に照合し、各話題タイトルの中から、少なくとも一の「格」に第一形態素情報の各形態素を含む第二形態素情報を検索することができるので、割合計算部361は、通常の語順とは異なるものから構成される発話内容、例えば”人が犬を噛む”である場合には、主体格の形態素が”人”、対象格の形態素が”犬”であることから、その各「格」と一致する第二形態素情報を検索することができ、その第二形態素情報(人;犬;噛む)に関連付けられている回答文{”本当に?”又は”意味がよくわかんないよ”など}を取得することができる。
【0175】
即ち、割合計算部361は、識別が困難な発話内容、例えば”人が犬を噛む”と”犬が人を噛む”とを識別することができるので、その識別した発話内容に最適な回答、前者については例えば”本当に?”、後者については例えば”大丈夫?”をすることができる。
【0176】
また、割合計算部361は、”談話範囲”に属する各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の形態素を含む第二形態素情報を検索すればよいので、”全て”の第二形態素情報の中から、一の第二形態素情報を取得する必要がなくなり、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより短時間で取得することができ、結果的に、会話制御装置1は、取得した第二形態素情報に基づいて利用者からの発話内容に対しての最適な回答文を迅速に出力することができる。
【0177】
尚、選択部362は、予め定められた優先順位に従って各話題タイトルの中から、一の話題タイトルを選択してもよい。この優先順位とは、話題タイトルとして選出されるための優先度を意味するものである。この優先順位は、開発段階で開発者が予め定めるものである。
【0178】
(第三変更例)
図20に示すように、本変更例においては、上記実施形態及び各変更例に限定されるものではなく、会話制御装置1a,1bにある通信部800と、通信ネットワーク1000を介してデータの送受信をするための通信部900と、通信部900に接続された各会話データベース500b〜500dと、サーバ2a〜2cとを備えてもよい(会話制御システム)。
【0179】
ここで、通信ネットワーク1000とは、データを送受信する通信網を意味するものであり、本実施形態では、例えば、インターネットなどが挙げられる。尚、本変更例では、便宜上、会話データベース500b〜500d、サーバ2a〜2cを限定しているが、これに限定されるものではなく、更に他の会話データベースを設けてもよい。
【0180】
これにより、会話制御部300は、会話制御装置1aの内部に配置してある会話データベース500aのみならず、その他の会話制御装置1b、他の会話データベース500b〜500d、サーバ2a〜2cをも参照することができるので、例えば、会話データベース500aの中から、話題検索命令信号に含まれる「格構成」に属する各形態素(第一形態素情報)と関連する談話範囲等を検索することができない場合であっても、その他の会話制御装置1b、会話データベース500b〜500d、サーバ2a〜2cを参照することにより、上記「格構成」と関連する談話範囲等を検索することができ、利用者の発話文により適した回答文を検索することができる。
【0181】
(第四変更例)
文構造解析部430は、特定した第一形態素情報を構成する各「格構成」及び各「格構成」に対応付けられた各形態素を会話データベース500に記憶するものであってもよい。回答文検索部370は、取得した回答文を構成する各「格構成」及び各「格構成」に対応付けられた各形態素を会話データベース500に記憶するものであってもよい。
【0182】
談話範囲決定部340は、検索した談話範囲を会話データベース500に記憶するものであってもよい。話題検索部360は、検索した第二形態素情報を会話データベース500に記憶するものであってもよい。
【0183】
上記第一形態素情報と、第二形態素情報と、第一形態素情報又は第二形態素情報を構成する各「格構成」及び各「格構成」に対応付けられた各形態素と、検索した回答文を構成する各「格構成」及び各「格構成」に対応付けられた各形態素と、検索した談話範囲とは、それらを相互に関連付けて履歴形態素情報として会話データベース500又は鸚鵡返し要素データベース802に記憶することができる。
【0184】
省略文補完部350は、文節解析部420で抽出された第一形態素情報に基づいて第一形態素情報を構成する各属性(サブジェクト、オブジェクト、アクションなど;格構成)の中から、形態素を含まない属性を検索し、検索した属性に基づいてその属性に、会話データベース500又は鸚鵡返し要素データベース802に記憶された履歴形態素情報を付加する。
【0185】
具体的に、談話範囲決定部340から話題検索命令信号が入力された省略文補完部350は、入力された談話検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報からなる発話内容が省略文であるかを判定し、第一形態素情報からなる発話内容が省略文(例えば、サブジェクト、オブジェクト、又はアクションに所定の形態素を有しないなど)である場合には、会話データベース500又は鸚鵡返し要素データベース802に記憶されている履歴形態情報を、第一形態素情報に付加する。
【0186】
即ち、履歴形態情報に含まれるサブジェクトをS1、オブジェクトをO1、アクションA1、談話範囲をD1とし、省略された第一形態素情報をWとすると、補完後の第一形態素情報W1は、S1∪W、O1∪W、A1∪W、又はD1∪Wとして表現することができる。
【0187】
話題検索部360は、省略文補完部350で補完された第一形態素情報W1と各第二形態素情報とを照合し、各「話題タイトル」(第二形態素情報)の中から、第一形態素情報W1を含む第二形態素情報を検索し、検索した話題タイトルを検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0188】
これにより、第一形態素情報からなる発話内容が省略文であり、日本語として明解でない場合であっても、省略文補完部350は、会話データベース500に記憶されている履歴形態情報を用いて、省略された第一形態素情報の形態素を補完することができるので、省略された第一形態素情報からなる発話内容を明確にすることができる。
【0189】
このため、省略文補完部350が、第一形態素情報を構成する発話内容が省略文である場合には、第一形態素情報からなる発話内容が適正な日本語となるように、第一形態素情報に省略された形態素を補完することができるので、話題検索部360は、形態素が補完された第一形態素情報に基づいて、その第一形態素情報と関連する最適な「話題タイトル」(第二形態素情報)を取得することができ、回答文検索部370は、話題検索部360で検索された最適な「話題タイトル」に基づいて、利用者の発話内容により適した回答文を出力することができる。
【0190】
(第五変更例)
話題検索部360は、図21に示すように、削除部363と、談話付加部364とを備えてもよい。削除部363は、検索した第二形態素情報に基づいて、第二形態素情報と談話範囲決定部340で検索された談話範囲とを照合し、第二形態素情報を構成する各形態素の中から、談話範囲と一致する形態素を削除する削除手段である。
【0191】
具体的に、省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報と、談話範囲決定部340で決定された談話範囲に属する各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を検索する。
【0192】
そして、削除部363は、検索された第二形態素情報に基づいて、その第二形態素情報と談話範囲決定部340で決定された談話範囲を構成する形態素とを照合し、第二形態素情報の中から、談話範囲を構成する形態素と一致する形態素を削除し、形態素が削除された第二形態素情報を削除信号として談話付加部364に出力する。
【0193】
即ち、削除部363は、第二形態素情報を構成する各形態素t1から、談話範囲決定部340で決定された現在の談話範囲D2(このD2は、形態素からなるものである)を取り除く(取り除いた結果をt2とすると、t2=t1−D2)。
【0194】
談話付加部364は、削除部363で形態素が削除された第二形態素情報に基づいて、談話範囲決定部340で検索された談話範囲に関連付けられた他の談話範囲を取得し、取得した他の談話範囲を構成する形態素を、第二形態素情報に付加する談話付加手段である。
【0195】
具体的には、現在の談話範囲D2が回答文K1と関連性のある談話範囲をDKとすると、回答文K1又は現在の談話範囲D2と関連性(兄弟関係にあるもの)のある他の談話範囲D3は、D3=D2∪DKとして表現することができるので、他の談話範囲D3を構成する形態素を付加した後の第二形態素情報W2は、W2=t2∪D3とすることができる。
【0196】
例えば、第二形態素情報を構成する各形態素t1が(A映画名;*;面白い){A映画名は面白い?}であり、談話範囲決定部340で決定された現在の談話範囲D2が(A映画名)である場合には、削除部363は、先ず、各形態素t1(A映画名;*;面白い)から談話範囲D2(A映画名)を削除し、削除した結果をt2(*;*;面白い)とする(t2=t1−D2)。
【0197】
現在の談話範囲D2(A映画名)と関連性のある他の談話範囲D3が”B映画名”である場合には、他の談話範囲D3を構成する形態素を付加した後の第二形態素情報W2は、t2∪D3であるので、(B映画名;*;面白い){B映画名は面白い?}とすることができる。
【0198】
これにより、利用者の発話内容が”A映画名は面白い?”である場合には、談話付加部364は、利用者の発話内容を構成する各形態素(A映画名;*;面白い)と一致する第二形態素情報(A映画名;*;面白い)を、他の第二形態素情報(B映画名;*;面白い){B映画名は面白い?}に変更することができるので、回答文検索部370は、談話付加部364で変更された第二形態素情報に関連付けられた回答文(例えば、”B映画名は面白いよ”)を取得し、取得した回答文を出力することができる。
【0199】
この結果、回答文検索部370は、利用者の発話内容に対する回答文を直接的に出力するわけではないが、談話付加部364で付加された形態素を含む第二形態素情報に基づいて、発話内容に関連する回答文を出力することができるので、出力部600は、回答文検索部370で検索された回答文に基づいて、さらに人間味のある回答文を出力することができる。
【0200】
尚、談話付加部364は、形態素が削除された第二形態素情報に他の談話範囲を付加するものだけに限定されるものではなく、形態素が削除された第二形態素情報に履歴形態素情報(会話データベース500に記憶されている)を付加するものであってもよい。
【0201】
(第六変更例)
話題検索部360は、各第二形態素情報の中から、第一形態素情報を含む第二形態素情報を検索することができない場合に、第一形態素情報と各回答文とを照合し、各回答文の中から、第一形態素情報を含む回答文を検索することができたときは、検索した回答文に関連付けられている第二形態素情報を取得する第一検索手段であってもよい。
【0202】
具体的に、省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を取得することができない場合には、図22に示すように、第一形態素情報と、第二形態素情報に関連付けられている回答文とを照合する。
【0203】
この照合により、話題検索部360は、回答文の中に第一形態素情報を構成する形態素(アクション又はアクションに対応付けられた形態素)が含まれていると判断した場合には、その回答文に関連付けられている第二形態素情報を検索する。
【0204】
これにより、話題検索部360は、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を検索することができなくても、各回答文の中から、第一形態素情報を構成する形態素(アクション又はアクションに対応付けられた形態素)を含む回答文を特定し、この特定した回答文に関連付けられている第二形態素情報を検索することができるので、利用者の発話内容を構成する第一形態素情報に対応する第二形態素情報を適切に検索することができる。
【0205】
この結果、話題検索部360が第一形態素情報に対応する最適な第二形態素情報を検索することができるので、回答文検索部370は、話題検索部360で検索された最適な第二形態素情報に基づいて、利用者の発話内容に対する適切な回答文を検索することができる。
【0206】
[プログラム]
上記会話制御システム及び会話制御方法で説明した内容は、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。
【0207】
ここで、プログラム言語としては、利用者が求める話題、ある事柄に対する利用者の感情度、又は陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて形態素と関連付けて階層的にデータベースに蓄積するための言語、本実施形態では、例えば、発明者らが開発したDKML(Discourse Knowledge Markup Language)、XML(eXtensible Markup Language)、C言語等が挙げられる。
【0208】
即ち、会話制御装置1は、各会話データベース500a〜500dに格納されているデータ(第二形態素情報、定型内容、回答文、回答種類、集合群、談話範囲、要素情報などの記憶情報)、その他の各部を、DKML(Discourse Knowledge Markup Language)、XML(eXtensible Markup Language)等で構築し、この構築した記憶情報等を利用するためのプログラムを実行することにより実現することができる。
【0209】
このような本実施形態に係るプログラムによれば、利用者の発話内容を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答文を出力することで、利用者の発話内容に対応する最適な回答文を出力することができるという作用効果を奏する会話制御装置、会話制御システム及び会話制御方法を一般的な汎用コンピュータで容易に実現することができる。
【0210】
また、会話制御装置1を開発する開発者は、利用者の発話内容に対する回答文を検索するための第二形態素情報等を、データベースにおいて前記言語を用いて階層的に構築することができるので、会話制御装置1は、利用者の発話内容に基づいて発話内容に対する回答文を、階層的な手順を経てデータベースから取得することができる。
【0211】
即ち、会話制御装置1は、利用者の発話内容の階層(例えば、データベースに蓄積されている第二形態素情報に対して上位概念にあるのか、又は下位概念にあるのか)を見極めて、見極めた階層に基づいて予め蓄積された各回答文の中から、適切な回答文を検索することができる。
【0212】
このため、会話制御装置1は、利用者の発話内容からなる第一形態素情報と、予め記憶されている”全て”の第二形態素情報とを逐一照合することなく、ある特定の階層に属する各第二形態素情報と第一形態素情報とを照合すればよいので、第一形態素情報と近似する第二形態素情報を短時間で取得することができる。
【0213】
更に、上記通信部800と通信部900との間の通信は、通信ネットワーク1000を介して、DKML等からなるプロトコルによってデータを送受信してもよい。これにより、会話制御装置1は、例えば、会話制御装置1に利用者の発話内容に適した回答文がない場合には、通信ネットワーク1000を通じて、DKML等の約束事に従って、利用者の発話内容に適した回答文(DKMLなどで記述されたもの)を検索し、検索した回答文を検索することができる(図20参照)。
【0214】
尚、プログラムは、記録媒体に記録することができる。この記録媒体は、図23に示すように、例えば、ハードディスク1100、フレキシブルディスク1200、コンパクトディスク1300、ICチップ1400、カセットテープ1500などが挙げられる。このようなプログラムを記録した記録媒体によれば、プログラムの保存、運搬、販売などを容易に行うことができる。
【0215】
[第二実施形態]
(会話制御装置の基本構成)
本発明の第二実施形態について図面を参照しながら説明する。本実施形態における会話制御装置1は、図24に示すように、第一実施形態における会話制御装置1の内部構造とほぼ同じであるが、選出部380(第二検索手段;選出手段)を有する点で相違する。また、会話制御装置1は、第一実施形態とは異なり、話題検索部360(第一検索手段)及び回答文検索部370(第二検索手段;回答文検索手段)の機能が一部相違する。
【0216】
この相違する点以外は、第一実施形態及び変更例の構造と同じであるので、相違する点以外の構造についての説明は省略する。なお、本実施形態では、上記第一実施形態における諸機能、例えば鸚鵡返し処理、反射的処理等なども当然に有し、またそれら機能に対応する効果も当然に奏する。
【0217】
なお、本実施形態では、後述する第一形態素情報及び話題タイトルは、第一実施形態とは異なって、その第一形態素情報及び話題タイトルに属する各形態素がサブジェクト、オブジェクト、アクション等の「格」構成に関係なく含まれているものとして説明する。
【0218】
第一実施形態では、会話制御装置1が、利用者からの発話内容に基づいて、その発話内容に対応する回答文を出力する処理について説明した。本実施形態では、利用者からの発話内容の意味が複数の意味に捉えられるような場合には、会話制御装置1が、その各意味の中から、会話制御装置1で展開したい話題に近い発話内容の意味を選出し、選出した意味に対応する回答文を出力する処理について説明する。
【0219】
具体的に、本実施形態における会話制御装置1は、第一実施形態のように、利用者からの発話内容に基づく受動的な回答処理(例えば、利用者からの質問内容に忠実に答える処理)を実行するものではなく、会話制御装置1から自発的に現在の話題を特定の話題に誘導させる能動的な回答処理するものである。本実施形態における会話制御装置1の構造は以下の通りである。なお、本実施形態における会話制御方法及びプログラムは、会話制御装置1における処理内容と同様の処理内容で実行することができる。
【0220】
図25に示すように、本実施形態では、フレーズには一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す話題タイトルが含まれ、話題タイトルには、利用者への回答文が対応付けられている。このフレーズは、例えば発話内容又は話題タイトル等が挙げられる。このフレーズは、本実施形態では、図25に示すように、話題タイトルが該当する。
【0221】
例えば、図25に示すように、話題タイトル1が(A装置;IR(イナズマ ラッシュ);教えて){A装置のIR(イナズマ ラッシュ)を教えて}である場合には、その話題タイトル1を構成する一部の形態素(IR;教えて)を含む話題タイトルとしては、話題タイトル2(A会社;IR(Investor Relations);教えて){A会社のIR(Investor Relations)を教えて}が挙げられる。上記各フレーズ、各話題タイトル及び各回答文は、会話データベース500(形態素記憶手段)に記憶されている。
【0222】
また、共通する話題タイトルには、回答文として選出されるための優先順位が対応付けられている。なお、回答文には、特定の話題に誘導させるための内容又は対応付けられる話題タイトルに関係する内容が含まれることが望ましい。
【0223】
話題検索部360(第一検索手段)は、利用者から入力された発話内容に基づいて予め会話データベース(形態素記憶手段)に記憶された複数のフレーズの中から、発話内容を含む各フレーズを検索するものである。すなわち、話題検索部360は、本実施形態では、文構造解析部430で抽出された第一形態素情報に基づいて、予め記憶された各話題タイトルの中から、第一形態素情報を含む各話題タイトルを検索する。
【0224】
具体的には、図25に示すように、第一形態素情報が(IR;教えて)である場合には、話題検索部360は、第一形態素情報(IR;教えて)を含む話題タイトル1(A装置;IR;教えて)及び話題タイトル2(A会社;IR;教えて)を検索する。
【0225】
選出部380(選出手段)は、話題検索部360で検索された各フレーズに基づいて各フレーズの中から、予め展開したい話題に関係するフレーズを選出するものである。すなわち、選出部380は、本実施形態では、話題検索部360で話題タイトルが複数検索された場合には、複数検索された各話題タイトルに対応付けられた各優先順位の大きさに応じて、一の話題タイトルを選出する。
【0226】
ここで、発話内容又は発話内容を構成する第一形態素情報を含む話題タイトルが複数検索されるということは、本実施形態では、発話内容が複数の意味に捉えられることを意味する。この結果、発話内容が複数の意味に捉えられる場合、すなわち話題タイトルが複数検索された場合には、選出部380は、検索された各話題タイトルの中から、会話制御装置1で予め展開したい話題に関係する話題タイトル(高い優先順位が対応付けられている話題タイトル)を選出する。
【0227】
具体的には、図25に示すように、文構造解析部430で第一形態素情報(IR;教えて)が抽出された場合には、話題検索部360は、第一形態素情報(IR;教えて)を含む話題タイトル1及び話題タイトル2を検索する。図25に示すように、検索された話題タイトル1に対応付けられた優先順位が2であり、話題タイトル2に対応付けられた優先順位が1であるので、選出部380は、話題タイトル1及び話題タイトル2の中から、優先順位1に対応付けられた話題タイトル2を選出する。
【0228】
すなわち、選出部380は、話題検索部360で複数の話題タイトルが検索された場合には、その検索された各話題タイトルに対応付けられた各優先順位の中から、最も高い優先順位を特定し、特定した優先順位に対応付けられた話題タイトルを選出する。なお、選出部380は、上記各優先順位の中から、最も低い優先順位を特定し、特定した優先順位に対応付けられた話題タイトルを選出してもよい。
【0229】
回答文検索部370(回答文検索手段)は、選出部380で選出されたフレーズに対応する回答文を検索するものである。すなわち、回答文検索部370は、本実施形態では、選出部380で選出された話題タイトルに基づいて、話題タイトルに対応付けられた回答文を検索する。
【0230】
具体的には、図25に示すように、回答文検索部370は、例えば選出部380で話題タイトル2(A会社;IR;教えて)が選出された場合には、その話題タイトル2に対応付けられた回答文2(A会社のIRは〜です)を取得する。出力部600は、回答文検索部370で取得された回答文2(A会社のIRは〜です)を出力する。
【0231】
なお、選出部380は、前回検索された話題タイトルが今回検索された各話題タイトルに含まれる場合には、今回検索された各話題タイトルの中から、前回検索された話題タイトルとは異なる話題タイトルを選出してもよい。すなわち、選出部380は、前回検索された話題タイトルが今回検索された各話題タイトルに含まれる場合には、今回検索された各話題タイトルの中から、前回検索された話題タイトルに対応付けられた優先順位の次の優先順位を特定し、特定した優先順位に対応付けられた話題タイトルを選出してもよい。
【0232】
具体的には、図25に示すように、例えば、選出部380は、前回検索(又は選出)された話題タイトル2(A会社;IR;教えて)が今回検索された話題タイトル1又は話題タイトル2に含まれる場合には、前回検索(又は選出)された話題タイトル2(A会社;IR;教えて)に対応付けられた優先順位1を特定する。この選出部380は、特定した優先順位1の次の優先順位2に対応付けられた話題タイトル1(A装置;IR;教えて)を、今回検索された話題タイトル1又は話題タイトル2の中から選出する。
【0233】
(会話制御装置を用いた会話制御方法)
上記構成を有する会話制御装置1による会話制御方法は、以下の手順により実施することができる。図26は、本実施形態に係る会話制御方法の手順を示すフロー図である。図26に示す(S201)〜(S204)までの処理は上記第一実施形態における(S101)〜(S104)までの処理と同様であるので、詳細な説明は省略する。
【0234】
図26に示すように、話題検索部360が、文構造解析部430で抽出された第一形態素情報に基づいて、予め記憶された各話題タイトルの中から、第一形態素情報を含む各話題タイトルを検索するステップを行う(S205)。具体的には、図25に示すように、第一形態素情報が(IR;教えて)である場合には、話題検索部360は、第一形態素情報(IR;教えて)を含む話題タイトル1(A装置;IR;教えて)及び話題タイトル2(A会社;IR;教えて)を検索する。
【0235】
その後、選出部380が、話題検索部360で各話題タイトルが検索された場合には、検索された各話題タイトルに対応付けられた各優先順位の大きさに応じて、一の話題タイトルを選出するステップを行う(S206)。具体的には、図25に示すように、文構造解析部430で第一形態素情報(IR;教えて)が抽出された場合には、話題検索部360は、第一形態素情報(IR;教えて)を含む話題タイトル1及び話題タイトル2を検索する。
【0236】
検索された話題タイトル1に対応付けられた優先順位が2であり、話題タイトル2に対応付けられた優先順位が1であるので、選出部380は、話題タイトル1及び話題タイトル2の中から、優先順位1に対応付けられた話題タイトル2を選出する。
【0237】
一方、選出部380は、前回検索された話題タイトルが今回検索された各話題タイトルに含まれる場合には、今回検索された各話題タイトルの中から、前回検索された話題タイトルに対応付けられた優先順位の次の優先順位を特定し、特定した優先順位に対応付けられた話題タイトルを選出する。
【0238】
具体的には、図25に示すように、例えば、選出部380は、前回検索された話題タイトル2(A会社;IR;教えて)が今回検索された話題タイトル1又は話題タイトル2に含まれる場合には、前回検索された話題タイトル2(A会社;IR;教えて)に対応付けられた優先順位1を特定する。この選出部380は、特定した優先順位1の次の優先順位2に対応付けられた話題タイトル1(A装置;IR;教えて)を、今回検索された話題タイトル1又は話題タイトル2の中から選出する。
【0239】
次いで、回答文検索部370が、選出部380で選出された話題タイトルに基づいて、話題タイトルに対応付けられた回答文を検索するステップを行う(S207)。具体的には、図25に示すように、回答文検索部370は、例えば選出部380で話題タイトル2(A会社;IR;教えて)が選出された場合には、その話題タイトル2に対応付けられた回答文2(A会社のIRは〜です)を取得する。出力部600は、回答文検索部370で取得された回答文2(A会社のIRは〜です)を出力する。
【0240】
(会話制御装置及び会話制御方法による作用及び効果)
上記構成を有する発明によれば、文構造解析部430で抽出された第一形態素情報(IR;教えて)を含む各話題タイトルとして、話題タイトル1(A装置;IR(イナズマ ラッシュ);教えて)及び話題タイトル2(A会社;IR(Investor Relations);教えて)が検索された場合には、選出部380は、検索された話題タイトル1及び話題タイトル2の中から、高い優先順位が対応付けられている話題タイトル2を選出することができる(図25参照)。
【0241】
ここで、入力情報を含む各フレーズが複数検索されること、又は入力情報を構成する第一形態素情報を含む第二形態素情報が複数検索されるということは、入力情報が複数の意味に捉えられることを意味する。したがって、発話内容が複数の意味に捉えられる場合、すなわち話題タイトルが複数検索された場合には、選出部380は、上述のように、各話題タイトルの中から、会話制御装置1で予め展開したい話題に関係する話題タイトル(高い優先順位が対応付けられている話題タイトル)を選出することができる。この結果、回答文検索部370は、選出部380で選出された話題タイトルに基づいて、話題タイトルに対応付けられた回答文(例えば特定の話題に誘導させるための文)を出力することができる。
【0242】
また、会話制御装置1は、利用者からの発話内容に基づく受動的な回答文を出力(例えば、利用者からの質問内容に忠実に答えること)するものではなく、会話制御装置から自発的に現在の話題から特定の話題に誘導させる能動的な回答文を出力することができる。
【0243】
更に、回答文には特定の話題に誘導させるための内容が回答文に含まれるので、回答文検索部370は、出力部600を介してその回答文を出力することにより現在の話題を予め展開させたい話題へとより的確に誘導することができる。すなわち、会話制御装置1は、現在の話題についての主導権を内部的に握り、その現在の話題を特定のストーリへとより的確に誘導することができる。
【0244】
更にまた、回答文検索部370は、上記入力情報に含まれる日本語特有な助詞(て・に・を・・等)を除いた形態素を用いて該当する回答文を検索するので、その各形態素から把握することができる意味内容に基づいて、予め作成された回答文をより的確に取得することができる。すなわち、回答文検索部370は、単に入力情報の全体をキーワードとして、そのキーワードに関連付けられた回答文を検索するよりも、より入力情報に適した回答文を検索することができる。
【0245】
加えて、話題検索部360は、第一形態素情報を含む話題タイトルを検索するので、利用者からの入力情報と完全に一致する話題タイトルを検索する必要がない。この結果、会話制御装置1を開発する開発者は、利用者から入力されると予想される入力情報に対応する膨大な回答文を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
【0246】
(変更例)
なお、本発明は、上記実施形態に限定されるものではなく、以下に示すような変更を加えることができる。選出部380は、話題検索部360で今回検索された各話題タイトルが所定の基準回数を越えて検索された場合には、前回選出された話題タイトルとは異なる話題タイトルを、今回検索された各話題タイトルの中から選出するものであってもよい。
【0247】
具体的には、選出部380は、例えば、前回選出された話題タイトル1(A装置;IR;教えて)が今回検索された話題タイトル1又は話題タイトル2に含まれ、今回検索された話題タイトル1又は話題タイトル2が所定の基準回数(例えば、5回)を越えて検索されたか否かを特定する。
【0248】
この選出部380は、特定した回数が所定の基準回数(例えば、5回)を越えた場合には、前回選出された話題タイトル1(A装置;IR;教えて)に対応付けられた優先順位1を特定する。選出部380は、特定した優先順位1の次の優先順位2に対応付けられた話題タイトル2(A会社;IR;教えて)を、今回検索された話題タイトル1又は話題タイトル2の中から選出する。
【0249】
一方、選出部380は、カウントした回数が基準回数(例えば、5回)を越えていない場合には、前回検索された話題タイトル1(A装置;IR;教えて)を他の話題タイトル2,話題タイトル3に優先して用いる。回答文検索部370は、選出部380で選出された話題タイトルに基づいて、話題タイトルに対応付けられた回答文を検索する。回答文検索部370は、管理部310を介して取得した回答文を出力部600に出力する。
【0250】
これにより、前回選出された話題タイトルが話題検索部360で今回検索された各話題タイトルに含まれ、今回検索された各話題タイトルが所定の基準回数を越えて検索された場合には、選出部380は、前回選出された話題タイトルとは異なる話題タイトルを、今回検索された各話題タイトルの中から選出することができる。
【0251】
すなわち、利用者から同様の発話内容が繰り返し発話された場合には、選出部380は、その繰り返された回数に応じて順次話題タイトルを変更することができる。この結果、会話制御装置1は、繰り返された発話内容の回数に応じて、現在の話題から特定の話題へと誘導させる回答文を出力することができる。また、同じ発話内容が繰り返し発話されると、会話制御装置1が現在の話題から他の話題へと誘導してくれるので、利用者は、恰も人間と話しているような感覚を味わうことができる。
【0252】
なお、本発明は、会話を行うことを目的とする装置等(会話ロボット等)に限定されるものではなく、遊技機等においても本機能を用いることができる。
【0253】
【発明の効果】
以上説明したように本発明によれば、利用者の発話内容が複数の意味に捉えられる場合には、予め展開したい特定の話題に関係する回答文を出力することで、現在の話題を特定の話題に誘導することができる。
【図面の簡単な説明】
【図1】第一実施形態に係る会話制御システムの概略構成を示すブロック図である。
【図2】第一実施形態における会話制御部及び文解析部の内部構造を示すブロック図である。
【図3】第一実施形態における形態素抽出部で抽出する各形態素の内容を示す図である。
【図4】第一実施形態における文節解析部で抽出する各文節の内容を示す図である。
【図5】第一実施形態における文構造解析部で特定する「格」の内容を示す図である。
【図6】第一実施形態における発話種類判定部で特定する「発話文のタイプ」を示す図である。
【図7】第一実施形態における発話種類データベースで格納する各辞書の内容を示す図である。
【図8】第一実施形態における会話データベースの内部で構築される階層構造の内容を示す図である。
【図9】第一実施形態における会話データベースの内部で構築される階層構造の詳細な関係を示す図である。
【図10】第一実施形態における会話データベースの内部で構築される「話題タイトル」の内容を示す図である。
【図11】第一実施形態における会話データベースの内部で構築される「話題タイトル」に関連付けられている「回答文のタイプ」の内容を示す図である。
【図12】第一実施形態における会話データベースの内部で構築される「談話範囲」に属する「話題タイトル」及び「回答文」の内容を示す図である。
【図13】第一実施形態における反射要素データベースで記憶する反射要素情報の内容を示す図である。
【図14】第一実施形態における鸚鵡返し要素データベースで記憶する鸚鵡返し要素、鸚鵡返し要素の形態素の内容を示す図である。
【図15】第一実施形態に係る会話制御方法の手順を示すフロー図である。
【図16】第一変更例における形態素抽出部で整理する発話内容を示す図である。
【図17】第二変更例における話題検索部の内部構成を示す図である。
【図18】第二変更例における割合計算部が「格構成」に属する各形態素と各「話題タイトル」とを「話題タイトル」毎に照合する様子を示す図である。
【図19】第二変更例における割合計算部が「各構成」に属する各形態素と「話題タイトル」に属する各形態素とを「格」毎に照合する様子を示す図である。
【図20】第三変更例における会話制御システムの概略構成を示す図である。
【図21】第五変更例における話題検索部の内部構成を示す図である。
【図22】第六変更例における話題検索部が第一形態素情報と、話題タイトル又は回答文とを照合する様子を示す図である。
【図23】第一実施形態におけるプログラムを格納する記録媒体を示す図である。
【図24】第二実施形態に係る会話制御装置の内部構成を示すブロック図である。
【図25】第二実施形態における会話データベースの内部で構築される「話題タイトル」及び「回答文」の内容を示す図である。
【図26】第二実施形態に係る会話制御方法の処理手順を示す図である。
【符号の説明】
1…会話制御装置、2…サーバ、100…入力部、200…音声認識部、300…会話制御部、310…管理部、320…反射的判定部、330…鸚鵡返し判定部、340…談話範囲決定部、350…省略文補完部、360…話題検索部、361…割合計算部、362…選択部、363…削除部、364…談話付加部、370…回答文検索部、380…選出部、400…文解析部、410…形態素抽出部、420…文節解析部、430…文構造解析部、440…発話種類判定部、450…形態素データベース、460…発話種類データベース、500…会話データベース、600…出力部、700…音声認識辞書記憶部、800…通信部、801…反射要素データベース、802…鸚鵡返し要素データベース、900…通信部、1000…通信ネットワーク、1100…ハードディスク、1200…フレキシブルディスク、1300…コンパクトディスク、1400…ICチップ、1500…カセットテープ[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a conversation control device and a conversation control method.
[0002]
[Prior art]
A conventional conversation control device can output a pre-stored answer sentence corresponding to the utterance content based on the utterance content from the user (for example, Patent Document 1).
[0003]
[Patent Document 1]
JP-A-2002-169804 (pages 6 to 15, FIG. 16)
[0004]
[Problems to be solved by the invention]
However, when the content of the user's utterance is captured in a plurality of meanings and there are a plurality of answer sentences corresponding to the utterance content, the conversation control device generally outputs the answer sentence searched first. Was. For this reason, when the utterance content of the user is captured in a plurality of meanings, the conversation control device selects, from the respective meanings, the meaning of the utterance content related to a specific topic to be developed in advance, and selects the meaning. An answer sentence corresponding to the meaning of the utterance content could not be output.
[0005]
For example, when the utterance content from the user is "Please tell me IR", the utterance content is captured in the meaning of IR (Inazuma Rush) of the effect image on the gaming machine or IR (Investor Relations) of the company. Sometimes. In this case, when the conversation control device first searches for an answer sentence corresponding to the IR (Inazuma Rush) of the effect image on the gaming machine from among the answer sentences, it outputs the first searched answer sentence. .
[0006]
That is, even when the conversation control device wants to output an answer sentence corresponding to the IR of the company, when the answer sentence corresponding to the IR (Inazuma Rush) of the effect image is first searched, the first searched answer The statement was output automatically. For this reason, there has been a demand for the development of a system capable of outputting an answer sentence related to a specific topic to be developed in advance when the utterance content from the user is captured in a plurality of meanings.
[0007]
Therefore, the present invention has been made in view of the above points, and when the utterance content of the user is captured in a plurality of meanings, by outputting an answer sentence related to a specific topic to be developed in advance, It is an object to provide a conversation control device and a conversation control method that can guide a current topic to a specific topic.
[0008]
[Means for Solving the Problems]
The present invention has been made in order to solve the above-described problem, and when searching for an answer sentence corresponding to input information based on input information including utterance content input from the user, the present invention has been made to solve the problem. Searches each phrase including the input information from a plurality of phrases stored in advance based on the input information, and selects a phrase related to a topic to be developed in advance from each phrase based on the searched phrases. Then, an answer sentence corresponding to the selected phrase is searched.
[0009]
That is, in the present invention, the phrase includes second morpheme information indicating a morpheme composed of one character, a plurality of character strings, or a combination thereof, and the plurality of second morpheme information includes an answer sentence to the user. And a priority order to be selected as an answer sentence are associated with each other, each second morpheme information and each answer sentence are stored in advance, and based on a character string included in the input information input by the user, a character Extracting at least one morpheme constituting the minimum unit of the column as first morpheme information, based on the extracted first morpheme information, from among the previously stored second morpheme information, including the first morpheme information When the second morpheme information is searched, and when a plurality of second morpheme information is searched, each of the searched second morpheme information is determined in accordance with the magnitude of each priority order associated with each searched second morpheme information. Dimorphological information Elect one second morpheme information from, based on the second morpheme information elected, characterized by searching an answer sentence associated with the second morpheme information.
[0010]
According to the invention of the present application, when the second morpheme information 1 and the
[0011]
That is, when the input information is captured in a plurality of meanings, and when the plurality of second morpheme information (or phrases) is searched, the conversation control device expands the second morpheme information from the respective second morpheme information in advance by the conversation control device. It is possible to select second morpheme information (second morpheme information associated with a high priority) related to a topic to be performed.
[0012]
As a result, the conversation control device does not output a passive answer sentence based on the content of the utterance from the user (for example, faithfully answer the content of the question from the user). It is possible to output an active answer sentence that expands to a specific topic, in other words, to output an answer sentence that guides the current topic to the specific topic.
[0013]
In the above invention, if each of the second morpheme information searched this time is searched for more than a predetermined reference number, the second morpheme information different from the previously selected second morpheme information is searched this time. May be selected from the second morpheme information. Thereby, if the second morpheme information selected last time is included in each of the second morpheme information searched this time, and each of the second morpheme information searched this time is searched beyond a predetermined reference number, the conversation The control device can select the second morpheme information different from the second morpheme information selected last time from each of the second morpheme information searched this time.
[0014]
That is, when the same utterance content is repeatedly uttered by the user, the conversation control device can sequentially change the second morpheme information according to the number of times of the repetition. As a result, the conversation control device can change the answer sentence for guiding the current topic to the specific topic one by one according to the number of repeated utterance contents.
[0015]
In the above invention, the answer sentence may include a content for guiding the user to a specific topic. In this case, since the content to guide the user to a specific topic is included in the answer sentence, the conversation control device outputs the answer sentence so that the current topic can be more accurately adjusted to the topic to be developed in advance. Can be guided. In other words, the conversation control device can take the initiative on the current topic internally and guide the current topic more accurately to a specific story.
[0016]
In the above invention, when the second morpheme information searched last time is included in each second morpheme information searched this time, the second morpheme information searched last time is selected from the second morpheme information searched this time. It is preferable to specify a priority next to the priority associated with the information, and select second morpheme information associated with the specified priority.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
[First embodiment]
(Basic configuration of conversation control system)
A conversation control system according to the present invention will be described with reference to the drawings. FIG. 1 is a schematic configuration diagram of a conversation control system having a conversation control device 1 according to the present embodiment.
[0018]
As shown in FIG. 1, the conversation control device 1 includes an
[0019]
In the present embodiment, for convenience of explanation, the description will be limited to the utterance content of the user (this utterance content is a type of input information). However, the present invention is not limited to the utterance content of the user, and is not limited to the utterance content of the user. For example, the input information may be input from a user or the like. Therefore, the "speech content" described below can also be described by replacing "speech content" with "input information".
[0020]
Similarly, in the following description, for convenience of explanation, the description will be limited to “speech sentence type” (speech type). The “input type” indicating the type of input information that has been input may be used. Therefore, the "utterance sentence type" (utterance type) described below can also be described by replacing "utterance type" with "input type".
[0021]
The
[0022]
Here, the input information means characters, symbols, voices and the like input through a keyboard or the like. Specifically, the
[0023]
The
[0024]
The
[0025]
The
[0026]
Specifically, the
[0027]
That is, the
[0028]
The
[0029]
In the present embodiment, the phrase form refers to a sentence having an independent word or an independent word with one or more attached words in the Japanese grammar, or a character string that does not break the meaning of the Japanese grammar. It means a sentence that is as small as possible. This clause is expressed as p1, p2,... Pk in the present embodiment.
[0030]
That is, as shown in FIG. 4, the
[0031]
The
[0032]
The sentence
[0033]
Here, the “case composition” means a case (attribute) indicating a substantial concept in a phrase, and in the present embodiment, for example, a subject (subject case) meaning a subject / subject and an object Examples include a meaningful object (target case), an action meaning an action, a time meaning a time (tense, aspect), a location meaning a place, and the like. In the present embodiment, each morpheme associated with three elements “case” (case configuration) of a subject, an object, and an action is defined as first morpheme information.
[0034]
That is, as shown in FIG. 5, for example, when the dependency element of each morpheme is "" or "ha", the sentence
[0035]
Further, for example, when the dependency element of each morpheme is “do”, the sentence
[0036]
The sentence
[0037]
The utterance
[0038]
In this embodiment, as shown in FIG. 6, the “utterance sentence type” is a statement (D; Declaration), a comment sentence (I; Impression), a conditional sentence (C; Condition), and a result sentence (D: Declaration). E; Effect), time sentence (T; Time), place sentence (L; Location), repulsion sentence (N; Negation), and the like. As shown in FIG. 6, each of these sentences is expressed as an affirmative sentence (A; Answer) or a question sentence (Q; Question).
[0039]
The statement is a sentence composed of a user's opinion or idea, and in the present embodiment, as shown in FIG. 6, a sentence such as "I like Sato" is exemplified. The impression sentence means a sentence composed of impressions held by the user. The location sentence means a sentence composed of locational elements.
[0040]
The result sentence means a sentence composed of a sentence including a result element for a topic. The time sentence means a sentence including a temporal element related to a topic.
[0041]
The conditional sentence means a sentence including elements such as a premise of the topic and a condition or a reason why the topic is established when one utterance is regarded as a topic. The repulsive sentence means a sentence including an element that repels the utterer. An example sentence for each “utterance sentence type” is as shown in FIG.
[0042]
That is, based on each phrase corresponding to the input sentence pattern signal, the utterance
[0043]
Here, the
[0044]
Accordingly, the utterance
[0045]
The utterance
[0046]
The
[0047]
Further, the
[0048]
Furthermore, the
[0049]
As shown in FIG. 8, in the present embodiment, the
[0050]
Each discourse range can be configured to have a hierarchical structure, as shown in FIG. As shown in the figure, for example, the discourse range (entertainment) of a higher concept with respect to a certain discourse range (movie) is arranged in an upper hierarchical structure, and the discourse range of a lower concept with respect to the discourse range (movie) (movie) Attribute, showing movie) can be located in a lower hierarchical structure. That is, in the present embodiment, each discourse range can be arranged at a hierarchical position where the relationship between the superordinate concept, the subordinate concept, the synonym, and the synonym with the other discourse ranges is clear.
[0051]
As described above, the discourse range is composed of each topic. In the present embodiment, for example, if the discourse range is the A movie name, the discourse range includes a plurality of topics related to the A movie name.
[0052]
This topic means a morpheme composed of one character, a plurality of character strings, or a combination thereof, that is, each morpheme constituting the utterance content that will be uttered by the user. In the present embodiment, It is composed of each morpheme associated with the subject (subject), the object (target case), and the "case" (attribute) of the action. In the present embodiment, each morpheme associated with these three elements is expressed as a topic title (this topic title corresponds to a lower concept of “topic”) (second morpheme information). .
[0053]
The topic title is not limited to each morpheme associated with the above three elements, but may include other "cases", that is, time (tense, aspect) meaning time, location meaning location, Each morpheme may be associated with a condition indicating a condition, an impression indicating an impression, an effect indicating a result, or the like.
[0054]
In this embodiment, the topic title (second morpheme information) is stored in the
[0055]
For example, if the topic title has a discourse range of “A movie name”, as shown in FIG. 10, subject (A movie name), object (director), action (great) {this is “A movie The name director is made up of}, which means “great.”
[0056]
If there is no morpheme associated with “case composition” (subject, object, action, etc.) in the topic title, this portion is indicated with “*” in the present embodiment.
[0057]
For example, what is the $ A movie name? When the sentence of} is converted into a topic title (subject; object; action), what is the name of {A movie? In the sentence of}, “A movie name” can be specified as a subject, but other “objects” and “actions” are not elements of the sentence, so the topic title is “subject” (A movie name) No "object"(*); no "action" (*) (see FIG. 10).
[0058]
In this embodiment, the answer sentence is associated with each topic title (second morpheme information) (see FIG. 8). In this embodiment, as shown in FIG. 11, the answer sentence includes a statement (D; Declaration) and an impression sentence in order to make an answer corresponding to the type of the utterance sentence uttered by the user. (I; Impression), conditional sentence (C; Condition), result sentence (E; Effect), time sentence (T; Time), location sentence (L; Location), negative sentence (N; Negation), etc. (answer) Types).
[0059]
That is, as shown in FIG. 12, each answer sentence is associated with, for example, the discourse range (Sato) {lower concept; home run, higher concept; grass baseball, synonyms; panda Sato / Sato / Panda} and each topic title Have been.
[0060]
As shown in the figure, for example, the topic title 1-1 is $ (Sato; *; I like): This is the order of (subject; object; action) as described above. If the order is the same as in the following, the answer sentence 1-1 corresponding to the topic title 1-1 is (DA; statement positive sentence "I like Sato"), (IA; impression positive sentence) "I like Sato very much"), (CA; positive statement on condition "Because Sato's home run is very impressive"), (EA; positive statement on result "I always watch TV games where Sato appears"), (TA; time affirmative sentence "I actually like it because of the five consecutive at-bats in Koshien"), (LA; place affirmative sentence "I like the serious face when standing on a blow"), (NA Affirmative sentence "I don't want to talk to someone who dislikes Sato, goodbye").
[0061]
In the present embodiment, as shown in FIG. 2, the
[0062]
The
[0063]
The
[0064]
Here, the standard content means reflective element information for answering the standard content to the utterance content from the user, and this reflective element information is stored in the reflective element database 801 (standard type storage means) in advance. A plurality is stored. As the reflective element information, in the present embodiment, as shown in FIG. 13, for example, "Good morning", "Hello", "Good evening", "greeting elements" such as "Hey", "I see", "Really?" And "typical elements".
[0065]
Specifically, the
[0066]
That is, assuming that the reflection element information is D1 and the first morpheme information is W, the
[0067]
For example, when the user utters the utterance content of “good morning”, the
[0068]
When it is not possible to search for the reflection element information including the utterance content from each of the reflection element information, the
[0069]
The parrot
[0070]
Here, in this embodiment, the parrot return means that the content of the utterance of the user is repeated as it is (or a content close thereto). In this embodiment, the parrot return element is composed of first morpheme information or the like constituting an answer sentence output immediately before from the conversation control device 1, and as shown in FIG. 14, for example, "horse is beautiful"(Horse;*; beautiful) and "I like Sato"(Sato;*; I like it).
[0071]
In addition, the parrot
[0072]
Specifically, the parrot
[0073]
When the parrot
[0074]
For example, the conversation control device 1 gives the answer sentence "The director of the A movie name is Mr. S" (the director of the A movie name; Mr. S; *) (the order is subject, object, action, and so on). ) Is output, and then, when the user utters “A is the director of the A movie name Mr. S” (the director of the A movie name; Mr. S; *) in response to the output sentence, the parrot returns The
[0075]
The parrot
[0076]
More specifically, when the user utters the utterance content “Horse is beautiful” and the conversation control device 1 outputs the content of “Horse may have a sense of dynamism” as an answer sentence, it is used later. When the person repeats the utterance content “horse is beautiful”, the parrot
[0077]
In this case, since the user has not heard the answer sentence from the conversation control device 1, the parrot
[0078]
On the other hand, when the parrot
[0079]
Note that the parrot
[0080]
In this case, the parrot
[0081]
As the “conditional” parrot return processing, for example, when the conversation control device 1 outputs an answer sentence “Horse is beautiful”, the user utters the utterance content “Why is the horse beautiful?” At this time, in order to solve the user's questions and the like, the parrot
[0082]
The discourse
[0083]
Specifically, the discourse
[0084]
For example, the discourse
[0085]
On the other hand, if the discourse range group is not included in the first morpheme information, the discourse
[0086]
Thereby, the
[0087]
As described above, the discourse
[0088]
The abbreviated
[0089]
Specifically, the abbreviation
[0090]
For example, the abbreviation
[0091]
That is, assuming that the first morpheme information is W and the determined discourse range is D, the abbreviation
[0092]
With this, even when the first morpheme information is an abbreviation and is not clear as Japanese, the abbreviation
[0093]
For this reason, the abbreviation
[0094]
The
[0095]
Specifically, the
[0096]
For example, if the “case configuration” that constitutes the first morphological information is (Sato; *; like) {I like Sato}, the
[0097]
The utterance
[0098]
The answer
[0099]
Specifically, the answer
[0100]
For example, if the topic title corresponding to the search result is the topic title 1-1 (Sato; *; I like it) shown in FIG. 12, the answer
[0101]
The
[0102]
The
[0103]
(Conversation control method using conversation control device)
The conversation control method by the conversation control device 1 having the above configuration can be implemented by the following procedure. FIG. 15 is a flowchart illustrating a procedure of the conversation control method according to the present embodiment.
[0104]
First, the
[0105]
Next, the
[0106]
Then, the
[0107]
Specifically, the
[0108]
Then, the
[0109]
That is, as shown in FIG. 4, the
[0110]
After that, the sentence
[0111]
That is, as shown in FIG. 5, for example, when the dependency element of each morpheme is "" or "ha", the sentence
[0112]
Further, for example, when the dependency element of each morpheme is “do”, the sentence
[0113]
The sentence
[0114]
Next, the utterance
[0115]
That is, based on each phrase corresponding to the input sentence pattern signal, the utterance
[0116]
The utterance
[0117]
Next, the
[0118]
Specifically, the
[0119]
When it is not possible to search for the reflection element information including the first morpheme information from among the respective pieces of reflection element information, the
[0120]
Next, the parrot
[0121]
When the parrot
[0122]
On the other hand, if the parrot
[0123]
Then, the discourse
[0124]
Specifically, the discourse
[0125]
For example, the discourse
[0126]
On the other hand, if the discourse range group is not included in the first morpheme information, the discourse
[0127]
Next, the abbreviation
[0128]
Specifically, the abbreviation
[0129]
For example, the abbreviation
[0130]
That is, assuming that the first morpheme information is W and the determined discourse range is D, the abbreviation
[0131]
Next, the
[0132]
Specifically, the
[0133]
For example, if the “case configuration” that constitutes the first morphological information is (Sato; *; like) {I like Sato}, the
[0134]
The utterance
[0135]
Then, the answer
[0136]
Specifically, the answer
[0137]
For example, if the topic title corresponding to the search result is the topic title 1-1 (Sato; *; I like it) shown in FIG. 12, the answer
[0138]
Next, the
[0139]
(Operation and effect of the conversation control device and the conversation control method)
According to the invention of the present application having the above-described configuration, the
[0140]
When the utterance content of the user is a fixed content, the
[0141]
In addition, the parrot
[0142]
In this case, the parrot
[0143]
In addition, the parrot
[0144]
In this case, the parrot
[0145]
Also, the
[0146]
As a result, the
[0147]
Also, the
[0148]
Further, since the
[0149]
Further, the answer
[0150]
Furthermore, the answer
[0151]
Finally, the abbreviation
[0152]
With this, the abbreviation
[0153]
As a result, even if the input information from the user is an abbreviated sentence, the conversation control device 1 uses the past search result without using the functions such as the neural network and the AI intelligence to determine what the abbreviated sentence means. It is possible to infer whether the conversation control device 1 is to be used, and the developer of the conversation control device 1 does not need to install a neural network and AI intelligence, so that the system of the conversation control device 1 can be constructed more easily.
[0154]
[Example of change]
It should be noted that the present invention is not limited to the above embodiment, and the following changes can be made.
[0155]
(First modification example)
In the present modification, the
[0156]
As shown in FIG. 16, some morphemes included in a character string uttered by the user are similar. For example, as shown in FIG. 16, when the element information indicating the entire set group is “gift”, the “gift” is similar to a present, a gift, a year-end gift, a gift, a celebration, etc. (set group). Therefore, if there is a morpheme similar to “gift” (such as the above-described present), the
[0157]
That is, for example, when the morpheme extracted from the character string is “present”, the
[0158]
This allows the
[0159]
(Second modification example)
As shown in FIG. 17, in this modification, the
[0160]
The
[0161]
Specifically, as shown in FIG. 17, the
[0162]
For example, as shown in FIG. 18, when the first morpheme information constituting the utterance sentence uttered by the user is (Sato; *; I like) {I like Sato}, the
[0163]
The
[0164]
Specifically, the
[0165]
Accordingly, the selecting
[0166]
Further, since the selecting
[0167]
As a result, the selecting
[0168]
Further, the
[0169]
Note that the
[0170]
Specifically, the
[0171]
For example, as shown in FIG. 19, when the morpheme of the “case” of the “case configuration” is (dog; person; bites) {the dog bites the person}, the
[0172]
If the element composing the topic title is (person; dog; bite) {the person bites the dog}, the
[0173]
The
[0174]
Accordingly, the
[0175]
That is, the
[0176]
Further, the
[0177]
Note that the
[0178]
(Third modification example)
As shown in FIG. 20, the present modified example is not limited to the above-described embodiment and each modified example, and transmits and receives data to and from the
[0179]
Here, the
[0180]
Thereby, the
[0181]
(Fourth modification)
The sentence
[0182]
The discourse
[0183]
The first morpheme information, the second morpheme information, each "case configuration" constituting the first morpheme information or the second morpheme information and each morpheme associated with each "case configuration", and the retrieved answer sentence The morphemes associated with each “case configuration” and each “case configuration” and the searched discourse range are associated with each other and stored in the
[0184]
The abbreviation
[0185]
Specifically, the abbreviation
[0186]
That is, if the subject included in the history form information is S1, the object is O1, the action A1, the discourse range is D1, and the omitted first morpheme information is W, the complemented first morpheme information W1 is S1 @ W , O1 @ W, A1 @ W, or D1 @ W.
[0187]
The
[0188]
Thus, even when the utterance content composed of the first morpheme information is an abbreviation and is not clear as Japanese, the
[0189]
For this reason, if the utterance content constituting the first morpheme information is an abbreviation, the abbreviation
[0190]
(Fifth modification example)
The
[0191]
Specifically, the
[0192]
Then, based on the retrieved second morpheme information, the
[0193]
That is, the
[0194]
The
[0195]
Specifically, assuming that the discourse range in which the current discourse range D2 is related to the answer sentence K1 is DK, another discourse having a relevance (one having a sibling relationship) to the answer sentence K1 or the current discourse range D2. Since the range D3 can be expressed as D3 = D2∪DK, the second morpheme information W2 after adding the morphemes constituting the other discourse range D3 can be expressed as W2 = t2∪D3.
[0196]
For example, each morpheme t1 constituting the second morpheme information is (A movie name; *; interesting) {Is the A movie name interesting? If the current discourse range D2 determined by the discourse
[0197]
If the other discourse range D3 related to the current discourse range D2 (A movie name) is “B movie name”, the second morpheme information after adding the morphemes constituting the other discourse range D3 Since W2 is t2∪D3, (B movie name; *; interesting) {B movie name is interesting? }.
[0198]
Accordingly, when the user's utterance content is “A movie name is interesting?”, The
[0199]
As a result, the answer
[0200]
Note that the
[0201]
(Sixth modification example)
When the second morpheme information including the first morpheme information cannot be searched from the second morpheme information, the
[0202]
Specifically, the
[0203]
By this collation, when the
[0204]
Thus, even if the
[0205]
As a result, the
[0206]
[program]
The contents described in the conversation control system and the conversation control method can be realized by executing a dedicated program for using a predetermined program language on a general-purpose computer such as a personal computer.
[0207]
Here, as a programming language, a hierarchical level is established by associating a topic desired by the user, the degree of emotion of the user with respect to a certain matter, or a type of statement, affirmative sentence, question sentence, repellent sentence, etc. with a morpheme according to the meaning content. In this embodiment, for example, a language for storing information in a database, such as a DKML (Discoverse Knowledge Markup Language), an XML (extensible Markup Language), and a C language developed by the inventors.
[0208]
That is, the conversation control device 1 stores data stored in each of the
[0209]
According to such a program according to the present embodiment, each morpheme constituting the utterance content of the user is identified, the semantic content grasped from each identified morpheme is analyzed, and the morpheme is associated with the analyzed semantic content. In general, a conversation control device, a conversation control system, and a conversation control method that have an operation effect of outputting an optimal response sentence corresponding to the utterance content of a user by outputting a pre-prepared answer sentence are generally used. It can be easily realized with a simple general-purpose computer.
[0210]
Further, the developer who develops the conversation control device 1 can hierarchically construct the second morpheme information and the like for searching for the answer sentence to the utterance content of the user using the language in the database, The conversation control device 1 can acquire an answer sentence to the utterance content from the database through a hierarchical procedure based on the utterance content of the user.
[0211]
That is, the conversation control device 1 determines and determines the hierarchy of the utterance contents of the user (for example, whether the second morpheme information stored in the database is in a higher concept or a lower concept). An appropriate answer sentence can be retrieved from each answer sentence stored in advance based on the hierarchy.
[0212]
For this reason, the conversation control device 1 does not collate the first morpheme information composed of the utterance content of the user with the “all” second morpheme information stored in advance, and each of the morpheme information belonging to a certain specific hierarchy. Since the second morpheme information and the first morpheme information need only be collated, the second morpheme information similar to the first morpheme information can be obtained in a short time.
[0213]
Further, in the communication between the
[0214]
Note that the program can be recorded on a recording medium. As shown in FIG. 23, the recording medium includes, for example, a
[0215]
[Second embodiment]
(Basic configuration of conversation control device)
A second embodiment of the present invention will be described with reference to the drawings. As shown in FIG. 24, the conversation control device 1 according to the present embodiment has substantially the same internal structure as the conversation control device 1 according to the first embodiment, but includes a selection unit 380 (second search means; selection means). They differ in points. Further, unlike the first embodiment, the conversation control device 1 partially differs in the functions of the topic search unit 360 (first search unit) and the answer sentence search unit 370 (second search unit; answer sentence search unit). .
[0216]
Except for this difference, the structure is the same as that of the first embodiment and the modified example, and the description of the structure other than the difference will be omitted. The present embodiment naturally has various functions in the first embodiment, such as a parrot return process, a reflexive process, and the like, and also has an effect corresponding to those functions.
[0219]
In the present embodiment, the first morpheme information and topic title described later are different from the first embodiment, and each morpheme belonging to the first morpheme information and topic title is a “case” such as a subject, an object, or an action. Description will be made assuming that it is included regardless of the configuration.
[0218]
In the first embodiment, the process in which the conversation control device 1 outputs an answer sentence corresponding to the utterance content based on the utterance content from the user has been described. In the present embodiment, when the meaning of the utterance content from the user can be grasped as a plurality of meanings, the conversation control device 1 determines the utterance that is close to the topic to be developed by the conversation control device 1 from the respective meanings. The process of selecting the meaning of the content and outputting an answer sentence corresponding to the selected meaning will be described.
[0219]
Specifically, as in the first embodiment, the conversation control device 1 according to the present embodiment performs a passive answer process based on the content of the utterance from the user (for example, a process that faithfully answers the content of the question from the user). Is executed, and the conversation control apparatus 1 voluntarily performs an active answer process to guide the current topic to a specific topic. The structure of the conversation control device 1 in the present embodiment is as follows. The conversation control method and the program according to the present embodiment can be executed with the same processing content as the processing content in the conversation control device 1.
[0220]
As shown in FIG. 25, in the present embodiment, the phrase includes a topic title indicating a morpheme composed of one character, a plurality of character strings, or a combination thereof, and the topic title includes an answer sentence to the user. Corresponding. The phrase includes, for example, the utterance content or the topic title. In this embodiment, the phrase corresponds to a topic title, as shown in FIG.
[0221]
For example, as shown in FIG. 25, if the topic title 1 is (A device; IR (Inazuma Rush); teach) {Teach the IR (Inazuma Rush) of the A device}, the topic title 1 is Topic titles including some constituent morphemes (IR; teach) include topic title 2 (Company A; IR (Investor Relations); teach) {Teach IR (Investor Relations) of Company A}. Can be The above phrases, topic titles, and answer sentences are stored in the conversation database 500 (morpheme storage unit).
[0222]
The common topic titles are associated with priorities for being selected as answer sentences. In addition, it is desirable that the answer sentence includes a content for guiding the user to a specific topic or a content related to the associated topic title.
[0223]
The topic search unit 360 (first search unit) searches each phrase including the utterance content from a plurality of phrases stored in a conversation database (morpheme storage unit) in advance based on the utterance content input by the user. Is what you do. That is, in the present embodiment, the
[0224]
Specifically, as shown in FIG. 25, when the first morpheme information is (IR; teach), the
[0225]
The selection section 380 (selection means) selects a phrase related to a topic to be developed in advance from each phrase based on each phrase searched by the
[0226]
Here, the fact that a plurality of topic titles including the utterance content or the first morpheme information constituting the utterance content is searched means that in the present embodiment, the utterance content is captured in a plurality of meanings. As a result, when the utterance content is captured in a plurality of meanings, that is, when a plurality of topic titles are searched, the selecting
[0227]
Specifically, as shown in FIG. 25, when the first morpheme information (IR; teach) is extracted by the sentence
[0228]
That is, when a plurality of topic titles are searched by the
[0229]
The answer sentence search unit 370 (answer sentence search means) searches for an answer sentence corresponding to the phrase selected by the
[0230]
More specifically, as shown in FIG. 25, for example, when a topic title 2 (Company A; IR; teach) is selected by the
[0231]
When the topic title searched last time is included in each topic title searched this time, the
[0232]
More specifically, as shown in FIG. 25, for example, the selecting
[0233]
(Conversation control method using conversation control device)
The conversation control method by the conversation control device 1 having the above configuration can be implemented by the following procedure. FIG. 26 is a flowchart showing the procedure of the conversation control method according to the present embodiment. The processing from (S201) to (S204) shown in FIG. 26 is the same as the processing from (S101) to (S104) in the first embodiment, and a detailed description thereof will be omitted.
[0234]
As shown in FIG. 26, based on the first morpheme information extracted by the sentence
[0235]
After that, when each topic title is searched by the
[0236]
Since the priority order associated with the searched topic title 1 is 2 and the priority order associated with the
[0237]
On the other hand, when the topic title searched last time is included in each topic title searched this time, the
[0238]
Specifically, as shown in FIG. 25, for example, the selecting
[0239]
Next, the answer
[0240]
(Operation and effect of the conversation control device and the conversation control method)
According to the invention having the above configuration, as each topic title including the first morpheme information (IR; teach) extracted by the sentence
[0241]
Here, the fact that a plurality of phrases each including input information is searched, or that a plurality of second morphological information including first morphological information constituting the input information are searched for, means that the input information has a plurality of meanings. Means that. Therefore, when the utterance content is captured in a plurality of meanings, that is, when a plurality of topic titles are searched, the
[0242]
Also, the conversation control device 1 does not output a passive answer sentence based on the content of the utterance from the user (for example, faithfully answer the content of the question from the user). It is possible to output an active answer sentence that guides the user from a current topic to a specific topic.
[0243]
Further, since the answer sentence includes content for guiding the user to a specific topic, the answer
[0244]
Furthermore, the answer
[0245]
In addition, since the
[0246]
(Example of change)
Note that the present invention is not limited to the above embodiment, and the following changes can be made. When each topic title searched this time by the
[0247]
Specifically, the
[0248]
When the specified number of times exceeds a predetermined reference number (for example, five times), the
[0249]
On the other hand, if the counted number does not exceed the reference number (for example, 5 times), the selecting
[0250]
Thus, if the topic title selected last time is included in each topic title searched this time by the
[0251]
That is, when the same utterance content is repeatedly uttered by the user, the
[0252]
Note that the present invention is not limited to a device or the like (conversation robot or the like) for the purpose of having a conversation, and this function can be used in a game machine or the like.
[0253]
【The invention's effect】
As described above, according to the present invention, when the content of a user's utterance is captured in a plurality of meanings, an answer sentence related to a specific topic to be developed in advance is output, so that the current topic can be specified. Can guide you to the topic.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating a schematic configuration of a conversation control system according to a first embodiment.
FIG. 2 is a block diagram illustrating an internal structure of a conversation control unit and a sentence analysis unit according to the first embodiment.
FIG. 3 is a diagram illustrating the content of each morpheme extracted by a morpheme extraction unit according to the first embodiment.
FIG. 4 is a diagram showing the contents of each phrase extracted by a phrase analysis unit in the first embodiment.
FIG. 5 is a diagram illustrating contents of “case” specified by a sentence structure analysis unit according to the first embodiment.
FIG. 6 is a diagram illustrating “utterance sentence type” specified by an utterance type determination unit according to the first embodiment.
FIG. 7 is a diagram showing the contents of each dictionary stored in the utterance type database in the first embodiment.
FIG. 8 is a diagram showing contents of a hierarchical structure constructed inside a conversation database in the first embodiment.
FIG. 9 is a diagram showing a detailed relationship of a hierarchical structure constructed inside a conversation database in the first embodiment.
FIG. 10 is a diagram showing the contents of a “topic title” constructed inside a conversation database in the first embodiment.
FIG. 11 is a diagram showing the contents of “type of answer sentence” associated with “topic title” constructed inside the conversation database in the first embodiment.
FIG. 12 is a diagram showing contents of “topic title” and “answer sentence” belonging to a “discussion range” constructed inside a conversation database in the first embodiment.
FIG. 13 is a diagram illustrating contents of reflection element information stored in a reflection element database according to the first embodiment.
FIG. 14 is a diagram showing parrot return elements stored in a parrot return element database and the contents of morphemes of the parrot return elements in the first embodiment.
FIG. 15 is a flowchart illustrating a procedure of a conversation control method according to the first embodiment.
FIG. 16 is a diagram showing utterance contents arranged by a morpheme extraction unit in the first modification.
FIG. 17 is a diagram illustrating an internal configuration of a topic search unit according to a second modification.
FIG. 18 is a diagram illustrating a manner in which the ratio calculation unit in the second modification checks each morpheme belonging to “case configuration” and each “topic title” for each “topic title”.
FIG. 19 is a diagram illustrating a manner in which the ratio calculation unit according to the second modified example collates each morpheme belonging to “each component” with each morpheme belonging to “topic title” for each “case”.
FIG. 20 is a diagram illustrating a schematic configuration of a conversation control system according to a third modification.
FIG. 21 is a diagram illustrating an internal configuration of a topic search unit in a fifth modification.
FIG. 22 is a diagram illustrating a manner in which a topic search unit in the sixth modification example compares first morpheme information with a topic title or an answer sentence.
FIG. 23 is a diagram illustrating a recording medium that stores a program according to the first embodiment.
FIG. 24 is a block diagram illustrating an internal configuration of a conversation control device according to a second embodiment.
FIG. 25 is a diagram showing contents of “topic title” and “answer sentence” constructed inside a conversation database in the second embodiment.
FIG. 26 is a diagram showing a processing procedure of a conversation control method according to the second embodiment.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Conversation control device, 2 ... Server, 100 ... Input part, 200 ... Speech recognition part, 300 ... Conversation control part, 310 ... Management part, 320 ... Reflective judgment part, 330 ... Parrot return judgment part, 340 ... Discourse range determination Section, 350: abbreviated sentence complementing section, 360: topic search section, 361: ratio calculating section, 362: selecting section, 363: deleting section, 364: discourse adding section, 370: answer sentence searching section, 380: selecting section, 400 ... Sentence analysis unit, 410 ... Morphological extraction unit, 420 ... Phrase analysis unit, 430 ... Sentence structure analysis unit, 440 ... Utterance type determination unit, 450 ... Morphological database, 460 ... Utterance type database, 500 ... Conversation database, 600 ... Output Unit, 700: voice recognition dictionary storage unit, 800: communication unit, 801: reflection element database, 802: parrot return element database, 900: communication unit, 1000: communication Network, 1100 ... hard disk, 1200 ... flexible disk, 1300 ... compact disc, 1400 ... IC chip, 1500 ... cassette tape
Claims (5)
利用者から入力された前記入力情報に基づいて、予め記憶された複数のフレーズの中から、該入力情報を含む各フレーズを検索する第一検索手段と、
前記第一検索手段で検索された前記各フレーズに基づいて、該各フレーズの中から、予め展開したい話題に関係するフレーズを選出し、選出した該フレーズに対応する前記回答文を検索する第二検索手段と
を有することを特徴とする会話制御装置。A conversation control device that searches for an answer sentence corresponding to the input information based on input information including utterance content input from a user,
Based on the input information input from the user, from among a plurality of phrases stored in advance, a first search means for searching for each phrase including the input information,
A second step of selecting a phrase related to a topic to be developed in advance from each of the phrases based on the respective phrases searched by the first search unit, and searching for the answer sentence corresponding to the selected phrase; A conversation control device comprising a search unit.
前記入力情報に含まれる文字列に基づいて、該文字列の最小単位を構成する少なくとも一つの形態素を第一形態素情報として抽出する形態素抽出手段と、
前記フレーズには、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報が含まれ、複数の該第二形態素情報には、前記回答文及び該回答文として選出されるための優先順位が対応付けられており、前記各第二形態素情報及び前記各回答文を予め記憶する形態素記憶手段とを有し、
前記第一検索手段は、前記形態素抽出手段で抽出された前記第一形態素情報に基づいて、予め記憶された前記各第二形態素情報の中から、該第一形態素情報を含む前記各第二形態素情報を検索し、
前記第二検索手段は、前記第一検索手段で前記各第二形態素情報が検索された場合には、検索された該各第二形態素情報に対応付けられた前記各優先順位の大きさに応じて、該各第二形態素情報の中から一の前記第二形態素情報を選出する選出手段と、
前記選出手段で選出された前記第二形態素情報に基づいて、該第二形態素情報に対応付けられた前記回答文を検索する回答文検索手段と
を有することを特徴とする会話制御装置。The conversation control device according to claim 1, wherein
A morpheme extracting unit configured to extract at least one morpheme constituting a minimum unit of the character string as first morpheme information based on the character string included in the input information;
The phrase includes second morpheme information indicating a morpheme composed of one character, a plurality of character strings, or a combination thereof, and the plurality of second morpheme information is selected as the answer sentence and the answer sentence. And a morphological storage means for storing the respective second morphological information and the respective answer sentences in advance,
The first retrieval unit is configured to select the second morpheme including the first morpheme information from among the second morpheme information stored in advance based on the first morpheme information extracted by the morpheme extraction unit. Search for information,
The second search means, when the first search means has searched for each of the second morpheme information, according to the magnitude of each of the priorities associated with each of the searched second morpheme information Selecting means for selecting one piece of the second morphological information from among the pieces of the second morphological information;
A conversation control device, comprising: an answer sentence search unit that searches for the answer sentence associated with the second morpheme information based on the second morpheme information selected by the selection unit.
前記選出手段は、前記第一検索手段で今回検索された前記各第二形態素情報が所定の基準回数を越えて検索された場合には、前回選出された前記第二形態素情報とは異なる前記第二形態素情報を、今回検索された前記各第二形態素情報の中から選出することを特徴とする会話制御装置。The conversation control device according to claim 2, wherein
The selecting means, when each of the second morphological information searched this time by the first searching means is searched for more than a predetermined reference number of times, the second morphological information different from the second morphological information selected last time. A conversation control device, wherein dimorphological information is selected from each of the second morphological information searched this time.
前記回答文には、特定の話題に誘導させるための内容が含まれることを特徴とする会話制御装置。The conversation control device according to claim 1, wherein:
The conversation control device, wherein the answer sentence includes content for guiding the user to a specific topic.
利用者から入力された前記入力情報に基づいて、予め記憶された複数のフレーズの中から、該入力情報を含む各フレーズを検索する第一ステップと、
前記第一ステップで検索された前記各フレーズに基づいて、該各フレーズの中から、予め展開したい話題に関係するフレーズを選出し、選出した該フレーズに対応する前記回答文を検索する第二ステップと
を有することを特徴とする会話制御方法。A conversation control method for searching for an answer sentence corresponding to the input information based on input information including utterance content input from a user,
A first step of searching for each phrase including the input information from a plurality of phrases stored in advance based on the input information input from the user;
A second step of selecting a phrase related to a topic to be developed in advance from the respective phrases based on the respective phrases searched in the first step, and searching for the answer sentence corresponding to the selected phrase; And a conversation control method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003047872A JP2004258902A (en) | 2003-02-25 | 2003-02-25 | Conversation controller, and conversation control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003047872A JP2004258902A (en) | 2003-02-25 | 2003-02-25 | Conversation controller, and conversation control method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004258902A true JP2004258902A (en) | 2004-09-16 |
Family
ID=33113997
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003047872A Pending JP2004258902A (en) | 2003-02-25 | 2003-02-25 | Conversation controller, and conversation control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004258902A (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009036998A (en) * | 2007-08-01 | 2009-02-19 | Infocom Corp | Interactive method using computer, interactive system, computer program and computer-readable storage medium |
JP2009036999A (en) * | 2007-08-01 | 2009-02-19 | Infocom Corp | Interactive method using computer, interactive system, computer program and computer-readable storage medium |
US7949530B2 (en) | 2005-10-21 | 2011-05-24 | Universal Entertainment Corporation | Conversation controller |
US7949532B2 (en) | 2005-10-21 | 2011-05-24 | Universal Entertainment Corporation | Conversation controller |
US7949531B2 (en) | 2005-10-21 | 2011-05-24 | Universal Entertainment Corporation | Conversation controller |
JP2018101197A (en) * | 2016-12-19 | 2018-06-28 | シャープ株式会社 | Server, information processing method, network system, and terminal |
CN110931012A (en) * | 2019-10-12 | 2020-03-27 | 深圳壹账通智能科技有限公司 | Reply message generation method and device, computer equipment and storage medium |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297626A (en) * | 2001-03-30 | 2002-10-11 | Just Syst Corp | Device, program, and method for presenting information |
-
2003
- 2003-02-25 JP JP2003047872A patent/JP2004258902A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002297626A (en) * | 2001-03-30 | 2002-10-11 | Just Syst Corp | Device, program, and method for presenting information |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7949530B2 (en) | 2005-10-21 | 2011-05-24 | Universal Entertainment Corporation | Conversation controller |
US7949532B2 (en) | 2005-10-21 | 2011-05-24 | Universal Entertainment Corporation | Conversation controller |
US7949531B2 (en) | 2005-10-21 | 2011-05-24 | Universal Entertainment Corporation | Conversation controller |
JP2009036998A (en) * | 2007-08-01 | 2009-02-19 | Infocom Corp | Interactive method using computer, interactive system, computer program and computer-readable storage medium |
JP2009036999A (en) * | 2007-08-01 | 2009-02-19 | Infocom Corp | Interactive method using computer, interactive system, computer program and computer-readable storage medium |
JP2018101197A (en) * | 2016-12-19 | 2018-06-28 | シャープ株式会社 | Server, information processing method, network system, and terminal |
WO2018116531A1 (en) * | 2016-12-19 | 2018-06-28 | シャープ株式会社 | Server, information processing method, network system, and terminal |
CN110931012A (en) * | 2019-10-12 | 2020-03-27 | 深圳壹账通智能科技有限公司 | Reply message generation method and device, computer equipment and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3997105B2 (en) | Conversation control system, conversation control device | |
JP2004258902A (en) | Conversation controller, and conversation control method | |
JP4279883B2 (en) | Conversation control system, conversation control method, program, and recording medium recording program | |
JP4110012B2 (en) | Conversation control device and conversation control method | |
JP4110011B2 (en) | Conversation control device and conversation control method | |
JP4413486B2 (en) | Home appliance control device, home appliance control method and program | |
JP4913850B2 (en) | Information processing system and information processing method | |
JP3923378B2 (en) | Robot control apparatus, robot control method and program | |
JP4038399B2 (en) | Face image display device, face image display method and program | |
JP2004062685A (en) | Information processing system, information processing method and program | |
JP3927067B2 (en) | Conversation control system, conversation control device, conversation control method, program, and recording medium recording program | |
JP4109964B2 (en) | Information output device, information output method, and program | |
JP4253487B2 (en) | Information acquisition device | |
JP4274760B2 (en) | Map output device, map output method and program | |
JP4205370B2 (en) | Conversation control system, conversation control method and program | |
JP4402868B2 (en) | Information acquisition apparatus, information acquisition method, and program | |
JP4434553B2 (en) | Information processing system, information processing apparatus, information processing method, program, and recording medium recording the program | |
JP4116367B2 (en) | Conversation control system, conversation control method, program | |
JP4188622B2 (en) | Access system and access control method | |
JP2004021937A (en) | Article ejection equipment, article ejection control method, and program thereof | |
JP2004030323A (en) | System and method for information transmission, and program | |
JP4312443B2 (en) | Information notification system, information notification control method and program | |
JP4316839B2 (en) | Conversation control device and conversation control method | |
JP3947421B2 (en) | Conversation control system, conversation control method, program, and recording medium recording program | |
JP2009205169A (en) | Household electric appliance control device, household electric appliance control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080115 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080317 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080401 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080529 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080611 |
|
A912 | Removal of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080808 |