JP4316839B2 - Conversation control device and conversation control method - Google Patents
Conversation control device and conversation control method Download PDFInfo
- Publication number
- JP4316839B2 JP4316839B2 JP2002152607A JP2002152607A JP4316839B2 JP 4316839 B2 JP4316839 B2 JP 4316839B2 JP 2002152607 A JP2002152607 A JP 2002152607A JP 2002152607 A JP2002152607 A JP 2002152607A JP 4316839 B2 JP4316839 B2 JP 4316839B2
- Authority
- JP
- Japan
- Prior art keywords
- morpheme
- information
- unit
- answer
- morpheme information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Machine Translation (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、利用者から入力された入力情報に基づいて、入力情報に対応する回答内容を、対話形式に近い自然な形式で出力する会話制御装置及び会話制御方法に関する。
【0002】
【従来の技術】
従来からの会話制御システムにおいては、利用者からの発話内容に基づいて、その発話内容に対応する予め格納された回答内容を出力するので、利用者は、会話制御システムから回答される回答内容により、擬似的に他の利用者と話しているような感覚を味わうことができた。
【0003】
【発明が解決しようとする課題】
しかしながら、上記会話制御システムでは、利用者からの発話内容(入力情報)と、予め格納してある利用者の発話内容(フレーズ)群とを照合し、そのフレーズ群の中から入力情報と一致するフレーズを検索し、検索したフレーズに対応付けられている回答内容を出力するものであることから、上記入力情報と少しでも近似するフレーズを数多く格納しなければ、入力情報により適した回答内容を出力することができなかった。
【0004】
一方、会話制御システムを構築する開発者が、入力情報と少しでも近似する膨大なフレーズと、その膨大なフレーズに対応付けられた回答内容とを予め会話制御システムに格納すれば、上記会話制御システムは、予め格納してある膨大なフレーズ群の中から、入力情報と一致するフレーズを検索し、検索したフレーズに対応付けられている回答内容を出力することができるので、入力情報により適した回答内容を出力することができる。
【0005】
ところが、会話制御システムを構築する開発者は、入力情報と一致するフレーズを会話制御システムで検索させるためには、利用者から発話されるであろう膨大なフレーズ群(無限大に近いフレーズ群)を予め会話制御システムに格納しなければならないこととなり、入力情報により適した回答内容を出力させる会話制御システムを構築することは困難であった。
【0006】
また、各回答内容は、予め定められた形式で格納されているので、会話制御システムは、利用者からの発話内容に対してそのまま回答するような形式で出力することが困難であり、対話形式により近い自然な形式で出力することができなかった。例えば、利用者が”A歌手の新譜はありますか”と発話した場合には、会話制御システムは、”「A歌手の新譜」は、○○です”という形式で回答することが困難であった。
【0007】
そこで、本願は以上の点に鑑みてなされたものであり、利用者から入力された入力情報を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を取得することで、利用者からの入力情報に対応する最適な回答内容を取得し、また予め格納する各回答内容を少なくしても入力情報に対応する最適な回答内容を取得し、更には取得した回答内容を対話形式により近い自然な形式で出力することのできる会話制御装置及び会話制御方法を提供することを課題とする。
【0008】
【課題を解決するための手段】
本願に係る発明は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報と、入力情報に対応する利用者への回答内容とを予め相互に関連付けて複数記憶し、利用者から入力された入力情報に基づいて入力情報を示す文字列を特定し、特定された文字列に基づいて、文字列の最小単位を構成する少なくとも一つの形態素を第一形態素情報として抽出し、抽出された第一形態素情報と各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する少なくとも一つの形態素を含む第二形態素情報を検索し、検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得し、取得された回答内容に基づいて、抽出された第一形態素情報又は検索された第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加することを特徴とするものである。
【0009】
このような本願に係る発明によれば、会話制御装置が、検索した第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得し、取得した回答内容に基づいて、抽出した第一形態素情報又は検索した第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加することができるので、会話制御装置は、入力情報に対応する回答内容を、対話形式に近い自然な形式で出力することができる。
【0010】
例えば、利用者が”A歌手の新譜はありますか”という入力情報を入力した場合には、会話制御装置は、その入力情報に対応する回答内容”曲名1”を取得し、この回答内容”曲名1”に、入力情報を構成する形態素”A歌手の新譜”を付加することができるので、出力する回答として「”A歌手の新譜”は”曲名1”です」を出力することができる。
【0011】
この結果、利用者から入力された入力情報にそのまま答えるような回答が会話制御装置から出力されるので、利用者は、恰も他の利用者との間で会話しているような感覚を味わうことができる。
【0012】
また、会話制御装置が、各第二形態素情報の中から、第一形態素情報を構成する形態素(利用者からの入力情報を構成する要素)を含む第二形態素情報を検索し、検索した第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することができるので、会話制御装置は、利用者からの入力情報を構成する各形態素に基づいて、各形態素により構築される意味空間(各形態素からなる文字列から把握される意味内容)に基づいて予め作成された回答内容を取得することができることとなり、単に入力情報の”全体”をキーワードとして、そのキーワードに関連付けられた回答内容を取得するよりも、より入力情報に適した回答内容を取得することができる。
【0013】
更に、会話制御装置は、利用者からの入力情報を構成する各形態素に基づいて、利用者の入力情報に最適な回答内容を検索することができるので、会話制御装置を開発する開発者は、各形態素から構築される意味空間に基づいた回答内容とその回答内容を検索するための検索機能とを主に作製すればよく、利用者からの入力情報を解析するための人工知能、ニューラルネットワーク等からなるプログラムを逐一構築する必要がない。
【0014】
更にまた、会話制御装置は、第一形態素情報を含む第二形態素情報を検索するので、利用者からの入力情報と完全に一致する第二形態素情報を検索する必要がなく、会話制御装置を開発する開発者は、利用者から入力されるであろう入力情報に対応する膨大な回答内容を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
本願に係る発明は、抽出された第一形態素情報の各形態素を、主格からなる主体格、対象からなる対象格などの各属性に分類し、分類された少なくとも一つの属性に属する形態素を取得された回答内容に付加することを特徴とする会話制御システムである。
【0015】
尚、会話制御装置は、第二形態素情報を構成する各形態素を、主体格、対象格などの属性毎に分類して予め記憶し、検索した第二形態素情報に基づいて、第二形態素情報を構成する少なくとも一つの属性に属する形態素を、取得された回答内容に付加するものであってもよい。
【0016】
このような本願に係る発明によれば、会話制御装置が、抽出された第一形態素情報を構成する各形態素を、主格からなる主体格、対象からなる対象格などの各属性に分類し、分類された少なくとも一つの属性に属する形態素を回答内容に付加することができるので、会話制御装置は、入力情報に対応する回答内容をより自然な形式、即ち対話形に近い形で出力することができる。
【0017】
例えば、利用者が”A歌手の新譜はありますか”という入力情報を入力した場合には、会話制御装置は、その入力情報に対応する回答内容”曲名1”を取得し、この回答内容”曲名1”に、入力情報を構成する形態素”新譜”(対象格の形態素)のみを付加することができるので、出力する回答として「”新譜”は”曲名1”です」を出力することができ、結果的にはより自然な形式で回答を出力することができる。
【0018】
本願に係る発明は、各第二形態素情報を複数のキーワード群に対応付けて予め記憶し、抽出された第一形態素情報と各キーワード群とを照合し、第一形態素情報を構成する少なくとも一つの形態素と一致するキーワードを取得し、取得したキーワードに対応付けられた第二形態素情報を検索することを特徴とするものである。
【0019】
このような本願に係る発明によれば、会話制御装置が、抽出された第一形態素情報と各キーワード群とを照合し、第一形態素情報を構成する少なくとも一つの形態素と一致するキーワードを取得し、取得したキーワードに属する前記キーワード群に対応付けられた第二形態素情報を検索することができるので、会話制御装置を開発する開発者は、第一形態素情報と近似する膨大な第二形態素情報を会話制御装置に逐一記憶させる必要がなくなり、第二形態素情報の記憶量を低減させることができる。
【0020】
本願に係る発明は、キーワード群に対応付けられた二以上の第二形態素情報を検索した場合には、各第二形態素情報の中から、第一形態素情報を構成する少なくとも一つの形態素を含む第二形態素情報を検索することを特徴とするものである。
【0021】
このような本願に係る発明によれば、会話制御装置が、キーワード群に対応付けられた二以上の第二形態素情報を検索した場合には、各第二形態素情報の中から、第一形態素情報を構成する少なくとも一つの形態素を含む第二形態素情報を検索することができるので、会話制御装置は、各第二形態素情報の中から、利用者から入力された入力情報に関連するより適切な第二形態素情報を検索することができる。
【0022】
また、開発者は、会話制御装置に記憶させる第二形態素情報を少なくすることができるので、会話制御装置は、少ない第二形態素情報の中から、第一形態素情報と近似する第二形態素情報を迅速に検索することができる。
【0023】
本願に係る発明は、記憶される第二形態素情報又は回答内容が、利用者が求める話題、ある事柄において利用者に対して抱く感情度又は陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて形態素と関連付けて階層的にデータベースに蓄積するための言語で記述されることを特徴とするものである。尚、この言語は、DKML(Discourse Knowledge Markup Language)で記述されることが好ましい。
【0024】
このような本願に係る発明によれば、会話制御装置を開発する開発者は、利用者からの入力情報に対する回答内容を検索するための第二形態素情報等を、データベースにおいて前記言語を用いて階層的に構築することができるので、会話制御装置は、利用者の入力情報に基づいて入力情報に対する回答内容を、階層的な手順を経てデータベースから取得することができる。
【0025】
即ち、会話制御装置は、利用者からの入力情報の階層(例えば、データベースに蓄積されている第二形態素情報に対して上位概念にあるのか、又は下位概念にあるのか)を見極めて、見極めた階層に基づいて予め蓄積された各回答内容の中から、適切な回答内容を取得することができる。
【0026】
尚、第一形態素情報を含む第二形態素情報とは、第二形態素情報が第一形態素情報をそのまま含む場合のみならず、第二形態素情報が第一形態素情報を構成する少なくとも一つの形態素を含む場合をも意味するものとする。
【0027】
【発明の実施の形態】
[第一実施形態]
(会話制御システムの基本構成)
本発明に係る会話制御システムについて図面を参照しながら説明する。図1は、本実施形態に係る会話制御装置1を有する会話制御システムの概略構成図である。
【0028】
同図に示すように、会話制御装置1は、入力部100と、音声認識部200と、会話制御部300と、文解析部400と、会話データベース500と、出力部600と、音声認識辞書記憶部700とを備えている。
【0029】
尚、本実施形態では、説明の便宜上、利用者の発話内容(この発話内容は、入力情報の一種)に限定して説明するが、この利用者の発話内容に限定されるものではなく、キーボード等から入力された入力情報であってもよい。従って、以下に示す「発話内容」は、「発話内容」を「入力情報」に置き換えて説明することもできる。
【0030】
同様にして、後述の説明では、説明の便宜上、「発話文のタイプ」(発話種類)に限定して説明するが、この「発話文のタイプ」に限定されるのではなく、キーボードなどから入力された入力情報の種類を示す「入力種類」であってもよい。従って、以下に示す「発話文のタイプ」(発話種類)は、「入力文のタイプ」に置き換えて説明することもできる。
【0031】
入力部100は、利用者からの入力情報を取得する取得手段であり、本実施形態では、マイクロホン、キーボード等が挙げられる。この入力部100は、利用者から入力された入力情報に基づいて、入力情報(音声以外)に対応する文字列を特定する文字認識手段でもある。
【0032】
ここで、入力情報とは、キーボード等を通じて入力された文字、記号、音声等を意味するものである。具体的に、入力部100は、利用者の入力情報(音声以外)を取得し、取得した入力情報を文字列として特定し、特定した文字列を会話制御部300に出力する。また、利用者からの発話内容(この発話内容は、音声からなるものであり、入力情報の一種である)をマイクロホンなどで取得した入力部100は、取得した発話内容を構成する音声を音声信号として音声認識部200に出力する。
【0033】
音声認識部200は、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定する文字認識手段である。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号を解析し、解析した音声信号に対応する文字列を、音声認識辞書記憶部700に格納されている辞書を用いて特定し、特定した文字列を文字列信号として会話制御部300に出力する。音声認識辞書記憶部700は、標準的な音声信号に対応する辞書(あ、い、う、え、など)を格納しているものである。
【0034】
前記文解析部400は、会話制御部300に入力された文字列を解析するものであり、本実施形態では、図2に示すように、形態素抽出部410と、文節解析部420と、文構造解析部430と、発話種類判定部440と、形態素データベース450と、発話種類データベース460とを有している。
【0035】
形態素抽出部410は、音声認識部200で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出する形態素抽出手段である。
【0036】
具体的に、管理部310から文字列が入力された形態素抽出部410は、入力された文字列の中から各形態素を抽出する。ここで、形態素とは、本実施形態では、文字列に表された語構成の最小単位を意味するものであり、この語構成の最小単位としては、図3に示すように、例えば、名詞、形容詞、動詞などの品詞が挙げられる。各形態素は、本実施形態では、m1、m2、・・、mlと表現する。
【0037】
即ち、形態素抽出部410は、入力された文字列信号に対応する文字列と、形態素データベース450に予め格納されている名詞、形容詞、動詞などからなる形態素群とを照合し、文字列の中から形態素群と一致する各形態素(m1、m2、・・・)を抽出し、抽出した各形態素を抽出信号として文節解析部420に出力する。
【0038】
文節解析部420は、形態素抽出部410で抽出された各形態素に基づいて、各形態素を文節形式に変換する変換手段である。具体的に、形態素抽出部410から抽出信号が入力された文節解析部420は、入力された抽出信号に対応する各形態素を用いて文節形式にまとめる。
【0039】
ここで、文節形式とは、本実施形態では、日本語文法において、自立語又は自立語に一つ以上の付属語がついた文、或いは、日本語文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切りの文を意味する。この文節は、本実施形態では、p1、p2、・・・pkと表現する。
【0040】
即ち、文節解析部420は、図4に示すように、入力された抽出信号に対応する各形態素に基づいて各形態素の係り受け要素(例えば、が・は・を・・)を抽出し、抽出した係り受け要素に基づいて各形態素を各文節にまとめることを行う。 各形態素を各文節にまとめた文節解析部420は、各形態素をまとめた各文節と、各文節を構成する各形態素とを含む文型情報を文型信号として文構造解析部430及び発話種類判定部440に出力する。
【0041】
文構造解析部430は、文節解析部420で分節された第一形態素情報の各形態素を主体格、対象格などの各属性に分類する分類手段である。具体的に、文節解析部420から文型信号が入力された文構造解析部430は、入力された文型信号に対応する各形態素と各形態素からなる文節とに基づいて、文節に含まれる各形態素の「格構成」(属性)を決定する。
【0042】
ここで、「格構成」とは、文節における実質的な概念を示す格(属性)を意味するものであり、本実施形態では、例えば、主語・主格を意味するサブジェクト(主体格)、対象を意味するオブジェクト(対象格)、動作・動詞を意味するアクション、時間を意味するタイム(テンス、ムード、アスペクトからなるもの)、場所を意味するロケーション等が挙げられる。本実施形態では、文節におけるサブジェクト、オブジェクト、アクションの三要素の「格」(格構成)に対応付けられた各形態素を第一形態素情報とする。
【0043】
即ち、文構造解析部430は、図5に示すように、例えば、各形態素の係り受け要素が”が”又は”は”である場合は、その係り受け要素の前にある形態素がサブジェクト(主語又は主格)であると判断する。また、文構造解析部430は、
例えば、各形態素の係り受け要素が”の”又は”を”である場合は、その係り受け要素の前にある形態素がオブジェクト(対象)であると判断する。
【0044】
更に、文構造解析部430は、例えば、各形態素の係り受け要素が”する”である場合は、その係り受け要素の前にある形態素がアクション(述語;この述語は動詞、形容詞などから構成される)であると判断する。
【0045】
各文節を構成する各形態素の「格構成」を決定した文構造解析部430は、決定した「格構成」に対応付けられた第一形態素情報に基づいて、後述する話題(トピック)の範囲を特定させるための話題検索命令信号を話題検索部320に出力する。
【0046】
発話種類判定部440は、文節解析部420で特定された文節に基づいて、発話内容の種類を示す発話種類を特定する種類特定手段である。具体的に、文節解析部420から入力された文型信号に対応する各形態素と各形態素から構成される文節とに基づいて、「発話文のタイプ」(発話種類)を判定する。
【0047】
ここで、「発話文のタイプ」は、本実施形態では、図6に示すように、陳述文(D;Declaration)、感想文(I;Impression)、条件文(C;Condition)、結果文(E;Effect)、時間文(T;Time)、場所文(L;Location)、反発文(N;Negation)、肯定文(A;Answer)、質問文(Q;Question)などから構成されるものである。
【0048】
陳述文とは、利用者の意見又は考えなどからなる文を意味するものであり、本実施形態では、図6に示すように、例えば”佐藤が好きだ”などの文が挙げられる。感想文とは、利用者が抱く感想からなる文を意味するものである。場所文とは、場所的な要素からなる文を意味するものである。
【0049】
結果文とは、話題に対して文が結果の要素を含む文から構成されるものを意味する。時間文とは、話題に関わる時間的な要素を含む文から構成されるものを意味する。
【0050】
条件文とは、一つの発話を話題と捉えた場合に、話題の前提、話題が成立している条件や理由などの要素を含む文から構成されるものを意味する。反発文とは、利用者の発話相手に対して反発するような要素を含む文から構成されるものを意味する。各「発話文のタイプ」についての例文は、図6に示す通りである。
【0051】
即ち、発話種類判定部440は、入力された文型信号に対応する各文節に基づいて、その各文節と発話種類データベース460に格納されている各辞書とを照合し、各文節の中から、各辞書に関係する文要素(図7参照)を抽出する。各文節の中から各辞書に関係する文要素を抽出した発話種類判定部440は、抽出した文要素に基づいて、「発話文のタイプ」を判定する。文要素とは、文字列の種類を特定するための分の種別を意味し、文要素は、本実施形態では、上記説明した定義句(〜のことだ)などが挙げられる。
【0052】
ここで、上記発話種類データベース460は、図7に示すように、定義句(例えば、〜のことだ)に関係する辞書を備えた定義表現事例辞書、肯定句(例えば、賛成、同感、ピンポーン)に関係する辞書を備えた肯定事例辞書、結果句(例えば、それで、だから)に関係する辞書を備えた結果表現事例辞書、挨拶句(例えば、こんにちは)に関係する辞書を備えた挨拶辞書、否定句(例えば、馬鹿言うんじゃないよ、反対)に関係する辞書を備えた否定事例辞書などから構成され、各辞書は、「発話文のタイプ」と関連付けられている。
【0053】
これにより、発話種類判定部440は、文節と発話種類データベース460に格納されている各辞書とを照合し、文節の中から各辞書に関連する文要素を抽出し、抽出した文要素に関連付けられた判定の種類を参照することで、「発話文のタイプ」を判定することができる(図7参照)。
【0054】
この発話種類判定部440は、後述する話題検索部320からの指示に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号を回答文検索部330に出力する。
【0055】
前記会話データベース500は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報と、発話内容に対する利用者への回答内容とを予め相互に関連付けて複数記憶する回答記憶手段である。
【0056】
また、会話データベース500は、第二形態素情報に複数の回答内容を関連付け、各回答内容に各回答内容の種類を示す回答種類をそれぞれに対応付けて予め記憶する回答記憶手段でもある。更に、会話データベース500は、第二形態素情報を構成する各要素を、主格からなる主体各、目的格からなる対象格などの属性に分類して記憶する回答記憶手段でもある。
【0057】
この会話データベース500は、図8に示すように、本実施形態では、大きく分けると、利用者が発話している内容について関連性のある範囲を意味する談話範囲(ディスコース)と、談話範囲に属し、利用者が発話している内容に最も密接な関連性のある範囲を意味する話題(トピック)とから構成されている。同図に示すように、”談話範囲”は、本実施形態では、”話題”の上位概念として位置付けるものとする。
【0058】
各談話範囲は、図9に示すように、階層構造となるように構成することができる。同図に示すように、例えば、ある談話範囲(映画)に対する上位概念の談話範囲(娯楽)は、上の階層構造に位置するようにし、談話範囲(映画)に対する下位概念の談話範囲(映画の属性、上映映画)は、下の階層構造に位置するようにすることができる。即ち、各談話範囲は、本実施形態では、他の談話範囲との関係で上位概念、下位概念、同義語、対義語の関係が明確となる階層位置に配置することかできる。
【0059】
上述の如く、談話範囲は、各話題から構成されるものであり、本実施形態では、例えば、談話範囲がA映画名であれば、”A映画名”に関係する複数の話題を含んでいる。
【0060】
この話題は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素、即ち、利用者から発話されるであろう発話内容を構成する各形態素を意味するものであり、本実施形態では、サブジェクト(主体格)、オブジェクト(対象格)、アクションの「格」(属性)に対応付けられた各形態素からなるものである。これら三要素に対応付けられた各形態素は、本実施形態では、話題タイトル(この話題タイトルは、”話題”の下位概念に相当するものである)(第二形態素情報)と表現することにする。
【0061】
尚、話題タイトルには、上記三要素に対応付けられた各形態素に限定されるものではなく、他の「格」、即ち、時間を意味するタイム(ムード、テンス、アスペクトなどからなるもの)、場所を意味するロケーション、条件を意味するコンディション、感想を意味するインプレッション、結果を意味するエフェクトなどに対応付けられた各形態素を有していてもよい。
【0062】
この話題タイトル(第二形態素情報)は、本実施形態では、会話データベース500に予め格納されているものであり、上記第一形態素情報(利用者が発話した内容から導かれたもの)とは区別されるものである。
【0063】
例えば、話題タイトルは、談話範囲が”A映画名”である場合には、図10に示すように、サブジェクト(A映画名)、オブジェクト(監督)、アクション(素晴らしい){これは、”A映画名の監督は素晴らしい”を意味する}から構成されるものである。
【0064】
話題タイトルのうち、「格構成」(サブジェクト、オブジェクト、アクションなど)に対応付けられた形態素がない場合は、その部分については、本実施形態では、”*”を示すことにする。
【0065】
例えば、{A映画名って?}の文を話題タイトル(サブジェクト;オブジェクト;アクション)に変換すると、{A映画名って?}の文のうち、”A映画名”がサブジェクトとして特定することができるが、その他”オブジェクト””アクション”は文の要素になっていないので、この話題タイトルは、”サブジェクト”(A映画名);”オブジェクト”なし(*);”アクション”なし(*)となる(図10参照)。
【0066】
回答文とは、利用者に対して回答する回答文(回答内容)を意味するものであり、この回答文は、本実施形態では、各話題タイトル(第二形態素情報)のそれぞれに関連付けられて会話データベース500に予め記憶されている(図8参照)。回答文は、本実施形態では、図11に示すように、利用者から発話された発話文のタイプに対応した回答をするために、陳述文(D;Declaration)、感想文(I;Impression)、条件文(C;Condition)、結果文(E;Effect)、時間文(T;Time)、場所文(L;Location)、否定文(N;Negation)、肯定文(A;Answer)、疑問文(Q;Question)などのタイプ(回答種類)に分類するものとする。
【0067】
即ち、各回答文は、図12に示すように、例えば、談話範囲(佐藤){下位概念;ホームラン、上位概念;草野球、同義語;パンダ佐藤・佐藤選手・パンダ}及び各話題タイトルと関連付けられている。
【0068】
同図に示すように、例えば、話題タイトル1−1が{(佐藤;*;好きだ):これは、上述の如く(サブジェクト;オブジェクト;アクション)の順番からなるものである。この順番は、以下同様とする}である場合は、その話題タイトル1−1に対応する回答文1−1は、(DA;陳述肯定文”(私も)佐藤が好きです”)、(IA;感想肯定文”佐藤がとても好きです”)、(CA;条件肯定文”佐藤のホームランはとても印象的だからです”)、(EA;結果肯定文”いつも佐藤の出る試合をテレビ観戦してしまいます”)、(TA;時間肯定文”実は、甲子園での5打席連続敬遠から好きになっています”)、(LA;場所肯定文”打撃に立ったときの真剣な顔が好きですね”)、(NA;反発肯定文”佐藤を嫌いな人とは話したくないですね、さよなら”)などが挙げられる。
【0069】
前記会話制御部300は、本実施形態では、図2に示すように、管理部310と、話題検索部320と、回答文検索部330とを有している。
【0070】
管理部310は、会話制御部300の全体を制御するものである。具体的に、入力部100又は音声認識部200から文字列が入力された管理部310は、入力された文字列を形態素抽出部410に出力する。また、管理部310は、回答文検索部330で検索された回答文を出力部600に出力する。
【0071】
話題検索部320は、文節解析部420で抽出された第一形態素情報と各第二形態素情報(話題タイトル)とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報を検索する第一検索手段である。具体的に、文構造解析部430から話題検索命令信号が入力された話題検索部320は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と会話データベース500に格納されている談話範囲群とを照合し、談話範囲群の中から第一形態素情報と関連する談話範囲を検索する。
【0072】
例えば、利用者から発話された発話文を構成する「格構成」に属する各形態素(第一形態素情報)が(佐藤;*;好きだ){佐藤は好きだ}である場合は、話題検索部320は、「格構成」に”佐藤”が含まれていることから、この”佐藤”と談話範囲群とを照合し、”佐藤”と一致する談話範囲(佐藤)を検索する。
【0073】
更に、「格構成」に関連する談話範囲を選択した話題検索部320は、選択した談話範囲に属する各話題タイトルの中から、「格構成」に属する各形態素に最も近い「話題タイトル」を検索し、この検索結果を検索結果信号として回答文検索部330及び発話種類判定部440に出力する。
【0074】
例えば、発話内容の「格構成」が(佐藤;*;好きだ){佐藤は好きだ}である場合は、話題検索部320は、図12に示すように、上記「格構成」に属する各形態素(佐藤;*;好きだ)と談話範囲(佐藤)に属する各話題タイトル1−1〜1−4とを照合し、各話題タイトル1−1〜1−4の中から、「格構成」に属する各形態素(佐藤;*;好きだ)と一致(又は近似)する話題タイトル1−1(佐藤;*;好きだ)を検索し、この検索結果を検索結果信号として回答文検索部330及び発話種類判定部440に出力する。
【0075】
話題検索部320から検索結果信号が入力された発話種類判定部440は、入力された検索結果信号に基づいて、該当する利用者に対して回答する特定の回答文を検索させるための回答検索命令信号(この回答検索命令信号には、判定した「発話文のタイプ」も含まれる)を回答文検索部330に出力する。
【0076】
回答文検索部330は、話題検索部320で検索された第二形態素情報(話題タイトル)に基づいて、第二形態素情報に関連付けられた回答文を取得する回答取得手段である。また、回答文検索部330は、話題検索部320で検索された第二形態素情報に基づいて、特定された利用者の発話種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に基づいて回答種類に対応付けられた回答文を取得するものでもある(第二検索手段、回答取得手段)。
【0077】
具体的に、話題検索部320から検索結果信号と、発話種類判定部440から回答検索命令信号とが入力された回答文検索部330は、入力された検索結果信号に対応する話題タイトル(検索結果によるもの;第二形態素情報)と回答検索命令信号に対応する「発話文のタイプ」(発話種類)とに基づいて、その話題タイトルに関連付けられている回答文群(各回答内容)の中から、「発話文のタイプ」(DA、IA、CAなど)と一致する回答種類(この回答種類は、図11に示す「回答文のタイプ」を意味する)からなる回答文を検索する。
【0078】
例えば、回答文検索部330は、検索結果に対応する話題タイトル(第二形態素情報)が図12に示す話題タイトル1−1(佐藤;*;好きだ)である場合は、その話題タイトル1−1に関連付けられている回答文1−1(DA、IA、CAなど)の中から、発話種類判定部440で判定された「発話文のタイプ」(例えばDA;発話種類)と一致する回答種類(DA)からなる回答文1−1(DA;(私も)佐藤が好きです)を検索し、この検索した回答文を回答文信号として管理部310に出力する。
【0079】
回答文検索部330から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。出力部600は、回答文検索部330で取得された回答文を出力する出力手段であり、本実施形態では、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部310から回答文信号が入力された出力部600は、入力された回答文信号に対応する回答文{例えば、私も佐藤が好きです}を出力する。
【0080】
(会話制御装置を用いた会話制御方法)
上記構成を有する会話制御装置1による会話制御方法は、以下の手順により実施することができる。図13は、本実施形態に係る会話制御方法の手順を示すフロー図である。
【0081】
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(S100)。具体的に入力部100は、利用者の発話内容を構成する音声を取得し、取得した音声を音声信号として音声認識部200に出力する。また、入力部100は、利用者から入力された入力情報(音声以外)に基づいて、入力情報(音声以外)に対応する文字列を特定し、特定した文字列を文字列信号として会話制御部300に出力する。
【0082】
次いで、音声認識部200が、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う(S102)。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号を解析し、解析した音声信号に対応する文字列を、音声認識辞書記憶部700に格納されている辞書を用いて特定し、特定した文字列を文字列信号として会話制御部300に出力する。
【0083】
次いで、形態素抽出部410が、音声認識部200で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を抽出するステップを行う(S103)。
【0084】
具体的に、管理部310から文字列信号が入力された形態素抽出部410は、入力された文字列信号に対応する文字列と、形態素データベース450に予め格納されている名詞、形容詞、動詞などの形態素群とを照合し、文字列の中から形態素群と一致する各形態素(m1、m2、・・・)を抽出し、抽出した各形態素を抽出信号として文節解析部420に出力する。
【0085】
そして、文節解析部420は、形態素抽出部410で抽出された各形態素に基づいて、各形態素を文節形式にまとめる(S104)。具体的に、形態素抽出部410から抽出信号が入力された文節解析部420は、図4に示すように、入力された抽出信号に対応する各形態素に基づいて各形態素の係り受け要素(例えば、が・は・を・・)を抽出し、抽出した係り受け要素に基づいて各形態素を各文節にまとめることを行う。第一形態素情報は、本実施形態では、一つの文節に属する各形態素を意味する。
【0086】
各形態素を各文節にまとめた文節解析部420は、各形態素をまとめた各文節と、各文節を構成する各形態素とを含む文型情報を文型信号として文構造解析部430及び発話種類判定部440に出力する。
【0087】
その後、文構造解析部430が、文節解析部420で分節された第一形態素情報の各形態素を主体格、対象格などの各属性に分類するステップを行う(S105)。具体的に、文節解析部420から文型信号が入力された文構造解析部430は、入力された文型信号に対応する各形態素と各形態素からなる文節とに基づいて、文節に含まれる各形態素の「格構成」を決定する。
【0088】
即ち、文構造解析部430は、図5に示すように、例えば、文節における各形態素の係り受け要素が”が”又は”は”である場合は、その係り受け要素の前にある形態素がサブジェクト(主語又は主格)であると判断する。また、文構造解析部430は、例えば、文節における各形態素の係り受け要素が”の”又は”を”である場合は、その係り受け要素の前にある形態素がオブジェクト(対象)であると判断する。
【0089】
更に、文構造解析部430は、例えば、文節における各形態素の係り受け要素が”する”である場合は、その係り受け要素の前にある形態素がアクション(述語;この述語は動詞、形容詞などから構成される)であると判断する。
【0090】
各文節を構成する各形態素の「格構成」を決定した文構造解析部430は、決定した「格構成」に対応付けられた第一形態素情報に基づいて、後述する話題(トピック)の範囲を特定させるための話題検索命令信号を話題検索部320に出力する。
【0091】
次いで、発話種類判定部440は、文節解析部420で特定された文節に基づいて、発話内容の種類を示す発話種類を特定するステップを行う(S106)。具体的に、発話種類判定部440は、文節解析部420から入力された文型信号に対応する各形態素と各形態素から構成される文節とに基づいて、「発話文のタイプ」(発話種類)を判定する。
【0092】
即ち、発話種類判定部440は、入力された文型信号に対応する各文節に基づいて、その各文節と発話種類データベース460に格納されている各辞書とを照合し、各文節の中から、各辞書に関係する文要素を抽出する。各文節の中から各辞書に関係する文要素を抽出した発話種類判定部440は、抽出した文要素に基づいて、「発話文のタイプ」(発話種類)を判定する。
【0093】
この発話種類判定部440は、後述する話題検索部320からの指示に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号を回答文検索部330に出力する。
【0094】
次いで、話題検索部320が、文節解析部420で抽出された第一形態素情報と各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報(話題タイトル)を検索するステップを行う(S107)。
【0095】
具体的に、文構造解析部430から話題検索命令信号が入力された話題検索部320は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と会話データベース500に格納されている談話範囲群とを照合し、談話範囲群の中から第一形態素情報と関連する談話範囲を検索する。
【0096】
例えば、利用者から発話された発話文を構成する「格構成」に属する各形態素(第一形態素情報)が(佐藤;*;好きだ){佐藤は好きだ}である場合は、話題検索部320は、「格構成」に”佐藤”が含まれていることから、この”佐藤”と談話範囲群とを照合し、”佐藤”と一致する談話範囲(佐藤)を検索する。
【0097】
更に、「格構成」に関連する談話範囲を選択した話題検索部320は、選択した談話範囲に属する各話題タイトルの中から、「格構成」に属する各形態素に最も近い「話題タイトル」を検索し、この検索結果を検索結果信号として回答文検索部330及び発話種類判定部440に出力する。
【0098】
例えば、「格構成」が(佐藤;*;好きだ){佐藤は好きだ}である場合は、話題検索部320は、図12に示すように、上記「格構成」に属する各形態素(佐藤;*;好きだ)と談話範囲(佐藤)に属する各話題タイトル1−1〜1−4とを照合し、各話題タイトル1−1〜1−4の中から「格構成」に属する各形態素(佐藤;*;好きだ)と一致(又は近似)する話題タイトル1−1(佐藤;*;好きだ)を検索し、この検索結果を検索結果信号として回答文検索部330及び発話種類判定部440に出力する。
【0099】
話題検索部320から検索結果信号が入力された発話種類判定部440は、入力された検索結果信号に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号(この回答検索命令信号には、判定した「発話文のタイプ」も含まれる)を回答文検索部330に出力する。
【0100】
次いで、回答文検索部330は、話題検索部320で検索された第二形態素情報(話題タイトル)に基づいて、特定された利用者の発話種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に関連付けられた回答文を取得するステップを行う(S108)。
【0101】
具体的に、話題検索部320から検索結果信号と、発話種類判定部440から回答検索命令信号とが入力された回答文検索部330は、入力された検索結果信号に対応する話題タイトル(第二形態素情報)と回答検索命令信号に対応する「発話文のタイプ」(発話種類)とに基づいて、その話題タイトルに関連付けられている回答文群(各回答内容)の中から、「発話文のタイプ」(DA、IA、CAなど)と一致する回答種類(この回答種類は、図11に示す「回答文のタイプ」を意味する)からなる回答文を検索する。
【0102】
例えば、回答文検索部330は、検索結果に対応する話題タイトルが図12に示す話題タイトル1−1(佐藤;*;好きだ)である場合は、その話題タイトル1−1に関連付けられている回答文1−1(DA、IA、CAなど)の中から、発話種類判定部440で判定された「発話文のタイプ」(例えばDA;発話種類)と一致する回答種類(DA)からなる回答文1−1(DA;(私も)佐藤が好きです)を検索し、この検索した回答文を回答文信号として管理部310に出力する。
【0103】
そして、回答文検索部330から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。その後、管理部310から回答文信号が入力された出力部600は、入力された回答文信号に対応する回答文{例えば、私も佐藤が好きです}を出力する(S109)。
【0104】
(会話制御装置及び会話制御方法による作用及び効果)
上記構成を有する本願に係る発明によれば、話題検索部320が、各第二形態素情報の中から、第一形態素情報を構成する形態素(利用者の発話内容を構成する要素)を含む第二形態素情報を検索し、検索した第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することができるので、話題検索部320は、利用者の発話内容を構成する各形態素に基づいて、各形態素により構築される意味空間(各形態素からなる文字列から把握される意味)を考慮し、かかる意味空間に基づいて予め作成された回答内容を取得することができることとなり、単に発話内容の全体をキーワードとして、そのキーワードに関連付けられた回答内容を取得するよりも、より発話内容に適した回答内容を取得することができる。
【0105】
また、会話制御装置1は、利用者の発話内容を構成する各形態素に基づいて、利用者の発話内容に適した最適な回答内容を検索することができるので、会話制御装置1を開発する開発者は、各形態素により構築される意味空間に基づいた回答内容とその回答内容を検索するための検索機能とを主に作製すればよく、利用者の発話内容を解析するための人工知能、ニューラルネットワーク等からなるプログラムを逐一構築する必要がない。
【0106】
更に、話題検索部320は、第一形態素情報を含む第二形態素情報を検索するので、利用者の発話内容と完全に一致する第二形態素情報を検索する必要がなく、会話制御装置1を開発する開発者は、利用者から発話されるであろう発話内容に対応する膨大な回答内容を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
【0107】
更にまた、回答文検索部330が、各第二形態素情報に関連付けられた回答種類(陳述、肯定、場所、反発など)の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に基づいて回答種類に対応付けられた回答内容を取得することができるので、回答文検索部330は、利用者の会話内容を構成する発話種類、例えば、利用者が単に意見を述べたもの、利用者が抱く感想からなるもの、利用者が場所的な要素を述べたものなどに基づいて、複数の回答内容の中から発話種類にマッチした回答内容を取得することができることとなり、該当する利用者に対してより最適な回答をすることができる。
【0108】
(変更例)
尚、本発明は、上記実施形態に限定されるものではなく、以下に示すような変更を加えることができる。
【0109】
(第一変更例)
本変更例においては、会話データベース500は、複数の形態素の集合からなる集合群の全体を示す要素情報を、集合群に関連付けて複数記憶する要素記憶手段であってもよい。更に、形態素抽出部410は、文字列から抽出した形態素と各集合群とを照合し、各集合群中から、抽出された形態素を含む集合群を選択し、選択した集合群に関連付けられた要素情報を第一形態素情報として抽出してもよい。
【0110】
図14に示すように、利用者が発話した文字列に含まれる各形態素には、類似しているものがある。例えば、図14に示すように、集合群の全体を示す要素情報を「贈答」とすると、「贈答」は、プレゼント、贈り物、御歳暮、御中元、お祝いなど(集合群)と相互に類似しているので、形態素抽出部410は、「贈答」に類似する形態素(上記のプレゼントなど)がある場合には、その類似する形態素については、「贈答」として取り扱うことができる。
【0111】
即ち、形態素抽出部410は、例えば、文字列から抽出した形態素が「プレゼント」である場合は、図14に示すように、「プレゼント」を代表する要素情報が「贈答」であるので、上記「プレゼント」を「贈答」に置き換えることができる。
【0112】
これにより、形態素抽出部410が相互に類似する形態素を整理することができるので、会話制御装置を開発する開発者は、相互に類似した各第一形態素情報から把握される意味空間に対応した第二形態素情報及び第二形態素情報に関係する回答内容を逐一作成する必要がなくなり、結果的に、記憶部に格納させるデータ量を低減させることができる。
【0113】
(第二変更例)
図15に示すように、本変更例においては、割合計算部321と、選択部322とを話題検索部320に備えてもよい。
【0114】
割合計算部321は、形態素抽出部410で抽出された第一形態素情報と各第二形態素情報(話題タイトル)とを照合し、各第二形態素情報毎に、第二形態素情報に対して第一形態素情報が占める割合を計算する計算手段である。
【0115】
具体的に、文構造解析部430から話題検索命令信号が入力された割合計算部321は、図15に示すように、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と会話データベース500に格納されている談話範囲に属する各話題タイトル(第二形態素情報)とを照合し、各話題タイトル毎に、それぞれの話題タイトルの中に、第一形態素情報が占める割合を計算する。
【0116】
例えば、図15に示すように、利用者から発話された発話文を構成する第一形態素情報が(佐藤;*;好きだ){佐藤は好きだ}である場合は、割合計算部321は、「格構成」に属する各形態素(佐藤;*;好きだ)と話題タイトルに含まれる各形態素(佐藤;*;好きだ)とを照合し、両者は一致するので、上記話題タイトルに、「格構成」に属する各形態素(佐藤;*;好きだ)が含まれる割合を、100%であると計算する。割合計算部321は、これらの計算を話題タイトル毎に行い、計算した各割合を割合信号として選択部322に出力する。
【0117】
選択部322は、割合計算部321で各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択する選択手段である。
【0118】
具体的に、割合計算部321から割合信号が入力された選択部322は、入力された割合信号に含まれる各割合(「格構成」の要素/「話題タイトル」の要素×100)の中から、例えば割合の高い話題タイトルを選択する(図16参照)。割合の高い話題タイトルを選択した選択部322は、選択した話題タイトルを検索結果信号として回答文検索部330及び発話種類判定部440に出力する。回答文検索部330は、選択部322で選択された話題タイトルに基づいて、話題タイトルに関連付けられた回答文を取得する。
【0119】
これにより、割合計算部321が、各第二形態素情報毎に、第二形態素情報に対して第一形態素情報が占める割合を計算し、選択部322が、各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択することができるので、選択部322は、例えば、第一形態素情報(利用者の発話内容を構成するもの)が第二形態素情報に占める割合の大きい第二形態素情報を、複数ある第二形態素情報群の中から取得することができれば、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより的確に取得することができる。
【0120】
この結果、回答文検索部330は、選択部322で取得された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答文を取得することができるので、利用者の発話内容に対して最適な回答文を取得することができる。
【0121】
また、選択部322は、複数の話題タイトルの中から、割合計算部321で計算された割合の高い話題タイトルを選択することができるので、利用者の発話文に含まれる「格構成」に属する各形態素と会話データベース500に格納されている各話題タイトルとが完全に一致しなくても、「格構成」に属する各形態素に密接する話題タイトルを取得することができる。
【0122】
この結果、選択部322が「格構成」に密接する話題タイトルを取得するので、会話制御装置1を開発する開発者は、「格構成」と完全に一致する話題タイトルを会話データベース500に逐一格納する必要がなくなるので、会話データベース500の容量を低減させることができる。
【0123】
尚、割合計算部321は、分類された各属性に属する第一形態素情報の各形態素と、予め記憶された各属性に属する各第二形態素情報の各形態素とを各属性毎に照合し、各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の各形態素を含む第二形態素情報を検索する第一検索手段であってもよい。
【0124】
具体的に、話題検索命令信号が入力された割合計算部321は、入力された話題検索命令信号に含まれる「格構成」の各「格」(サブジェクト;オブジェクト;アクション)毎に、その「格」に属する第一形態素情報の各形態素と、「格構成」と同一の「格」からなる話題タイトルの「格」に属する各形態素とを照合し、互いの「格」を構成する形態素が同一か否かを判定する。
【0125】
例えば、図17に示すように、割合計算部321は、「格構成」の「格」の形態素が(犬;人;噛んだ){犬が人を噛んだ}である場合は、それらの形態素”犬”、”人”、”噛んだ”と、それらの形態素を構成する「格」と同一の「格」からなる話題タイトルの形態素”犬”、”人”、”噛んだ”とを照合し、話題タイトルを構成する各形態素”犬”、”人”、”噛んだ”のうち、各形態素に対応する「格」と同一の「格」からなる「格構成」の形態素”犬”、”人”、”噛んだ”と一致している割合を算出(100%)する。
【0126】
もし、話題タイトルを構成する要素が(人;犬;噛んだ){人が犬を噛んだ}である場合は、割合計算部321は、上記と同様の手順により、二つの格に属する形態素が異なるので、「格構成」を構成する形態素と「話題タイトル」との「格」毎の一致度を33%であると算出する(図17参照)。
【0127】
割合を計算した割合計算部321は、各割合の中から、割合の高い話題タイトルを選択し、選択した話題タイトルを検索結果信号として回答文検索部330及び発話種類判定部440に出力する。
【0128】
これにより、割合計算部321が、分類された各「格構成」(主体格、対象格など)に属する第一形態素情報の各形態素と、予め記憶された話題タイトルとを各「格」毎に照合し、各話題タイトルの中から、少なくとも一の「格」に第一形態素情報の各形態素を含む第二形態素情報を検索することができるので、割合計算部321は、通常の語順とは異なるものから構成される発話内容、例えば”人が犬を噛む”である場合には、主体格の形態素が”人”、対象格の形態素が”犬”であることから、その各「格」と一致する第二形態素情報を検索することができ、その第二形態素情報に関連付けられている回答内容{”本当に?”又は”意味がよくわかんないよ”など}を取得することができる。
【0129】
即ち、割合計算部321は、識別が困難な発話内容、例えば”人が犬を噛む”と”犬が人を噛む”とを識別することができるので、その識別した発話内容により適した回答、前者については例えば”本当に?”、後者については例えば”大丈夫?”をすることができる。
【0130】
(第三変更例)
図18に示すように、本変更例においては、上記実施形態及び上記各変更例に限定されるものではなく、会話制御装置1a,1bにある通信部800と、通信ネットワーク1000を介して通信部800との間でデータの送受信をするための通信部900と、通信部900に接続された各会話データベース500b〜500dと、サーバ2a〜2cとを備えてもよい(会話制御システム)。
【0131】
ここで、通信ネットワーク1000とは、データを送受信する通信網を意味するものであり、本実施形態では、例えば、インターネットなどが挙げられる。
【0132】
尚、本変更例では、便宜上、会話制御装置1a,1b、会話データベース500b〜500d、サーバ2a〜2cを限定しているが、これに限定されるものではなく、更に他の会話データベースを設けてもよい。このサーバ2a〜2cには、会話データベース500a〜500dに記憶されている内容と同様の内容が記憶されている。
【0133】
これにより、会話制御部300は、会話制御装置1aの内部に配置してある会話データベース500aのみならず、通信ネットワーク1000を介して、他の会話制御装置1b、会話データベース500b〜500d、サーバ2a〜2cをも参照することができるので、例えば、会話データベース500aの中から、話題検索命令信号に含まれる「格構成」に属する各形態素(第一形態素情報)と関連する談話範囲を検索することができない場合であっても、他の会話制御装置1b、会話データベース500b〜500d、サーバ2a〜2cを参照することにより、上記第一形態素情報と関連する談話範囲を検索することができ、利用者の発話文により適した回答文を検索することができる。
【0134】
[プログラム]
上記会話制御システム及び会話制御方法で説明した内容は、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。
【0135】
ここで、プログラム言語としては、本実施形態では、利用者が求める話題、ある事柄において利用者に対して抱く感情度、又は陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて形態素と関連付けて階層的にデータベースに蓄積するための言語、例えば、本発明者らが開発したDKML(Discourse Knowledge Markup Language)、その他C言語等が挙げられる。
【0136】
即ち、会話制御装置1は、各会話データベース500a〜500dに格納されているデータ(第二形態素情報、回答文、回答種類、集合群、要素情報などの記憶情報)、その他の各部を、DKML(Discourse Knowledge Markup Language)等で構築し、この構築した記憶情報等を利用するためのプログラムを実行することにより実現することができる。
【0137】
このような本実施形態に係るプログラムによれば、利用者の発話内容を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を出力することで、利用者の発話内容に対応する最適な回答内容を出力することができるという作用効果を奏する会話制御装置、会話制御システム及び会話制御方法を一般的な汎用コンピュータで容易に実現することができる。
【0138】
更に、上記通信部800と通信部900との間の通信は、通信ネットワークを介して、DKML等からなるプロトコルによってデータを送受信してもよい。これにより、会話制御装置1は、例えば、会話制御装置に利用者の発話内容に適した回答内容がない場合には、通信ネットワーク1000を通じて、DKML等の約束事に従って、利用者の発話内容に適した回答内容(DKMLなどで記述されたもの)を検索し、検索した回答内容を取得することができる。
【0139】
尚、プログラムは、記録媒体に記録することができる。この記録媒体は、図19に示すように、例えば、ハードディスク1100、フロッピー(登録商標)ディスク1200、コンパクトディスク1300、ICチップ1400、カセットテープ1500などが挙げられる。このようなプログラムを記録した記録媒体によれば、プログラムの保存、運搬、販売などを容易に行うことができる。
【0140】
[第二実施形態]
(会話制御システムの基本構成)
本発明の第二実施形態について図面を参照しながら説明する。図20は、本実施形態に係る会話制御システムの内部構造を示す図である。同図に示すように、会話制御システムにおける会話制御装置1は、第一実施形態における会話制御装置1の内部構造とほぼ同じであるが、形態素付加部340を有する点で相違する。この相違する点以外は、第一実施形態及び変更例の構造と同じであるので、相違する点以外の構造についての説明は、省略する。
【0141】
第一実施形態では、会話制御装置1が、利用者からの入力情報に基づいて入力情報に対応する最適な回答内容を取得する処理について説明したが、本実施形態では、会話制御装置1が、利用者からの入力情報に基づいて、入力情報を構成する形態素を、入力情報に対応する最適な回答内容に付加する処理について説明する。具体的な説明は以下の通りである。
【0142】
形態素付加部340は、回答文検索部330で取得された回答内容に基づいて、形態素抽出部410で抽出された第一形態素情報又は話題検索部320で検索された第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加する形態素付加手段である。
【0143】
また、形態素付加部340は、文節解析部420で分類された少なくとも一つの属性に属する形態素(この形態素は第一形態素情報に属するもの)を、回答文検索部330で検索(取得)された回答内容に付加する形態素付加手段でもある。更に、形態素付加部340は、話題検索部320で検索された第二形態素情報を構成する少なくとも一つの属性に属する形態素を、回答内容に付加する回答付加手段でもある。
【0144】
具体的に、回答文検索部330から回答内容と、形態素抽出部410で抽出された第一形態素情報とが入力された形態素付加部340は、入力された回答内容と第一形態素情報とに基づいて、第一形態素情報を構成する少なくとも一つの形態素を回答内容に付加する。
【0145】
また、回答文検索部330から回答内容と、話題検索部320から第二形態素情報とが入力された形態素付加部340は、入力された回答内容と第二形態素情報とに基づいて、第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加する。
【0146】
上記形態素を回答内容に付加した形態素付加部340は、回答内容に形態素を付加したものを、付加回答内容として管理部310に出力する。形態素付加部340から付加回答内容が入力された管理部310は、入力された付加回答内容を出力部600に出力する。
【0147】
例えば、利用者からの入力情報が{B歌手の新譜名を教えて}である場合には、形態素抽出部410は、入力情報のうち、”B歌手”、”新譜名”、”教えて”、を第一形態素情報として抽出する。回答文検索部330は、話題検索部320で検索された第一形態素情報と一致する第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得し、取得した回答内容に、第一形態素情報を構成する形態素”B歌手””新譜名”を付加する。
【0148】
また、文節解析部420は、形態素抽出部410で抽出された第一形態素情報に属する各形態素を、主体格(サブジェクト)、対象格(オブジェクト)、動作・動詞(アクション)などの属性に分類する。各属性に分類された第一形態素情報は、(B歌手;新譜;教えて){これは、サブジェクト、オブジェクト、アクションの順番}となる。ここでの形態素抽出部410、文節解析部420の動作は、第一実施形態と同様であるので、詳述な動作説明は省略する。
【0149】
話題検索部320は、各属性に分類された第一形態素情報(B歌手;新譜;教えて)に基づいて、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を取得する。回答文検索部330は、取得された第二形態素情報に基づいて、第二形態素情報に関連付けられている回答内容を会話データベース500の中から取得し、取得した回答内容に、第一形態素情報(又は第二形態素情報)を構成する各属性に属する少なくとも一つの形態素を付加する。
【0150】
ここで、会話データベース500には、図21に示すように、複数ある回答内容を回答内容テーブルとして記憶されている。同図に示すように、この回答内容テーブルには、本実施形態では、歌手名(A歌手、B歌手、C歌手・・・)、市販されているCDに格納されている新譜の歌い出し(フレーズ1、フレーズ2、フレーズ3・・・)、歌手の所属事務所(事務所1、事務所2、事務所3・・・)、歌手が行うコンサートの予定日(2002年7月1日・・・)、新譜のランキング(1位、10位、17位・・・)等が含まれている。
【0151】
具体的に、回答文検索部330は、第一形態素情報又は第二形態素情報を構成する各形態素が(B歌手;新譜;教えて)である場合には、この各形態素の中から、サブジェクトの形態素”B歌手”、及びオブジェクトの形態素”新譜”を抽出する。尚、回答文検索部330は、第一形態素情報又は第二形態素情報を構成する各形態素のうち、サブジェクト又はオブジェクトに属する形態素のいずれか一つの形態素を抽出するものであってもよい。
サブジェクトの形態素”B歌手”、及びオブジェクトの形態素”新譜”を抽出した回答文検索部330は、抽出した各形態素に基づいて、会話データベース500に記憶されている回答内容テーブルを参照し、図21に示すように、形態素”B歌手”及び形態素”新譜名”に対応する回答内容”曲名2”(同図に示す斜線部分)を取得する。この回答内容”曲名2”を取得した回答文検索部330は、取得した回答内容”曲名2”を形態素付加部340に出力する。
【0152】
回答文検索部330から回答内容”曲名2”が入力された形態素付加部340は、入力された回答内容”曲名2”に基づいて、第一形態素情報又は第二形態素情報を構成する少なくとも一つの形態素を付加する。
【0153】
具体的に、形態素付加部340は、例えば、図22に示すように、第一形態素情報又は第二形態素情報を構成するサブジェクト及びオブジェクトに属する形態素”B歌手”及び形態素”新譜”を、入力された回答内容”曲名2”に付加する。形態素付加部340は、入力された回答内容”曲名2”に各形態素”B歌手””新譜”を付加することができるので、出力する回答として”B歌手の新譜は、曲名2です”を出力することができる。
【0154】
(会話制御装置を用いた会話制御方法)
上記構成を有する会話制御装置1による会話制御方法は、以下の手順により実施することができる。回答内容を取得するまでの手順は、第一実施形態における手順(S101〜S109)と同様の手順で行うことができる。このため、以下に述べる会話制御方法では、回答内容が取得された以降のフローについて主に説明する。
【0155】
形態素付加部340が、回答文検索部330で取得された回答内容に基づいて、形態素抽出部410で抽出された第一形態素情報又は話題検索部320で検索された第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加するステップを行う。
【0156】
具体的に、回答文検索部330から回答内容と、形態素抽出部410で抽出された第一形態素情報とが入力された形態素付加部340は、入力された回答内容と第一形態素情報とに基づいて、第一形態素情報を構成する少なくとも一つの形態素を回答内容に付加する。
【0157】
また、回答文検索部330から回答内容と、話題検索部320から第二形態素情報とが入力された形態素付加部340は、入力された回答内容と第二形態素情報とに基づいて、第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加する。
【0158】
上記形態素を回答内容に付加した形態素付加部340は、回答内容に形態素を付加したものを、付加回答内容として管理部310に出力する。形態素付加部340から付加回答内容が入力された管理部310は、入力された付加回答内容を出力部600に出力する。
【0159】
例えば、利用者からの入力情報が{B歌手の新譜名を教えて}である場合には、形態素抽出部410は、入力情報のうち、”B歌手”、”新譜名”、”教えて”、を第一形態素情報として抽出する。回答文検索部330は、話題検索部320で検索された第一形態素情報と一致する第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得し、取得した回答内容に、第一形態素情報を構成する形態素”B歌手””新譜名”を付加する。
【0160】
また、文節解析部420は、形態素抽出部410で抽出された第一形態素情報に属する各形態素を、主体格(サブジェクト)、対象格(オブジェクト)、動作・動詞(アクション)などの属性に分類する。各属性に分類された第一形態素情報は、(B歌手;新譜;教えて){これは、サブジェクト、オブジェクト、アクションの順番}となる。
【0161】
そして、話題検索部320は、各属性に分類された第一形態素情報(B歌手;新譜;教えて)に基づいて、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を取得する。回答文検索部330は、取得された第二形態素情報に基づいて、第二形態素情報に関連付けられている回答内容を会話データベース500の中から取得し、取得した回答内容に、第一形態素情報(又は第二形態素情報)を構成する各属性に属する少なくとも一つの形態素を付加する。
【0162】
具体的に、回答文検索部330は、第一形態素情報又は第二形態素情報を構成する各形態素が(B歌手;新譜;教えて)である場合には、この各形態素の中から、サブジェクトの形態素”B歌手”、及びオブジェクトの形態素”新譜”を抽出する。
【0163】
そして、サブジェクトの形態素”B歌手”、及びオブジェクトの形態素”新譜”を抽出した回答文検索部330は、抽出した各形態素に基づいて、会話データベース500に記憶されている回答内容テーブルを参照し、図21に示すように、形態素”B歌手”及び形態素”新譜名”に対応する回答内容”曲名2”(同図に示す斜線部分)を取得する。この回答内容”曲名2”を取得した回答文検索部330は、取得した回答内容”曲名2”を形態素付加部340に出力する。
【0164】
その後、回答文検索部330から回答内容”曲名2”が入力された形態素付加部340は、入力された回答内容”曲名2”に基づいて、第一形態素情報又は第二形態素情報を構成する少なくとも一つの形態素を付加する。
【0165】
具体的に、形態素付加部340は、例えば、図22に示すように、第一形態素情報又は第二形態素情報を構成するサブジェクト及びオブジェクトに属する形態素”B歌手”及び形態素”新譜”を、入力された回答内容”曲名2”に付加する。形態素付加部340は、入力された回答内容”曲名2”に各形態素”B歌手””新譜”を付加することができるので、出力する回答として”B歌手の新譜は、曲名2です”を出力することができる。
【0166】
(会話制御装置及び会話制御方法による作用及び効果)
このような本願に係る発明によれば、回答文検索部330が、話題検索部320で検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得し、形態素付加部340が、回答文検索部330で取得された回答内容に基づいて、第一形態素情報又は第二形態素情報を構成する少なくとも一つの形態素を回答内容に付加することができるので、形態素付加部340は、入力情報に対応する回答内容を自然な形式で出力することができる。
【0167】
例えば、利用者が”A歌手の新譜はありますか”という入力情報を入力した場合には、回答文検索部330は、その入力情報に対応する回答内容”曲名1”を取得し、形態素付加部340が、回答文検索部330で取得された回答内容”曲名1”に、入力情報を構成する形態素”A歌手の新譜”を付加することができるので、出力する回答として「”A歌手の新譜”は”曲名1”です」を出力することができる。
【0168】
この結果、利用者から入力された入力情報にそのまま答えるような回答が会話制御装置1から出力されるので、利用者は、恰も他の利用者との間で会話しているような感覚を味わうことができる。
【0169】
また、話題検索部320が、各第二形態素情報の中から、第一形態素情報を構成する形態素(利用者からの入力情報を構成する要素)を含む第二形態素情報を検索し、回答文検索部330が、話題検索部320で検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することができるので、回答文検索部330は、利用者からの入力情報を構成する各形態素に基づいて、各形態素により構築される意味空間(各形態素からなる文字列から把握される意味内容)に基づいて予め作成された回答内容を取得することができることとなり、単に入力情報の”全体”をキーワードとして、そのキーワードに関連付けられた回答内容を取得するよりも、より入力情報に適した回答内容を取得することができる。
【0170】
更に、回答文検索部330は、利用者からの入力情報を構成する各形態素に基づいて、利用者の入力情報に最適な回答内容を検索することができるので、会話制御装置1を開発する開発者は、各形態素から構築される意味空間に基づいた回答内容とその回答内容を検索するための検索機能とを主に作製すればよく、利用者からの入力情報を解析するための人工知能、ニューラルネットワーク等からなるプログラムを逐一構築する必要がない。
【0171】
更にまた、話題検索部320は、利用者からの入力情報と完全に一致する第二形態素情報を検索するのではなく、第一形態素情報を含む第二形態素情報を検索するので、会話制御装置1を開発する開発者は、利用者から入力されるであろう入力情報に対応する膨大な回答内容を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
【0172】
また、文節解析部420が、抽出された第一形態素情報を構成する各形態素を、主格からなる主体格、対象からなる対象格などの各属性に分類し、形態素付加部340が、文節解析部420で分類された少なくとも一つの”属性”に属する形態素を回答内容に付加することができるので、会話制御装置1は、ある属性に属する形態素が付加された回答内容に基づいて、入力情報に対応する回答をより自然な形式、即ち対話形に近い形で出力することができる。
【0173】
例えば、利用者が”A歌手の新譜はありますか”という入力情報を入力した場合には、会話制御装置は、その入力情報に対応する回答内容”曲名1”を取得し、この回答内容”曲名1”に、入力情報を構成する形態素”新譜”(対象格の形態素)のみを付加することができるので、出力する回答として「”新譜”は”曲名1”です」を出力することができ、結果的には会話内容に適したより自然な形式で出力することができる。
【0174】
(変更例)
尚、本発明は、上記第二実施形態に限定されるものではなく、話題検索部320は、以下の機能も行うことができる。話題検索部320は、形態素抽出部410で抽出された第一形態素情報と各キーワード群とを照合し、第一形態素情報を構成する少なくとも一つの形態素と一致するキーワードを取得し、取得したキーワードに対応付けられた第二形態素情報を検索する第一検索手段でもある。
【0175】
また、話題検索部320は、キーワードに対応付けられた二以上の第二形態素情報を検索した場合には、各第二形態素情報の中から、第一形態素情報を構成する少なくとも一つの形態素を含む第二形態素情報を検索する第一検索手段でもある。
【0176】
ここで、第二形態素情報は、図23に示すように、本実施形態では、例えば、第二形態素情報を構成するいずれか一つの形態素に、あるキーワード群が対応付けられており、この第二形態素情報が会話データベース500に複数記憶されている。
【0177】
具体的に、話題検索部320は、例えば、形態素抽出部410で抽出された第一形態素情報が(B歌手;新譜;教えて){B歌手の新譜を教えて}である場合には、第一形態素情報の各形態素と各キーワード群(同図に示す「一般歌手」、「新譜の歌い出し」など)とを照合し、形態素”B歌手”と一致するキーワード”B歌手”を取得する。
【0178】
形態素”B歌手”と一致するキーワード”B歌手”を取得した話題検索部320は、取得したキーワード”B歌手”に基づいて、キーワード”B歌手”に対応付けられた第二形態素情報(一般歌手;新譜;教えて)を選択する(図23参照)。
【0179】
もし、形態素”B歌手”と一致するキーワード”B歌手”を取得した話題検索部320は、図23に示すように、取得したキーワード”B歌手”に対応付けられた第二形態素情報が二つある場合には、この二つある第二形態素情報(一般歌手;新譜;教えて)、(一般歌手;新譜の歌い出し;教えて)のうち、第一形態素情報(B歌手;新譜;教えて)の各形態素に近い第二形態素情報(一般歌手;新譜;教えて)を選択する。この選択は、第一形態素情報を構成する少なくとも一つの形態素が、第二形態素情報に含まれるかにより行われる。
【0180】
このような本実施形態に係る発明によれば、話題検索部320が、抽出された第一形態素情報と各キーワード群とを照合し、第一形態素情報を構成する少なくとも一つの形態素と一致するキーワードを取得し、取得したキーワードに対応付けられた第二形態素情報を検索することができるので、会話制御装置1を開発する開発者は、第一形態素情報と近似する膨大な第二形態素情報を会話制御装置に逐一記憶させる必要がなくなり、第二形態素情報の記憶量を低減させることができる。
【0181】
また、話題検索部320が、キーワードに対応付けられた二以上の第二形態素情報を検索した場合には、各第二形態素情報の中から、第一形態素情報を構成する少なくとも一つの形態素を含む第二形態素情報を検索することをができるので、話題検索部320は、各第二形態素情報の中から、利用者から入力された入力情報に関連するより適切な第二形態素情報を検索することができる。
【0182】
更に、開発者は、キーワード群を第二形態素情報と対応付けることにより、会話データベース500に記憶させる第二形態素情報を少なくすることができるので、話題検索部320は、少ない第二形態素情報の中から、第一形態素情報と近似する第二形態素情報を迅速に検索することができる。
【0183】
【発明の効果】
以上説明したように、本発明によれば、会話制御装置が、利用者から入力された入力情報を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を取得することで、利用者からの入力情報に対応する最適な回答内容を取得し、また予め格納する各回答内容を少なくしても入力情報に対応する最適な回答内容を取得し、更には取得した回答内容を対話形式により近い自然な形式で出力することができる。
【図面の簡単な説明】
【図1】第一実施形態に係る会話制御システムの概略構成を示すブロック図である。
【図2】第一実施形態における会話制御部及び文解析部の内部構造を示すブロック図である。
【図3】第一実施形態における形態素抽出部で抽出する各形態素の内容をを示す図である。
【図4】第一実施形態における文節解析部で抽出する各文節の内容を示す図である。
【図5】第一実施形態における文構造解析部で特定する「格」の内容を示す図である。
【図6】第一実施形態における発話種類判定部で特定する「発話文のタイプ」を示す図である。
【図7】第一実施形態における発話種類データベースで格納する各辞書の内容を示す図である。
【図8】第一実施形態における会話データベースの内部で構築される階層構造の内容を示す図である。
【図9】第一実施形態における会話データベースの内部で構築される階層構造の詳細な関係を示す図である。
【図10】第一実施形態における会話データベースの内部で構築される「話題タイトル」の内容を示す図である。
【図11】第一実施形態における会話データベースの内部で構築される「話題タイトル」に関連付けられている「回答文のタイプ」の内容を示す図である。
【図12】第一実施形態における会話データベースの内部で構築される「談話範囲」に属する「話題タイトル」及び「回答文」の内容を示す図である。
【図13】第一実施形態に係る会話制御方法の手順を示すフロー図である。
【図14】第一変更例における形態素抽出部で整理する発話内容を示す図である。
【図15】第二変更例における話題検索部の内部構成を示す図である。
【図16】第二変更例における割合計算部が「格構成」に属する各形態素と各「話題タイトル」とを「話題タイトル」毎に照合する様子を示す図である。
【図17】第二変更例における割合計算部が「格構成」に属する各形態素と「話題タイトル」に属する各形態素とを「格」毎に照合する様子を示す図である。
【図18】第三変更例における会話制御システムの概略構成を示す図である。
【図19】第一実施形態におけるプログラムを格納する記録媒体を示す図である。
【図20】第二実施形態に係る会話制御システムの概略構成を示すブロック図である。
【図21】第二実施形態における会話データベースで記憶される回答内容テーブルの内容を示す図である。
【図22】第二実施形態における形態素付加部が回答内容に形態素を付加する様子を示す図である。
【図23】変更例における話題検索部が第一形態素情報と各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報と近似する第二形態素情報を選択するまでの様子を示す図である。
【符号の説明】
1…会話制御装置、100…入力部、200…音声認識部、300…会話制御部、310…管理部、320…話題検索部、321…割合計算部、322…選択部、330…回答文検索部、400…文解析部、410…形態素抽出部、420…文節解析部、430…文構造解析部、440…発話種類判定部、450…形態素データベース、460…発話種類データベース、500…会話データベース、600…出力部、700…音声認識辞書記憶部、800…通信部、900…通信部、1000…通信ネットワーク、1100…ハードディスク、1200…フロッピー(登録商標)ディスク、1300…コンパクトディスク、1400…ICチップ、1500…カセットテープ[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a conversation control apparatus and a conversation control method for outputting answer contents corresponding to input information in a natural format close to a dialog format based on input information input from a user.
[0002]
[Prior art]
In the conventional conversation control system, since the answer contents stored in advance corresponding to the utterance contents are output based on the utterance contents from the user, the user can use the answer contents answered from the conversation control system. I was able to enjoy the feeling of talking with other users in a pseudo manner.
[0003]
[Problems to be solved by the invention]
However, in the above conversation control system, the utterance content (input information) from the user is collated with the utterance content (phrase) group of the user stored in advance, and matches the input information from the phrase group. Since it searches for a phrase and outputs the response content associated with the searched phrase, if it does not store a large number of phrases that are as close as possible to the above input information, it will output the response content that is more appropriate for the input information. I couldn't.
[0004]
On the other hand, if the developer who constructs the conversation control system stores in the conversation control system in advance a huge number of phrases that are as close as possible to the input information and the answer contents associated with the large number of phrases, the conversation control system Can search for a phrase that matches the input information from a huge group of phrases stored in advance, and output the answer contents associated with the searched phrase, so that the answer is more suitable for the input information. The contents can be output.
[0005]
However, a developer who builds a conversation control system can search for a phrase that matches the input information using the conversation control system, and the user will have a huge phrase group (a phrase group near infinity). Must be stored in the conversation control system in advance, and it is difficult to construct a conversation control system that outputs answer contents more suitable for input information.
[0006]
In addition, since each answer content is stored in a predetermined format, it is difficult for the conversation control system to output in a format that answers the utterance content from the user as it is. Could not be output in a more natural format. For example, when a user utters “Are you a new singer?”, It is difficult for the conversation control system to answer in the form “A new singer's score is XX”. .
[0007]
Therefore, the present application has been made in view of the above points, and each morpheme constituting input information input from the user is specified, and the semantic content grasped from each specified morpheme is analyzed and analyzed. By obtaining pre-prepared answer contents associated with semantic contents, the optimum answer contents corresponding to the input information from the user are obtained, and the input information can be stored even if each answer contents stored in advance is reduced. It is an object of the present invention to provide a conversation control apparatus and a conversation control method capable of acquiring the optimum answer content corresponding to the above and further outputting the obtained answer content in a natural format closer to the dialog format.
[0008]
[Means for Solving the Problems]
The invention according to the present application stores a plurality of second morpheme information indicating a morpheme composed of one character, a plurality of character strings, or a combination thereof, and a response content to the user corresponding to the input information in advance. The character string indicating the input information is specified based on the input information input from the user, and at least one morpheme constituting the minimum unit of the character string is extracted as the first morpheme information based on the specified character string And collating the extracted first morpheme information with each second morpheme information, and searching from each second morpheme information for second morpheme information including at least one morpheme constituting the first morpheme information, Based on the retrieved second morpheme information, the response content associated with the second morpheme information is acquired, and based on the acquired response content, the extracted first morpheme information or the retrieved second morpheme It is characterized in adding to the answer content to at least one of morphemes constituting a broadcast.
[0009]
According to the invention according to the present application, the conversation control device acquires the response content associated with the second morpheme information based on the searched second morpheme information, and extracts based on the acquired response content Since at least one morpheme constituting the first morpheme information or the searched second morpheme information can be added to the response content, the conversation control device can display the response content corresponding to the input information in a natural format close to the interactive format. Can be output.
[0010]
For example, when the user inputs input information “Is there a new singer A”, the conversation control device acquires the response content “
[0011]
As a result, an answer that directly answers the input information input by the user is output from the conversation control device, so that the user can feel as if the user is having a conversation with another user. Can do.
[0012]
Further, the conversation control device searches the second morpheme information including the morpheme constituting the first morpheme information (the element constituting the input information from the user) from each second morpheme information, and the second searched Since the response content associated with the second morpheme information can be acquired based on the morpheme information, the conversation control device is constructed by each morpheme based on each morpheme constituting the input information from the user. Answer contents created in advance can be acquired based on the semantic space (semantic content grasped from the character string consisting of each morpheme), and the entire input information is simply set as a keyword and associated with the keyword. It is possible to obtain answer contents more suitable for input information than to obtain answer contents.
[0013]
Furthermore, since the conversation control device can search for the optimum answer content for the input information of the user based on each morpheme constituting the input information from the user, the developer who develops the conversation control device It is only necessary to create answer contents based on the semantic space constructed from each morpheme and a search function for searching the answer contents. Artificial intelligence for analyzing input information from users, neural networks, etc. There is no need to build a program consisting of
[0014]
Furthermore, since the conversation control device retrieves the second morpheme information including the first morpheme information, it is not necessary to retrieve the second morpheme information that completely matches the input information from the user, and the conversation control device is developed. The developer who does not need to store a large amount of response contents corresponding to the input information that will be input from the user in advance, and can reduce the capacity of the storage unit.
In the invention according to the present application, each morpheme of the extracted first morpheme information is classified into each attribute such as a subject case consisting of a main case and a target case consisting of a target, and a morpheme belonging to at least one of the classified attributes is acquired. It is a conversation control system characterized by being added to the answer contents.
[0015]
The conversation control device classifies each morpheme constituting the second morpheme information for each attribute such as a subject case and a target case, stores the morpheme in advance, and stores the second morpheme information based on the searched second morpheme information. A morpheme belonging to at least one attribute constituting may be added to the acquired answer content.
[0016]
According to the invention according to the present application, the conversation control device classifies each morpheme constituting the extracted first morpheme information into each attribute such as a subject case composed of a main case, a target case composed of a target, and classified. Since the morpheme belonging to at least one attribute can be added to the answer content, the conversation control device can output the answer content corresponding to the input information in a more natural form, that is, in a form close to an interactive form. .
[0017]
For example, when the user inputs input information “Is there a new singer A”, the conversation control device acquires the response content “
[0018]
The invention according to the present application stores each second morpheme information in advance in association with a plurality of keyword groups, collates the extracted first morpheme information with each keyword group, and forms at least one of the first morpheme information A keyword that matches the morpheme is acquired, and second morpheme information associated with the acquired keyword is searched.
[0019]
According to the invention according to the present application, the conversation control device collates the extracted first morpheme information with each keyword group, and acquires a keyword that matches at least one morpheme constituting the first morpheme information. Since the second morpheme information associated with the keyword group belonging to the acquired keyword can be searched, the developer who develops the conversation control device can obtain a large amount of second morpheme information that approximates the first morpheme information. There is no need to store the conversation control device one by one, and the storage amount of the second morpheme information can be reduced.
[0020]
In the invention according to the present application, when two or more second morpheme information associated with the keyword group is searched, the second morpheme information includes at least one morpheme constituting the first morpheme information. It is characterized by searching for dimorphic information.
[0021]
According to the invention according to the present application, when the conversation control device searches for two or more second morpheme information associated with the keyword group, the first morpheme information is extracted from each second morpheme information. Since the second morpheme information including at least one morpheme that constitutes can be searched, the conversation control device can select a more appropriate first morpheme related to the input information input by the user from each second morpheme information. Dimorphic information can be searched.
[0022]
In addition, since the developer can reduce the second morpheme information to be stored in the conversation control device, the conversation control device can obtain the second morpheme information that approximates the first morpheme information from the few second morpheme information. You can search quickly.
[0023]
The invention according to the present application is that the second morpheme information or answer content stored is the type of topic the user wants, the degree of emotion or statement that the user has in a certain matter, an affirmative sentence, a question sentence, a repulsive sentence, etc. Are described in a language for hierarchically storing them in a database in association with morphemes according to their semantic content. This language is preferably described in DKML (Discourse Knowledge Markup Language).
[0024]
According to the invention according to the present application, the developer who develops the conversation control device hierarchizes the second morpheme information and the like for searching the response content for the input information from the user using the language in the database. Therefore, the conversation control apparatus can acquire the response content for the input information from the database through a hierarchical procedure based on the input information of the user.
[0025]
In other words, the conversation control device has determined and determined the hierarchy of input information from the user (for example, whether it is in a higher concept or a lower concept with respect to the second morpheme information stored in the database). Appropriate answer contents can be acquired from the answer contents accumulated in advance based on the hierarchy.
[0026]
The second morpheme information including the first morpheme information includes not only the case where the second morpheme information includes the first morpheme information as it is, but the second morpheme information includes at least one morpheme constituting the first morpheme information. It also means a case.
[0027]
DETAILED DESCRIPTION OF THE INVENTION
[First embodiment]
(Basic configuration of conversation control system)
A conversation control system according to the present invention will be described with reference to the drawings. FIG. 1 is a schematic configuration diagram of a conversation control system having a
[0028]
As shown in the figure, the
[0029]
In the present embodiment, for convenience of explanation, the description is limited to the user's utterance content (this utterance content is a kind of input information), but is not limited to the user's utterance content, and the keyboard. The input information may be input from the above. Therefore, the “utterance content” shown below can be described by replacing “utterance content” with “input information”.
[0030]
Similarly, in the following description, for convenience of explanation, the description will be limited to the “spoken sentence type” (speech type), but is not limited to this “spoken sentence type”, and input from a keyboard or the like. It may be an “input type” indicating the type of input information. Accordingly, the following “speech sentence type” (speech type) can be replaced with “input sentence type”.
[0031]
The
[0032]
Here, the input information means characters, symbols, voices and the like input through a keyboard or the like. Specifically, the
[0033]
The
[0034]
The
[0035]
The
[0036]
Specifically, the
[0037]
That is, the
[0038]
The
[0039]
Here, in this embodiment, the phrase format is a sentence in which the independent grammar or one or more attached words are attached to the independent grammar in the Japanese grammar, or a character string that does not destroy the meaning of the Japanese grammar. Means a sentence that is separated as finely as possible. This clause is expressed as p1, p2,... Pk in this embodiment.
[0040]
That is, as shown in FIG. 4, the
[0041]
The sentence
[0042]
Here, the “case structure” means a case (attribute) indicating a substantial concept in the clause. In the present embodiment, for example, a subject (subject) that represents a subject / subject, Object meaning (object case), action meaning action / verb, time meaning time (consisting of tense, mood, aspect), location meaning location, etc. In the present embodiment, each morpheme associated with the “case” (case configuration) of the three elements of the subject, the object, and the action in the phrase is set as the first morpheme information.
[0043]
That is, as shown in FIG. 5, for example, when the dependency element of each morpheme is “” or “is”, the sentence
For example, if the dependency element of each morpheme is “NO” or “NO”, it is determined that the morpheme before the dependency element is an object (target).
[0044]
Further, the sentence
[0045]
The sentence
[0046]
The utterance
[0047]
In this embodiment, as shown in FIG. 6, the “spoken sentence type” is a statement sentence (D; Declaration), an impression sentence (I; Impression), a conditional sentence (C; Condition), and a result sentence ( E; Effect, time sentence (T; Time), location sentence (L; Location), rebound sentence (N; Negation), affirmative sentence (A; Answer), question sentence (Q; Question) It is.
[0048]
The statement sentence means a sentence composed of a user's opinion or idea, and in this embodiment, as shown in FIG. 6, for example, a sentence such as “I like Sato” can be cited. An impression sentence means the sentence which consists of an impression which a user holds. A place sentence means a sentence made up of place elements.
[0049]
A result sentence means a sentence composed of sentences including a result element for a topic. A time sentence means a sentence composed of sentences including temporal elements related to a topic.
[0050]
The conditional sentence means a sentence composed of sentences including elements such as a premise of a topic, a condition and a reason why the topic is established, when one utterance is regarded as a topic. The repulsive sentence means a sentence composed of a sentence including an element that repels a user's utterance partner. An example sentence for each “spoken sentence type” is as shown in FIG.
[0051]
That is, the utterance
[0052]
Here, as shown in FIG. 7, the
[0053]
As a result, the utterance
[0054]
The utterance
[0055]
The
[0056]
The
[0057]
As shown in FIG. 8, in this embodiment, the
[0058]
Each discourse range can be configured to have a hierarchical structure as shown in FIG. As shown in the figure, for example, a higher level discourse range (entertainment) for a certain discourse range (movie) is positioned in the upper hierarchical structure, and a lower level discourse range (movie) for the discourse range (movie). The attribute (movie) can be located in the lower hierarchical structure. That is, in the present embodiment, each discourse range can be arranged at a hierarchical position where the relationship between the higher concept, the lower concept, the synonym, and the antonym is clear in relation to other discourse ranges.
[0059]
As described above, the discourse range is composed of topics, and in this embodiment, for example, if the discourse range is an A movie name, it includes a plurality of topics related to “A movie name”. .
[0060]
This topic means a morpheme composed of a single character, a plurality of character strings, or a combination thereof, that is, each morpheme constituting speech content that will be uttered by the user. Each morpheme is associated with a subject (subject), an object (target case), and an action “case” (attribute). In this embodiment, each morpheme associated with these three elements is expressed as a topic title (this topic title corresponds to a subordinate concept of “topic”) (second morpheme information). .
[0061]
The topic title is not limited to each morpheme associated with the above three elements, but other “cases”, that is, a time meaning time (consisting of mood, tense, aspect, etc.), Each morpheme may be associated with a location meaning a place, a condition meaning a condition, an impression meaning an impression, an effect meaning a result, and the like.
[0062]
In this embodiment, the topic title (second morpheme information) is stored in advance in the
[0063]
For example, if the talk range is “A movie name”, as shown in FIG. 10, the subject title is subject (A movie name), object (director), action (great) {this is “A movie name” The director of the name is composed of "meaning great".
[0064]
If there is no morpheme associated with “case composition” (subject, object, action, etc.) among the topic titles, “*” is indicated for the portion in the present embodiment.
[0065]
For example, {A What is a movie name? } Is converted into a topic title (subject; object; action). }, “A movie name” can be specified as the subject, but “object” and “action” are not elements of the sentence, so the topic title is “subject” (A movie name) ); No “object” (*); no “action” (*) (see FIG. 10).
[0066]
The answer sentence means an answer sentence (answer contents) to be answered to the user. In this embodiment, the answer sentence is associated with each topic title (second morpheme information). It is stored in advance in the conversation database 500 (see FIG. 8). In this embodiment, as shown in FIG. 11, the answer sentence is a statement sentence (D; Declaration) or an impression sentence (I; Impression) in order to make an answer corresponding to the type of utterance sentence uttered by the user. , Conditional sentence (C; Condition), result sentence (E; Effect), time sentence (T; Time), location sentence (L; Location), negative sentence (N; Negation), positive sentence (A; Answer), question It shall be classified into a type (answer type) such as a sentence (Q).
[0067]
That is, as shown in FIG. 12, each answer sentence is associated with, for example, a discourse range (Sato) {subordinate concept; home run, superordinate concept; grass baseball, synonym; panda Sato, Sato player, panda} and each topic title. It has been.
[0068]
As shown in the figure, for example, the topic title 1-1 is {(Sato; *; I like): this consists of the order of (subject; object; action) as described above. If this order is the same below, the answer sentence 1-1 corresponding to the topic title 1-1 is (DA; statement affirmative sentence ("I also like Sato")), (IA ; Sentence affirmative sentence "I like Sato very much"), (CA; Condition affirmative sentence "Sato's home run is very impressive"), (EA; Result affirmative sentence "I always watch Sato's games on TV Masu "), (TA; time affirmative sentence" I actually like it from the five-batt continual refrain at Koshien "), (LA; place affirmative sentence" I like the serious face when standing at the batting " ), (NA; repulsion affirmation "I don't want to talk to people who don't like Sato, goodbye").
[0069]
In the present embodiment, the
[0070]
The
[0071]
The
[0072]
For example, when each morpheme (first morpheme information) that belongs to the “case structure” constituting the utterance sentence uttered by the user is (Sato; *; I like) {I like Sato}, the topic search unit Since “Sato” is included in the “case composition”, 320 compares this “Sato” with the discourse range group, and searches for a discourse range (Sato) that matches “Sato”.
[0073]
Further, the
[0074]
For example, if the “case composition” of the utterance content is (Sato; *; I like) {I like Sato}, the
[0075]
The utterance
[0076]
The answer
[0077]
Specifically, the answer
[0078]
For example, if the topic title (second morpheme information) corresponding to the search result is the topic title 1-1 (Sato; *; I like) shown in FIG. The answer type that matches the “type of utterance” (for example, DA: utterance type) determined by the utterance
[0079]
The
[0080]
(Conversation control method using conversation control device)
The conversation control method by the
[0081]
First, the
[0082]
Next, the
[0083]
Next, the
[0084]
Specifically, the
[0085]
Then, the
[0086]
The
[0087]
Thereafter, the sentence
[0088]
That is, as shown in FIG. 5, the sentence
[0089]
Further, for example, when the dependency element of each morpheme in the clause is “Yes”, the sentence
[0090]
The sentence
[0091]
Next, the utterance
[0092]
That is, the utterance
[0093]
The utterance
[0094]
Next, the
[0095]
Specifically, the
[0096]
For example, when each morpheme (first morpheme information) that belongs to the “case structure” constituting the utterance sentence uttered by the user is (Sato; *; I like) {I like Sato}, the topic search unit Since “Sato” is included in the “case composition”, 320 compares this “Sato” with the discourse range group, and searches for a discourse range (Sato) that matches “Sato”.
[0097]
Further, the
[0098]
For example, when “case composition” is (Sato; *; I like) {I like Sato}, the
[0099]
The utterance
[0100]
Next, the answer
[0101]
Specifically, the answer
[0102]
For example, when the topic title corresponding to the search result is the topic title 1-1 (Sato; *; I like) shown in FIG. 12, the answer
[0103]
Then, the
[0104]
(Operation and effect of conversation control device and conversation control method)
According to the invention according to the present application having the above-described configuration, the
[0105]
Further, since the
[0106]
Furthermore, since the
[0107]
Furthermore, the answer
[0108]
(Example of change)
In addition, this invention is not limited to the said embodiment, The change as shown below can be added.
[0109]
(First change example)
In this modification, the
[0110]
As shown in FIG. 14, some morphemes included in the character string uttered by the user are similar. For example, as shown in FIG. 14, if the element information indicating the entire group is “gift”, the “gift” is similar to a present, a gift, a year-end gift, a mid-year gift, a celebration, etc. (group) Therefore, when there is a morpheme similar to “gift” (such as the present), the
[0111]
That is, for example, when the morpheme extracted from the character string is “present”, the
[0112]
This allows the
[0113]
(Second modified example)
As shown in FIG. 15, in the present modification example, the
[0114]
The
[0115]
Specifically, the
[0116]
For example, as shown in FIG. 15, when the first morpheme information constituting the utterance sentence uttered by the user is (Sato; *; I like) {I like Sato}, the
[0117]
The
[0118]
Specifically, the
[0119]
Accordingly, the
[0120]
As a result, the answer
[0121]
Moreover, since the
[0122]
As a result, since the
[0123]
The
[0124]
Specifically, the
[0125]
For example, as illustrated in FIG. 17, when the “case” morpheme of “case configuration” is (dog; person; bite) {dog bites a person}, the
[0126]
If the element constituting the topic title is (person; dog; bite) {person bites the dog}, the
[0127]
The
[0128]
As a result, the
[0129]
That is, since the
[0130]
(Third change example)
As shown in FIG. 18, the present modification example is not limited to the above-described embodiment and each modification example, and the
[0131]
Here, the
[0132]
In this modified example, the
[0133]
Thereby, the
[0134]
[program]
The contents described in the conversation control system and the conversation control method can be realized by executing a dedicated program for using a predetermined program language in a general-purpose computer such as a personal computer.
[0135]
Here, as the programming language, in this embodiment, the topic requested by the user, the degree of emotion held for the user in a certain matter, or the type of statement, affirmative sentence, question sentence, repulsive sentence, etc. The language for hierarchically storing in the database in association with the morpheme, for example, DKML (Discourse Knowledge Markup Language) developed by the present inventors, and other C languages.
[0136]
That is, the
[0137]
According to such a program according to the present embodiment, each morpheme constituting the utterance content of the user is identified, the semantic content grasped from each identified morpheme is analyzed, and associated with the analyzed semantic content. A conversation control device, a conversation control system, and a conversation control method that have the effect of being able to output the optimum answer contents corresponding to the user's utterance contents by outputting the answer contents prepared in advance. It can be easily realized by a general purpose computer.
[0138]
Furthermore, communication between the
[0139]
The program can be recorded on a recording medium. As shown in FIG. 19, examples of the recording medium include a
[0140]
[Second Embodiment]
(Basic configuration of conversation control system)
A second embodiment of the present invention will be described with reference to the drawings. FIG. 20 is a diagram showing an internal structure of the conversation control system according to the present embodiment. As shown in the figure, the
[0141]
In the first embodiment, the
[0142]
The
[0143]
In addition, the
[0144]
Specifically, the
[0145]
In addition, the
[0146]
The
[0147]
For example, when the input information from the user is {Tell me the new singer name of B singer}, the
[0148]
The
[0149]
Based on the first morpheme information (B singer; new score; tell me) classified into each attribute, the
[0150]
Here, as shown in FIG. 21, the
[0151]
Specifically, when each morpheme constituting the first morpheme information or the second morpheme information is (B singer; new score; teach), the answer
The answer
[0152]
The
[0153]
Specifically, the
[0154]
(Conversation control method using conversation control device)
The conversation control method by the
[0155]
The
[0156]
Specifically, the
[0157]
In addition, the
[0158]
The
[0159]
For example, when the input information from the user is {Tell me the new singer name of B singer}, the
[0160]
The
[0161]
And the
[0162]
Specifically, when each morpheme constituting the first morpheme information or the second morpheme information is (B singer; new score; teach), the answer
[0163]
Then, the answer
[0164]
After that, the
[0165]
Specifically, the
[0166]
(Operation and effect of conversation control device and conversation control method)
According to the invention according to this application, the answer
[0167]
For example, when the user inputs input information “Is there a new record for A singer?”, The answer
[0168]
As a result, since the answer that directly answers the input information input by the user is output from the
[0169]
Moreover, the
[0170]
Further, the answer
[0171]
Furthermore, the
[0172]
The
[0173]
For example, when the user inputs input information “Is there a new singer A”, the conversation control device acquires the response content “
[0174]
(Example of change)
In addition, this invention is not limited to said 2nd embodiment, The
[0175]
Further, when searching for two or more second morpheme information associated with a keyword, the
[0176]
Here, as shown in FIG. 23, the second morpheme information has a keyword group associated with any one morpheme constituting the second morpheme information in the present embodiment. A plurality of morpheme information is stored in the
[0177]
Specifically, the
[0178]
The
[0179]
If the
[0180]
According to the invention according to this embodiment, the
[0181]
In addition, when the
[0182]
Furthermore, since the developer can reduce the second morpheme information stored in the
[0183]
【The invention's effect】
As described above, according to the present invention, the conversation control device identifies each morpheme constituting the input information input from the user, analyzes the semantic content grasped from each identified morpheme, and performs analysis. By acquiring pre-prepared answer contents that are associated with the meaning contents, the user can obtain the optimum answer contents corresponding to the input information from the user, and input even if each answer contents stored in advance is reduced. The optimum answer content corresponding to the information can be acquired, and the obtained answer content can be output in a natural format closer to the interactive format.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a schematic configuration of a conversation control system according to a first embodiment.
FIG. 2 is a block diagram showing an internal structure of a conversation control unit and a sentence analysis unit in the first embodiment.
FIG. 3 is a diagram showing the contents of each morpheme extracted by a morpheme extraction unit in the first embodiment.
FIG. 4 is a diagram showing the contents of each phrase extracted by a phrase analysis unit in the first embodiment.
FIG. 5 is a diagram showing the contents of “case” specified by the sentence structure analysis unit in the first embodiment.
FIG. 6 is a diagram showing an “uttered sentence type” specified by an utterance type determining unit in the first embodiment.
FIG. 7 is a diagram showing the contents of each dictionary stored in the utterance type database in the first embodiment.
FIG. 8 is a diagram showing the contents of a hierarchical structure built inside the conversation database in the first embodiment.
FIG. 9 is a diagram showing a detailed relationship of a hierarchical structure built inside the conversation database in the first embodiment.
FIG. 10 is a diagram showing the content of a “topic title” constructed within the conversation database in the first embodiment.
FIG. 11 is a diagram showing the content of “answer sentence type” associated with “topic title” built inside the conversation database in the first embodiment.
FIG. 12 is a diagram showing the contents of “topic title” and “answer sentence” belonging to “discourse range” built inside the conversation database in the first embodiment.
FIG. 13 is a flowchart showing a procedure of a conversation control method according to the first embodiment.
FIG. 14 is a diagram showing utterance contents organized by a morpheme extraction unit in the first modification.
FIG. 15 is a diagram illustrating an internal configuration of a topic search unit in a second modified example.
FIG. 16 is a diagram illustrating a state in which the ratio calculation unit in the second modification collates each morpheme belonging to “case configuration” and each “topic title” for each “topic title”.
FIG. 17 is a diagram illustrating a state in which the ratio calculation unit according to the second modification collates each morpheme belonging to “case configuration” and each morpheme belonging to “topic title” for each “case”.
FIG. 18 is a diagram showing a schematic configuration of a conversation control system in a third modified example.
FIG. 19 is a diagram showing a recording medium for storing a program in the first embodiment.
FIG. 20 is a block diagram showing a schematic configuration of a conversation control system according to a second embodiment.
FIG. 21 is a diagram showing the contents of an answer content table stored in a conversation database in the second embodiment.
FIG. 22 is a diagram illustrating a state in which a morpheme adding unit adds a morpheme to an answer content in the second embodiment.
23. Until the topic search unit in the modification collates the first morpheme information with each second morpheme information and selects second morpheme information that approximates the first morpheme information from each second morpheme information. FIG.
[Explanation of symbols]
DESCRIPTION OF
Claims (14)
前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する少なくとも一つの形態素を第一形態素情報として抽出する形態素抽出手段と、
一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報と、該入力情報に対応する該利用者への回答内容とを予め相互に関連付けて複数記憶する回答記憶手段と、
前記形態素抽出手段で抽出された前記第一形態素情報と前記各第二形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を構成する前記形態素を含む前記第二形態素情報を検索する第一検索手段と、
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得する回答取得手段と、
前記回答取得手段で取得された前記回答内容に基づいて、前記形態素抽出手段で抽出された前記第一形態素情報又は前記第一検索手段で検索された前記第二形態素情報を構成する少なくとも一つの前記形態素を前記回答内容に付加する形態素付加手段とを有することを特徴とする会話制御装置。Character recognition means for identifying a character string indicating the input information based on the input information input by the user;
Based on the character string specified by the character recognition means, morpheme extraction means for extracting at least one morpheme constituting the minimum unit of the character string as first morpheme information;
Answer storage means for storing a plurality of second morpheme information indicating a morpheme composed of one character, a plurality of character strings, or a combination thereof, and a response content to the user corresponding to the input information in advance ,
The first morpheme information extracted by the morpheme extraction means and the second morpheme information are collated, and the second morpheme includes the second morpheme constituting the first morpheme information. A first search means for searching for morpheme information;
Based on the second morpheme information searched by the first search unit, an answer acquisition unit that acquires the response content associated with the second morpheme information;
At least one of the first morpheme information extracted by the morpheme extraction unit or the second morpheme information searched by the first search unit based on the response content acquired by the response acquisition unit A conversation control apparatus comprising: morpheme adding means for adding a morpheme to the answer content.
前記形態素抽出手段で抽出された前記第一形態素情報の各形態素を、主格からなる主体格、対象からなる対象格などの各属性に分類する分類手段を有し、
前記形態素付加手段は、前記分類手段で分類された少なくとも一つの属性に属する前記形態素を、前記回答取得手段で取得された前記回答内容に付加することを特徴とする会話制御装置。The conversation control device according to claim 1,
Classification means for classifying each morpheme of the first morpheme information extracted by the morpheme extraction unit into each attribute such as a subject case consisting of a main case and a target case consisting of a target;
The conversation control apparatus, wherein the morpheme adding unit adds the morpheme belonging to at least one attribute classified by the classification unit to the answer content acquired by the answer acquiring unit.
前記第二形態素情報を構成する各形態素は、前記主体格、前記対象格などの属性毎に分類されて前記回答記憶手段に予め記憶されており、
前記形態素付加手段は、前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報を構成する少なくとも一つの前記属性に属する前記形態素を、前記回答取得手段で取得された前記回答内容に付加することを特徴とする会話制御装置。The conversation control device according to claim 1,
Each morpheme constituting the second morpheme information is classified in advance for each attribute such as the subject case and the target case and stored in advance in the answer storage unit,
The morpheme adding unit is configured to acquire the morpheme belonging to at least one of the attributes constituting the second morpheme information based on the second morpheme information searched by the first search unit by the answer acquisition unit. A conversation control apparatus characterized by being added to the answer content.
前記各第二形態素情報は、複数のキーワード群に対応付けられており、
前記第一検索手段は、前記形態素抽出手段で抽出された前記第一形態素情報と前記各キーワード群とを照合し、前記第一形態素情報を構成する少なくとも一つの形態素と一致する前記キーワードを取得し、取得したキーワードに対応付けられた前記第二形態素情報を検索することを特徴とする会話制御装置。The conversation control device according to claim 1,
Each of the second morpheme information is associated with a plurality of keyword groups,
The first search unit collates the first morpheme information extracted by the morpheme extraction unit with each keyword group, and acquires the keyword that matches at least one morpheme constituting the first morpheme information. A conversation control device that searches for the second morpheme information associated with the acquired keyword.
前記第一検索手段は、二以上の前記第二形態素情報を検索した場合には、該各第二形態素情報の中から、前記第一形態素情報を構成する少なくとも一つの前記形態素を含む前記第二形態素情報を検索することを特徴とする会話制御装置。The conversation control device according to claim 4,
When the first search means searches for two or more second morpheme information, the second search unit includes at least one of the second morpheme information including at least one morpheme constituting the first morpheme information. A conversation control device characterized by retrieving morpheme information.
前記回答記憶手段で記憶される前記第二形態素情報又は前記回答内容は、前記利用者が求める話題、ある事柄において前記利用者に対して抱く感情度又陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて前記形態素と関連付けて階層的にデータベースに蓄積するための言語で記述されることを特徴とする会話制御装置。The conversation control device according to claim 1,
The second morpheme information or the answer content stored in the answer storage means is a topic requested by the user, a feeling level or a statement sentence to the user in a certain matter, an affirmative sentence, a question sentence, a repulsive sentence The conversation control device is characterized in that it is described in a language for hierarchically storing it in the database in association with the morpheme according to its semantic content.
前記言語は、DKMLからなることを特徴とする会話制御装置。The conversation control device according to claim 6,
The conversation control apparatus according to claim 1, wherein the language is DKML.
一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報と、該入力情報に対応する該利用者への回答内容とを予め相互に関連付けて回答記憶手段に複数記憶するステップと、
文字認識手段が、利用者から入力された入力情報に基づいて、該入力情報を示す文字列を特定するステップと、
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する少なくとも一つの形態素を第一形態素情報として抽出するステップと、
第一検索手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各第二形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を構成する前記形態素を含む前記第二形態素情報を検索するステップと、
回答取得手段が、前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、
形態素付加手段が、前記回答取得手段で取得された前記回答内容に基づいて、前記形態素抽出手段で抽出された前記第一形態素情報又は前記第一検索手段で検索された前記第二形態素情報を構成する少なくとも一つの前記形態素を前記回答内容に付加するステップとを有することを特徴とするコンピュータにおける会話制御方法。A conversation control method in a computer that functions as character recognition means, morpheme extraction means, first search means, answer acquisition means and morpheme addition means ,
A plurality of second morpheme information indicating a morpheme composed of one character, a plurality of character strings, or a combination thereof, and a response content to the user corresponding to the input information are stored in a plurality of response storage means in association with each other in advance. Steps,
A step of identifying a character string indicating the input information based on the input information input from the user by the character recognition means;
Morpheme extraction means, based on the character string specified by the character recognition means, to extract at least one morpheme constituting the minimum unit of the character string as first morpheme information;
The first search means collates the first morpheme information extracted by the morpheme extraction means with the second morpheme information, and configures the first morpheme information from the second morpheme information. Retrieving the second morpheme information including morphemes;
A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
The morpheme adding unit configures the first morpheme information extracted by the morpheme extraction unit or the second morpheme information searched by the first search unit based on the response content acquired by the response acquisition unit Adding at least one morpheme to the answer content.
分類手段が、前記形態素抽出手段で抽出された前記第一形態素情報の各形態素を、主格からなる主体格、対象からなる対象格などの各属性に分類するステップと、
前記形態素付加手段が、前記分類手段で分類された少なくとも一つの属性に属する前記形態素を、前記回答取得手段で取得された前記回答内容に付加するステップとを有することを特徴とするコンピュータにおける会話制御方法。 9. The conversation control method in a computer according to claim 8, wherein the computer further functions as a classification means ,
A classifying unit classifying each morpheme of the first morpheme information extracted by the morpheme extracting unit into attributes such as a subject case consisting of a main case and a target case consisting of a target;
Conversation control in a computer, wherein the morpheme adding means includes a step of adding the morpheme belonging to at least one attribute classified by the classifying means to the answer content acquired by the answer acquiring means Method.
前記第二形態素情報を構成する各形態素は、前記主体格、前記対象格などの属性毎に分類されて前記回答記憶手段に予め記憶されており、
前記形態素付加手段が、前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報を構成する少なくとも一つの前記属性に属する前記形態素を、前記回答取得手段で取得された前記回答内容に付加するステップを有することを特徴とするコンピュータにおける会話制御方法。A conversation control method in a computer according to claim 8,
Each morpheme constituting the second morpheme information is classified in advance for each attribute such as the subject case and the target case and stored in advance in the answer storage unit,
Based on the second morpheme information searched by the first search unit, the morpheme addition unit acquires the morpheme belonging to at least one of the attributes constituting the second morpheme information by the answer acquisition unit. A method for controlling conversation in a computer, further comprising the step of adding to the answer contents.
前記各第二形態素情報は、複数のキーワード群に対応付けられており、
前記第一検索手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各キーワード群とを照合し、前記第一形態素情報を構成する少なくとも一つの形態素と一致する前記キーワードを取得し、取得したキーワードに対応付けられた前記第二形態素情報を検索するステップを有することを特徴とするコンピュータにおける会話制御方法。A conversation control method in a computer according to claim 8,
Each of the second morpheme information is associated with a plurality of keyword groups,
The first search unit collates the first morpheme information extracted by the morpheme extraction unit with each of the keyword groups, and acquires the keyword that matches at least one morpheme constituting the first morpheme information. A method for controlling conversation in a computer, comprising the step of retrieving the second morpheme information associated with the acquired keyword.
前記第一検索手段が、二以上の前記第二形態素情報を検索した場合には、該各第二形態素情報の中から、前記第一形態素情報を構成する少なくとも一つの前記形態素を含む前記第二形態素情報を検索するステップを有することを特徴とするコンピュータにおける会話制御方法。A conversation control method for a computer according to claim 11, comprising:
When the first search means searches for two or more second morpheme information, the second morpheme information includes the second morpheme that includes at least one morpheme constituting the first morpheme information. A conversation control method in a computer comprising a step of retrieving morpheme information.
前記回答記憶手段で記憶される前記第二形態素情報又は前記回答内容は、前記利用者が求める話題、ある事柄において前記利用者に対して抱く感情度又は陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて前記形態素と関連付けて階層的にデータベースに蓄積するための言語で記述されることを特徴とするコンピュータにおける会話制御方法。A conversation control method in a computer according to claim 8,
The second morpheme information or the content of the answer stored in the answer storage means is a topic requested by the user, a feeling or a statement sentence to the user in a certain matter, an affirmative sentence, a question sentence, a repulsive sentence A conversation control method in a computer, characterized in that the types are described in a language for hierarchically storing them in a database in association with the morpheme according to the semantic content.
前記言語は、DKMLからなることを特徴とするコンピュータにおける会話制御方法。A conversation control method for a computer according to claim 13, comprising:
The conversation control method in a computer, wherein the language is DKML.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002152607A JP4316839B2 (en) | 2002-05-27 | 2002-05-27 | Conversation control device and conversation control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002152607A JP4316839B2 (en) | 2002-05-27 | 2002-05-27 | Conversation control device and conversation control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003345792A JP2003345792A (en) | 2003-12-05 |
JP4316839B2 true JP4316839B2 (en) | 2009-08-19 |
Family
ID=29769898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002152607A Expired - Lifetime JP4316839B2 (en) | 2002-05-27 | 2002-05-27 | Conversation control device and conversation control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4316839B2 (en) |
-
2002
- 2002-05-27 JP JP2002152607A patent/JP4316839B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003345792A (en) | 2003-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3997105B2 (en) | Conversation control system, conversation control device | |
JP2004258902A (en) | Conversation controller, and conversation control method | |
JP4110012B2 (en) | Conversation control device and conversation control method | |
JP4316839B2 (en) | Conversation control device and conversation control method | |
JP4413486B2 (en) | Home appliance control device, home appliance control method and program | |
JP4751565B2 (en) | Conversation control device, conversation control method, and program | |
JP4110011B2 (en) | Conversation control device and conversation control method | |
JP4913850B2 (en) | Information processing system and information processing method | |
JP4274760B2 (en) | Map output device, map output method and program | |
JP4751563B2 (en) | Product discharge device, product discharge control method and program | |
JP3923378B2 (en) | Robot control apparatus, robot control method and program | |
JP4205370B2 (en) | Conversation control system, conversation control method and program | |
JP4141783B2 (en) | USAGE NOTICE SYSTEM, USAGE NOTICE CONTROL METHOD AND PROGRAM | |
JP4038399B2 (en) | Face image display device, face image display method and program | |
JP3927067B2 (en) | Conversation control system, conversation control device, conversation control method, program, and recording medium recording program | |
JP4344508B2 (en) | Sentence generation system, sentence generation method, program | |
JP2007305146A (en) | Conversation control method, program, and recording medium recording program | |
JP4253487B2 (en) | Information acquisition device | |
JP4434553B2 (en) | Information processing system, information processing apparatus, information processing method, program, and recording medium recording the program | |
JP4188622B2 (en) | Access system and access control method | |
JP4402868B2 (en) | Information acquisition apparatus, information acquisition method, and program | |
JP4109964B2 (en) | Information output device, information output method, and program | |
JP4243079B2 (en) | Premium discharging device, premium discharging control method and program | |
JP4832701B2 (en) | Game machine, game control method, control program | |
JP2009205169A (en) | Household electric appliance control device, household electric appliance control method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050413 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080318 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080509 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090521 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4316839 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
S631 | Written request for registration of reclamation of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313631 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130529 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |